undertheseanlp/automatic_speech_recognitionPublic

NotificationsYou must be signed in to change notification settings
Fork38
Star69

Vietnamese Automatic Speech Recognition

License

GPL-3.0 license

69 stars 38 forks Branches Tags Activity

Star

Notifications

You must be signed in to change notification settings

Branches Tags

Folders and files

Name		Name	Last commit message	Last commit date
Latest commit History 148 Commits
data		data
egs		egs
insight		insight
report		report
tmp		tmp
util		util
.gitignore		.gitignore
Experiment.ipynb		Experiment.ipynb
LICENSE.txt		LICENSE.txt
README.en.md		README.en.md
README.md		README.md
data_format.md		data_format.md

Repository files navigation

Nhận dạng tiếng nói tiếng Việt

Dự án nghiên cứu về bài toánNhận dạng tiếng nói tiếng Việt, được phát triển bởi nhóm nghiên cứu xử lý ngôn ngữ tự nhiên tiếng Việt -undertheseanlp. Chứa mã nguồn các thử nghiệm cho việc xử lý dữ liệu, huấn luyện và đánh giá mô hình, cũng như cho phép dễ dàng tùy chỉnh mô hình đối với những tập dữ liệu mới.

Nhóm tác giả

Vũ Anh (anhv.ict91@gmail.com)
Lê Phi Hùng (lephihungch@gmail.com)

Tham gia đóng góp

Mọi ý kiến đóng góp hoặc yêu cầu trợ giúp xin gửi vào mụcIssues của dự án. Các thảo luận được khuyến khíchsử dụng tiếng Việt để dễ dàng trong quá trình trao đổi.

Nếu bạn có kinh nghiệm trong bài toán này, muốn tham gia vào nhóm phát triển với vai trò làDeveloper, xin hãy đọc kỹHướng dẫn tham gia đóng góp.

Mục lục

Yêu cầu hệ thống

Hệ điều hành: Ubuntu 16.04
Python 3.6+
conda 4+

Thiết lập môi trường

Cài đặt Kaldi

Để cài đặt Kaldi, thực hiện theo các bước tạihướng dẫn

$ git clone https://github.com/kaldi-asr/kaldi.git kaldi-trunk --origin golden$ cd kaldi-trunk/tools/; make;$ extras/install_openblas.sh$ cd ../src; ./configure  --openblas-root=../tools/OpenBLAS/install; make

Cài đặt language modeling toolkit srilm

Cài đặt dependencies

$ apt-get install gawk

Cài đặt srilm

$ cd kaldi-trunk/tools$ wget -O srilm.tgz https://raw.githubusercontent.com/denizyuret/nlpcourse/master/download/srilm-1.7.0.tgz$ ./install_srilm.sh...Installation of SRILM finished successfullyPlease source the tools/env.sh in your path.sh to enable it

Hướng dẫn sử dụng

Huấn luyện mô hình

Mô tả dữ liệu:Xem chi tiết

Trước khi run train.py phải set lại đường dẫn tới kaldi_folder .

Method predict nên có thêm argument model_path nếu bạn đã thực hiện train trước đó (vì nếu không nó sẽ lấy theo tmp_path của model, mà tmp_path này random cho mỗi lần khởi tạo lại model để chuẩn bị cho việc chạy training mới)

Thay đổi N_TRAIN và N_TEST trong init của KaldiSpeechRecognition để đổi giới hạn tập train/test

Output folder sẽ nằm trong kaldi_folder/egs/uts_{tmp_number} với tmp_number được thấy khi run train.py (EX: "Init Kaldi Speech Recognition in number_of_tmp folder" - Will be updated soon)

Kết quả thử nghiệm

Huấn luyện trên tập dữ liệu VIVOS - OpenFPT, test trên tập VLSP 2018

Mô hình	WER
GMM: MFCC + delta + LDA + MLTT	75.27%

Huấn luyện trên tập dữ liệu VIVOS, test trên tập VLSP 2018

Mô hình	WER
GMM: MFCC + delta + LDA + MLTT	79.80%
GMM: MFCC + delta	82.03%

Bản quyền

Mã nguồn của dự án được phân phối theo giấy phépGPL-3.0.

Dự án sử dụng tập dữ liệuVIVOS trong các thử nghiệm. Xin vui lòng kiểm tra lại thông tin trên website hoặc báo cáo khoa học tương ứng để biết thông tin về bản quyền và trích dẫn khi sử dụng tập dữ liệu này.

About

Vietnamese Automatic Speech Recognition

Movatterモバイル変換

Navigation Menu

Search code, repositories, users, issues, pull requests...

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

License

Uh oh!

Folders and files

Latest commit

History

Repository files navigation

Nhận dạng tiếng nói tiếng Việt

Mục lục

Yêu cầu hệ thống

Thiết lập môi trường

Hướng dẫn sử dụng

Huấn luyện mô hình

Kết quả thử nghiệm

Bản quyền

About

Topics

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages

Uh oh!

Contributors2

Uh oh!

Languages

Movatterモバイル変換

License

undertheseanlp/automatic_speech_recognition

Folders and files

Latest commit

History

Repository files navigation

Nhận dạng tiếng nói tiếng Việt

Mục lục

Yêu cầu hệ thống

Thiết lập môi trường

Hướng dẫn sử dụng

Huấn luyện mô hình

Kết quả thử nghiệm

Bản quyền

About

Topics

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages0

Uh oh!

Contributors2

Uh oh!

Languages

Packages