Các kết quả thực nghiệm

Một phần của tài liệu (LUẬN văn THẠC sĩ) mô hình markov ẩn và ứng dụng xây dựng hệ thống nhận dạng tiếng nói (Trang 57 - 61)

a) Thử nghiệm với từ điển có chèn short pause và không chèn short pause

Trong khi nói, giữa những câu những từ sẽ có khoảng ngừng nghỉ khác nhau. Để máy có thể phân biệt được điều này là rất khó khăn. Để kiểm tra sự ảnh hưởng của yếu tố ngừng nghỉ giữa các câu các từ tới độ chính xác của hệ thống luận văn đã tiến hành thử nghiệm trên 2 bộ từ điển phiên âm 10 chữ số tiếng việt khác nhau. Một bộ từ điển phiên âm không chèn thêm các âm quy định là khoảng nghỉ và một bộ từ điển có chèn thêm các sp quy định là những khoảng nghỉ giữa các từ.

+Từ điển có chèn thêm các sp:

Kết quả của thử nghiệm độ chính xác của hệ thống nhận dạng theo 2 bộ từ điển ở trên được cho trong bảng sau:

Bảng 3.2. Kết quả thử nghiệm hệ thống nhận dạng với bộ từ điển có chèn sp và không chèn sp

Hệ thống nhận dạng Mức câu Mức từ

Bộ từ điển không chèn SP 56% 90%

Bộ từ điển có chèn SP 70% 90%

Như vậy, với bộ từ điển có chèn thêm các sp độ chính xác mức câu sẽ tăng lên. Đây sẽ là bộ từ điển được chọn để tiến hành các thực nghiệm về sau.

b) Thử nghiệm với dữ liệu test nằm trong dữ liệu huấn luyện và độc lập với dữ liệu huấn luyện

Trong quá trình thực nghiệm phát sinh ra vấn đề đó là có những câu trong dữ liệu test mà không có mặt trong dữ liệu huấn luyện. Như vậy hệ thống phải nhận dạng các câu các âm tiết mà nó chưa được học trước đó. Nếu tập dữ liệu được bổ sung thì độ chính xác của kết quả nhận dạng có thể được nâng lên. Để nghiên cứu độ tốt nhất của hệ thống có thể đạt tới, ta cần thử nghiệm trong trường hợp dữ liệu test trùng với dữ liệu huấn luyện.

chính là dữ liệu huấn luyện. Kết quả thu được là tốt hơn so với thử nghiệm dữ liệu test độc lập với dữ liệu huấn luyện.

Kết quả thực nghiệm được cho ở bảng sau:

Bảng 3.3. Kết quả thử nghiệm hệ thống nhận dạng với dữ liệu test trùng với dữ liệu huấn luyện

Hệ thống nhận dạng Mức câu Mức từ

Dữ liệu test trùng với dữ liệu huấn luyện 80% 95% Dữ liệu test độc lập với dữ liệu huấn luyện 70% 90%

KẾT LUẬN

Nhận dạng tiếng nói là một trong những vấn đề rất khó trong lĩnh vực nhận dạng. Trong quá trình thực hiện luận văn, em đã gặp không ít khó khăn nhất là về mặt tài liệu, vì lí do ở Việt Nam những nghiên cứu về nhận dạng tiếng nói là không nhiều, và những người chuyên sâu trong lĩnh vực còn rất ít. Tuy nhiên, với sự cố gắng và sự động viên giúp đỡ của các thầy cô em đã hoàn thiện luận văn của mình và có những đóng góp sau:

Nghiên cứu các phương pháp nhận dạng tiếng nói, đánh giá và lựa chọn phương pháp phù hợp để xây dựng hệ thống nhận dạng tiếng nói tiếng Việt.

Tìm hiểu phương pháp xử lý trích chọn đặc trưng và đánh giá tầm quan trọng của việc trích chọn đặc trưng tiếng nói với hệ thống nhận dạng.

Tìm về bộ công cụ HTK đặc biệt là các bước tổng quát để xây dựng một hệ thống nhận dạng tiếng nói.

Tìm những đặc điểm quan trọng của ngôn ngữ tiếng Việt để xây dựng hệ thống nhận dạng tiếng nói tiếng Việt.

Nghiên cứu xây dựng hệ thống nhận dạng 10 chữ số phát âm tiếng Việt. Xây dựng được bộ cơ sở dữ liệu với 1000 câu làm dữ liệu huấn luyện và 100 câu làm dữ liệu Test.

Tìm hiểu mô hình phiêm âm âm vị tiếng việt.

Xây dựng hệ thống nhận dạng, đánh giá kết quả thực nghiệm

Trong khoảng thời gian ngắn, điều kiện cơ sở vật chất phục vụ cho quá trình thu âm dữ liệu còn rất hạn chế nên lượng dữ liệu thu vào chưa phong phú (độ đa dạng, số lượng và chất lượng), cho nên kết quả đạt được trong hệ thống nhận dạng chưa cao. Trong thời gian tiếp sau, luận văn tiếp tục cải thiện độ chính xác của hệ thống nhận dạng bằng cách bổ sung thêm về cơ sở dữ liệu cho hệ thống.

TÀI LIỆU THAM KHẢO

[1]. Barbara S, “High- Performance Automatic Speech Recognition via Enhanced

Front-end Analysis and Acoustic Modeling”,Ph.D.Thesis, University of

California, 2001.

[2]. Hosom J.P, Cole R.A, and Cosi P, “ Improverment in Neural-Network Training and Search technique for continunous Digit recognition” Australia

Journal of Intelligent information processing systems, vol.5,no.5, pp.227-284, 1998.

[3]. Đặng Ngọc Đức, “Nghiên cứu ứng dụng mạng Neural và mô hình Markov ẩn

vào trong nhận dạng tiếng Việt”, Luận án tiến sĩ toán học, Đại học Quốc Gia

Hà Nội, 2004.

[4]. Đỗ Xuân Thọ, Lê Hữu Tĩnh, “Giáo trình tiếng Việt 2”, nhà xuất bản Giáo dục, 1997.

[5]. Lương Chi Mai, Hồ Tú Bảo, “Về xử lý tiếng Việt trong công nghệ thông tin”, Báo cáo khoa học, Viện công nghệ thông tin.

[6]. Nguyễn Thành Phúc, “Một phương pháp nhận dạng lời Việt: áp dụng phương

pháp kết hợp mạng Neural với mô hình Markov ẩn”, Luận án tiến sĩ Kỹ thuật,

Đại học Bách khoa Hà Nội, 2000.

[7]. http://luanvan.net.vn/luan-van/luan-van-nhan-dang-tieng-noi-tieng-viet-su- dung-mang-no-ron-nhan-tao-va-mo-hinh-markov-an-52153/ [8]. http://4tech.com.vn/forums/showthread.php/5055-T%C3%ACm- hi%E1%BB%83u-m%C3%B4-h%C3%ACnh-Markov-%E1%BA%A9n [9]. http://doc.edu.vn/tai-lieu/luan-van-nhan-dang-tieng-noi-tieng-viet-tim-hieu- va-ung-dung-54092/

Một phần của tài liệu (LUẬN văn THẠC sĩ) mô hình markov ẩn và ứng dụng xây dựng hệ thống nhận dạng tiếng nói (Trang 57 - 61)

Tải bản đầy đủ (PDF)

(61 trang)