Hướng phát triển

Một phần của tài liệu Nhận dạng tiếng Việt sử dụng biến đổi Wavelet và mô hình Markov ẩn (Trang 115)

Hướng phát triển tiếp theo sẽ là tiếp tục hoàn thiện hệ thống nhận dạng theo phương pháp đề xuất. Thử nghiệm huấn luyện hệ thống với bộ từ điển mẫu lớn hơn, áp dụng mô hình HMM cho âm vị thay vì từ rời rạc.

Khi hệ thống đạt được độ chính xác cần thiết sẽ có thể được triển khai thực thi trên mô hình điều khiển Robot bằng tiếng nói tiếng Việt thời gian thực.

Do hiểu biết và kiến thức có hạn, đặc biệt trong điều kiện thời gian rất eo hẹp, vừa học tập, nghiên cứu vừa tham gia công tác giảng dạy, luận văn không thể

tránh khỏi những thiếu sót. Em rất mong nhận được sự chỉ bảo của các thầy, các góp ý của các bạn để tôi có thể hoàn thiện luận văn và tiếp tục nghiên cứu sâu hơn về lĩnh vực nhận dạng tiếng Việt.

TÀI LIỆU THAM KHẢO

Tiếng Việt

[1] Hoàng Đình Chiến, Lê Tiến Thường (2005), “Nhận dạng tiếng Việt dùng mạng Neural kết hợp với trích đặc trưng LPC và AMDF”, Hội thảo CNTT Quốc Gia. [2] Hoàng Đình Chiến, “Nhận dạng tiếng Việt dùng mạng Neural kết hợp với trích đặc trưng LPC và AMDF”, Chuyên san Tạp chí BCVT.

[3] Hà Đình Dũng, Nguyễn Kim Quang (2003), “Xây dựng bộ giảm nhiễu sử dụng phương pháp trừ phổ ứng dụng trong hệ thống nhận dạng tiếng nói”, Báo cáo hội thảo quốc gia CNTT, Thái Nguyên

[4] Đỗ Xuân Đat, Võ Văn Tuấn (2003), Nghiên cứu các đặc trưng tiếng Việt áp dụng vào nhận dạng tiếng nói, Luận văn tốt nghiệp Cử nhân CNTT, Đại học KHTN TP Hồ Chí Minh.

[5] Đặng Ngọc Đức, “Ứng dụng mạng neural trong nhận dạng tiếng nói mười chữ số tiếng Việt”, Chuyên san Tạp chí BCVT.

[6] Đặng Ngọc Đức, “Gán nhãn âm vị trong quá trình xây dựng CSDL tiếng Việt”, Chuyên san Tạp chí BCVT.

[7] Đặng Ngọc Đức, Lương Chi Mai, “Tăng cường độ chính xác của mạng neural nhận dạng tiếng Việt”, Chuyên san Tạp chí BCVT.

[8] Nguyễn Hoàng Hải, Hà Trần Đức, Nguyễn Việt Anh (2005), Công cụ phân tích wavelet và ứng dụng trong MATLAB, NXB Khoa học kỹ thuật.

[9] Bùi Huy Hải (2004), Nén tín hiệu tiếng nói dùng biến đổi Wavelet, Luận văn thạc sỹ khoa học, ĐH Bách Khoa Hà Nội.

[10] Trịnh Văn Loan, Nguyễn Nam Hà, Phạm Việt Hà, “Xác đinh tham số đặc trưng của các nguyên âm không dấu tiếng Việt”, Chuyên san Tạp chí BCVT.

[11] Lương Chi Mai, Đặng Ngọc Đức (2005), “Hệ thống nhận dạng tiếng việt không dấu liên tục có bộ từ vựng kích thước trung bình”, Hội thảo CNTT Quốc Gia, Hải Phòng.

[12] Nguyễn Thị Thanh Mai, Ngô Hoàng Huy, Nguyễn Huy Hoàng (2005), “Nhận dạng thanh điệu tiếng Việt trên tiếng nói rời rạc phụ thuộc người nói”, Hội thảo CNTT Quốc Gia, Hải Phòng.

[13] Nguyễn Hồng Quang (2004), Nhận dạng tiếng nói tiếng Việt tìm hiểu và ứng dụng, Luận văn tốt nghiệp Cử nhân CNTT, Đại học KHTN TP Hồ Chí Minh. [14] Nguyễn Đình Thông (2005), “Tài liệu hướng dẫn báo cáo phần Xử lý ảnh và tín hiệu”, Hệ Cao học, Đại học Quốc gia Hà nội.

[15] Lê Tiến Thường, Hoàng Đình Chiến, Trần Thanh Hùng (2004), “Phương pháp hiệu quả nhận dạng tiếng Việt ứng dụng phép biến đổi Wavelet”, Chuyên san Tạp chí BCVT.

[16] Lê Tiến Thường, Huỳnh Ngọc Phiên, “Phương pháp mới trích chu kỳ cao độ trung bình trong nhận dạng thanh điệu tiếng Việt”, Chuyên san Tạp chí BCVT, 2005.

[17] Lê Tiến Thường, Hoàng Đình Chiến, “Biến đổi wavelets, subband coding và một số ứng dụng trong xử lý tín hiệu”.

[18] Nguyễn Quốc Trung (2002), Xử lý tín hiệu và lọc số, tập 1,2 NHB KHKT. [19] Nguyễn Quốc Trung (2002), Bài giảng môn Xử lý tín hiệu nâng cao, Hệ cao học, ĐH Bách Khoa Hà Nội.

Tiếng Anh

[20] Donoho, D. L.(1995), “Denoising via soft thresholding'', IEEE Trans. Information Theory, 41: pp. 613-627.

[21] Bob Dunn (29 April 2003), Speech Signal Processing and Speech Recognition. [22] Christine Englund (2004), “Speech recognition in the JAS 39 Gripen aircraft adaptation to speech at different G-loads”, pp. 2 – 5.

[23] R. Favero and R. King, (1993). Wavelet parameterization for speech recognition, Preprint.

[24] Qiang Fu (2003), “A novel speech enhancement system based on wavelet denoising”.

[25] Yi Hu, Student Member, IEEE, and Philipos C. Loizou, Member, IEEE, (2003), “Speech Enhancement Based on Wavelet Thresholding the Multitaper Spectrum”.

[26] M. Krishnan, C. Neophytou, and G. Prescott (1994). Wavelet transform speech recognition using vector quantization, dynamic time wraping and articicial neural networks. Preprint.

[27] S.Manikandan (2006), “Speech enhancement based on wavelet denoising”. [28] Lawrence Rabiner and Biing-Hwang Juang (1993), Fundamentals of Speech Recognition, Prentice Hall.

[29] Gibert Strang, Truong Nguyen (1996), Wavelet and Filter Banks, Weliesley- Cambridge Press, The United States of America.

[30] H. Talhami, T.Le-Tien, D.T. Nguyen, (1997), “Simple algorithm for wavelet maxima modulus extraction in time-scale representation”, IEEE Electronic Letter, An Internaltional Publication, England, Vol.33.

[31] Beng T. TAN, Minyue Fu, Andrew Spray (2000), “The use of wavelet transforms in phoneme recognition”

[32] Le Tien Thuong, Nguyen Huu Loc (1998), “An efficient algorithm for ridge extraction in time-scale and time-frequency representations”

[33] Keiichi Tokuda, HMM-Based Speech Synthesis toward Human-like Talking Machines.

PDF Merger

register your program!

Go to Purchase Now>>

 Merge multiple PDF files into one

 Select page range of PDF to merge

 Select specific page(s) to merge

 Extract page(s) from different PDF

files and merge into one

Một phần của tài liệu Nhận dạng tiếng Việt sử dụng biến đổi Wavelet và mô hình Markov ẩn (Trang 115)

Tải bản đầy đủ (PDF)

(120 trang)