1. Trang chủ
  2. » Luận Văn - Báo Cáo

Nhận dạng tiếng nói dùng mô hình markov ẩn

121 22 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 121
Dung lượng 1,11 MB

Nội dung

BỘ GIÁO DỤC VÀ ĐÀO TẠO ĐẠI HỌC QUỐC GIA THÀNH PHỐ HỒ CHÍ MINH TRƯỜNG ĐẠI HỌC BÁCH KHOA NGUYỄN THANH PHƯƠNG ĐỀ TÀI: NHẬN DẠNG TIẾNG NÓI DÙNG MƠ HÌNH MARKOV ẨN LUẬN VĂN CAO HỌC CHUN NGÀNH: TỰ ĐỘNG HĨA NĂM 2003 Nhận dạng tiếng nói tiếng Việt GIỚI THIỆU Đã từ lâu, người mơ ước đến hệ thống điều khiển tự động “thông minh” mà giao tiếp với người cách thân thiện gần gũi Một phương tiện giao tiếp “thân thiện gần gũi” người tiếng nói thông qua tiếng nói, người máy hiểu Khi máy tính không cần bàn phím, hệ thống điều khiển không cần bảng điều khiển, máy điện thoại không cần đến bàn phím để quay số, người ta điều khiển hệ thống từ xa cách gọi điện thoại để nói chuyện với người bạn Để thực điều này, người ta phải xây dựng cho máy hệ thống mà hiểu tiếng nói người, hệ thống nhận dạng tiếng nói Ngày nay, với phát triển điện tử tin học, máy tính với tóc độ tính toán cao, Chip xử lý tốc độ cao đời thuận lợi lớn cho việc thực hệ thống nhận dạng tiếng nói Hiện giới có nhiều nghiên cứu thử nghiệm hệ thống nhận dạng tiếng nói đạt số kết khả quan nhö : Via Voice Millennium (IBM), Via Voice Standard (IBM), Naturally Speaking 5.0 (Dragon), CSLU (Center of Spoken Language Understanding), hệ thống xây dựng để nhận dạng tiếng Anh Ngoài số hệ thống nhận dạng ngôn ngữ khác : tiếng Trung Quốc, Tây ban nha, Ý, Đức, thực Tuy nhiên, tiếng Việt chưa có hệ thống nhận dạng hoàn chỉnh Mục đích luận án xây dựng hệ thống nhận dạng tiếng nói tiếng Việt dùng mô hình chuỗi Markov ẩn (Hidden Markov Models) HMM Hệ thống nhận dạng tiếng nói tổng quát gồm giai đoạn: Giai đoạn huấn luyện giai đoạn nhận dạng, minh họa hình vẽ Giai đoạn huấn luyện: Huấn luyện cho hệ thống mẫu chuẩn tương ứng với âm giọng khác Giai đoạn nhận dạng : Hệ thống nhận dạng mẫu tiếng nói ngẫu nhiên dựa vào mô hình mẫu tiếng nói mẫu Giai đoạn huấn luyện Mô hình tiếng nói tiếng nói cần nhận dạng Giai đoạn nhận dạng Xuất từ tương ứng Hình 1: Sơ đồ tổng quát hệ thống nhận dạng tiếng nói Để thực mục tiêu đề nghị sơ đồ khối trình nhận dạng sau: GVHD: TS Nguyễn Đức Thành, HVTH: Nguyễn Thanh Phương Nhận dạng tiếng nói tiếng Việt Tín hiệu Tín hiệu Chọn Chỉ số LPC Tiền xử tiếng Chuỗi Tính tiế n g Số hoá giá từ lý tín nói Ceptral, quan toán P(O|λ) i tiếng cần trị xác hiệu xử lượng tử sá t đượ c rờ i nói nhận lớn hoá suất O rạc hóa tiếng nói lý dạng vector ν* HMM từ mẫu * Với υ = arg max[ P(O | λυ )] 1

Ngày đăng: 16/04/2021, 14:43

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
[4] G. lee, T.Huang, “An Improved Training Algorithm in HMM-Based Speech recognition”, ICSLP96,Vol.2,1996 Sách, tạp chí
Tiêu đề: An Improved Training Algorithm in HMM-Based Speech recognition
[1] L.Rabiner and B.H.Juang. Fundamentals of speech recognition. Published by PTR Prentice-hall. Englewood Cliffs. New Jersey 07632. 1993 Khác
[2] Speech recognition. Theory and C++ Implementation. Claudio Becchetti and Lucio Prina Ricotti. Fondazione Ugo Bordoni, Rome, Italy. John Wiley and Sons, LTD Khác
[3] Xử lý tín hiệu số. Quách Tuấn Ngọc. Nhà xuất bản giáo dục 1995 Khác
[5] Fuzzy Speech Recognition – Patrick M.Mills – University of South Carolina - 1996 Khác
[6] Xử Lý Tín Hiệu Số – PGS.TS Nguyễn Hữu Phương – ĐHKH Tự Nhiên TPHCM. 2000 Khác
[7] Ngữ âm tiếng Việt – Đoàn Thiện Thuật. Nhà xuất bản đại học và trung học chuyên nghieọp, 1998 Khác
[8] Tiếng Việt – Cao Xuân Hạo. Nhà xuất bản giáo dục 1998 Khác
[9] Fuzzy speech recognition – Patrick M.Mills – University of South Carolina - 1996 Khác
[10] F. J. Owens. Signal processing of speech. Published by Macmillan. London. 1993 Khác
[11] John R. Deller, Jr., John G. Proakis and John H. L. Hansen. Discrete-time processing. Published by Macmillan. New York 1993 Khác
[12] Paul M. Embree and Bruce Kimble. C Language Algorithms for digital signal processing. Published by Prentice-Hall 19xx Khác
[13] John G. Proakis and Dimitris G. Manolakis. Introduction to digital signal processing. Published by Macmillan. New York. 1989 Khác
[14] Cơ cấu ngữ âm tiếng Việt. Đinh Lê Thư, Nguyễn Văn Huệ. Nhà xuất bản giáo dục. 1998 Khác

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN