Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 116 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
116
Dung lượng
1,64 MB
Nội dung
ĐẠI HỌC QUỐC GIA THÀNH PHỐ HỒ CHÍ MINH TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN BỘ MÔN CÔNG NGHỆ TRI THỨC hóóóg LUẬN VĂN TỐT NGHIỆP CỬ NHÂN CƠNG NGHỆ THÔNG TIN NGHIÊN CỨU CÁC ĐẶC TRƯNG CỦA TIẾNG VIỆT ÁP DỤNG VÀO NHẬN DẠNG TIẾNG NÓI TIẾNG VIỆT Giáo viên hướng dẫn: Th.S Thái Hùng Văn Sinh viên thực hiện: Đỗ Xuân Đạt – 9912540 Võ Văn Tuấn – 9912737 Thành phố Hồ Chí Minh, tháng năm 2003 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com Lời Cảm Ơn Hoàn thành luận văn này, chúng em xin chân thành cảm ơn thầy Thái Hùng Văn trực tiếp hướng dẫn tạo điều kiện cho chúng em tiếp cận với lĩnh vực nhận dạng tiếng nói, lĩnh vực vô lý thú Chúng em xin gởi lời cảm ơn đến thầy cô trường, đặc biệt thầy cô môn Công Nghệ Tri Thức, thầy Trần Tiến Đức trường ĐH Sư Phạm Kỹ Thuật truyền đạt cho chúng em nhiều kiến thức bổ ích Chúng tơi khơng thể khơng nhắc đến động viên chăm sóc gia đình, cộng tác giúp đỡ ủng hộ tinh thần bạn bè, đặc biệt bạn Nguyễn Tấn Dũng anh Đặng Hồng Vũ Chúng tơi xin ghi ơn tất Thành phố Hồ Chí Minh, tháng năm 2003 Đỗ Xuân Đạt - Võ Văn Tuấn i LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com Lời Giới Thiệu Trong q trính tiến hố, người trở thành động vật mạnh nhất, cao cấp nhờ vào hai thứ: lao động tiếng nói Lao động tạo tư tiếng nói giúp người kết hợp với Cùng với thời gian, phương tiện giao tiếp - thông tin người phát triển phong phú đa dạng Tuy nhiên, dù đa dạng đến đâu khơng thể thay vai trị tiếng nói Tiếng nói phương tiện giao tiếp đặc biệt hiệu phổ dụng, chức vô quý giá người [L.V.Lợi-99] Sự phát triển vượt bậc người nhờ tốc độ khả giao tiếp phong phú tiếng nói Ngày nay, nhờ phát triển khoa học kỹ thuật, máy móc thay lao động tay chân Tuy nhiên để điều khiển máy móc, người phải làm nhiều thao tác tốn nhiều thời gian cần phải đào tạo Điều gây trở ngại khơng việc sử dụng máy móc, thành tựu khoa học kỹ thuật Chúng ta tưởng tượng nhà có người máy giúp việc Khi ta muốn người máy làm việc, ta phải lục tìm đĩa chương trình tương ứng, phải nạp chương trình, … phải chạy lăng xăng làm danh sách công việc lúc ta ngồi bên bàn làm việc, phải tập trung suy nghĩ vào vấn đề cần giải Và ta tưởng tượng xem người máy “nghe hiểu” ta nói Lúc ta cần “nhờ vả” câu, việc trở nên dễ dàng! Đi tìm giải pháp giúp cho máy “nghe hiểu” được, người bước vào lĩnh vực nhận dạng tiếng nói Hơn nửa kỷ trôi qua, người thu thành tựu đáng kể, có ứng dụng hữu ích vào đời sống Nhưng dù sao, khả “nghe hiểu” máy khoảng cách xa so với thực tế Mặt khác, hệ thống nhân dạng phát triển tương đối tốt số ngôn ngữ tiếng Anh, tiếng Pháp, tiếng Hoa,… Còn nước ta, nhận dạng tiếng nói cịn lĩnh vực mẻ Đến đạt số thành tựu có ứng dụng định, nhìn chung, nhận dạng tiếng Việt chưa đạt kết cần thiết để tạo sản phẩm thực tế hồn chỉnh Khó khăn nằm tính phức tạp vấn đề mức độ đầu tư kế thừa chưa cao Các nghiên cứu chủ yếu nhận ii LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com dạng tiếng nói chung chung chưa có nhiều phân tích kỹ đặc tính riêng tiếng Việt Các hệ nhận dạng trước hầu hết không phân biệt từ đồng âm như: a, á, à, ả, ã, ạ… Hơn kích thước từ điển (số từ nhận biết được) nhỏ, thời gian học mẫu lâu, nhận dạng mang tính phụ thuộc người nói cao Vấn đề cịn khó khăn chỗ nhận dạng tiếng nói mang tính liên ngành [T.H.Văn00] Nghiên cứu nhận dạng tiếng nói máy tính nghiên cứu hệ thống ngành khoa học có liên quan như: ngơn ngữ học, thống kê học, sinh lý học, vật lý học, toán học, âm học, tâm lý học, lý thuyết thông tin truyền tin… dĩ nhiên có cơng nghệ thông tin Luận văn xây dựng với mong muốn góp phần khắc phục hạn chế trên, nâng cao hiệu nhận dạng tiếng Việt; cách rút trích sử dụng nhiều đặc trưng âm học tiếng Việt hơn, từ dùng nhiều đặc trưng để nhận dạng giúp nâng cao độ xác phân biệt từ đồng âm góp phần nâng kích thước từ điển lên lớn Nội dung luận văn trình bày thành chương sau: Chương 1: Tiếng nói ngữ âm tiếng Việt Chương thứ tóm tắt tiếng nói trình bày số đặc điểm ngữ âm tiếng Việt Trong số đó, luận văn quan tâm nhiều đến điệu, đặc điểm khác biệt tiếng Việt so với nhiều ngôn ngữ khác Chương 2: Xử lý tín hiệu số - phân tích tiếng nói: Trình bày số kiến thức xử lý tín hiệu số số phương pháp tiếp cận tín hiệu tiếng nói Chương 3: Nhận dạng tiếng nói Chương mơ tả hệ nhận dạng tiếng nói tổng quát, cụ thể vào hệ nhận dạng tiếng nói sử dụng mơ hình Markov ẩn liên tục Chương 4: Một số khảo sát điệu tiếng Việt Đây khảo sát người viết điệu tiếng Việt Kết khảo sát kết hợp, so sánh với nghiên cứu ngữ âm tiếng Việt trước để rút đặc điểm ngữ âm tiếng Việt, làm sở cho việc xây dựng hệ nhận dạng tiếng Việt theo mô tả luận văn Chương 5: Xây dựng mơ hình nhận dạng điệu tiếng Việt Nhận dạng điệu bước ứng dụng nghiên cứu nói vào hệ iii LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com nhận dạng tiếng Việt luận văn Bắt đầu từ đặc tính đặc trưng tiếng Việt điệu Chương 6: Thiết kế mơ hình nhận dạng tiếng Việt Phần thiết kế luận văn hệ nhận dạng tiếng Việt hồn chỉnh Ứng dụng mơ đun nhận dạng điệu vào hệ nhận dạng tiếng Việt hoàn chỉnh Chương 7: Hiện thực hố mơ hình nhận dạng tiếng Việt Chương cuối cài đặt cụ thể luận văn hệ nhận dạng tiếng Việt Phần phụ lục 1: giới thiệu số đặc điểm ngữ âm tiếng Việt Trong đó, luận văn ý nhiều đến đặc điểm điệu dùng để ứng dụng phân lớp tiếng Việt Phần phụ lục 2: Giới thiệu vai trò tần số tiếng nói số phương pháp rút trích tần số iv LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com Mục Lục Lời Cảm Ơn i Lời Giới Thiệu .ii Mục Lục v Chương Tiếng nói ngữ âm tiếng Việt 1.1 Giới thiệu tiếng nói 1.1.1 Sự phân bố biên độ 1.1.2 Sự phân bố tần số 1.1.3 Sự biến đổi tần số 1.1.4 Tỷ số tiếng nói 1.2 Ngữ âm tiếng Việt (Tham khảo phụ lục 1) 1.2.1 Thanh điệu 1.2.2 Âm vị 1.2.3 Trường độ Chương Xử lý tín hiệu số - phân tích tín hiệu tiếng nói 2.1 Xử lý tín hiệu số 2.1.1 Lấy mẫu tín hiệu Hàm lấy mẫu: 2.1.1.1 Phổ tín hiệu lấy mẫu 2.1.1.2 Mối quan hệ phổ tín hiệu rời rạc phổ tín hiệu liên tục theo thời gian thời gian 2.1.2 Dãy xung 10 2.1.3 Biến đổi Fourier rời rạc 11 2.1.3.1 Biến đổi Fourier rời rạc 12 v LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com 2.1.3.2 Biến đổi Fourier nhanh 13 2.1.4 Biến đổi cosin rời rạc 13 2.1.5 Các lọc 14 2.1.6 Cửa sổ tín hiệu 15 2.2 Phân tích tín hiệu tiếng nói 20 2.2.1 Phương pháp dãy lọc 20 2.2.2 Trích đặc trưng MFCC 28 2.2.3 Phương pháp mã hóa dự báo tuyến tính (LPC) 32 2.2.3.1 Làm rõ tín hiệu .34 2.2.3.2 Phân đoạn thành frame 34 2.2.3.3 Lấy cửa sổ 35 2.2.3.4 Phân tích tự tương quan 36 2.2.3.5 Phân tích LPC 36 2.2.3.6 Chuyển hệ số LPC thành hệ số cepstral 37 2.2.3.7 Đặt trọng số cho hệ số cepstral 37 2.3 Phát chu kỳ tiếng nói – phương pháp tìm tần số (Tham khảo phụ lục 2) 38 2.3.1 Các kỹ thuật theo miền thời gian 39 2.3.2 Các kỹ thuật phân tích phổ hữu hạn 39 2.3.3 Mơ tả tín hiệu 40 2.3.3.1 Tiếng nói thơ 40 2.3.3.2 Lỗi dự báo tuyến tính 40 2.3.4 Một số phương pháp cài đặt kỹ thuật trích F0: 41 2.3.4.1 Phương pháp dùng cepstral: 41 2.3.4.2 Phương pháp tự tương quan: 41 2.3.4.3 Phương pháp CLIP (center clipping pitch detector) 42 vi LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com 2.3.4.4 Phương pháp SIFT (Simplified Inverse Filter Tracking) 43 2.3.4.5 Hàm AMDF (Average Magnitude Difference Function) 43 2.3.4.6 Phương pháp so khớp biên độ 43 Chương Nhận dạng tiếng nói 46 3.1 Tổng quan hệ nhận dạng: 46 3.2 Tổng quan hệ nhận dạng tiếng nói: 46 3.3 Những thuận lợi khó khăn nhận dạng tiếng nói: 49 3.4 Nhận dạng tiếng nói sử dụng mơ hình Markov ẩn 50 3.4.1 Mơ hình Markov ẩn toán cần giải quyết: 50 3.4.1.1 Giải toán thứ nhất: 51 3.4.1.2 Giải toán thứ hai: 52 3.4.1.3 Giải toán thứ ba: 52 3.4.2 Mơ hình Markov ẩn liên tục (CDHMM - Continuous Densities Hidden Markov Model) 55 Chương Một số khảo sát điệu tiếng Việt 59 4.1 Thanh (Thanh ngang) 59 4.2 Thanh (Thanh huyền) 60 4.3 Thanh (Thanh ngã) 61 4.4 Thanh (Thanh hỏi) 63 4.5 Thanh (Thanh sắc) 64 4.6 Thanh (Thanh nặng) 66 Chương Xây dựng mơ hình nhận dạng điệu tiếng Việt 66 5.1 Tiền xử lý 66 5.2 Trích F0 từ tín hiệu tiếng nói (pitch extraction) 69 5.3 Tạo vector đặc trưng từ vector V(F0) 71 5.4 Huấn luyện cho mơ hình 72 vii LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com 5.5 Nhận dạng 73 5.6 Một số kết nhận dạng điệu tiếng Việt 74 Chương Thiết kế mô hình nhận dạng tiếng nói tiếng Việt 77 6.1 Công đoạn huấn luyện 77 6.2 Công đoạn nhận dạng 79 Chương Hiện thực hố mơ hình nhận dạng tiếng Việt 80 7.1 Nhận dạng tiếng đơn 80 7.2 Nhận dạng câu 82 Chương Kết luận 84 8.1 Kết luận 84 8.2 Hướng phát triển: 85 Tài liệu tham khảo 86 Phụ lục 1: Ngữ âm tiếng Việt 87 Phụ lục 2: Vai trò tần số số kỹ thuật xử lý tần số 100 viii LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com Chương Tiếng nói ngữ âm tiếng Việt 1.1 Giới thiệu tiếng nói Tiếng nói loại sóng âm Khi ta nói, tiếng nói truyền mang theo thông tin dạng dao động phương truyền đến tai người nhận Mức độ truyền tin tiếng nói xem nhanh khả tự nhiên người Khác với sách báo, thư tín… tryền tin chiều, tiếng nói giúp ta truyền tin hai chiều Sách báo giúp ta ghi lại thông tin để sau đọc lại, tiếng nói giúp ta thể thân Thơng qua cách nói chuyện, khả ứng xử, ta đánh giá trình độ nhân cách mơt người Tiếng nói phương tiện truyền tin nhanh hiệu người Tiếng nói có nhiều đặc tính: Đặc tính sóng âm gồm đặc tính sinh lý, vật lý như: cường độ, tần số, biên độ, lượng, âm sắc, độ cao, độ to… Đặc tính xã hội như: ngữ điệu, sắc thái tình cảm, địa phương… Số từ sử dụng thường xuyên giao tiếp ngày người dao động khoảng từ 2000 đến 3000 từ Số từ người ta sử dụng trung bình khoảng 5000 đến 10000 từ [5] Nghiên cứu nhận dạng tiếng nói máy tính, ta xem xét chủ yếu đến tần số, biên độ (hay lượng) Tiếng nói có miền tần số nằm khoảng 80 – 8000 Hz [11] 1.1.1 Sự phân bố biên độ Khi thống kê với khoảng 80 người (4 người/ ngôn ngữ), người ta nhận thấy biên độ tối đa đạt tiếng nói lớn 50dB [5] Trong chuỗi tiếng nói, biên độ tiếng nói phân bố liên tục theo dạng hình sin LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com đối lập Về mặt ngữ âm, đặc tính điệu khơng lan truyền lên phụ âm đầu Hoặc có (trong trường hợp phụ âm đầu hữu vang), đoạn đầu âm tiết đặc trưng khu biệt điệu chưa thể rõ Tài liệu ngữ âm thí nghiệm chứng minh rằng, thông tin ngôn ngữ học điệu thể rõ nửa cuối âm tiết mà thơi Phần vần âm tiết bao gồm âm đệm, âm bắt buộc có bán nguyên âm hay phụ âm cuối Sự khác biểu tập trung cuối vần (tức nguyên âm phụ âm cuối) Trong vần khơng có phụ âm cuối (ví dụ: ta, tu), có âm cuối bán nguyên âm (ví dụ: mai, sau), hay có âm cuối phụ âm vang (ví dụ: nam, lan xanh, mang) đặc trưng điệu đặc trưng dễ dàng Phức tạp vần kết thúc phụ âm cuối vơ thanh, khép (ví dụ: tạp, tập, hát, bắt, bác, bắc …) đoạn giữ phụ âm cuối vơ có zero âm học, đặc trưng đoạn Nhưng mặt thụ cảm, phụ âm cuối nhận diện /-p/, hay /-t/, /-k/ nhờ giai đoạn tạo thành chỗ tắc chuyển tiếp từ nguyên âm đến phụ âm (Gordina, 1984) Giai đoạn chuyển tiếp luôn hữu thanh, nên nhờ dó đặc trưng điệu phần có biểu hạn chế Có thể nói rằng, mối quan hệ với thành phần chiết đoạn âm tiết, điệu bị chế định rõ ràng âm cuối Vì phân bố điệu âm tiết phụ thuộc vào loại hình kết thúc âm tiết Số lượng điệu xuất âm tiết kết thúc phụ âm cuối vô hạn chế Ở âm tiết sắc nặng Hai có đường nét âm điệu không đổi hướng, lên (như sắc) xuống (như nặng) Nên dễ nhận diện âm tiết có trường độ giai đoạn tính ngắn Sự phân bố điệu mối quan hệ với âm cuối tóm tắt sơ đồ sau: 93 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com Thanh sắc nặng âm tiết có âm cuối vơ có đặc điểm riêng độ dài đường nét âm điệu khác với sắc nặng âm tiết lại (so sánh: tá / tán với tát ta / tạn với tạt) Vì vậy, trước có quan niệm điệu âm tiết có âm cuối vơ thanh điệu đặc biệt khác tiếng việt ghi hệ thống gồm điệu: tan, tàn, tãn, tản, tán, tạn, tát, tạt 1.4 Về đặc trưng điệu tiếng Việt trạng thái tĩnh Như biết tiếng việt thuộc loại ngơn ngữ đơn lập có điệu Nếu âm tiết đơn vị với chức làm vỏ vật chất hình vị (đơn vị nhỏ có ý nghĩa) diện mạo ngữ âm cần xem xét theo khía cạnh: Phổ âm tần số quan điểm âm vị học hệ thống dấu hiệu khu biệt ngữ âm tiếng Việt Quả âm tiết có điệu định điệu tồn âm tiết Xét mặt cấu trúc, điệu thuộc tính ngữ âm tồn âm tiết, bao gồm thông số âm học bản: 1- tần số (F0), 2- cường độ (I), 3- trường độ (T) Xét mặt chức năng, điệu dấu hiệu hay chùm nét khu biệt tồn âm tiết lẽ đó, âm tiết tiếng việt có cấu trúc thành phần: cáu trúc âm cấu trúc điệu cấu trúc âm bao gồm yếu tố chiết đoạn; điệu yếu tố siêu chiết đoạn điệu cấu trúc đa chiều phi tuyến tính Xét phân chiết, khơng có đặc tính phân lập xét chức lại có đặc tính phân lập 1.5 Diện mạo đường nét điệu qua thụ cảm thính giác Thanh 1: có bốn biến điệu, đường nét ngang phẳng Thanh 2: có ba biến điệu, đường nét nói chung xuống đặn, phẳng Thanh 3: có bốn biến điệu, đường nét bị gãy thành đoạn, đoạn hai lên kết thúc cao Nét gãy phần lớn bị tách 94 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com có biến điệu, nét gãy lại khơng bị tách điều chứng tỏ tượng tắc họng khơng có tính chất bắt buộc Thanh 4: có ba biến điệu, đường nét ban đầu xuống sau lên mạnh (thường gặp giọng nam) yếu (thường gặp giọng nữ) Thanh 5: có bốn biến điệu, đường nét lên hoặc phẳng lên gấp ngắn Thanh 6: có năm biến điệu nói chung xuống gấp ngắn Đường nét lên gấp xuống gấp có liên quan trực tiếp với phương thức kết thúc âm tiết Nhận Xét: Tuỳ theo cấu trúc âm tiết phát âm cá nhân cộng tác viên, điệu thể hình thức khác nét chung điệu nhận diện qua đường nét điệu, lẽ đặc trưng ngữ âm điệu đường nét, tức vận động tần số theo hàm thời gian Từ kết phân tích, miêu tả đường nét điệu sau: Thanh điệu Sự miêu tả đường nét Ngang xuống đặn phẳng lên, xuống – gãy – lên xuống –lên Lên xuống thấp Thanh có hai hình thức thể hiện: 5a, 5b, 6a, 6b Đường nét chúng miêu tả sau: Thanh điệu Hình thức thể 5a Đi lên đặn 5b Đi lên gấp 6a Đi xuống thấp Sự miêu tả đường nét 95 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com Đi xuống thấp gấp 6b Âm vị Xét mặt ngữ âm, âm vị đơn vị nhỏ tiếng nói Mỗi âm vị có hai chức : Cấu tạo nên vỏ âm đơn vị có nghĩa Phân biệt vỏ âm đơn vị có nghĩa Ví dụ: từ tơi có âm vị: “t”, “ơ”, “i” Đến đây, câu hỏi đặt âm vị khác đặc trưng Ta xét đến đặc trưng âm học cấu âm tạo nên âm vị Các đặc trung âm vị chia thành loại tuỳ theo tiêu chuẩn như: 2.1 Phân biệt nguyên âm theo vị trí đầu lưỡi: ngun âm dịng trước: phát âm, đầu lưỡi đưa phía trước Ví dụ: [i], [e] nguyên âm dòng giữa: phát âm, phần lưỡi nâng lên phía ngạc ngun âm dịng sau: phần sau lưỡi nâng lên phía ngạc mềm Ví dụ: [a], [u], [o] 2.2 Phân biệt nguyên âm dựa vào độ mở miệng: nguyên âm có độ mở rộng: [a], [ă] nguyên âm có độ mở hẹp: [i], [u] 2.3 Phân biệt ngun âm theo hình dáng mơi: khơng trịn mơi: [i], [e], [a] trịn mơi: [o], [u] Ngồi ra, người ta dựa vào tiêu chuẩn khác như: tính mũi hố, trường độ… Người ta mơ tả nguyên âm dựa vào tất tiêu chuẩn trên, ví dụ: [i] ngun âm có độ mở hẹp, hàng trước, khơng trịn mơi; [u] ngun âm hàng sau, trịn mơi, độ mởi hẹp… 2.4 Phân biệt phụ âm dựa vào phương thức cấu âm: 96 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com phụ âm tắc: khơng khí bị cản trở hồn tồn, phải phá vỡ cản trở để gây tiếng nổ phụ âm xát: khơng khí bị cản trở khơng hồn tồn, phải lách khe hở nhỏ hai quan cấu âm, gây nên tiếng xát nhẹ Ví dụ: [v], [f], [h]… phụ âm rung: phát âm, chỗ lưỡi đầu lưỡi chấn động liên tục làm cho luồng không khí bị chặn lại mở liên tiếp, gây nên loạt tiếng rung Đó phụ âm kiểu [R] 2.5 Căn vào vị trí cấu âm: âm môi-môi: vật cản hai môi, [m], [b]…; âm môi-răng, vật cản hàm môi [v], [f]… âm đầu lưỡi: đầu lưỡi áp chặt vào hàm trên: [t], đầu lưỡi áp vào ngạc hay lợi: [d], [n], [l]… âm mặt lưỡi: mặt lưỡi nâng lên phía ngạc cứng: [c] âm cuối lưỡi: phần cuối lưỡi nâng lên tiếp xúc ngạc mềm: [g], [k]… âm hầu: khơng khí bị cản trở hầu: [h]… Tổng hợp tiêu chuẩn giúp ta phân biệt âm vị với Ví dụ: phụ âm [p] âm môi, ồn, vô thanh, tắc, phụ âm; phụ âm [d] âm đầu lưỡi, ốn, hữu thanh, tắc… 2.6 Phân biệt phụ âm dựa vào đặc điểm âm học: âm vang: [m], [n], [l]… Các phụ âm vang có đặc điểm thành phần cấu tạo chúng, tiếng âm ồn: [t], [k], [b], [s]… Có nhiều tiếng động (tiếng ồn) thành phần cấu tạo Phụ âm ốn chia hai loại nhỏ: hữu ([b], [d], [g], [z]: dây rung) vô ([p], [t], [k], [s]: dây không rung) Khi phân loại tổng quát, người ta dựa vào số đặc điểm khác Đó tiêu chí lưỡng phân, tổng hợp lại tạo thành lưỡng phân: Nguyên âm – không nguyên âm Phụ âm – không phụ âm Bổng - trầm 97 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com Loãng - đặc Ngắt – không ngắt Gắt – không gắt Căng – lơi Hữu – vô Mũi - miệng Giáng – không giáng Thăng – khơng thăng Thanh hầu hóa – khơng hầu hoá Ưu điểm phân loại âm học: Có thể xác định trực tiếp âm mà khơng cần phải thông qua hoạt động máy phát âm Nguyên âm phụ âm phân chia bình đẳng Dựa lưỡng phân mà đề xuất mơ hình giúp thực thi mơ hình giao tiếp người - máy Có mối tương ứng với phân loại cấu âm Ngồi âm vị, ta cịn có khái niệm “âm tố” Âm tố thể cụ thể âm vị Ví dụ: âm vị [n], âm tiết khác khác nhau: mạnh lên, yếu đi, trịn mơi (“no”, “nơ”) Từng cách phát âm cụ thể âm vị [n] âm tiết “no” hay “nơ” âm tố [n] Tóm lại, âm tố biến thể âm vị Các biến thể thường chia làm hai loại: biến thể kết hợp bị qui định bỡi vị trí, bối cảnh; biến thể tự khơng phụ thuộc bối cảnh Trường độ Một đặc điểm ngơn ngữ tiếng Việt tính cố định trường độ âm tiết Các âm tiết loại hình điệu có độ dài nhau, không kể đến số yếu tố tham gia cấu tạo âm tiết nhiều hay Ví dụ, hai âm tiết làm, mang điệu huyền, có trường độ nhau, dù phần vần là nguyên âm [ a ], phần vần làm gồm hai yếu tố nguyên âm [a] âm cuối [m] Để đảm bảo cho tính cố định trường độ âm tiết, nội phần vần có đắp đổi lẫn trường độ: nguyên âm ngắn bán nguyên âm cuối / 98 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com phụ âm cuối dài ngược lại, nguyên âm dài bán nguyên âm cuối / phụ âm cuối ngắn Ngoài đắp đổi trường độ, phần vần cịn có lệ thuộc chất ngun âm âm cuối Giữa âm cuối âm có tiếp hợp lỏng âm cuối sau nguyên âm dài Từ đặc điểm vừa nêu, nhận thấy, nguyên âm (trừ / ă / ) âm cuối có biến thể ngắn dài Ảnh hưởng âm cuối lên tiếng Hệ thống âm cuối Âm cuối yếu tố kết thúc âm tiết Các âm tiết tiếng Việt kết thúc cách biến đổi âm sắc âm động tác khép lại máy phát âm, làm cho bổng trầm Âm cuối trường hợp hai bán nguyên âm /-u/ /-i/ Ví dụ: dâu, sao, ngày, mai Âm tiết tiếng Việt cịn kết thúc động tác khép máy phát âm với phụ âm tắc (mũi miệng), ví dụ: học, tập, hành, động Về mặt âm vị học, hệ thống âm cuối tiếng Việt gồm có bán nguyên âm phụ âm Quy luật biến dạng âm âm cuối Trong kết hợp với âm đầu âm đệm, nguyên âm làm âm có bị ảnh hưởng nhiều Chẳng hạn, sau âm đầu phụ âm mũi / m-, n-, , ŋ- /, nguyên âm nhiều bị mũi hoá Sau âm đệm / -u- /, ảnh hưởng tính chất trịn mơi âm đệm, ngun âm bị mơi hố, trở thành ngun âm chuyển sắc Tuy nhiên, đáng kể biến dạng âm âm cuối chúng kết hợp với Trong khn khổ phần vần, có liên quan chặt chẽ âm âm cuối Sự biến đổi âm kéo theo biến đổi âm cuối ngược lại 99 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com Phụ lục 2: Vai trò tần số số kỹ thuật xử lý tần số Việc xác định tần số (F0) hay “pitch” tín hiệu vấn đề quan trọng nhiều ứng dụng tiếng nói (Mặc dù pitch đặc tính nhận biết tiếng nói, F0 đối tượng cần tính đây, “bộ ước lượng” thường gọi “dị tìm pitch”) Tiếng nói hữu bao gồm rung động dây thanh, “pitch” đề cập đến tần số rung động hay chu kỳ tính tín hiệu tiếng nói Các xử lý âm ngữ điệu nhấn giọng định âm vị ngơn ngữ nói Hầu hết mã hố tiếng nói mức độ thấp tính pitch để giúp cho tiếng nói tái tạo chấp nhận được, số mã hoá tiếng nói mức độ vừa sử dụng pitch để giảm bớt mức độ chuyển đổi giữ tiếng nói có chất lượng cao Thành phần pitch có ích nhận dạng người nói tổng hợp tiếng nói (ngữ điệu tự nhiên phải tuân theo luật) Biểu diễn tần số theo thời gian thực cho ta ý tưởng ứng dụng cho người điếc học nói Việc xác định pitch đơn giản hầu hết tiếng nói, thay đổi tiếng nói tự nhiên, dao động bất qui tắc dây thanh, khoảng giới hạn giá trị F0 rộng, ảnh hưởng hình dạng máy phát âm đến F0, tiếng nói bị giảm chất lượng mơi trường ồn, thuật tốn thường khơng đạt độ xác 100% Các kỹ thuật thiết bị phần cứng có sử dụng thêm thơng tin khác ngồi tín hiệu tiếng nói, ví dụ: cách đo điện trở quản dây mở đóng, thơng qua tiếp xúc với micrơ hay gia tốc kế gắn người, hay thông qua siêu âm hình ảnh hoạt động dây Tuy nhiên, phần lớn dị tìm pitch thuật tốn máy tính thao tác trực tiếp tín hiệu tiếng nói Hầu hết xử lý có phần định tiếng nói, xử lý phân loại lên đến lớp tiếng nói: hữu thanh, vơ thanh, kết hợp (ví dụ: /z/), khoảng lặng Khơng giống ước lượng pitch, việc dị tìm tiếng nói (gồm loại rời rạc) phù hợp với kỹ thuật nhận dạng mẫu Ta dị tìm F0 từ các tham số mang tính chu kỳ miền thời gian hay từ thay đổi điều hoà cách theo qui luật miền tần số Các dò 100 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com pitch theo miền thời gian có thành phần: tiền xử lý (dùng để lọc đơn giản hố tín hiệu thơng qua việc thu nhỏ liệu), mơđun sở trích F0 (đánh dấu pitch nằm có dạng sóng), xử lý (dùng để sửa lỗi) Các thuật toán thử xác định hay nhiều khía cạnh sau tín hiệu tiếng nói: hàm điều hồ bản, cấu trúc thời gian có chu kỳ, xen kẽ cường độ cao thấp, điểm gián đoạn Các hàm điều hoà cấu trúc có chu kỳ thường cho kết tốt, nhiên có vài trường hợp cá biệt bị sai Các thuật tốn dị tìm pitch thường chuyển phức tạp thành phần sang thành phần khác Ví dụ: rút trích hàm điều hồ cần phải có lọc phức tạp để làm công việc tiền xử lý lại ý đến rút trích sơ cấp đơn giản đếm số zero crossing tiếng nói xử lý lọc Một ngưỡng động khác không sử dụng xử lý để loại bỏ giá trị zero crossing khơng phù hợp Nhìn chung, tiền xử lý lọc thơng thấp đơn giản, độ phức tạp việc chọn tần số ngưỡng tăng lên tuỳ thuộc vào khoảng giới hạn giá trị F0 Các kỹ thuật miền tần số dùng để trích pitch gồm: độ tương quan, khả lớn nhất, kỹ thuật xử lý phổ khác có kiểm tra tín hiệu tiếng nói cửa sổ ngắn Tự tương quan, độ lệch trung bình biên độ, nén phổ, phương pháp so khớp hàm điều hoà xử lý tiếp cận phổ Nhìn chung chúng có độ xác cao kỹ thuật miền thời gian, chi phí tính tốn cao Trích pitch theo thời gian thực có ràng buộc giá trị F0 phải tính với độ trì hỗn nhỏ Bởi hầu hết kỹ thuật xử lý theo miền tần số cần vùng đệm mẫu tiếng nói trước chuyển đổi phổ, chúng thường không nhanh xử lý trực tiếp dạng sóng theo thời gian.Ta sửa lại số dị tìm pitch để đạt tốc độ nhanh hơn, cách giảm thời gian chu kỳ F0; ví dụ: ước lượng lại cấu trúc có chu kỳ (và thời gian chu kỳ) nhanh chu Các dị tìm pitch khơng kết xuất thời điểm mà tính khoảng thời gian phù hợp cho ứng dụng mã hố tiếng nói Các kỹ thuật theo miền thời gian Dường ước lượng tần số công việc đơn giản; người, đặc biệt nhà ngữ âm học cảm thấy dễ dàng khảo sát dạng sóng phân đoạn thành chu kỳ liên tục Bởi kích thích máy phát âm lên chu kỳ F0 diễn sợi dây đóng lại, chu kỳ có khuynh hướng bắt đầu cường độ lớn (gọi điểm khởi đầu) sau giảm dần Mức độ giảm thường tỷ lệ 101 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com nghịch với băng tần F1 Ngoại trừ tiếng nói có chu kỳ ngắn hay băng tần F1 hẹp, thường có suy giảm đủ cho ta định vị điểm khởi đầu nhờ phép duyệt tìm cực đại đơn giản, với vài ràng buộc thời gian chu kỳ Nếu giới hạn người nói từ giọng trẻ em hay giọng nữ cao đến giọng nam trung, thời gian chu kỳ F0 kéo dài từ nhỏ ms đến lớn 20 ms, giới hạn điển hình nhỏ hơn, ví dụ: 6-12 ms đàn ông Một ràng buộc đáng tin cậy dựa tốc độ thay đổi F0; phần hữu tiếng nói, F0 thường thay đổi chậm, nhiều quãng khoảng 100 ms Trước áp dụng ràng buộc liên tục trên, người ta phải tìm chu kỳ F0 xác vùng hữu thanh, F0 thay đổi nhiều vùng vô tiếng nói (ví dụ: điểm bắt đầu lại tiếng nói sau khoảng lặng hay âm tắc có F0 sai lệch nhiều so với F0 điểm kết thúc phần hữu liền trước) Hầu hết vấn đề tìm F0 xảy vùng biên hữu vô thanh, nơi mà ràng buộc liên tục không áp dụng chu kỳ F0 gần bất qui tắc Các khó khăn khác phụ thuộc vào thay đổi đột ngột cường độ phoóc măng làm tăng đường biên âm vị Để dễ dàng tiếp cận việc dị tìm điểm khởi đầu, thơng thường tiếng nói cần xử lý lọc thông thấp bước tiền xử lý để cịn lưu trữ F1 (ví dụ: khoảng 0-900 Hz) Điều loại bỏ ảnh hường phoóc măng cao mà giữ lại tần số có hàm điều hồ đủ mạnh để xác định điểm khởi đầu xác Một cách tiếp cận khác chọn ngưỡng cường độ thay đổi: chu kỳ có giá trị nhỏ khoảng ms, điểm khởi đầu phải cách ms, bỏ qua sai lệch tín hiệu lớn xảy sau điểm bắt đầu chu kỳ, ngưỡng giảm dần theo hàm mũ mức độ đặc trưng chu kỳ F0 Một cách tiếp cận trực tiếp lọc tất lượng từ tín hiệu tiếng nói ngoại trừ tần số sau kiểm tra số zero crossing (mỗi chu kỳ dao động có điểm zero crossing) Một khó khăn gặp phải xác định ngưỡng cho lọc thông thấp: ngưỡng phải đủ lớn để nhận dao động giọng nói cao phải đủ nhỏ để loại bỏ tất dao động từ thứ hai trở giọng nói thấp Khó khăn thứ hai, nhiều ứng dụng dùng tiếng nói lọc thơng để phân tích (ví dụ: điện thoại, loại bỏ miền tần số 0-300 Hz), dao động không biểu diễn Một giải pháp cho vấn đế tái tạo dao động từ dao động tần số cao thơng qua phép ước lượng phi tuyến, ví dụ: cho tiếng nói qua tách sóng, để tạo lượng tất dao động thành phần 102 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com Các kỹ thuật ước lượng F0 dựa theo miền thời gian có thuận lợi tính tốn đơn giản Thêm vào đó, chúng định vị thời điểm định cho điểm khởi đầu F0, điều thật có ích cần tính chu kỳ F0 so với việc ước lượng F0 đơn Tuy nhiên, hệ thống có tốc độ nói khác (tăng hay giảm tốc độ, phụ thuộc người dùng thích nghe tốc độ nào) thông thường làm cách bỏ qua hay nhân đôi chu kỳ F0, ghép nối điểm khởi đầu để giảm thiểu gián đoạn dạng sóng Các kỹ thuật phân tích phổ hữu hạn Lớp thứ hai việc ước lượng F0 khối mẫu tiếng nói có nhiệm vụ chuyển đổi mẫu tín hiệu theo dạng phổ để làm tăng thơng tin mang tính chu kỳ tín hiệu Tính chu kỳ xuất đạt cực đại phổ mang tính tn hồn Trong cực đại dạng sóng theo miền thời gian thường dựa tương tác phoóc măng (đặc biệt F1) với kích thích mơn, cực đại phổ thường dễ nhận biết Trong hệ thống này, người ta xem phép biến đổi phổ bước tiền xử lý dị tìm cực đại phổ ước lượng F0 sở Sau xử lý kiểm tra lại sửa lỗi F0 ước lượng Các lỗi phân thành loại sau: gấp đôi hay giảm nửa pitch, thiếu bước nhận dạng sở hàm điều hoà lần Lỗi gấp đơi có khuynh hướng xảy mức lượng tần số yếu mức lượng tần số (Lỗi chia đôi F0 thường xảy thuật toán theo miền thời gian hơn, hai chu kỳ bị nhầm thành một) Theo nghiên cứu, F0 biến thiên quãng khung hầu hết ước lượng pitch (thông thường ước lượng F0 10-30 ms), xử lý áp dụng ràng buộc liên tục để làm trơn ước lượng thay đổi bất thường Các lỗi sai lệch nhỏ chừng vài hertz khó xử lý lỗi thơ, lỗi (ví dụ: gấp đơi) có xu hướng gia tăng khung phân tích q ngắn (khơng chứa đủ thơng tin để xác định pitch xác) hay dài (nếu F0 thay đổi nhanh khung) Hai trường hợp sau minh hoạ lựa chọn độ dài khung thích hợp Cũng ứng dụng lấy cửa sổ khác, tham số tiếng nói tốt tín hiệu khơng đổi suốt khung Vì ta nên lấy khung ngắn, nhiều vài chu kỳ pitch, F0 thay đổi nhanh Cũng lợi dụng tính chất thay đổi nhanh phổ đường biên dùng vào ước lượng pitch phổ Mặt khác, khung phải chứa chu kỳ để cung cấp dấu hiệu mang tính chu kỳ Tính xác việc tính F0 tỷ lệ với số mẫu khung phân tích Vì thế, 103 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com khung ngắn dễ gặp lỗi tìm pitch Vì có gái trị F0 rút từ khung, người ta thường lấy trung bình F0 ước lượng khung Một phức tạp việc trích pitch có ngun nhân từ khơng xác pha (gặp phải nhiều phương tiện truyền tin, chẳng hạn điện thoại) từ sai lệch pha các dao động Bởi pha phổ tiếng nói bị thay đổi đến 1800 với phoóc măng, dao động khoảng 200-900 Hz F1 dường có pha khác với pha dạng sóng phức tạp làm mờ tính chu kỳ việc ước lượng pitch theo miền thời gian Một giải pháp cho việc loại bỏ ảnh hưởng pha cách dị tìm điểm cực đại, thao tác trực tiếp tín hiệu tiếng nói lọc mà thơng qua tính tự tương quan hữu hạn (k) Nhắc lại (k) nghịch đảo phép biến đổi Fourier cho phổ lượng (|X(ejw)|2), đó, thiết đặt pha điều hồ giá trị zero Mặc dù tín hiệu theo miền thời gian, (k) định vị điểm bắt đầu pitch mát pha phân tích hữu hạn Vì mục đích ước lượng F0, tái tạo phổ lượng khơng xác, tín hiệu tiếng nói thường bị bóp méo trính xử lý trước lấy tự tương quan để giảm bớt tính tốn giữ tham số có tính tuần hồn Phương pháp cắt tâm (Center clipping) dùng để tăng hiệu suất trích pitch Đó kỹ thuật gán mẫu có cường độ thấp giảm mẫu có cường độ (biên độ) cao Tuy nhiên cắt gây khó khăn cho việc dị tìm pitch tiếng nói lớn (ồn) Người ta phải dùng ngưỡng cắt động, thường 30% cường độ tiếng nói lớn nhất, để thích nghi với cường độ tiếng nói khác Phương pháp Infinite peak clipping dùng để ước lượng pitch cho kết tốt thông qua tự tương quan giảm đáng kể tính tốn tất phép nhân gồm giá trị Dùng cắt xen kẽ, tín hiệu tăng đến cường độ cao (trong giữ dấu đại số mẫu tiếng nói) để đánh dấu cực đại dạng sóng Có thể ước lượng F0 trực tiếp cách định vị cực đại phổ Tuy nhiên cách làm thiếu xác thực tế rơi vào trường hợp tín hiệu tiếng nói lọc hay tần số có lượng thấp F1 Cấu trúc điều hoà (phổ đạt cực đại nhiều điểm tần số bản) dấu hiệu xác để tách F0; tần số ước số chung lớn dao động cho ta ước lượng F0 tốt Một cách tiếp cận khác tính tách biệt tần số dao động phổ; lực chọn nén phổ số nguyên (ví dụ: nén tần số tỷ lệ 2,3,4…): kết tần số thể cực đại tốt tăng cường hàm điều hoà 104 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com Kỹ thuật tìm độ tương tự lớn có cách ước lượng pitch khác, đặc biệt chạy tốt tín hiệu tiếng nói ồn (lớn) Một cách xác định chu kỳ tín hiệu mơi trường ồn thêm khoảng lặng tín hiệu tín hiệu gốc Khi khoảng lặng chu kỳ pitch, tín hiệu tiếng nói khuếch đại, tiếng ồn (khác pha với khoảng lặng) có xu hướng bị khử Các dị tìm pitch phổ cho ta ước lượng gần cách tiếp cận theo miền thời gian địi hỏi tính tốn chuyển phổ nhiều Phép biến đổi trọng vào thơng tin tính tuần hồn tiếng nói phân tích theo miền thời gian không làm Nhắc lại, xác định tiếng nói phần việc trích pitch, lỗi gặp phải hệ thống phân làm loại: lỗi F0 lớn (ví dụ: gấp đơi), lỗi F0 nhỏ, lỗi nhầm khung tiếng nói hữu thành vơ thanh, ngược lại Khơng có thuật tốn đồng thời xử lý tốt loại lỗi Ta ước lượng dị tìm cách dùng vào hệ thống mã hố tiếng nói biểu diễn kích thích F0 kết luận kích thích có tiếng nói hay khơng Khơng có lỗi tương ứng với khía cạnh chất lượng mong đợi tiếng nói mã hoá, lỗi nhầm lẫn từ hữu sang vơ gây cho ta nhiều khó chịu dẫn đến tiếng chói tai, âm ồn Trong tính tốn pitch khơng tương xứng với mong đợi lắm, việc sử dụng thuật tốn trích pitch khác cho kết không chênh lệch nhiều Thuật tốn AMDF có lẽ chọn lựa tốt, kiểm tra kết mong đợi cao, cho mã hố tiếng nói định dựa vào kết luận tín hiệu tiếng nói hay khơng cho việc tìm mối liên quan kết mong đợi với lỗi F0 2.1 Rút gọn thơng tin Trong ứng dụng mã hố nhận dạng, cơng việc lớn việc phân tích tiếng nói biểu diễn thơng tin tín hiệu cách có hiệu mà chứa đủ tham số để tái tạo lại nhận dạng tiếng nói Trong mã hố, ta nhằm vào mục đích làm giảm nhớ hay tốc độ cần phải truyền tải tiếng nói mà giữ chất lượng tốt tiếng nói tái tạo theo mặt sau: dễ hiểu, tự nhiên, nhận biết người nói Vì vậy, cách biểu diễn mang tính kinh tế khía cạnh định tín hiệu tiếng nói quan trọng Trong hệ thống nhận dạng, vấn đề lưu trữ ý đến bên cạnh quan tâm chủ yếu độ nhận dạng xác Tuy nhiên, nhận dạng chạy nhanh mẫu liệu lưu trữ chiếm nhớ Hơn nữa, mẫu tốt, nhỏ thường cho kết tốt hơn, ví dụ: mẫu chứa dạng sóng tiếng nói lấy mẫu cần nhiều nhớ lưu trữ cho đặc tính chất lượng mẫu dạng phổ hay dự 105 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com báo tuyến tính Trong hai trường hợp, việc cắt bỏ thông tin dư chứa tín hiệu tiếng nói quan trọng Dĩ nhiên thơng tin cần thiết hay khơng cịn tuỳ thuộc vào ứng dụng: chẳng hạn khía cạnh phụ thuộc người nói khơng thể thiếu ứng dụng nhận dạng người nói, nhiên khía cạnh lại thơng tin thừa ứng dụng nhận dạng thông điệp theo mẫu hệ thống nhận dạng tiếng nói tự động Không phải lúc xác định rõ ràng khía cạnh tiếng nói cắt bỏ Tiếng nói chấp nhận được tổng hợp với tốc độ 600 bit/giây, biểu diễn tiếng nói dạng số đơn giản cần nửa số Tuy nhiên, ta giảm tỷ lệ bit, xuất sai lệch nhỏ tiếng nói tái tạo Đặc biệt khía cạnh tín hiệu liên quan đến nhận dạng người nói dường khơng cắt bỏ Các mơ hình tổng hợp tiếng nói trọng đến khía cạnh trì tính dễ hiểu, ý đến giảm tính tự nhiên 2.2 Nắm bắt thuận lợi chuyển động chậm máy phát âm Bởi xem tiếng nói chuỗi âm vị liên kết theo ngữ điệu, hầu hết hệ thống phân tích tiếng nói cố gắng rút trích tham số liên quan đến phổ mẫu thời gian thể đặc trưng riêng âm vị Tiếng nói thường chuyển thành tập tín hiệu tham số có liên hệ chặt chẽ với chuyển động phận máy phát âm Các tín hiệu gắn với phận riêng biệt (ví dụ: tham số F0 gắn liền với rung động dây thanh) tạo thành kết hợp số phận; ví dụ: kết xuất từ lọc thông hay mẫu phổ phép biến đổi DFT liên quan đến vị trí phc măng cường độ, khía cạnh lại tồn bộ máy phát âm định Bộ máy phát âm chuyển động chậm so với tốc độ lấy mẫu bình thường; ví dụ: âm vị (phonetic) trung bình thường có thời lượng dài 50 ms ( số ngắn hơn, chẳng hạn âm nổ), tốc độ lấy mẫu tiếng nói thơng thường khoảng 0.1 ms Kết tham số tiếng nói tương ứng có tốc độ thay đổi chậm ta lấy thập phân.Ví dụ, phép biến đổi Fourier hữu hạn (đã kiểm tra với tần số cố định) tín hiệu thời gian băng thông băng thông cửa sổ dùng phân tích phổ Người ta lấy thập phân với tỷ lệ gấp đôi băng thông cửa sổ mà khơng mát thơng tin; ví dụ: cách biểu diễn phổ băng tần rộng, người ta dùng cửa sổ 300 Hz để biểu 106 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com diễn với tốc độ lấy mẫu 600 mẫu/giây Bởi thực tế băng tần cửa sổ khơng hồn tồn bị giới hạn, việc lấy thập phân khơng làm sai lệch thông tin nhiều Xét khung phân tích tốc độ cập nhật tiêu biểu khoảng 10 ms, có phần nhỏ có thay đổi đột ngột Vì vậy, việc lấy mẫu tham số phổ tốc độ 600 mẫu/giây không hiệu sử dụng tốc độ cao khoảng thời gian ngắn Trên thực tế, thuật toán mã hoá nhận dạng lấy mẫu với tốc độ khoảng 25-200 mẫu/giây, tuỳ theo ứng dụng Điều làm giảm bớt độ xác lúc thay đổi phổ diễn nhanh, nhiên theo lý thyết hiệu khơng giảm nhiều (ví dụ: khơng cần thiết phải làm trơn thay đổi dốc tiếng nói tái tạo), lại thu thuận lợi lớn việc giảm nhớ lưu trữ tham số 107 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com ... đặc điểm ngữ âm tiếng Việt, làm sở cho việc xây dựng hệ nhận dạng tiếng Việt theo mô tả luận văn Chương 5: Xây dựng mơ hình nhận dạng điệu tiếng Việt Nhận dạng điệu bước ứng dụng nghiên cứu nói. .. thiết kế luận văn hệ nhận dạng tiếng Việt hồn chỉnh Ứng dụng mơ đun nhận dạng điệu vào hệ nhận dạng tiếng Việt hoàn chỉnh Chương 7: Hiện thực hố mơ hình nhận dạng tiếng Việt Chương cuối cài đặt... tích tiếng nói: Trình bày số kiến thức xử lý tín hiệu số số phương pháp tiếp cận tín hiệu tiếng nói Chương 3: Nhận dạng tiếng nói Chương mơ tả hệ nhận dạng tiếng nói tổng quát, cụ thể vào hệ nhận