Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 76 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
76
Dung lượng
3,08 MB
Nội dung
ĐẠI HỌC QUỐC GIA TP HCM TRƯỜNG ĐẠI HỌC BÁCH KHOA HUỲNH NGỌC THÁI DUY NGHIÊN CỨU CÁC MƠ HÌNH XẤP SỈ VÀ NỘI SUY ĐỂ XÂY DỰNG CÁC THUẬT TOÁN LỌC VÀ NÉN ÂM THANH Chuyên ngành: TOÁN ỨNG DỤNG Mã số: 60 46 36 LUẬN VĂN THẠC SĨ TP HỒ CHÍ MINH, tháng 06 năm 2013 i ĐẠI HỌC QUỐC GIA TP HCM TRƯỜNG ĐẠI HỌC BÁCH KHOA HUỲNH NGỌC THÁI DUY NGHIÊN CỨU CÁC MƠ HÌNH XẤP SỈ VÀ NỘI SUY ĐỂ XÂY DỰNG CÁC THUẬT TOÁN LỌC VÀ NÉN ÂM THANH Chuyên ngành: TOÁN ỨNG DỤNG Mã số: 60 46 36 LUẬN VĂN THẠC SĨ TP HỒ CHÍ MINH, tháng 06 năm 2013 ii Cơng trình hồn thành tại: Trường Đại học Bách Khoa – ĐHQG-HCM Cán hướng dẫn khoa học : TS Vũ Đức Phú Cán chấm nhận xét : Cán chấm nhận xét : Luận văn thạc sĩ bảo vệ Trường Đại học Bách Khoa, ĐHQG Tp HCM ngày tháng năm 2013 Thành phần Hội đồng đánh giá luận văn thạc sĩ gồm: Xác nhận Chủ tịch Hội đồng đánh giá LV Trưởng Khoa quản lý chuyên ngành sau luận văn sửa chữa (nếu có) CHỦ TỊCH HỘI ĐỒNG TRƯỞNG KHOA KHOA HỌC ỨNG DỤNG iii ĐẠI HỌC QUỐC GIA TP.HCM CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM TRƯỜNG ĐẠI HỌC BÁCH KHOA Độc lập - Tự - Hạnh phúc Tp HCM, ngày 21 Tháng 06 Năm 2013 NHIỆM VỤ LUẬN VĂN THẠC SĨ Họ tên học viên : Huỳnh Ngọc Thái Duy Phái : Nam Ngày sinh 11-12-1981 Nơi sinh : Cà Mau Toán ứng dụng MSHV : 10240509 : Chuyên ngành : I – TÊN ĐỀ TÀI : NGHIÊN CỨU CÁC MƠ HÌNH XẤP SỈ VÀ NỘI SUY ĐỂ XÂY DỰNG CÁC THUẬT TOÁN LỌC VÀ NÉN ÂM THANH II – NHIỆM VỤ VÀ NỘI DUNG : • Giới thiệu tín hiệu rời rạc hệ thống rời rạc • Các phép biến đổi quan trọng • Giải thuật nén LPC – Linear prediction coding • Giải thuật nén CELP- Code excited linear prediction III – NGÀY GIAO NHIỆM VỤ : 21/12/2012 IV – NGÀY HOÀN THÀNH NHIỆM VỤ : 21/06/2013 V – CÁN BỘ HƯỚNG DẪN : TS Vũ Đức Phú CÁN BỘ HƯỚNG DẪN CN BỘ MÔN QL CHUYÊN NGÀNH TS Vũ Đức Phú PGS.TS Nguyễn Đình Huy TRƯỞNG KHOA KHOA HỌC ỨNG DỤNG iv LỜI CẢM ƠN Lời đầu tiên, tác giả xin cảm ơn người thân yêu gia đình động viên, hỗ trợ chỗ dựa vững suốt năm qua Tác giả xin bày tỏ lòng biết ơn sâu sắc đến TS Vũ Đức Phú Người dìu dắt tác giả vào đường khoa học ứng dụng Thầy tận tâm hướng dẫn, đưa gợi ý sâu sắc, lời khuyên nhủ sáng suốt tạo điều kiện cho tác giả học tập, nghiên cứu thực luận văn Bên cạnh đó, xin bày tỏ lịng biết ơn sâu sắc đến Thầy Cơ Bộ mơn Tốn Ứng dụng giảng nghiêm túc chất lượng, giây phút trao đổi thú vị bổ ích, lời khuyên nhủ sáng suốt chân tình suốt khoá học Cuối cùng, tác giả xin cảm ơn giúp đỡ quý báu kịp thời bạn học viên lớp Cao học Tốn Ứng dụng khóa 2011 Trường Đại học Bách Khoa TP.HCM Xin chân thành cảm ơn Huỳnh Ngọc Thái Duy v TÓM TẮT Luận văn bao gồm bốn chương: Chương trình bày vấn đề biểu diễn, phân tích, nhận dạng, thiết kế thực hệ thống rời rạc Chương trình bày lý thuyết về: Biến đổi Z, biến đổi Z ngược, biến đổi Fourier liên tục, biến đổi Fourier rời rạc, biến đổi Fourier nhanh, tính chất mối liên hệ phép biến đổi Chương trình bày cấu tạo nguyên tắc hoạt động quan phát âm người Từ xây dựng cở sở lý thuyết giải thuật cho thuật tốn nén tiếng nói LPC-Linear prediction coding Chương bốn trình bày cở sở lý thuyết giải thuật cho thuật tốn nén tiếng nói CELP-Code excited linear prediction ABSTRACT The thesis consist four chapters Chapter is a general introduction of discrete system and some basic manipulations on discrete system such as: express, analyse, recognise and design discrete systems Chapter is a review of important transforms such as: Z tramsform, inverse Z transform, Fourier transform, inverse Fourier transform, fast Fourier transform as well as the properties, relationship between them Chapter present the structure of the human speech generation system and its approximation by a physical model consisting of tube sections Then by a mathematics model consisting digital filters From those, showing the mathematics theory to construct Linear prediction coding algorithm Chapter provided the mathematics theory and also algorithm of Code excited linear prediction method, which achieved a good compression rate but still keep the quality of sound very close to the original vi Mục lục Chương Giới Thiệu Về Tín Hiệu Rời Rạc Và Hệ Thống Rời Rạc 1.1.Giới thiệu 1.2.Tín hiệu rời rạc 1.2.1 Định nghĩa tín hiệu 1.2.2 Phân loại tín hiệu 1.2.3 Định lý lấy mẫu Nyquist–Shannon 1.2.4 Cách biểu diễn tín hiệu rời rạc 1.2.5 Các tín hiệu rời rạc 1.2.6 Các phép toán dãy 1.3.Hệ thống rời rạc 1.3.1 Khái niệm 1.3.2 Phân loại hệ thống rời rạc 10 1.4.Tổng chập (Convolution) 12 1.4.1 Định nghĩa 12 1.4.2 Các tính chất tổng chập 13 1.5.Tương quan tính hiệu rời rạc 14 1.5.1 Các định nghĩa 14 1.5.2 Một số tính chất tương quan chéo tự tương quan 15 Chương Các Phép Biến Đổi Quan Trọng 16 2.1.Giới thiệu 16 2.2.Biến đổi Z (Z transform) 16 2.2.1 Định nghĩa 16 2.2.2 Miền hội tụ (ROC: Region of Convergence) 17 2.2.3 Cực zeros 19 2.2.4 Biến đổi Z ngược (The inverse Z -transform) 19 vii 2.2.5 Các tính chất biến đổi Z 20 2.2.6 Các cặp biến đổi Z 21 2.2.7 Hàm truyền đạt hệ thống LTI 22 2.3.Biến đổi Fourier (Fourier transform) 23 2.3.1 Chuổi Fourier tín hiệu liên tục tuần hoàn theo thời gian 23 2.3.2 Biến đổi Fourier 24 2.3.3 Biến đổi Fourier ngược tín hiệu liên tục 25 2.4.Biến đổi Fourier rời rạc-DFT 26 2.4.1 Biến đổi Fourier rời rạc-DFT 26 2.4.2 Biến đổi Fourier rời rạc ngược 29 2.5.Biến đổi Fourier rời rạc nhanh 31 Chương Mơ Hình Tốn Học Của Hệ Thống Phát Âm Của Người Phương pháp LPC (Linear Prediction Coding) 34 3.1.Giới thiệu 34 3.2.Bộ máy phát âm chế phát âm 35 3.2.1 Bộ máy phát âm : 35 3.2.2 Cơ chế phát âm 37 3.3.Mô hình tốn học hệ thống phát âm người 39 3.4.Phương pháp LPC - Linear prediction coding 44 3.4.1 Cách xác định hệ số tiên đoán 45 3.4.2 Cách tìm chu kỳ khởi tạo dãy xung đơn vị P hệ số khuếch đại G 48 3.4.3 Thuật toán LPC 50 Chương Phương pháp CELP (Code excited linear prediction) 54 4.1.Giới thiệu 54 4.2.Phương pháp CELP 54 4.2.1 Bộ lọc nhấn cảm nhận 55 4.2.2 Bộ lọc dự đoán thời gian dài - Long term prediction filter 56 4.2.3 Codebook 58 viii 4.2.4 Cách tính thông số cho subframe 4.3.Thuật toán nén giải nén theo phương pháp CELP 60 63 4.3.1 Nén 63 4.3.2 Giải nén 64 LỜI MỞ ĐẦU Với phát triển máy tính internet, nhu cầu chia thơng tin ngày địi hỏi cao Với dạng liệu có dung lượng lớn, ví dụ liệu hình ảnh hay album nhạc, việc gửi qua internet việc làm nhiều thời gian Do đó, nhóm nghiên cứu, tổ chức, nhiều công ty khác cố gắng tìm định dạng âm sử dụng thuật toán riêng để nhằm giảm bớt dung lượng liệu cần để diễn tả âm gốc lúc cố gắng giữ cho âm gần với âm gốc Nén âm giúp cho cơng ty điện thoại thực nhiều gọi hệ thống đường truyền Nén âm cần thiết công nghệ phát triển điện thoại di động giúp người dùng sử dụng hiệu gói dung lượng cấp Sử dụng dung lượng cho việc truyền tải âm đồng nghĩa với việc có nhiều dung lượng có dich vụ khác ví dụ như: hình ảnh video Có nhiều định dạng khác đời như: wav, mp3, wma, aac, ogg, mpc, atrac, Chúng hoạt động gần giống định dạng có thuật tốn khác để xác định xem giữ lại mẫu âm nào, bỏ mẫu âm nào, điều chỉnh mẫu âm Bên cạnh thuật toán nén âm nói chung trên, đặc điểm ngơn ngữ quốc gia yếu tố quan trọng hiệu thuật toán Hiện tại, đề tài nén âm dành riêng cho Tiếng việt cịn bỏ ngỏ Do đó, việc nghiên cứu mơ hình xấp xỉ nội suy để xây dựng thuật toán lọc nén âm đặc biệt âm tiếng Việt hướng nghiên cứu quan có ứng dụng thực tiễn cao Do thời gian thực đề tài khơng nhiều, kiến thức cịn hạn chế nên khơng tránh khỏi hạn chế sai sót Tác giả mong nhận góp ý 53 Bảng 3.1: Kết nén LPC cho số đoạn âm Dạng Dạng Nén Tỉ lệ nén W WAV(kb) MP3(kb) LPC(kb) WAV:LPC 705 352 31 22,74:1 1115 557 49 22,75:1 365 178 16 22,81:1 392 147 18 21,78:1 1040 520 46 22,61:1 Mẫu Từ bảng kết cho thấy việc sử dụng thuật toán LPC đề tài đạt tỉ lệ nén cao dao động khoảng từ 21, 78 : đến 22, 81 : Mặc dù có tỉ lệ nén cao, thuật tốn LPC vẩn có vài nhược điểm cần phải khắc phục • Trong số trường hợp, frame âm phân loại thành hữu vơ • Việc sử dụng hoàn toàn nhiễu ngẫu nhiên dãy xung đơn vị có chu kỳ tạo làm nguồn âm khơng phù hợp với thực tế • Chất lượng âm tổng hợp không tốt Trên tất nhược điểm trên, thuật tốn LPC có ý nghĩa lớn xử lý âm Vì xây dựng tiếng nói người Trong phần đề tài tìm hiểu thuật toán khác khắc phục nhược điểm cho tỉ lệ nén cao 54 Chương Phương pháp CELP (Code excited linear prediction) 4.1 Giới thiệu Xuất phát từ nhược điểm phương pháp LPC phân tích chương 3, ta thấy việc sử dụng nhiễu Gaussian hay dãy xung đơn vị làm nguồn âm không phù hợp với thức tế Phương pháp CELP giới thiệu dãy đoạn nhiễu Gaussian gọi codebook Đây nơi chứa vectơ kích thích vectơ có độ dài cố định Các vectơ tạo thành từ dãy nhiễu Gaussian Tín hiệu kích thích (nguồn âm) cho đoạn tiếng nói tìm kiếm codebook Do đó, vectơ kích thích codebook có số phần tử với số mẫu đoạn tiếng nói Vấn đề đặt tìm vectơ thích hợp codebook để mơ nguồn âm 4.2 Phương pháp CELP Ý tưởng phương pháp thể sơ đồ hình 4.1 Hình 4.1: Phương pháp CELP 55 Đầu tiên nguồn âm đươc khổi tạo qua lọc LPC, tổng hợp âm sˆ(n) Sau lấy âm gốc ban đầu trừ âm vừa tổng hợp ta có dãy sai số Cho dãy sai số qua lọc cảm nhận ta có dãy aw (n) Cực tiểu hóa dãy aw (n) ta tìm nguồn âm thích hợp cho đoạn âm ban đầu 4.2.1 Bộ lọc nhấn cảm nhận Ngoài việc khai thác tính chất tiếng nói để nén âm thanh, người ta khai thác cảm nhận âm tai người Tai người không cảm nhận âm bị che âm khác có lượng lớn mức định Hình 4.2: Biểu diễn hiệu ứng lọc nhấn cảm nhận Sự tác động lọc nhấn cảm nhận biểu diễn hình 4.2 Ta thấy phổ nhiễu có vùng nằm phía đáp ứng tần số lọc LPC tần số nằm vùng bị nhiễu che Bộ lọc nhấn cảm nhận W(z) nâng biên độ nhiễu vùng tần số formant (vùng đỉnh đáp ứng tần số lọc LPC) nén biên độ nhiễu vùng trũng 56 đáp ứng tần số Phổ nhiễu sau qua W(z) có hình dạng tương tự phổ lọc LPC nhiễu dễ dàng bị tần số formant che (năng lượng tần số formant che lượng nhiễu) Như vậy, W(z) định dạng nhiễu hay sai số cho chúng bị che tần số formant lượng cao Hàm truyền đạt lọc nhấn cảm nhận là: q W (z) = A(z) = A( γzD ) 1− k=1 q 1− k=1 q ak z −k k=1 q = −k ak γz −k D ak z −k 1− 1− k=1 (4.1) k ak z −k γD Trong đó: • ak hệ số tiên đốn cho lọc LPC frame tương ứng • γD ∈ (0, 1) thực tế lựa chọn tốt cho γD nằm khoảng 0, → 0, 4.2.2 Bộ lọc dự đoán thời gian dài - Long term prediction filter Như đề cập chương 3, dãy sai số dự đốn chứa thơng tin tần số khởi tạo xung, ý tưởng thiết kế lọc mà cho dãy sai số dự đoán qua lọc đỉnh xung bị lọc bỏ, dãy sai số dự đoán trở thành dãy nhiễu trắng Bộ lọc có ý nghĩa quan trọng phương pháp CELP đồng nguồn âm âm hữu âm vô thành nhiễu trắng Ý tưởng lọc diễn tả sơ đồ hình 4.3 57 Hình 4.3: Bộ lọc dự đoán dài LTP Hàm truyền đạt lọc: P (z) = − b0 z −α (4.2) Nguyên tắc hoạt động lọc làm trễ dãy sai số dự đoán α mẫu, sau nhân dãy với hệ số b0 trừ với dãy sai số ban đầu Nếu tìm α khớp với chu kỳ khởi tạo xung sau phép trừ đỉnh xung bị triệt tiêu (hình 4.4) Như vậy, tìm α đồng nghĩa với việc tìm chu kỳ khởi tạo xung Hình 4.4: Nguyên tắc hoạt động lọc dự đoán dài LTP Hệ số α tìm khoảng 20 → 147 tương ứng với ngưỡng tần số 58 giọng nói người (50 → 400Hz) Chúng ta tìm hiểu cách tìm α b0 phần đề tài Từ hình 4.3 ta có sơ đồ hình 4.5: Hình 4.5: Bộ lọc dự đốn dài ngược Như sơ đồ hình 4.1 trở thành sơ đồ hình 4.6 Hình 4.6: Phương pháp CELP với Bộ lọc LTP ngược 4.2.3 Codebook Từ sơ đồ 4.6 ta thấy nguồn âm nhiễu, từ có khái niệm codebook Đây nơi chứa vectơ kích thích vectơ có độ dài 59 cố định Các vectơ tạo thành từ dãy nhiễu Gaussian Tín hiệu kích thích (nguồn âm) cho đoạn tiếng nói tìm kiếm codebook cho lượng dãy sai số aw (n) nhỏ Hình 4.7: Sơ đồ CELP hồn chỉnh độ dài frame (hình 4.7) Bởi vì, thực nghiệm chưng minh rằng: dù hệ Một codebook thường chứa 1024 vectơ, vectơ có độ dài số tiên đoán ak ổn định 20ms thông số chu kỳ khởi tạo xung, hệ số khuếch đại ổn định khoảng 5ms Vì vậy, chia frame thành subframe, subframe khoảng 5ms cập nhật lại nguồn âm sau subframe Trong phương pháp ta dùng lọc LPC bậc 10 Đối với subframe cần cập nhật số vectơ dùng làm nguồn âm codebook, hệ số khuếch đại β, hai thông số b0 , α để xây dựng lọc dự đoán dài (hinh 4.8) P (z) 60 Hình 4.8: Các thơng số cần cho frame subframe 4.2.4 Cách tính thơng số cho subframe Theo sơ đồ 4.7 ta có: e(n) = s(n) − sˆ(n) =⇒aw (n) = e(n) ∗ w(n) = [s(n) − sˆ(n)] ∗ w(n) = s(n) ∗ w(n) − sˆ(n) ∗ w(n) Như thay vị trí đặt lọc nhấn cảm nhận tiến sơ đồ 4.7 thành sơ đồ 4.9: Hình 4.9: Phương pháp CELP sau di chuyển lọc nhấn cảm nhận Trong đó: 61 • 1 = P (z) − b0 z α • H(z) = = q ak z −k 1− A(z) k=1 q ak z −k 1− k=1 q • W (z) = 1− k=1 k ak z −k γD = A(z) A( γzD ) A(z) = nên ta thu gọn hai lọc H(z) z A(z) A( γD ) A( γzD ) W (z) thành lọc (hình 4.10) A( γzD ) Vì: H(z).W (z) = Hình 4.10: Phương pháp CELP sau thu gọn lọc Gọi: • h(n) đáp ứng xung lọc A(z/γD ) • w(n) đáp ứng xung lọc nhấn cảm nhận W (z) Ta có: • v(n) = βck (n) 62 • u(n) = v(n) + b0 u(n − α) = βck (n) + b0 u(n − α) • sˆ(n) = u(n) ∗ h(n) = βck (n) ∗ h(n) + b0 u(n − α) ∗ h(n) • sw (n) = s(n) ∗ w(n) • aw (n) = sw (n) − sˆ(n) = s(n) ∗ w(n) − βck (n) ∗ h(n) − b0 u(n − α) ∗ h(n) Đặt: + ζw0 (n) = s(n) ∗ w(n) + ζw1 (n, k) = ck (n) ∗ h(n) + ζw2 (n, α) = u(n − α) ∗ h(n) =⇒ aw (n) = ζw0 (n) − βζw1 (n, k) − b0 ζw2 (n, α) Để đơn giản trình cực tiểu lượng dãy aw (n) ta chia trình thành hai bước: Bước 1: Chúng ta tìm giá trị tối ưu b0 α để cực tiểu hàm: n [ζw0 (n) − b0 ζw2 (n, α)]2 ξ2 (b0 , α) = (4.3) i=1 Với α cho trước, giá trị tối ưu ˆb0 (α) b0 phải thỏa: δξ2 ˆ b0 (α) = δb0 n [ζw0 (n) − ˆb0 (α)ζw2 (n, α)]ζw2 (n, α) = i=1 n ζw0 (n)ζw2 (n, α) =⇒ˆb0 (α) = i=1 ζw2 (n, α) Thay giá trị ˆb0 (α) vừa tìm vào 4.3 ta có: n ζw0 (n)ζw2 (n, α) n ζw0 (n) − ξ2 (α) = i=1 n i=1 i=1 (4.4) (n, α) ζw2 63 Giá trị tối ưu α để cực tiểu ξ2 (α) tìm khoảng 20 → 147 Điều thực dễ dàng máy tính Bước 2: Sau tìm giá trị b0 α, đồng thời tìm giá trị hàm: ζw0 (n) = ζw0 (n) − b0 ζw2 (n, α) (4.5) Cơng việc bước tìm giá trị tối ưu k β để cực tiểu hàm: n [ζw0 (n) − βζw1 (n, k)]2 ξ1 (β, k) = (4.6) i=1 Điều thực tương tự bước Tuy nhiên, trường hợp giá trị k tìm 1024 số codebook 4.3 Thuật toán nén giải nén theo phương pháp CELP Trong phần trước chương tìm hiểu cách tìm hệ số cần thiết cho subframe Trong phần xây dựng thuật toán nén giải nén âm CELP Đầu vào thuật toán dãy tín hiệu âm thanh, đầu thuật tốn ma trân chứa thông số quan trọng hệ thống LPC thông số cần thiết cho subframe mà từ ma trận ta nội suy tín hiệu âm ban đầu 4.3.1 Nén Đầu tiên ta chia đoạn âm thanh nhiều đoạn ngắn (frame) frame khoảng 20ms, frame chia thành subframe (5ms) Sau dùng phương pháp trình phần để tính thông số ak cho frame k, β, b0 , α cho subframe (hinh 4.11) Giả sử ta có đoạn âm lấy mẫu với tần số lấy mẫu 16000 mẫu/giây Như đoạn 20ms chứa 320 mẫu Với phương pháp nén CELP ta chi cần lưu 26 thông số cho đoạn âm 20ms tỉ lệ nén :12.3:1 tỉ lệ tốt so với phương pháp nén âm 64 sử dụng như: MP3, WMA, AAC, M4A mà chất lượng âm tương đương Hình 4.11: Thuật tốn nén CELP 4.3.2 Giải nén Trong phần giải nén, hệ thống cập nhật thông số quan trọng như: tần số lấy mẫu, độ dài frame, sau liệu chia thành thông số, chứa thông số lọc LPC frame tương ứng thông số k, β, b0 , α subframe Hệ thống cập nhật thông số để khởi tạo nguồn âm Sau đó, cho nguồn âm qua lọc LPC để tổng hợp tính hiệu âm cho subframe tương ứng Nối frame lại với ta có đoạn âm ban đầu (hinh 4.12) 65 Hình 4.12: Thuật tốn giải nén CELP cho frame Kết quả: Bảng 4.1: Kết nén CELP cho số đoạn âm Dạng Dạng Nén Tỉ lệ nén W WAV(kb) MP3(kb) CELP(kb) WAV:LPC 705 352 55 12,81:1 1115 557 76 14,67:1 365 178 26 14,04:1 392 147 29 13,52:1 1040 520 67 15,52:1 Mẫu Để chứng minh khả nén thuật tốn CELP chúng tơi tiến hành nén đoạn âm có dung lượng giọng nói khác Kết liệt kê bảng 4.1 Từ bảng kết cho thấy việc sử dụng thuật toán CELP cho tỉ lệ nén thấp tỉ lệ nén thuật toán LPC mức cao so với định dạng âm thông dụng Đặc biệt thuật toán CELP cải tiến chất lượng âm lên rõ rệt 66 KẾT LUẬN Trong đề tài chúng tơi xây dựng thành cơng thuật tốn lọc nén âm từ mơ hình xấp sỉ nội suy với tỉ lệ nén cao nhiều so với định dạng nén dụng rộng rải như: MP3, WMA, AAC, M4A chất lượng âm tốt Với thuật toán LPC đề tài đạt tỉ lệ nén cao là: 22, 81 : mà giữ giọng, nội dung thông tin cần truyền tải Để chất lượng âm tốt so với thuật toán LPC mà tỉ lệ nén vẩn mức cao, đề tài phát triên thuật toán CELP đạt tỉ lệ nén cao là: 15, 52 : Các kết mà đề tài đạt có ý nghĩa khoa học, mà cịn có ý nghĩa thực tiển nhằm ứng dụng trong: Sách nói, ghi âm vấn phát biểu Phân tích LPC khơng có ứng dụng việc nén tiếng nói mà cịn ứng dụng thuật tốn nhân dạng âm Do dó, hướng phát triển đề tài dụng thông số tìm phân tích LPC để nhận dạng tiếng Việt hướng nghiên cứu có ý nghĩa lớn trong: Điều khiển thiết bị giọng nói, dịch thuật, chuyển giọng nói thành văn 67 Tài liệu tham khảo [1] Nguyễn Quốc Trung Xữ lý tín hiệu lọc số, Tập 1, Tập 2, Nhà xuất Khoa học Kỹ Thuật, Hà Nội, 2000 [2] Lavrence Rebiner - Biing Hwang Juang Fundamentals of speech Recognition Prentice-Hall International, 1992 [3] John H L Hansen John R Deller and John G Proakis Discrete-Time Process- ing of Speech Signals IEEE Press, 2000 [4] John G Proakis and Dimitris G Manolakis Digital Signal Processing Prentice-Hall, third edition, 1996 [5] Thomas F Quatieri Discrete-Time Speech Signal Processing PrenticeHall, third edition, 1996 [6] N JAYANT, Signal Compression: Coding of Speech, Audio, Text, Image and Video, World Scientific Publishing Co Pte Ltd – 1997 [7] M Arjona Ramírez and M Minami, Technology and Standards For Lowbit-rate Vocoding Methods, H Bidgoli, Ed., New York: Wiley, 2008, vol.2 [8] L Deng and D O’shaughnessy, Speech Processing - A dynamic and optimization-oriented approach, Mercel-Dekker, New York, 2003 [9] J Dang, M Akagi and K Honda, "Communication between Speech Production and Perception within the Brain -Observation and Simulation, J Computer Science and Technology, vol.21, 2006 ... sinh : Cà Mau Toán ứng dụng MSHV : 10240509 : Chuyên ngành : I – TÊN ĐỀ TÀI : NGHIÊN CỨU CÁC MƠ HÌNH XẤP SỈ VÀ NỘI SUY ĐỂ XÂY DỰNG CÁC THUẬT TOÁN LỌC VÀ NÉN ÂM THANH II – NHIỆM VỤ VÀ NỘI DUNG :... ĐẠI HỌC BÁCH KHOA HUỲNH NGỌC THÁI DUY NGHIÊN CỨU CÁC MƠ HÌNH XẤP SỈ VÀ NỘI SUY ĐỂ XÂY DỰNG CÁC THUẬT TOÁN LỌC VÀ NÉN ÂM THANH Chuyên ngành: TOÁN ỨNG DỤNG Mã số: 60 46 36 LUẬN VĂN THẠC SĨ... Hiện tại, đề tài nén âm dành riêng cho Tiếng việt bỏ ngỏ Do đó, việc nghiên cứu mơ hình xấp xỉ nội suy để xây dựng thuật toán lọc nén âm đặc biệt âm tiếng Việt hướng nghiên cứu quan có ứng dụng