Phương pháp nén tín hiệu audio dùng biến đổi wavelet

MỤC LỤC LỜI NÓI ĐẦU CHƯƠNG CÁC KIẾN THỨC CƠ BẢN VỀ ÂM THANH 1.1.2 Đơn vị vật lý âm 1.1.2.2.Đơn vị âm chủ quan .7 1.1.2.3 Quãng độ cao (quãng tần số) 1.1.3 Đặc tính sinh lý cảm thụ âm 1.1.3.1 Mức to, độ to, mức âm cảm giác 1.1.3.3 Thính giác định vị (hiệu ứng Stereo) 11 1.1.3.4 Nghe âm chênh lệch thời gian .11 1.2 Xử lý tín hiệu số sóng âm 12 1.2.1.Tín hiệu hệ thống rời rạc 12 1.2.1.1 Giới thiệu 12 1.2.1.2 Đáp ứng xung hệ tuyến tính bất biến 12 1.2.1.3 Tính chất tổng chập hệ TTBB .13 1.2.1.4 Hệ nhân (causal system) 14 1.2.1.5 Tính ổn định 14 1.2.1.6 Phương trình sai phân tuyến tính hệ số 15 1.2.1.7 Biểu diễn hệ rời rạc miền tần số 15 1.2.1.8 Định lý lấy mẫu Shannon 17 1.2.2 Phép biến đổi Fourier rời rạc 17 1.2.2.1 Chuỗi Fourier rời rạc tín hiệu rời rạc tuần hoàn 17 1.2.2.2 Biến đổi Fourier rời rạc tín hiệu có độ dài hữu hạn 18 1.2.2.3 Phép biến đổi nhanh fourier .19 CHƯƠNG 20 CHUẨN NÉN ÂM THANH MPEG 20 2.1 Giới thiệu chuẩn nén MPEG .20 2.1.1 MPEG gì? 20 2.1.2 So sánh chuẩn MPEG 20 2.1.3 Âm MPEG 21 2.1.4 Các khái niệm âm MPEG 22 2.1.4.1 Hiệu ứng che (masking) 22 2.1.4.2 Ngưỡng nghe mức nhạy cảm 22 2.1.4.3 Che tần số (Frequency Masking) 23 2.1.4.4 Che thời (che thời gian) 24 2.1.5 Hoạt động 25 2.2 Các khái niệm MPEG 26 2.2.1 Lược đồ mã hóa Perceptual Subband 27 2.2.2 Giải thích hiệu che (masking effect) 27 2.2.2.1 Nén âm MPEG .28 2.2.2.2 Hiệu che 28 2.2.2.3 Các lớp âm MPEG 29 CHƯƠNG 32 -1- PHÉP BIẾN ĐỔI WAVELET 32 3.1 Biến đổi Fourier 32 3.2 Biến đổi Fourier thời gian ngắn (STFT) 33 3.3 Biến đổi Wavelet 33 3.4 Các loại biến đổi Wavelet 34 3.4.1 Wavelet liên tục CWT 34 3.4.2 Biến đổi Wavelet rời rạc DWT 37 3.4.3 Biến đổi Wavelet gói 40 CHƯƠNG 43 PHƯƠNG PHÁP NÉN TÍN HIỆU ÂM THANH .43 DÙNG BIẾN ĐỔI WAVELET 43 4.1 Thực phân tích dùng lọc 43 4.1.1 Thuật toán biến đổi .43 4.1.2 Phân rã nhiều mức 44 4.2 Kỹ thuật nén tiếng nói wavelet 45 4.2.1 Giới thiệu .45 4.2.2 Chọn Wavelet .45 4.2.3 Phân tích wavelet 46 4.2.4 Lược bỏ hệ số phân rã tín hiệu 47 4.2.5 Hệ số mã hóa 49 4.2.6 Mô hình Psychoacoustic .50 4.2.7 Phân tích âm hữu vô .50 4.2.8 Thiết kế hệ thống 51 4.2.8.1 Tổng quan hệ thống 51 4.2.8.2 Tính toán mức ngưỡng 52 4.2.8.3 Mức phân rã tối ưu biến đổi wavelet .52 4.2.8.4 Hữu thanh, vô cấu trúc trộn tiếng 53 4.2.9 Các phép đo 55 4.2.10 Ảnh hưởng kích cỡ khung lên kết nén 56 4.3 Đánh giá kết thực nhiệm vụ tương lai 57 4.3.1 Đánh giá kết thực .57 4.3.2 Nhiệm vụ tương lai 58 4.3.2.1 Tăng chất lượng 58 4.3.2.2 Cải tiến tỷ lệ nén 58 CHƯƠNG 59 THỰC NGHIỆM .59 5.1 Xây dựng cấu trúc wavelet 59 5.2 Kết hợp nén wavelet mô hình Psychoacoustic 60 5.3 Kết đạt .60 KẾT LUẬN .63 PHỤ LỤC 64 TÀI LIỆU THAM KHẢO 66 NHẬN XÉT CỦA GIÁO VIÊN HƯỚNG DẪN 67 -2- LỜI NÓI ĐẦU Nén tiếng nói kỹ thuật biến đổi giọng nói người thành dạng mã hoá sau tín hiệu có khả giải mã để trở đưa tín hiệu cuối gần với tín hiệu gốc Luận văn đưa công nghệ để nén tín hiệu âm sử dụng kỹ thuật DWT (biến đổi Wavelet rời rạc) Phân tích Wavelet biến đổi tín hiệu gốc thành hệ đo sau phải có khả dịch trở lại thành tín hiệu gốc Nói biến đổi Wavelet tín hiệu tín hiệu gốc phân tích hệ số Wavelet thang đo khác vị trí khác Các hệ số biểu diễn tín hiệu miền Wavelet việc biến đổi liệu thực phù hợp với hệ số Wavelet Trong luận văn mã hoá tiếng nói tảng Wavelet thực phần mềm “MATLAB 7.0.1 Wavelet Tool box” Vấn đề chủ yếu liên quan đến việc thiết kế mã hoá âm sử dụng Wavelet phải sử dụng Wavelet tối ưu cho tín hiệu, đánh giá mức phân rã tín hiệu DWT, đánh giá mức ngưỡng lược bỏ hệ số đánh giá hiệu nén Một ưu điểm mã hoá âm sử dụng Wavelet đa dạng hoá tỷ lệ nén, với kỹ thuật khác tỷ lệ nén cố định Ứng dụng cao kỹ thuật Wavelet khôi phục chất lượng tín hiệu tăng tỷ lệ nén tín hiệu Có thể nói lĩnh vực nghiên cứu mẻ có nhiều tiềm hấp dẫn, đặc biệt Việt Nam Đó lý em chọn đề tài: “Phương pháp nén tín hiệu Audio dùng biến đổi Wavelet” Luận văn chia làm chương: - Chương 1: Các kiến thức âm - Chương 2: Giới thiệu chuẩn nén MPEG -3- - Chương 3: Tìm hiểu phép biến đổi Wavelet - Chương 4: Phương pháp nén tín hiệu âm dùng biến đổi Wavelet - Chương 5: Chương trình kiểm nghiệm Với quỹ thời gian có hạn nên luận văn chưa thể giải vấn đề cách hoàn chỉnh, đặc biệt phần ứng dụng Rất mong thầy cô bạn độc giả góp ý phê bình để kết nghiên cứu ngày hoàn thiện -4- CHƯƠNG CÁC KIẾN THỨC CƠ BẢN VỀ ÂM THANH 1.1 Các khái niệm sóng âm 1.1.1 Dao động âm truyền dao động Sóng âm loại sóng có biên độ dao động nhỏ mà thính giác nhận biết Thí dụ dao động phát từ dây đàn, mặt trống… rung động Sóng âm loại sóng nên khái niệm tượng dao động sóng áp dụng cho sóng âm Trong không khí chất khí khác, dao động truyền dạng sóng dọc, đến tai người dao động có tần số từ 16 đến 20000 Hz gây cảm giác đặc biệt âm Các dao động đàn hồi có tần số f>20.000 Hz sóng siêu âm.Các dao động đàn hồi có tần số f f1) f2 / f1 = x Khi x=1 tức f2 / f1 = gọi quãng tần số (hay ốc-ta) Khi x=1/2 tức f2 / f1 = 1.41 gọi nửa ốc-ta Khi x=1/3 tức f2 / f1 = 1.26 gọi 1/3 ốc-ta Mức áp suất âm ốc-ta mức áp suất âm 1/2 ốc-ta cộng thêm 3db Mức áp suất âm ốc-ta mức áp suất âm 1/3 ốc-ta cộng thêm 5db Vì quãng tần số âm quy định độ cao âm nên gọi quãng độ cao Theo tập quán âm nhạc quãng độ cao gọi quãng (bát độ) Chẳng hạn âm LA, tần số f=440 Hz tăng bát độ tăng gấp đôi tần số, tức 880 Hz -8- Trong thực tế thường gặp âm phức tạp bao gồm nhiều tần số Tập hợp tất tần số cấu tạo âm gọi “tần phổ” âm đó, tần phổ gián đoạn hay liên tục Một âm có tần phổ liên tục đặc trưng “ Mức tần phổ B ” với định nghĩa: - Mức tần phổ mức áp suất âm chiều rộng dãi tần số - Một âm có mức tần phổ B không đổi với tần số gọi tiếng ồn trắng - Một âm có tần phổ gián đoạn đặc trưng “mức dãi tần số” với định nghĩa: mức dãi tần số mức áp suất âm chiều rộng dãi tần số lớn 1Hz 1.1.3 Đặc tính sinh lý cảm thụ âm 1.1.3.1 Mức to, độ to, mức âm cảm giác Mức áp suất âm, mức cường độ âm vừa mang tính chất chủ quan vừa mang tính chất khách quan đại lượng xác định từ đại lượng túy vật lý Vấn đề có ý nghĩa to lớn thực tế cần biết sức mạnh âm đo tai người Mức to, độ to âm sức mạnh cảm giác âm gây nên tai người, phụ thuộc vào áp suất âm mà phụ thuộc vào tần số âm Thí dụ âm có tần số 100 Hz 1000 Hz áp suất âm 0,02 bar nghe to nhỏ khác nhau, âm 1000 Hz nghe to âm 100 Hz Muốn nghe to âm 1000 Hz âm 100 Hz phải có áp suất 0,25 bar Như tai người không nhạy âm 100 Hz âm 1000 Hz Tần số thấp tai người nhạy 1.1.3.1.1 Mức to Để biểu thị mức to cảm giác chủ quan, ta dùng đại lượng “mức to”, đơn vị “Fôn” với định nghĩa sau : Fôn mức to âm chuẩn, giá trị mức áp suất âm âm chuẩn tức : L = 20lg P/P o (Fôn) -9- Vậy mức to âm đo Fôn, giá trị mức áp suất âm âm chuẩn đo db có mức to với âm Thí dụ: âm có tần số 500 Hz mức áp suất âm 25 db âm có tần số 50 Hz mức áp suất âm 64 db có mức to 20 Fôn, mức to âm 1000 Hz mức áp suất 20 db Muốn biết mức to âm phải so sánh với âm chuẩn Đối với âm chuẩn, mức to ngưỡng nghe Fôn, ngưỡng chói tai 120 Fôn Cùng giá trị áp suất, âm tần số cao, mức to lớn 1.1.3.1.2 Độ to Khi so sánh âm to âm lần, dùng khái niệm “độ to” đơn vị “Sôn” với định nghĩa sau: Số lượng Sôn biểu thị số lần mạnh âm so với âm chuẩn mà tai người phân biệt Độ to thuộc tính thính giác, cho phép phán đoán tính chất mạnh yếu âm Căn vào độ to mà xếp âm từ nhỏ tới to Mức to tăng 10 Fôn độ to tăng gấp đôi ngược lại 1.1.3.2 Âm điệu âm sắc Âm điệu âm cao hay thấp, trầm hay bổng Âm điệu chủ yếu phụ thuộc vào tần số âm, tần số cao, âm nghe cao, tần số thấp âm nghe trầm Âm sắc sắc thái âm du dương hay thô kệch, hay rè, hay đục Âm sắc phụ thuộc vào cấu tạo sóng âm điều hòa, biểu thị số lượng loại tần số, cường độ phân bố chúng quanh âm Âm sắc có quan hệ mật thiết với cường độ, âm điệu thời gian âm vang, trưởng thành tắt dần trường âm Khi hai ca sĩ hát câu độ cao, ta phân biệt giọng hát người Khi đàn ghi-ta, sáo, kèn tấu lên đoạn nhạc độ cao, ta phân biệt tiếng nhạc cụ Mỗi người, - 10 - H0 H1 2 2 Tín hiệu gốc Mức Mức Mức Mức Mức H0 H1 2 2 H0 H1 2 2 H0 2 H1 2 H0 2 H1 2 Hình 4.8: Sơ đồ phân rã mức 4.2.8.4 Hữu thanh, vô cấu trúc trộn tiếng Từ phần tín hiệu trên, chúng phân tích thành 03 đoạn khác nhận dạng dự mức lượng phân tích wavelet hệ số N/2 Hình biểu diễn cấu trúc tiếng nói phân tích wavelet mức Cấu trúc vectơ biến đổi wavelet [cA5, cD5, cD4, cD3, cD2, cD1], chiều dài hệ số riêng là: (50, 50, 81, 144, 270, 521) Tổng chiều dài hệ số 1116 lớn kích thước khung có 1024 - 53 - Hình 4.9: Các đoạn âm hữu biến đổi DWT thang Hình 4.10: Các đoạn âm vô biến đổi DWT thang - 54 - Hình 4.11: Trộn đoạn tiếng 4.2.9 Các phép đo Số lượng thông số sử dụng để đánh giá hoạt động mã hoá wavelet hai giai đoạn phân tích tái khôi phục lại tín hiệu sau nén, so sánh với thông số đây:  Tỷ lệ tín hiệu nhiễu (SNR)  Tỷ lệ mức tín hiệu cao nhiễu (PSNR)  Lỗi tín hiệu (NRMSE)  Năng lượng tín hiệu thu  Tỷ lệ nén 1-Tỷ lệ tín hiệu nhiễu:   SNR = 10log10   x2     e   x2 : Là bình phương trung bình tín hiệu tiếng nói  e2 : Là bình phương trung bình sai lệch tín hiệu gốc tín hiệu khôi phục 2-Tỷ lệ mức tín hiệu cao nhiễu: PSNR = 10log10 NX [ x  r] - 55 - N : Là chiều dài tín hiệu sau khôi phục X : Là giá trị lớn tín hiệu x [x – r]2 : Là sai khác lượng tín hiệu gốc tín hiệu sau khôi phục lại 3-Lỗi tín hiệu: [ x( n)  r ( n)] NRMSE = [ x( n )   x ( n)] x(n) : Là tín hiệu tiếng nói r(n) : Là tín hiệu sau khôi phục lại x(n) : Là giá trị trung bình tín hiệu tiếng nói 4-Năng lượng tín hiệu thu được: RSE = 100 * x(n) r ( n) 2 x(n)  : Là tín hiệu gốc tiêu chuẩn r(n)  : Là tín hiệu khôi phục tiêu chuẩn 5-Tỷ lệ nén: C= L[x(n)] L[ x(n)] L[cWC ] : Chiều dài dãy x(n) L[cWC] : Chiều dài vectơ biến đổi wavelet nén 4.2.10 Ảnh hưởng kích cỡ khung lên kết nén Để giải thích cho ảnh hưởng khung lên kết nén, lưu ý tín hiệu tiếng nói phân tích sử dụng wavelets Db10 mức phân rã thứ 5, bảng sau mô tả giá trị hệ số biến đổi với kích cỡ khung khác : - 56 - Một suy luận quan trọng từ bảng là, kích cỡ khung giảm hệ số wavelets tăng theo tỷ lệ Có nghĩa tỷ lệ hệ số wavelets kích cỡ khung tăng lên kích cỡ khung giảm Như tỷ lệ nén mã hoá tiếng nói thời gian thực sử dụng wavelets tín hiệu tiếng nói ghi lại từ trước hay không sử dụng khung sử dụng khung có kích cỡ lớn 4.3 Đánh giá kết thực nhiệm vụ tương lai 4.3.1 Đánh giá kết thực Nén tín hiệu âm dùng biến đổi wavelet phương pháp nén trình nghiên cứu chưa sử dụng rộng rãi phương pháp nén truyền thống khác Mặc dù phương pháp trình tìm hiểu nghiên cứu, luận văn trình bày phương pháp nén tín hiệu audio dùng biến đổi wavelet lưu trữ liệu truyền thông Đối với mô hình nén để lưu trữ có kết hợp nén dùng DWT mô hình Psychoacoustic Tuy nhiên, phân tích tiếng nói có hai kích thích chủ yếu âm hữu âm vô trình bày phân tích wavelet âm vô không hiệu ta nên kết hợp phương pháp nén với phương pháp mã hóa entropy (điển hình mã hoá Huffman) thu kết tối ưu - 57 - 4.3.2 Nhiệm vụ tương lai 4.3.2.1 Tăng chất lượng Hãy nghe câu để kiểm tra chất lượng dựa câu nói Nam giới ‘Cats and dogs each hate the other’ sử dụng wavelets khác biểu lộ âm ‘s’ từ ‘dogs’ méo nhẹ nghe không cẩn thận bị nhầm lẫn với từ đơn Âm ‘s’ âm vô Hình 4.10 biểu diễn khung âm vô trải toàn băng tần, nhiên khung không chịu nén đáng kể mức ngưỡng áp dụng Nếu giá trị thấp sử dụng cho ngưỡng tín hiệu tái lập xấu méo Như wavelets không ảnh hưởng đến mã hoá khung tiếng vô Cần kiểm tra khung tiếng nói vô mã hoá chúng trực tiếp cách sử dụng số cấu trúc mã hoá bit, chẳng hạn mã hoá entropy, liệu âm vô không bị không tăng tốc độ bit đáng kể 4.3.2.2 Cải tiến tỷ lệ nén Xa nữa, ta nên khai thác triệt để liệu thừa mã hoá Nên sử dụng lược đồ mã hoá bit để mô tả liệu Kỹ thuật mã hoá mã hoá Entropy, hai lược đồ mã hoá entropy phổ biến Prefix coding cấu trúc Huffman coding, hai dạng mã hoá đòi hỏi có sẵn kiến thức tự nhiên nguồn liệu, khả phân bổ nguồn liệu Tuy nhiên nhiều dạng tín hiệu trước, dạng liệu nên đặt cấu trúc trước từ hệ liệu - 58 - CHƯƠNG THỰC NGHIỆM Hệ thống thực nghiệm xây dựng theo mô hình Hệ thống xây dựng phần mềm MATLAB 7.01 Hình 5.1: Mô hình nén audio thực nghiệm 5.1 Xây dựng cấu trúc wavelet - Sử dụng Wavelets Daubechies – db4, qua trình thực nghiệm phân tích tín hiệu audio, người ta thấy sử dụng hàm wavelet phân tích mức lượng tối ưu Hình 5.2: Phân tích tín hiệu sử dụng db4, phân rã mức - Chọn mức phân rã tín hiệu mức để đạt chất lượng tối ưu Như tín hiệu s phân tích sau: s = a5 + d5 + d4 + d3 + d2 +d1 - 59 - 5.2 Kết hợp nén wavelet mô hình Psychoacoustic Mô hình Psychoacoustic xây dựng mô hình thực nghiệm Tín hiệu audio biến đổi sang miền tần số sử dụng biến đổi fft với khung liệu 2048 mẫu chia thành phần critial band, subband phát điểm âm masking masked dựa vào hàm mật độ phổ P P=10log10fft(frame,2048)2 Nếu k2000 (các điểm đầu điểm cuối) P(k)P(k-2)+7 & P(k)>P(k+2)+7 + k>=500 & kP(k-2)+7 & P(k)>P(k+2)+7 & P(k)>P(k-3)+7 & P(k)>P(k+3)+7 + k>=500 & kP(k-2)+7 & P(k)>P(k+2)+7 & P(k)>P(k-3)+7 & P(k)>P(k+3)+7 & P(k)>P(k-4)+7 & P(k)>P(k+4)+7 &P(k)>P(k-5)+7 & P(k)>P(k+5)+7 & P(k)>P(k-6)+7 & P(k)>P(k+6)+7 Khi phát k điểm masking lượng tử để giảm số bit mã hóa theo luật: Ptm(k)=10*log10(100.1*P(k-1)+10 0.1*P(k)+10 0.1*P(k+1)) 5.3 Kết đạt Kết thử nghiệm với tín hiệu âm nhạc đầu vào thể loại âm nhạc khác nhau, kiểm định tỉ lệ nén chất lượng âm trực tiếp qua hệ thống - 60 - Original audio signal 0.5 -0.5 -1 0.2 0.4 0.6 0.8 1.2 1.4 1.6 1.8 1.4 1.6 1.8 Time in [seg] Compressed audio signal 0.5 -0.5 -1 0.2 0.4 0.6 0.8 1.2 Time in [seg] Hình 5.3: Tín hiệu âm ban đầu sau khôi phục Thể loại nhạc Tỷ lệ nén trung bình Chất lượng âm khôi phục Drums (solo) 3.98 Transparent Pop 5.12 Nearly Transparent Speech 4.46 Transparent Piano (solo) 4.23 Transparent Jazz 7.75 Original Preferred Rock 8.46 Original Preferred Bảng Tỷ lệ nén chất lượng âm khôi phục số thể loại âm nhạc - 61 - Với mẫu thực nghiệm phân rã câu nói “one, two, three” dung lượng tín hiệu gốc 18,8kb dung lượng tín hiệu đo bên thu 18,6kb Phần tín hiệu bị phần tín hiệu nằm mức phân tích nằm mức ngưỡng, chủ yếu âm vô nhiễu Tín hiệu gốc: câu“one, two, three” – Kích thước 18,8kb Tín hiệu tái lập: câu“one, two, three” – Kích thước 18,6kb Tỷ lệ SNR = 17,45db Như vậy, với việc phân rã tín hiệu wavelet đạt độ nén cao, chất lượng âm tốt, phần sai khác không đáng kể - 62 - KẾT LUẬN Nén tín hiệu âm sử dụng biến đổi wavelets có nhiều ưu điểm vượt trội so với phương thức nén cổ điển, chúng nghiên cứu ứng dụng rộng rãi kỹ thuật nén (không phạm vi tiếng nói mà nén ảnh, nén liệu ) khuôn khổ luận văn tốt nghiệp, em cố gằng tìm hiểu nghiên cứu ứng dụng wavelets kỹ thuật nén âm làm sở cho hướng nghiên cứu sau với tham vọng làm giảm dung lượng tín hiệu truyền dẫn lưu trữ, tăng dung lượng nhớ băng thông Nội dung luận văn trình bày chương mô tả phần phương pháp phân tích nén tiếng nói truyền thống, nêu ưu điểm phương pháp sử dụng biến đổi wavelets Tuy nhiên công nghệ ứng dụng vô dạng, lĩnh vực xử lý tín hiệu nâng cấp tín hiệu, lọc nhiễu, nén tín hiệu, nhận dạng tín hiệu Với khoảng thời gian có hạn nên luận văn chưa thực hoàn chỉnh chắn tránh khỏi sai sót, hạn chế đề tài Rất mong thầy cô bạn độc giả phân tích cho ý kiến đóng góp để đề tài ngày hoàn thiện hơn, có hiệu thiết thực Em xin chân thành cảm ơn Nhằm bổ xung, hoàn thiện phát triển cao ứng dụng đa wavelets em xin đề xuất cho hướng phát triển đề tài sau : - Nâng cấp chất lượng tiếng nói truyền dẫn - Cải tiến tỷ lệ nén tín hiệu - Nghiên cứu ứng dụng wavelets nhận dạng tiếng nói phục vụ cho điều khiển tự động, đặc biệt nhận dạng tiếng việt Em xin chân thành cảm ơn Thầy Phùng Trung Nghĩa động viên, gợi mở giúp đỡ em hoàn thành luận văn khuyến khích em tiếp tục tham gia nghiên cứu đường khoa học - 63 - PHỤ LỤC Một số Modul chương trình: Modul ENCODER [x,Fs,bits] = wavread(file); xlen=length(x); t=0:1/Fs:(length(x)-1)/Fs; step=frame_size; N=ceil(xlen/step); Cchunks=0; Lchunks=0; Csize=0; PERF0mean=0; PERFL2mean=0; n_avg=0; n_max=0; n_0=0; n_vector=[]; for i=1:1:N if (i==N) frame=x([(step*(i-1)+1):length(x)]); else frame=x([(step*(i-1)+1):step*i]); end [C,L] = wavedec(frame,level,wavelet); if wavelet_compression=='on ' [thr,sorh,keepapp] = ddencmp('cmp','wv',frame); if heavy_compression == 'on ' thr=thr*10^6; end [XC,CXC,LXC,PERF0,PERFL2] = wdencmp('gbl',C, L, wavelet, level,thr,sorh,keepapp); C=CXC; L=LXC; PERF0mean=PERF0mean + PERF0; PERFL2mean=PERFL2mean+PERFL2; end Modul DECODER xdchunks=0; for i=1:1:N if i==N Cframe=Cchunks([((Csize(1)*(i-1))+1):Csize(2)+(Csize(1)*(i1))]); if compander=='on ' if max(Cframe)==0 else Cframe = compand(Cframe,Mu,max(Cframe),'mu/expander'); - 64 - end end xd = waverec(Cframe,Lchunks(Lsize+2:length(Lchunks)),wavelet); else Cframe=Cchunks([((Csize(1)*(i-1))+1):Csize(1)*i]); if compander=='on ' if max(Cframe)==0 else Cframe = compand(Cframe,Mu,max(Cframe),'mu/expander'); end end xd = waverec(Cframe,Lchunks(1:Lsize),wavelet); end xdchunks=[xdchunks xd]; Decoder = round((i/N)*100) end Model Psychoacoustic if psychoacoustic=='on ' P=10.*log10((abs(fft(frame,length(frame)))).^2); Ptm=zeros(1,length(P)); for k=1:1:length(P) if ((k=250)) bool = 0; elseif ((P(k)(P(k+2)+7))); elseif ((k>=63) & (k(P(k-2)+7)) & (P(k)>(P(k+2)+7)) & (P(k)>(P(k-3)+7)) & (P(k)>(P(k+3)+7))); elseif ((k>=127) & (k(P(k-2)+7)) & (P(k)>(P(k+2)+7)) & (P(k)>(P(k-3)+7)) & (P(k)>(P(k+3)+7)) & (P(k)>(P(k4)+7)) & (P(k)>(P(k+4)+7)) &(P(k)>(P(k-5)+7)) & (P(k)>(P(k+5)+7)) & (P(k)>(P(k-6)+7)) &(P(k)>(P(k+6)+7))); else bool = 0; end if bool==1 Ptm(k)=10*log10(10.^(0.1.*(P(k1)))+10.^(0.1.*(P(k)))+10.^(0.1.*P(k+1))); end end - 65 - TÀI LIỆU THAM KHẢO [1] Nguyễn Việt Anh, Nguyễn Hoàng Hải, , “Công cụ phân tích Wavelet ứng dụng Matlab”, NXB khoa học kỹ thuật Hà Nội, 2005 [2] Nguyễn ViệtAnh, Nguyễn Hoàng Hải, , “Lập trình Matlab ứng dụng”, NXB khoa học kỹ thuật Hà Nội, 2005 [3] Nguyễn Quốc Trung, “Xử lý tín hiệu lọc số”, NXB khoa học kỹ thuật Hà Nội, 1998 [4] Gibert Strang, Truong Nguyen, “Wavelet and Filter Banks”, WeliesleyCambridge Press, The United States of America, 1996 [5] P L H Jamieson “High Quality Audio Compression Using an Adaptive Wavelet Packet Decomposition and Psychoacoustic Modeling”, IEEE Transactions on Signal Processing, Vol 46, No 4, April 1998 [6] Matias Zanartu,“Audio Compression using Wavelet Techniques”, ECE 648 – 3/2005, Purdue University [7] Dr John Homer, Wavelet, A New Tool For Signal Analysis, School of Information Technology And Electical Engineering (2001) [8] L Besacier, S gassi, A Dufaux, M Ansorge, F Pellandini GSM Speech Coding And Speaker recognition Institute of Microtechnology, Neuchateal (Switzerland) (2000) [9] Ali n Akansu, Ricard A Haddad (1995), Multiresolution Signal Decomposition, Academic Press, Inc., Boston San Diego, NewYork - 66 - NHẬN XÉT CỦA GIÁO VIÊN HƯỚNG DẪN …………………………………………………………………………………………… …………………………………………………………………………………………… …………………………………………………………………………………………… …………………………………………………………………………………………… …………………………………………………………………………………………… …………………………………………………………………………………………… …………………………………………………………………………………………… …………………………………………………………………………………………… …………………………………………………………………………………………… …………………………………………………………………………………………… …………………………………………………………………………………………… …………………………………………………………………………………………… …………………………………………………………………………………………… …………………………………………………………………………………………… …………………………………………………………………………………………… …………………………………………………………………………………………… …………………………………………………………………………………………… …………………………………………………………………………………………… …………………………………………………………………………………………… …………………………………………………………………………………………… …………………………………………………………………………………………… GIÁO VIÊN HƯỚNG DẪN Phùng Trung Nghĩa - 67 - [...]... ước chung, tín hiệu được coi là hàm theo một biến độc lập và là biến thời gian Tín hiệu số (Digital signal) là tín hiệu rời rạc (theo biến độc lập thời gian) đồng thời có biên độ cũng rời rạc hóa (lượng tử hóa) 1.2.1.2 Đáp ứng xung trong hệ tuyến tính bất biến Tín hiệu vào x(n) được gọi là tác động, tín hiệu ra y(n) được gọi là đáp ứng của hệ xử lý Ta có quan hệ : y(n) = T[x(n)] T : phép biến đổi x(n)... Để hiểu rõ hơn về wavelet, chúng ta sẽ xét qua một số biến đổi truyền thống biểu diễn tín hiệu trong miền tần số và miền thời gian – tần số 3.1 Biến đổi Fourier Ta biết biến đổi Fourier truyền thống phân tích tín hiệu thành những đường sin liên tục ở các tần số khác nhau Về mặt toán học, biến đổi này chuyển việc bảo dưỡng tín hiệu ở miền thời gian sang miền tần số Đối với nhiều tín hiệu, phân tích Fourier... 1.2 Xử lý tín hiệu số đối với sóng âm 1.2.1 .Tín hiệu và hệ thống rời rạc 1.2.1.1 Giới thiệu Tín hiệu là biểu hiện vật lý của thông tin, thường là thông tin về trạng thái hay hành vi của một hệ vật lý nào đó Về mặt toán học, tín hiệu được coi là hàm của một hay vài biến độc lập Ví dụ: tín hiệu âm thanh là sự thay đổi áp suất không khí theo thời gian; tín hiệu hình ảnh là hàm độ sáng theo hai biến không... dụng biến đổi Fourier để phân tích một vùng nhỏ của tín hiệu tại một thời điểm và gọi là kỹ thuật lấy cửa số tín hiệu Đây chính là biến đổi Fourer thời gian ngắn, thực hiện ánh xạ một tín hiệu thành một hàm hai chiều thời gian – tần số Hình 3.2: Biến đổi Fourier thời gian ngắn STFT sử dụng các hàm cơ sở là những hàm mũ phức đã lấy cửa sổ và các hàm dịch của chúng để tạo nên biến đổi Để có được biến đổi. .. một Wavelet và so sánh với khởi đầu của một tín hiệu nguyên thủy Bước 2: Tính toán giá trị C, đặc trưng cho tương quan gần của Wavelet với đoạn tín hiệu này C càng lớn, càng có sự tương tự Chính xác hơn, nếu năng lượng của tín hiệu và Wavelet là bằng nhau, C có thể hiểu là hệ số tương quan Kết quả sẽ phụ thuộc vào Wavelet mẹ Hình 3.6: Bước 1, So sánh wavelet với tín hiệu nguyên thủy Bước 3: Dịch Wavelet. .. với tín hiệu tuần hoàn và rời rạc xp(n), ta có chuỗi Fourier rời rạc (DFS): xp(n) =  ak.ej(2k/N)n k= Trong đó các hệ số ak là các hệ số khai triển chuỗi Fourier rời rạc hay còn được gọi là các vạch phổ của tín hiệu tuần hoàn 1.2.2.2 Biến đổi Fourier rời rạc của tín hiệu có độ dài hữu hạn Việc biểu diễn Fourier cho tín hiệu rời rạc có độ dài hữu hạn gọi là phép biến đổi Fourier rời rạc (DFT) Tín hiệu. .. của tín hiệu đóng vai trò rất quan trọng Nhưng phân tích Fourier cũng có một hạn chế rất lớn là khi chuyển sang miền tần số thì thông tin thời gian bị mất đi Nhìn vào biến đổi Fourier của một tín hiệu ta không thể xác định thời điểm xảy ra một sự kiện nào đó Nếu tính chất của tín hiệu không thay đổi theo thời gian hay tín hiệu là tĩnh thì hạn chế này không quan trọng Tuy nhiên, hầu hết các tín hiệu. .. so với các kỹ thuật cổ điển, phân tích wavelet có thể thực hiện nén hoặc khử nhiễu tín hiệu mà không có suy giảm nhận thấy được Hình 3.3: Phân tích Wavelet Có một điểm chú ý ở đây là phân tích Wavelet không ánh xạ tín hiệu sang miền thời gian – tần số mà thay vào đó là miền thời gian – tỷ lệ (time-scale) 3.4 Các loại biến đổi Wavelet 3.4.1 Wavelet liên tục CWT Wavelet là những hàm cơ sở mn(t) liên... biên độ dải thông là Ts 1.2.2 Phép biến đổi Fourier rời rạc 1.2.2.1 Chuỗi Fourier rời rạc của tín hiệu rời rạc tuần hoàn - 17 - Tín hiệu tuần hoàn xp(n)là tuần hoàn với chu kỳ N nếu: xp(n)= xp(n+N), với mọi n Đối với tín hiệu rời rạc, ta khai triển Fourier theo hàm: k(n) = ej(2k/N)n , k=0,1, 2 Các hàm điều hòa phức rời rạc chỉ có N tín hiệu phân biệt nhau vì tín hiệu sai khác nhau là bội của N thì... hữu hạn là tín hiệu có giá trị khác 0 trong một khoảng hữu hạn thời gian nào đó, và bằng 0 trong khoảng còn lại Đây là loại tín hiệu tồn tại trong thực tế vì chúng ta chỉ có thể quan sát mọi tín hiệu trong một khoảng thời gian là hữu hạn từ N1 đến N2 Để đơn giản hoá, ta có thể quy ước tín hiệu x(n) tồn tại trong khoảng thời gian: 0  n  M-1, tức là : M = N2 - N1+1 Với tín hiệu x(n) này được dùng như

Định dạng
Số trang	67
Dung lượng	1,82 MB