1. Trang chủ
  2. » Giáo Dục - Đào Tạo

Nghiên cứu kỹ thuật mã hóa nén tín hiệu âm thanh ứng dụng tại đài tiếng nói việt nam

125 7 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 125
Dung lượng 6,67 MB

Nội dung

ĐẠI HỌC ĐÀ NẴNG TRƢỜNG ĐẠI HỌC BÁCH KHOA TRẦN HỮU LỘC NGUYỄN THANH PHONG NGUYỄN THANH PHONG LUẬN VĂN THẠC SĨ KỸ THUẬT ĐIỆN TỬ C C R L T NGHIÊN CỨU KỸ THUẬT MÃ HĨA NÉN TÍN DU HIỆU ÂM THANH ỨNG DỤNG TẠI ĐÀI TIẾNG NÓI VIỆT NAM LUẬN VĂN THẠC SĨ KỸ THUẬT ĐIỆN TỬ NĂM 2019 Đà Nẵng – Năm 2019 ĐẠI HỌC ĐÀ NẴNG TRƢỜNG ĐẠI HỌC BÁCH KHOA NGUYỄN THANH PHONG C C R L T NGHIÊN CỨU KỸ THUẬT MÃ HÓA NÉN TÍN HIỆU DU ÂM THANH ỨNG DỤNG TẠI ĐÀI TIẾNG NÓI VIỆT NAM Chuyển nghành: KỸ THUẬT ĐIỆN TỬ Mã số: 8520203 LUẬN VĂN THẠC SĨ KỸ THUẬT ĐIỆN TỬ Ngƣời hƣớng dẫn khoa hoc: TS HOÀNG LÊ UYÊN THỤC Đà Nẵng – Năm 2019 i LỜI CAM ĐOAN Tôi xin cam đoan đề tài: ―NGHIÊN CỨU KỸ THUẬT MÃ HĨA NÉN TÍN HIỆU ÂM THANH ỨNG DỤNG TẠI ĐÀI TIẾNG NĨI VIỆT NAM‖ cơng trình nghiên cứu độc lập, khơng có chép ngƣời khác Đề tài kết mà nỗ lực nghiên cứu trình học tập bậc cao học Trƣờng Đại Học Bách Khoa – Đại học Đà Nẵng, dƣới hƣớng dẫn TS Hoàng Lê Uyên Thục, giảng viên Khoa Điện tử - Viễn thông thuộc Nhà Trƣờng Trong trình viết thuyết minh làm thực nghiệm, tơi có sử dụng số liệu, liệu riêng Đài Tiếng nói Việt Nam, nơi tơi công tác tham khảo số tài liệu có nguồn gốc xuất xứ rõ ràng Tơi xin cam đoan có vấn đề sai trái tơi xin chịu hoàn toàn trách nhiệm C C DU R L T Ngƣời cam đoan Nguyễn Thanh Phong ii MỤC LỤC LỜI CAM ĐOAN ii MỤC LỤC ii DANH MỤC HÌNH viii DANH MỤC BẢNG ix MỞ ĐẦU 1 Đặt vấn đề Mục tiêu, đối tƣợng phạm vi nghiên cứu Đối tƣợng phạm vi nghiên cứu Phƣơng pháp nghiên cứu Cấu trúc luận văn Ý nghĩa luận văn Chƣơng 1: GIỚI THIỆU TỔNG QUAN VỀ HỆ THỐNG PHÁT THANH CỦA ĐÀI TIẾNG NÓI VIỆT NAM 1.1 Giới thiệu chƣơng 1.2 Giới thiệu tổng quan Đài Tiếng Nói Việt Nam 1.2.1 Các kênh phát 1.2.2 Truyền hình 1.2.3 Báo chí 1.2.4 Phát thanh, truyền hình internet điện thoại di động 1.3 Các loại sóng phát dùng Đài TNVN 1.3.1 Sóng trung 1.3.2 Sóng ngắn 1.3.3 Sóng FM 1.4 Phát tín hiệu tƣơng tự Đài TNVN 10 1.4.1 Sơ đồ nguyên lý phát tín hiệu tƣơng tự Đài TNVN 10 1.4.2 Ƣu nhƣợc điểm phát tín hiệu tƣơng tự 11 1.5 Một số tiêu chuẩn phát số đƣợc thử nghiệm Đài TNVN 12 1.5.1 Phát số tiêu chuẩn EUREKA 147 (DAB) 12 1.5.2 Phát số tiêu chuẩn DRM 14 1.5.3 Phát số tiêu chuẩn DMB 14 1.6 Kết luận chƣơng 15 Chƣơng 2: LÝ THUYẾT MÃ HÓA NÉN ÂM THANH 16 2.1 Giới thiệu chƣơng 16 2.2 Lý thuyết âm 16 2.2.1 Âm 16 2.2.2 Sự cảm thụ âm tai ngƣời 17 2.2.3 Tín hiệu âm tƣơng tự 18 2.3 Số hóa tín hiệu âm 20 2.3.1 Lấy mẫu 20 2.3.2 Lƣợng tử hóa 23 2.3.3 Mã hóa 23 2.4 Lý thuyết nén âm số 24 2.4.1 Mã hóa nén khơng tổn hao 24 2.4.2 Mã hóa nén có tổn hao 25 2.5 Các định dạng âm thực tế 26 C C DU R L T iii 2.5.1 Định dạng âm số gốc 26 2.5.2 Định dạng âm nén không tổn hao 27 2.5.3 Định dạng âm nén có tổn hao 27 2.6 Kết luận chƣơng 28 Chƣơng 3: CÁC KỸ THUẬT MÃ HÓA NÉN ÂM THANH 29 3.1 Giới thiệu chƣơng 29 3.2 Mơ hình tâm lý thính giác ngƣời 29 3.2.1 Độ nhạy tai 30 3.2.2 Hiệu ứng che 32 3.3 Nguyên lý mã hóa cảm quan 34 3.3.1 Xử lý tín hiệu mã hóa cảm quan 35 3.3.2 Mã hóa cảm quan MPEG-1 36 3.3.3 Mã hóa cảm quan MPEG-2 38 3.4 Kỹ thuật mã hóa nén âm số theo chuẩn MP3 39 3.4.1 Giàn lọc băng 39 3.4.2 Lập mơ hình cảm quan 41 3.4.3 Lƣợng tử hóa 41 3.4.4 Mã hóa 42 3.4.5 Định dạng dòng bit 42 3.5 Kỹ thuật mã hóa âm theo chuẩn AAC 43 3.5.1 Các khâu xử lý tín hiệu cải tiến từ MP3 43 3.5.2 Các khâu xử lý tín hiệu bổ sung cho AAC 45 3.6 So sánh kỹ thuật mã hóa nén MP3 AAC 45 3.6.1 Tính phổ biến 45 3.6.2 Tỷ lệ nén 46 3.6.3 Chất lƣợng âm 46 3.6.4 Khả tƣơng thích 46 3.7 Kết luận chƣơng 47 Chƣơng 4: THỰC NGHIỆM ỨNG DỤNG MÃ HÓA NÉN ÂM THANH SỐ TẠI ĐÀI TIẾNG NÓI VIỆT NAM 48 4.1 Giới thiệu chƣơng 48 4.2 Chuẩn bị thí nghiệm 48 4.2.1 Chuẩn bị sở liệu 48 4.2.2 Chuẩn bị sở vật chất 50 4.3 Quy trình thí nghiệm 52 4.3.1 Thí nghiệm đánh giá hiệu nén 52 4.3.2 Thí nghiệm đánh giá chất lƣợng nén 53 4.4 Kết đánh giá hiệu nén 54 4.5 Kết đánh giá chất lƣợng nén 56 4.5.1 Kết đánh giá chất lƣợng nén theo phƣơng pháp khách quan 56 4.5.2 Kết đánh giá chất lƣợng nén theo phƣơng pháp chủ quan 59 4.6 Ứng dụng kỹ thuật mã hóa nén phát 60 4.6.1 Ứng dụng vào phát internet di động 61 4.6.2 Ứng dụng lƣu trữ chƣơng trình phát sau sản xuất 61 4.6.3 Ứng dụng lƣu trữ chƣơng trình phát sau phát sóng 62 4.6.4 Ứng dụng lƣu trữ kho nhạc 63 C C DU R L T iv 4.6.5 Ứng dụng lƣu trữ để trao đổi nội dung phát sóng hệ 63 4.7 Kết luận chƣơng 64 KẾT LUẬN VÀ HƢỚNG PHÁT TRIỂN ĐỀ TÀI 65 Kết luận 65 Hƣớng phát triển đề tài 65 TÀI LIỆU THAM KHẢO 66 TIẾNG VIỆT 66 PHỤ LỤC C C DU R L T v NGHIÊN CỨU KỸ THUẬT MÃ HĨA NÉN TÍN HIỆU ÂM THANH ỨNG DỤNG TẠI ĐÀI TIẾNG NÓI VIỆT NAM Học viên: Nguyễn Thanh Phong Mã số: CH683 Chuyên ngành: Kỹ thuật Điện Tử Trường Đại học Bách khoa - ĐHĐN Khóa: 36 Tóm tắt — Tại Đài Tiếng nói Việt Nam (TNVN), kênh âm số đƣợc mã hóa theo chuẩn không nén Do chất mà tệp âm dạng khơng nén có dung lƣợng cực lớn, yêu cầu dung lƣợng ổ cứng lƣu trữ chƣơng trình phát lớn việc thao tác đoạn âm khó khăn Luận văn thực áp dụng thử nghiệm chuẩn nén âm Đài TNVN, bao gồm chuẩn MP3 (Moving Picture Experts Group 1- Layer 3) AAC (Moving Picture Experts Group 2- Advanced Audio Coding) Lần lƣợt chuẩn MP3 AAC đƣợc áp dụng cho 18 tệp âm trích chọn từ chƣơng trình khác gần Đài với tổng dung lƣợng 5546MB (tƣơng đƣơng thời lƣợng giờ), sau đƣợc đánh giá dựa tiêu chí hiệu bao gồm thời gian thực thi tỷ lệ nén Tiêu chí chất lƣợng đƣợc đánh giá theo phƣơng pháp khách quan dựa vào tỷ lệ lỗi MSE (Mean Squared Error) đánh giá chủ quan dựa vào nghe thử Thí nghiệm nghe thử đƣợc tiến hành 24 đoạn âm ngắn nhiều thể loại, đoạn kéo dài trung bình 20 giây, với số lƣợng tình nguyện viên tham gia 35 ngƣời C C R L T DU Kết nghiên cứu cho thấy tính khả thi việc áp dụng chuẩn nén âm đài TNVN, đặc biệt giúp xác định tập giá trị tham số phù hợp chuẩn nén nhằm tiết kiệm dung lƣợng lƣu trữ liệu giảm thời gian thao tác tín hiệu, đảm bảo chất lƣợng dịch vụ phát Từ khóa — Mã hóa nén âm thanh, mã hóa MP3 (Moving Picture Experts Group – Layer 3), mã hóa AAC (Moving Picture Experts Group – Advanced Audio Coding), đánh giá chủ quan, nghe thử vi A STUDY OF THE APPLICATION OF DIGITAL AUDIO COMPRESSION TECHNIQUES TO THE VOICE OF VIETNAM NATIONAL STATION Student: Nguyen Thanh Phong Code: CH683 Course: 36 Major: Electronics Technology The University Of DaNang University Of Science And Technology Abstract—At the Voice Of Vietnam national station (VOV), the digital audio channels are currently encoded by uncompressed audio codings in wave format Basically, the size of wave format-based audio files is extremely large, so the capacity to store the radio programs is very high and the manipulation on audio clips is very complex This thesis aims to validate the experimental applications of audio compression standards including MP3 (Moving Picture Experts Group 1- Layer 3) and AAC (Moving Picture Experts Group 2- Advanced Audio Coding) to The VOV MP3 and AAC are sequentially applied to 18 audio clips extracted from different instant VOV programs during over hours, and then are measured based on performance metrics including processing time and compresstion ratio The audio quality is evaluated objectively based on MSE (Mean Squared Error) and subjectively based on listening tests Listening tests are implemented on 24 multi-genre audio clips with a participation of 35 volunteers C C R L T DU The experimental results show the feasibility of the application of MP3 and AAC techniques to The VOV Based on the experimental results, the most appropriate parameter values of new audio techiniques are also determined in order to save the storage capacity and the signal manipulation time while ensuring the required quality of audio service Key words— Audio compression coding, code MP3 (Moving Picture Experts Group – Layer 3), code AAC (Moving Picture Experts Group – Advanced Audio Coding), Subjective evaluation, testing listen vii BẢNG VIẾT TẮT A AAC AM AIFF C CD COFDM D DAB DMB DPCM DRM DSB E EBU ETSI F FM FLAC H HD HE HVXC I IEC ITU ISO ISDB – T L LP M MPEG N NRSC O OFDM P PCM V VOV W WAVE : : : Advanced Audio Coding Amplitude Modulation Audio Interchange File Format : : Compact Disc Code Orthogonal Frequency : : : : : Digital Audio Broadcasting Digital Multimedia Broadcasting Differential Pulse Code Modulation Digital Radio Mondiale Digital Sound Broadcasting : : European Broadcasting Union European Telecommunications Standards Institute : : Frequency Modulation Free Lossless Audio code C C R L T DU : : : High Definition Radio High Efficiency-ACC Harmonic Vector Excitation Coding : : : : International Electrotechnical Commission International Telecommunication Union International Organization Of Standardition Intergrated Srevices Digital Broadcast Terrestriall : Linear Prediction Analysis : Moving Picture Experts Group : National Radio Systems Committee : Orthogonal Frequency Division Multiplexing : Pulse Code Modulation : Radio The Voice of Viet Nam : Waveform Audio viii DANH MỤC HÌNH Hình 1.1 Bản đồ phủ sóng phát Đài TNVN (nguồn Trung Tâm Kỹ Thuật Phát Thanh VOV) Hình 1.2 Sơ đồ nguyên lý phát tín hiệu tƣơng tự Đài TNVN 11 Hình 1.3 Sơ đồ máy phát số chuẩn EUREKA 147 13 Hình 1.4 Sơ đồ khối máy phát số theo tiêu chuẩn DRM 14 Hình 2.1 Quá trình chuyển đối tín hiệu tƣơng tự sang tín hiệu số 20 Hình 2.2 Lấy mẫu lý tƣởng 21 Hình 2.3 Phổ tín hiệu lấy mẫu 22 Hình 2.4 Quá trình lấy mẫu thực tế 23 Hình 2.5 Hàm lƣợng tử hóa với bƣớc lƣợng tử q = 23 Hình 3.1 Ngƣỡng nghe tuyệt đối 30 Hình 3.2 Ngƣỡng nghe tuyệt đối đƣợc xác định dựa mức áp SPL 31 Hình 3.3 Nhiễu lƣợng tử hóa trƣờng hợp lƣợng tử hóa 12 bit 31 Hình 3.4 Phân chia băng lƣợng tử hóa với số bit thay đổi 32 Hình 3.5 Âm mạnh làm méo ngƣỡng nghe tuyệt đối âm yếu 33 Hình 3.6 Áp dụng hiệu ứng che tần số vào nén âm 34 Hình 3.7 Hiệu ứng che thời gian trƣớc sau 34 Hình 3.8 Kết hợp hiệu ứng che thời gian che tần số 34 Hình 3.9 Bộ mã hóa giải mã âm theo khung 36 Hình 3.10 Bộ mã hóa âm MPEG chia khung tín hiệu âm thành 32 băng rộng 38 Hình 3.11 Sơ đồ khối mã hóa audio theo chuẩn MP3 39 Hình 3.12 Sự chồng lấp khối liệu với nửa sau khối chồng lên nửa đầu khối 41 Hình 3.13 Sơ đồ khối mã hóa audio theo chuẩn MPEG-2 AAC 43 Hình 3.14 Đoạn ghi âm đàn cascanet 44 Hình 3.15 Tác dụng TNS 45 Hình 4.1 Hình ảnh phịng thí nghiệm 51 Hình 4.2 Bass base card âm để kiểm chứng headphone 52 Hình 4.3 Quy trình thí nghiệm đánh giá chuẩn nén 53 Hình 4.4 Lƣu trữ chƣơng trình trƣớc phát sóng 61 Hình 4.5 Lƣu trữ lại chƣơng trình sau phát sóng 62 Hình 4.6 Lƣu trữ kho nhạc 63 Hình 4.7 Lƣu trữ âm sử dụng chung hệ 64 C C DU R L T yt24=audioread('File 02 giong nam doc 44.1Khz.wav',[507151 529200] ); yt25=audioread('File 02 giong nam doc 44.1Khz.wav',[529201 551250] ); yt26=audioread('File 02 giong nam doc 44.1Khz.wav',[551251 573300] ); yt27=audioread('File 02 giong nam doc 44.1Khz.wav',[573301 595350] ); yt28=audioread('File 02 giong nam doc 44.1Khz.wav',[595351 617400] ); yt29=audioread('File 02 giong nam doc 44.1Khz.wav',[617401 639450] ); yt30=audioread('File 02 giong nam doc 44.1Khz.wav',[639451 661500] ); xt21=audioread('File 02 giong nam doc 44.1Khz.wav',[441001 463050]); xt22=audioread('giai nen lai wave giong nam doc.wav',[463051 485100] ); xt23=audioread('giai nen lai wave giong nam doc.wav',[485101 507150] ); xt24=audioread('giai nen lai wave giong nam doc.wav',[507151 529200] ); xt25=audioread('giai nen lai wave giong nam doc.wav',[529201 551250] ); xt26=audioread('giai nen lai wave giong nam doc.wav',[551251 573300] ); xt27=audioread('giai nen lai wave giong nam doc.wav',[573301 595350] ); xt28=audioread('giai nen lai wave giong nam doc.wav',[595351 617400] ); xt29=audioread('giai nen lai wave giong nam doc.wav',[617401 639450] ); xt30=audioread('giai nen lai wave giong nam doc.wav',[639451 661500] ); X21= (sum((yt21-xt21).^2))/22050; X22= (sum((yt22-xt22).^2))/22050; X23= (sum((yt23-xt23).^2))/22050; X24= (sum((yt24-xt24).^2))/22050; X25= (sum((yt25-xt25).^2))/22050; X26= (sum((yt26-xt26).^2))/22050; X27= (sum((yt27-xt27).^2))/22050; X28= (sum((yt28-xt28).^2))/22050; X29= (sum((yt29-xt29).^2))/22050; X30= (sum((yt30-xt30).^2))/22050; yt31=audioread('File 02 giong nam doc 44.1Khz.wav',[661501 683550]); yt32 =audioread('File 02 giong nam doc 44.1Khz.wav',[683551 705600] ); yt33=audioread('File 02 giong nam doc 44.1Khz.wav',[705601 727650] ); yt34=audioread('File 02 giong nam doc 44.1Khz.wav',[727651 749700] ); yt35=audioread('File 02 giong nam doc 44.1Khz.wav',[749701 771750] ); yt36=audioread('File 02 giong nam doc 44.1Khz.wav',[771751 793800] ); yt37=audioread('File 02 giong nam doc 44.1Khz.wav',[793801 815850] ); yt38=audioread('File 02 giong nam doc 44.1Khz.wav',[815851 837900] ); yt39=audioread('File 02 giong nam doc 44.1Khz.wav',[837901 859950] ); yt40=audioread('File 02 giong nam doc 44.1Khz.wav',[859951 882000] ); xt31=audioread('giai nen lai wave giong nam doc.wav',[661501 683550]); xt32=audioread('giai nen lai wave giong nam doc.wav',[683551 705600] ); xt33=audioread('giai nen lai wave giong nam doc.wav',[705601 727650] ); xt34=audioread('giai nen lai wave giong nam doc.wav',[727651 749700] ); xt35=audioread('giai nen lai wave giong nam doc.wav',[749701 771750] ); xt36=audioread('giai nen lai wave giong nam doc.wav',[771751 793800] ); xt37=audioread('giai nen lai wave giong nam doc.wav',[793801 815850] ); xt38=audioread('giai nen lai wave giong nam doc.wav',[815851 837900] ); xt39=audioread('giai nen lai wave giong nam doc.wav',[837901 859950] ); xt40=audioread('giai nen lai wave giong nam doc.wav',[859951 882000] ); X31= (sum((yt31-xt31).^2))/22050; X32= (sum((yt32-xt32).^2))/22050; X33= (sum((yt33-xt33).^2))/22050; X34= (sum((yt34-xt34).^2))/22050; X35= (sum((yt35-xt35).^2))/22050; X36= (sum((yt36-xt36).^2))/22050; X37= (sum((yt37-xt37).^2))/22050; X38= (sum((yt38-xt38).^2))/22050; X39= (sum((yt39-xt39).^2))/22050; X40= (sum((yt40-xt40).^2))/22050; C C R L T DU C.3 Code Matlab xác định MSE cho AAC tốc độ 64Kbps yt1=audioread('FILE yt2=audioread('FILE yt3=audioread('FILE yt4=audioread('FILE yt5=audioread('FILE yt6=audioread('FILE GOC GOC GOC GOC GOC GOC GIONG GIONG GIONG GIONG GIONG GIONG NU.wav',[1 22050]); NU.wav',[22051 44100] ); NU.wav',[44101 66150] ); NU.wav',[66151 88200] ); NU.wav',[88201 110250] ); NU.wav',[110251 132300] ); yt7=audioread('FILE GOC GIONG NU.wav',[132301 154350] ); yt8=audioread('FILE GOC GIONG NU.wav',[154351 176400] ); yt9=audioread('FILE GOC GIONG NU.wav',[176401 198450] ); yt10=audioread('FILE GOC GIONG NU.wav',[198451 220500] ); xt1=audioread('GIAI NEN AAC THANH WAVE 64kbps.wav',[1 22050]); xt2=audioread('GIAI NEN AAC THANH WAVE 64kbps.wav',[22051 44100] ); xt3=audioread('GIAI NEN AAC THANH WAVE 64kbps.wav',[44101 66150] ); xt4=audioread'GIAI NEN AAC THANH WAVE 64kbps.wav',[66151 88200] ); xt5=audioread('GIAI NEN AAC THANH WAVE 64kbps.wav',[88201 110250] ); xt6=audioread('GIAI NEN AAC THANH WAVE 64kbps.wav',[110251 132300] ); xt7=audioread('GIAI NEN AAC THANH WAVE 64kbps.wav',[132301 154350] ); xt8=audioread('GIAI NEN AAC THANH WAVE 64kbps.wav',[154351 176400] ); xt9=audioread('GIAI NEN AAC THANH WAVE 64kbps.wav',[176401 198450] ); xt10=audioread'GIAI NEN AAC THANH WAVE 64kbps.wav',[198451 220500] ); X1= (sum((yt1-xt1).^2))/22050; X2= (sum((yt2-xt2).^2))/22050; X3= (sum((yt3-xt3).^2))/22050; X4= (sum((yt4-xt4).^2))/22050; X5= (sum((yt5-xt5).^2))/22050; X6= (sum((yt6-xt6).^2))/22050; X7= (sum((yt7-xt7).^2))/22050; X8= (sum((yt8-xt8).^2))/22050; X9= (sum((yt9-xt9).^2))/22050; X10= (sum((yt10-xt10).^2))/22050; yt11=audioread('FILE GOC GIONG NU.wav',[220501 242550]); yt12=audioread('FILE GOC GIONG NU.wav',[242551 264600]); yt13=audioread('FILE GOC GIONG NU.wav',[264601 286650]); yt14=audioread('FILE GOC GIONG NU.wav',[286651 308700]); yt15=audioread('FILE GOC GIONG NU.wav',[308701 330750]); yt16 =audioread('FILE GOC GIONG NU.wav',[330751 352800]); yt17=audioread('FILE GOC GIONG NU.wav',[352801 374850]); yt18 =audioread('FILE GOC GIONG NU.wav',[374851 396900]); yt19=audioread('FILE GOC GIONG NU.wav',[396901 418950]); yt20=audioread('FILE GOC GIONG NU.wav',[418951 441000]); xt11=audioread('GIAI NEN AAC THANH WAVE 64kbps.wav',[220501 242550]); xt12=audioread('GIAI NEN AAC THANH WAVE 64kbps.wav',[242551 264600]); xt13=audioread('GIAI NEN AAC THANH WAVE 64kbps.wav',[264601 286650]); xt14=audioread('GIAI NEN AAC THANH WAVE 64kbps.wav',[286651 308700]); xt15=audioread('GIAI NEN AAC THANH WAVE 64kbps.wav',[308701 330750]); xt16=audioread('GIAI NEN AAC THANH WAVE 64kbps.wav',[330751 352800]); xt17=audioread('GIAI NEN AAC THANH WAVE 64kbps.wav',[352801 374850]); xt18=audioread('GIAI NEN AAC THANH WAVE 64kbps.wav',[374851 396900]); xt19=audioread('GIAI NEN AAC THANH WAVE 64kbps.wav',[396901 418950]); xt20=audioread('GIAI NEN AAC THANH WAVE 64kbps.wav',[418951 441000]); X11= (sum((yt11-xt11).^2))/22050; X12= (sum((yt12-xt12).^2))/22050; X13= (sum((yt13-xt13).^2))/22050; X14= (sum((yt14-xt14).^2))/22050; X15= (sum((yt15-xt15).^2))/22050; X16= (sum((yt16-xt16).^2))/22050; X17= (sum((yt17-xt17).^2))/22050; X18= (sum((yt18-xt18).^2))/22050; X19= (sum((yt19-xt19).^2))/22050; X20= (sum((yt20-xt20).^2))/22050; yt21=audioread('FILE GOC GIONG NU.wav',[441001 463050]); yt22 =audioread('FILE GOC GIONG NU.wav',[463051 485100] ); yt23 =audioread('FILE GOC GIONG NU.wav',[485101 507150] ); yt24 =audioread('FILE GOC GIONG NU.wav',[507151 529200] ); yt25 =audioread('FILE GOC GIONG NU.wav',[529201 551250] ); yt26=audioread('FILE GOC GIONG NU.wav',[551251 573300] ); yt27=audioread('FILE GOC GIONG NU.wav',[573301 595350] ); yt28=audioread('FILE GOC GIONG NU.wav',[595351 617400] ); yt29=audioread('FILE GOC GIONG NU.wav',[617401 639450] ); yt30=audioread('FILE GOC GIONG NU.wav',[639451 661500] ); C C DU R L T xt21=audioread('FILE GOC GIONG NU.wav',[441001 463050]); xt22=audioread('GIAI NEN AAC THANH WAVE 64kbps.wav',[463051 xt23=audioread('GIAI NEN AAC THANH WAVE 64kbps.wav',[485101 xt24=audioread('GIAI NEN AAC THANH WAVE 64kbps.wav',[507151 xt25=audioread('GIAI NEN AAC THANH WAVE 64kbps.wav',[529201 xt26=audioread('GIAI NEN AAC THANH WAVE 64kbps.wav',[551251 xt27=audioread('GIAI NEN AAC THANH WAVE 64kbps.wav',[573301 xt28=audioread('GIAI NEN AAC THANH WAVE 64kbps.wav',[595351 xt29=audioread('GIAI NEN AAC THANH WAVE 64kbps.wav',[617401 xt30=audioread('GIAI NEN AAC THANH WAVE 64kbps.wav',[639451 X21= (sum((yt21-xt21).^2))/22050; X22= (sum((yt22-xt22).^2))/22050; X23= (sum((yt23-xt23).^2))/22050; X24= (sum((yt24-xt24).^2))/22050; X25= (sum((yt25-xt25).^2))/22050; X26= (sum((yt26-xt26).^2))/22050; X27= (sum((yt27-xt27).^2))/22050; X28= (sum((yt28-xt28).^2))/22050; X29= (sum((yt29-xt29).^2))/22050; X30= (sum((yt30-xt30).^2))/22050; yt31=audioread('FILE GOC GIONG NU.wav',[661501 683550]); yt32 =audioread('FILE GOC GIONG NU.wav',[683551 705600] ); yt33=audioread('FILE GOC GIONG NU.wav',[705601 727650] ); yt34 =audioread('FILE GOC GIONG NU.wav',[727651 749700] ); yt35 =audioread('FILE GOC GIONG NU.wav',[749701 771750] ); yt36=audioread('FILE GOC GIONG NU.wav',[771751 793800] ); yt37=audioread('FILE GOC GIONG NU.wav',[793801 815850] ); yt38=audioread('FILE GOC GIONG NU.wav',[815851 837900] ); yt39=audioread('FILE GOC GIONG NU.wav',[837901 859950] ); yt40=audioread('FILE GOC GIONG NU.wav',[859951 882000] ); xt31=audioread('GIAI NEN AAC THANH WAVE 64kbps.wav',[661501 xt32=audioread('GIAI NEN AAC THANH WAVE 64kbps.wav',[683551 xt33=audioread('GIAI NEN AAC THANH WAVE 64kbps.wav',[705601 xt34=audioread('GIAI NEN AAC THANH WAVE 64kbps.wav',[727651 xt35=audioread('GIAI NEN AAC THANH WAVE 64kbps.wav',[749701 xt36=audioread('GIAI NEN AAC THANH WAVE 64kbps.wav',[771751 xt37=audioread('GIAI NEN AAC THANH WAVE 64kbps.wav',[793801 xt38=audioread('GIAI NEN AAC THANH WAVE 64kbps.wav',[815851 xt39=audioread('GIAI NEN AAC THANH WAVE 64kbps.wav',[837901 xt40=audioread('GIAI NEN AAC THANH WAVE 64kbps.wav',[859951 X31= (sum((yt31-xt31).^2))/22050; X32= (sum((yt32-xt32).^2))/22050; X33= (sum((yt33-xt33).^2))/22050; X34= (sum((yt34-xt34).^2))/22050; X35= (sum((yt35-xt35).^2))/22050; X36= (sum((yt36-xt36).^2))/22050; X37= (sum((yt37-xt37).^2))/22050; X38= (sum((yt38-xt38).^2))/22050; X39= (sum((yt39-xt39).^2))/22050; X40= (sum((yt40-xt40).^2))/22050; 485100] 507150] 529200] 551250] 573300] 595350] 617400] 639450] 661500] ); ); ); ); ); ); ); ); ); C C R L T DU 683550]); 705600] ); 727650] ); 749700] ); 771750] ); 793800] ); 815850] ); 837900] ); 859950] ); 882000] ); C.4 Code Matlab xác định MSE cho AAC tốc độ 192Kbps yt1=audioread('FILE GOC GIONG NU.wav',[1 22050]); yt2=audioread('FILE GOC GIONG NU.wav',[22051 44100] ); yt3=audioread('FILE GOC GIONG NU.wav',[44101 66150] ); yt4=audioread('FILE GOC GIONG NU.wav',[66151 88200] ); yt5=audioread('FILE GOC GIONG NU.wav',[88201 110250] ); yt6=audioread('FILE GOC GIONG NU.wav',[110251 132300] ); yt7=audioread('FILE GOC GIONG NU.wav',[132301 154350] ); yt8=audioread('FILE GOC GIONG NU.wav',[154351 176400] ); yt9=audioread('FILE GOC GIONG NU.wav',[176401 198450] ); yt10=audioread('FILE GOC GIONG NU.wav',[198451 220500] ); xt1=audioread('GIAI NEN AAC THANH WAVE 192kbps.wav',[1 22050]); xt2=audioread('GIAI NEN AAC THANH WAVE 192kbps.wav',[22051 44100] ); xt3=audioread('GIAI NEN AAC THANH WAVE 192kbps.wav',[44101 66150] ); xt4=audioread('GIAI NEN AAC THANH WAVE 192kbps.wav',[66151 88200] ); xt5=audioread('GIAI NEN AAC THANH WAVE 192kbps.wav',[88201 110250] ); xt6=audioread('GIAI NEN AAC THANH WAVE 192kbps.wav',[110251 132300] ); xt7=audioread('GIAI NEN AAC THANH WAVE 192kbps.wav',[132301 154350] ); xt8=audioread('GIAI NEN AAC THANH WAVE 192kbps.wav',[154351 176400] ); xt9=audioread('GIAI NEN AAC THANH WAVE 192kbps.wav',[176401 198450] ); xt10=audioread('GIAI NEN AAC THANH WAVE 192kbps.wav',[198451 220500] ); X1= (sum((yt1-xt1).^2))/22050; X2= (sum((yt2-xt2).^2))/22050; X3= (sum((yt3-xt3).^2))/22050; X4= (sum((yt4-xt4).^2))/22050; X5= (sum((yt5-xt5).^2))/22050; X6= (sum((yt6-xt6).^2))/22050; X7= (sum((yt7-xt7).^2))/22050; X8= (sum((yt8-xt8).^2))/22050; X9= (sum((yt9-xt9).^2))/22050; X10= (sum((yt10-xt10).^2))/22050; yt11=audioread('FILE GOC GIONG NU.wav',[220501 242550]); yt12=audioread('FILE GOC GIONG NU.wav',[242551 264600]); yt13=audioread('FILE GOC GIONG NU.wav',[264601 286650]); yt14=audioread('FILE GOC GIONG NU.wav',[286651 308700]); yt15=audioread('FILE GOC GIONG NU.wav',[308701 330750]); yt16=audioread('FILE GOC GIONG NU.wav',[330751 352800]); yt17=audioread('FILE GOC GIONG NU.wav',[352801 374850]); yt18=audioread('FILE GOC GIONG NU.wav',[374851 396900]); yt19=audioread('FILE GOC GIONG NU.wav',[396901 418950]); yt20=audioread('FILE GOC GIONG NU.wav',[418951 441000]); xt11=audioread('GIAI NEN AAC THANH WAVE 192kbps.wav',[220501 242550]); xt12=audioread('GIAI NEN AAC THANH WAVE 192kbps.wav',[242551 264600]); xt13 =audioread('GIAI NEN AAC THANH WAVE 192kbps.wav',[264601 286650]); xt14=audioread('GIAI NEN AAC THANH WAVE 192kbps.wav',[286651 308700]); xt15=audioread('GIAI NEN AAC THANH WAVE 192kbps.wav',[308701 330750]); xt16=audioread('GIAI NEN AAC THANH WAVE 192kbps.wav',[330751 352800]); xt17=audioread('GIAI NEN AAC THANH WAVE 192kbps.wav',[352801 374850]); xt18=audioread('GIAI NEN AAC THANH WAVE 192kbps.wav',[374851 396900]); xt19=audioread('GIAI NEN AAC THANH WAVE 192kbps.wav',[396901 418950]); xt20=audioread('GIAI NEN AAC THANH WAVE 192kbps.wav',[418951 441000]); X11= (sum((yt11-xt11).^2))/22050; X12= (sum((yt12-xt12).^2))/22050; X13= (sum((yt13-xt13).^2))/22050; X14= (sum((yt14-xt14).^2))/22050; X15= (sum((yt15-xt15).^2))/22050; X16= (sum((yt16-xt16).^2))/22050; X17= (sum((yt17-xt17).^2))/22050; X18= (sum((yt18-xt18).^2))/22050; X19= (sum((yt19-xt19).^2))/22050; X20= (sum((yt20-xt20).^2))/22050; yt21=audioread('FILE GOC GIONG NU.wav',[441001 463050]); yt22=audioread('FILE GOC GIONG NU.wav',[463051 485100] ); yt23=audioread('FILE GOC GIONG NU.wav',[485101 507150] ); yt24=audioread('FILE GOC GIONG NU.wav',[507151 529200] ); yt25=audioread('FILE GOC GIONG NU.wav',[529201 551250] ); yt26=audioread('FILE GOC GIONG NU.wav',[551251 573300] ); yt27=audioread('FILE GOC GIONG NU.wav',[573301 595350] ); yt28=audioread('FILE GOC GIONG NU.wav',[595351 617400] ); yt29=audioread('FILE GOC GIONG NU.wav',[617401 639450] ); yt30=audioread('FILE GOC GIONG NU.wav',[639451 661500] ); xt21=audioread('FILE GOC GIONG NU.wav',[441001 463050]); xt22=audioread('GIAI NEN AAC THANH WAVE 192kbps.wav',[463051 485100] ); xt23=audioread('GIAI NEN AAC THANH WAVE 192kbps.wav',[485101 507150] ); xt24=audioread('GIAI NEN AAC THANH WAVE 192kbps.wav',[507151 529200] ); xt25=audioread('GIAI NEN AAC THANH WAVE 192kbps.wav',[529201 551250] ); xt26=audioread('GIAI NEN AAC THANH WAVE 192kbps.wav',[551251 573300] ); xt27=audioread('GIAI NEN AAC THANH WAVE 192kbps.wav',[573301 595350] ); C C DU R L T xt28=audioread('GIAI NEN AAC THANH WAVE 192kbps.wav',[595351 xt29=audioread('GIAI NEN AAC THANH WAVE 192kbps.wav',[617401 xt30=audioread('GIAI NEN AAC THANH WAVE 192kbps.wav',[639451 X21= (sum((yt21-xt21).^2))/22050; X22= (sum((yt22-xt22).^2))/22050; X23= (sum((yt23-xt23).^2))/22050; X24= (sum((yt24-xt24).^2))/22050; X25= (sum((yt25-xt25).^2))/22050; X26= (sum((yt26-xt26).^2))/22050; X27= (sum((yt27-xt27).^2))/22050; X28= (sum((yt28-xt28).^2))/22050; X29= (sum((yt29-xt29).^2))/22050; X30= (sum((yt30-xt30).^2))/22050; yt31=audioread('FILE GOC GIONG NU.wav',[661501 683550]); yt32=audioread('FILE GOC GIONG NU.wav',[683551 705600] ); yt33=audioread('FILE GOC GIONG NU.wav',[705601 727650] ); yt34=audioread('FILE GOC GIONG NU.wav',[727651 749700] ); yt35=audioread('FILE GOC GIONG NU.wav',[749701 771750] ); yt36=audioread('FILE GOC GIONG NU.wav',[771751 793800] ); yt37=audioread('FILE GOC GIONG NU.wav',[793801 815850] ); yt38=audioread('FILE GOC GIONG NU.wav',[815851 837900] ); yt39=audioread('FILE GOC GIONG NU.wav',[837901 859950] ); yt40=audioread('FILE GOC GIONG NU.wav',[859951 882000] ); xt31=audioread('GIAI NEN AAC THANH WAVE 192kbps.wav',[661501 xt32=audioread('GIAI NEN AAC THANH WAVE 192kbps.wav',[683551 xt33=audioread('GIAI NEN AAC THANH WAVE 192kbps.wav',[705601 xt34=audioread('GIAI NEN AAC THANH WAVE 192kbps.wav',[727651 xt35=audioread('GIAI NEN AAC THANH WAVE 192kbps.wav',[749701 xt36=audioread('GIAI NEN AAC THANH WAVE 192kbps.wav',[771751 xt37=audioread('GIAI NEN AAC THANH WAVE 192kbps.wav',[793801 xt38=audioread('GIAI NEN AAC THANH WAVE 192kbps.wav',[815851 xt39=audioread('GIAI NEN AAC THANH WAVE 192kbps.wav',[837901 xt40=audioread('GIAI NEN AAC THANH WAVE 192kbps.wav',[859951 X31= (sum((yt31-xt31).^2))/22050; X32= (sum((yt32-xt32).^2))/22050; X33= (sum((yt33-xt33).^2))/22050; X34= (sum((yt34-xt34).^2))/22050; X35= (sum((yt35-xt35).^2))/22050; X36= (sum((yt36-xt36).^2))/22050; X37= (sum((yt37-xt37).^2))/22050; X38= (sum((yt38-xt38).^2))/22050; X39= (sum((yt39-xt39).^2))/22050; X40= (sum((yt40-xt40).^2))/22050; C C DU R L T 617400] ); 639450] ); 661500] ); 683550]); 705600] ); 727650] ); 749700] ); 771750] ); 793800] ); 815850] ); 837900] ); 859950] ); 882000] ); C C DU R L T C C DU R L T C C DU R L T C C DU R L T C C DU R L T C C DU R L T C C DU R L T C C DU R L T C C DU R L T C C DU R L T ... NGUYỄN THANH PHONG C C R L T NGHIÊN CỨU KỸ THUẬT MÃ HĨA NÉN TÍN HIỆU DU ÂM THANH ỨNG DỤNG TẠI ĐÀI TIẾNG NÓI VIỆT NAM Chuyển nghành: KỸ THUẬT ĐIỆN TỬ Mã số: 8520203 LUẬN VĂN THẠC SĨ KỸ THUẬT ĐIỆN... thuyết âm mã hóa nén tín hiệu âm thanh, nhằm làm tảng cho nghiên cứu kỹ thuật mã hóa nén âm cụ thể chƣơng Chương trình bày phân tích kỹ thuật mã hóa nén âm cảm quan theo chuẩn MP3 AAC Đây chuẩn nén. .. 66 TIẾNG VIỆT 66 PHỤ LỤC C C DU R L T v NGHIÊN CỨU KỸ THUẬT MÃ HĨA NÉN TÍN HIỆU ÂM THANH ỨNG DỤNG TẠI ĐÀI TIẾNG NÓI VIỆT NAM Học viên: Nguyễn Thanh Phong Mã số:

Ngày đăng: 16/06/2021, 10:22

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w