Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 71 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
71
Dung lượng
772,97 KB
Nội dung
BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC DÂN LẬP KỸ THUẬT CÔNG NGHỆ LUẬN VĂN TỐT NGHIỆP ĐỀ TÀI : ÂM THANH SỐ – CHUẨN MPEG-1 LAYER III PHÂN TÍCH VÀ ỨNG DỤNG GVHD :BÙI TRỌNG TÚ SVTH : LÊ THỊ NGA LÂM THỊ NGỌC GIÀU MSSV : 98 TH 156 98 TH 063 - KHÓA 98 TP HỒ CHÍ MINH 2003 TRƯỜNG ĐẠI HỌC DÂN LẬP KỸ THUẬT CÔNG NGHỆ KHOA CÔNG NGHỆ THÔNG TIN LUẬN VĂN TỐT NGHIỆP ĐỀ TÀI : ÂM THANH SỐ – CHUẨN MPEG-1 LAYER III PHÂN TÍCH VÀ ỨNG DỤNG GVHD :ThS BÙI TRỌNG TÚ SVTH :LÊ THỊ NGA LÂM THỊ NGỌC GIÀU MSSV : 98 TH 156 - KHÓA 98 98 TH 063 - KHÓA 98 TP HỒ CHÍ MINH NĂM 2003 Sau 5 năm học tập và rèn luyện tại khoa Công Nghệ Thông Tin trường Đại Học Dân Lập Kỹ Thuật Công Nghệ , đến nay chúng em đã hoàn thành chương trình học tập và luận văn tốt nghiệp. Chúng em trân trọng cảm ơn : - Ban giám hiệu nhà trường đã quan tâm tạo điều kiện thuận lợi để chúng em học tập và rèn luyện tốt. - Các thầy cô trong khoa Công Nghệ Thông Tin tận tâm giảng dạy, truyền đạt những kiến thức cơ bản về kỹ thuật máy tính là hành trang quý báu để chúng em bước vào đời. - Thầy Bùi Trọng Tú đã hướng dẫn chỉ bảo tận tình giúp chúng em hoàn thành tốt Luận Văn Tốt Nghiệp này. Do trình độ và thời gian có phần hạn chế cũng như sự tiếp thu giáo trình chưa cao nên chắc chắn việc hiện thực chương trình sẽ có thiếu sót, chưa được như ý muốn. Rất mong nhận được sự đóng góp ý kiến của tất cả thầy cô, anh chị và các bạn để tạo điều kiện cho việc thực hiện Luận văn Tốt Nghiệp được tốt hơn. Xin chân thành cám ơn. Lâm Thị Ngọc Giàu Lê Thị Nga Phân tích và ứng dụng chuẩn MP3 Trang 1 MỤC LỤC Mục lục…… 1 Lời mở đầu 5 Các thuật ngữ thường dùng 6 PHẦN 1 : LÝ THUYẾT 7 CHƯƠNG I: CÁC ĐẶC ĐIỂM CƠ BẢN CỦA ÂM THANH 7 I. Các đặc tính cơ bản của âm thanh 7 1. Tần số sóng âm 7 2. Biên độ sóng âm 8 II. Khái quát về âm thanh số 9 1. Lấy mẫu rời rạc thời gian, tín hiệu audio tương tự 9 2. Lượng tử hoá và các mẫu rời rạc thời gian 9 3. Tỉ số tín hiệu trên sai số (Signal-to-error ratio) 10 CHƯƠNG II: GIỚI THIỆU VỀ MPEG 11 I. GIỚI THIỆU 11 1. MPEG là gì? 11 2. So sánh các chuẩn MPEG: 11 3. Âm thanh MPEG 12 4. Hoạt động: 13 II. CÁC KHÁI NIỆM CƠ BẢN VỀ MPEG. 14 1. Lược đồ mã hóa Perceptual Subband. 14 2. Giải thích về hiệu qủa che (masking effect). 14 a. Nén âm thanh MPEG 15 b. Hiệu quả che. 16 3. Các lớp âm thanh MPEG. 17 a. Lớp I (Layer I) 18 b. Lớp II (Layer II) 18 c. Lớp III (Layer III). 19 III. CÁC THÔNG SỐ DÙNG TRONG MPEG 20 1. Mode. 20 2. Sampling Frequency (tốc độ lấy mẫu) 21 3. Bit Rate. 21 CHƯƠNG III: MÃ HÓA THỤ CẢM 23 I. CƠ SỞ ÂM TÂM LÝ 23 1. Ngưỡng nghe tuyệt đối (absolute threshold of hearing) 23 2. Các băng tới hạn(critical bands) 23 3. Hiện tượng che (masking) 24 II. MÃ HÓA BĂNG PHỤ 26 Phân tích và ứng dụng chuẩn MP3 Trang 2 III. MÃ HOÁ BIẾN ĐỔI 26 IV. MÃ HOÁ MP3 ( MP3 ENCODING) . 27 1. Phân tích phép biến đổi Fourier nhanh (FFT analysis) . 27 2. Ngưỡng che(Masking Threshold) . 28 3. Băng lọc phân tích (Analysis Filterbank) . 28 4. MDCT với cửa sổ động . 28 5. Chia tỉ lệ và lượng tử hóa (Scaling và Quantization) 29 6. Mã hóa Huffman và sinh ra dòng bit (Huffman Coding and Bitstream Generation) . 30 7. Thông tin (Side Information) . 32 CHƯƠNG IV: GIẢI MÃ MPEG1 LỚP 3 33 I. GIẢI MÃ MP3 (MP3 DECODING) . 33 1. Định dạng khung (Frame Format) 33 a. Tiêu đề . 34 b. Thông tin (side infomation) 38 c. Dữ liệu chính (main data) 39 d. Dữ liệu phụ (Ancillary Data) 40 2. Giải mã Huffman 40 3. Lượng tử hoá lại (requantization) 41 4. Sắp xếp lại thứ tự ( reordering) . 42 5. Giải mã stereo 42 a.Giải mã Stereo MS . 42 b.Giải mã cường độ stereo 43 6. Giảm biệt danh (Alias Redution) . 43 7. IMDCT 44 8. Khối lọc đa pha tổng hợp ( Synthesis Polyphase Filterbank) 46 II. NHÌN CHUNG VỀ HIỆU QUẢ CÁC GIẢI THUẬT GIẢI MÃ MP3 46 1 . Giải mã Huffman 46 2 . Bộ lượng tử hóa lại (Requantizer) 48 3. Phép biến đổi cosin rời rạc cải tiến đảo ngược (IMDCT) 51 4. Băng lọc đa pha ( Polyphase Filterbank) 53 PHẦN 2: XÂY DỰNG PHẦN MỀM 57 CHƯƠNG I:GIAO DIỆN VÀ THUYẾT MINH CHƯƠNG TRÌNH 57 1. Thanh SkinProgress 58 2. Nút Minimize 58 3. Nút Colse 58 4. Timer 58 5. Tổng thời gian 58 6 .Nút Open 58 7 .Nút Play 58 Phân tích và ứng dụng chuẩn MP3 Trang 3 8. Nút Pause 59 9. Nút Stop 59 10. Thanh tiến trình 59 11. Nút Volume 59 CHƯƠNG II : LƯU ĐỒ GIẢI THUẬT VÀ CẤU TRÚC DỮ LIỆU 60 I. SƠ ĐỒ KHỐI 60 II. LƯU ĐỒ GIẢI THUẬT 61 III. CẤU TRÚC DỮ LIỆU 63 1. File Agrs.h 63 a. Lớp MPArgs 63 b. Cấu trúc MPInfo 66 c. Cấu trúc frame 66 2. File Common.h 67 a. Cấu trúc ID3TagStruct 67 b. Cấu trúc gr_info_s 67 c. Cấu trúc bandInfoStruct 68 d. Cấu trúc III_sideinfo 68 3. File Elsound.h 69 a. Cấu trúc esInputMode 69 b. Cấu trúc esOutputMode 69 c. Cấu trúc esPlayerMode 69 d. Cấu trúc esPlayerError 69 4. File Huffman.h 70 IV. ĐỊNH NGHĨA 70 1. Các định nghĩa dùng trong tập tin <Common.h> 70 2. Các định nghĩa dùng trong Player.h 71 3. Các định nghĩa dùng trong Resource.h 71 PHẦN 3 : TỔNG KẾT 72 Tài liệu tham khảo 73 Phân tích và ứng dụng chuẩn MP3 Trang 4 LỜI MỞ ĐẦU Trong thời đại bùng nổ của công nghệ thông tin, việc truyền tải dữ liệu là nhu cầu cần thiết. Đặc biệt là việc gởi dữ liệu theo đường Internet, vì chất lượng đường truyền thấp nên cần phải nén dữ liệu nhỏ gọn để thuận lợi cho việc upload hay download. Đối với lĩnh vực âm nhạc cũng vậy, nhu cầu gởi tặng bài hát cho nhau , nghe nhạc trực tuyến trên mạng rất phổ biến vì vậy việc nén file nhạc vô cùng cần thiết để tiết kiệm đường truyền, thời gian và tiền bạc. Để giải quyết vấn đề này MPEG có rất nhiều chuẩn để nén như MPEG 1, MPEG 2,… dùng để nén file theo nhiều cách khác nhau. Một trong những chuẩn phổ biến là chuẩn MPEG 1, trong khuôn khổ đề tài này chúng em chỉ tìm hiểu về chuẩn MPEG 1 Layer 3 hay còn gọi là mp3 và minh hoạ bằng một chương trình giải mã file mp3, sau đó phát ra loa. Phân tích và ứng dụng chuẩn MP3 Trang 5 CÁC THUẬT NGỮ THƯỜNG DÙNG MDCT Modified Discrete Cosine Transform. IMDCT Inverse Modified Discrete Cosine Transform. Sample rate Tốc độ lấy mẫu. FFT Fast Fourier Transform. DFT Discrete Fourier Transform. Signal-to-noise (S/N) Tỉ số giữa tín hiệu và nhiễu. CRC Cyclic Redundancy Check . ADC Analog to Digital Converter. CODEC CODer/DECoder. CPU Central Processing Unit. DCT Discrete Cosine Transform . DSP Digital Signal Processor. FS Sampling Frequency, e.g. 44100 Hz for CD audio. FIFO First in, first out. FLOP Floating-point operation. FPU Floating point unit. Hardware math acceleration. inside a CPU. ISO International Standards Organisation. MFLOPS Million floating-point operations per second. MPEG Motion Picture Expert Group. Working group within ISO. PCM Pulse Code Modulation. Output from an ADC. Phân tích và ứng dụng chuẩn MP3 Trang 6 PHẦN I : LÝ THUYẾT CHƯƠNG I : CÁC ĐẶC ĐIỂM CƠ BẢN CỦA ÂM THANH Âm thanh được tạo bởi một thực thể dao động. Không có dao động thì không có âm thanh. Thực thể dao động thì được gọi là nguồn âm. Nguồn âm làm cho các phần tử của môi trường bên cạnh nó dao động. Các phần tử này lại làm cho các phần tử kế nó dao động. Bằng cách này các phần tử của môi trường truyền đến tai của người nghe. Khi chúng ta cảm nhận một âm thanh nào đó, các phần tử dao động làm cho màng nhĩ của chúng ta cũng dao động. Các dao động này được tiếp nhận và phân tích bởi bộ não của chúng ta. Âm thanh có thể truyền qua môi trường không khí, nước hoặc các cấu trúc xây dựng… âm thanh truyền đi dưới dạng sóng âm, sự truyền âm thanh thực chất là sự truyền năng lượng từ nơi này đến nơi khác. I. CÁC ĐẶC TÍNH CƠ BẢN CỦA ÂM THANH Bất kỳ âm thanh đơn giản nào chẳng hạn như một nốt nhạc đều có thể hoàn toàn được mô tả bởi 3 đặc tính cảm nhận sau: cao độ (pitch ), cường độ (intensity), âm sắc (timbre). Những đặc tính này lần lượt tương ứng với các đặc tính vật lý sau của âm thanh: tần số (frequency), biên độ (amplitude), sự cấu thành của các hài (harmonic constitution). 1. Tần số sóng âm Âm thanh được truyền đi dưới dạng sóng âm. Khi sóng âm truyền đi sự truyền dao động của các phần tử dao động theo hướng truyền sóng. Sự dịch chuyển của các phần tử của môi trường tạo ra các vùng có mật độ phần tử cao thấp khác nhau. Các vùng có mật độ phần tử cao được gọi là các vùng đậm đặc (compression). Các vùng có mật độ phần tử thấp được gọi là vùng loãng (rarefaction). Các vùng loãng và vùng đậm đặc lan truyền theo hướng truyền của sóng. Các phần tử dao động không lan truyền theo hứơng truyền sóng, chúng dao động xung quanh vị trí cân bằng của chúng. Mỗi một dao động hoàn chỉnh được gọi là chu kỳ dao động (từ điểm bắt đầu của nó, tới một khoảng cách tối đa theo một hứơng, sau đó trở về vị trí ban đầu, tới một khoảng cách theo hướng ngược lại, và cuối cùng là trở về vị trí ban đầu ). Số chu kỳ dao động được thực hiện trong một giây được gọi là tần số dao động, đây cũng chính là tần số của âm thanh. Một trong những khác biệt Phân tích và ứng dụng chuẩn MP3 Trang 7 chính giữa hai âm thanh là sự khác biệt về cao độ, và cũng chính tần số của âm thanh quyết định cao độ của nó . Tần số được tính bằng Hertz (Hz), KiloHertz (kHz,1kHz=1000Hz)…Một người bình thường có thể nghe được các nguồn âm có dải tần số từ 20Hz đến 20kHz. 2. Biên độ sóng âm Biên độ sóng âm chính là khoảng cách dịch chuyển tối đa của các phần tử dao động. Tương quan giữa biên độ sóng âm với các vùng loãng và vùng đậm đặc . Biên độ của sóng âm thể hiện mức độ dao động của các phần tử của môi trường tạo nên sóng âm. Biên độ sóng âm càng lớn thì các phần tử dao động có năng lượng càng lớn và âm thanh sẽ có cường độ càng lớn. Cường độ âm thanh tỉ lệ nghịch với khoảng cách tính từ nguồn âm. Càng xa nguồn âm cường độ âm thanh càng giảm, kết quả là tai ta nghe càng khó . Cường độ âm được biểu diễn bởi mức áp suất âm thanh SPL (Sound Pressure Level). Mức SPL của một nguồn âm nào đó được tính như sau: SPL(dB)= 20 log(P/P 0 ) Trong đó P : áp suất của nguồn âm (N/m 2 ) P 0 : áp suất chuẩn qui chiếu, P o =2* 10 -5 N/m 2 Am thanh SPL(dB) Ngưỡng im lặng 0 Tiếng thì thầm 10 Phòng thu âm 20 Nói bình thường 60 Tiếng la hét 80 Tiếng xe tải 90 Nhạc rock 100 Ngư ỡng cảm nhận 120 Ngưỡng đau 140 Một số mức SPL của vài dạng âm thanh. II. KHÁI QUÁT VỀ ÂM THANH SỐ [...]... V1,L1 V1,L2 V1,L3 V2,L1 V2, L2 & L3 0000 free Free Free free Free 00 01 32 32 32 32 8 0 010 64 48 40 48 16 0 011 96 56 48 56 24 010 0 12 8 64 56 64 32 010 1 16 0 80 64 80 40 011 0 19 2 96 80 96 48 011 1 224 11 2 96 11 2 56 10 00 256 12 8 11 2 12 8 64 10 01 288 16 0 12 8 14 4 80 10 10 320 19 2 16 0 16 0 96 10 11 352 224 19 2 17 6 11 2 11 00 384 256 224 19 2 12 8 11 01 416 320 256 224 14 4 11 10 448 384 320 256 16 0 11 11 bad Bad bad bad Bad... A 11 (3 1- 2 1) Đồng bộ khung( tất cả các bit đều được đặt ở trạng thái 1) B 2 (20 ,19 ) MPEG Audio version ID 00 - MPEG Version 2.5 01 – Bit dự trữ 10 - MPEG Version 2 (ISO/IEC 13 81 8-3 ) 11 - MPEG Version 1 (ISO/IEC 11 17 2-3 ) C 2 (18 ,17 ) Phần mô tả Layer 00 – dự trữ 01 - Layer III 10 - Layer II Trang 31 Phân tích và ứng dụng chuẩn MP3 11 - Layer I D 1 (16 ) E 4 (15 ,12 ) Chỉ số tốc độ bit bits V1,L1 V1,L2 V1,L3... hạn Tần số trung tâm Độ rộng (Hz) Trang 20 Tần số dưới (Hz) Tần số trên (Hz) Phân tích và ứng dụng chuẩn MP3 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 50 15 0 250 350 450 570 700 840 10 00 11 70 13 70 16 00 18 50 215 0 2500 2900 3400 4000 4800 5800 7000 8500 10 500 13 500 18 755 10 0 10 0 10 0 11 0 12 0 14 0 15 0 16 0 19 0 210 240 280 320 380 450 550 700 900 11 00 13 00 18 00 2500 3500 6550 10 0 200... bits MPEG1 MPEG2 MPEG2 .5 00 4 410 0 Hz 22050 Hz 11 025 Hz Trang 32 Phân tích và ứng dụng chuẩn MP3 01 48000 Hz 24000 Hz 12 000 Hz 10 32000 Hz 16 000 Hz 8000 Hz 11 Reserv reserv reserv 1 (9) Bit đệm (padding bit) 0 - khung không sử dụng bit đệm 1 - khung sử dụng bit đệm với 1 khe cắm mở phụ Cách tính chiều dài khung : trước tiên ta hãy phân biệt kích thước khung và chiều dài khung Kích thước khung là số mẫu... nén âm thanh theo chuẩn ISO/IEC Ngày nay, nhóm làm việc MPEG đã phát triển và phát hành các tiêu chuẩn MPEG- 1, MPEG- 2 và MPEG- 4 Chuẩn MPEG- 3 được kết hợp vào MPEG- 2 và không còn tách riêng nữa Nhóm MPEG hiện nay đã phát triển đến chuẩn MPEG- 7 MPEG chỉ là một tên riêng, tên chính thức của nó là : ISO/IEC JTC1 SC29 WG 11 ISO : International Organization for Standardization (Tổ chức chuẩn quốc tế) IEC... International Electro-technical Commission (Hội đồng kỹ thuật điện tử quốc tế ) JTC1 : Joint Technical Committee 1 (Hội đồng kỹ thuật liên hợp 1) SC29 : Sub-committee 29 (Hội đồng phụ 29) Trang 9 Phân tích và ứng dụng chuẩn MP3 WG 11: Work Group 11 (moving picture with audio) (Nhóm làm việc 11 ) 2 So sánh các chuẩn MPEG MPEG -1 định nghĩa một tiêu chuẩn cho việc lưu trữ và phục hồi các hình ảnh động và âm thanh trên... (16 bit CRC follows header) 1 - không kiểm tra V1 - MPEG Version 1 V2 - MPEG Version 2 và Version 2.5 L1 - Layer I L2 - Layer II L3 - Layer III "free" : format tuỳ ý "bad" :giá trị không được phép sử dụng File MPEG có tốc độ bit thay đổi (VBR) Mỗi khung có thể được tạo ra với tốc độ bit khác nhau và được sử dụng trong tất cả các lớp( giải mã lớp 3 cũng dùng phương pháp này) F 2 (11 ,10 ) Chỉ số tần số. .. của MPEG- 7 là chuẩn hoá việc biểu diễn các mô tả về nội dung nghe nhìn Tuy nhiên chuẩn không định nghĩa các công cụ để nhận ra nội dung nghe nhìn thật sự 3 Âm thanh MPEG Trang 10 Phân tích và ứng dụng chuẩn MP3 Về cơ bản, âm thanh MPEG sẽ làm giảm kích thước lưu trữ 1 tâp tin âm thanh đi rất nhiều Một đĩa Audio-CD lưu trữ được khoảng 650 Mbyte dữ liệu âm thanh thô với cách mã hóa 16 bit (bitdepth) và. .. nghe và khả năng thích hợp của nó MPEG hoạt động dựa trên hệ thống nghe của con người, đó là cảm giác về âm mang đặc tính sinh lý và tâm lý Âm thanh CD ghi lại tất cả tần số, kể cả những tần số bị ‘che’ Âm thanh MPEG chỉ ghi lại những tần số mà tai người có thể nghe Trang 11 Phân tích và ứng dụng chuẩn MP3 Như vậy, MPEG sẽ bỏ qua những thông tin không quan trọng Dựa trên nghiên cứu về nhận thức âm thanh. .. điểm của chuẩn MPEG- 1 Ví dụ, MPEG- 2 có thể tạo hình ảnh lớn gấp 4 lần MPEG- 1 với độ nét cao hơn và rõ hơn (720 x 480 và 12 80 x 720) Các đặc tính của MPEG- 2 bao gồm hình ảnh chất lượng cao và âm thanh nổi MPEG- 3 định nghĩa một tiêu chuẩn cho High Difinition Television (HDTV), là thế hệ tiếp theo của công nghệ truyền hình theo định dạng số đầu đủ Tiêu chuẩn này đã không được phát triển hoàn thiện và cuối . việc MPEG đã phát triển và phát hành các tiêu chuẩn MPEG- 1, MPEG- 2 và MPEG- 4. Chuẩn MPEG- 3 được kết hợp vào MPEG- 2 và không còn tách riêng nữa. Nhóm MPEG hiện nay đã phát triển đến chuẩn MPEG- 7 10 CHƯƠNG II: GIỚI THIỆU VỀ MPEG 11 I. GIỚI THIỆU 11 1. MPEG là gì? 11 2. So sánh các chuẩn MPEG: 11 3. Âm thanh MPEG 12 4. Hoạt động: 13 II. CÁC KHÁI NIỆM CƠ BẢN VỀ MPEG. 14 . BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC DÂN LẬP KỸ THUẬT CÔNG NGHỆ LUẬN VĂN TỐT NGHIỆP ĐỀ TÀI : ÂM THANH SỐ – CHUẨN MPEG- 1 LAYER III PHÂN TÍCH VÀ ỨNG DỤNG