Luận văn Phân tích và ứng dụng chuẩn MPEG

69 636 1
Luận văn Phân tích và ứng dụng chuẩn MPEG

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Luận văn Phân tích và ứng dụng chuẩn MPEG Trong thời đại bùng nổ của công nghệ thông tin, việc truyền tải dữ liệu là nhu cầu cần thiết. Đặc...

Phân tích ứng dụng chuẩn MP3 Trang 1 Luận văn Phân tích ứng dụng chuẩn MPEG Phân tích ứng dụng chuẩn MP3 Trang 2 MỤC LỤC Mục lục…… 1 Lời mở đầu 5 Các thuật ngữ thường dùng 6 PHẦN 1 : LÝ THUYẾT 7 CHƯƠNG I: CÁC ĐẶC ĐIỂM CƠ BẢN CỦA ÂM THANH 7 I. Các đặc tính cơ bản của âm thanh 7 1. Tần số sóng âm 7 2. Biên độ sóng âm 8 II. Khái quát về âm thanh số 9 1. Lấy mẫu rời rạc thời gian, tín hiệu audio tương tự 9 2. Lượng tử hoá các mẫu rời rạc thời gian 9 3. Tỉ số tín hiệu trên sai số (Signal-to-error ratio) 10 CHƯƠNG II: GIỚI THIỆU VỀ MPEG 11 I. GIỚI THIỆU 11 1. MPEG là gì? 11 2. So sánh các chuẩn MPEG: 11 3. Âm thanh MPEG 12 4. Hoạt động: 13 II. CÁC KHÁI NIỆM CƠ BẢN VỀ MPEG. 14 1. Lược đồ mã hóa Perceptual Subband. 14 2. Giải thích về hiệu qủa che (masking effect). 14 a. Nén âm thanh MPEG. 15 b. Hiệu quả che. 16 3. Các lớp âm thanh MPEG. 17 a. Lớp I (Layer I) 18 b. Lớp II (Layer II) 18 c. Lớp III (Layer III). 19 III. CÁC THÔNG SỐ DÙNG TRONG MPEG 20 1. Mode. 20 2. Sampling Frequency (tốc độ lấy mẫu). 21 3. Bit Rate. 21 CHƯƠNG III: MÃ HÓA THỤ CẢM 23 I. CƠ SỞ ÂM TÂM LÝ. 23 1. Ngưỡng nghe tuyệt đối (absolute threshold of hearing) . 23 2. Các băng tới hạn(critical bands) . 23 3. Hiện tượng che (masking) . 24 Phân tích ứng dụng chuẩn MP3 Trang 3 II. MÃ HÓA BĂNG PHỤ . 26 III. MÃ HOÁ BIẾN ĐỔI 26 IV. MÃ HOÁ MP3 ( MP3 ENCODING) . 27 1. Phân tích phép biến đổi Fourier nhanh (FFT analysis) . 27 2. Ngưỡng che(Masking Threshold) . 28 3. Băng lọc phân tích (Analysis Filterbank) . 28 4. MDCT với cửa sổ động . 28 5. Chia tỉ lệ lượng tử hóa (Scaling Quantization) . 29 6. Mã hóa Huffman sinh ra dòng bit (Huffman Coding and Bitstream Generation) . 30 7. Thông tin (Side Information) . 32 CHƯƠNG IV: GIẢI MÃ MPEG1 LỚP 3 33 I. GIẢI MÃ MP3 (MP3 DECODING) . 33 1. Định dạng khung (Frame Format) . 33 a. Tiêu đề . 34 b. Thông tin (side infomation). 38 c. Dữ liệu chính (main data) 39 d. Dữ liệu phụ (Ancillary Data) . 40 2. Giải mã Huffman 40 3. Lượng tử hoá lại (requantization) . 41 4. Sắp xếp lại thứ tự ( reordering) . 42 5. Giải mã stereo . 42 a.Giải mã Stereo MS . 42 b.Giải mã cường độ stereo . 43 6. Giảm biệt danh (Alias Redution) . 43 7. IMDCT . 44 8. Khối lọc đa pha tổng hợp ( Synthesis Polyphase Filterbank) . 46 II. NHÌN CHUNG VỀ HIỆU QUẢ CÁC GIẢI THUẬT GIẢI MÃ MP3 . 46 1 . Giải mã Huffman . 46 2 . Bộ lượng tử hóa lại (Requantizer) . 48 3. Phép biến đổi cosin rời rạc cải tiến đảo ngược (IMDCT) 51 4. Băng lọc đa pha ( Polyphase Filterbank) . 53 PHẦN 2: XÂY DỰNG PHẦN MỀM 57 CHƯƠNG I:GIAO DIỆN THUYẾT MINH CHƯƠNG TRÌNH 57 1. Thanh SkinProgress 58 2. Nút Minimize 58 3. Nút Colse 58 4. Timer 58 5. Tổng thời gian 58 6 .Nút Open 58 Phân tích ứng dụng chuẩn MP3 Trang 4 7 .Nút Play 58 8. Nút Pause 59 9. Nút Stop 59 10. Thanh tiến trình 59 11. Nút Volume 59 CHƯƠNG II : LƯU ĐỒ GIẢI THUẬT CẤU TRÚC DỮ LIỆU 60 I. SƠ ĐỒ KHỐI 60 II. LƯU ĐỒ GIẢI THUẬT 61 III. CẤU TRÚC DỮ LIỆU 63 1. File Agrs.h 63 a. Lớp MPArgs 63 b. Cấu trúc MPInfo 66 c. Cấu trúc frame 66 2. File Common.h 67 a. Cấu trúc ID3TagStruct 67 b. Cấu trúc gr_info_s 67 c. Cấu trúc bandInfoStruct 68 d. Cấu trúc III_sideinfo 68 3. File Elsound.h 69 a. Cấu trúc esInputMode 69 b. Cấu trúc esOutputMode 69 c. Cấu trúc esPlayerMode 69 d. Cấu trúc esPlayerError 69 4. File Huffman.h 70 IV. ĐỊNH NGHĨA 70 1. Các định nghĩa dùng trong tập tin <Common.h> 70 2. Các định nghĩa dùng trong Player.h 71 3. Các định nghĩa dùng trong Resource.h 71 PHẦN 3 : TỔNG KẾT 72 Tài liệu tham khảo 73 Phân tích ứng dụng chuẩn MP3 Trang 5 LỜI MỞ ĐẦU Trong thời đại bùng nổ của công nghệ thông tin, việc truyền tải dữ liệu là nhu cầu cần thiết. Đặc biệt là việc gởi dữ liệu theo đường Internet, vì chất lượng đường truyền thấp nên cần phải nén dữ liệu nhỏ gọn để thuận lợi cho việc upload hay download. Đối với lĩnh vực âm nhạc cũng vậy, nhu cầu gởi tặng bài hát cho nhau , nghe nhạc trực tuyến trên mạng rất phổ biến vì vậy việc nén file nhạc vô cùng cần thiết để tiết kiệm đường truyền, thời gian tiền bạc. Để giải quyết vấn đề này MPEG có rất nhiều chuẩn để nén như MPEG 1, MPEG 2,… dùng để nén file theo nhiều cách khác nhau. Một trong những chuẩn phổ biến là chuẩn MPEG 1, trong khuôn khổ đề tài này chúng em chỉ tìm hiểu về chuẩn MPEG 1 Layer 3 hay còn gọi là mp3 minh hoạ bằng một chương trình giải mã file mp3, sau đó phát ra loa. Phân tích ứng dụng chuẩn MP3 Trang 6 CÁC THUẬT NGỮ THƯỜNG DÙNG MDCT Modified Discrete Cosine Transform. IMDCT Inverse Modified Discrete Cosine Transform. Sample rate Tốc độ lấy mẫu. FFT Fast Fourier Transform. DFT Discrete Fourier Transform. Signal-to-noise (S/N) Tỉ số giữa tín hiệu nhiễu. CRC Cyclic Redundancy Check . ADC Analog to Digital Converter. CODEC CODer/DECoder. CPU Central Processing Unit. DCT Discrete Cosine Transform . DSP Digital Signal Processor. FS Sampling Frequency, e.g. 44100 Hz for CD audio. FIFO First in, first out. FLOP Floating-point operation. FPU Floating point unit. Hardware math acceleration. inside a CPU. ISO International Standards Organisation. MFLOPS Million floating-point operations per second. MPEG Motion Picture Expert Group. Working group within ISO. PCM Pulse Code Modulation. Output from an ADC. Phân tích ứng dụng chuẩn MP3 Trang 7 PHẦN I : LÝ THUYẾT CHƯƠNG I : CÁC ĐẶC ĐIỂM CƠ BẢN CỦA ÂM THANH Âm thanh được tạo bởi một thực thể dao động. Không có dao động thì không có âm thanh. Thực thể dao động thì được gọi là nguồn âm. Nguồn âm làm cho các phần tử của môi trường bên cạnh nó dao động. Các phần tử này lại làm cho các phần tử kế nó dao động. Bằng cách này các phần tử của môi trường truyền đến tai của người nghe. Khi chúng ta cảm nhận một âm thanh nào đó, các phần tử dao động làm cho màng nhĩ của chúng ta cũng dao động. Các dao động này được tiếp nhận phân tích bởi bộ não của chúng ta. Âm thanh có thể truyền qua môi trường không khí, nước hoặc các cấu trúc xây dựng… âm thanh truyền đi dưới dạng sóng âm, sự truyền âm thanh thực chất là sự truyền năng lượng từ nơi này đến nơi khác. I. CÁC ĐẶC TÍNH CƠ BẢN CỦA ÂM THANH Bất kỳ âm thanh đơn giản nào chẳng hạn như một nốt nhạc đều có thể hoàn toàn được mô tả bởi 3 đặc tính cảm nhận sau: cao độ (pitch ), cường độ (intensity), âm sắc (timbre). Những đặc tính này lần lượt tương ứng với các đặc tính vật lý sau của âm thanh: tần số (frequency), biên độ (amplitude), sự cấu thành của các hài (harmonic constitution). 1. Tần số sóng âm Âm thanh được truyền đi dưới dạng sóng âm. Khi sóng âm truyền đi sự truyền dao động của các phần tử dao động theo hướng truyền sóng. Sự dịch chuyển của các phần tử của môi trường tạo ra các vùng có mật độ phần tử cao thấp khác nhau. Các vùng có mật độ phần tử cao được gọi là các vùng đậm đặc (compression). Các vùng có mật độ phần tử thấp được gọi là vùng loãng (rarefaction). Các vùng loãng vùng đậm đặc lan truyền theo hướng truyền của sóng. Các phần tử dao động không lan truyền theo hứơng truyền sóng, chúng dao động xung quanh vị trí cân bằng của chúng. Mỗi một dao động hoàn chỉnh được gọi là chu kỳ dao động (từ điểm bắt đầu của nó, tới một khoảng cách tối đa theo một hứơng, sau đó trở về vị trí ban đầu, tới một khoảng cách theo hướng ngược lại, cuối cùng là trở về vị trí ban đầu ). Số chu kỳ dao động được thực hiện trong một giây được gọi là tần số dao động, đây cũng chính là tần số của âm thanh. Một trong những khác biệt Phân tích ứng dụng chuẩn MP3 Trang 8 chính giữa hai âm thanh là sự khác biệt về cao độ, cũng chính tần số của âm thanh quyết định cao độ của nó . Tần số được tính bằng Hertz (Hz), KiloHertz (kHz,1kHz=1000Hz)…Một người bình thường có thể nghe được các nguồn âm có dải tần số từ 20Hz đến 20kHz. 2. Biên độ sóng âm Biên độ sóng âm chính là khoảng cách dịch chuyển tối đa của các phần tử dao động. Tương quan giữa biên độ sóng âm với các vùng loãng vùng đậm đặc . Biên độ của sóng âm thể hiện mức độ dao động của các phần tử của môi trường tạo nên sóng âm. Biên độ sóng âm càng lớn thì các phần tử dao động có năng lượng càng lớn âm thanh sẽ có cường độ càng lớn. Cường độ âm thanh tỉ lệ nghịch với khoảng cách tính từ nguồn âm. Càng xa nguồn âm cường độ âm thanh càng giảm, kết quả là tai ta nghe càng khó . Cường độ âm được biểu diễn bởi mức áp suất âm thanh SPL (Sound Pressure Level). Mức SPL của một nguồn âm nào đó được tính như sau: SPL(dB)= 20 log(P/P 0 ) Trong đó P : áp suất của nguồn âm (N/m 2 ) P 0 : áp suất chuẩn qui chiếu, P o =2* 10 -5 N/m 2 Aâm thanh SPL(dB) Ngưỡng im lặng 0 Tiếng thì thầm 10 Phòng thu âm 20 Nói bình thường 60 Tiếng la hét 80 Tiếng xe tải 90 Nhạc rock 100 Ngưỡng cảm nhậ n 120 Ngưỡng đau 140 Một số mức SPL của vài dạng âm thanh. II. KHÁI QUÁT VỀ ÂM THANH SỐ Phân tích ứng dụng chuẩn MP3 Trang 9 1. Lấy mẫu rời rạc thời gian, tín hiệu Audio tương tự Tín hiệu audio tương tự thay đổi liên tục theo thời gian, nghĩa là biên bộ của tín hiệu thay đổi liên tục theo thời gian. Lấy mẫu tín hiệu audio tương tự là xác định biên độ của tín hiệu ở những thời điểm theo những khoảng thời gian cách điều nhau vì vậy các mẫu là các xung có biên độ nhất định. Khoảng thời gian cách đều này gọi là chu kỳ lấy mẫu T s , tần số lấy mẫu (tốc độ lấy mẫu ) f s = (1 / T s ). 2. Lượng tử hoá các mẫu rời rạc thời gian Lượng tử hoá là biểu diễn biên độ của các xung tín hiệu thành 1 giá trị số sử dụng hệ thống số nhị phân. Người ta dùng một từ ( word) có độ dài n bit để biểu diễn các giá trị đó. Số bits n được chọn tùy thuộc vào giá trị của các mẫu và n được gọi là độ phân giải lượng tử hoá( quantization resolution). Giá trị của 1 word xác định 1 mức luợng tử hoá (quantization level) độ chênh lệch giữa 2 mức liên tiếp gọi là khoảng lượng tử hoá (quantization interval). Ví dụ: ta sử dụng n=8 bit để biểu diễn các giá trị điện thế liên tục từ 0 -> 25,5 V như sau: V1=0 thì word= 0000 0000 ( mức 0) V2=0,1 thì word= 0000 0001 ( mức 1) V3 = 0,2 thì word= 0000 0010 ( mức 2) ……………………………………………………………………. V255= 25,5 thì word =1111 1111 (mức 255) Giả sử ta có V a =0,15 V thì word ở mức 1 (0000 0001 ) hoặc mức 2 (0000 0010) tuỳ thuộc vào sự lựa chọn của chúng ta. Nhưng nếu V a =0.12 thì nó thuộc mức 1 vì gần giá trị ở mức 1 hơn. Các giá trị lượng tử hoá chỉ là xấp xỉ gần bằng giá trị thực tế của các mẫu. Độ sai biệt giữa giá trị lượng tử hoá giá trị thực được gọi là sai số lượng tử hoá ( quantization error). 3. Tỉ số tín hiệu trên sai số (Signal-to-error ratio) Để đánh giá chất lượng của hệ thống lượng tử hóa, một thông số quan trọng được định nghĩa là tỉ số của biên độ tín hiệu cực đại trên sai số lượng tử hóa cực đại, tỉ số này được gọi là tỉ số tỉ hiệu trên sai số (S/E). Phân tích ứng dụng chuẩn MP3 Trang 10 CHƯƠNG II: GIỚI THIỆU VỀ MPEG I. GIỚI THIỆU 1. MPEG là gì? MPEG, viết tắt của cụm từ ‘ Moving Picture Experts Group’, là 1 nhóm chuyên nghiên cứu phát triển các tiêu chuẩn về hình ảnh số nén âm thanh theo chuẩn ISO/IEC. Ngày nay, nhóm làm việc MPEG đã phát triển phát hành các tiêu chuẩn MPEG-1, MPEG-2 MPEG-4. Chuẩn MPEG-3 được kết hợp vào MPEG-2 không còn tách riêng nữa. Nhóm MPEG hiện nay đã phát triển đến chuẩn MPEG-7. MPEG chỉ là một tên riêng, tên chính thức của nó là : ISO/IEC JTC1 SC29 WG11. ISO : International Organization for Standardization (Tổ chức chuẩn quốc tế) IEC : International Electro-technical Commission (Hội đồng kỹ thuật điện tử quốc tế ) JTC1 : Joint Technical Committee 1 (Hội đồng kỹ thuật liên hợp 1) SC29 : Sub-committee 29 (Hội đồng phụ 29) [...].. .Phân tích ứng dụng chuẩn MP3 WG11: Work Group 11 (moving picture with audio) (Nhóm làm việc 11) 2 So sánh các chuẩn MPEG MPEG-1 định nghĩa một tiêu chuẩn cho việc lưu trữ phục hồi các hình ảnh động âm thanh trên các thiết bị lưu trữ Tiêu chuẩn này định nghĩa rằng hình ảnh được phát lại ở tốc độ 30 frames một giây âm thanh được phát lại ở chất lượng như CD-audio, độ phân giải hình... cùng người ta đã nhận ra rằng với một vài điều chỉnh thích hợp, MPEG- 1 MPEG- 2 làm việc rất tốt đối với HDTV MPEG- 4 định nghĩa một tiêu chuẩn cho các ứng dụng Multi-media Đặc biệt nó định nghĩa tiêu chuẩn truyền cho dòng phức tạp các hình ảnh, âm thanh dữ liệu đồ hoạ việc tái hợp chúng trên thiết bị thu MPEG- 4 được phát triển theo 2 giai đoạn, 1 2 Chuẩn MPEG- 4 định nghĩa các đối tượng hình... Fourier nhanh (FFT) băng lọc phân tích 1 Phân tích phép biến đổi Fourier nhanh (FFT analysis) Khối FFT chuyển 576 mẫu đến miền tần số sử dụng phép biến đổi Fourier Trang 25 Phân tích ứng dụng chuẩn MP3 2 Ngưỡng che (Masking Threshold) Thông tin tần số từ khối FFT được sử dụng để liên kết mô hình âm tâm lý để xác định ngưỡng che cho tất cả các tần số Ngưỡng che được áp dụng vào bộ lượng tử hóa... x 240 Chuẩn MPEG- 1 được dùng điển hình trong các phần mềm huấn luyện bằng máy tính, các game hành động trong máy tính, video chất lượng VHS, Karaoke MPEG- 2 định nghĩa cho một tiêu chuẩn kỹ thuật truyền hình số Chuẩn MPEG- 2 khắc phục một vài nhược điểm của chuẩn MPEG- 1 Ví dụ, MPEG- 2 có thể tạo hình ảnh lớn gấp 4 lần MPEG- 1 với độ nét cao hơn rõ hơn (720 x 480 1280 x 720) Các đặc tính của MPEG- 2... hay ứng dụng multimedia Nếu ta phải sử dụng tốc độ bit thấp cho sự truyền có hiệu quả, tốc độ 24 kHz là thích hợp 3 Bit Rate Trang 19 Phân tích ứng dụng chuẩn MP3 Mỗi Layer chế độ có nhiều cách chọn lựa tốc độ bit (bit rate) Việc chọn tốc độ bit tùy thuộc trước tiên vào chất lượng âm yêu cầu Băng thông tín hiệu là hẹp hơn nếu tốc độ bit thấp, khiến cho nó không thực tế đối với một số ứng dụng. .. Trang 28 Phân tích ứng dụng chuẩn MP3 O 2/25 F 3/25 H 1/25 U 1/25 C 1/25 D 1/25 I 1/25 N 2/25 G 1/25 space 3/25 Tiếp tục sắp xếp các symbol theo xác xuất giảm dần 7 Thông tin (Side Information) Thông tin chứa các thông số điều khiển thao tác giải mã như là sự lựa chọn bảng Huffman, chuyển đổi cửa sổ, điều khiển độ lợi (gain control) Trang 29 Phân tích ứng dụng chuẩn MP3 CHƯƠNG IV: GIẢI MÃ MPEG1 ... cần thiết  Sự phân bố nhiễu hay sự phân bố bit : Quá trình phân bố bit trong lớp 1 lớp 2 chỉ xấp xỉ lượng nhiễu gây bởi lượng tử hóa theo số bit cho trước Bộ mã hóa lớp 3 sử dụng một vòng lặp phân bố nhiễu Theo cách này , các bộ lượng tử hóa được thay đổi theo thứ tự , lượng tử hóa có được là do tính toán được phân bố cho mỗi băng phụ III CÁC THÔNG SỐ DÙNG TRONG MPEG Chuẩn MPEG cho phép ta... gồm hình ảnh chất lượng cao âm thanh nổi MPEG- 3 định nghĩa một tiêu chuẩn cho High Difinition Television (HDTV), là thế hệ tiếp theo của công nghệ truyền hình theo định dạng số đầu đủ Tiêu chuẩn này đã không được phát triển hoàn thiện cuối cùng được kết hợp vào với chuẩn MPEG- 2 MPEG- 3 nhắm đến mục tiêu là các ứng dụng HDTV với kích thước mẫu lên đến 1920x1080x30 Hz được mã hoá ở tốc độ bit... điểm : đó là đặc tính phi tuyến của ngưỡng nghe khả năng thích hợp của nó MPEG hoạt động dựa trên hệ thống nghe của con người, đó là cảm giác về âm mang đặc tính sinh lý tâm lý Âm thanh CD ghi lại tất cả tần số, kể cả những tần số bị ‘che’ Âm thanh MPEG chỉ ghi lại những tần số mà tai người có thể nghe Trang 12 Phân tích ứng dụng chuẩn MP3 Như vậy, MPEG sẽ bỏ qua những thông tin không quan trọng... mã hóa thích nghi được minh họa như hình sau: Audio_vào Bộ đệm, Biến đổi Lượng tử hoá thích nghi Trang 24 Mã hoá Entropy Audio ra Phân tích ứng dụng chuẩn MP3 FFT mô hình âm tâm lý Tính toán ngưỡng che Bộ mã hoá biến đổi thích nghi III MÃ HOÁ MP3 ( MP3 ENCODING) Tín hiệu vào bộ mã hóa là bộ điều biến mã xung bình thường (PCM) được phân chia vào khung có 1152 mẫu Khung này được chia làm hai granules, . Phân tích và ứng dụng chuẩn MP3 Trang 1 Luận văn Phân tích và ứng dụng chuẩn MPEG Phân tích. tiêu chuẩn về hình ảnh số và nén âm thanh theo chuẩn ISO/IEC. Ngày nay, nhóm làm việc MPEG đã phát triển và phát hành các tiêu chuẩn MPEG- 1, MPEG- 2 và MPEG- 4.

Ngày đăng: 28/01/2014, 23:53

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan