Tài liệu tham khảo công nghệ thông tin Kỹ thuật mã hóa thụ cảm
Trang 1NỘI DUNG BÁO CÁO
1 Yêu cầu của đề tài.
2 Tìm hiểu về kỹ thuật mã hóa thụ cảm.3 Phân tích MPEG-1 Layer 3 (MP3).4 Giới thiệu chương trình.
5 Kết luận và hướng phát triển
Trang 2PHẦN I: YÊU CẦU CỦA ĐỀ TÀI Các kỹ thuật mã hoá âm thanh
Phân tích quá trình mã hóa mpeg 1 layer 3.
Phân tích quá trình giải mã mpeg 1 layer 3.
Viết chương trình giải mã tập tin MPEG-1 Layer III, phát lại ra loa.
Trang 3PHẦN II : TÌM HIỂU KỸ THUẬT MÃ HÓA THỤ CẢM
1 MÃ HÓA BĂNG PHỤ.
Tín hiệu Audio được cho vào 1 băng lọc gồm Mmạch lọc thông dãi chiếm đầy phổ tần ngheđược.
Mô hình âm tâm lý được sử dụng để tính toánngưỡng che cho mỗi băng phụ.
Lối ra của mỗi mạch lọc được lấy mẫu tới hạn,và được lượng tử hoá và mã hoá một cách riêngbiệt.
Việc lượng tử hoá của mỗi băng phụ được dựatrên tỉ số năng lượng đỉnh trên mức che (độchênh lệch giữa các thành phần các mức SPLcao nhất và ngưỡng che) tính được cho mỗibăng phụ
Tỉ số này được sử dụng bởi bộ phân phối bitđể phân bố số bit cần thiết cho việc lượng tửhoá mỗi băng phụ, các thành phần thấp hơnngưỡng che thì không được mã hoá.
Cuối cùng các mẫu lượng tử hoá được đóngthành các khung dữ liệu, trong khung có kèmtheo các dữ liệu phụ khác.
Trang 42 MÃ HOÁ BIẾN ĐỔI
Các mẫu Audio trong miền thời gian đượcchuyển sang miền tần số nhờ các phép biến đổitoán học.
phép biến đổi như phép biến đổi Fourier rời rạcDFT( Discrete Fourier Transform) hoặc MDCT.
đổi được lượng tử hoá và mã hoá dựa trên môhình âm tâm lý, các thành phần bị che đượcloại bỏ
phép mã hoá hiệu quả hơn.
Trang 5PHẦN III :PHÂN TÍCH MPEG -1 LAYER III1 MODE:
Chuẩn MPEG có 4 chế độ:Mono.
Dual channel.Stereo.
Intensity Stereo (còn gọi là Joint Stereo).2 TỐC ĐỘ LẤY MẪU:
Một số tốc độ lấy mẫu:
(Tiêu chuẩn ISO/IEC 11172-3).3 LỚP III: Lớp này đưa ra mức độ nén và lọc cao hơncả lớp II và sử dụng một bộ mã hóa Huffman.
Trang 6Lớp III là chuẩn hiệu quả nhất và đã trở thànhchuẩn trong thực tế cho việc mã hoá chất lượng âmthanh
Những cải thiện của lớp 3 so với lớp 1 và lớp 2 : Giảm sự chồng phổ.
Lượng tử hóa phi tuyến.
Mã hóa entropy các giá trị dữ liệu Sử dụng bộ dự trữ bit.
4 ĐỊNH DẠNG KHUNG DỮ LIỆU:
Trang 7Frame bao gồm 4 phần : tiêu đề,thông tin ,dữ liệu chính, dữ liệu phụ.
a Tiêu đề (Header): có chiều dài 4 bytes (32 bits) và
chứa thông tin về lớp , tốc độ bit, tần số mẫu và chế độstereo được mô tả cụ thể như sau:
b Thông tin (Side information ) :có chiều dài là 256
bit
Main databegin
SI granules 0SI granules 1
c Dữ liệu chính (Main data) :
Chứa hệ số tỉ lệ và mẫu tần số đã được mã hóa.
Trang 8 Chiều dài phụ thuộc tốc độ bit chứa trong header và dữ liệu phụ.
Ví dụ về việc quản lý dữ liệu chính như sau :
d
Dữ liệu phụ :
Do người dùng định nghĩa, nhưng không cần thiết giải mã
Trang 95 QUÁ TRÌNH MÃ HÓA:
Ví dụ ta có chuỗi cần mã hoá là “HUFFMAN”.
Symbol Xác suấtH 1 / 7U 1 / 7F 2 / 7M1 / 7
A1 / 7N1 / 7
Trang 106 QUÁ TRÌNH GIẢI MÃ:
Giải mã Huffman:
Trang 11 Sự lượng tử hóa lại (Requantization):
Dùng hệ số tỉ lệ để chuyển đổi giá trị mã hóa Huffman thành giá trị quang phổ sử dụng công thức sau:
xri = isi4/3 * 2 ( 0.25 * C )
Sự sắp xếp lại (Reordering):
phải sắp xếp lại băng tỉ lệ dùng cửa sổ ngắn
hiệu quả hơn
Trang 12 Giải mã âm thanh (Stereo) Giảm bớt biệt danh
IMDCT:biến đổi vạch phổ (Xk) thành khối lọc đapha mẫu subband (Si) sử dụng công thức sau :
xi=
Tổng hợp tầng lọc đa pha :
thành 32 mẫu PCM
Trang 14PHẦN IV : GIỚI THIỆU CHƯƠNG TRÌNH
Trang 15
PHẦN V : KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN1 KẾT LUẬN:
được một bài hát.
Thực hiện được các chức năng củachương trình như mở file mp3, giải mã vàphát ra loa, tạm dừng hay ngưng hẳn
Một số hạn chế:
file mp3 liên tục.
pass, treble hay độ cân bằng của volume2 HƯỚNG PHÁT TRIỂN:
Chọn được một danh sách các filemp3 và phát liên tục các file mp3 đó
điều chỉnh được độ cân bằng của volume Lặp lại một bài hát hay các chức năng
khác như trong những chương trình nghenhạc phổ biến hiện nay như: Winamp,