Tổng số dòng bit được truyền đi bao gồm các giá trị âm thanh được lượng tử hoá cũng như các thông tin khác giúp cho bộ dải mã khôi phục lại tín hiệu âm thanh Hệ số nén tín hiệu luôn mâu
Trang 2ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
TRẦN THỊ MINH HUỆ
MÃ HÓA VÀ NÉN TÍN HIỆU ÂM THANH ỨNG DỤNG TRONG PHÁT THANH SỐ
Ngành: Công nghệ Điện tử - Viễn thông
Chuyên ngành: Kỹ thuật Điện tử
Trang 3
MỤC LỤC
LỜI CAM ĐOAN 1
MỤC LỤC 3
DANH MỤC CÁC HÌNH VẼ 8
DANH MỤC CÁC BẢNG 10
DANH MỤC CÁC KÝ HIỆU 11
MỞ ĐẦU 13
CHƯƠNG I: KIẾN THỨC CƠ SỞ 15
1.1- Âm thanh [11][6] 15
1.2.1- Định nghĩa 15
1.1.2- Quá trình truyền lan của âm thanh 15
1.1.3- Các đại lượng vật lý của âm thanh [6],[11] 16
1.1.3.1- Tần số 16
1.1.3.2- Áp suất âm thanh 17
1.1.3.3- Tốc độ dao động âm 18
1.1.3.4- Công suất âm thanh 18
1.1.3.5- Cường độ âm thanh 19
1.1.4- Quá trình cảm thụ của tai người đối với âm thanh 19
1.1.5- Các yếu tố ảnh hưởng đến âm thanh 20
1.1.5.1- Suy giảm năng lượng trên đường truyền lan 20
1.1.5.2- Ảnh hưởng của thời tiết, khí hậu 21
1.1.5.3- Hiện tượng nhiễu xạ 22
1.1.5.4- Hiện tượng phản xạ, khúc xạ 23
1.2- Tín hiệu âm thanh tương tự 25
1.2.1- Định nghĩa 25
1.2.2 Sự chuyển đổi của sóng âm thanh sang tín hiệu điện 26
1.2.3- Các thông số của tín hiệu tương tự 26
1.2.3.1- Biên độ (Amplitute) 26
1.2.3.2- Tần sô (Frequency) 26
1.2.3.3- Pha (Phase) 26
1.2.4-Các hạn chế của tín hiệu tương tự 27
Trang 41.3- Tín hiệu âm thanh số 27
1.3.1- Định nghĩa 27
1.3.2- Chuyển đổi tín hiệu âm thanh tương tự sang số [2], [6] 30
1.3.2.1- Lấy mẫu 30
1.3.2.2- Định lý Nysquist và hiện tượng chồng phổ 33
1.3.2.3- Lượng tử hóa 34
1.3.2.4- Mã hóa 37
CHƯƠNG 2: KỸ THUẬT NÉN ÂM THANH 39
2.1 - Các giải thuật nén âm thanh [6],[12] 39
2.1.1- Giới thiệu 39
2.1.2- Giải thuật nén không mất dữ liệu 39
2.1.2.1- Mã hóa Huffman [12] 39
2.1.2.2- Mã hóa số học 42
2.1.2.3- Giải thuật Lempel-Ziv-Welch (LZW) 43
2.1.3- Giải thuật nén có mất dữ liệu 44
2.1.3.1- Nén âm thanh dùng mô hình tâm lý 44
2.1.3.2- Mã hóa dải con [3], [5],[7] 47
2.1.3.3- Nén âm thanh theo chuẩn MPEG[6],[10],[2] 49
2.2- Các định dạng âm thanh thực tế 55
2.2.1- Các định dạng âm thanh không nén : WAVE, AIFF 55
2.2.2- Các định dạng âm thanh có nén không mất dữ liệu : 55
2.2.2.1- FLAC (Free Lossless Audio Codec) 56
2.2.2.2- ALAC (Apple Lossless Audio Codec) 56
2.2.3- Các định dạng âm thanh có nén mất dữ liệu 56
2.2.3.1- WMA (Windows Media Audio) 56
2.2.3.2- MP3 (MPEG 1- Layer 3) 57
2.2.3.3- AAC (Advanced Audio Coding) 57
2.2.4- Tìm hiểu về các chuẩn âm thanh HD-Audio 60
Chương 3: MÃ HÓA DẢI CON 5 KÊNH SBC(66644), ỨNG DỤNG TRONG THANH SỐ [1],[3],[7],[5],[8] 62
3.1 Giới thiệu 62
3.2- Mã hóa dải con với tổ hợp hệ số phân chia [66644] 62
Trang 53.2.1- Sơ đồ khối bộ SBC(66644) 62
3.2.2 Thiết kế các bộ lọc trong SBC(66644) [1],[3], [5], [7],[8] 65
3.2.2.1-Thiết kế bộ lọc thông thấp (LPF) 67
3.2.2.2- Thiết kế bộ lọc thông dải 1 (BPF1) 68
3.2.2.3- Thiết kế bộ lọc thông dải 2 (BPF2) 71
3.2.2.4- Thiết kế bộ lọc thông dải 3 (BPF3) 72
3.3- So sánh hệ số nén âm thanh dùng tổ hợp [66644] và tổ hợp [8842] [8],[9],[10] 77 3.4- Ứng dụng mã hóa dải con [66644] trong phát thanh số [2],[9],[8] 78
3.4.1- Các hệ thống phát thanh số hiện nay 78
3.4.2 - Hệ thống phát thanh số trong dải cùng kênh IBOC 79
3.4.2.1- Hệ thống phát thanh số AM-IBOC 80
3.4.2.2- Hệ thống phát thanh số FM-IBOC 80
3.4.3- Hệ thống phát thanh số EUREKA-147 81
3.4.4- Ứng dụng của SBC(66644) trong phát thanh số 83
3.4.4.1- Ứng dụng SBC(66644) trong phát thanh số qua Internet 84
3.4.4.2- Ứng dụng SBC(66644) trong hệ thống phát thanh số IBOC 84
3.5- Định hướng phát thanh số vô tuyến ở Việt nam 85
3.6- Kết luận 88
Danh mục tài liệu tham khảo 89
Trang 6DANH MỤC CÁC CHỮ VIẾT TẮT
AIFF Audio Interchange File Format
ALAC Apple Lossless Audio Codec
AM-IBOC Amplitude Modulation in-band on-channel
CCITT Comite Consultatif International Telephonique
DPCM Differential pulse code modulation
FM-IBOC Frequency Modulation- in-band on-channel
HD HR High-definition High Resolution
HD MA High-definition Master Audio
HDMI High-Definition Multimedia Interface
HE-AAC High Efficiency Advanced Audio Coding
IBM International Business Machines
LC-AAC Low Complexity Advanced Audio Coding LD-AAC Low Delay Advanced Audio Coding
MDCT Modify Discrete Cosine Transform
Trang 7MNR Masking NoiseRate
NTSC National Television System Committee
OFDM Orthogonal Frequency Division Multiplexing
QPSK Quadrature Phase Shift Keying
R-DAT Read- Digital Audio Tape
S/PDIF Sony/Philips Digital Interface
SCFSI Scale factor Selection Infomation
SNQR Signal to Quantizing Noise Ratio
SSR.AAC Scalable Sample Rate Advanced Audio Coding
BST- OFDM- ISDB Hệ thống phá thanh số của Nhật Bản
EUREKA- 147 Hệ thống phá thanh số của châu Âu
HIPERLAN Mạng tốc độ cao
SBC(66644) Mã hóa dải con 5 kênh dùng tổ hợp phân chia [6, 6, 6, 4, 4] SBC(8842) Mã hóa dải con 4 kênh dùng tổ hợp phân chia [8, 8, 4, 2] SBC(442) Mã hóa dải con 4 kênh dùng tổ hợp phân chia [4, 4, 2]
Trang 8DANH MỤC CÁC HÌNH VẼ
Hình 1.1: Dạng truyền lan của sóng dọc - sóng ngang 15
Hình 1.2: Dạng sóng ở trường gần và trường xa của một nguồn âm 16
Hình 1.3: Biểu diễn mối tương quan toán học giữa các đại lượng của sóng âm 17
Hình 1.4: Mối liên hệ giữa các đại lượng của âm thanh 18
Hình 1.5: Đường đẳng thính- đặc tính tai người 19
Hình 1.6: Suy giảm năng lượng theo khoảng cách 21
Hình 1.7: Ảnh hưởng của gió đến sự truyền lan của âm thanh 22
Hình 1.8: Vật cản tạo lên bóng âm và làm biến đổi âm sắc 23
Hình 1.9: Phản xạ âm thanh trên một mặt phẳng và tại một góc phẳng 23
Hình 1.10: Sự phản xạ âm thanh lên các mặt cong lõm 24
Hình 1.11: Tần số, pha, biên độ của tín hiệu âm thanh tương tự 26
Hình 1.12: Mô phỏng tín hiệu số 27
Hình 1.13: Quá trình chuyển đổi tín hiệu tương tự sang tín hiệu số 30
Hình 1.14: Quá trình lấy mẫu và kết quả dãy PAM sau khi điều chế biên độ xung trong miền thời gian và miền tần số 31
Hình 1.15: Khôi pục tín hiệu audio tương tự 32
Hình 1.16: Quá trình lấy mẫu thực tế trong miền thời gian 32
Hình 1.17: Quá trình lấy mẫu thực tế trong miền tần số 33
Hình 1.18: Méo do chồng phổ 34
Hình1.19: Hàm lượng tử với bước lượng tử q=1 35
Hình 1.20: Mức lượng tử và lỗi lượng tử 36
Hình 1.21: Lỗi lượng tử 36
Hình 1.22: Mô tả luật mã hóa 13 đoạn với biên độ dương 38
Hình 2.1: Các bước tạo cây Huffman 41
Hình 2.2: Cây Huffman sau khi tạo 42
Hình 2.3: Thí nghiệm đo ngưỡng nghe của tai người 45
Hình 2.4: Minh họa cho hiệu ứng che 45
Hình 2.5: Minh họa hiệu ứng che khuất tần số - mặt nạ tần số 46
Hình 2.6: Minh họa hiệu ứng che khuất âm yếu - mặt nạ thời gian 46
Hình 2.7: Kết hợp hiệu ứng mặt nạ tần số với mặt nạ thời gian 46
Trang 9Hình 2.8: Phân chia dải tần nghe được thành các băng con và lượng tử hóa các mẫu
trong từng băng với số bit khác nhau 47
Hình 2.9: Sơ đồ mã hóa dải con tổng quát M kênh 47
Hình 2.10: Nguyên lý mã hóa dải con 48
Hình 2.11: Sơ đồ khối bộ mã hóa audio MPEG 50
Hình 2.12: Cấu trúc khung số liệu audio mức I MPEG 52
Hình 2.13: Định dạng dòng số liệu audio mức I, II, III tiêu chuẩn MPEG 53
Hình 2.14: Định dạng dòng bit số liệu audio chuẩn MPEG-2 54
mở rộng của chuẩn MPEG-1 54
Hình 2.15: Các chuẩn nén tín hiệu audio theo tiêu chuẩn MPEG 55
Hình 2.16: Ứng dụng của tiêu chuẩn nén audio AC-3 trong hệ thống 59
phát sóng audio vệ tinh 59
Hình 2.17: Tổng quát hệ thống nén audio theo chuẩn AC-3 60
Hình 3.1: Sơ đồ phương pháp phân tầng lựa chọn tổ hợp phân chia [6, 6, 6, 4, 4] 62
Hình 3.2: Các dải con ứng với tổ hợp phân chia [6, 6, 6, 4, 4] 63
Hình 3.3: Sơ đồ khối bộ mã hóa dải con đa phân giải tuyệt đối 5 kênh dùng tổ hợp phân chia [6, 6, 6, 4, 4] 63
Hình 3.4: Bank lọc lý tưởng và bank lọc thực tế 65
Hình 3.5: Đáp ứng biên độ của bộ lọc thông thấp 67
Hình 3.6: Đặc tuyến biên độ của GdB(F) và G(F) khi α= (11/24)π, N=20 của bộ lọc thông thấp trong SCB(66644) 68
Hình 3.7: Đáp ứng biên độ của bộ lọc thông dải 1 68
Hinh 3.8 Đặc tuyến biên độ của GdB(F) và G(F) khi α= (11/24)π, N=20 của bộ lọc thông dải thứ 1 trong SCB(66644) 70
Hinh 3.9: Đặc tuyến biên độ của GdB(F) và G(F) khi α= (11/24)π, N=20 của bộ lọc thông dải thứ 2 trong SCB(66644) 72
Hinh 3.10: Đặc tuyến biên độ của GdB(F) và G(F) khi α= (11/24)π, N=20 của bộ lọc thông dải thứ 3 trong SCB(66644) 73
Hinh 3.11: Đặc tuyến biên độ của GdB(F) và G(F) khi α= (11/24)π, N=20 của bộ lọc thông cao trong SCB(66644) 75
Hình 3.12: Đặc tuyến biên độ G(F) của 5 bộ lọc trong SBC(66644) khi chọn N=20 và α= (11/24)π 75
Trang 10Hình 3.13: Đặc tuyến biên độ GdB(F) của 5 bộ lọc trong SBC(66644) khi chọn N=20
và α= (11/24)π 76
Hình 3.15: Phổ tần của hệ thống FM-IBOC 81
Hình 3.16: Các sóng mang con ở miền tần số trong OFDM 82
Hình 3.17: Mật độ phổ công suất của tín hiệu DAB chế độ phát I 83
DANH MỤC CÁC BẢNG Bảng 1.1: Bảng giá trị của các mã nhị phân ứng với N=3 37
Bảng 2.1: Thống kê các ký tự với số lần xuất hiện 41
Bảng 2.2: Mã hóa các ký tự bằng phương pháp mã hóa Huffman 42
Bảng 2.3: Các trường hợp xảy ra khi kết hợp các mẫu 43
Bảng 3.1: Hệ số Lbkn, Bblkn1,Bbkn2, Bbkn3, Hbkn khi α= (11/24)π, N=20 của các bộ lọc trong SCB(66644) 76
Bảng 3.2: So sánh lỗi khôi phục khi cùng số bit 77
Bảng 3.3: So sánh số bit trung bình khi cùng lỗi khôi phục 78
Bảng 3.4: Đề xuất ứng dụng SBC(66644) vào phát thanh số 85
Trang 11DANH MỤC CÁC KÝ HIỆU
1 BL Độ rộng dải thông của bộ lọc thông thấp (đơn vị là rad)
2 BB Độ rộng dải thông của bộ lọc thông dải (đơn vị là rad)
3 BH Độ rộng dải thông của bộ lọc thông cao (đơn vị là rad)
4 Btr Độ rộng dải chuyển tiếp của bộ lọc (đơn vị là rad)
5 Lbn Hệ số của bộ lọc thông dải phụ thuộc vào n
6 Hbn Hệ số của bộ lọc thông cao phụ thuộc vào n
7 Lbkn Hệ số của bộ lọc thông thấp đã nhân với cửa sổ kn phụ thuộc vào n
8 Bbkn Hệ số của bộ lọc thông dải đã nhân với cửa sổ kn phụ thuộc vào n
9 Hbkn Hệ số của bộ lọc thông cao đã nhân với cửa sổ kn phụ thuộc vào n
10 f Tần số (đơn vị là Hz)
11 fmax Tần số cực đại của tín hiệu âm thanh (đơn vị là Hz)
12 Fmax Tần số cực đại của tín hiệu âm thanh chuẩn hoá /π (không thứ nguyên)
13 F Tần số chuẩn hoá /π (không có thứ nguyên)
19 cH Tần số cắt của bộ lọc thông cao [rad]
20 cB1 Tần số cắt dưới của bộ lọc thông dải [rad]
21 cB2 Tần số cắt trên của bộ lọc thông dải
22 sL Tần số giới hạn của bộ lọc thông thấp ở mức -20dB [rad]
23 sH Tần số giới hạn của bộ lọc thông cao ở mức -20dB [rad]
24 sB1 Tần số giới hạn dưới của bộ lọc thông dải ở mức -20dB[rad]
25 sB2 Tần số giới hạn trên của bộ lọc thông dải ở mức -20dB [rad]
26 fSv Tần số lấy mẫu của tín hiệu đầu vào
27 fSr Tần số lấy mẫu của tín hiệu đầu ra
28 G Đáp ứng biên độ của bộ lọc
29 GdB Đáp ứng biên độ của bộ lọc tính theo dB
30 GL Đáp ứng biên độ của bộ lọc thông thấp
31 GLdB Đáp ứng biên độ của bộ lọc thông thấp tính theo dB
32 GB Đáp ứng biên độ của bộ lọc thông dải
33 GBdB Đáp ứng biên độ của bộ lọc thông dải tính theo dB
34 GH Đáp ứng biên độ của bộ lọc thông cao
35 GHdB Đáp ứng biên độ của bộ lọc cao tính theo dB
36 N Bậc của bộ lọc
Trang 1237 HL(ejF) Đáp ứng tần số của bộ lọc thông thấp theo thang tần số F
38 HB(ejF) Đáp ứng tần số của bộ lọc thông dải theo thang tần số F
39 HH(ejF) Đáp ứng tần số của bộ lọc thông cao theo thang tần số F
40 TS Chu kỳ lấy mẫu (đơn vị là giây)
41 TSv Chu kỳ lấy mẫu của tín hiệu đầu vào
42 TSr Chu kỳ lấy mẫu của tín hiệu đầu ra
43 bTB Số bít trung bình/mẫu trong mã hoá dải con
44 bTB(66644) Số bít trung bình/mẫu trong mã hoá dải con SBC(66644)
45 bTB(8842) Số bít trung bình/mẫu trong mã hoá dải con SBC(8842)
46 bi Số bít cấp cho dải con thứ i
47 bTBi Số bít trung bình/mẫu cấp cho tín hiệu dải con thứ i
53 ni Hệ số phân chia của dải con thứ i
54 M Số kênh trong bộ mã hóa dải con
55 ε Lỗi khôi phục trong mã hóa dải con
56 εTB Lỗi khôi phục trung bình trong mã hóa dải con
57 ε(66644) Lỗi khôi phục trung bình trong mã hóa dải con SBC(66644)
58 ε(8842) Lỗi khôi phục trung bình trong mã hóa dải con SBC(8842)
59 2
i Phương sai của tín hiệu dải con thứ i
60 p Độ gợn sóng trong dải thông của bộ lọc
61 s Độ gợn sóng trong dải chắn của bộ lọc
62 5 Hệ số so sánh lỗi trong mã hóa dải con 5 kênh
63 x(n) Tín hiệu trong miền thời gian rời rạc chuẩn hóa theo tần số lấy mẫu
64 X(z) Tín hiệu trong miền z
65 X(ej ) Tín hiệu trong miền tần số liên tục
66 NOFDM Số sóng mang trong kỹ thuật OFDM
67 fOFDM Khoảng cách tần số giữa hai sóng mang liền kề trong kỹ thuật OFDM
68 TOFDM Thời gian tồn tại của một sóng mang trong kỹ thuật OFDM
69 BOFDM Độ rộng dải tần của tín hiệu OFDM
70 BAM-IBOC Độ rộng dải tần của tín hiệu âm thanh số trong hệ thống AM-IBOC
71 BFM-IBOC Độ rộng dải tần của tín hiệu âm thanh số trong hệ thống FM-IBOC
72 m Số trạng thái trong điều chế số m-PSK
Trang 13MỞ ĐẦU
Sự phát triển trong ngành điện từ sản xuất các thiết bị âm thanh chuyên dụng và dân dụng đều dựa trên công nghệ số Kỹ thuật xử ký số tín hiệu đã góp phần cho sự phát triển của phát thanh số từ khâu xử lý đến truyền dẫn, lưu trữ Ngày nay các hệ thống đa truyền thông đã sử dụng các hệ thống âm thanh đa kênh Khi dung lượng lưu trữ và độ rộng kênh truyền số liệu được quan tâm đúng mức, tốc độ dòng số liệu của các tín hiệu âm thanh này sẽ có đủ độ lớn để giữ được mức âm thanh trung thực Tuy nhiên, một khó khăn gặp phải đó là thời gian lưu trữ và giá thành của thết bị sẽ tăng cao Do đó để giảm giá thành và tốc độ lưu trữ số liệu, một phương pháp đưa ra là nén dòng số liệu audio số Hiện nay các kỹ thuật nén tín hiệu đang đóng vai trò quan trọng trong lĩnh vực âm thanh số chất lượng cao
Nguyên tắc chính của các kỹ thuật nén hiện nay là giảm thông tin dư thừa và không cần thiết trong các tín hiệu âm thanh Bất kỳ tín hiệu âm thanh nào cũng có một
số thành phần không cần thiết cho việc xác định thông tin Các thành phần thông tin này không quan trọng đối với tai người và không cần cho quá trình xử lý thông tin tại não bộ Việc giảm các thông tin không cần thiết có nghĩa là các thông tin này sẽ không được truyền đi Kết quả là giảm luồng dữ liệu mà việc thu nhận tín hiệu âm thanh sẽ không bị giảm chất lượng Đa số các hệ thống mã hoá tín hiệu âm thanh đều dựa trên nguyên lý âm học chủ quan: độ nhạy của tai thay đổi theo tần số, hiệu ứng mặt nạ Tín hiệu đầu vào được chia theo các dải tần số khác nhau, sau đó chuyển sang miền tần số thành các nhóm có độ dài khác nhau Tổng số dòng bit được truyền đi bao gồm các giá trị âm thanh được lượng tử hoá cũng như các thông tin khác giúp cho bộ dải mã khôi phục lại tín hiệu âm thanh
Hệ số nén tín hiệu luôn mâu thuẫn với chất lượng tín hiệu Hệ số nén càng lớn thì chất lượng tín hiệu càng giảm Mã hoá dải con (SBC) được phát minh năm 1980 có
ưu điểm nổi bật là nén dữ liệu với hệ số rất lớn nhưng vẫn đảm bảo chất lượng tín hiệu cho phép Trong thực tế, tuỳ theo mục đích khác nhau ta phải giải quyết mâu thuẫn giữa tỷ lệ nén dữ liệu và chất lượng âm thanh sao cho vẫn đảm bảo về tiêu chuẩn phát thanh Chính vì vậy, các vấn đề về nén và mã hoá tín hiệu âm thanh trong các thiết bị
xử lý, lưu trữ truyền dẫn là vấn đề đặc biệt được quan tâm đối với ngành truyền thông
nói chung và ngành phát thanh nói riêng Xuất phát từ lý do đó, tôi chọn đề tài “Mã
hóa và nén tín hiệu âm thanh ứng dụng trong phát thanh số” cho luận văn của
Trang 14mình Nội dung tìm hiểu của luận văn gồm 3 chương sẽ lần lượt trình bày các vấn đề sau:
Chương I: Trình bày kiến thức cơ sở về âm thanh từ đặc điểm của sóng âm thanh đến tín hiệu âm thanh tương tự chuyển đổi sang tín hiệu âm thanh số
Chương II: Trình bày về các giải thuật nén âm thanh và các định dạng âm thanh thực tế
Chương III: Trình bày mã hoá – nén tín hiệu âm thanh ứng dụng trong phát thanh số- mã hoá dải con với tổ hợp hệ số phân chia[6, 6, 6, 4, 4] và mô phỏng kết quả
Trang 15CHƯƠNG I: KIẾN THỨC CƠ SỞ 1.1- Âm thanh [11][6]
1.2.1- Định nghĩa
Âm thanh là các dao động cơ học của các phân tử, nguyên tử hay các hạt làm nên vật chất và lan truyền trong vật chất như các sóng Âm thanh, giống như nhiều sóng, được đặc trưng bởi tần số, bước sóng, chu kỳ, biên độ và vận tốc lan truyền (tốc độ âm thanh)
Đối với thính giác của người, âm thanh thường là sự dao động trong dải tần số từ khoảng 20 Hz đến 20 kHz, của các phân tử không khí, và lan truyền trong không khí,
va đập vào màng nhĩ, làm rung màng nhĩ và kích thích bộ não Âm thanh bao gồm các tần số cao hơn hay thấp hơn tần số mà tai người có thể nghe thấy, và không chỉ lan truyền trong không khí, mà trong bất cứ vật liệu nào Trong định nghĩa này, âm thanh
là sóng cơ học và theo lưỡng tính sóng hạt của vật chất, sóng này cũng có thể coi là dòng lan truyền của các hạt phonon, các hạt lượng tử của âm thanh
1.1.2- Quá trình truyền lan của âm thanh
Sóng âm thanh từ một vật thể rung động phát ra, được lan truyền trong không gian, tới tai ta làm rung động màng nhĩ theo đúng nhịp điệu rung động của vật thể đã phát ra âm thanh, nhờ đó mà tai nghe được âm thanh Một môi trường vật chất mà trong đó sóng âm lan truyền được gọi là trường âm
Trong không khí, âm thanh lan truyền ở dạng sóng dọc (hình 1.1), phương dao động trùng với phương chuyển động Với phương thức lan truyền này, các phần tử không khí sẽ tạo thanh những vùng ép (không khí đặc lại) và vùng dãn (không khí loãng ra) thay đổi nhau Vùng ép làm cho thanh áp tăng lên, vùng dãn làm cho thanh
áp giảm đi Trong quá trình lan truyền của âm thanh các phần tử không khí chỉ dao động tại chỗ, nghĩa là sóng âm không vận chuyển vật chất mà chỉ truyền năng lượng Trong không khí cũng như chất khí nói chung và trong chất lỏng âm thanh chỉ truyền lan ở dạng sóng dọc
Hình 1.1: Dạng truyền lan của sóng dọc - sóng ngang
Trang 16Trong chất rắn, ngoài dạng sóng dọc âm thanh còn truyền lan ở dạng sóng ngang (hình 1.1), phương dao động vuông góc với phương chuyển động Trong chất rắn còn tồn tại các dạng sóng đặc biệt như sóng uốn trong các dạng tấm và màng mỏng, sóng xoắn trong các dạng dây và thanh
Trong không khí sóng âm lan truyền từ nguồn ra tất cả các hướng Nếu nguồn
âm có kích thước nhỏ so với bước sóng thì ta có thể coi nó như nguồn âm điểm, và sóng âm sẽ lan tỏa từ một điểm đó ra không gian như những hình cầu lớn dần Dạng sóng âm này được gọi là sóng cầu Càng xa nguồn âm, các mặt cầu càng lớn và vòm cầu càng phẳng dần, tới một giới hạn nào đó có thể coi mặt sóng như một mặt phẳng, được gọi là sóng phẳng (hình 1.2) Sóng cầu càng xa nguồn âm cường độ càng suy giảm Sóng phẳng, cường độ có thể coi như không đổi trên đường lan truyền (trên lý thuyết), còn trong thực tế nó suy giảm rất ít
Hình 1.2: Dạng sóng ở trường gần và trường xa của một nguồn âm
Trong môi trường chân không âm thanh không thể truyền lan được vì không tồn tại các phần tử để truyền năng lượng âm Một số chất truyền âm rất kém, thường là loại mềm, xốp như bông ,cỏ khô, dạ Các chất này gọi là chất hút âm, được dùng lót tường ở các rạp hát, rạp chiếu phim, phòng bá âm để hút âm, giảm tiếng vang
1.1.3- Các đại lƣợng vật lý của âm thanh [6],[11]
1.1.3.1- Tần số
Tần số của một âm đơn là số lần dao động của khí không khí truyền dẫn âm trong một giây Đơn vị đo tần số là Hz – Hertz (1MHz = 1000kHz = 1000000Hz) Tần số biểu thị cao độ của âm thanh: Tiếng trầm có tần số thấp, tiếng bổng có tần số cao Tai người có thể nghe được các tần số thấp từ 16Hz và tần số cao tới
Trang 1720000Hz Dải tần số từ 16Hz đến 20Khz gọi là dải âm tần Những âm có tần số dưới 16Hz được gọi là hạ âm, những âm có tần số trên 20kHz gọi là siêu âm Tiếng nói của con người có tần số trung bình từ 300Hz đến 3400Hz
Ứng với mỗi tần số dao động f có chu kỳ dao động T[s] (chu kỳ dao đông âm thanh là thời gian âm đó dao động được một lần) và một bước sóng λ[m] (hình 1.3)
Hình 1.3: Biểu diễn mối tương quan toán học giữa các đại lượng của sóng âm
f
trong đó C là tốc độ tryền lan của âm thanh trong không khí C = 340m/s Vậy bước sóng của âm thanh là khoảng cách truyền lan của âm thanh tương ứng với một chu kỳ dao động Bước sóng của âm thanh tương ứng trong dải âm tần là từ 21.25m đến 0.017m
Trong thực tế một âm phát ra không phải là một âm đơn, mà là một âm phức
Âm phức bao gồm âm đơn và một số âm hài có tần số gấp 2, 3, 4 lần âm đơn
1.1.3.2- Áp suất âm thanh
Trong môi trường không khí tồn tại một áp suất khí quyển, khi có tác động của
âm thanh thì làm cho áp suất khí quyển sẽ dao động Độ dao động của áp suất của khí quyển khi bị sóng âm thanh tác động được gọi là áp suất âm thanh Áp suất âm thanh hay còn gọi là thanh áp có đơn vị là Pascal [Pa], 1Pa= 1N/m2 Áp suất do âm thanh tạo
ra ở một điểm gọi là thanh áp tại điểm đó Thanh áp tác động lên mọi hướng không gian như nhau Trong trường gần, thanh áp biến đổi theo tỷ lệ nghịch với khoảng cách (
r
p 1) và không phụ thuộc vào tần số
Trong thực tế ta thường biểu thị thanh áp ở dạng mức- mức thanh áp đơn vị là đo
là đêxiben dB Công thức đo mức thanh áp được xác định như sau
Bước sóng λ Chù kỳ T Biên độ
Trang 18Khi có tác động của sóng âm thanh, các phần tử không khí dao động xung quanh
vị trí cân bằng của nó Tốc độ dao động của các phần tử không khí do tác động của âm thanh gọi là tốc độ dao động âm (ký hiệu là v [m/s]) Ở nhiệt độ 20oC và áp suất khí quyển bình thường, âm thanh truyền lan trong không khí với tốc độ 340m/s, còn tốc độ dao động âm thì cực nhỏ phụ thuộc vào cường độ âm thanh Trong dải thanh áp từ 10-9
đến 10-3
átmốtphe thì tốc độ dao động âm tương ứng từ 2,5.10-7 đếm 0.25m/s
Trong trường gần, tốc độ dao động âm phụ thuộc vào tần số, ở tần số thấp nó biến đổi nhanh hơn theo khoảng cách, biến đổi theo tỷ lệ nghịch với bình phương khoảng cách (
2
1
r
v )
Trong trường âm của sóng phẳng (trường xa), thanh áp cũng như hiệu thanh áp
và tốc độ dao động âm đồng pha và tỷ lệ thuận với nhau Với sóng cầu (ở trường gần) thanh áp và tốc độ dao động âm lệch pha với nhau, và càng gần nguồn âm thì độ lệch pha sẽ tiến tới gần 900, hai đại lượng này sẽ không tỷ lệ thuận với nhau
Tỷ số giữa thanh áp và tốc độ dao động gọi là trở kháng âm (hình 1.4)
Hình 1.4: Mối liên hệ giữa các đại lượng của âm thanh
1.1.3.4- Công suất âm thanh
Công suất âm thanh là năng lượng âm thanh đi qua đơn vị diện tích S [m2
] trong khoảng thời gian một giây Công suất âm thanh có thể tính bằng công thức
) v: tốc độ dao động âm (m/s) z: trở kháng âm (Ns/m3
) p: Tỷ trọng không khí (kg/m2
)
Trang 19Trong đó p là thanh áp, v là tốc độ dao động của một phần tử không khí tại thời điểm đang xét, S là diện tích mà năng lượng âm thanh đi qua Đơn vị đo công suất âm thanh là W
1.1.3.5- Cường độ âm thanh
Cường độ âm thanh là công suất âm thanh đi qua một đơn vị diện tích 1cm2
đặt vuông góc với phương truyền âm trong một đơn vị thời gian
pv S
P
Trong đó ba đại lượng áp suất âm thanh, công suất âm thanh, cường độ âm thanh
có quan hệ với nhau: P IS pvS Cả ba thông số đều biểu thị độ lớn nhỏ của âm thanh Âm thanh có năng lượng càng lớn thì công suất, cường độ và áp suất của âm thanh càng lớn
1.1.4- Quá trình cảm thụ của tai người đối với âm thanh
Tai người có thể nghe được âm thanh trong dải tần số từ 20Hz ÷ 20.000Hz Người già nghe tiếng thanh kém hơn người trẻ Ta có thể phân biệt được 130 mức thanh áp khác nhau, mỗi mức cách nhau 1dB Tai người nghe nhậy với các tần số trong khoảng 500Hz ÷ 5000Hz
Đường đẳng thính thể hiện đặc tính của tai người
Hình 1.5: Đường đẳng thính- đặc tính tai người
Trang 20Đường cong biểu diễn cảm giác nghe to bằng nhau ở các tần số khác nhau gọi
là đường đẳng thính Cảm giác về độ to của âm thanh được gọi là âm lượng (volume), đơn vị đo âm lượng được gọi là phon (phon là đơn vị đo độ to nhỏ của âm thanh thông qua độ nhạy chủ quan của tai người) Hình 1.5 biểu diễn đường đẳng thính ở các mức
âm lượng khác nhau đối với những sóng âm đến tai ta từ phía trước mặt Từ hình 1.5 ta thấy
Ở tần số 1000Hz âm lượng và mức thanh áp là như nhau Còn ở các tần số khác thì mức âm luôn luôn khác âm lượng
Tai có độ nhạy cao nhất trong vùng tần số từ 2000Hz đến 5000Hz, ở tần số thấp và cao tai ta kém nhạy hơn (vì tai người thường xuyên nghe âm thanh trong dải tần đó-tiếng nói)
Âm lượng nhỏ nhất mà tai ta còn nghe thấy (0 phon) gọi là ngưỡng nghe,
âm lượng lớn nhất mà tai ta cảm thấy nhức tai (khoảng 130 phon) gọi là ngưỡng đau tai
Khi nghe với âm lượng càng nhỏ thì tai ta càng cảm thấy thiếu trầm và thiếu thanh, vì vậy muốn đánh giá độ trung thực của nguồn âm thanh thì cần nghe với âm lượng đủ lớn
Tai người có thể phân biệt được các âm sắc khác nhau Âm sắc là sắc thái riêng của âm thanh, giúp ta phân biệt được các loại nguồn âm khác nhau Hai âm phức có
âm cơ bản giống nhau về tần số và biên độ, nhưng hài âm có tần số và biên độ khác nhau nên có âm sắc khác nhau
Tai người có khả năng ưu tiên nghe rõ các tiếng mà mình nghe quen (tiếng thanh nghe rõ hơn tiếng trầm) Nhờ có hai tai mà ta có thể xác định được hướng mà
âm thanh truyền tới Vì vậy ta có thể nghe được âm thanh lập thể Ngoài ra thính giác còn có quán tính, nghĩa là tai người không phản ứng với quá trình tức thời của âm thanh Sự cảm thụ bằng tai là kết quả tác động bình quân của năng lượng âm trong một khoảng thời gian xác định
1.1.5- Các yếu tố ảnh hưởng đến âm thanh
1.1.5.1- Suy giảm năng lượng trên đường truyền lan
Khi các nguồn âm có kích thước nhỏ hơn nhiều so với bước sóng thì đều có thể coi là những nguồn âm điểm Nguồn âm điểm đều phát ra sóng có dạng hình cầu - sóng cầu (sóng âm bức xạ đều ra các hướng) năng lượng âm thanh phân bố đều đặn trên mặt cầu Diện tích mặt cầu tăng theo tỷ lệ bình phương với bán kính F r2
, nghĩa
là năng lượng âm sẽ giảm theo tỷ lệ bình phương của khoảng cách tới nguồn âm , điều
đó có nghĩa là suy giảm rất nhanh: mỗi khi khoảng cách tăng gấp đôi thì thanh áp giảm
Trang 21đi một nửa hoặc mức thanh áp giảm đi 6dB (hình 1.6) Như vậy ở trường gần năng
lượng (hay mức âm) suy giảm rất nhanh, ở trường xa năng lượng suy giảm chậm hơn
Hình 1.6: Suy giảm năng lượng theo khoảng cách 1: nguồn âm điểm, 2: nguồn âm tuyến, 3: nguồn âm diện
Khi có nhiều nguồn âm điểm nối tiếp nhau thành một tuyến đường sẽ tạo thành
nguồn âm tuyến , thí dụ một tuyến đường ô tô có xe chạy liên tục, một tuyến đường sắt
với một đoàn tàu hỏa, và sóng âm của của những nguồn âm dạng tuyến sẽ tạo thành
những hình ống trụ bức xạ vào không trung, sự suy giảm năng lượng của dạng nguồn
âm này nhỏ hơn: khi khoảng cách tăng gấp đôi thì nó chỉ giảm 3dB
Các nguồn âm dạng như một mặt phẳng thì gọi là nguồn âm diện Trong trường
gần của các nguồn âm diện có mặt bức xạ mức âm hầu như không suy giảm theo
khoảng cách, vì ở đây sóng âm có dạng như sóng phẳng Ở vị trí xa nguồn âm diện
(với khoảng cách R>> kích thước nguồn âm d) thì mức âm suy giảm dần
Trong thực tế độ suy giảm trong trường gần khoảng 4dB mỗi khi khoảng cách
tăng gấp đôi Các nguồn âm trong tự nhiên có kích thước nhất định do vậy sự suy
giảm năng lượng lại phụ thuộc vào tần số Ví dụ các nhạc khí ở dải tần cao có thể coi
là nguồn âm diện, trong khi ở dải tần thấp lại được coi như nguồn âm điểm Nghĩa là
tần số thấp suy giảm theo khoảng cách với tốc độ nhanh hơn, tần số cao suy giảm với
tốc độ chậm hơn
1.1.5.2- Ảnh hưởng của thời tiết, khí hậu
Trên đường lan truyền ngoài sự suy giảm năng lượng do phải phân bố năng
lượng theo không gian mở rộng, âm thanh còn bị mất năng lượng bởi môi trường
không khí, tần số càng cao độ suy giảm càng lớn Nhiệt độ và độ ẩm cũng ảnh hưởng
dB Mức suy giảm
1
Trang 22tới sự truyền tải năng lượng âm độ ẩm và nhiệt độ tăng thì sự suy giảm năng lượng lại bớt đi Trong thực tế, những ảnh hưởng của độ ẩm và nhiệt độ gần như không đáng kể
vì quá nhỏ
Ở ngoài trời âm thanh còn bị ảnh hưởng của tốc độ gió khá rõ rệt Tốc độ gió ở gần mặt đất thấp hơn trên cao, vì vậy xuôi theo chiều gió thì âm thanh bị uốn xuống đất, nghĩa là mức âm thanh mạnh lên, khi ngược chiều gió thì âm thanh bị uốn lên trời, nghĩa là mức âm thanh giảm đi, tạo lên vùng giới hạn mà ở đó mức âm chênh lệch khoảng 30dB ngoài độ suy giảm thông thường theo khoảng cách (hình 1.7)
Hình 1.7: Ảnh hưởng của gió đến sự truyền lan của âm thanh
1.1.5.3- Hiện tƣợng nhiễu xạ
Trên đường lan truyền trực tiếp từ nguồn âm đến người nghe hoặc micrrophone, sóng âm thường gặp các vật cản như bức tường, bàn ghế hay người che khuất Như vậy tương tự như ánh sáng, sẽ tạo nên những bóng âm ( hình 1.8), nhưng không phân định rõ ràng, sắc nét thành những tia thẳng như ánh sáng tạo lên bóng tối Hiện tượng khác biệt đó là do tỷ lệ kích thước của vật chắn so với sóng âm khác với sóng ánh sáng Ánh sáng có bước sóng cực nhỏ, trong khi âm thanh có nhiều bước sóng với kích thước khác nhau từ dải tần số thấp đế dải tần số cao, khác nhau hàng trăm, hàng nghìn lần
Bóng âm được hình thành khi các thành phần âm thanh có bước sóng nhỏ hơn kích thước của vật chắn, d Các thành phần âm thanh có bước sóng lớn hơn kích thước của vật chắn, dcó thể uốn vòng qua vật chắn, ta gọi là hiện tượng nhiễu xạ của sóng âm Như vậy phía sau một vật cản âm sắc bị biến đổi, vì chỉ nghe được thành phần tần số thấp, tần số cao bị mất, vật cản càng lớn thì âm sắc bị biến đổi càng nhiều,
âm thanh nghe càng tối (hình 1.8)
Hướng gió
Vùng mức âm suy giảm nhiều
Vùng mức âm tăng Lên theo chiều gió
Trang 23Hình 1.8: Vật cản tạo lên bóng âm và làm biến đổi âm sắc
Trong các phòng hòa nhạc hay nhà hát, âm thanh từ sân khấu đến người nghe ở cuối phòng còn bị suy giảm năng lượng do sự hấp thụ của khán giả ngồi trước Những tần số cao bị hấp thụ nhiều hơn, nên ở các dãy cuối phòng âm thanh có thể tối hơn phía trước Bằng giải pháp xử lý trần để lái các phản âm tới các hàng ghế cuối phòng sẽ làm cho âm sắc ít biến đổi
1.1.5.4- Hiện tƣợng phản xạ, khúc xạ
Trên đường lan truyền của sóng âm, khi gặp các vật cản, một phần năng lượng
bị hấp thụ vào vật cản (một phần bị tiêu hao, một phần truyền qua môi trường của vật liêu - hiện tượng khúc xạ âm thanh), một phần phản xạ trở lại môi trường truyền âm Trong một không gian khép kín sóng âm sẽ phản xạ nhiều lần và tạo thành trường âm phản xạ
Kích thước và hình dạng của các mặt phản xạ sẽ tạo lên các kiểu phản xạ khác nhau: Nếu kích thước của mặt phản xạ lớn hơn bước sóng nhiều lần sẽ tạo lên phản xạ gương phẳng; sóng phản xạ sẽ đi theo một hướng, và tuân theo định luật phản xạ, góc tới bằng góc phản xạ (hình.1.9)
Hình 1.9: Phản xạ âm thanh trên một mặt phẳng và tại một góc phẳng
Góc tới = góc phản xạ Hướng tới = hướng phản xạ
Âm sắc giữ nguyên
Âm sắc biến đổi (thành phần
ở tần số cao bị suy giảm)
Trang 24Nếu kích thước của của mặt phản xạ nhỏ hơn hoặc bằng bước sóng thì âm thanh sẽ phản xạ ra nhiều hướng gọi là tán xạ Các mặt phản xạ cong (gương cầu lõm)
sẽ tạo lên những dạng phản xạ đặc biệt cho âm thanh tùy theo nguồn đặt ở vị trí nào (hình 1.10)
Trên đường lan truyền của sóng âm, khi gặp các vật cản, một phần năng lượng bị hấp thụ vào vật cản (một phần bị tiêu hao, một phần truyền qua môi trường của vật liêu - hiện tượng khúc xạ âm thanh Vậy khi âm thanh truyền sang môi trường có chiết suất khác (hai môi trường khác nhau) khì sóng âm sẽ khúc xạ Do vậy âm thanh trong phòng truyền ra ngoài
Hình 1.10: Sự phản xạ âm thanh lên các mặt cong lõm
1.1.5.5- Ảnh hưởng của sóng phản xạ tác động đến quá trình cảm thụ âm thanh
Chỉ khi nào những âm phản xạ đến sau trực âm khoảng 50ms trở lên và có cường độ đủ lớn thì tai ta mới nghe tách biệt được chúng khỏi trực âm, song các phản
âm bậc 1 nằm trong khoảng thời gian nhỏ hơn 50ms vẫn có những ảnh hưởng rất lớn đến âm thanh trong phòng Các phản âm bậc 1 cho biết được không gian bên trong của một phòng về kích thước, hình dạng và cách xử lý bề mặt, hoặc không gian ngoài trời
Ảnh hưởng của phản âm bậc 1 đến quá trình cảm thụ âm thanh
Định hướng sai vị trí nguồn âm
Hướng tới của các sóng phản âm không trùng với hướng tới của sóng trực âm, trong không gian khép kín tai ta thu nhận âm thanh từ nhiều hướng nhưng vẫn định vị nguồn âm theo hướng của sóng trực âm (theo hướng âm thanh đến trước) Nhưng nếu trên đường lan truyền của sóng trực âm nó bị vật cản làm cho mức âm của nó suy giảm
Nếu nguồn âm đặt gần
Nếu các tia tới song song với nhau thì tia phản xạ hội tụ lại một điểm
Nếu nguồn âm đặt đúng tiêu điểm Tia phản xạ
sẽ hội tụ tại tiêu điểm
Trang 25đi rất nhiều (vật cản hấp thụ năng lượng), thấp hơn mức âm của một sóng phản xạ nào
đó trên 10dB, thì sẽ làm cho ta định hướng sai vị trí nguồn âm nghiã là nguồn âm được định hướng theo tia phản xạ bậc 1
Cảm giác về kích thước của phòng
Cảm giác về kích thước của phòng được quyết định chủ yếu bởi các tia phản xạ bậc 1
Độ trễ của sóng phản xạ so với sóng trực âm cho biết được kích thước gian phòng
Độ trễ của sóng phản xạ τ <10ms tương ứng với quãng đường đi của sóng âm khoảng 3m cho ta cảm giác phòng rất nhỏ (phòng ở) làm biến đổi âm sắc của nguồn âm rất rõ khi thu thanh
Độ trễ của sóng phản xạ τ ≈ 10 đến 15ms cho ta cảm giác phòng nhỏ
Độ trễ của sóng phản xạ τ ≈ 25 đến 50ms cho ta cảm giác phòng trong bình
Độ trễ của sóng phản xạ τ ≈ 50 đến 100ms cho ta cảm giác phòng lớn
Khi mức âm của sóng phản xạ bậc 1 tăng thì khả năng cảm thụ về kích thước của phòng càng rõ, đến một giới hạn nào đó – tùy thuộc vào độ trễ- thì những sóng phản
xạ bậc 1 này sẽ gây cản trở cho quá trình cảm thụ về kích thước phòng
Tiếng dội
Những phản âm riêng rẽ với độ trễ τ > 50ms, tương ứng với quãng đường đi của sóng âm trên 17m, và có cường độ đủ mạnh thì tai ta có thể nghe tách rời khỏi trực
âm thành một tiếng dội Tiếng dội có thể chèn ép tiếng nói chính do vậy sẽ lạ giảm độ
rõ của tiếng nói
Khi có một xung âm thanh phát ra giữa hai bức tường song song thì sóng âm sẽ phản xạ nhiều lần, tạo thành một tiếng dội liên tục Khoảng cách giữa hai bức tường thu hẹp thì tiếng dội sẽ tăng tốc độ và năng lượng suy giảm dần giống như hiện tượng tiếng vang
1.2- Tín hiệu âm thanh tương tự
1.2.1- Định nghĩa
Ở dạng gốc, tín hiệu âm thanh là tín hiệu tương tự (analog), tức là tín hiệu có đường biểu diễn tần số và biên độ liên tục Tín hiệu tương tự có thể được xác định tại một thời điểm bất kỳ và có vô số các giá trị tức thời khác nhau Tín hiệu tương tự là tín hiệu biến đổi liên tục về thời gian và trị số
Ba thông số chính của tín hiệu tương tự
– Biên độ (Amplitute)
– Tần sô (Frequency)
– Pha (Phase)
Trang 261.2.2 Sự chuyển đổi của sóng âm thanh sang tín hiệu điện
Để thực hiện chuyển đổi tín hiệu âm thanh (dạng sóng) sang tín hiệu âm thanh dạng điện thì ta sử dụng thiết bị chuyển đổi là Microphone
Nguyên tắc chuyển đổi: sóng âm thanh tác động vào màng dung của microphone Màng dung rung lên làm cho điện trường, từ trường trong microphone biến thiên tạo lên dòng điện xoay chiều, dòng điện đó được gọi là tín hiệu âm thanh tương tự Tuỳ theo mục đích sử dụng (thu tiếng nói , âm nhạc …) mà ta lựa chọn các loại microphone khác nhau Ví dụ: Microphone điện động, microphone điện dung, microphone bột than…Mỗi loại microphone sẽ có đặc tính tần số khác nhau (chất lượng âm thanh khác nhau) cũng như hướng tính, độ nhạy và độ lọc ồn ….khác nhau
1.2.3- Các thông số của tín hiệu tương tự
- Tín hiệu 30Hz nghĩa là nó thay đổi 30 lần trong một giây
Một chu kỳ (cycle): là khoảng thời gian mà tín hiệu đó lại lặp lại
Trang 27• Sự dịch pha xảy ra khi chu kỳ của tín hiệu chưa kết thúc, và một chu kỳ mới của tín hiệu bắt đầu trước khi chu kỳ trước đó chưa hoàn tất
– Tai người không cảm nhận được dịch pha
– Tín hiệu mang dữ liệu bị ảnh hưởng bởi sự dịch pha
• Ví dụ các mối nối không hoàn hảo sẽ gây ra dịch pha
1.2.4-Các hạn chế của tín hiệu tương tự
- Méo phi tuyến trong quá trình ghi âm: nguyên tắc ghi âm dựa trên sự thay đổi của biên độ tín hiệu tỷ lệ với một đại lượng vật lý của vật liệu ghi như: độ lớn của rãnh ghi trên đĩa, từ dư trên băng…Ví dụ trong ghi âm trên băng từ khi mức tín hiệu âm thanh vượt quá mức cho phép thì tín hiệu sẽ rơi vào vùng bão hoà gây ra méo tín hiệu, làm giảm chất lượng âm thanh (tiếng rè nhiều)
- Thời gian trong quá trính sao chép lưu trữ lớn Để sao chép từ băng này sang băng khác hay sang các thiết bị số thì phải mất thời gian đúng bằng thời gian chạy của băng Khả năng định tuyến trên băng khó chính xác hay phải thực hiện rất thủ công
- Tín hiệu trên tạp âm (S/N) bị hạn chế: trong quá trình ghi âm tương tự: ở phía trên độ lớn tín hiệu bị hạn chế bởi méo phi tuyến, ở phía dưới tín hiệu bị hạn chế bởi tạp âm
Do vậy dải động bị nén lại gây ra mất độ trung thực của các nguồn âm thanh trong tự nhiên
1.3- Tín hiệu âm thanh số
1.3.1- Định nghĩa
Tín hiệu âm thanh số là tín hiệu gồm những mẫu được lấy ra từ tín hiệu gốc analog và số hóa theo mã quy định, vì thế nó là những tín hiệu rời rạc, xét về mặt thời gian cũng như giá trị Mỗi mẫu rời rạc được biểu diễn bằng một mã nhị phân
Tín hiệu số bao gồm chỉ hai trạng thái, được diễn tả với hai trạng thái ON và OFF hoặc
là 1 và 0
Hình 1.12: Mô phỏng tín hiệu số
Vào những năm 1980, các thiết bị audio số đã dần dần chiếm lĩnh và thay thế các thiết bị audio tương tự trong phát sóng và sản xuất Với những ưu điểm của tín
Trang 28hiệu audio số như: Độ méo tín hiệu nhỏ (0.01%); Dải động âm thanh lớn (>90dB); đáp tuyến tần số bằng phẳng (±0.5dB); việc tìm kiếm dữ liệu nhanh chóng, dễ dàng; độ bền ổn định lâu dài Kết quả là đã cải thiện chất lượng ghi và xử lý tín hiệu âm thanh, đồng thời nó đáp ứng được nhu cầu lưu trữ và các hệ thống sản xuất chương trình bằng máy tính
Một tiêu chuẩn audio số ra đời với sự liên kết giữa hai hiệp hội kỹ thuật audio AES và hiệp hội truyền thanh truyền hình châu Âu EBU đã xây dựng nền tảng cho sự phát triển các thiết bị ghi âm và các thiết bị tại studio, nơi tín hiệu được xử lý và phân phối hoàn toàn số Ngoài ra, nó hạn chế hiện tượng méo tín hiệu âm thanh trong hai quá trình biến đổi tương tự - số và ngược lại, từ đo chất lượng của tín hiệu âm thanh được nâng cao rõ rệt
Thiết bị audio số này, có dặc điểm tín hiệu vào ra là tương tự, dùng thay thế trực tiếp các thiết bị số và hoạt động môi trường tương tự Tuy nhiên trong kỹ thuật sản xuất và truyền dẫn có xu hướng sẽ tiến tới số hóa toàn phần, đó là toàn bộ quá trình ghi, xử lý và truyền dẫn đều làm việc trong môi trường số Cuối cùng, một giao thức cho toàn bộ quá trình truyền dẫn đã phát triển và thừa nhận trong các thiết bị audio số từ phía phát đến phía thu Có hai lý do chính cho thấy xử lý tín hiệu âm thanh theo công nghệ số là thực sự cần thiết:
- Chất lượng tái tạo của hệ thống audio số không phụ thuộc vào phương tiện
mà chỉ phụ thuộc vào chất lượng của quá trình chuyển đổi A/D và ngược lại
- Việc chuyển đổi audio tương tự sang audio số mở ra rất nhiều cơ hội mà audio tương tự không thể đáp ứng được
Nếu kỹ thuật ghi audio số đảm bảo được chất lượng cho bộ chuyển đổi thì mọi nhược điểm ghi audio tương tự sẽ được khắc phục Hiện nay, các nghiên cứu đều tập trung mở rộng thiết kế của bộ chuyển đổi, trong khi chỉ cần sử dụng linh hoạt những phần của hệ thống xử lý dữ liệu Méo, xuyên âm, tạp âm, tạp âm điều chế, lỗi sẽ chỉ còn là vấn đề của kỹ thuật tương tự Khi một bản ghi số được sao chép, các số như nhau sẽ xuất hiện trên bản coppy Nếu không xảy ra suy giảm thì bản sao chép sẽ không khác với bản gốc Các bản ghi số có thể sử dụng để sao chép nhiều laafnmaf không bị suy giảm chất lượng tín hiệu Xét một vài thông số kỹ thuật đặc trưng ảnh hưởng tới chất lượng tín hiệu:
Tỷ số tín hiệu trên tạp âm (S/N) là tỉ số giữa mức điện áp hữu ích trên mức điện áp tạp âm, đo bằng dB Tạp âm thường sinh ra ngay trong các linh kiện điện
tử, những tạp âm này phân bố suốt dải âm tần từ thấp đến cao
Dải động của kênh truyền dẫn cho biết tỉ lệ giữa mức điện áp ra cực đại và cực tiểu mà không bị ảnh hưởng của tạp âm Giá trị cực đại phụ thuộc vào khả
Trang 29năng điều chế của hệ thống, giá trị cực tiểu phụ thuộc vào tạp âm của toàn kênh Một kênh truyền dẫn có dải động hẹp thì tín hiệu đầu ra bị ép lại
Tín hiệu truyền đi thương bị giới hạn trong một dải tần số, tùy thuộc vào chất lượng của kênh Tín hiệu tần số thấp và thành phần điện áp một chiều cũng như tần số rất cao thường không được truyền tải đầy đủ hoặc bị mất hoàn toàn
Trên một kênh truyền lý tưởng, tín hiệu đầu ra phải biến đổi tuyến tính với tín hiệu đầu vào, nếu không sẽ xuất hiện méo tín hiệu (méo tuyến tính và méo phi tuyến) Méo tuyến tính do đặc tuyến tần số - biên độ của hệ thống không bằng phẳng Méo phi tuyến do đặc tuyến công tác của linh kiện điện tử không được thẳng, tạo ra các thành phần tần số không có trong các tín hiệu gốc
Tín hiệu audio tương tự khi truyền qua một số thiết bị như máy ghi băng từ tính hoặc máy quay đĩa có thể phải chịu sự biến điệu tần số do sự chuyển động cơ học không đồng nhất của băng và đĩa Điều này được xác định bởi thông số méo sai tốc âm tần và phách động (W&F) Trong hệ thống số, W&F phụ thuộc vào sự
ổn định của đồng hồ lấy mẫu rong bộ chuyển đổi A/D, D/A
Một trong những ưu điểm lớn của hệ thống số là giá thành thấp Nếu như quá trình sao chép không có lỗi, các thiết bị ghi không cần thêm chống lỗi Chỉ cần đảm bảo ở lần ghi thứ nhất, ở lần sao chép sau chất lượng ở bản ghi sẽ được duy trì Máy ghi số không cần kích cỡ lớn và lượng băng lớn như máy ghi analog chuyên nghiệp Một vào bit có thể bị lỗi do tạp âm hoặc bị mất trên đường truyền, phần sửa lỗi sẽ khôi phục lại giá trị ban đầu Ghi số chiếm ít không gian hơn ghi analog với chất lượng tương đương hoặc cao hơn
Chuyển mạch xử lý bằng số nhị phân có thể tích phân với mạt độ dày hơn mạch tương tự, cung một chíp có thể có nhiều chức năng do vậy chi phí sản xuất thấp Truy nhập dữ liệu nhanh, có thể quan sát dạng sóng audio trên màn hình,
Hiện nay, các mạng thông tin phát triển có thể tải audio số một cách dễ dàng trên những khoảng cách không xác định mà không gây tổn hao Phát thanh số (DAB) tận dụng những kỹ thuật này để loại bỏ can nhiễu, giảm âm các vấn đề về thu nhiều đường của phát audio tương tự, tận dụng dải thông một cách hiệu quả Vì những yếu
tố trên, chi phí cho thiết bị số rẻ hơn thiết bị tương tự rất nhiều
Tóm lại, để các thiết bị số có thể hòa nhập vào môi trường tương tự, thì các tín hiệu tương tự phải được chuyển sang tín hiệu số và ngược lại Tín hiệu aduio số thực
sự trở lên hấp dẫn khi tín hiệu audio tương tự qua bộ chuyển đổi A/D để tạo thành tín hiệu số có sai lệch không đáng kể, sự phức tạp trong quá trình số hóa được giải quyết
và định dạng số phù hợp cho từng ứng dụng như truyền dẫn và ghi audio
Trang 301.3.2- Chuyển đổi tín hiệu âm thanh tương tự sang số [2], [6]
Trong thực tế các bộ chuyển đổi âm thanh tiêu chuẩn như Microphone và loa phóng thanh đều là các thiết bị tương tự Vì vậy các tín hiệu điện liên tục theo thời gian phải được chuyển đổi thành các định dạng số rời rạc theo thời gian dùng cho xử
lý tín hiệu (DSP) Các bước của quá trình chuyển đổi A/D là
- Lấy mẫu (rời rạc hóa theo thời gian)
- Lượng tử hóa (rời rạc hóa theo biên độ)
- Mã hóa (gán giá trị nhị phân cho các mẫu)
Hình 1.13: Quá trình chuyển đổi tín hiệu tương tự sang tín hiệu số
1.3.2.1- Lấy mẫu a/ Lấy mẫu lý tưởng
Nguyên lý lấy mẫu là qúa trình lấy biên độ của dạng sóng tương tự tại từng thời điểm theo một chu kỳ nhất định Việc lấy mẫu chính xác phụ thuộc vào tần số lấy mẫu Thực chất quá trình lấy mẫu bao gồm việc nhân các tín hiệu tương tự với một chuỗi xung truyền lặp đi lặp lại theo thời gian có tần số là tần số lấy mẫu Để mô tả quá trình này ta xét trường hợp lấy mẫu lý tưởng với khoảng thời gian xung lấy mẫu gần bằng không Quá trình này sẽ tạo ra một dãy xung điều chế biên độ (PAM) và được mô tả trong hình 1.14 tương ứng trong miềm thời gian và tần số
Tín hiệu
Digital
Trang 31Hình 1.14: Quá trình lấy mẫu và kết quả dãy PAM sau khi điều chế biên độ xung trong
miền thời gian và miền tần số
Trong quá trình điều chế biên độ, quá trình khôi phục tín hiệu audio tương tự được thực hiện nhờ bộ lọc thông thấp (hình 1.15)
Nếu fc là tần số cực đại của phổ tín hiệu tương tự và fsa là tần số lây mẫu, dải băng trên và dưới được giới hạn bởi fsa + fc ,fsa – fc Phổ băng tần thấp sẽ bị chồng phổ bởi phổ cơ bản âm thanh
t
Tín lấy mẫu (PAM) Biên độ
Phổ tần số lấy mẫu
fs-fmax
fs 2fs 3fs
Phổ tín hiệu audio lấy mẫu Biên độ
Phổ tín hiệu vào Biên độ
Biên độ
Điều chế biên độ
fs 2fs 3fs
f
f
Trang 32Hình 1.15: Khôi pục tín hiệu audio tương tự
b/ Lấy mẫu tín hiệu thực tế
Quá trình lấy mẫu lý tưởng giả thiết khoảng thời gian xung lấy mẫu gần bằng không Tuy nhiên trong thực tế, trong thời gian cho phép của bộ chuyển đổi A/D, giá trị biên độ xung cho mỗi mẫu sẽ được duy trì đến tận thời gian mẫu tiếp theo được lấy
Vì vậy, tạo ra tín hiệu audio tương tự đã được lấy mẫu có dạng bậc thanh như hình 1.16 Khoảng thời gian tồn tại này đúng bằng chu kỳ lấy mẫu
Hình 1.16: Quá trình lấy mẫu thực tế trong miền thời gian
t
Tín đã lấy mẫu Biên độ
t
Tín lấy mẫu (PAM)
Biên độ
Lọc thông thấp
fs 2fs f
Phổ tín hiệu audio lấy mẫu Biên độ
Tín hiệu audio Biên độ
t
Phổ tín hiệu audio Biên độ
Fmax f
Trang 33
Hình 1.17: Quá trình lấy mẫu thực tế trong miền tần số
c/ Các tần số lấy mẫu chuẩn
Hiện nay trên thế giới có ba tần số lấy mẫu thường sử dụng và được xem là các tần số lấy mẫu chuẩn:
32 kHz (tiêu chuẩn dùng trong truyền dẫn): tín hiệu audio số lấy mẫu theo tiêu chuẩn này được lựa chọn dùng trong phát sóng tại tần số FM
44.1 kHz 9 (tiêu chuẩn cho một số áp dụng của khách hàng): tần số lấy mẫu này được lựa chọn sử dụng trong các hệ NTSC hoặc PAL qua các băng video (VTRs) với điều chế PCM nhằm lưu trữ và phát tín hiệu audio số Sau này, VTRs được sử dụng trong lĩnh vực đĩa CDs, và tần số 44.1 kHz trở thành tần số tiêu chuẩn cho các ứng dụng máy ghi âm số chỉ đọc R-DAT
48 kHz (tạo nguồn, xử lý, trao đổi vật liệu chương trình): tần số này có mối quan hệ với tần số lấy mẫu 32kHz và là tiêu chuẩn thuận tiện cho quá trình chuyển đổi A/D Nó chấp nhận được tín hiệu audio tương tự có độ rộng dải tần trên 22kHz Tần số 48kHz được sử dụng trong các máy chuyên dụng trong studio cho chất lượng cao cả khi ghi và phát
1.3.2.2- Định lý Nysquist và hiện tƣợng chồng phổ
Khi lấy mẫu dưới tần số quy định sẽ vi phạm vào định lý Nysquist, dẫn đến méo do chồng phổ, đó là hiện tượng tần số lấy mẫu thấp hơn hai lần tần số cao nhất của tín hiệu tương tự Vậy để tránh hiện tượng chồng phổ, tín hiệu tương tự phải có giới hạn dải thông thích hợp nhỏ hơn hoặc bằng fsa /2 trước khi được chuyển đổi A/D
Để khôi phục đúng tín hiệu thì: 2f M f sa
- Lựa chọn hợp lý giá trị của fs :
Phổ tần số lấy mẫu
fs-fmax
fs 2fs 3fs
Phổ tín hiệu
đã lấy mẫu Biên độ
Phổ tín hiệu vào Biên độ
Biên độ
Điều chế biên độ
fs 2fs 3fs
f
f
Trang 34fsa phải đủ lớn để biểu diễn đầy đủ tính chất của tín hiệu
fsa quá lớn sẽ yêu cầu cao về phần cứng, tốn bộ nhớ vv…
- Giới hạn trên của fs
Giả sử Tp: thời gian để xử lý mỗi mẫu dữ liệu (tùy thuộc vào phân cứng)
fp= 1/Tp: tốc độ xử lý mỗi mẫu
Để giá trị các mẫu không chồng lên nhau thì: f sa f p
Tóm lại giá trị của fsa: 2f M f sa f p
Khi xảy ra hiện tượng chồng phổ, tín hiệu tương tự khôi phục từ tín hiệu PAM sẽ bị gập phổ tại vị trí có tần số cao hơn fsa /2 khi tái tạo tín hiệu băng cơ bản Các thành phần tần số bị chồng phổ sẽ cho kết quả tín hiệu âm thanh gốc được mô tả như một kiểu âm thanh lẫn tiếng kim khí Hình 1.19 mô tả hiện tượng phổ bị gấp và méo tín hiệu tương tự khi tái tạo
Hình 1.18: Méo do chồng phổ
1.3.2.3- Lƣợng tử hóa
Lượng tử hoá là quá trình xấp xỉ các giá trị của tín hiệu lấy mẫu s(nT) bằng bội số của một giá trị q (q gọi là bước lượng tử) Nếu q không thay đổi thì quá trình lượng tử gọi là đồng nhất Quá trình này thực hiện bằng hàm bậc thang mô tả như hình 1.19: Chồng phổfmax
Lọc thông thấp
Trang 35Hình1.19: Hàm lượng tử với bước lượng tử q=1 Quá trình lượng tử có thể thực hiện bằng cách định nghĩa giá trị trung tâm của hàm lượng tử Ví dụ như trong hình 1.20, các giá trị trong khoảng từ (n – ½)q đến (n +½)q sẽ được làm tròn là n Phương pháp này sẽ cực tiểu hóa công suất của tín hiệu lỗi Một phương pháp khác có thể sử dụng là dùng hàm cắt, nghĩa là các giá trị trong khoảng [nq,(n+1)q] sẽ làm tròn thành n
Như vậy, quá trình lượng tử hóa sẽ làm méo dạng tín hiệu và xem như tồn tại một tín hiệu nhiễu Sự méo dạng này gọi là méo lượng tử hay còn gọi là nhiễu lượng tử
)()
Biên độ của tín hiệu nhiễu lượng tử sẽ nằm trong khoảng (-q/2,q/2) Do sai số lượng tử không biết trước nên việc mô tả sai số lượng tử mang tính thống kê Tổng quát, ta có thể xem e(n) là chuỗi các biến ngẫu nhiên trong đó:
- Thống kê của e(n) không thay đổi theo thời gian (nhiễu lượng tử hóa là quá trình ngẫu nhiên dừng)
- Nhiễu lượng tử e(n) là chuỗi các biến ngẫu nhiên không tương quan
- Nhiễu lượng tử e(n) không tương quan với tín hiệu ngõ vào s(n)
- Hàm mật độ xác suất của e(n) phân bố đều trên tầm các giá trị của sai
số lượng tử
Lỗi lượng tử có giá trị lớn nhất khi biên độ mẫu nằm giữa các bước lượng tử, lúc này bộ lượng tử hóa lấy giá trị nhị phân gần nhất như minh họa trong hình 1.20 Tại chu kỳ T1, giá trị lấy mẫu nằm giữa hai mức lượng tử Trong trường hợp này, lỗi lượng tử là lớn nhất và bộ lượng tử hóa sẽ phát ra giá trị nhị phân bên dưới hay bên trên giá trị giá trị đo
Trang 36Hình 1.20: Mức lượng tử và lỗi lượng tử Lỗi lượng tử phụ thuộc vào nhiều yếu tố, như một lượng nhỏ tạp âm sinh ra trong quá trình xen âm giữa các thành phần tín hiệu dầu vào ngãu nhiên tạo ra, đặc biệt
là khi giá trị lấy mẫu nằm nửa vời giữa hai mức lượng tử Kết quả là các lỗi gây ra có thể thấy rõ khi tạp âm bị lẫn vào tín hiệu gốc làm chất lượng tín hiệu từ khâu sản xuất kém, nhiều khi gây ra hiện tượng chất lượng âm thanh bị chói hay tạp âm
Hình 1.21: Lỗi lượng tử Như vậy, nhiễu lượng tử được phân bố đều trên khoảng (-q/2,q/2) và có phương sai (công suất nhiễu lượng tử) là:
Trang 37Tín hiệu được lấy mẫu và lượng tử hóa bao gồm một tập hợp các số và được lưu trữ ở dạng nhị phân Đối với số nhị phân N bit sẽ có tối đa N
2 giá trị khác nhau ứng với N
2 mức lượng tử khác nhau Như vậy, phạm vi lượng tử sẽ bị giới hạn trong khoảng từ q đến N
2 q, bất kỳ biên độ tín hiệu nào vượt quá giá trị này thì sẽ bị cắt bỏ Giả sử tín hiệu mã hóa có biên độ trong khoảng [-Am,Am]:
2/
2 q
Từ đó, giả sử công suất tín hiệu là 2
s thì tỷ số tín hiệu trên nhiễu lượng tử hóa (SQNR – Signal to Quantizing Noise Ratio) là:
76.102,6log
2079.10)1(02.6log
10[dB]
2
N
A N
s m e
VD một bộ chuyển đổi A/D 16 bit sẽ cho tỉ số SQNR khoảng 96 dB, theo đó một bộ biến đổi A/D 20 bít có giá trị SNQR là 122dB Tuy nhiên mối tương quan này không đúng đối với tín hiệu sin tại mức thấp Như vậy, lỗi lượng tử phụ thuộc vào tín hiệu và nó làm méo tín hiệu đầu vào
Nhận xét
Bộ ADC tăng thêm 1 bit , tỉ số SNR tăng thêm ~ 6 dB
Số bit càng nhiều thì nhiễu lượng tử càng nhỏ
Tỉ số SNR không phụ thuộc vào biên độ tín hiệu
1.3.2.4- Mã hóa
Tín hiệu ở ngõ ra bộ lượng tử hóa được đưa đến bộ mã hóa, bộ mã hóa sẽ gán một số nhị phân cho mỗi mức lượng tử Quá trình này gọi là mã hóa Hầu hết, các hệ thống mã hóa đều sử dụng phương pháp điều xung mã (PCM), điều chế xung rộng (PWM), mã hóa vi sai (DPCM)
Có nhiều phương pháp mã hóa khác nhau nhưng trong đa số hệ thống xử lý tín hiệu số sử dụng phương pháp bù 2 Một ví dụ đối với N = 3 như sau:
Bảng 1.1: Bảng giá trị của các mã nhị phân ứng với N=3
Trang 38Ngoài phương pháp mã hóa tuyến tính như trên (các mức lượng tử có cùng số bit nhị phân bằng nhau), ta còn sử dụng phương pháp mã hóa phi tuyến Phương pháp này sử dụng các bước lượng tử thay đổi theo biên độ tín hiệu Một phương pháp được chuẩn hóa bởi CCITT là luật mã hóa 13 đoạn thường dùng trong mạng viễn thông
Luật mã hóa 13 đoạn (13-segment coding law) thực hiện chuyển đổi biên độ của tín hiệu x thành tín hiệu y như sau:
Hình 1.22: Mô tả luật mã hóa 13 đoạn với biên độ dương
Trang 39CHƯƠNG 2: KỸ THUẬT NÉN ÂM THANH 2.1 - Các giải thuật nén âm thanh [6],[12]
2.1.1- Giới thiệu
Quá trình điều chế PCM đã tạo ra dòng tín hiệu audio số, hiệu audio số được
sử dụng trong các hệ thống đa truyền thông và nhiều ứng dụng khác Ngày nay các hệ thống đa truyền thông đã sử dụng các hệ thống âm thanh đa kênh Khi dung lượng lưu trữ và độ rộng kênh truyền số liệu được quan tâm đúng mức, tốc độ dòng số liệu của các tín hiệu âm thanh này sẽ có đủ độ lớn để giữ được mức âm thanh trung thực Tuy nhiên, một khó khăn gặp phải đó là thời gian lưu trữ và giá thành của thết bị sẽ tăng cao Do đó để giảm giá thành và tốc độ lưu trữ số liệu, một phương pháp đưa ra là nén dòng số liệu audio số
Các hệ thống nén tín hiệu âm thanh dựa trên các đặc tính tâm sinh lý âm thanh cũng như giới hạn về thính giác của của con người nhằm loại bỏ những thành phần thông tin dư thừa trong các tín hiệu audio
Các kỹ tuật mã hóa nguồn được dùng để loại bỏ những thành phần dư thừa trong tín hiệu audio và các kỹ thuật – che mặt lạ tâm sinh lý nghe được sử dụng dùng
để nhận biết và loại bỏ các thành phần không thích hợp Có 2 kỹ thuật nén chủ yếu hiện nay sử dụng:
Mã hóa dự đoán trước trong miền thời gian: Phương pháp này sẽ sử dụng mã hóa khác nhau đối với thành phần khác nhau của các mẫu liên tiếp mà có thể khôi phục được Việc giảm tốc độ dòng bít sẽ được sử dụng để mã hóa và truyền dẫn các thông tin của tín hiệu audio
Mã chuyển đổi trong miền tần số: kỹ thuật này sử dụng các khối của các mẫu audio ra từ bộ PCM đều để truyền từ miền thời gian sang miền tần số những dải băng khác nhau
2.1.2- Giải thuật nén không mất dữ liệu
Nén không mất dữ liệu cho phép khôi phục lại dòng bit những thông tin nguyên thủy sau bộ giải nén mà không gây ra tổn hao Hệ thống này loại bỏ độ dư thừa thống kê những thông tin tồn tại trong tín hiệu audio có thể dự báo trước từ những mẫu trước đó Bộ nén số liệu không tổn hao cho các tỷ số nén thấp, tỷ số tốt nhất đạt được
là 2:1 nó phụ thuộc vào sự phức tạp của tín hiệu audio nguồn
2.1.2.1- Mã hóa Huffman [12]
Mã hóa Huffman là một thuật toán mã hóa dữ liệu ngẫu nhiên được sử dụng
để nén không mất dữ liệu Thuật ngữ này đề cập đến việc sử dụng một bảng mã có chiều dài biến đổi để mã hóa một dữ liệu nguồn (chẳng hạn như các ký tự trong một tập tin) mà bảng mã chiều dài thay đổi đã được bắt nguồn một cách cụ thể dựa trên
Trang 40ước tính xác suất xảy ra cho mỗi giá trị có thể của dữ liệu nguồn Phương pháp mã hóa Huffman
Sử dụng vài bits để biểu diễn một ký tự (gọi là “mã bit”)
Độ dài “mã bit” cho các ký tự không giống nhau:
Ký tự xuất hiện nhiều lần biểu diễn bằng mã ngắn
Ký tự xuất hiện ít lần biểu diễn bằng mã dài
Mã hóa bảng mã có độ dài thay đổi (Variable Length Encoding)
Thuật toán nén
Bước 1: duyệt file lập bảng thống kê số lần xuất hiện của mỗi loại ký tự Bước 2: Phát sinh cây cây Huffman dựa vào bảng thống kê
Bước 3: Tạo cây Huffman phát sinh bảng mã bit cho các ký tự
Bước 4: Duyệt file thay thế các ký tự bảng mã bit tương ứng
Bước 5: Lưu lại thông tin của cây để giải nén
Tạo cây Huffman:
Mô tả cây : Một cây Huffman: mã Huffman được biểu diễn bằng một cây nhị phân
Tính chât cây Huffman:
Nhánh trái tương ứng với mã hoá bit „0‟; nhánh phải tương ứng với mã hoá bit „1‟ Các nút có tần số thấp nằm ở xa gốc mã bit dài
Các nút có tần số lớn nằm ở gần gốc mã bit ngắn
Sô nút của cây: (2n-1)
Thuật toán phát sinh cây:
[b1]: Chọn trong bảng 2 phần tử x,y có trọng số thấp tạo thành nút cha z