Hệ thống thớnh giỏc của con người (HAS : Human Auditory System) xử lý giống như bộ phõn tớch phổ và tỏch riờng phổ của cỏc õm thanh nghe được bằng cỏc bộ lọc thụng giải được gọi là cỏc dải giới hạn tới hạn. Cỏc dải này cú độ rộng 100hz trong dải tần số dưới 500Hz, cũn tần số trờn 500hz thỡ độ rộng của dải tăng tỷ lệ tương ứng với tần số như đó được miờu tả bởi Fletcher (1940) và Sharf (1970). Mụ hỡnh hiện thời được sử dụng được tạo bởi 25 dải con tương ứng với 25 bộ lọc ốc tai của tai người.
Độ nhạy thớnh giỏc HAS giảm ở cỏc tần số thấp và tần số cao. Hỡnh dưới cho thấy ỏp suất õm thanh tối thiểu cho cỏc õm , cũn được gọi là ngưỡng nghe thấy tuyệt đối. Vớ dụ đối với õm cú tần số 1khz ngưỡng nghe thấy 27dB cú nghĩa là với nhiễu dưới 27 dB thỡ khụng thể nghe thấy. Do đú õm 1khz cú thể được lượng tử hoỏ phần õm thanh lớn hơn 27dB.
Hỡnh 3.3 : Ngưỡng che lấp tần số và nghe thấy tuyệt đối
3.2 / Cỏc kỹ thuật nộn số liệu audio.
Tần số Hz 10 50 100 500 1k 5k 10k 20k 0 10 20 30 40 50 60 70 80 90 100 110 Mức áp suất âm thanh (Db)
Ngưỡng nghe thấy được sửa đổi bởi âm thanh chắn
Kết quả chắn từ sóng hình sin 1Khz @ 65Db
Kết quả chắn từ sóng hình sin 1Khz @ 45Db
Cỏc kỹ thuật mó hoỏ nguồn được sử dụng để loại bỏ sự dư thừa của tớn hiệu audio (khi cỏc mẫu sai khỏc nhau khụng đỏng kể), kỹ thuật che lấp cảm nhận õm thanh được sử dụng để loại bỏ nội dung khụng liờn quan (cỏc mẫu õm thanh khụng thể nghe được). Cú hai kỹ thuật nộn chớnh là :
• Mó hoỏ dự đoỏn miền thời gian : kỹ thuật này sử dụng mó hoỏ vi sai để lấy sự khỏc nhau giữa hai mẫu liờn tiếp.
• Mó hoỏ chuyển dạng miền tần số : kỹ thuật này sử dụng cỏc khối của cỏc mẫu audio PCM tuyến tớnh được chuyển từ miền thời gian đến một số dải nhất định trong miền tần số.
3.2.1 / Nộn khụng suy hao
Cỏc phương thức nộn khụng suy hao cho phộp khụi phục từng bit thụng tin số liệu nguyờn thuỷ sau khi giải nộn. Chỳng loại bỏ sự dư thừa thống kờ trong cỏc tớn hiệu audio bởi cỏc cỏc giỏ trị dự đoỏn từ cỏc mẫu trước đú. Tỷ số nộn khoảng 2:1 cú thể đạt được và nú phụ thuộc vào độ phức tạp tớn hiệu audio nguyờn thuỷ.
Nộn khụng suy hao được thực hiện dựa vào kỹ thuật mó hoỏ dự đoỏn miền thời gian đú là :
• Cỏc thuật toỏn vi sai : Cỏc tớn hiệu audio cú chứa cỏc õm thanh lặp đi lặp lại cũng như một số lượng lớn sự dư thừa và cỏc õm thanh khụng thể cảm nhận được. Thụng tin lặp đi lặp lại này được loại bỏ trong quỏ trỡnh mó hoỏ và được tỏi tạo lại ở bộ giải mó. Kĩ thuật DPCM cũng cú thể được sử dụng cho tớn hiệu audio.
• Mó hoỏ entropy: sử dụng phương thức loại bỏ sự dư thừa trong việc thể hiện cỏc hệ số lượng tử hoỏ để cải thiện hiệu quả mó hoỏ. Cỏc hệ số sẽ được mó hoỏ theo tần suất suất hiện, cỏc hệ số cú tần xuất xuất hiện cao sẽ được mó hoỏ với số bit ớt hơn, cỏc hệ số cú tần suất xuất hiện thấp hơn sẽ được mó hoỏ với số bit nhiều hơn.
• Cỏc thụng số quỏ tải khối dữ liệu: thực hiện bằng cỏch nhúm cỏc giỏ trị bit nhị phõn được lấy từ đầu ra của bộ chuyển đổi ADC thành cỏc khối số liệu (trong miền thời gian: cỏc mẫu lõn cận nhau ở đầu ra của bộ ADC, hoặc trong miền tần số: cỏc hệ số tần số lõn cận nhau ở đầu ra của bộ mó hoỏ DCT). Cỏc giỏ trị nhị phõn sau đú sẽ được chia tỷ lệ sao cho giỏ trị lớn nhất luụn nhỏ hơn giỏ trị thang lượng tử đầy đủ. Hệ số này được gọi là số mũ, là gớa trị chung cho tất cả cỏc khối. Tiếp theo đú mỗi giỏ trị cú thể được thể hiện bằng giỏ trị phần định trị và bởi giỏ trị mũ để chỉ thị chớnh xỏc biờn độ của mẫu. Đõy là quỏ trỡnh tỏi lượng tử hoỏ khụng đồng nhất, ở đú kớch cừ bước lượng tử hoỏ được quyết định bởi số bớt được cấp phỏt cho một khối. Việc tớnh toỏn cấp phỏt bit được lấy từ mụ hỡnh cảm nhận õm thanh của người như được trỡnh bày ở hỡnh dưới đõy. Sự giảm tốc độ số liệu cú thể nhận được bởi gửi một giỏ trị mũ trờn một khối số liệu.
Hỡnh 3.4 : Hệ thống mó hoỏ điểm quỏ tải khối số liệu audio. ADC 16 bit Delay Buffer Digital Scaling M ul tip le xe r Scaling
calculation 3 bit exponent
HAS model
Encoded bit stream analoge input
3.2.2 / Nộn cú suy hao.
Kỹ thuật nộn suy cú thể đạt được bởi kết hợp hai hay nhiều kỹ thuật xử lý, tận dụng khả năng khụng cảm nhận được cỏc thành phần phổ cú biờn độ nhỏ giữa cỏc thành phần phổ cú biờn độ lớn. Tỷ lệ nộn của kỹ thuật nộn suy hao cú thể đạt được từ 2:1 đến 20:1 tuỳ thuộc vào độ phức tạp của quỏ trỡnh nộn, giải nộn và cỏc yờu cầu của chất lượng õm thanh.
Cỏc hệ thống nộn suy hao sử dụng kỹ thuật mó hoỏ cảm giỏc . Nguyờn lý cơ bản của nú là loại bỏ sự dư thừa thớnh giỏc trong tớn hiệu audio bởi loại bỏ bất cứ tớn hiệu nào nằm dưới đường cong ngưỡng nghe thấy, điều này giải thớch tại sao người ta gọi cỏc hệ thống nộn số liệu audio cú tổn hao là mất cỏc thành phần õm.
Nộn suy hao sử dụng cỏc kỹ thuật như :
• Hiệu ứng che lấp miền thời gian, miền tần số của cỏc thành phần tớn hiệu. Tỉ lệ signal-mask được sử dụng để xỏc định số bit cho quỏ trỡnh lượng tử hoỏ mỗi băng tớn hiệu.
• Hiệu ứng che lấp nhiễu lượng tử hoỏ cho cỏc õm nghe được bởi việc cấp phỏt đử cỏc bit một cỏch vừa đủ để đảm bảo nhiễu lượng tử hoỏ luụn luụn dưới đường cong ngưỡng nghe thấy. Tại cỏc tần số gần với tớn hiệu cú khả năng nghe được thỡ giỏ trị SNR từ 20dB đến 30dB là cú thể chấp nhận được, nú tương đương với độ phõn tớch từ 4 đến 5 bit
• Mó hoỏ nối (Joint coding): kỹ thuật này tận dụng sự dư thừa trong cỏc hệ thống õm thanh đa kờnh. Với cỏc hệ thống này thỡ một số lượng đỏng kể số liệu õm thanh tương đương tồn tại ở tất cả cỏc kờnh. Do vậy, số liệu cú thể được giảm bởi mó hoỏ một lần giỏ trị tương đương đú và chỉ cho bộ giải mó biết phải lặp lại cho tất cả cỏc kờnh khỏc.