Quá trình chuyển đổi tín hiệu tơng tự sang số bao gồm các bớc sau: • Lọc tín hiệu nhằm mục đích hạn chế băng tần • Lấy mẫu rời rạc hố tín hiệu theo thời gian • Lợng tự hố chuyển đổi g
Trang 1bộ giáo dục và đào tạo trờng đại học bách khoa hà nội
đỗ thị phợng uyên
Hà nội - 2008
Tai ngay!!! Ban co the xoa dong chu nay!!! 17057204961701000000
Trang 2bộ giáo dục và đào tạo
trờng đại học bách khoa hà nội
luận văn thạc sĩ khoa học
công nghệ phát thanh số ứng dụng và triển khai trong tơng lai ở việt nam
Trang 3TÓM TẮT LUẬN VĂN
Luận văn "Công nghệ phát thanh số Ứng dụng và triển khai trong -
tương lai ở Việt Nam" được nghiên cứ tại rường Đại họ Báchu T c Khoa -
Hà N ội Luận văn trình ày tổng quan âm thanh, các công n b về ghệ xử lý âm thanh số, giới thiệu một cách sâu sắc các tiêu chuẩn phát thanh số đã triển khai và thử nghiệm trên thế giới Thông qua các tiêu chí, quan điểm đánh giá đưa ra đề xuất tiêu chuẩn phát thanh số mặt đất trong điều kiện của Việt Nam
Âm thanh số với độ méo tín hiệu nhỏ, dải động âm thanh lớn, đáp tuyến tần số bằng phẳng, tìm kiếm dữ liệu nhanh chóng dễ dàng, ghi âm số nhiều lần mà chất lượng không suy giảm, lưu trữ số và các hệ thống sản xuất chương trình audio dựa trên máy tính tỏ ra rất hiệu quả Được kết hợp với kỹ thuật nén, audio số có nén lại càng có nhiều ưu điểm hơn như tiết kiệm bộ nhớ, tiết kiệm kênh truyền…Hệ thống thông tin chỉ cần truyền tải tín hiệu âm thanh tại đầu vào với độ chính xác vừa đủ để cho phép đầu thu có khả năng tái tạo lại tín hiệu ban đầu
Phát thanh số làm nâng cao chất lượng chương trình, giảm chi phí khai thác, tăng nguồn thu dịch vụ gia tăng; nâng cao hiệu quả sử dụng phổ tần số
vô tuyến điện Do đó chuyển sang phát thanh số là một xu thế tất yếu của thế giới Hiện nay trên thế giới đang tồn tại nhiều nhiều tiêu chuẩn phát thanh số, mỗi tiêu chuẩn có đặc điểm và phạm vi ứng dụng khác nhau như tiêu chuẩn EUREKA147 ở châu Âu, DMB ở Hàn Quốc, ISDB-T ở Nhật Nhiều nước châu Âu, châu Á đang hoàn thành giai đoạn thử nghiệm DAB để có thể đưa phát thanh số vào khai thác trên diện rộng Luận văn cũng xem xét, đánh giá những đặc điểm cơ bản và các ưu nhược điểm của các tiêu chuẩn từ đó đưa ra
đề xuất lựa chọn tiêu chuẩn phát thanh số mặt đất ở Việt Nam
Trang 4THESIS SUMMARY
My thesis is “DAB - Application and deployment in distant future
in Vietnam”, studied at Ha Noi niver ity of Technology The he isU s t s presents an overview about audio and digital audio processing technologies; analyses DAB standards tested and deployed in the world and suggests a DAB standard suitable to Vietnam conditions
The advantages of digital audio can be summed up as follows: little signal deformation, wide audio dynamic range, searching databases easily and quickly, better copyability and storing digitals and program producing system based on the computer efficiently Compressed digital audio can save transmission channel and memory by combining with compressed technology… System only need transmiss audio signals at the input with enough accuracy to receiver to recreate the original signals
DAB improves the quality of programs, reduces operation cost, increases more profits from adding services and improves the efficiency of using frequency range Therefore, changing to using DAB is an indispensable trend in the world Nowadays, there are many DAB standards in the world Features and application scope of each is different such as EUREKA147 in Europe, DMB in Korea, ISDB-T in Japan Many countries in Europe and Asia are trying to complete DAB testing stage in order to deploy DAB on wide scale The thesis also considers and appreciates the basic features, advantages and disadvantages of each DAB standard, from this giving the suggestion to choose a suitable DAB standard in Vietnam
Trang 5MỤC LỤC
Danh mục cỏc ký hiệu và chữ viết tắt 5
Danh mục cỏc hỡnh vẽ và bảng biểu 7
Lời núi đầu 9
1 Tổng quan về phát thanh số 11
1.1 - Âm thanh và đặc tính của âm thanh 11
1.1.1 - Sóng âm 11
1.1.2 - Sự cảm nhận của thính giác 12
1.2 - Số hóa tín hiệu audio 14
1.2.1 - Biến đổi ADC 16
a Lấy mẫu 16
b Lợng tử hóa 18
c Mã hóa 21
d Dither 23
e Dải động 24
f Tần số lấy mẫu chuẩn 24
g Chức năng tiền nhấn 25
1.2.2 - Biến đổi DAC 25
a Hiệu ứng méo độ nở 26
b Lọc thông thấp 27
c Lấy mẫu ở tần số cao 27
d Tạo dạng nhiễu 30
e Hạn chế của ADC/DAC 31
1.3 - Nén audio số 32
1.3.1 - Cơ sở của nén dữ liệu audio 32
1.3.1.1 - Mô hình tâm lý thính giác 33
Trang 61.3.1.2 - Sự che lấp tín hiệu audio 33
1.3.2 - Kỹ thuật giảm dữ liệu audio 36
1.3.2.1 - Giảm dữ liệu không tổn thất 36
1.3.2.2 - Giảm dữ liệu có tổn thất 38
1.3.2.3 - Quá trình mã hóa audio 38
a Filter band 39
b Mô hình cảm thụ, đồ thị mặt nạ và vị trí bit 41
c Bộ tạo thang độ và bộ lợng tử hóa 42
d Ghép kênh dữ liệu 43
1.4 - Tiêu chuẩn mã hóa audio 43
1.4.1 - Tiêu chuẩn nén AC3 43
1.4.2 - Tiêu chuẩn nén ATTRAC 45
1.4.3 - Tiêu chuẩn nén MPEG-1 49
a Layer I 51
b Layer II 52
c Layer III 53
1.4.4 - Hệ thống MPEG 2 cho audio 54
2 Các tiêu chuẩn PTS đã triển khai và đang thử nghiệm trên thế giới 57
2.1 - Tình hình nghiên cứu và phát triển phát thanh số 57
trên thế giới và khu vực Châu á - Thái Bình Dơng
2.2 - Tiêu chuẩn EURKA-147 62
2.2.1 - Các đặc điểm cơ bản 62
2.2.2 - Mã hóa và chèn theo thời gian 63
2.2.3 - Điều chế OFDM và các chế độ truyền dẫn 63
2.2.4 - Thiết lập mạng 64
2.3 - Tiêu chuẩn WORLDSPACE 65
2.4 - Tiêu chuẩn IN-BAND/ON CHANEL- 66
2.5 - Tiêu chuẩn DIGITAL AM 68
2.6 - Tiêu chuẩn BST-OFDM ISDB 72
Trang 72.7 - Tiêu chuẩn DRM 74
2.8 - Tiêu chuẩn DMB 74
3 Nghiên cứu khả năng ứng dụng và triển khai 76
công nghệ phát thanh số mặt đất ở Việt Nam 3.1 - Tình hình phủ sóng phát thanh tại Việt Nam 76
3.2 - Đánh giá và đề xuất lựa chọn tiêu chuẩn phát thanh số 76
cho tiếng nói Việt Nam 3.2.1 - Tiêu chí, quan điểm đánh giá 77
3.2.2 - Đánh giá và đề xuất lựa chọn tiêu chuẩn 78
Kết luận 86
Tài liệu tham khảo 87
Phụ lục 88
Túm tắt luận văn 93
Trang 8Lời nói đầu
Ngành phát thanh của Việt Nam đã phát triển và hình thành một mạng lới các đài phát thanh từ trung ơng tới địa phơng đáp ứng đợc nhiệm vụ chính trị, xã hội, văn hoá Diện tích phủ sóng và chất lợng thu về cơ bản đã
đáp ứng đợc yêu cầu thực tế Tuy nhiên với công nghệ phát thanh analog việc phát triển ngành để đáp ứng kịp nhu cầu phát triển của xã hội sẽ gặp một vài khó khăn trở ngại nh: Chi phí cho việc mở rộng vùng phủ sóng (tăng từ 87% hiện nay lên 100%) sẽ rất tốn kém, mở thêm chơng trình cần đầu t thêm mạng phát sóng, truyền dẫn tín hiệu, kinh phí đầu t lớn Trong khi nhu cầu cần tăng thêm chơng trình là rất cần thiết Chi phí khai thác mạng phát sóng rất cao, chủ yếu do điện năng tiêu thụ Chất lợng thu bị han chế do hiện tợng pha đinh, nhiễu đa đờng
Công nghệ phát thanh số và việc triển khai phát thanh số thay cho phát thanh tơng tự đã đợc áp dụng ở nhiều nơi trên thế giới từ cách đây hơn 10 năm Tuy vây, đối với nớc ta để đa ra kiến nghị lựa chọn bộ tiêu chuẩn phát thanh số và lộ trình phát triển phát thanh số cho Tiếng nói Việt Nam, cần tiến hành nghiên cứu nắm vững các tiêu chuẩn phát thanh số hiện tại kết hợp xem xét nhiều yếu tố ảnh hởng khác nh: xu thế phát triển phát thanh số trên thế giới và trong khu vực, chiến lợc phát triển kinh tế xã hội của Việt Nam, của ngành phát thanh Việt Nam và của các ngành có liên quan ( viễn thông, truyền hình, công nghiệp điện tử…), khả năng phục vụ, các tiêu chí về kinh tế, kỹ thuật ( điều kiện địa hình phủ sóng, khả năng tận dụng cơ sở hạ tầng sẵn có, phổ tần số sử dụng, phạm vi áp dụng, chính sách phủ sóng, giá thành máy thu…) Chuyển sang phát thanh số là xu thế tất yếu của thế giới Việt Nam không thể là một ngoại lệ Lý do chính là vì phát thanh là cầu nối giữa các quốc gia là phơng tiện nghe thống nhất và phổ cập trên toàn cầu Bên cạnh ,
đó, phát thanh số có những u điểm là nâng cao chất lợng chơng trình, giảm chi phí khai thác, tăng nguồn thu dịch vụ gia tăng; nâng cao hiệu quả sử dụng
Trang 9phổ tần số vô tuyến điện Giải pháp về công nghệ lại đa dạng và đang phát triển …Nhng để đảm bảo cho việc triển khai phát thanh số thành công ở Việt Nam thì việc lựa chọn một bộ tiêu chuẩn hợp lý là rất cần thiết
Với những lý do trên, tôi chọn đề tài “Công nghệ phát thanh số - ứng dụng và triển khai trong tơng lai ở Việt Nam” nhằm mục đích tìm hiểu, nghiên cứu công nghệ phát thanh số và đa ra đợc mô hình triển khai cho phát thanh Việt Nam
Luận văn đợc trình bày gồm 3 chơng với nội dung nh sau :
- Chơng 1: Giới thiệu tổng quan về phát thanh số
- Chơng 2: Các tiêu chuẩn phát thanh số đã triển khai và đang thử nghiệm trên thế giới
- Chơng 3: Nghiên cứu khả năng ứng dụng và triển khai công nghệ phát thanh số cho Việt Nam
Tôi xin bày tỏ lòng cảm ơn sâu sắc tới TS Phạm Văn Bình đã tận tình hớng dẫn tôi nghiên cứu, tìm hiểu và tạo mọi điều kiện để tôi có thể hoàn thành luận văn tốt nghiệp
Do hạn chế về thời gian và kiến thức, luận văn tốt nghiệp của tôi còn rất nhiều thiếu sót Kính mong nhận đợc sự đóng góp ý kiến của thầy cô và các bạn để đề tài của tôi đợc hoàn thiện hơn
Xin trõn trọng cảm ơn
Hà nội, ngày 5 thỏng 10 năm 2008
Học viờn
Đỗ Thị Phượng Uyờn
Trang 10Chơng 1
Tổng quan về phát thanh số
Trên thế giới hiện nay đang tồn tại rất nhiều tiêu chuẩn phát thanh số và
đợc phát sóng truyền dẫn dới nhiều hình thức khác nhau: Phát sóng qua vệ tinh, truyền dẫn qua cáp, truyền dẫn qua Internet và phát sóng mặt đất nhằm phục vụ ngời nghe sử dụng các hình thức thu đa dạng nh: các máy thu cố
định, di động, trên ôtô… với các chơng trình có chất lợng cao Việc lựa chọn truyền dẫn dới hình thức nào còn tuỳ thuộc vào các điều kiện: địa hình, phân
bố dân c, điều kiện kinh tế, điều kiện xã hội… Tuy nhiên dù theo tiêu chuẩn nào và truyền dẫn dới hình thức nào thì khởi đầu cho phát thanh số vẫn là kỹ thuật chuyển đổi các tín hiệu âm thanh tơng tự thành âm thanh số Chơng 1
sẽ trình bày tổng quan về âm thanh, kỹ thuật xử lý âm thanh số, nén tín hiệu
âm thanh số để làm cơ sở cho việc xây dựng nội dung của các chơng tiếp theo
1.1 - âm thanh và đặc tính của âm thanh
Khi một vật dao động về một phía nào đó, nó làm cho các lớp không khí liền trớc bị nén lại, và lớp không khí liền sau dãn ra Sự nén và dãn không khí nh vậy lặp đi lặp lại một cách tuần hoàn nên đã tạo ra trong không khí một sóng đàn hồi Sóng này truyền tới tai, nén vào màng nhĩ khiến cho màng nhĩ cũng dao động với cùng tần số Khi màng nhĩ dao động, các vị trí phân biệt của màng nhĩ trên bề mặt giống nh nó chuyển động về trớc hay sau đáp ứng với các sóng âm vào Khi cùng một thời điểm, ta nghe thấy nhiều âm, thì mọi
âm thanh phân biệt này đợc trộn với nhau một cách tự nhiên trong tai giống nh một hình mẫu đơn của áp suất không khí thay đổi Tai và óc làm việc cùng nhau để phân tích tín hiệu này ngợc lại thành những cảm giác về âm riêng biệt
Trang 11• Thanh ỏp P: độ dao động ỏp suất của khớ quyển khi bị súng õm tỏc động, bằng ỏp suất tổng ở thời điểm hiện tại trừ đi ỏp suất tĩnh
đơn vị: Pascal (Pa)
• Mức thanh ỏp = bỡnh phương thanh ỏp, được dựng để chuẩn húa (20 mPa2) khi tớnh õm lượng theo đơn vị dB
• Mức õm thanh được tớnh theo đơn vị dB
- Sự biến đổi của mức õm theo thang loga phự hợp với tõm sinh lý con người
• Âm thanh bao gồm õm đơn và õm phức
Âm đơn : là õm được hỡnh thành tại một tần số theo dao động sin
Âm phức : là õm được hỡnh bởi nhiều tần số theo dao động sin
Tai ngời bình thờng có thể nghe âm thanh trong phạm vi tần số 20Hz tới 15.000Hz, riêng lứa tuổi 18 có thể nghe đến 20.000Hz Âm có tần số dới 20
Hz là hạ âm, trên 20.000Hz là siêu âm tai ngời không thể nghe thấy đợc Trong phạm vi tần số cảm thụ âm thanh nói trên độ nhạy cảm theo tần số cũng
Trang 12kh¸c nhau §é nh¹y c¶m cao nhÊt cña tai n»m ë ph¹m vi tÇn sè tõ 1000Hz tíi 5000Hz vµ gi¶m dÇn ë tÇn sè thÊp
H×nh 1.1 : C¬ quan thÝnh gi¸c
• Cảm nhận về tần số: là sự cảm nhận về độ cao của âm
Quy luật: Khi tần số tăng lên gấp 2 lần thì cảm nhận sự thay đổi của độ cao
của âm là tương đương
• Cảm nhận về biên độ : là sự cảm nhận về độ to của âm
Quy luật: Khi âm lượng tăng lên gấp 10 lần thì cảm nhận sự thay đổi của độ
to của âm là tương đương
- Ngưỡng nghe được: Cường độ âm lớn nhỏ nhất mà tai người có thể cảm thụ được Phân biệt có âm thanh tồn tại hay không Giá trị : 0 dB
- Ngưỡng chói tai: Cường độ âm lớn nhất mà tai người còn cảm thụ được Ngưỡng phân biệt âm thanh có làm tổn thương cơ quan thính giác hay không Giá trị : 120 dB
• Hiệu ứng che lấp là hiệu ứng làm thay đổi ngưỡng nghe thấy do tác động của nguồn âm khác (nhiễu)
Mức che lấp là khoảng dịch chuyển ngưỡng nghe thấy khi có và không có tác động che lấp Các yếu tố ảnh hưởng : Thời gian, Tần số, Mức, Đặc tính của
âm thanh
Trang 13• Hiệu ứng stereo
Monophonic : nguồn đơn
Stereophonic tạo hiệu ứng về mặt khụng gian qua cảm nhận 3 thuộc tớnh của nguồn õm để định vị nguồn õm về mặt khụng gian:
- Biờn độ : hướng tỷ lệ với độ lớn tương đối cảm nhận giữa 2 tai
- Pha : hướng của nguồn õm
- Thời gian : khoảng cỏch tỷ lệ với thời gian truyền õm
1.2 - số hóa các tín hiệu audio
Xử lý tín hiệu âm thanh theo công nghệ số có rất nhiều u điểm nh:
- Ưu điểm nổi bật của âm thanh số là nhiễu không thể xâm nhập đợc vào tín hiệu
- Cải thiện tỷ số tín hiệu/ tạp âm
- Việc tìm kiếm dữ liệu nhanh chóng, dễ dàng
Từ những năm 80, thiết bị audio số đã dần thay thế thiết bị audio tơng
tự trong sản xuất chơng trình và phát sóng Ưu điểm nổi bật là ghi âm số nhiều lần mà chất lợng không suy giảm, lu trữ số và các hệ thống sản xuất chơng trình audio dựa trên cơ sở máy tính tỏ ra rất hiệu quả Công nghệ số cho phép ghi, xử lý, truyền dẫn phát sóng và thu thanh hoàn toàn trong môi trờng số
Để thiết bị số có thể hoạt động, tín hiệu audio tơng tự phải đợc chuyển thành tín hiệu audio số (ADC) Xử lý audio số sẽ có giá trị , nếu quá
Trang 14trình ADC không gây giảm chất lợng và phải có các định dạng số thích hợp cho ghi âm và truyền dẫn
Về cơ bản, âm thanh tơng tự và số là khác nhau, nên ta luôn bị mất thông tin khi làm phép chuyển đổi giữa chúng Khi đợc số hoá, sóng âm thanh đợc biểu diễn nh là một chuỗi các số (đợc gọi là các mẫu), mà chúng biểu diễn áp suất không khí hay tín hiệu điện tại các thời điểm kế tiếp nhau theo thời gian Khi mẫu hoá một tín hiệu tơng tự, ta luôn gặp phải 2 vấn
đề: thứ nhất, mỗi giá trị kế tiếp trong dạng biểu diễn dạng số là một quãng xác
định nào đó của thời gian, và mỗi khối có một độ rộng xác định; thứ hai là các
số số hoá là rời rạc Chỉ có một số xác định các độ cao có thể cho mỗi khối Theo hình vẽ, ta thấy độ cao các khối không ăn khớp với đờng tín hiệu gốc
Tín hiệu tơng tự Tín hiệu số
Hình 1.2: Chuyển đổi tín hiệu sang dạng các mẫu số
Đây là hai lỗi cơ bản trong tín hiệu âm thanh số Lỗi này có thể đợc kiểm soát bằng cách thay đổi khuôn dạng chi tiết của dạng biểu diễn âm thanh, nhng không thể loại bỏ đợc hoàn toàn Chính vì vậy, tuỳ theo ứng dụng ta sẽ phải chấp nhận một số lỗi nhất định Và các hệ số khác nh kích thớc dữ liệu hay tần số xử lý yêu cầu ta phải chấp nhận một sai số lớn hơn từ một số nguồn để có thể giảm hơn nữa các sai số khác
1.2.1 - Biến đổi ADC
Microphone và loa là các linh kiện tơng tự, hoạt động với các tín hiệu tơng tự Vì vậy các tín hiệu điện liên tục theo thời gian phải đợc chuyển đổi
Trang 15thành các định dạng số rời rạc theo thời gian dùng cho xử lý số tín hiệu Bộ biến đổi ADC có ảnh hởng lớn đến chất lợng audio số Quá trình chuyển
đổi tín hiệu tơng tự sang số bao gồm các bớc sau:
• Lọc tín hiệu nhằm mục đích hạn chế băng tần
• Lấy mẫu (rời rạc hoá tín hiệu theo thời gian)
• Lợng tự hoá (chuyển đổi giá trị liên tục của tín hiệu thành giá trị rời rạc theo biên độ)
• Mã hoá (gán giá trị nhị phân cho các mẫu)
a/ Lấy mẫu
Nguyên tắc lấy mẫu:
Theo định lý Nyquist : Để chuyển đổi một tín hiệu tơng tự thành tín hiệu
số, thì tín hiệu tơng tự cần thiết phải đợc lấy mẫu trớc tiên, ở những điểm nhất định về thời gian giá trị mẫu tín hiệu vào này cần đợc lấy mẫu Khoảng thời gian cố định giữa mỗi mẫu đợc gọi là khoảng lấy mẫu ( ts)
Hình 1.3: Quá trình chuyển đổi tín hiệu liên tục
Định lý lấy mẫu hoàn toàn đơn giản, tần số lấy mẫu fs lớn hơn hoặc bằng hai lần tần số cực đại của tín hiệu tơng tự gốc : fs ≥ 2fmax
Quá trình lấy mẫu thực hiện việc phân tích tín hiệu audio tơng tự với chuỗi xung có thời gian lặp lại với tần số lấy mẫu Đó lá quá trình điều biên xung
(PAM) trong miền thời gian ( hình 1.4), và trong miền tần số (hình 1.5)
Theo định lý Nyquist, với fs ≥ 2fmax (fs - tần số lấy mẫu, fmax - tần số audio cực
đại) thì các biên phụ không chồng lên nhau, không có hiện tợng chồng phổ
(hình 1.6)
Trang 16Trớc khi thực hiện biến đổi ADC, phải hạn chế phổ tần số audio đến giá trị nhỏ hơn 1/2fs
Hình 1.4: Quá trình lấy mẫu (PAM) trong miền thời gian
Hình 1.5: Phổ điều chế với các biên phụ (fs= fmax) xung quanh
tần số lấy mẫu trong miền tần số
Hình 1.6: Hiện t-ợng chồng phổ
Biờn độ
Thời gian Tớn hiệu Audio
Xung lấy mẫu
Phổ tần số lấy mẫu
Điều biờn
Tớn hiệu Audio lấy mẫu
Trang 17Xung lấy mẫu phải có số thời gian hẹp, bằng một chu kỳ lấy mẫu (1/fs).Trong thực tế bộ ADC, giá trị biên độ xung của mỗi mẫu đợc giữ cho
đến khi nào đạt mẫu tiếp theo (hình 1.7)
Hình 1.7: Quá trình lấy mẫu và giữ (sampling- and hold) trong miền thời gian
-b/ Lợng tử hoá
Sau quá trình lấy mẫu tín hiệu vẫn còn là tơng tự, quá trình chuyển thành tín hiệu số thực sự diễn ra ở bớc lợng tử hóa này Quantizing -
(hình1.8a) Đây chính là quá trình chuyển đổi từ giá trị điện áp sang dạng giá
trị số tơng ứng.Trong một hệ thống, dải tín hiệu tơng tự đợc chia thành một số vùng, và những mẫu tín hiệu đợc gán một giá trị nhất định Những giá trị này đợc biểu thị dới dạng nhị phân, với số dơng đợc biểu thị bằng mã nhị phân tự nhiên còn với số âm thì biểu thị bằng mã dơng cộng thêm số
1 Trong hệ thống nh vậy , bit mang ý nghĩa nhiều nhất MSB đợc dùng nh
là bit dấu , nó là “0” với những giá trị dơng, là “1” với những giá trị âm Những vùng trong đó tín hiệu đợc chuyển đổi gọi là khoảng lợng tử, biểu thị bằng chữ Q Một dãy n bit biểu thị cho giá trị điện áp tơng ứng với khoảng lợng tử gọi là từ mã
Quá trình lợng tử hoá có các đặc điểm sau đây:
Biờn độ
Thời gian Tớn hiệu Audio
Xung lấy mẫu
Thời gian
Điều biờn
Tớn hiệu đó lấy mẫu
Thời gian
Trang 18• Khoảng giá trị nhị phân không đối xứng với các chuyển dịch dơng và
âm của tín hiệu audio gốc
• Tín hiệu tơng tự có biên độ thấp đợc lợng tử hoá với rất ít mức rời rạc Việc này gây ra sai số lợng tử Muốn giảm sai số lợng tử phải tăng số mức rời rạc Hệ thống 5 bit sẽ giảm khoảng lợng tử hoá xuống còn 1/2 so với
hệ thống 4 bit Bộ lợng tử hoá 16 bit có thể làm tăng 65.535 (216-1) khoảng lợng tử Một phơng pháp khác giảm sai số lợng tử hoá là tăng tần số lấy mẫu ( oversampling – lấy mẫu cao)
Hình 1.8: Quá trình lấy mẫu và sai số l-ợng tử hoá trong ADC 4 bit
• Nếu biên độ tín hiệu audio tơng tự vợt quá khoảng lợng tử hoá thì sẽ xảy ra cắt số (digital clipping)
Theo nguyên tắc lợng tử , do các điện áp trong khoảng lợng tử đợc đại diện bằng một mức trung bình nên quá trình lợng tử là quá trình không tuyến tính và có thể tạo ra lỗi , các lỗi này gọi là lỗi lợng tử Sai số lợng tử hoá phụ thuộc vào tín hiệu: Nếu nhiễu nhẹ tồn tại trong tín hiệu gốc, thì nó sẽ
Thời gian Biờn độ
1/f s
a) Thời gian lấy mẫu và giỏ trị
lượng tử hoỏ 4 bit
Trang 19cộng vào các thành phần ngẫu nhiên Sai số lợng tử hoá có thể coi nh là nhiễu cộng vào tín hiệu gốc và làm cho chất lợng âm thanh thô hơn
Tỷ số tín hiệu trên nhiễu (SNR) là tỉ số tín hiệu dạng sine cực đại (dới mức cắt) trên giá trị RMS (căn bình phơng trung bình) của sai số lợng tử hoá (e) Với ADC n bít, một nửa các khoảng lợng tử hoá 2- n-1 đợc dùng cho một cực tính của sóng sine Giá trị sóng sine với RMS cực đại đợc tính nh
sau:
2
.
2 1 Q V
n−
( Q: khoảng lợng tử hoá, 2n-1: 1/2 số khoảng lợng tử hoá 2n)
Các tín hiệu audio có phổ rộng và các giá trị biên độ cao sẽ tạo sai số lợng tử hoá có xác suất bằng nhau với bất kỳ một giá trị nào giữa : +Q/2 và - Q/2 Cho nên có các giá trị ngẫu nhiên Q trong một khoảng lợng tử hoá và xác xuất cho mỗi giá trị bằng 1/Q Giá trị RMS của nhiễu lợng tử đợc biểu diễn bằng căn bình phơng trung bình của tổng các sai số bình phơng:
Tổng sai số trung bình bình phơng: +∫
−
2 / 2 / 2 Q Q
de e
Trung bình của tổng : +∫
−
2 /
2 / 2
Q
de e Q
Căn bình phơng trung bình:
Điện áp nhiễu = ∫
2 / 2 / 2
1 ) (
Q Q
de e Q
Q
Q N
c/ Mã hoá
Trang 20Mỗi giá trị lợng tử hoá nhị phân cần phải đợc mã hoá để phù hợp với loại tín hiệu lấy mẫu, truyền dẫn và ghi âm Hệ thống mã hoá thờng dùng là PCM ( điều xung mã), PWM (điều chế theo độ rộng xung), ADM (điều chế dữ liệu thích nghi), DPCM (điều chế xung mã vi sai), FP - điểm di động (floating point)
PCM ít hiệu quả, nhng đơn giản PCM đợc thực hiện tuyến tính cho tất cả các khoảng lợng tử hoá Tất cả các mức lợng tử hoá đợc gán bằng các từ mã theo một trật tự logic
PAM (Pulse Amplitude Modulation)
Trong thực tế, các bộ chuyển đổi DAC và ADC thờng xuyên sử dụng dạng PAM điều chế biên độ xung, nh một khuôn dạng trung gian, trong đó -
âm thanh đợc coi nh một chuỗi các xung, và biên độ của mỗi xung (độ cao) biểu diễn độ mạnh của âm thanh tại điểm đó
Tín hiệu tơng tự Xung PAM
Hình 1.9: PAM
PWM (Pulse Width Modulation)
Ngoài ra, ta còn dạng biểu diễn khác là PWM điều chế độ rộng xung, - cũng giống nh PAM, đây là dạng biểu diễn mỗi mẫu nh một xung, nhng
nó sử dụng độ rộng hay khoảng kéo dài của xung (thay cho biên độ) để biểu diễn độ mạnh của âm thanh
Trang 21Tín hiệu tơng tự Xung PWM
Hình 1.10: PWM
PCM (Pulse Code Modulation)
Đây là dạng biểu diễn mỗi mẫu nh một chuỗi các xung, mà các xung
đó biểu diễn mã nhị phân của nó Nhng biểu diễn dạng này rất khó xác định
đâu là điểm bắt đầu và kết thúc của mỗi mã Tuy nhiên, không khó khăn để có thể khắc phục điều này, ví dụ nh ta có thể xây dựng các mã theo một dạng riêng để không có mã nào chứa 3 số 1 liên tiếp (111) và sau đó chèn 111 vào tín hiệu tại điểm bắt đầu của mỗi mã Trong bộ nhớ máy tính, các mã nhị phân liên tiếp đợc lu trữ nh các số Thông thờng, dữ liệu âm thanh dạng PCM
đợc lu trữ với 8 hay 16 bits mỗi mẫu
Tín hiệu tơng tự Xung PCM
Hình 1.11: PCM
d/ Dither
Trang 22Dùng kỹ thuật Dither để giảm méo lợng tử hoá các tín hiệu có mức thấp
Kỹ thuật Dither cộng nhiễu trắng vào tín hiệu (giá trị RMS của nhiễu trắng nhỏ hơn 1/3 khoảng lợng tử hoá) Khi biến đổi ngợc lại thành tơng tự, tín hiệu khôi phục không có liên quan với tín hiệu gốc Tuy nhiên, mạch lọc thông thấp khôi phục tín hiệu lấy trung bình tín hiệu theo thời gian; nhiễu
đợc tách ra và tín hiệu gốc đợc khôi phục xấp xỉ
Hình 1.12: Dither hoá tín hiệu vào có mức thấp.
e/ Dải động
Q/2
Q Q/2
Đầu ra lượng tử hoỏ Dạng sin gốc
Trang 23Hình 1.13: Mã hoá 20 -bit nhị phâ n (giá trị 1 và 0)
Mức tín hiệu audio đạt cực đại trớc khi cắt mã số lớn nhất mà bộ ADC
có thể cho (hình 1.13) Mức này tơng đơng mức 0dB FS (thang độ đầy đủ)
và tất cả các mức số đợc chuẩn theo điểm này là các giá trị âm Mức cực tiểu
đợc đặt bằng nhiễu Dither ( 120 dBFS cho ADC 20bit) Do đó, dải động là
-120dB
f/ Tần số lấy mẫu chuẩn:
Hiện nay, thông thờng dùng 3 tần số lấy mẫu chuẩn:
• 32 K Hz (tiêu chuẩn chuyên dụng): Dùng trong truyền dẫn đến máy phát thanh FM Stereo
• 44,1 KHz (tiêu chuẩn dân dụng): Dùng trong máy ghi hình Umatic, CD, R-DAT (chỉ phát lại)
• 48 KHz (tiêu chuẩn phát thanh): Có thể dùng với băng tần audio tơng
tự lên đến 22 kHz
g/ Chức năng Preemphasis (tiền nhấn):
Giới hạn tớn hiệu dương max MSB
(Hex)
Trang 24Kỹ thuật Preemphasis (tiền nhấn) và deemphasis (giải nhấn) đợc dùng trong ghi âm và phát lại Nó làm giảm nhiễu lợng tử hoá ở vùng tần số cao Cần lu ý là chức năng này đợc dùng trong máy ghi âm với tín hiệu audio vào là tơng tự Đối với máy ghi âm số có tín hiệu vào số thì không cần dùng
chức năng này
1.2.2 - Biến đổi DAC
Quá trình của bộ biến đổi ngợc (số ra tơng tự DAC) bao gồm:-
• Giải mã các từ mã nhị phân
• Biến đổi ngợc thành điện áp, biểu diễn các tín hiệu audio gốc
Hình 1.14 là mạch DAC có độ phân giải n bit Dữ liệu n bit điều khiển n - chuyển mạch (vị trí ON và OFF ứng với giá trị 0 và 1 của tín hiệu số) Các vị trí chuyển mạch cho giá trị điện áp V ở đầu ra tỉ lệ với các bit trong từ mẫu
-Dạng tín hiệu ra của DAC đợc cho trong hình 1.15
Hình 1.14 : Mạch DAC có độ phân giải n-bit
0
2 2 2 2 2 2
bit 0 bit 1 bit 2 bit 3 bit 4 bit n- 1
1 0 1 1 0 0 MSB
Điện áp ra (V)
- +
LSB
Nguồn điện
áp chuẩn
Biờn độ Biờn độ
Trang 25Hình 1.15: Dạng tín hiệu ra của DAC
a/ Hiệu ứng aperture hiệu ứng méo độ mở -
Phổ tín hiệu lấy mẫu đợc điều chế biên độ với tín hiệu có đờng bao dạng sinx/x Đờng bao của hàm sinx/x biến đổi theo độ rộng xung lấy mẫu tại tần số cao Nếu xung có độ rộng gần bằng 0, thì quá trình lấy mẫu là lý tởng (sinx/x=1) và không có thay đổi ở tần số cao Sự thay đổi tăng theo độ rộng xung lấy mẫu; Hiện tợng này gọi là hiệu ứng thời gian aperture
Tỉ lệ: aperture =
s
Với: t- thời gian xung lấy mẫu Ts- chu kỳ lấy mẫu
Với tỷ lệ aperture bằng 1 (100%), độ suy giảm 4 dB tại 1/2 fs Nếu tỷ lệ aperture giảm xuống 12,5%, thì độ suy giảm còn 0,2 dB, nhng biên độ của
các biên phụ tăng
Trang 26b/ Lọc thông thấp
Bộ lọc thông thấp (khôi phục tín hiệu) loại bỏ các hài bậc cao (trên fs/2)
đợc hình thành trong quá trình lấy mẫu Bộ lọc loại bỏ các thành phân tần số
cao chứa trong các tín hiệu bậc thang (hình1.15c)
c/ Lấy mẫu ở tần số cao
Lấy mẫu ở tần số cao (over samling) đợc dùng cho ADC và DAC nhằm nâng cao chất lợng (giảm méo lợng tử và thành phần chồng phổ)
Với sự thay đổi lớn biên độ tín hiệu audio tơng tự (lấy mẫu tần số cao), các mức lợng tử hoá rời rạc phụ đợc cộng vào, kết quả làm giảm sai số lợng tử hoá
Nếu lấy mẫu tần sỗ cao cho ADC có độ phân giải cao, ví dụ 18 bit, thì phải chia khoảng lợng tử 16 bit thành 4 khoảng Sử dụng độ phân giải của ADC cao hơn (>18 bit) sẽ làm giảm sai số lợng tử hoá 4 lần và nâng cao khả năng tạo lại các tín hiệu mức thấp của hệ thống
Với hệ thống dùng tần số lấy mẫu gấp 2 lần thì phổ của nhiễu lợng tử sẽ tăng trên 2 lần so với độ rộng băng tần thông thờng và tỉ số SNR tăng lên 3
dB Tỉ số SNR đối với một tín hiệu sin đợc tính nh sau:
SNR (dB) = 6,02n + 1,76 + 10log10d (1.6)Trong đó:
n – số bit/mẫu lợng tử hoá
d – hệ số lấy mẫu tần số cao
Vd : Với tần số lấy mẫu tăng 4 lần thì SNR tăng 6 dB
Hình 1.16 là sơ đồ khối của hệ thống ADC và DAC với tần số lấy mẫu gấp 4 lần
Mạch lọc số dùng cho ADC/DAC nhằm loại bỏ các thành phần tần số không mong muốn trong phổ tín hiệu trớc bộ DAC, và để tiết kiệm các mạch lọc chống chồng phổ (điểm cắt sắc nét) và mạch lọc khôi phục
Mạch lọc số có các hoạt động nh nhân, làm trễ, cộng các số nhị phân có
độ chính xác cao, dễ thực hiện
Trang 27
Hình 1.16: Hệ thống ADC/DAC với tần số lấy mẫu gấp 4 lần
Số phần tử trễ quyết định bậc của mạch lọc số Bậc càng cao thì có khả
năng tạo các dạng đặc tuyến cắt càng sắc nét mà không gây méo pha Hình
1.17 là ví dụ mạch lọc số dùng tần số lấy mẫu gấp 4 lần Mỗi tế bào D là một dây trễ (giống nh một bộ ghi dịch) Mỗi mẫu có trễ đợc nhân với các hệ số - (nhân với X1,, X2,…, Xn), kết quả đợc cộng lại trong bộ cộng nhị phân
LPF
Biến đổi 4f s - >fs
Lọc số LPF
Biến
đổi Fs->4f s
DAC Loc tơng
Trang 28a) Läc ngang bËc n, dïng trong lÊy mÉu víi tÇn sè cao gÊp 4 lÇn
b) §¸p tuyÕn cña xung lÊy mÉu t¹i ®Çu ra bé läc sè
c) §¸p øng läc sè cã trÔ vµ tæng l¹i tÇn sè lÊy mÉu chuÈn
H×nh 1.17: M¹ch läc nèi tiÕp ngang (transversal filter) dïng trong ADC/DAC
cã tÇn sè lÊy mÉu gÊp 4 lÇn.
TÇn sè tæng céng ë ®Çu ra t¨ng gÊp 4 lÇn (192kHz) Phæ tÝn hiÖu lÊy mÉu
®îc cho trong h×nh 1.18 TÝn hiÖu gèc ®îc lÊy mÉu t¹i 48 kHz, tÊt c¶ c¸c
phæ xung quanh 48, 96, 144 kHz ®îc lo¹i bá b»ng m¹ch läc sè nèi tiÕp dïng
tÇn sè lÊy mÉu gÊp 4 lÇn, nhiÔu lîng tö ho¸ tr¶i phæ trong b¨ng tÇn b»ng 4fs/2
Thời gian
Đầu ra theo mẫu đầu vào x
Thời gian Đầu ra theo mẫu
đầu vào x + 1
Trang 29Hình 1.18: Phổ tín hiệu tại đầu ra mạch lọc số dùng tần số lấy mẫu gấp 4 lần
d/ Tạo dạng nhiễu (noise shaping)
Lấy mẫu tần số cao sẽ mở rộng khoảng tần số tín hiệu lấy mẫu, trải phổ của nhiễu lợng tử hoá trên vùng băng tần cơ bản Kỹ thuật dao động nhiễu sẽ giảm mức phổ nhiễu trong băng tần cơ bản tín hiệu audio, nhng làm tăng mức phổ của nhiễu ngoài khoảng này Biên độ nhiễu đợc cố định, nhng phổ của nó đã thay đổi Ta có thế giảm nhiễu audio một cách đáng kể, nếu dùng cách lọc bậc 2 hoặc 3 để tạo dạng nhiễu
a) ADC với lấy mẫu tần số cao gấp 4 lần và vòng phản hồi
Tạo dạng/
tớch phõn nhiễu
Lọc số LPF
Thời gian
Hàm truyền tớn hiệu vào
Hàm truyền nhiễu lượng tử hoỏ (mạch lọc bậc 1) Biờn độ
f s /2
Trang 30b) Phổ của tín hiệu audio t-ơng tự và tín hiệu nhiễu l-ợng tử hoá tại đầu ra ADC
Hình 1.19: ADC dùng tần số lấy mẫu gấp 4 lần và vòng phản hồi tạo dạng nhiễu
Hình 1.19a là sơ đồ khối bộ ADC có tần số lấy mẫu tăng gấp 4 lần và mạch phản hồi tạo dạng nhiễu Mạch phản hồi có hàm truyền đạt với đáp ứng phẳng cho tín hiệu vào tơng tự ( ngoài vòng phản hồi) và hàm truyền đạt tích phân đối với tín hiệu nhiễu lợng tử đa vào vòng phản hồi qua ADC
Hình 1.19blà phổ của tín hiệu tơng tự vào và tín hiệu nhiễu lợng tử
e/ Hạn chế của ADC/DAC
Cả hai mạch ADC và DAC đều có gây sai số cho tín hiệu audio Nói chung các sai số này là nhỏ, nhng nhiều lần đi qua ADC và DAC sẽ tích lại làm giảm chất lợng tín hiệu audio Có thể phân biệt sai số thành 2 nhóm:
- Nhiễu của bộ lọc thông thấp (LPF) Nếu một nhóm các tần số bị trễ hơn các nhóm khác trong phổ tín hiệu, thì sẽ xảy ra trễ nhóm Sai số trễ nhóm làm méo tín hiệu khôi phục Hơn nữa độ gọn của mạch lọc thông thấp khôi phục và chồng phổ có thể tích lại và tạo các sai số có biên độ đáng kể trong tín hiệu khôi phục Các sai số này có thể sửa bằng các mạch lọc số bậc cao
- Sai số biến đổi Các giá trị lợng tử hoá có sai số đợc hình thành, nếu tần
số lấy mẫu dạng chuông thay đổi, làm cho các vị trí và thời gian lấy mẫu không chính xác
1.3 - nén audio số
Do nhu cầu đòi hỏi phải ghi âm thanh trên các chất liệu ghi gọn nhẹ ngày càng lớn, nên bắt buộc những nhà sáng chế, nhà sản xuất nghĩ ra nhiều phơng pháp ghi âm tiên tiến sao cho ghi đợc ngày càng nhiều âm thanh trên các định dạng ghi âm nhỏ gọn Việc nén tơng tự cho phép làm giảm dải
động tín hiệu đáp ứng yêu cầu số hóa âm nhạc Theo những nghiên cứu y học hiện đại đã phát hiện ra rằng tai ngời rất nhạy cảm với một số tần số nhất
Trang 31định, điều này dẫn tới một phơng pháp mã hóa ” mã hóa âm thanh giác quan” Phòng thí nghiệm Dolby vào năm 1984 đã đa ra phơng pháp , gọi tắt
là AC-1, đợc dùng trong phát thanh Thế hệ tiếp theo là AC-2 , AC-3 đợc dùng cho trờng quay và các sản phẩm hậu kỳ với tỉ lệ bit thấp và vì vậy hệ thống này đợc dành cho hệ thống phát thanh truyền hình Một bớc đột phá thực sự của công nghệ này do Sony tạo ra đó là ATRAC ( Adaptive transform Acoustic Coding) Hệ thống này có tỉ lệ nén 5:1 nên có sự suy giảm tín hiệu rất ít và đợc Sony chọn dùng cho hệ thống mã hóa âm thanh vòm trong chiếu bóng cũng nh trong định dạng ghi âm Minidisc
Tín hiệu Audio số PCM đợc dùng trong phát thanh, truyền hình, multimedia và nhiều ứng dụng khác (hệ thống nhiều đờng audio, nhà hát tại nhà) Tín hiệu âm thanh Stereo có độ phân giải 16 bit, lấy mẫu tại 48 kHz, sẽ cho tốc độ dữ liệu audio là 1.54 Mb/s, còn hệ thống âm thanh tròn nhiều kênh
có tốc độ dữ liệu 4.5 Mb/s Do đó cần nén dữ liệu có hiệu quả để lu trữ và phân phối kênh có độ rộng hẹp
Audio có nén đợc sử dụng trên CD-ROM, mạng phát thanh truyền hình
số qua vệ tinh DBS (Digital broadcast satellite) Các hệ thống nén thông tin
âm thanh dựa trên đặc trng tâm sinh lý nghe và các giới hạn của tai ngời để loại bỏ các thành phần dữ liệu d thừa trong tín hiệu audio
1.3.1 - Cơ sở của nén dữ liệu audio
Nén tín hiệu audio đợc thực hiện dựa trên cơ sở là mô hình tâm lý thính giác của con ngời, sự hạn chế về mặt cảm nhận và hiện tợng che lấp các thành phần tín hiệu âm thanh
Hệ thống thính giác của con ngời (Human Auditory System-HAS) có
đặc điểm nh một bộ phân tích phổ Nó chia dải phổ âm thanh nghe thấy thành các băng tần gọi là các “ băng tới hạn”(critical bands) nh một dãy các
bộ lọc thông dải Các băng này có bề rộng dải thông là 100 Hz với các tần số dới 500 Hz và tăng theo tần số tín hiệu với các tần số lớn hơn 500 KHz Bề
Trang 32rộng dải thông này tăng tới vài KHz khi tần số tín hiệu lớn hơn 10 KHz Có thể mô hình hoá hệ thống cảm nhận của con ngời bằng 26 bộ lọc thông dải liên tiếp có bề rộng dải thông nh đã nói
Khi tín hiệu âm thanh bao gồm các tần số gần kề nhau, hệ thống thính giác của con ngời (HAS) sẽ tổ hợp chúng thành một nhóm có năng lợng cân bằng Ngợc lại, nếu âm thanh bao gồm nhiều tần số khác biệt nhau, chúng sẽ
đợc xử lý tách biệt và độ lớn âm đợc xác định
Tính nhạy cảm của HAS giảm tại các tần số cao và tần số thấp Điều này
có nghĩa rằng đối với các mức âm thấp thì sự thay đổi trong cảm nhận của con ngời là rất quan trọng và sẽ giảm dần tại các mức âm cao
1.3.1.2 Sự che lấp tín hiệu Audio -
Hệ thống thính giác của con ngời còn có một đặc điểm vô cùng quan trọng, đó là tính che lấp “ masking” Có hai dạng che lấp, đó là : che lấp thời gian và che lấp tần số Tiến hành thực nghiệm đối với hệ thống thính giác, ngời ta đã xây dựng đợc đặc tuyến che lấp trong miền thời gian và trong miền tần số
bị biến đổi bởi âm che lấp
Kết quả
che lấp tạo bởi
Trang 33Để tai ngời có thể nghe thấy, bất cứ một âm thanh ở tần số đơn nào cũng phải có mức áp suất âm lớn hơn một giá trị ngỡng xác định Tập hợp tất cả các giá trị ngỡng này đối với tất cả các âm đơn trong dải tần nghe đợc tạo nên một đờng cong gọi là “ngỡng nghe thấy tuyệt đối” (absolute hearing threshold), là đờng đậm nét ở hình vẽ trên Tất cả các âm thanh nằm dới đờng cong này đều không có khả năng đợc con ngời cảm nhận
Do sự xuất hiện của một âm thanh có cờng độ cao ở một tần số nào đó,
sẽ làm đờng cong này biến đổi đi Trong ví dụ trên, âm 1 KHz với mức áp suất âm 45 dB đã làm ngỡng nghe thấy tuyệt đối dâng lên 27dB Điều này có nghĩa những tạp âm dới 27 dB là không nghe thấy Nếu sử dụng thang lợng
-tử có 6dB/ bớc nhảy thì chỉ cần 3 bít để mã hoá âm này vì giá trị vi sai ở đây là: 45 27 = 18 dB.-
Nếu mức âm 1-KHz tăng lên tới 65 dB thì mức che phủ sẽ tăng lên tới 55
dB, giá trị vi sai lúc này chỉ còn 10 dB và có thể đợc mã hoá chỉ bằng 2 bít Việc che phủ tần số trớc và sau cũng rất quan trọng Nh trên hình vẽ,
âm 1-KHz cũng làm ngỡng nghe thấy của các âm tần số xung quanh dâng lên Sự che phủ tần số phía sau quan trọng hơn và tăng theo mức âm Điều này cho phép giảm độ chính xác mã hoá cho những tần số tín hiệu xung quanh âm
Trang 34che phủ Những âm đơn tần xung quanh 1-KHz có mức âm nhỏ hơn đờng cong che phủ sẽ không có khả năng cảm nhận và không cần thiết phải mã hoá
mà vẫn không làm ảnh hởng tới chất lợng cảm nhận của con ngời Hệ thống nén dựa trên đặc điểm này đợc gọi là hệ thống nén theo thính giác
♦ Sự che phủ thời gian
Sự che phủ thời gian là hiện tợng tai ngời chỉ cảm nhận đợc âm sau khi âm
đó bắt đầu khoảng 200 ms và có cảm tởng âm thanh còn kéo dài khoảng 200ms nữa sau khi âm thanh đã dứt Ngoài ra, thính giác cũng không phân biệt đợc khoảng ngừng nhỏ hơn 50 ms giữa hai âm thanh giống nhau đi liền nhau
1.3.2 - Kỹ thuật giảm dữ liệu audio
Kỹ thuật mã hoá nguồn đợc dùng để loại bỏ độ d thừa của tín hiệu audio (nếu độ chênh lệch mẫu - đến - mẫu bằng 0) và kỹ thuật che mặt nạ tâm sinh lý nghe đợc dùng để nhận dạng và loại bỏ nội dung không thích hợp (các mẫu không phải là audio) Có 2 kỹ thuật nén dữ liệu chính sau đây:
250
0
Tín hiệu che lấp
Hình 1.21 : Sự che lấp về thời gian
Che phủ trớc
Che lấp liên tục
Che phủ sau
Trang 35- Mã hoá dự báo miền thời gian: Loại mã hoá này sử dụng mã hoá vi sai
để khôi phục phần chênh lệch giữa các mẫu kề nhau Tốc độ bit đợc giảm sẽ
có thể dùng để mã hoá và truyền thông tin audio
- Mã hoá biến đổi miền tần số: Kỹ thuật này dùng các khối của các mẫu audio mã hoá PCM tuyến tính, đợc biến đổi từ miền thời gian thành một số nhất định các băng tần khác nhau trong miền tần số
Hiện tợng che lấp quan trọng nhất xảy ra trong miền tần số Để lợi dụng
đặc điểm này, phổ tín hiệu audio đợc phân tích thành nhiều băng phụ có độ phân giải thời gian và tần số phù hợp với bề rộng các băng tần tới hạn của HAS Mỗi băng phụ chứa một số thành phần âm rời rạc
1.3.2.1 Giảm dữ liệu không tổn thất
Nén không tổn thất cho phép khôi phục thông tin dữ liệu gốc từ bit đến bit sau khi dãn một cách trung thực Nó loại bỏ độ d thừa thống kê tồn tại trong tín hiệu audio bằng các giá trị dự báo từ các mẫu trớc Có thể đạt tỉ lệ nén thấp (tốt nhất là 2:1) và phụ thuộc vào độ phức tạp của tín hiệu audio gốc Nhờ mã hoá dự báo miền thời gian mà ta có thể nén không tổn thất:
• Thuật toán vi sai: Tín hiệu audio có chứa các âm lặp lại cũng nh số lợng lớn độ d thừa và các âm thanh không thích hợp Dữ liệu lặp lại đợc loại bỏ trong quá trình mã hoá và đợc khôi phục lại tại phần giải mã Kỹ thuật DPCM cũng có thể sử dụng cho tín hiệu audio Đầu tiên tín hiệu audio
đợc tách ra thành một số các băng tần con có chứa một số âm rời rạc Sau đó mã hoá bằng DPCM và bộ dự báo thích hợp cho các băng có chu kỳ ngắn Loại mã hoá thích nghi này đợc thực hiện trên cơ sở quan sát năng lợng tín hiệu đầu vào để cải biên kích thớc bớc lợng tử hoá Đó là DPCM thích nghi (ADPCM)
3bit số mũ
16 bit
16 bit
Dòng bit mã hoá
16-bit ADC
Tính toán thang độ
Trang 36Hình 1.2 2 :Hệ thống mã hoá điểm quá tải khối dữ liệu audio
• Bộ mã hoá entropy tách độ d thừa bằng cách biểu diễn các hệ số lợng
tử hoá của băng tần con nhằm nâng cao hiệu quả mã hoá Các hệ số này đợc truyền theo bậc tăng tần số, tạo các giá trị lớn tại các tần số thấp và bớc chạy dài của các giá trị nhỏ hoặc gần bằng 0 cho các tần số cao VLC đợc thực hiện nhờ các bảng giá trị Huffman khác nhau để phù hợp thống kê tốt nhất với các giá trị có tần số thấp và cao
• Các thông số quá tải khối dữ liệu: Các giá trị nhị phân từ quá trình biến
đổi ADC, đợc nhóm thành các khối dữ liệu cả trong miền thời gian (bằng cách lấy mẫu kề nhau tại đầu ra ADC) lẫn trong miền tần số (bằng cách lấy các hệ số tần số tại đầu ra FDCT) Các giá trị nhị phân trong 1 block dữ liệu sau đó đợc tạo thang độ tiếp, sao cho giá trị vừa dới giá trị thang độ đầy đủ
Hệ số thang độ này ( gọi là số mũ) là chung cho tất cả các giá trị trong khối Cho nên, mỗi giá trị có thể biểu diễn bằng một định trị (giá trị mẫu) và bằng một số mũ (chỉ thị biên độ riêng của mẫu) Đó là quá trình lợng tử hoá không
đều và kích thớc bớc lợng tử hoá đợc xác định bằng số các bít chiếm
trong khối Vị trí bít đợc tính trong mô hình HAS (hình 1.21) Giảm tốc độ
dữ liệu đợc thực hiện bằng cách gửi giá trị mũ lần một/ khối dữ liệu Mặc dù nhiễu phụ thuộc nội dung tín hiệu, nhng mã hoá đợc thực hiện tốt Kỹ thuật che mặt nạ giúp giảm nhiễu audio
1.3.2.2 Giảm dữ liệu có tổn thất
Nén có tổn thất nhờ kết hợp 2 hoặc nhiều kỹ thuật xử lý để sử dụng đặc
điểm không nhạy của HAS nhằm tách các thành phần phổ theo các thành phần
có biên độ cao hơn Giảm dữ liệu có tổn thất cho tỉ lệ nén từ 2:1 đến 20:1, phụ
Trang 37thuộc vào độ phức tạp của quá trình mã hoá giải mã và yêu cầu - về chất lợng audio
Giảm dữ liệu có tổn thất sử dụng kỹ thuật mã hoá thụ cảm, nguyên lý cơ bản là loại bỏ độ d thừa thụ cảm trong tín hiệu audio bằng cách xoá bất kỳ tín hiệu nào nằm dới đồ thị ngỡng Nén audio có tổn hao nhờ kết hợp nhiều
kỹ thuật:
• Che phủ miền thời gian và tần số các thành phần số liệu
• Che phủ lợng tử cho mỗi âm audio bằng cách sắp xếp đủ các bit để làm cho mức nhiễu lợng tử luôn dới đồ thị che mặt nạ ại các tần số Tgần tín hiệu audio, tỉ số SNR = 20dB 30dB (độ phân giải 4 - - 5 bit)
• Mã hoá nối Kỹ thuật này tách độ d thừa trong hệ thống đa kênh audio (các dữ liệu giống nhau tồn tại trong tất cả các kênh) Do đó, giảm dữ liệu đợc thực hiện nhờ mã hoá các dữ liệu giống nhau và chỉ thị cho bộ giải mã lặp lại
1.3.2.3 Quá trình mã hoá audio
Hiệu ứng che mặt nạ quan trọng nhất, xảy ra trong miền tần số Để tách
đặc tính này, phổ tín hiệu audio đợc tách thành các băng tần con với độ phân giải thời gian và tần số phù hợp với các độ rộng băng tần tới hạn của HAS Cấu trúc cơ bản của bộ mã hoá cảm thụ :
Băng lọc
Mô hình thu nhận
Lợng tử hoá mã hoá
Phân bố bit
Ghép kênh Phân bổ
bit tín hiệu vào
Trang 38Hình 1.23: Bộ mã hoá thụ cảm audio cơ bản
• Bộ xử lý thang độ và lợng tử hoá
• Bộ ghép kênh dữ liệu: Nhận dữ liệu lợng tử hoá và cộng thông tin phụ (thông tin vị trí bit và hệ thống thang độ) cho quá trình giải mã
a/ Filter bank
Có 3 loại filter bank:
- Subband ban : Phổ tín hiệu đợc chia thành các băng tần con có độ krộng bằng nhau (32 băng con trong MPEG - Layer I và II) Nó tơng tự quá trình HAS phân tích tần số (chia phổ audio thành các băng tới hạn) Độ rộng các băng tần con tới hạn có thay đổi Dới 500Hz, độ rộng băng là 100Hz, và
nó tăng đến nhiều KHz (trên 10 KHz) Dới 500Hz, một băng tần con chứa nhiều băng tần tới hạn Các mạch lọc băng tần con (nh mạch lọc gơng bình phơng đa pha: PQMF) có phần chồng nhau nhỏ và đợc dùng cho các mẫu thời gian kề nhau Ví dụ trong MPEG – Layer II, một frame audio đợc tách thành 32 băng con bằng nhau, mỗi băng con chứa 36 mẫu
Mỗi tín hiệu băng con sau đó đợc lợng tử hoá đều với một vị trí bit cho băng con để duy trì tỷ số mặt nạ trên nhiễu MNR (Mask to Noise Ratio) dơng Tỷ số này là dơng nếu đồ thị mặt nạ trên mức nhiễu
- Tranform bank: Thuật toán DCT cải biên (MDCT) đợc dùng để biến tín hiệu audio trong miền thời gian thành một số lợng lớn các băng tần con (256 - 1024) Sẽ có một số phần chồng giống nhau trong filter bank này
- Filter bank lai: Chúng hình thành các mạch lọc băng tần con tiếp theo sau mạch lọc MDCT Sự kết hợp này sẽ cung cấp độ phân giải tần số tinh hơn nh dùng trong MPEG III Tín hiệu vào đầu tiên đợc tách thành 32 băng tần con băng PQMF, sau đó MDCT đợc dùng trong 18 mẫu trong mỗi băng tần con (cung cấp 576 băng tần rất hẹp) Kết quả cho độ phân giải thời gian là 3.8ms
Trong các tín hiệu audio tĩnh, MDCT đợc thực hiện trên 18 mẫu đầu ra của băng tần con (cung cấp 2 biến đổi/ băng con/ Frame) Nếu đợc tách tức
Trang 39thời trong tín hiệu, thì thực hiện MDCT trên 6 mẫu đầu ra của băng tần con; kết quả độ phân giải theo thời gian đợc nâng cao 1.27ms
Đặc trng độ phân giải mạch lọc là kết quả phối hợp có hiệu quả của nhiều hệ số quan trọng Filter bank có độ phân giải thấp cho một số nhỏ các băng tần con và các thành phần âm thanh của hầu hết các phổ tín hiệu audio rơi trong từng băng con Vì lý do này cần mã hoá từng băng tần con Tuy nhiên một số ít băng tần con trong mạch lọc này làm giảm độ phức tạp mã hóa
và giải mã, trong khi đó cho độ phân giải về thời gian tốt
Bộ filter bank có độ phân giải cao, tạo một số lớn các băng tần con và các thành phần âm thanh của phổ tín hiệu audio không rơi vào trong tất cả các băng tần con Các băng tần con không có các thành phần âm thanh sẽ không cần mã hoá, do đó kết quả sẽ giảm tốc độ dữ liệu mã hoá Độ rộng băng tần hẹp có thể mô phỏng tốt hơn độ rộng băng tần giới hạn của HAS Tuy nhiên chúng có độ phân giải thời gian thấp (tạo các hiệu ứng tiền echo trong thời gian mã hóa tín hiệu tức thời) Có thể sử dụng Filter bank thích nghi bằng bộ tách tức thời
Một filter bank biến đổi 256 băng, có độ phức tạp tơng tự filter bank
32 băng con
Đặc điểm của quá trình filter bank đợc trình bày theo:
- Độ phân giải theo thời gian: bằng độ dài khối filter bank của các mẫu nhân với 20.83à s, độ rộng của một mẫu là 20.83à s đối với tốc độ lấy mẫu 48KHz Thông số này cho ý tởng của bộ hoạt động mã hoá tín hiệu tức thời
Ví dụ mã hoá AC 3: 128 x 20.83=2.66ms.-
- Độ phân giải theo tần số: Bằng độ rộng băng tần phổ cực đại/ tổng số băng tần con Độ rộng băng tần phổ cực đại bằng 24 KHz đối với tốc độ lấy mẫu 48KHz Ví dụ mã hoá AC – 3: 24000/256=93.75 Hz
- Độ dài Frame: Bằng số băng tần con nhân số mẫu trong một khối nhân với 20.83à s Giá trị này đợc tính cho tốc độ lấy mẫu 48 KHz Ví dụ mã hoá MPEG layer I: 32x12x20.83=8ms
Trang 40b/ Mô hình cảm thụ, đồ thị mặt nạ và vị trí bit
Có thể phân tích tâm sinh lý nghe với tín hiệu vào PCM (về nội dung năng lợng và tần số) nhờ thuật toán biến đổi fourier nhanh FFT Đồ thị mặt nạ đợc tính từ ngỡng nghe thấy và các đặc tính che tần số của HAS Dạng
và mức của đồ thị mặt nạ phụ thuộc nội dung tín hiệu Trong hình 1.24, độ
chênh lệch giữa đờng bao phổ tín hiệu và đồ thị mặt nạ đợc giảm đến mức cực đại là 40dB Độ chênh lệch quyết định số bit cực đại (trên cơ sở 6dB/bit) cần để mã hoá tất cả các phổ tín hiệu audio Quá trình xác lập vị trí bit đảm bảo nhiễu lỡng tử hoá thấp hơn mức nghe thấy Mức đồ thị mặt nạ cao hơn
đờng bao phổ tín hiệu 12KHz và không cần sắp xếp bit trong vùng này
Từ đồ thị mặt nạ, các ngỡng mặt nạ đợc dẫn từ mỗi băng tần con Mỗi ngỡng quyết định năng lợng nhiễu lỡng tử hoá cực đại chấp nhận trong mỗi băng tần con (tại đó nhiễu bắt đầu phát ra âm thanh cho các hệ thống nén không tổn thất)
Mã hoá MPEG dùng quá trình sắp xếp vị trí bit tiến - thích nghi, vì việc tính toán vị trí bit chỉ đợc tiến hành trên tín hiệu của bộ mã hoá Ngoài ra thông tin phụ cần một độ rộng băng tần truyền nhất định
(Hz) Phõn bố bit
8K 2K
Biờn độ
Tần số 6K
Đường bao tớn hiệu phổ (tớnh toỏn)