1. Trang chủ
  2. » Luận Văn - Báo Cáo

Công nghệ phát thanh số ứng dụng và triển khai trong tương lai ở việt nam

93 3 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Công Nghệ Phát Thanh Số Ứng Dụng Và Triển Khai Trong Tương Lai Ở Việt Nam
Tác giả Đỗ Thị Phượng Uyên
Người hướng dẫn TS. Phạm Văn Bình
Trường học Hà Nội University of Technology
Chuyên ngành Kỹ Thuật Điện Tử
Thể loại thesis
Năm xuất bản 2008
Thành phố Hà Nội
Định dạng
Số trang 93
Dung lượng 2,62 MB

Nội dung

Quá trình chuyển đổi tín hiệu tơng tự sang số bao gồm các bớc sau: • Lọc tín hiệu nhằm mục đích hạn chế băng tần • Lấy mẫu rời rạc hố tín hiệu theo thời gian • Lợng tự hố chuyển đổi g

Trang 1

bộ giáo dục và đào tạo trờng đại học bách khoa hà nội

đỗ thị phợng uyên

Hà nội - 2008

Tai ngay!!! Ban co the xoa dong chu nay!!! 17057204961701000000

Trang 2

bộ giáo dục và đào tạo

trờng đại học bách khoa hà nội





luận văn thạc sĩ khoa học

công nghệ phát thanh số ứng dụng và triển khai trong tơng lai ở việt nam

Trang 3

TÓM TẮT LUẬN VĂN

Luận văn "Công nghệ phát thanh số Ứng dụng và triển khai trong -

tương lai ở Việt Nam" được nghiên cứ tại rường Đại họ Báchu T c Khoa -

Hà N ội Luận văn trình ày tổng quan âm thanh, các công n b về ghệ xử lý âm thanh số, giới thiệu một cách sâu sắc các tiêu chuẩn phát thanh số đã triển khai và thử nghiệm trên thế giới Thông qua các tiêu chí, quan điểm đánh giá đưa ra đề xuất tiêu chuẩn phát thanh số mặt đất trong điều kiện của Việt Nam

Âm thanh số với độ méo tín hiệu nhỏ, dải động âm thanh lớn, đáp tuyến tần số bằng phẳng, tìm kiếm dữ liệu nhanh chóng dễ dàng, ghi âm số nhiều lần mà chất lượng không suy giảm, lưu trữ số và các hệ thống sản xuất chương trình audio dựa trên máy tính tỏ ra rất hiệu quả Được kết hợp với kỹ thuật nén, audio số có nén lại càng có nhiều ưu điểm hơn như tiết kiệm bộ nhớ, tiết kiệm kênh truyền…Hệ thống thông tin chỉ cần truyền tải tín hiệu âm thanh tại đầu vào với độ chính xác vừa đủ để cho phép đầu thu có khả năng tái tạo lại tín hiệu ban đầu

Phát thanh số làm nâng cao chất lượng chương trình, giảm chi phí khai thác, tăng nguồn thu dịch vụ gia tăng; nâng cao hiệu quả sử dụng phổ tần số

vô tuyến điện Do đó chuyển sang phát thanh số là một xu thế tất yếu của thế giới Hiện nay trên thế giới đang tồn tại nhiều nhiều tiêu chuẩn phát thanh số, mỗi tiêu chuẩn có đặc điểm và phạm vi ứng dụng khác nhau như tiêu chuẩn EUREKA147 ở châu Âu, DMB ở Hàn Quốc, ISDB-T ở Nhật Nhiều nước châu Âu, châu Á đang hoàn thành giai đoạn thử nghiệm DAB để có thể đưa phát thanh số vào khai thác trên diện rộng Luận văn cũng xem xét, đánh giá những đặc điểm cơ bản và các ưu nhược điểm của các tiêu chuẩn từ đó đưa ra

đề xuất lựa chọn tiêu chuẩn phát thanh số mặt đất ở Việt Nam

Trang 4

THESIS SUMMARY

My thesis is “DAB - Application and deployment in distant future

in Vietnam”, studied at Ha Noi niver ity of Technology The he isU s t s presents an overview about audio and digital audio processing technologies; analyses DAB standards tested and deployed in the world and suggests a DAB standard suitable to Vietnam conditions

The advantages of digital audio can be summed up as follows: little signal deformation, wide audio dynamic range, searching databases easily and quickly, better copyability and storing digitals and program producing system based on the computer efficiently Compressed digital audio can save transmission channel and memory by combining with compressed technology… System only need transmiss audio signals at the input with enough accuracy to receiver to recreate the original signals

DAB improves the quality of programs, reduces operation cost, increases more profits from adding services and improves the efficiency of using frequency range Therefore, changing to using DAB is an indispensable trend in the world Nowadays, there are many DAB standards in the world Features and application scope of each is different such as EUREKA147 in Europe, DMB in Korea, ISDB-T in Japan Many countries in Europe and Asia are trying to complete DAB testing stage in order to deploy DAB on wide scale The thesis also considers and appreciates the basic features, advantages and disadvantages of each DAB standard, from this giving the suggestion to choose a suitable DAB standard in Vietnam

Trang 5

MỤC LỤC

Danh mục cỏc ký hiệu và chữ viết tắt 5

Danh mục cỏc hỡnh vẽ và bảng biểu 7

Lời núi đầu 9

1 Tổng quan về phát thanh số 11

1.1 - Âm thanh và đặc tính của âm thanh 11

1.1.1 - Sóng âm 11

1.1.2 - Sự cảm nhận của thính giác 12

1.2 - Số hóa tín hiệu audio 14

1.2.1 - Biến đổi ADC 16

a Lấy mẫu 16

b Lợng tử hóa 18

c Mã hóa 21

d Dither 23

e Dải động 24

f Tần số lấy mẫu chuẩn 24

g Chức năng tiền nhấn 25

1.2.2 - Biến đổi DAC 25

a Hiệu ứng méo độ nở 26

b Lọc thông thấp 27

c Lấy mẫu ở tần số cao 27

d Tạo dạng nhiễu 30

e Hạn chế của ADC/DAC 31

1.3 - Nén audio số 32

1.3.1 - Cơ sở của nén dữ liệu audio 32

1.3.1.1 - Mô hình tâm lý thính giác 33

Trang 6

1.3.1.2 - Sự che lấp tín hiệu audio 33

1.3.2 - Kỹ thuật giảm dữ liệu audio 36

1.3.2.1 - Giảm dữ liệu không tổn thất 36

1.3.2.2 - Giảm dữ liệu có tổn thất 38

1.3.2.3 - Quá trình mã hóa audio 38

a Filter band 39

b Mô hình cảm thụ, đồ thị mặt nạ và vị trí bit 41

c Bộ tạo thang độ và bộ lợng tử hóa 42

d Ghép kênh dữ liệu 43

1.4 - Tiêu chuẩn mã hóa audio 43

1.4.1 - Tiêu chuẩn nén AC3 43

1.4.2 - Tiêu chuẩn nén ATTRAC 45

1.4.3 - Tiêu chuẩn nén MPEG-1 49

a Layer I 51

b Layer II 52

c Layer III 53

1.4.4 - Hệ thống MPEG 2 cho audio 54

2 Các tiêu chuẩn PTS đã triển khai và đang thử nghiệm trên thế giới 57

2.1 - Tình hình nghiên cứu và phát triển phát thanh số 57

trên thế giới và khu vực Châu á - Thái Bình Dơng

2.2 - Tiêu chuẩn EURKA-147 62

2.2.1 - Các đặc điểm cơ bản 62

2.2.2 - Mã hóa và chèn theo thời gian 63

2.2.3 - Điều chế OFDM và các chế độ truyền dẫn 63

2.2.4 - Thiết lập mạng 64

2.3 - Tiêu chuẩn WORLDSPACE 65

2.4 - Tiêu chuẩn IN-BAND/ON CHANEL- 66

2.5 - Tiêu chuẩn DIGITAL AM 68

2.6 - Tiêu chuẩn BST-OFDM ISDB 72

Trang 7

2.7 - Tiêu chuẩn DRM 74

2.8 - Tiêu chuẩn DMB 74

3 Nghiên cứu khả năng ứng dụng và triển khai 76

công nghệ phát thanh số mặt đất ở Việt Nam 3.1 - Tình hình phủ sóng phát thanh tại Việt Nam 76

3.2 - Đánh giá và đề xuất lựa chọn tiêu chuẩn phát thanh số 76

cho tiếng nói Việt Nam 3.2.1 - Tiêu chí, quan điểm đánh giá 77

3.2.2 - Đánh giá và đề xuất lựa chọn tiêu chuẩn 78

Kết luận 86

Tài liệu tham khảo 87

Phụ lục 88

Túm tắt luận văn 93

Trang 8

Lời nói đầu

Ngành phát thanh của Việt Nam đã phát triển và hình thành một mạng lới các đài phát thanh từ trung ơng tới địa phơng đáp ứng đợc nhiệm vụ chính trị, xã hội, văn hoá Diện tích phủ sóng và chất lợng thu về cơ bản đã

đáp ứng đợc yêu cầu thực tế Tuy nhiên với công nghệ phát thanh analog việc phát triển ngành để đáp ứng kịp nhu cầu phát triển của xã hội sẽ gặp một vài khó khăn trở ngại nh: Chi phí cho việc mở rộng vùng phủ sóng (tăng từ 87% hiện nay lên 100%) sẽ rất tốn kém, mở thêm chơng trình cần đầu t thêm mạng phát sóng, truyền dẫn tín hiệu, kinh phí đầu t lớn Trong khi nhu cầu cần tăng thêm chơng trình là rất cần thiết Chi phí khai thác mạng phát sóng rất cao, chủ yếu do điện năng tiêu thụ Chất lợng thu bị han chế do hiện tợng pha đinh, nhiễu đa đờng

Công nghệ phát thanh số và việc triển khai phát thanh số thay cho phát thanh tơng tự đã đợc áp dụng ở nhiều nơi trên thế giới từ cách đây hơn 10 năm Tuy vây, đối với nớc ta để đa ra kiến nghị lựa chọn bộ tiêu chuẩn phát thanh số và lộ trình phát triển phát thanh số cho Tiếng nói Việt Nam, cần tiến hành nghiên cứu nắm vững các tiêu chuẩn phát thanh số hiện tại kết hợp xem xét nhiều yếu tố ảnh hởng khác nh: xu thế phát triển phát thanh số trên thế giới và trong khu vực, chiến lợc phát triển kinh tế xã hội của Việt Nam, của ngành phát thanh Việt Nam và của các ngành có liên quan ( viễn thông, truyền hình, công nghiệp điện tử…), khả năng phục vụ, các tiêu chí về kinh tế, kỹ thuật ( điều kiện địa hình phủ sóng, khả năng tận dụng cơ sở hạ tầng sẵn có, phổ tần số sử dụng, phạm vi áp dụng, chính sách phủ sóng, giá thành máy thu…) Chuyển sang phát thanh số là xu thế tất yếu của thế giới Việt Nam không thể là một ngoại lệ Lý do chính là vì phát thanh là cầu nối giữa các quốc gia là phơng tiện nghe thống nhất và phổ cập trên toàn cầu Bên cạnh ,

đó, phát thanh số có những u điểm là nâng cao chất lợng chơng trình, giảm chi phí khai thác, tăng nguồn thu dịch vụ gia tăng; nâng cao hiệu quả sử dụng

Trang 9

phổ tần số vô tuyến điện Giải pháp về công nghệ lại đa dạng và đang phát triển …Nhng để đảm bảo cho việc triển khai phát thanh số thành công ở Việt Nam thì việc lựa chọn một bộ tiêu chuẩn hợp lý là rất cần thiết

Với những lý do trên, tôi chọn đề tài “Công nghệ phát thanh số - ứng dụng và triển khai trong tơng lai ở Việt Nam” nhằm mục đích tìm hiểu, nghiên cứu công nghệ phát thanh số và đa ra đợc mô hình triển khai cho phát thanh Việt Nam

Luận văn đợc trình bày gồm 3 chơng với nội dung nh sau :

- Chơng 1: Giới thiệu tổng quan về phát thanh số

- Chơng 2: Các tiêu chuẩn phát thanh số đã triển khai và đang thử nghiệm trên thế giới

- Chơng 3: Nghiên cứu khả năng ứng dụng và triển khai công nghệ phát thanh số cho Việt Nam

Tôi xin bày tỏ lòng cảm ơn sâu sắc tới TS Phạm Văn Bình đã tận tình hớng dẫn tôi nghiên cứu, tìm hiểu và tạo mọi điều kiện để tôi có thể hoàn thành luận văn tốt nghiệp

Do hạn chế về thời gian và kiến thức, luận văn tốt nghiệp của tôi còn rất nhiều thiếu sót Kính mong nhận đợc sự đóng góp ý kiến của thầy cô và các bạn để đề tài của tôi đợc hoàn thiện hơn

Xin trõn trọng cảm ơn

Hà nội, ngày 5 thỏng 10 năm 2008

Học viờn

Đỗ Thị Phượng Uyờn

Trang 10

Chơng 1

Tổng quan về phát thanh số

Trên thế giới hiện nay đang tồn tại rất nhiều tiêu chuẩn phát thanh số và

đợc phát sóng truyền dẫn dới nhiều hình thức khác nhau: Phát sóng qua vệ tinh, truyền dẫn qua cáp, truyền dẫn qua Internet và phát sóng mặt đất nhằm phục vụ ngời nghe sử dụng các hình thức thu đa dạng nh: các máy thu cố

định, di động, trên ôtô… với các chơng trình có chất lợng cao Việc lựa chọn truyền dẫn dới hình thức nào còn tuỳ thuộc vào các điều kiện: địa hình, phân

bố dân c, điều kiện kinh tế, điều kiện xã hội… Tuy nhiên dù theo tiêu chuẩn nào và truyền dẫn dới hình thức nào thì khởi đầu cho phát thanh số vẫn là kỹ thuật chuyển đổi các tín hiệu âm thanh tơng tự thành âm thanh số Chơng 1

sẽ trình bày tổng quan về âm thanh, kỹ thuật xử lý âm thanh số, nén tín hiệu

âm thanh số để làm cơ sở cho việc xây dựng nội dung của các chơng tiếp theo

1.1 - âm thanh và đặc tính của âm thanh

Khi một vật dao động về một phía nào đó, nó làm cho các lớp không khí liền trớc bị nén lại, và lớp không khí liền sau dãn ra Sự nén và dãn không khí nh vậy lặp đi lặp lại một cách tuần hoàn nên đã tạo ra trong không khí một sóng đàn hồi Sóng này truyền tới tai, nén vào màng nhĩ khiến cho màng nhĩ cũng dao động với cùng tần số Khi màng nhĩ dao động, các vị trí phân biệt của màng nhĩ trên bề mặt giống nh nó chuyển động về trớc hay sau đáp ứng với các sóng âm vào Khi cùng một thời điểm, ta nghe thấy nhiều âm, thì mọi

âm thanh phân biệt này đợc trộn với nhau một cách tự nhiên trong tai giống nh một hình mẫu đơn của áp suất không khí thay đổi Tai và óc làm việc cùng nhau để phân tích tín hiệu này ngợc lại thành những cảm giác về âm riêng biệt

Trang 11

• Thanh ỏp P: độ dao động ỏp suất của khớ quyển khi bị súng õm tỏc động, bằng ỏp suất tổng ở thời điểm hiện tại trừ đi ỏp suất tĩnh

đơn vị: Pascal (Pa)

• Mức thanh ỏp = bỡnh phương thanh ỏp, được dựng để chuẩn húa (20 mPa2) khi tớnh õm lượng theo đơn vị dB

• Mức õm thanh được tớnh theo đơn vị dB

- Sự biến đổi của mức õm theo thang loga phự hợp với tõm sinh lý con người

• Âm thanh bao gồm õm đơn và õm phức

Âm đơn : là õm được hỡnh thành tại một tần số theo dao động sin

Âm phức : là õm được hỡnh bởi nhiều tần số theo dao động sin

Tai ngời bình thờng có thể nghe âm thanh trong phạm vi tần số 20Hz tới 15.000Hz, riêng lứa tuổi 18 có thể nghe đến 20.000Hz Âm có tần số dới 20

Hz là hạ âm, trên 20.000Hz là siêu âm tai ngời không thể nghe thấy đợc Trong phạm vi tần số cảm thụ âm thanh nói trên độ nhạy cảm theo tần số cũng

Trang 12

kh¸c nhau §é nh¹y c¶m cao nhÊt cña tai n»m ë ph¹m vi tÇn sè tõ 1000Hz tíi 5000Hz vµ gi¶m dÇn ë tÇn sè thÊp

H×nh 1.1 : C¬ quan thÝnh gi¸c

• Cảm nhận về tần số: là sự cảm nhận về độ cao của âm

Quy luật: Khi tần số tăng lên gấp 2 lần thì cảm nhận sự thay đổi của độ cao

của âm là tương đương

• Cảm nhận về biên độ : là sự cảm nhận về độ to của âm

Quy luật: Khi âm lượng tăng lên gấp 10 lần thì cảm nhận sự thay đổi của độ

to của âm là tương đương

- Ngưỡng nghe được: Cường độ âm lớn nhỏ nhất mà tai người có thể cảm thụ được Phân biệt có âm thanh tồn tại hay không Giá trị : 0 dB

- Ngưỡng chói tai: Cường độ âm lớn nhất mà tai người còn cảm thụ được Ngưỡng phân biệt âm thanh có làm tổn thương cơ quan thính giác hay không Giá trị : 120 dB

• Hiệu ứng che lấp là hiệu ứng làm thay đổi ngưỡng nghe thấy do tác động của nguồn âm khác (nhiễu)

Mức che lấp là khoảng dịch chuyển ngưỡng nghe thấy khi có và không có tác động che lấp Các yếu tố ảnh hưởng : Thời gian, Tần số, Mức, Đặc tính của

âm thanh

Trang 13

• Hiệu ứng stereo

Monophonic : nguồn đơn

Stereophonic tạo hiệu ứng về mặt khụng gian qua cảm nhận 3 thuộc tớnh của nguồn õm để định vị nguồn õm về mặt khụng gian:

- Biờn độ : hướng tỷ lệ với độ lớn tương đối cảm nhận giữa 2 tai

- Pha : hướng của nguồn õm

- Thời gian : khoảng cỏch tỷ lệ với thời gian truyền õm

1.2 - số hóa các tín hiệu audio

Xử lý tín hiệu âm thanh theo công nghệ số có rất nhiều u điểm nh:

- Ưu điểm nổi bật của âm thanh số là nhiễu không thể xâm nhập đợc vào tín hiệu

- Cải thiện tỷ số tín hiệu/ tạp âm

- Việc tìm kiếm dữ liệu nhanh chóng, dễ dàng

Từ những năm 80, thiết bị audio số đã dần thay thế thiết bị audio tơng

tự trong sản xuất chơng trình và phát sóng Ưu điểm nổi bật là ghi âm số nhiều lần mà chất lợng không suy giảm, lu trữ số và các hệ thống sản xuất chơng trình audio dựa trên cơ sở máy tính tỏ ra rất hiệu quả Công nghệ số cho phép ghi, xử lý, truyền dẫn phát sóng và thu thanh hoàn toàn trong môi trờng số

Để thiết bị số có thể hoạt động, tín hiệu audio tơng tự phải đợc chuyển thành tín hiệu audio số (ADC) Xử lý audio số sẽ có giá trị , nếu quá

Trang 14

trình ADC không gây giảm chất lợng và phải có các định dạng số thích hợp cho ghi âm và truyền dẫn

Về cơ bản, âm thanh tơng tự và số là khác nhau, nên ta luôn bị mất thông tin khi làm phép chuyển đổi giữa chúng Khi đợc số hoá, sóng âm thanh đợc biểu diễn nh là một chuỗi các số (đợc gọi là các mẫu), mà chúng biểu diễn áp suất không khí hay tín hiệu điện tại các thời điểm kế tiếp nhau theo thời gian Khi mẫu hoá một tín hiệu tơng tự, ta luôn gặp phải 2 vấn

đề: thứ nhất, mỗi giá trị kế tiếp trong dạng biểu diễn dạng số là một quãng xác

định nào đó của thời gian, và mỗi khối có một độ rộng xác định; thứ hai là các

số số hoá là rời rạc Chỉ có một số xác định các độ cao có thể cho mỗi khối Theo hình vẽ, ta thấy độ cao các khối không ăn khớp với đờng tín hiệu gốc

Tín hiệu tơng tự Tín hiệu số

Hình 1.2: Chuyển đổi tín hiệu sang dạng các mẫu số

Đây là hai lỗi cơ bản trong tín hiệu âm thanh số Lỗi này có thể đợc kiểm soát bằng cách thay đổi khuôn dạng chi tiết của dạng biểu diễn âm thanh, nhng không thể loại bỏ đợc hoàn toàn Chính vì vậy, tuỳ theo ứng dụng ta sẽ phải chấp nhận một số lỗi nhất định Và các hệ số khác nh kích thớc dữ liệu hay tần số xử lý yêu cầu ta phải chấp nhận một sai số lớn hơn từ một số nguồn để có thể giảm hơn nữa các sai số khác

1.2.1 - Biến đổi ADC

Microphone và loa là các linh kiện tơng tự, hoạt động với các tín hiệu tơng tự Vì vậy các tín hiệu điện liên tục theo thời gian phải đợc chuyển đổi

Trang 15

thành các định dạng số rời rạc theo thời gian dùng cho xử lý số tín hiệu Bộ biến đổi ADC có ảnh hởng lớn đến chất lợng audio số Quá trình chuyển

đổi tín hiệu tơng tự sang số bao gồm các bớc sau:

• Lọc tín hiệu nhằm mục đích hạn chế băng tần

• Lấy mẫu (rời rạc hoá tín hiệu theo thời gian)

• Lợng tự hoá (chuyển đổi giá trị liên tục của tín hiệu thành giá trị rời rạc theo biên độ)

• Mã hoá (gán giá trị nhị phân cho các mẫu)

a/ Lấy mẫu

Nguyên tắc lấy mẫu:

Theo định lý Nyquist : Để chuyển đổi một tín hiệu tơng tự thành tín hiệu

số, thì tín hiệu tơng tự cần thiết phải đợc lấy mẫu trớc tiên, ở những điểm nhất định về thời gian giá trị mẫu tín hiệu vào này cần đợc lấy mẫu Khoảng thời gian cố định giữa mỗi mẫu đợc gọi là khoảng lấy mẫu ( ts)

Hình 1.3: Quá trình chuyển đổi tín hiệu liên tục

Định lý lấy mẫu hoàn toàn đơn giản, tần số lấy mẫu fs lớn hơn hoặc bằng hai lần tần số cực đại của tín hiệu tơng tự gốc : fs ≥ 2fmax

Quá trình lấy mẫu thực hiện việc phân tích tín hiệu audio tơng tự với chuỗi xung có thời gian lặp lại với tần số lấy mẫu Đó lá quá trình điều biên xung

(PAM) trong miền thời gian ( hình 1.4), và trong miền tần số (hình 1.5)

Theo định lý Nyquist, với fs ≥ 2fmax (fs - tần số lấy mẫu, fmax - tần số audio cực

đại) thì các biên phụ không chồng lên nhau, không có hiện tợng chồng phổ

(hình 1.6)

Trang 16

Trớc khi thực hiện biến đổi ADC, phải hạn chế phổ tần số audio đến giá trị nhỏ hơn 1/2fs

Hình 1.4: Quá trình lấy mẫu (PAM) trong miền thời gian

Hình 1.5: Phổ điều chế với các biên phụ (fs= fmax) xung quanh

tần số lấy mẫu trong miền tần số

Hình 1.6: Hiện t-ợng chồng phổ

Biờn độ

Thời gian Tớn hiệu Audio

Xung lấy mẫu

Phổ tần số lấy mẫu

Điều biờn

Tớn hiệu Audio lấy mẫu

Trang 17

Xung lấy mẫu phải có số thời gian hẹp, bằng một chu kỳ lấy mẫu (1/fs).Trong thực tế bộ ADC, giá trị biên độ xung của mỗi mẫu đợc giữ cho

đến khi nào đạt mẫu tiếp theo (hình 1.7)

Hình 1.7: Quá trình lấy mẫu và giữ (sampling- and hold) trong miền thời gian

-b/ Lợng tử hoá

Sau quá trình lấy mẫu tín hiệu vẫn còn là tơng tự, quá trình chuyển thành tín hiệu số thực sự diễn ra ở bớc lợng tử hóa này Quantizing -

(hình1.8a) Đây chính là quá trình chuyển đổi từ giá trị điện áp sang dạng giá

trị số tơng ứng.Trong một hệ thống, dải tín hiệu tơng tự đợc chia thành một số vùng, và những mẫu tín hiệu đợc gán một giá trị nhất định Những giá trị này đợc biểu thị dới dạng nhị phân, với số dơng đợc biểu thị bằng mã nhị phân tự nhiên còn với số âm thì biểu thị bằng mã dơng cộng thêm số

1 Trong hệ thống nh vậy , bit mang ý nghĩa nhiều nhất MSB đợc dùng nh

là bit dấu , nó là “0” với những giá trị dơng, là “1” với những giá trị âm Những vùng trong đó tín hiệu đợc chuyển đổi gọi là khoảng lợng tử, biểu thị bằng chữ Q Một dãy n bit biểu thị cho giá trị điện áp tơng ứng với khoảng lợng tử gọi là từ mã

Quá trình lợng tử hoá có các đặc điểm sau đây:

Biờn độ

Thời gian Tớn hiệu Audio

Xung lấy mẫu

Thời gian

Điều biờn

Tớn hiệu đó lấy mẫu

Thời gian

Trang 18

• Khoảng giá trị nhị phân không đối xứng với các chuyển dịch dơng và

âm của tín hiệu audio gốc

• Tín hiệu tơng tự có biên độ thấp đợc lợng tử hoá với rất ít mức rời rạc Việc này gây ra sai số lợng tử Muốn giảm sai số lợng tử phải tăng số mức rời rạc Hệ thống 5 bit sẽ giảm khoảng lợng tử hoá xuống còn 1/2 so với

hệ thống 4 bit Bộ lợng tử hoá 16 bit có thể làm tăng 65.535 (216-1) khoảng lợng tử Một phơng pháp khác giảm sai số lợng tử hoá là tăng tần số lấy mẫu ( oversampling – lấy mẫu cao)

Hình 1.8: Quá trình lấy mẫu và sai số l-ợng tử hoá trong ADC 4 bit

• Nếu biên độ tín hiệu audio tơng tự vợt quá khoảng lợng tử hoá thì sẽ xảy ra cắt số (digital clipping)

Theo nguyên tắc lợng tử , do các điện áp trong khoảng lợng tử đợc đại diện bằng một mức trung bình nên quá trình lợng tử là quá trình không tuyến tính và có thể tạo ra lỗi , các lỗi này gọi là lỗi lợng tử Sai số lợng tử hoá phụ thuộc vào tín hiệu: Nếu nhiễu nhẹ tồn tại trong tín hiệu gốc, thì nó sẽ

Thời gian Biờn độ

1/f s

a) Thời gian lấy mẫu và giỏ trị

lượng tử hoỏ 4 bit

Trang 19

cộng vào các thành phần ngẫu nhiên Sai số lợng tử hoá có thể coi nh là nhiễu cộng vào tín hiệu gốc và làm cho chất lợng âm thanh thô hơn

Tỷ số tín hiệu trên nhiễu (SNR) là tỉ số tín hiệu dạng sine cực đại (dới mức cắt) trên giá trị RMS (căn bình phơng trung bình) của sai số lợng tử hoá (e) Với ADC n bít, một nửa các khoảng lợng tử hoá 2- n-1 đợc dùng cho một cực tính của sóng sine Giá trị sóng sine với RMS cực đại đợc tính nh

sau:

2

.

2 1 Q V

n−

( Q: khoảng lợng tử hoá, 2n-1: 1/2 số khoảng lợng tử hoá 2n)

Các tín hiệu audio có phổ rộng và các giá trị biên độ cao sẽ tạo sai số lợng tử hoá có xác suất bằng nhau với bất kỳ một giá trị nào giữa : +Q/2 và - Q/2 Cho nên có các giá trị ngẫu nhiên Q trong một khoảng lợng tử hoá và xác xuất cho mỗi giá trị bằng 1/Q Giá trị RMS của nhiễu lợng tử đợc biểu diễn bằng căn bình phơng trung bình của tổng các sai số bình phơng:

Tổng sai số trung bình bình phơng: +∫

2 / 2 / 2 Q Q

de e

Trung bình của tổng : +∫

2 /

2 / 2

Q

de e Q

Căn bình phơng trung bình:

Điện áp nhiễu = ∫

2 / 2 / 2

1 ) (

Q Q

de e Q

Q

Q N

c/ Mã hoá

Trang 20

Mỗi giá trị lợng tử hoá nhị phân cần phải đợc mã hoá để phù hợp với loại tín hiệu lấy mẫu, truyền dẫn và ghi âm Hệ thống mã hoá thờng dùng là PCM ( điều xung mã), PWM (điều chế theo độ rộng xung), ADM (điều chế dữ liệu thích nghi), DPCM (điều chế xung mã vi sai), FP - điểm di động (floating point)

PCM ít hiệu quả, nhng đơn giản PCM đợc thực hiện tuyến tính cho tất cả các khoảng lợng tử hoá Tất cả các mức lợng tử hoá đợc gán bằng các từ mã theo một trật tự logic

PAM (Pulse Amplitude Modulation)

Trong thực tế, các bộ chuyển đổi DAC và ADC thờng xuyên sử dụng dạng PAM điều chế biên độ xung, nh một khuôn dạng trung gian, trong đó -

âm thanh đợc coi nh một chuỗi các xung, và biên độ của mỗi xung (độ cao) biểu diễn độ mạnh của âm thanh tại điểm đó

Tín hiệu tơng tự Xung PAM

Hình 1.9: PAM

PWM (Pulse Width Modulation)

Ngoài ra, ta còn dạng biểu diễn khác là PWM điều chế độ rộng xung, - cũng giống nh PAM, đây là dạng biểu diễn mỗi mẫu nh một xung, nhng

nó sử dụng độ rộng hay khoảng kéo dài của xung (thay cho biên độ) để biểu diễn độ mạnh của âm thanh

Trang 21

Tín hiệu tơng tự Xung PWM

Hình 1.10: PWM

PCM (Pulse Code Modulation)

Đây là dạng biểu diễn mỗi mẫu nh một chuỗi các xung, mà các xung

đó biểu diễn mã nhị phân của nó Nhng biểu diễn dạng này rất khó xác định

đâu là điểm bắt đầu và kết thúc của mỗi mã Tuy nhiên, không khó khăn để có thể khắc phục điều này, ví dụ nh ta có thể xây dựng các mã theo một dạng riêng để không có mã nào chứa 3 số 1 liên tiếp (111) và sau đó chèn 111 vào tín hiệu tại điểm bắt đầu của mỗi mã Trong bộ nhớ máy tính, các mã nhị phân liên tiếp đợc lu trữ nh các số Thông thờng, dữ liệu âm thanh dạng PCM

đợc lu trữ với 8 hay 16 bits mỗi mẫu

Tín hiệu tơng tự Xung PCM

Hình 1.11: PCM

d/ Dither

Trang 22

Dùng kỹ thuật Dither để giảm méo lợng tử hoá các tín hiệu có mức thấp

Kỹ thuật Dither cộng nhiễu trắng vào tín hiệu (giá trị RMS của nhiễu trắng nhỏ hơn 1/3 khoảng lợng tử hoá) Khi biến đổi ngợc lại thành tơng tự, tín hiệu khôi phục không có liên quan với tín hiệu gốc Tuy nhiên, mạch lọc thông thấp khôi phục tín hiệu lấy trung bình tín hiệu theo thời gian; nhiễu

đợc tách ra và tín hiệu gốc đợc khôi phục xấp xỉ

Hình 1.12: Dither hoá tín hiệu vào có mức thấp.

e/ Dải động

Q/2

Q Q/2

Đầu ra lượng tử hoỏ Dạng sin gốc

Trang 23

Hình 1.13: Mã hoá 20 -bit nhị phâ n (giá trị 1 và 0)

Mức tín hiệu audio đạt cực đại trớc khi cắt mã số lớn nhất mà bộ ADC

có thể cho (hình 1.13) Mức này tơng đơng mức 0dB FS (thang độ đầy đủ)

và tất cả các mức số đợc chuẩn theo điểm này là các giá trị âm Mức cực tiểu

đợc đặt bằng nhiễu Dither ( 120 dBFS cho ADC 20bit) Do đó, dải động là

-120dB

f/ Tần số lấy mẫu chuẩn:

Hiện nay, thông thờng dùng 3 tần số lấy mẫu chuẩn:

• 32 K Hz (tiêu chuẩn chuyên dụng): Dùng trong truyền dẫn đến máy phát thanh FM Stereo

• 44,1 KHz (tiêu chuẩn dân dụng): Dùng trong máy ghi hình Umatic, CD, R-DAT (chỉ phát lại)

• 48 KHz (tiêu chuẩn phát thanh): Có thể dùng với băng tần audio tơng

tự lên đến 22 kHz

g/ Chức năng Preemphasis (tiền nhấn):

Giới hạn tớn hiệu dương max MSB

(Hex)

Trang 24

Kỹ thuật Preemphasis (tiền nhấn) và deemphasis (giải nhấn) đợc dùng trong ghi âm và phát lại Nó làm giảm nhiễu lợng tử hoá ở vùng tần số cao Cần lu ý là chức năng này đợc dùng trong máy ghi âm với tín hiệu audio vào là tơng tự Đối với máy ghi âm số có tín hiệu vào số thì không cần dùng

chức năng này

1.2.2 - Biến đổi DAC

Quá trình của bộ biến đổi ngợc (số ra tơng tự DAC) bao gồm:-

• Giải mã các từ mã nhị phân

• Biến đổi ngợc thành điện áp, biểu diễn các tín hiệu audio gốc

Hình 1.14 là mạch DAC có độ phân giải n bit Dữ liệu n bit điều khiển n - chuyển mạch (vị trí ON và OFF ứng với giá trị 0 và 1 của tín hiệu số) Các vị trí chuyển mạch cho giá trị điện áp V ở đầu ra tỉ lệ với các bit trong từ mẫu

-Dạng tín hiệu ra của DAC đợc cho trong hình 1.15

Hình 1.14 : Mạch DAC có độ phân giải n-bit

0

2 2 2 2 2 2

bit 0 bit 1 bit 2 bit 3 bit 4 bit n- 1

1 0 1 1 0 0 MSB

Điện áp ra (V)

- +

LSB

Nguồn điện

áp chuẩn

Biờn độ Biờn độ

Trang 25

Hình 1.15: Dạng tín hiệu ra của DAC

a/ Hiệu ứng aperture hiệu ứng méo độ mở -

Phổ tín hiệu lấy mẫu đợc điều chế biên độ với tín hiệu có đờng bao dạng sinx/x Đờng bao của hàm sinx/x biến đổi theo độ rộng xung lấy mẫu tại tần số cao Nếu xung có độ rộng gần bằng 0, thì quá trình lấy mẫu là lý tởng (sinx/x=1) và không có thay đổi ở tần số cao Sự thay đổi tăng theo độ rộng xung lấy mẫu; Hiện tợng này gọi là hiệu ứng thời gian aperture

Tỉ lệ: aperture =

s

Với: t- thời gian xung lấy mẫu Ts- chu kỳ lấy mẫu

Với tỷ lệ aperture bằng 1 (100%), độ suy giảm 4 dB tại 1/2 fs Nếu tỷ lệ aperture giảm xuống 12,5%, thì độ suy giảm còn 0,2 dB, nhng biên độ của

các biên phụ tăng

Trang 26

b/ Lọc thông thấp

Bộ lọc thông thấp (khôi phục tín hiệu) loại bỏ các hài bậc cao (trên fs/2)

đợc hình thành trong quá trình lấy mẫu Bộ lọc loại bỏ các thành phân tần số

cao chứa trong các tín hiệu bậc thang (hình1.15c)

c/ Lấy mẫu ở tần số cao

Lấy mẫu ở tần số cao (over samling) đợc dùng cho ADC và DAC nhằm nâng cao chất lợng (giảm méo lợng tử và thành phần chồng phổ)

Với sự thay đổi lớn biên độ tín hiệu audio tơng tự (lấy mẫu tần số cao), các mức lợng tử hoá rời rạc phụ đợc cộng vào, kết quả làm giảm sai số lợng tử hoá

Nếu lấy mẫu tần sỗ cao cho ADC có độ phân giải cao, ví dụ 18 bit, thì phải chia khoảng lợng tử 16 bit thành 4 khoảng Sử dụng độ phân giải của ADC cao hơn (>18 bit) sẽ làm giảm sai số lợng tử hoá 4 lần và nâng cao khả năng tạo lại các tín hiệu mức thấp của hệ thống

Với hệ thống dùng tần số lấy mẫu gấp 2 lần thì phổ của nhiễu lợng tử sẽ tăng trên 2 lần so với độ rộng băng tần thông thờng và tỉ số SNR tăng lên 3

dB Tỉ số SNR đối với một tín hiệu sin đợc tính nh sau:

SNR (dB) = 6,02n + 1,76 + 10log10d (1.6)Trong đó:

n – số bit/mẫu lợng tử hoá

d – hệ số lấy mẫu tần số cao

Vd : Với tần số lấy mẫu tăng 4 lần thì SNR tăng 6 dB

Hình 1.16 là sơ đồ khối của hệ thống ADC và DAC với tần số lấy mẫu gấp 4 lần

Mạch lọc số dùng cho ADC/DAC nhằm loại bỏ các thành phần tần số không mong muốn trong phổ tín hiệu trớc bộ DAC, và để tiết kiệm các mạch lọc chống chồng phổ (điểm cắt sắc nét) và mạch lọc khôi phục

Mạch lọc số có các hoạt động nh nhân, làm trễ, cộng các số nhị phân có

độ chính xác cao, dễ thực hiện

Trang 27

Hình 1.16: Hệ thống ADC/DAC với tần số lấy mẫu gấp 4 lần

Số phần tử trễ quyết định bậc của mạch lọc số Bậc càng cao thì có khả

năng tạo các dạng đặc tuyến cắt càng sắc nét mà không gây méo pha Hình

1.17 là ví dụ mạch lọc số dùng tần số lấy mẫu gấp 4 lần Mỗi tế bào D là một dây trễ (giống nh một bộ ghi dịch) Mỗi mẫu có trễ đợc nhân với các hệ số - (nhân với X1,, X2,…, Xn), kết quả đợc cộng lại trong bộ cộng nhị phân

LPF

Biến đổi 4f s - >fs

Lọc số LPF

Biến

đổi Fs->4f s

DAC Loc tơng

Trang 28

a) Läc ngang bËc n, dïng trong lÊy mÉu víi tÇn sè cao gÊp 4 lÇn

b) §¸p tuyÕn cña xung lÊy mÉu t¹i ®Çu ra bé läc sè

c) §¸p øng läc sè cã trÔ vµ tæng l¹i tÇn sè lÊy mÉu chuÈn

H×nh 1.17: M¹ch läc nèi tiÕp ngang (transversal filter) dïng trong ADC/DAC

cã tÇn sè lÊy mÉu gÊp 4 lÇn.

TÇn sè tæng céng ë ®Çu ra t¨ng gÊp 4 lÇn (192kHz) Phæ tÝn hiÖu lÊy mÉu

®îc cho trong h×nh 1.18 TÝn hiÖu gèc ®îc lÊy mÉu t¹i 48 kHz, tÊt c¶ c¸c

phæ xung quanh 48, 96, 144 kHz ®îc lo¹i bá b»ng m¹ch läc sè nèi tiÕp dïng

tÇn sè lÊy mÉu gÊp 4 lÇn, nhiÔu lîng tö ho¸ tr¶i phæ trong b¨ng tÇn b»ng 4fs/2

Thời gian

Đầu ra theo mẫu đầu vào x

Thời gian Đầu ra theo mẫu

đầu vào x + 1

Trang 29

Hình 1.18: Phổ tín hiệu tại đầu ra mạch lọc số dùng tần số lấy mẫu gấp 4 lần

d/ Tạo dạng nhiễu (noise shaping)

Lấy mẫu tần số cao sẽ mở rộng khoảng tần số tín hiệu lấy mẫu, trải phổ của nhiễu lợng tử hoá trên vùng băng tần cơ bản Kỹ thuật dao động nhiễu sẽ giảm mức phổ nhiễu trong băng tần cơ bản tín hiệu audio, nhng làm tăng mức phổ của nhiễu ngoài khoảng này Biên độ nhiễu đợc cố định, nhng phổ của nó đã thay đổi Ta có thế giảm nhiễu audio một cách đáng kể, nếu dùng cách lọc bậc 2 hoặc 3 để tạo dạng nhiễu

a) ADC với lấy mẫu tần số cao gấp 4 lần và vòng phản hồi

Tạo dạng/

tớch phõn nhiễu

Lọc số LPF

Thời gian

Hàm truyền tớn hiệu vào

Hàm truyền nhiễu lượng tử hoỏ (mạch lọc bậc 1) Biờn độ

f s /2

Trang 30

b) Phổ của tín hiệu audio t-ơng tự và tín hiệu nhiễu l-ợng tử hoá tại đầu ra ADC

Hình 1.19: ADC dùng tần số lấy mẫu gấp 4 lần và vòng phản hồi tạo dạng nhiễu

Hình 1.19a là sơ đồ khối bộ ADC có tần số lấy mẫu tăng gấp 4 lần và mạch phản hồi tạo dạng nhiễu Mạch phản hồi có hàm truyền đạt với đáp ứng phẳng cho tín hiệu vào tơng tự ( ngoài vòng phản hồi) và hàm truyền đạt tích phân đối với tín hiệu nhiễu lợng tử đa vào vòng phản hồi qua ADC

Hình 1.19blà phổ của tín hiệu tơng tự vào và tín hiệu nhiễu lợng tử

e/ Hạn chế của ADC/DAC

Cả hai mạch ADC và DAC đều có gây sai số cho tín hiệu audio Nói chung các sai số này là nhỏ, nhng nhiều lần đi qua ADC và DAC sẽ tích lại làm giảm chất lợng tín hiệu audio Có thể phân biệt sai số thành 2 nhóm:

- Nhiễu của bộ lọc thông thấp (LPF) Nếu một nhóm các tần số bị trễ hơn các nhóm khác trong phổ tín hiệu, thì sẽ xảy ra trễ nhóm Sai số trễ nhóm làm méo tín hiệu khôi phục Hơn nữa độ gọn của mạch lọc thông thấp khôi phục và chồng phổ có thể tích lại và tạo các sai số có biên độ đáng kể trong tín hiệu khôi phục Các sai số này có thể sửa bằng các mạch lọc số bậc cao

- Sai số biến đổi Các giá trị lợng tử hoá có sai số đợc hình thành, nếu tần

số lấy mẫu dạng chuông thay đổi, làm cho các vị trí và thời gian lấy mẫu không chính xác

1.3 - nén audio số

Do nhu cầu đòi hỏi phải ghi âm thanh trên các chất liệu ghi gọn nhẹ ngày càng lớn, nên bắt buộc những nhà sáng chế, nhà sản xuất nghĩ ra nhiều phơng pháp ghi âm tiên tiến sao cho ghi đợc ngày càng nhiều âm thanh trên các định dạng ghi âm nhỏ gọn Việc nén tơng tự cho phép làm giảm dải

động tín hiệu đáp ứng yêu cầu số hóa âm nhạc Theo những nghiên cứu y học hiện đại đã phát hiện ra rằng tai ngời rất nhạy cảm với một số tần số nhất

Trang 31

định, điều này dẫn tới một phơng pháp mã hóa ” mã hóa âm thanh giác quan” Phòng thí nghiệm Dolby vào năm 1984 đã đa ra phơng pháp , gọi tắt

là AC-1, đợc dùng trong phát thanh Thế hệ tiếp theo là AC-2 , AC-3 đợc dùng cho trờng quay và các sản phẩm hậu kỳ với tỉ lệ bit thấp và vì vậy hệ thống này đợc dành cho hệ thống phát thanh truyền hình Một bớc đột phá thực sự của công nghệ này do Sony tạo ra đó là ATRAC ( Adaptive transform Acoustic Coding) Hệ thống này có tỉ lệ nén 5:1 nên có sự suy giảm tín hiệu rất ít và đợc Sony chọn dùng cho hệ thống mã hóa âm thanh vòm trong chiếu bóng cũng nh trong định dạng ghi âm Minidisc

Tín hiệu Audio số PCM đợc dùng trong phát thanh, truyền hình, multimedia và nhiều ứng dụng khác (hệ thống nhiều đờng audio, nhà hát tại nhà) Tín hiệu âm thanh Stereo có độ phân giải 16 bit, lấy mẫu tại 48 kHz, sẽ cho tốc độ dữ liệu audio là 1.54 Mb/s, còn hệ thống âm thanh tròn nhiều kênh

có tốc độ dữ liệu 4.5 Mb/s Do đó cần nén dữ liệu có hiệu quả để lu trữ và phân phối kênh có độ rộng hẹp

Audio có nén đợc sử dụng trên CD-ROM, mạng phát thanh truyền hình

số qua vệ tinh DBS (Digital broadcast satellite) Các hệ thống nén thông tin

âm thanh dựa trên đặc trng tâm sinh lý nghe và các giới hạn của tai ngời để loại bỏ các thành phần dữ liệu d thừa trong tín hiệu audio

1.3.1 - Cơ sở của nén dữ liệu audio

Nén tín hiệu audio đợc thực hiện dựa trên cơ sở là mô hình tâm lý thính giác của con ngời, sự hạn chế về mặt cảm nhận và hiện tợng che lấp các thành phần tín hiệu âm thanh

Hệ thống thính giác của con ngời (Human Auditory System-HAS) có

đặc điểm nh một bộ phân tích phổ Nó chia dải phổ âm thanh nghe thấy thành các băng tần gọi là các “ băng tới hạn”(critical bands) nh một dãy các

bộ lọc thông dải Các băng này có bề rộng dải thông là 100 Hz với các tần số dới 500 Hz và tăng theo tần số tín hiệu với các tần số lớn hơn 500 KHz Bề

Trang 32

rộng dải thông này tăng tới vài KHz khi tần số tín hiệu lớn hơn 10 KHz Có thể mô hình hoá hệ thống cảm nhận của con ngời bằng 26 bộ lọc thông dải liên tiếp có bề rộng dải thông nh đã nói

Khi tín hiệu âm thanh bao gồm các tần số gần kề nhau, hệ thống thính giác của con ngời (HAS) sẽ tổ hợp chúng thành một nhóm có năng lợng cân bằng Ngợc lại, nếu âm thanh bao gồm nhiều tần số khác biệt nhau, chúng sẽ

đợc xử lý tách biệt và độ lớn âm đợc xác định

Tính nhạy cảm của HAS giảm tại các tần số cao và tần số thấp Điều này

có nghĩa rằng đối với các mức âm thấp thì sự thay đổi trong cảm nhận của con ngời là rất quan trọng và sẽ giảm dần tại các mức âm cao

1.3.1.2 Sự che lấp tín hiệu Audio -

Hệ thống thính giác của con ngời còn có một đặc điểm vô cùng quan trọng, đó là tính che lấp “ masking” Có hai dạng che lấp, đó là : che lấp thời gian và che lấp tần số Tiến hành thực nghiệm đối với hệ thống thính giác, ngời ta đã xây dựng đợc đặc tuyến che lấp trong miền thời gian và trong miền tần số

bị biến đổi bởi âm che lấp

Kết quả

che lấp tạo bởi

Trang 33

Để tai ngời có thể nghe thấy, bất cứ một âm thanh ở tần số đơn nào cũng phải có mức áp suất âm lớn hơn một giá trị ngỡng xác định Tập hợp tất cả các giá trị ngỡng này đối với tất cả các âm đơn trong dải tần nghe đợc tạo nên một đờng cong gọi là “ngỡng nghe thấy tuyệt đối” (absolute hearing threshold), là đờng đậm nét ở hình vẽ trên Tất cả các âm thanh nằm dới đờng cong này đều không có khả năng đợc con ngời cảm nhận

Do sự xuất hiện của một âm thanh có cờng độ cao ở một tần số nào đó,

sẽ làm đờng cong này biến đổi đi Trong ví dụ trên, âm 1 KHz với mức áp suất âm 45 dB đã làm ngỡng nghe thấy tuyệt đối dâng lên 27dB Điều này có nghĩa những tạp âm dới 27 dB là không nghe thấy Nếu sử dụng thang lợng

-tử có 6dB/ bớc nhảy thì chỉ cần 3 bít để mã hoá âm này vì giá trị vi sai ở đây là: 45 27 = 18 dB.-

Nếu mức âm 1-KHz tăng lên tới 65 dB thì mức che phủ sẽ tăng lên tới 55

dB, giá trị vi sai lúc này chỉ còn 10 dB và có thể đợc mã hoá chỉ bằng 2 bít Việc che phủ tần số trớc và sau cũng rất quan trọng Nh trên hình vẽ,

âm 1-KHz cũng làm ngỡng nghe thấy của các âm tần số xung quanh dâng lên Sự che phủ tần số phía sau quan trọng hơn và tăng theo mức âm Điều này cho phép giảm độ chính xác mã hoá cho những tần số tín hiệu xung quanh âm

Trang 34

che phủ Những âm đơn tần xung quanh 1-KHz có mức âm nhỏ hơn đờng cong che phủ sẽ không có khả năng cảm nhận và không cần thiết phải mã hoá

mà vẫn không làm ảnh hởng tới chất lợng cảm nhận của con ngời Hệ thống nén dựa trên đặc điểm này đợc gọi là hệ thống nén theo thính giác

♦ Sự che phủ thời gian

Sự che phủ thời gian là hiện tợng tai ngời chỉ cảm nhận đợc âm sau khi âm

đó bắt đầu khoảng 200 ms và có cảm tởng âm thanh còn kéo dài khoảng 200ms nữa sau khi âm thanh đã dứt Ngoài ra, thính giác cũng không phân biệt đợc khoảng ngừng nhỏ hơn 50 ms giữa hai âm thanh giống nhau đi liền nhau

1.3.2 - Kỹ thuật giảm dữ liệu audio

Kỹ thuật mã hoá nguồn đợc dùng để loại bỏ độ d thừa của tín hiệu audio (nếu độ chênh lệch mẫu - đến - mẫu bằng 0) và kỹ thuật che mặt nạ tâm sinh lý nghe đợc dùng để nhận dạng và loại bỏ nội dung không thích hợp (các mẫu không phải là audio) Có 2 kỹ thuật nén dữ liệu chính sau đây:

250

0

Tín hiệu che lấp

Hình 1.21 : Sự che lấp về thời gian

Che phủ trớc

Che lấp liên tục

Che phủ sau

Trang 35

- Mã hoá dự báo miền thời gian: Loại mã hoá này sử dụng mã hoá vi sai

để khôi phục phần chênh lệch giữa các mẫu kề nhau Tốc độ bit đợc giảm sẽ

có thể dùng để mã hoá và truyền thông tin audio

- Mã hoá biến đổi miền tần số: Kỹ thuật này dùng các khối của các mẫu audio mã hoá PCM tuyến tính, đợc biến đổi từ miền thời gian thành một số nhất định các băng tần khác nhau trong miền tần số

Hiện tợng che lấp quan trọng nhất xảy ra trong miền tần số Để lợi dụng

đặc điểm này, phổ tín hiệu audio đợc phân tích thành nhiều băng phụ có độ phân giải thời gian và tần số phù hợp với bề rộng các băng tần tới hạn của HAS Mỗi băng phụ chứa một số thành phần âm rời rạc

1.3.2.1 Giảm dữ liệu không tổn thất

Nén không tổn thất cho phép khôi phục thông tin dữ liệu gốc từ bit đến bit sau khi dãn một cách trung thực Nó loại bỏ độ d thừa thống kê tồn tại trong tín hiệu audio bằng các giá trị dự báo từ các mẫu trớc Có thể đạt tỉ lệ nén thấp (tốt nhất là 2:1) và phụ thuộc vào độ phức tạp của tín hiệu audio gốc Nhờ mã hoá dự báo miền thời gian mà ta có thể nén không tổn thất:

• Thuật toán vi sai: Tín hiệu audio có chứa các âm lặp lại cũng nh số lợng lớn độ d thừa và các âm thanh không thích hợp Dữ liệu lặp lại đợc loại bỏ trong quá trình mã hoá và đợc khôi phục lại tại phần giải mã Kỹ thuật DPCM cũng có thể sử dụng cho tín hiệu audio Đầu tiên tín hiệu audio

đợc tách ra thành một số các băng tần con có chứa một số âm rời rạc Sau đó mã hoá bằng DPCM và bộ dự báo thích hợp cho các băng có chu kỳ ngắn Loại mã hoá thích nghi này đợc thực hiện trên cơ sở quan sát năng lợng tín hiệu đầu vào để cải biên kích thớc bớc lợng tử hoá Đó là DPCM thích nghi (ADPCM)

3bit số mũ

16 bit

16 bit

Dòng bit mã hoá

16-bit ADC

Tính toán thang độ

Trang 36

Hình 1.2 2 :Hệ thống mã hoá điểm quá tải khối dữ liệu audio

• Bộ mã hoá entropy tách độ d thừa bằng cách biểu diễn các hệ số lợng

tử hoá của băng tần con nhằm nâng cao hiệu quả mã hoá Các hệ số này đợc truyền theo bậc tăng tần số, tạo các giá trị lớn tại các tần số thấp và bớc chạy dài của các giá trị nhỏ hoặc gần bằng 0 cho các tần số cao VLC đợc thực hiện nhờ các bảng giá trị Huffman khác nhau để phù hợp thống kê tốt nhất với các giá trị có tần số thấp và cao

• Các thông số quá tải khối dữ liệu: Các giá trị nhị phân từ quá trình biến

đổi ADC, đợc nhóm thành các khối dữ liệu cả trong miền thời gian (bằng cách lấy mẫu kề nhau tại đầu ra ADC) lẫn trong miền tần số (bằng cách lấy các hệ số tần số tại đầu ra FDCT) Các giá trị nhị phân trong 1 block dữ liệu sau đó đợc tạo thang độ tiếp, sao cho giá trị vừa dới giá trị thang độ đầy đủ

Hệ số thang độ này ( gọi là số mũ) là chung cho tất cả các giá trị trong khối Cho nên, mỗi giá trị có thể biểu diễn bằng một định trị (giá trị mẫu) và bằng một số mũ (chỉ thị biên độ riêng của mẫu) Đó là quá trình lợng tử hoá không

đều và kích thớc bớc lợng tử hoá đợc xác định bằng số các bít chiếm

trong khối Vị trí bít đợc tính trong mô hình HAS (hình 1.21) Giảm tốc độ

dữ liệu đợc thực hiện bằng cách gửi giá trị mũ lần một/ khối dữ liệu Mặc dù nhiễu phụ thuộc nội dung tín hiệu, nhng mã hoá đợc thực hiện tốt Kỹ thuật che mặt nạ giúp giảm nhiễu audio

1.3.2.2 Giảm dữ liệu có tổn thất

Nén có tổn thất nhờ kết hợp 2 hoặc nhiều kỹ thuật xử lý để sử dụng đặc

điểm không nhạy của HAS nhằm tách các thành phần phổ theo các thành phần

có biên độ cao hơn Giảm dữ liệu có tổn thất cho tỉ lệ nén từ 2:1 đến 20:1, phụ

Trang 37

thuộc vào độ phức tạp của quá trình mã hoá giải mã và yêu cầu - về chất lợng audio

Giảm dữ liệu có tổn thất sử dụng kỹ thuật mã hoá thụ cảm, nguyên lý cơ bản là loại bỏ độ d thừa thụ cảm trong tín hiệu audio bằng cách xoá bất kỳ tín hiệu nào nằm dới đồ thị ngỡng Nén audio có tổn hao nhờ kết hợp nhiều

kỹ thuật:

• Che phủ miền thời gian và tần số các thành phần số liệu

• Che phủ lợng tử cho mỗi âm audio bằng cách sắp xếp đủ các bit để làm cho mức nhiễu lợng tử luôn dới đồ thị che mặt nạ ại các tần số Tgần tín hiệu audio, tỉ số SNR = 20dB 30dB (độ phân giải 4 - - 5 bit)

• Mã hoá nối Kỹ thuật này tách độ d thừa trong hệ thống đa kênh audio (các dữ liệu giống nhau tồn tại trong tất cả các kênh) Do đó, giảm dữ liệu đợc thực hiện nhờ mã hoá các dữ liệu giống nhau và chỉ thị cho bộ giải mã lặp lại

1.3.2.3 Quá trình mã hoá audio

Hiệu ứng che mặt nạ quan trọng nhất, xảy ra trong miền tần số Để tách

đặc tính này, phổ tín hiệu audio đợc tách thành các băng tần con với độ phân giải thời gian và tần số phù hợp với các độ rộng băng tần tới hạn của HAS Cấu trúc cơ bản của bộ mã hoá cảm thụ :

Băng lọc

Mô hình thu nhận

Lợng tử hoá mã hoá

Phân bố bit

Ghép kênh Phân bổ

bit tín hiệu vào

Trang 38

Hình 1.23: Bộ mã hoá thụ cảm audio cơ bản

• Bộ xử lý thang độ và lợng tử hoá

• Bộ ghép kênh dữ liệu: Nhận dữ liệu lợng tử hoá và cộng thông tin phụ (thông tin vị trí bit và hệ thống thang độ) cho quá trình giải mã

a/ Filter bank

Có 3 loại filter bank:

- Subband ban : Phổ tín hiệu đợc chia thành các băng tần con có độ krộng bằng nhau (32 băng con trong MPEG - Layer I và II) Nó tơng tự quá trình HAS phân tích tần số (chia phổ audio thành các băng tới hạn) Độ rộng các băng tần con tới hạn có thay đổi Dới 500Hz, độ rộng băng là 100Hz, và

nó tăng đến nhiều KHz (trên 10 KHz) Dới 500Hz, một băng tần con chứa nhiều băng tần tới hạn Các mạch lọc băng tần con (nh mạch lọc gơng bình phơng đa pha: PQMF) có phần chồng nhau nhỏ và đợc dùng cho các mẫu thời gian kề nhau Ví dụ trong MPEG – Layer II, một frame audio đợc tách thành 32 băng con bằng nhau, mỗi băng con chứa 36 mẫu

Mỗi tín hiệu băng con sau đó đợc lợng tử hoá đều với một vị trí bit cho băng con để duy trì tỷ số mặt nạ trên nhiễu MNR (Mask to Noise Ratio) dơng Tỷ số này là dơng nếu đồ thị mặt nạ trên mức nhiễu

- Tranform bank: Thuật toán DCT cải biên (MDCT) đợc dùng để biến tín hiệu audio trong miền thời gian thành một số lợng lớn các băng tần con (256 - 1024) Sẽ có một số phần chồng giống nhau trong filter bank này

- Filter bank lai: Chúng hình thành các mạch lọc băng tần con tiếp theo sau mạch lọc MDCT Sự kết hợp này sẽ cung cấp độ phân giải tần số tinh hơn nh dùng trong MPEG III Tín hiệu vào đầu tiên đợc tách thành 32 băng tần con băng PQMF, sau đó MDCT đợc dùng trong 18 mẫu trong mỗi băng tần con (cung cấp 576 băng tần rất hẹp) Kết quả cho độ phân giải thời gian là 3.8ms

Trong các tín hiệu audio tĩnh, MDCT đợc thực hiện trên 18 mẫu đầu ra của băng tần con (cung cấp 2 biến đổi/ băng con/ Frame) Nếu đợc tách tức

Trang 39

thời trong tín hiệu, thì thực hiện MDCT trên 6 mẫu đầu ra của băng tần con; kết quả độ phân giải theo thời gian đợc nâng cao 1.27ms

Đặc trng độ phân giải mạch lọc là kết quả phối hợp có hiệu quả của nhiều hệ số quan trọng Filter bank có độ phân giải thấp cho một số nhỏ các băng tần con và các thành phần âm thanh của hầu hết các phổ tín hiệu audio rơi trong từng băng con Vì lý do này cần mã hoá từng băng tần con Tuy nhiên một số ít băng tần con trong mạch lọc này làm giảm độ phức tạp mã hóa

và giải mã, trong khi đó cho độ phân giải về thời gian tốt

Bộ filter bank có độ phân giải cao, tạo một số lớn các băng tần con và các thành phần âm thanh của phổ tín hiệu audio không rơi vào trong tất cả các băng tần con Các băng tần con không có các thành phần âm thanh sẽ không cần mã hoá, do đó kết quả sẽ giảm tốc độ dữ liệu mã hoá Độ rộng băng tần hẹp có thể mô phỏng tốt hơn độ rộng băng tần giới hạn của HAS Tuy nhiên chúng có độ phân giải thời gian thấp (tạo các hiệu ứng tiền echo trong thời gian mã hóa tín hiệu tức thời) Có thể sử dụng Filter bank thích nghi bằng bộ tách tức thời

Một filter bank biến đổi 256 băng, có độ phức tạp tơng tự filter bank

32 băng con

Đặc điểm của quá trình filter bank đợc trình bày theo:

- Độ phân giải theo thời gian: bằng độ dài khối filter bank của các mẫu nhân với 20.83à s, độ rộng của một mẫu là 20.83à s đối với tốc độ lấy mẫu 48KHz Thông số này cho ý tởng của bộ hoạt động mã hoá tín hiệu tức thời

Ví dụ mã hoá AC 3: 128 x 20.83=2.66ms.-

- Độ phân giải theo tần số: Bằng độ rộng băng tần phổ cực đại/ tổng số băng tần con Độ rộng băng tần phổ cực đại bằng 24 KHz đối với tốc độ lấy mẫu 48KHz Ví dụ mã hoá AC – 3: 24000/256=93.75 Hz

- Độ dài Frame: Bằng số băng tần con nhân số mẫu trong một khối nhân với 20.83à s Giá trị này đợc tính cho tốc độ lấy mẫu 48 KHz Ví dụ mã hoá MPEG layer I: 32x12x20.83=8ms

Trang 40

b/ Mô hình cảm thụ, đồ thị mặt nạ và vị trí bit

Có thể phân tích tâm sinh lý nghe với tín hiệu vào PCM (về nội dung năng lợng và tần số) nhờ thuật toán biến đổi fourier nhanh FFT Đồ thị mặt nạ đợc tính từ ngỡng nghe thấy và các đặc tính che tần số của HAS Dạng

và mức của đồ thị mặt nạ phụ thuộc nội dung tín hiệu Trong hình 1.24, độ

chênh lệch giữa đờng bao phổ tín hiệu và đồ thị mặt nạ đợc giảm đến mức cực đại là 40dB Độ chênh lệch quyết định số bit cực đại (trên cơ sở 6dB/bit) cần để mã hoá tất cả các phổ tín hiệu audio Quá trình xác lập vị trí bit đảm bảo nhiễu lỡng tử hoá thấp hơn mức nghe thấy Mức đồ thị mặt nạ cao hơn

đờng bao phổ tín hiệu 12KHz và không cần sắp xếp bit trong vùng này

Từ đồ thị mặt nạ, các ngỡng mặt nạ đợc dẫn từ mỗi băng tần con Mỗi ngỡng quyết định năng lợng nhiễu lỡng tử hoá cực đại chấp nhận trong mỗi băng tần con (tại đó nhiễu bắt đầu phát ra âm thanh cho các hệ thống nén không tổn thất)

Mã hoá MPEG dùng quá trình sắp xếp vị trí bit tiến - thích nghi, vì việc tính toán vị trí bit chỉ đợc tiến hành trên tín hiệu của bộ mã hoá Ngoài ra thông tin phụ cần một độ rộng băng tần truyền nhất định

(Hz) Phõn bố bit

8K 2K

Biờn độ

Tần số 6K

Đường bao tớn hiệu phổ (tớnh toỏn)

Ngày đăng: 22/01/2024, 16:51

HÌNH ẢNH LIÊN QUAN

Hình 1.1 : Cơ quan thính giác - Công nghệ phát thanh số ứng dụng và triển khai trong tương lai ở việt nam
Hình 1.1 Cơ quan thính giác (Trang 12)
Hình 1.2: Chuyển đổi tín hiệu sang dạng các mẫu số - Công nghệ phát thanh số ứng dụng và triển khai trong tương lai ở việt nam
Hình 1.2 Chuyển đổi tín hiệu sang dạng các mẫu số (Trang 14)
Hình 1.3: Quá trình chuyển đổi tín hiệu liên tục. - Công nghệ phát thanh số ứng dụng và triển khai trong tương lai ở việt nam
Hình 1.3 Quá trình chuyển đổi tín hiệu liên tục (Trang 15)
Hình 1.6: Hiện t-ợng chồng phổ - Công nghệ phát thanh số ứng dụng và triển khai trong tương lai ở việt nam
Hình 1.6 Hiện t-ợng chồng phổ (Trang 16)
Hình  1.4: Quá trình lấy mẫu (PAM) trong miền thời gian - Công nghệ phát thanh số ứng dụng và triển khai trong tương lai ở việt nam
nh 1.4: Quá trình lấy mẫu (PAM) trong miền thời gian (Trang 16)
Hình 1.7: Quá trình lấy mẫu và giữ (sampling- and hold) trong miền thời gian  - - Công nghệ phát thanh số ứng dụng và triển khai trong tương lai ở việt nam
Hình 1.7 Quá trình lấy mẫu và giữ (sampling- and hold) trong miền thời gian - (Trang 17)
Hình 1.8: Quá trình lấy mẫu và sai số l-ợng tử hoá trong ADC 4 bit - Công nghệ phát thanh số ứng dụng và triển khai trong tương lai ở việt nam
Hình 1.8 Quá trình lấy mẫu và sai số l-ợng tử hoá trong ADC 4 bit (Trang 18)
Hình 1.12: Dither hoá tín hiệu vào có mức thấp. - Công nghệ phát thanh số ứng dụng và triển khai trong tương lai ở việt nam
Hình 1.12 Dither hoá tín hiệu vào có mức thấp (Trang 22)
Hình 1.13: Mã hoá 20 -bit nhị phâ n (giá trị 1 và 0) - Công nghệ phát thanh số ứng dụng và triển khai trong tương lai ở việt nam
Hình 1.13 Mã hoá 20 -bit nhị phâ n (giá trị 1 và 0) (Trang 23)
Hình  1.14  là  mạch  DAC  có  độ  phân  giải  n bit.  Dữ  liệu  n bit  điều  khiển  n  - - -chuyển mạch (vị trí ON và OFF ứng với giá trị 0 và 1 của tín hiệu số) - Công nghệ phát thanh số ứng dụng và triển khai trong tương lai ở việt nam
nh 1.14 là mạch DAC có độ phân giải n bit. Dữ liệu n bit điều khiển n - - -chuyển mạch (vị trí ON và OFF ứng với giá trị 0 và 1 của tín hiệu số) (Trang 24)
Hình 1.18: Phổ tín hiệu tại đầu ra mạch lọc số dùng tần số lấy mẫu gấp 4 lần - Công nghệ phát thanh số ứng dụng và triển khai trong tương lai ở việt nam
Hình 1.18 Phổ tín hiệu tại đầu ra mạch lọc số dùng tần số lấy mẫu gấp 4 lần (Trang 29)
Đồ thị che (tính toán - Công nghệ phát thanh số ứng dụng và triển khai trong tương lai ở việt nam
th ị che (tính toán (Trang 40)
Hình 1.25:  Sơ đồ khối mã hóa âm thanh tròn AC- 3 trên cơ sở DOLBY - Công nghệ phát thanh số ứng dụng và triển khai trong tương lai ở việt nam
Hình 1.25 Sơ đồ khối mã hóa âm thanh tròn AC- 3 trên cơ sở DOLBY (Trang 43)
Hình 1 6 :  .2 Kích th-ớc hai loại đĩa CD và MD. - Công nghệ phát thanh số ứng dụng và triển khai trong tương lai ở việt nam
Hình 1 6 : .2 Kích th-ớc hai loại đĩa CD và MD (Trang 45)
Hình 1.2 : Sơ đồ khối bộ mã hoá MPEG cho audio 7 - Công nghệ phát thanh số ứng dụng và triển khai trong tương lai ở việt nam
Hình 1.2 Sơ đồ khối bộ mã hoá MPEG cho audio 7 (Trang 48)

TRÍCH ĐOẠN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN