0
Tải bản đầy đủ (.pdf) (76 trang)

Ghi audio số

Một phần của tài liệu TÌM HIỂU KỸ THUẬT CHUYỂN ĐỔI TÍN HIỆU TỪ TƯƠNG TỰ SANG TÍN HIỆU SỐ TRONG TRUYỀN HÌNH (Trang 66 -66 )

V. Nén trong ảnh

7. Đồng bộ giữa tín hiệu audio số vμ tín hiệu video

7.1 Ghi audio số

Định dạng băng audio số DAT (digital audio tape) đầu tiên đ−ợc phát truyển cho máy ghi âm dân dụng (đầu từ quay nên còn gọ lμ R-DAT, Rotary digital audio tape). Tuy nhiên DAT có chất l−ợng cao, nên đ−ợc dùng cho mục đích chuyên dụng.

Các tín hiệu vμo t−ơng tự đ−ợc số hoá, mã hoá kênh (điều chế 8-10) tr−ớc khi ghi âm trên băng kim loại 3,81mm. Định dạng R-DAT gồm 4 mode ghi/phát, lấy mẫu 48KHz, vμ 2 mode phát lại tốc độ lấy mẫu 44,1KHz.

• Các đặc tr−ng của R-DAT Đặc tr−ng chung:

• Số kênh audio:2

• Thơi gian ghi:2h (4h, 32KHz, mode2).

• Đầu từ không tiếp đất, đầu ghi trùng với đầu phát.

• Thời gian dò mμnh :200 lần so với bình th−ờng

• Kích th−ớc Casselte:73x54x10,5mm. Đặc tr−ng điện:

• Đáp ứng tần số:phẳng 10Hzữ22KHz (fS=48KHz)

• Tần số lấy mẫu • 32KHz • 44,12Khz • 48KHz (chất l−ợng cao) Lấy mẫu: • 16 bit tuyến tính, 48vμ44,1Khz

• 12 bit phi tuyến,32 KHz(mode)

• Méo:<0,005% Đặc tr−ng cơ: • 30mm trống đầu từ,900 • Trống:2000r/min(1000r/min*32Khz mone2) • Tốc độ bằng:8,15monls (4,075mm/s*32KHz,mode2) • Độ rộng rãnh: 13,591mm • Độ rộng băng: 3,81mm • Độ dầy băng: 13mm .Cơ sở về nén audiọ

7.2. Khái niệm kỹ thuật nén số liệu audiọ

Ngμy nay, trong các hệ thống truỳên hình đã đ−ợc sữ dụng các hệ thống âm

thanh đa kênh tới tận hộ gia đình. Khi dung l−ợng l−u trữ vμ độ rộng kênh truyền số liệu đ−ợc quan tâm đúng mức, tốc độ dòng số liệu của các tín hiệu âm thanh nμy sẽ có đủ độ lớn để giữ đ−ợc mức âm thanh trung thực. Ví dụ với 16 bit mã hoá tín hiệu audio lấy mẫu tại tần số lấy mẫu 48KHz tạo ra dòng số liệu có tốc độ 1,54 Mbit/s. Nh− vậy, tốc độ dòng số liệu trong hệ thống âm thanh đa kênh đạt đ−ợc tổng cộng lμ 4,5Mbit/s. Tuy nhiên thời gian l−u trữ vμ giá thμnh thiết bị rất caọ Vậy để giảm giá thμnh vμ tốc độ l−u trữ lμ ta phaie nén dòng số liệu audio số. Hệ thống nén tín hiệu âm thanh lμ loại bỏ đi những thμnh phần thông tin d− thừa trong các tins hiệu audiọ Tín hiệu audio đã đ−ợc nén đ−ợc tổ hợp trong máy tính tạo cho các ứng dụng đa truyền thông nh− phân phối ch−ơng trình trên đĩa Cd- ROMS vμ qua mạng. Vμ nó cũng có thể đem sử dụng trong truyền hình quảng bá qua vệ tinh(DSB)

7.3. Kỹ thuật nén số liệu audiọ

Kỹ thuật mã hoá nguồn đ−ợc dùng để loại bỏ độ d− thừa của tín hiệu audio vμ

nhận dạng vμ loại bỏ nội dung không thích hợp (các maaux không phải lμ audio). Có hai kỹ thuật nén dữ liệu chính sau đâỵ

7.3.1. Nén không tổn haọ

Nén không tổn hao cho phép khôi phục thông tin dữ liệu gốc sau bộ giải nén mμ không gây ra tổn hao (ng−ợc lại với nén ). Nó loại bỏ độ d− thừa thống kê tồn tại trong tín hiệu audio bằng các giá trị dự báo từ các mẫu tr−ớc. Có thể đạt tỷ lệ nén thấy (tốt nhất lμ2:1)vμ phụ thuộc vμo độ phức tạp của tín hiệu audio gốc.

Nhờ mã hoá dự báo miền thời gian mμ ta có thể nén không tổn haọ

• Thuật toán vsai: Tín hiệu audio có chứa các âm lặp lại cũng nh− số l−ợng lớn độ d− thừa vμ các âm thanh không thích hợp. Dữ liệu lặp lại đ−ợc loại bỏ trong quá trình mã hoá vμ đ−ợc khôi phục lại tại phần giải mã. Kỹ thuật DPCM (điều xung mã visai) cũng đ−ợc sử dụng trong tín hiệu audiọ Tín hiệu audio đ−ợc tách ra thμnh một số các băng tần con có chứa một số âm rời rạc. Sau đó mã hoá bằng DPCM vμ bộ dự báo thích hợp cho các tín hiệu có chu kỳ ngắn. Loại mã hoá thích nghi nμy thực hiện trên cơ sở quan sát năng l−ợng tín hiệu đầu vμo nhằm sữa chữa kích cỡ b−ớc l−ợng tử phù hợp. B−ớc nμy đ−ợc gọi lμ thích nghi DPCM(ADPCM).

• Bộ mã hoá entropy tách độ d− thừa bằng cách biểu diễn các hệ số l−ợng tử hoá của băng tần con nhằm nâng cao hiệu quả mã hoá. Các hệ số nμy đ−ợc truyền theo bậc tăng tần số, tạo các giá trị lớn tại các tần số thấp vμ b−ớc chạy dμi của các giá trị nhỏ hoặc gần bằng 0 cho các tần số caọ

• Các thông số quá tải khối dữ liệu: Các giá trị nhị phân từ quá trình biến đổi(số sang t−ơng tự)Adc, đ−ợc nhóm thμnh các khối dữ liệu cả trong miền thời gian lẫn trong miền tần số.

7.3.2. Nén tín hiệu số có tổn haọ

Nén có tổn hao nhờ kết hợp hai hay nhiều kỹ thuật sử lý để sử dụng đặc điểm các HAS lμ tách các thμnh phần phổ có biên độ nhỏ giữa các thμnh phần phổ có biên độ lớn. Ph−ơng pháp giảm số liệu xử lý cao có hệ số nén từ 2:1 đến 20:1 nó phụ thuộc vμo quá trình nén vμ giải nén, vμ về yêu cầu chất l−ợng audiọ

Hệ thống nén số liệu có tổn hao sử dụng kỹ thuật mã hoá thụ cảm, nguyên lý của nó lμ loại bỏ độ d− thừa trong tín hiệu audio bằng cách bỏ đi những tín hiệu

hằm d−ới đồ thị ng−ỡng âm. Do đó ng−ời ta gọi các hệ thống nén số liệu có tổn hao lμ mất các thμnh phần âm.

Nén có tổn hao kết hợp nhiều kỹ thuật

*.Kỹ thuật “mákinh-che” che phủ miền thời gian vμ tần số các thμnh phần tín hiệu

*.Che phủ nhiễu l−ợng tử cho mổi âm audio bằng cách xắp xếp đủ các bit để lμm cho mức nhiễu l−ợng tử luôn d−ới đồ thị che mặt nạ. Tại các tần số gần tín hiệu audio, tỉ số SNR=20ữ30 db (độ phân giải 4ữ5 bit)

*. Mã hoá nối (Joint Coding). Kỹ thuật nμy tách độ d− thừa trong hệ thống đa kênh audio (một số đáng kể dữ liệu giống nhau tồn tại trong tất cả các kênh). Do đó, giảm dữ liệu đ−ợc thực hiện nhờ mã hoá các dữ liệu giống nhauvμ chỉ thị cho bộ giải mã lặp lại

8.Nén tín hiệu audio theo chuẩn MPEG

Hiện nay trên thế giới tồn tại nhiều hệ âm thanh dùng trong truyền hình nh− hệ MICAM số, hệ MUSICAM số, A-2 (Two audio) t−ơng tự hệ AC-3 (audio coding 3) số con nén.

8.1 Tiêu chuẩn nén MPEG-1 (ISO/LEC 11172)

Tiêu chuẩn nén MPEG-1 đ−ợc phát truyền vμ dùng cho “má hoá ảnh động vμ tín hiệu audio kèm theo cho l−u trữ với tốc độ khoảng 1,5M bit/s” chuẩn MPEG-1 dựa vμo nguyên lý nén tín hiệu audio của tiêu chuẩn MPEG

Chuẩn MPEG sử dụng tần số lấy mẫu của CD-DA (Com pact Disc Digital Audio) vμ DAT (Digital audio tape). Bên cạnh các tần số lấy mẫu nμyMPEG còn sử dụng các tần số :44,1 KHz, 32KHz để lấy mẫu vμ tất cả đều sử dụng 16 bits. Đối với số liệu audio trên đĩa Compact thì cả hai kênh đầu có tần số lấy mẫu lμ 44,1 KHz với 16bits/mẫu, khi đó tốc độ số liệu audio lμ 1,4Mbit/S. Do vạy chúng cần phải đ−ợc nén lạị

H34. Sơ đồ cấu trúc của bộ mã hoáMPEG tín hiệu audio

Dữ liệu phụ

H35. Sơ đồ cấu trúc của bộ mã hoáMPEG tín hiệu audio

8.2 Thuật toán nén tín hiệu audio MPEG bao gồm các b−ớc sau:

8.2.1. Audio đ−ợc chuyển về miền tần số, vμ toμn bộ dải phổ của nó đ−ợc chia thμnh 32 băng con thông qua bộ lọc băng con.

*.Lọc băng con:Phổ tín hiệu đ−ợc chia thμng các băng con có độ rộng dải thông bằng nhau, thμnh các băng tới hạn có thể thay đổi, nó tăng tới vμi KHz khi tần số trên 10Khz, tần số d−ới 500Hz độ rộng băng lμ 100Hz, một băng con có tới vμi băng tới hạn.

C h u y ể n đ ổ i t ừ m i ề n t h ờ i g i a n s a n g m i ề n t ầ n s ố M ã h o á k h ớ p n ố i B í t c h ỉ đ ị n h l−ợ n g t ử h o á m ã h o á T ạ o k h u n g b ộ n h ớ s ố l i ệ u D ò n g b í t m ã h o á M ô h ì n t â m s i n h l ý n h g e C á c m ã a u d i o P C M 3 2 / 4 4 1 / 4 8 K h z S ố l i ệ u p h ụ Khung không đóng gói Tái tạo khôi phục Chuyển đổi từ miền tần số sang miền thời

gian Dòng bít mã hoá C á c m ã a u d i o P C M 3 2 / 4 4 1 / 4 8 K h z

Bộ lọc băng con có một pgần gối lên nhau vμ th−ờng sử dụng cho các mẫu kề nhau trong miền thời giạ VD trong mức II của chuẩn MPEG một khung audio có 1152 mẫu gốc đ−ợc chia thμng 32 băng con có độ rộng bằng nhau (750Hz* tần số lấy mẫu 48KHz) mỗi băng con có 36 mẫụ

Sau đó mỗi tín hiệu băng con đ−ợc l−ơng tử hoá đều có các bít chỉ định đặc tr−ng đẻ bảo vệ băng con bằng tỷ số tích cực masking trên tạp âm (MNR). Tỷ số có tích cực khi đ−ờng cong các mức chặn ở trên mức tạp âm.

*. Băng chuyển đổi:Thuật toán sửa đổi DCT(MDCT) đ−ợc sử dụng để biến đổi tín hiệu:audio từ miền thời gian sang miền tần số thμnh một số l−ợng lớn các bít con, giống nh− bộ lọc băng con chuyển đổi các băng con cũng nằm kề nhaụ

Lọc băng ghép: Đây lμ sự kết hợp giữa bộ lọc băng con vμ bộ lọc băng chuyển đổị Tín hiệu đ−ợc chia thμnh 32 băng con do bộ lọc bâ−ng, sau đó thuật toán sửa đổi MDCT đ−ợc áp dụng cho 18 mẫu trong từng băng con tạo ra tổng cộng 576 băng con đạt đ−ợc độ phân tích thời gian lμ 3,8ms

Đặc tính quan trọng của bộ lọc băng lμ độ phân tích có tính thoả hiệp. Một bộ lọc băng có độ phân tích thấp sẽ cho số l−ợng nhỏ các băng con vμ thμnh phần âm của phổ tín hiệu audio nằm trong băng con. Khi kỹ thuật mức ng−ỡng masking giảm đi thì cần rất nhiều bit cho l−ợng tử hoá tín hiệu của mổi băng con, số l−ợng các băng con giẩm đi trong bộ lọc dẫn đến độ phức tạp của bộ mã hoá vμ giải mã giãm đi trong khi đạt đ−ợc độ phân tích trong khoảng thời gian ngắn.

Một bộ lọc băng có độ phân tích cao cho ra một l−ợng lớn các băng tần con vμ các thμnh phần âm của phổ tín hiệu audio nh−ng không nằm trong tất cả các băng con. Các băng con không có thμnh phần âm không cần mã hoá, kết quả bộ mã hoá số liệu không gây tổn haọ Các băng con có thể tái tạo tốt hơn băng tới hạn bằng đặc tính HAS nh−ng độ phân tích thời gian kém

Nh− vậy bộ lọc băng chuyển đổi 256 dải có độ phức tạp giống bộ lọc băng 32dải băng con.

8.2.2 Với mỗi băng ng−ời ta xác định mức biên độ tín hiệu vμ mức nhiểu băng “mô hình tâm sinh lý nghe-psychoacaushic model” đây lμ thμnh phần chính của bộ mã hoá MPEG Audio vμ chức năng của nó lμ phần tích tín hiệu vμọ Psychoacoushic model cá xác định các định tỷ lệ Signal- mák cho mỗi băng tỷ lệ Sigmal mask đ−ợc sử dụng đễ xác định số bit cho quá trình l−ợng tử hoá môĩ băng để giảm đi khả năng nghe thấy của âm thanh.

8.2.3 Mỗi bâ−ng con đ−ợc l−ợng tử hoá thông qua l−ợng tử các thμnh phần nghe thấy trong mỗi băng. Nó đi kèm với mã Huffman đễ mã hoá các giá trị phổ tín hiệu vμ cho nén số liệu tốt hơn vμ định dạng số liệụ

Chuẩn MPEG ápp dụng với audio ba mức nén. Mức một nén c− bản với tốc độ bít lớn nhất 448bit/s mức II vμ mức III lμ mức mở rộng mức I vμ tốc độ của chúng đạt đ−ợc 320Kbit/s vμ 384Kbit/s. Nếu ta đạt đ−ợc đ−ợc tỷ lệ nén cao bù vμo đó chi phí cũng tăng cho bộ giãi mã vμ mã hoá.

8.3 ứng dụng và đặc điểm của ba mức tiêu chuẩn MPEG

• Mức một : ứng dụng trong các thiết bị dân dụng

• Mức hai: ứng dụng trong các thiết bị chuyên dụng vμ Multimedia

• Mức ba : Dùng trong các hệ thống mã hoá tiếng nói 64Kbit/s vμ thấp hơn, dùng mã hoá chất l−ợng cao cho tín hiệu âm nhạc

Đặc điểm của từng mức

8.3.1 Đặc điểm của mức Ị

• Tốc độ dòng số liệu từ 32 đến 448Kbit/s ( tổng cộng)

• Tín hiệu vμo chia thμnh các khung bao gồm 384 mẫu trên một kênh

• Chu kỳ khung lμ 8ms cho kênh 48 KHz

• 32 băng con có độ rộng bằng nhau tạo ra từ các khối block gồm 12 mẫu (32 x12=384 mẫu )

• Hệ số tỷ lệ 6bit/một băng, hệ số tỷ lệ khác nhau cho mỗi băng

• Phân phối bít theo ph−ơng thức thích ứng tr−ớc

• Mỗi mẫu băng con đ−ợc l−ợng tử hoá một cách chính xác bằng cách tính toán phân bố các bít

Sử dụng cho các đơn kênh hay đa kênh-Stereo

• Đáp ứng đ−ợc các ứng dụng của ng−ời sử dụng

8.3.2 Đặc điểm của mức II

MPEG mức hai audio đã cải thiện ph−ơng thức hoạt động của mức một cho phép nén tốt hơn đạt đ−ợc tốc độ 128 Kbit/s

• Đạt đ−ợc tốc độ dòng số liệu từ 32dến 384Kbit/s (tổng cộng)

• Tín hiệu vμo đ−ợc chia thμnh các khung chứa 1152 mẫu trên một kênh

• 32 băng con có độ rộng bằng nhau tạo ra từ các khối blok gồm 36 mẫu (32x36=1152 mẫu )

• Hệ số tỷ lệ 6bit/băng, hệ số tỷ lệ khác nhau cho mổi băng

• Phân phối bit theo ph−ơng thức thích ứng tr−ớc

• Mỗi mẫu băng con đ−ợc l−ợng tử hoá một cách chính xác bằng cách tính toán phân bổ các bit

• Sử dụng kênh đơn (mono) hay Stereo

• Tiêu chuẩn nén audio MPEG có nhiều ứng dụng rộng rải trong chuyển đổi ROM, DVB, DBS, Multimedya

8.3.3 Đặc điểm mức III

Mức III lμ lớp cho tốc độ dòng bit thấp, đạt đ−ợc tốc độ 64Kbit/s

• Đạt đ−ợc tốc độ dòng số liệu từ 32đến 320 Kbit/s

• Tín hiệu vμo đ−ợc chia thμnh các khung chứa 1152 mẫu trên một khung

• Chu kỳ khung lμ 24ms cho kênh 48 KHz

• 32 băng con có độ rộng bằng nhau đ−ợc chia thμnh 18 MDCT (32x36=1152 mẫu )

• Hệ số tỷ lệ đ−ợc sử dụng lμm giảm các mức l−ợng tử vμ tạp âm l−ợng tử

• Phân phối bit theo ph−ơng thức thích ứng tr−ớc

• Sử dụng mã VLC (Hufman) các giá trị l−ợng tử

• Sử dụng kênh đơn (mono) hay stereo

• Sở dụng trong các ứng dụng cần tốc độ bit thấp nh− mạng ISDN viễn thông, đ−ờng truyền vệ tinh vμ âm thanh chất l−ợng cao qua mạng Intenet

8.3.4 Chuẩn nén MPEG2

Tiêu chuẩn MPEG2(ISO/IEC 13818) có từ năm 1994 đ−ợc ứng dụng lμ sự mở rộng của tiêu chuẩn MPEG1 nhằm đáp ứng các yêu cầu của các ứng dụng mớị

• tiêu chuẩn MPEG lsf đa năng cho phép đạt chất l−ợng cao tốc độ chuyền số liệu nhanh vμ thiết bị phức tạp. Chất l−ợng audio số có thể thay đổi trong một phạp vi rộng tuỳ thụôc vμo tốc độ dòng bit từ thấp đến cao, tốc độ số liệu từ 32 đến 1066 Kbit/s.

Phạm vi rộng đ−ợc thực hiện nhờ chia khung số liệu audio MPEG2 thμnh hai phần. Một phần lμ dòng bit gốc thích ứng với MPED1 (384Kb/scủa mứcII) phần còn lại lμ bit mở rộng. Với Layer III( mức III cho tốc độ dòng bit lμ 64Kb/s trên một kênh, có thể nén tốc độ lμ 320Kb/s tức lμ có thể nén mã hoá đ−ợc tốc độ đấy thôi 5 Kênh đầy đủ băng tần. Nh− vậy các thuật toán mã hoá ở máy phát hình mμ không cần thay đổị

Sự mở rộng trên có thể thực hiện đ−ợc nhờ cộng thêm vμo mỗi mức. * ẵ tốc độ lấy mẫu(16:22,05;24Kb/s)

Dung l−ợng đa kênh (tốc độ bit đa kênh mở rộng đến 1Mb/s cho phép đạt đ−ợc tốc độ cao). Các dữ liệu nμy đ−ợc lấy vμo không gian dữ liệu phụ của cấu trúc MPEG1 audio khung

Tiêu chuẩn audio MPEG2 phát triển sau vμ thích ứng với tiêu chuẩn MPEG1. Tuy nhiên giải mã MPEG chỉ có thể giải mã đ−ợc các kênh trái vμ phải của dòng dữ liệu MPEG2 audiọ Tất cả các mức của MPEG1 vμ MPEG2 đều giống nhau

8.4 Ưu điểm của hai tiêu chuẩn MPEG

• Dòng bít MPEG có thể mở rộng thμnh dòng MPEG2 một cách dễ dμng

• Từ dòng bit MPEG , mỗi bộ giãi mã MPEG có thể tách các tín hiệu mono hoặc các tín hiệu Stereo vμ các tín hiệu MPEG2 còn lại

• Trong hệ thống MPEG có thể đồng thời chuyền nhiều thông tin phụ.

• Dòng số liệu phụ có thể thay đổi trong quá trình phát sóng, nó có thể liên kết hai chiều giữa phía phát vμ thọ Hệ thống t−ơng tác cho phép thu ch−ơng trình riêng mμ mình yêu thích.

Một phần của tài liệu TÌM HIỂU KỸ THUẬT CHUYỂN ĐỔI TÍN HIỆU TỪ TƯƠNG TỰ SANG TÍN HIỆU SỐ TRONG TRUYỀN HÌNH (Trang 66 -66 )

×