Đồng bộ giữa các tín hiệu audio số

Một phần của tài liệu đồ án truyền hình số (Trang 65 - 76)

V. Nén trong ảnh

6. Đồng bộ giữa các tín hiệu audio số

Tiêu chuẩn AESII-1991 đã chỉ rõ khả năng đồng bộ hoá cả tần số vμ pha của các thiết bị vận hμnh trong audiọ Các máy phát chuyên dụng phân phối các tín hiệu chuẩn rất ổn định vμ phục vụ cho việc đồng bộ hoá tần số tạo điều kiện cho ch−ơng trình audio lớn. Trong tr−ờng hợp nμy thiết bị sản xuất các thiết bị con, còn các máy phát chuẩn lμ máy chủ. Trong các audio nhỏ, có thể dùng tín hiệu ra của bộ thiết bị khác thông qua bộ khuếch đại phân phối tín hiệu số. Tiêu chuẩn AESII chỉ rõ các mẫu tín hiệu audio số phải cùng pha với tín hiệu chuẩn, Độ lệch pha cho phép của khung audio tại đầu phát lμ ±5% vμ tại đầu thu ±25%.

Chuyển đổi Lọc Giải mã đánh dấu l−ợng Chuyển đổinối tiếp – song song vμ tách kêng Bộ đệm kênh 1 Bộ đệm kênh 2 Khôi phuc xung clock

Hai tín hiệu của ádio số có tần số lấy mẫu khác nhau hoậc không thể đồng bộ cùng nhau thì các bộ chuyển đổi tốc độ lấy mẫu vμ đồng bộ đ−ợc sử dụng. Quá trình đồng bộ thực hiện đ−ợc khi tốc độ của hai dòng số liệu đ−ợc kiểm soát vμ có mối quan hệ với nhau độ phức tạp vμ chi phí của thiết bị cao hơn khi quá trình đồng bộ không đ−ợc thực hiện. Vì các mẫu tín hiệu ở đầu phát vμ đầu thu không có mối liên hệ nμọ

7. Đồng bộ giữa tín hiệu audio số và tín hiệu videọ

Trong truyền hình tín hiệu âm thanh số chuẩn cần phải đ−ợc đồng bộ với tín hiệu video chuẩn nhằm ngăn chặn hiện t−ợng trễ giữa tín hiệu audio vμ tín hiệu video, vμ cho phép chuyển mạch giữa tín hiệu audio vμ tín hiệu video không có tiếng lách tách.

Trong hệ thống 625/50, số l−ợng các mẫu audio trên một khung video đ−ợc quy định chính xác (1920 mẫu audio với tần số lâý mẫu 48KHz). Mối quan hệ về pha giữa tín hiệu audio vμ tín hiệu video đ−ợc duy trì một cách rễ dμng. Tín hiệu âm thanh tiêu chuẩn audio AES 3 có thể giữ đồng bộ với tín hiệu video bởi vì tín hiệu chuẩn 48 KHz nhận đ−ợc từ tín hiệu video chuẩn trong hệ thống 625 dòng.

7.1 Ghi audio số.

Định dạng băng audio số DAT (digital audio tape) đầu tiên đ−ợc phát truyển cho máy ghi âm dân dụng (đầu từ quay nên còn gọ lμ R-DAT, Rotary digital audio tape). Tuy nhiên DAT có chất l−ợng cao, nên đ−ợc dùng cho mục đích chuyên dụng.

Các tín hiệu vμo t−ơng tự đ−ợc số hoá, mã hoá kênh (điều chế 8-10) tr−ớc khi ghi âm trên băng kim loại 3,81mm. Định dạng R-DAT gồm 4 mode ghi/phát, lấy mẫu 48KHz, vμ 2 mode phát lại tốc độ lấy mẫu 44,1KHz.

• Các đặc tr−ng của R-DAT Đặc tr−ng chung:

• Số kênh audio:2

• Thơi gian ghi:2h (4h, 32KHz, mode2).

• Đầu từ không tiếp đất, đầu ghi trùng với đầu phát.

• Thời gian dò mμnh :200 lần so với bình th−ờng

• Kích th−ớc Casselte:73x54x10,5mm. Đặc tr−ng điện:

• Đáp ứng tần số:phẳng 10Hzữ22KHz (fS=48KHz)

• Tần số lấy mẫu • 32KHz • 44,12Khz • 48KHz (chất l−ợng cao) Lấy mẫu: • 16 bit tuyến tính, 48vμ44,1Khz

• 12 bit phi tuyến,32 KHz(mode)

• Méo:<0,005% Đặc tr−ng cơ: • 30mm trống đầu từ,900 • Trống:2000r/min(1000r/min*32Khz mone2) • Tốc độ bằng:8,15monls (4,075mm/s*32KHz,mode2) • Độ rộng rãnh: 13,591mm • Độ rộng băng: 3,81mm • Độ dầy băng: 13mm .Cơ sở về nén audiọ

7.2. Khái niệm kỹ thuật nén số liệu audiọ

Ngμy nay, trong các hệ thống truỳên hình đã đ−ợc sữ dụng các hệ thống âm

thanh đa kênh tới tận hộ gia đình. Khi dung l−ợng l−u trữ vμ độ rộng kênh truyền số liệu đ−ợc quan tâm đúng mức, tốc độ dòng số liệu của các tín hiệu âm thanh nμy sẽ có đủ độ lớn để giữ đ−ợc mức âm thanh trung thực. Ví dụ với 16 bit mã hoá tín hiệu audio lấy mẫu tại tần số lấy mẫu 48KHz tạo ra dòng số liệu có tốc độ 1,54 Mbit/s. Nh− vậy, tốc độ dòng số liệu trong hệ thống âm thanh đa kênh đạt đ−ợc tổng cộng lμ 4,5Mbit/s. Tuy nhiên thời gian l−u trữ vμ giá thμnh thiết bị rất caọ Vậy để giảm giá thμnh vμ tốc độ l−u trữ lμ ta phaie nén dòng số liệu audio số. Hệ thống nén tín hiệu âm thanh lμ loại bỏ đi những thμnh phần thông tin d− thừa trong các tins hiệu audiọ Tín hiệu audio đã đ−ợc nén đ−ợc tổ hợp trong máy tính tạo cho các ứng dụng đa truyền thông nh− phân phối ch−ơng trình trên đĩa Cd- ROMS vμ qua mạng. Vμ nó cũng có thể đem sử dụng trong truyền hình quảng bá qua vệ tinh(DSB)

7.3. Kỹ thuật nén số liệu audiọ

Kỹ thuật mã hoá nguồn đ−ợc dùng để loại bỏ độ d− thừa của tín hiệu audio vμ

nhận dạng vμ loại bỏ nội dung không thích hợp (các maaux không phải lμ audio). Có hai kỹ thuật nén dữ liệu chính sau đâỵ

7.3.1. Nén không tổn haọ

Nén không tổn hao cho phép khôi phục thông tin dữ liệu gốc sau bộ giải nén mμ không gây ra tổn hao (ng−ợc lại với nén ). Nó loại bỏ độ d− thừa thống kê tồn tại trong tín hiệu audio bằng các giá trị dự báo từ các mẫu tr−ớc. Có thể đạt tỷ lệ nén thấy (tốt nhất lμ2:1)vμ phụ thuộc vμo độ phức tạp của tín hiệu audio gốc.

Nhờ mã hoá dự báo miền thời gian mμ ta có thể nén không tổn haọ

• Thuật toán vsai: Tín hiệu audio có chứa các âm lặp lại cũng nh− số l−ợng lớn độ d− thừa vμ các âm thanh không thích hợp. Dữ liệu lặp lại đ−ợc loại bỏ trong quá trình mã hoá vμ đ−ợc khôi phục lại tại phần giải mã. Kỹ thuật DPCM (điều xung mã visai) cũng đ−ợc sử dụng trong tín hiệu audiọ Tín hiệu audio đ−ợc tách ra thμnh một số các băng tần con có chứa một số âm rời rạc. Sau đó mã hoá bằng DPCM vμ bộ dự báo thích hợp cho các tín hiệu có chu kỳ ngắn. Loại mã hoá thích nghi nμy thực hiện trên cơ sở quan sát năng l−ợng tín hiệu đầu vμo nhằm sữa chữa kích cỡ b−ớc l−ợng tử phù hợp. B−ớc nμy đ−ợc gọi lμ thích nghi DPCM(ADPCM).

• Bộ mã hoá entropy tách độ d− thừa bằng cách biểu diễn các hệ số l−ợng tử hoá của băng tần con nhằm nâng cao hiệu quả mã hoá. Các hệ số nμy đ−ợc truyền theo bậc tăng tần số, tạo các giá trị lớn tại các tần số thấp vμ b−ớc chạy dμi của các giá trị nhỏ hoặc gần bằng 0 cho các tần số caọ

• Các thông số quá tải khối dữ liệu: Các giá trị nhị phân từ quá trình biến đổi(số sang t−ơng tự)Adc, đ−ợc nhóm thμnh các khối dữ liệu cả trong miền thời gian lẫn trong miền tần số.

7.3.2. Nén tín hiệu số có tổn haọ

Nén có tổn hao nhờ kết hợp hai hay nhiều kỹ thuật sử lý để sử dụng đặc điểm các HAS lμ tách các thμnh phần phổ có biên độ nhỏ giữa các thμnh phần phổ có biên độ lớn. Ph−ơng pháp giảm số liệu xử lý cao có hệ số nén từ 2:1 đến 20:1 nó phụ thuộc vμo quá trình nén vμ giải nén, vμ về yêu cầu chất l−ợng audiọ

Hệ thống nén số liệu có tổn hao sử dụng kỹ thuật mã hoá thụ cảm, nguyên lý của nó lμ loại bỏ độ d− thừa trong tín hiệu audio bằng cách bỏ đi những tín hiệu

hằm d−ới đồ thị ng−ỡng âm. Do đó ng−ời ta gọi các hệ thống nén số liệu có tổn hao lμ mất các thμnh phần âm.

Nén có tổn hao kết hợp nhiều kỹ thuật

*.Kỹ thuật “mákinh-che” che phủ miền thời gian vμ tần số các thμnh phần tín hiệu

*.Che phủ nhiễu l−ợng tử cho mổi âm audio bằng cách xắp xếp đủ các bit để lμm cho mức nhiễu l−ợng tử luôn d−ới đồ thị che mặt nạ. Tại các tần số gần tín hiệu audio, tỉ số SNR=20ữ30 db (độ phân giải 4ữ5 bit)

*. Mã hoá nối (Joint Coding). Kỹ thuật nμy tách độ d− thừa trong hệ thống đa kênh audio (một số đáng kể dữ liệu giống nhau tồn tại trong tất cả các kênh). Do đó, giảm dữ liệu đ−ợc thực hiện nhờ mã hoá các dữ liệu giống nhauvμ chỉ thị cho bộ giải mã lặp lại

8.Nén tín hiệu audio theo chuẩn MPEG

Hiện nay trên thế giới tồn tại nhiều hệ âm thanh dùng trong truyền hình nh− hệ MICAM số, hệ MUSICAM số, A-2 (Two audio) t−ơng tự hệ AC-3 (audio coding 3) số con nén.

8.1 Tiêu chuẩn nén MPEG-1 (ISO/LEC 11172)

Tiêu chuẩn nén MPEG-1 đ−ợc phát truyền vμ dùng cho “má hoá ảnh động vμ tín hiệu audio kèm theo cho l−u trữ với tốc độ khoảng 1,5M bit/s” chuẩn MPEG-1 dựa vμo nguyên lý nén tín hiệu audio của tiêu chuẩn MPEG

Chuẩn MPEG sử dụng tần số lấy mẫu của CD-DA (Com pact Disc Digital Audio) vμ DAT (Digital audio tape). Bên cạnh các tần số lấy mẫu nμyMPEG còn sử dụng các tần số :44,1 KHz, 32KHz để lấy mẫu vμ tất cả đều sử dụng 16 bits. Đối với số liệu audio trên đĩa Compact thì cả hai kênh đầu có tần số lấy mẫu lμ 44,1 KHz với 16bits/mẫu, khi đó tốc độ số liệu audio lμ 1,4Mbit/S. Do vạy chúng cần phải đ−ợc nén lạị

H34. Sơ đồ cấu trúc của bộ mã hoáMPEG tín hiệu audio

Dữ liệu phụ

H35. Sơ đồ cấu trúc của bộ mã hoáMPEG tín hiệu audio

8.2 Thuật toán nén tín hiệu audio MPEG bao gồm các b−ớc sau:

8.2.1. Audio đ−ợc chuyển về miền tần số, vμ toμn bộ dải phổ của nó đ−ợc chia thμnh 32 băng con thông qua bộ lọc băng con.

*.Lọc băng con:Phổ tín hiệu đ−ợc chia thμng các băng con có độ rộng dải thông bằng nhau, thμnh các băng tới hạn có thể thay đổi, nó tăng tới vμi KHz khi tần số trên 10Khz, tần số d−ới 500Hz độ rộng băng lμ 100Hz, một băng con có tới vμi băng tới hạn.

C h u y ể n đ ổ i t ừ m i ề n t h ờ i g i a n s a n g m i ề n t ầ n s ố M ã h o á k h ớ p n ố i B í t c h ỉ đ ị n h l−ợ n g t ử h o á m ã h o á T ạ o k h u n g b ộ n h ớ s ố l i ệ u D ò n g b í t m ã h o á M ô h ì n t â m s i n h l ý n h g e C á c m ã a u d i o P C M 3 2 / 4 4 1 / 4 8 K h z S ố l i ệ u p h ụ Khung không đóng gói Tái tạo khôi phục Chuyển đổi từ miền tần số sang miền thời

gian Dòng bít mã hoá C á c m ã a u d i o P C M 3 2 / 4 4 1 / 4 8 K h z

Bộ lọc băng con có một pgần gối lên nhau vμ th−ờng sử dụng cho các mẫu kề nhau trong miền thời giạ VD trong mức II của chuẩn MPEG một khung audio có 1152 mẫu gốc đ−ợc chia thμng 32 băng con có độ rộng bằng nhau (750Hz* tần số lấy mẫu 48KHz) mỗi băng con có 36 mẫụ

Sau đó mỗi tín hiệu băng con đ−ợc l−ơng tử hoá đều có các bít chỉ định đặc tr−ng đẻ bảo vệ băng con bằng tỷ số tích cực masking trên tạp âm (MNR). Tỷ số có tích cực khi đ−ờng cong các mức chặn ở trên mức tạp âm.

*. Băng chuyển đổi:Thuật toán sửa đổi DCT(MDCT) đ−ợc sử dụng để biến đổi tín hiệu:audio từ miền thời gian sang miền tần số thμnh một số l−ợng lớn các bít con, giống nh− bộ lọc băng con chuyển đổi các băng con cũng nằm kề nhaụ

Lọc băng ghép: Đây lμ sự kết hợp giữa bộ lọc băng con vμ bộ lọc băng chuyển đổị Tín hiệu đ−ợc chia thμnh 32 băng con do bộ lọc bâ−ng, sau đó thuật toán sửa đổi MDCT đ−ợc áp dụng cho 18 mẫu trong từng băng con tạo ra tổng cộng 576 băng con đạt đ−ợc độ phân tích thời gian lμ 3,8ms

Đặc tính quan trọng của bộ lọc băng lμ độ phân tích có tính thoả hiệp. Một bộ lọc băng có độ phân tích thấp sẽ cho số l−ợng nhỏ các băng con vμ thμnh phần âm của phổ tín hiệu audio nằm trong băng con. Khi kỹ thuật mức ng−ỡng masking giảm đi thì cần rất nhiều bit cho l−ợng tử hoá tín hiệu của mổi băng con, số l−ợng các băng con giẩm đi trong bộ lọc dẫn đến độ phức tạp của bộ mã hoá vμ giải mã giãm đi trong khi đạt đ−ợc độ phân tích trong khoảng thời gian ngắn.

Một bộ lọc băng có độ phân tích cao cho ra một l−ợng lớn các băng tần con vμ các thμnh phần âm của phổ tín hiệu audio nh−ng không nằm trong tất cả các băng con. Các băng con không có thμnh phần âm không cần mã hoá, kết quả bộ mã hoá số liệu không gây tổn haọ Các băng con có thể tái tạo tốt hơn băng tới hạn bằng đặc tính HAS nh−ng độ phân tích thời gian kém

Nh− vậy bộ lọc băng chuyển đổi 256 dải có độ phức tạp giống bộ lọc băng 32dải băng con.

8.2.2 Với mỗi băng ng−ời ta xác định mức biên độ tín hiệu vμ mức nhiểu băng “mô hình tâm sinh lý nghe-psychoacaushic model” đây lμ thμnh phần chính của bộ mã hoá MPEG Audio vμ chức năng của nó lμ phần tích tín hiệu vμọ Psychoacoushic model cá xác định các định tỷ lệ Signal- mák cho mỗi băng tỷ lệ Sigmal mask đ−ợc sử dụng đễ xác định số bit cho quá trình l−ợng tử hoá môĩ băng để giảm đi khả năng nghe thấy của âm thanh.

8.2.3 Mỗi bâ−ng con đ−ợc l−ợng tử hoá thông qua l−ợng tử các thμnh phần nghe thấy trong mỗi băng. Nó đi kèm với mã Huffman đễ mã hoá các giá trị phổ tín hiệu vμ cho nén số liệu tốt hơn vμ định dạng số liệụ

Chuẩn MPEG ápp dụng với audio ba mức nén. Mức một nén c− bản với tốc độ bít lớn nhất 448bit/s mức II vμ mức III lμ mức mở rộng mức I vμ tốc độ của chúng đạt đ−ợc 320Kbit/s vμ 384Kbit/s. Nếu ta đạt đ−ợc đ−ợc tỷ lệ nén cao bù vμo đó chi phí cũng tăng cho bộ giãi mã vμ mã hoá.

8.3 ứng dụng và đặc điểm của ba mức tiêu chuẩn MPEG

• Mức một : ứng dụng trong các thiết bị dân dụng

• Mức hai: ứng dụng trong các thiết bị chuyên dụng vμ Multimedia

• Mức ba : Dùng trong các hệ thống mã hoá tiếng nói 64Kbit/s vμ thấp hơn, dùng mã hoá chất l−ợng cao cho tín hiệu âm nhạc

Đặc điểm của từng mức

8.3.1 Đặc điểm của mức Ị

• Tốc độ dòng số liệu từ 32 đến 448Kbit/s ( tổng cộng)

• Tín hiệu vμo chia thμnh các khung bao gồm 384 mẫu trên một kênh

• Chu kỳ khung lμ 8ms cho kênh 48 KHz

• 32 băng con có độ rộng bằng nhau tạo ra từ các khối block gồm 12 mẫu (32 x12=384 mẫu )

• Hệ số tỷ lệ 6bit/một băng, hệ số tỷ lệ khác nhau cho mỗi băng

• Phân phối bít theo ph−ơng thức thích ứng tr−ớc

• Mỗi mẫu băng con đ−ợc l−ợng tử hoá một cách chính xác bằng cách tính toán phân bố các bít

Sử dụng cho các đơn kênh hay đa kênh-Stereo

• Đáp ứng đ−ợc các ứng dụng của ng−ời sử dụng

8.3.2 Đặc điểm của mức II

MPEG mức hai audio đã cải thiện ph−ơng thức hoạt động của mức một cho phép nén tốt hơn đạt đ−ợc tốc độ 128 Kbit/s

• Đạt đ−ợc tốc độ dòng số liệu từ 32dến 384Kbit/s (tổng cộng)

• Tín hiệu vμo đ−ợc chia thμnh các khung chứa 1152 mẫu trên một kênh

• 32 băng con có độ rộng bằng nhau tạo ra từ các khối blok gồm 36 mẫu (32x36=1152 mẫu )

• Hệ số tỷ lệ 6bit/băng, hệ số tỷ lệ khác nhau cho mổi băng

• Phân phối bit theo ph−ơng thức thích ứng tr−ớc

• Mỗi mẫu băng con đ−ợc l−ợng tử hoá một cách chính xác bằng cách tính toán phân bổ các bit

• Sử dụng kênh đơn (mono) hay Stereo

• Tiêu chuẩn nén audio MPEG có nhiều ứng dụng rộng rải trong chuyển đổi ROM, DVB, DBS, Multimedya

8.3.3 Đặc điểm mức III

Mức III lμ lớp cho tốc độ dòng bit thấp, đạt đ−ợc tốc độ 64Kbit/s

• Đạt đ−ợc tốc độ dòng số liệu từ 32đến 320 Kbit/s

• Tín hiệu vμo đ−ợc chia thμnh các khung chứa 1152 mẫu trên một khung

• Chu kỳ khung lμ 24ms cho kênh 48 KHz

• 32 băng con có độ rộng bằng nhau đ−ợc chia thμnh 18 MDCT (32x36=1152 mẫu )

• Hệ số tỷ lệ đ−ợc sử dụng lμm giảm các mức l−ợng tử vμ tạp âm l−ợng tử

• Phân phối bit theo ph−ơng thức thích ứng tr−ớc

• Sử dụng mã VLC (Hufman) các giá trị l−ợng tử

• Sử dụng kênh đơn (mono) hay stereo

• Sở dụng trong các ứng dụng cần tốc độ bit thấp nh− mạng ISDN viễn thông, đ−ờng truyền vệ tinh vμ âm thanh chất l−ợng cao qua mạng Intenet

Một phần của tài liệu đồ án truyền hình số (Trang 65 - 76)

Tải bản đầy đủ (PDF)

(76 trang)