1. Trang chủ
  2. » Kỹ Thuật - Công Nghệ

Kỹ thuật audio video chương 2

29 349 2

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 29
Dung lượng 1,09 MB

Nội dung

MULTIMEDIA MULTIMEDIA NỘI DUNG • TỔNG QUAN • KỸ THUẬT AUDIO • KỸ THUẬT VIDEO Kỹ thuật Audio Nội dung • • • • • • • • • GIỚI THIỆU MÃ HOÁ AUDIO CẢM QUAN PHÂN TÍCH TÂM LÝ ÂM HỌC KỸ THUẬT NÉN AUDIO MPEG-1 MPEG-2 AC-3 (DOLBY DIGITAL) APT-X100 MÃ HOÁ ÂM THANH NỔI Giới thiệu • Âm thanh: • Dạng lan truyền sóng không gian, • Sóng âm ñến tai người nghe, ñập vào màng nhĩ, làm cho người ñó cảm nhận ñược rung ñộng • Con người có khả phân biệt với âm khác dựa vào số ñặc tính tần số, nhịp ñiệu, mức áp lực • Mục ñích hệ thống audio: • Xử lý, tạo hiệu ứng, nén tín hiệu audio từ tín hiệu thu nhận từ nguồn • Audio số: • Chuỗi giá trị số ñược biểu diễn mức âm theo thời gian Ứng dụng • Các hệ thống thông tin không dây: – Truyền hình phân giải cao (HighDensity TV HDTV), Âm quảng bá số (Digital Broadcast Audio DBA), Vệ tinh quảng bá trực tiếp (Digital Broadcast Satelite DBS) • Các môi trường mạng: – Âm theo yêu cầu (chuyển mạch gói, Internet), Truyền hình cáp (CATV) tuyến studio • Các ứng dụng ña môi trường: – CD-R, ðĩa ña số (DVD) • Cinema: – Dolby AC-3 (5 kênh, @384kbps), APT-x100 • Lưu trữ khối: – MiniDisc, DCC Audio số • Hệ thống audio tương tự số • Hệ thống audio tương tự, việc xử lý tín hiệu gặp phải số vấn ñề khả linh kiện (về mặt tần số), lưu trữ, phức tạp từ ñó méo phi tuyến cao, SNR bé • Hệ thống audio số, việc thu nhận, hiệu chỉnh, xử lý phát lại trở nên dễ dàng nhiều Các kỹ thuật tổng hợp nhận dạng phát triển cách nhanh chóng, tương thích máy tính người trở nên phong phú • Ưu ñiểm audio số là: ðộ méo tín hiệu nhỏ (0,01%), Dải ñộng âm lớn gần mức tự nhiên (>90dB), Dải tần rộng (20Hz ñến 20kHz), ðáp tuyến tần số phẳng, Cho phép ghi âm nhiều lần mà không giảm chất lượng, Thuận tiện lưu trữ, xử lý, Tăng dung lượng kênh truyền, Khả xử lý hệ phi tuyến Quá trình thu nhận audio số Tín hiệu vào tương tự Khuếch ñại Lọc thông Lấy L tuyến tính thấp giữ mấu Mã hóa Tạo Dither Tín hiệu vào tương tự Khuếch ñại Lọc thông Lấy R tuyến tính thấp giữ mấu Ghép kênh Mã hóa Hình 2-1 Quá trình thu nhận âm số Xử lý Tín hiệu số Lấy mẫu lượng tử hoá • Lấy mẫu giữ mức: Lấy mẫu trình rời rạc hóa tín hiệu mặt thời gian giữ cho biên ñộ khoảng thời gian lấy mẫu không ñổi • Lượng tử hóa: Lượng tử hóa trình rời rạc tín hiệu mặt biên ñộ Tại mẫu, biên ñộ ñược chia thành mức gọi mức lượng tử Tín hiệu vào Lượng tử Hình 2-2 Lấy giữ mẫu lượng tử Dither • Nguyên nhân: Lượng tử hóa méo Tín hiệu có biên ñộ nhỏ méo lượng tử cao • Khắc phục: Cộng âm trước lấy mẫu với tạp âm tương tự Ngẫu nhiên hóa ảnh hưởng méo lượng tử ñể phân phối ñều méo lượng tử thành lỗi ngẫu nhiên không tập trung nhiều vào phần có biên ñộ thấp • Khái niệm: Dither nhiễu ñược cộng vào tín hiệu âm • Mục ñích: Loại bỏ méo lượng tử • Cơ sở: Dither làm cho tín hiệu âm bị biến ñổi mức lượng tử gần nhau, ñiều làm giảm ñộ tương quan lượng tử hóa tín hiệu, loại ảnh hưởng lỗi mã hóa biên ñộ tín hiệu thấp mức lượng tử • Nhược ñiểm: Cộng nhiễu vào tín hiệu Dither Tín hiệu gốc Tín hiệu gốc Tín hiệu lấy mẫu Tín hiệu lấy mẫu Tín hiệu sau lọc Tín hiệu sau lọc Không dither Dither Hình 2-3 Dither không dither Mã hóa mã hóa kênh • Mã hoá – trình chuyển mức rời rạc thành chuỗi mẫu số nhị phân (hoặc hệ ñếm khác) theo quy luật ñịnh – Sau mã hóa nhị phân, ta ñược tín hiệu ñiều xung mã PCM – Tín hiệu PCM không thích hợp ñể lưu trữ truyền dẫn tồn thành phần chiều mã hóa kênh • Mã hóa kênh – biến ñổi liệu với mục ñích ñạt ñược mật ñộ bit cao giới hạn băng thông kênh truyền – Giảm tổn hao truyền lưu trữ – Cải thiện dải thông, liệu truyền dẫn có ñặc tính tối ưu – Làm cho phổ tín hiệu âm số méo Ghép kênh – Tín hiệu âm số thường bao gồm nhiều kênh, ví dụ hệ thống âm 5.1 gồm kênh trái, phải, trung tâm, trái vòm, phải vòm siêu trầm, có tín hiệu mã phụ, mã ñồng bộ… – Nguyên lý ghép kênh có thường ñược áp dụng ñó ghép kênh phân chia theo thời gian, kênh sử dụng khe thời gian ñược ấn ñịnh trước L L R Ghép kênh L+R R Hình 2-4 Ghép kênh tín hiệu audio MÃ HOÁ AUDIO CẢM QUAN • Giới thiệu Mục ñích: Biểu diễn chuỗi số ngắn gọn Tốc ñộ bit thấp Chất lượng cao ðộng cơ: Giảm tốc ñộ liệu Giảm chi phí truyền dẫn (BW) Giảm yêu cầu lưu trữ Mạnh Các yêu cầu: Cảm nhận suốt ðộc lập nguồn Có khả ña kênh ðộ phức tạp bất ñối xứng ðộ trễ hợp lý MÃ HOÁ AUDIO CẢM QUAN Mã hoá nguồn không thực tế với tín hiệu audio, ñó, audio, người ta tiến hành - Khai thác ñặc tính thu ñược - Loại bỏ thành phần không thích hợp với cảm nhận - Giảm dư thừa thống kê Băng thông Tốc ñộ lấy mẫu Số bits mẫu Tốc ñộ bit thô Số kênh Mô hình hiệu nguồn Sức chịu ñựng nguồn Chất lượng mong ñợi Tính ña dạng phổ Thoại 200-3400Hz 8kHz 8bits 64kbps Có Có thể yêu cầu Méo bị giới hạn Harmonic, V/UV/TR Audio 20Hz-20kHz 44.1kHz/48kHz 16+bits 768kbps 1-6+kênh Không Yêu cầu Chất lượng “CD” Không thể phân loại MÃ HOÁ AUDIO CẢM QUAN • Các tiêu chuẩn lấy mẫu theo yêu cầu cụ thể khác - Chất lượng - ðộ trễ - Băng thông - Tốc ñộ … Tiêu chuẩn Tốc ñộ lấy mẫu Số bits/mẫu Mono/stereo Tốc ñộ Băng tần ðiện thoại kHz bits/mẫu Mono kbytes/s 4Khz AM radio 11.025 kHz bits/mẫu Mono 11.0 kbytes/s 5kHz FM radio 22.05 kHz 16 bits/mẫu Stereo 88.2 kbytes/s 10kHz CD 44.1 kHz 16 bits/mẫu Stereo 176.4 kbytes/s 20kHz DAT 48 kHz 16 bits/mẫu Stereo 192.0 kbytes/s 20Khz MÃ HOÁ AUDIO CẢM QUAN Băng lọc số: Băng lọc số tập hợp lọc số có chung ñầu vào nhiều ñầu chung ñầu nhiều ñầu vào Băng lọc số phân tích tập hợp lọc số có ñáp ứng tần số Hk(ejω) có chung ñầu vào nhiều ñầu H0(ejω) x(n) H1(ejω) … X(ejω) HM-1(ejω) x0(n) x1(n) xM-1(n) X0(ejω) X1(ejω) XM-1(ejω) Ngõ gồm M tín hiệu Xk(n) chiếm dải tần liên tiếp gọi tín hiệu băng (subband) Các lọc H0(ejω): thông thấp, HM-1(ejω): thông cao, Hi(ejω): thông dải, với i từ ñến M-2 MÃ HOÁ AUDIO CẢM QUAN Băng lọc số tổng hợp: Là tập hợp lọc số có ñáp ứng tần số Gk(ejω) có chung ñầu x0(n) x1(n) xL-1(n) X0(ejω) X1(ejω) XL-1 (ejω) G0(ejω) G1(ejω) … + GL-1(ejω) + x(n) X(ejω) Các lọc : G0(ejω): thông thấp, GM-1(ejω): thông cao, Gi(ejω): thông dải, với i từ ñến L-2 Băng lọc số nhiều nhịp hai kênh băng lọc gương cầu phương QMF (Quadrature Mirror Filter Bank): Băng lọc số nhiều nhịp kết hợp băng lọc số phân tích, băng lọc số tổng hợp với phân chia nội suy Với số lọc băng lọc phân tích tổng hợp ta có băng lọc số nhiều nhịp hai kênh MÃ HOÁ AUDIO CẢM QUAN x(n) H0(ejω) x0(n) ↓2 y0(n) v0(n) ↓2 H1(ejω) x1(n) ↑2 G0(ejω) ↑2 G1(ejω) + xˆ(n) y1’(n) y1(n) v1(n) y0’(n) • H0(ejω), G0(ejω) :Lọc thông thấp H1(ejω), G1(ejω) :Lọc thông cao • Lý tưởng: xˆ ( n) = x(n) • Nếu |H0(ejω)|=|H1(ejω)| chọn tần số cắt cho lọc π/2 ta thấy |H0(ejω)|là ảnh |H1(ejω)| qua gương ñặt vị trí π/2 Băng lọc nhiều nhịp hai kênh với ñặc tính gọi băng lọc gương cầu phương • Nếu xˆ (n) = cx(n − n0 )giống dạng tín hiệu ngõ vào ta gọi băng lọc gương cầu phương khôi phục hoàn hảo PRQMF (Perfect Reconstructure QMF) MÃ HOÁ AUDIO CẢM QUAN • Mã hoá băng cấu trúc lọc QMF – Mã hoá băng • Sử dụng lọc số ñể mã hoá băng x(n) H0(ejω) x0(n) ↓2 v0(n) Kênh truyền dẫn ↓2 H1(ejω) x1(n) v0(n) v1(n) v1(n) y0(n) ↑2 G0(ejω) ↑2 G1(ejω) y1(n) y0’(n) + xˆ(n) y1’(n) Mã hoá Giải mã • Thuận lợi cho việc nén tín hiệu âm phổ tập trung không ñồng ñều Từ ñó, ta có ñược phân bố hợp lý, vừa hiệu quả, vừa ñạt chất lượng cao PHÂN TÍCH TÂM LÝ ÂM HỌC • Ngưỡng nghe tuyệt ñối ATH (Absolute Theshold of Hearing) – Thí nghiệm:ðặt người phòng kín, im lặng, phát âm kiểm tra (test tone) với tần số xác ñịnh (1kHz), tăng mức âm cho ñến nghe ñược, ghi lại giá trị lặp lại với tần số khác – Vẽ ñồ thị, ta ñược ngưỡng nghe tuyệt ñối Thử với người khác, ghi kết PHÂN TÍCH TÂM LÝ ÂM HỌC • Dải tới hạn (critical bankwidth) – Fletcher tiến hành thử nghiệm cho thấy việc nghe người giống sử dụng lọc tâm sinh lý có ñộ rộng gần giá trị tới hạn Flecher gọi ñộ rộng lọc tới hạn dải tới hạn – Dải tới hạn biểu diễn công suất xác ñịnh tai cho cho tần số hay dải tần số liên tục – Các thí nghiệm cho thấy rằng: • Với tần số che nhỏ 500Hz dải tới hạn không ñổi với ñộ rộng khoảng 100Hz • Với tần số che lớn 500Hz dải tới hạn có ñộ rộng tăng tương ñối tuyến tính theo tần số – Vậy, thang tần số không tuyến tính thang bark (Barkhausen) PHÂN TÍCH TÂM LÝ ÂM HỌC • Dải tới hạn (critical bankwidth) – Flecher chia băng thông âm thành 25 dải tới hạn Dải Tần số thấp Tsố trung tâm Tần số cao Băng thông - 50 100 - 100 150 200 100 300 350 400 100 400 450 510 110 510 570 630 120 630 700 770 140 … … … … … 25 15500 18775 22050 6550 PHÂN TÍCH TÂM LÝ ÂM HỌC • Dải tới hạn (critical bankwidth) – Bark ñơn vị ñể biểu diễn dải tới hạn, bark=1 ñộ rộng dải tới hạn f  – Công thức chuyển ñổi: f < 500 ,  100 1bark =  f 9 + log ( ), 1000  f ≥ 500 – Công thức khác: 1bark=13arctg(0.76f)+3.5arctg(f/7500) [bark] – Công thức khác nữa: 1bark=13arctg(0.76f)+3.5arctg(f2/65.25) [bark] PHÂN TÍCH TÂM LÝ ÂM HỌC • Kỹ thuật che (masking) Con người nghe âm với có mặt âm khác cảm nhận yếu ñi âm có tần số gần với âm cần nghe biên ñộ lớn – Che tần số (frequency masking) Thí nghiệm: ðặt người phòng kín, phát âm che (masking tone) với tần số xác ñịnh (1kHz) mức ñó (60dB), sau ñó, phát âm kiểm tra (test tone) (1,1kHz) , tăng mức ñến nghe ñược Thay ñổi âm kiểm tra, vẽ ngưỡng nghe, lặp lại với âm che khác PHÂN TÍCH TÂM LÝ ÂM HỌC – Che thời gian (temporal masking) Thí nghiệm: Phát âm che tần số 1kHz, biên ñộ 55dB, thêm âm kiểm tra 1,1kHz, biên ñộ 20dB trước sau âm che Âm kiểm tra nghe ñược (nó ñang bị che) Lặp lại mức khác âm kiểm tra vẽ Với thí nghiệm trên, ta thấy âm 1,1kHz với 20dB bị che trước khoảng 15ms che sau khoảng 50ms KỸ THUẬT NÉN AUDIO • Cơ sở Âm trung thực chất lượng dịch vụ thoả mãn tốc ñộ dòng liệu phải lớn Ví dụ : Hệ thống âm ña kênh mã hoá 16 bits, tần số lấy mẫu 48kHz (6 kênh) có tốc ñộ: 48x16x6=4.5Mbps Tốc ñộ cao Khó khăn lưu trữ, truyền dẫn giá thành thiết bị Nén • Nén không tổn hao Khôi phục ñúng thông tin ban ñầu sau giải nén Cơ sở: Loại bỏ dư thừa thống kê, thông tin xuất tín hiệu mà dự báo trước Tỷ số nén thấp, khoảng 2:1, phụ thuộc vào ñộ phức tạp tín hiệu nguồn Thường sử dụng kỹ thuật mã hoá dự ñoán miền thời gian KỸ THUẬT NÉN AUDIO – Thuật toán vi sai: Tín hiệu âm có ñặc tính lặp ñi lặp lại nên xuất dư thừa số liệu Thông tin lặp ñược loại bỏ trình mã hoá ñược ñưa vào lại trình giải mã sử dụng kỹ thuật DPCM Các tín hiệu audio ñầu tiên ñược phân tích thành tập hợp dải băng bao gồm số lượng âm rời rạc, sau ñó, DPCM ñược sử dụng ñể dự báo tín hiệu lặp lại theo chu kỳ Nếu sử dụng ADPCM cho kết tốt – Mã hoá Entropy: Tận dụng ñộ dư thừa cách miêu tả hệ số băng ñã lượng tử hoá nhằm cải thiện tính hiệu trình mã hoá Các hệ số lượng tử ñược gởi ñi theo tăng dần tần số Kết nhận ñược bảng mã tối ưu thống kê giá trị miền tần số thấp cao Sử dụng mã hoá Hufman, Lempel-Zip ñể nén KỸ THUẬT NÉN AUDIO • Nén tổn hao Hệ thống thính giác người phân biệt thành phần phổ có biên ñộ nhỏ thành phần phổ có biên ñộ lớn Hệ số nén lớn, khoảng 20:1 phụ thuộc vào trình nén giải nén chất lượng audio yêu cầu – Các kỹ thuật ñược sử dụng: - Kỹ thuật che (masking) ñối với thành phần tín hiệu miền thời gian tần số - Che mức tạp âm lượng tử cho âm ñộ tín hiệu âm cách ñịnh số bit vừa ñủ ñể chắn mức nhiễu lượng tử nằm mức giá trị cần che - Mã hoá ghép: Khai thác ñộ dư thừa hệ thống audio ña kênh với thành phần số liệu kênh giống Mã hoá phần số liệu chung kênh ñịnh cho giải mã lặp lại tín hiệu ñó kênh lại MPEG-1 • Giới thiệu MPEG-1 Mono Stereo 32, 44.1, 48kHz Lớp I Lớp II Lớp III ðược phát triển sở phối hợp chuẩn ISO/IEC 11172 Sử dụng tần số lấy mẫu CD-DA, với fs=32;44.1;48kHz, mã hoá 16bits/mẫu tín hiệu Tốc ñộ bít: 32 - 768 kbps/channel Các kiểu: Mono, dual-mono, dual-stereo, joint-stereo Xác ñịnh tham số khác tốc ñộ, dòng số sau nén, số mẫu header cho kênh, cấu trúc thời gian khung, phương pháp mã hoá dự ñoán chế ñộ làm việc MPEG-1 • ðặc tính Lớp I Lớp II Lớp III Dùng cho thiết bị dân dụng Dùng cho thiết bị chuyên dụng, ña môi trường Dùng cho thiết bị chuyên dụng, ña môi trường Tốc ñộ dòng số liệu từ 32448kbps Tốc ñộ dòng số liệu từ 32384kbps Tốc ñộ dòng số liệu từ 32320kbps 384mẫu/khung/kênh 1152mẫu/khung/kênh 1152mẫu/khung/kênh 32 băng ñều nhau, băng gồm block 12 mẫu 32 băng ñều nhau, băng gồm block 36 mẫu 32 băng tới hạnthành 18 MDCT Chu kỳ khung 8ms cho kênh có fs=48kHz Chu kỳ khung 24ms cho kênh có fs=48kHz Chu kỳ khung 24ms cho kênh có fs=48kHz Hệ số tỷ lệ bits/băng, phân phối bit theo phương thức ứng trước Hệ số tỷ lệ bits/băng, phân phối bit theo phương thức ứng trước Hệ số tỷ lệ bits/băng, phân phối bit theo phương thức ứng trước MPEG-1 12 mẫu 12 mẫu 12 mẫu Các mẫu Audio ngõ vào Lọc băng Lọc băng 12 mẫu 12 mẫu 12 mẫu 12 mẫu 12 mẫu 12 mẫu Lọc băng … 12 mẫu 12 mẫu 12 mẫu Lọc băng 31 • • Khung lớp I : 12x32 =384 Khung lớp II, III: 12x32x3=1152 Khung lớp I Khung lớp II lớp III MPEG-1 – Kiến trúc Băng lọc phân tích ña pha 32 kênh MPEG1 lớp 1,2 s(n) 32 Lượng tử hoá Mã hoá 32 FFT LI: 512 LII: 1024 Phân tích tâm sinh lý âm học M U X Lượng tử SMR SMR: Tỷ số tín hiệu/ngưỡng che Dữ liệu Phân phối bit ñộng kênh Thông tin thêm MPEG1 lớp Dữ liệu Băng lọc 32 phân tích ña pha 32 kênh ↓32 MDCT Vòng lặp ñịnh bit Lượng tử hoá Mã hoá Huffman M U X s(n) FFT Phân tích tâm sinh lý âm học SMR kênh Mã thông Thông tin thêm tin thêm MPEG-1 • Thuật toán – Tiến hành chia ngõ vào thành 32 băng băng lọc • Lấy 32 mẫu PCM thời ñiểm, kết 32 hệ số tần số ngõ – Trong MPEG-1 lớp I tập 32 giá trị PCM ñược kết hợp vào khối gồm 12 nhóm 32 mẫu – MPEG-1 lớp II lớp III gồm khối 12 nhóm – Phân bố bit ñảm bảo nhiễu lượng tử nằm ngưỡng che – Với băng con, xác ñịnh mức biên ñộ mức nhiễu mô hình tâm sinh lý nghe SMR (signal-mask rate) ñược sử dụng ñể xác ñịnh số bit cho trình lượng tử hoá ñối với băng với mục ñích giảm thiểu dung lượng MPEG-1 Ví dụ: Sau phân tích, mức 16 băng ñầu là: Band 10 11 12 13 14 15 16 Level (db) 12 10 10 60 35 20 15 Nếu mức băng thứ 60 che 12 dB băng thứ 15 dB băng thứ Băng có mức 10dB15dB: gởi ñi Chỉ có mức lớn mức che ñược gởi ñi thay dùng bits ñể mã hoá, ta dùng bits MPEG-Layer I: Bộ lọc DCT khung tần số phẳng băng Mô hình tâm sinh lý nghe sử dụng che tần số MPEG-Layer II: Có khung lọc (trước, kế), tổng 1125 mẫu Sử dụng vài bits ñể che thời gian MPEG-Layer III: Sử dụng lọc tới hạn ñể ñáp ứng tốt Mô hình tâm sinh lý nghe sử dụng che thời gian, che tần số, tính toán ñộ dư thừa stereo mã hoá Hufman MPEG-1 • Cấu trúc khung Header Info Side Info Subband Samples Aux Data – Header Info: Gồm 12 bits ñồng bộ; 20 bis thông tin hệ thống thị tốc ñộ bit, tần số lấy mẫu, dạng nhấn…; 16 bits CRC với ña thức sinh x16+x15+x2+1 – Side Info: Gồm phân bố bit: lớp với bits tuyến tính cho băng con, lớp II bits cho băng tần thấp, bit tần trung bits tần cao; hệ số tỷ lệ bits/băng kết hợp với phân bố bits bits mã hóa cho băng ñó ñể xác ñịnh giá trị, lớp III mã hóa âm – Subband Samples: 32x12 mẫu ñối với lớp I 32x36 mẫu ñối với lớp II lớp III – Aux Data: Dữ liệu bổ sung MPEG-2 • Mở rộng MPEG-1 cho ứng dụng • Có khả áp dụng nhiều tốc ñộ khác nhau, từ 32 ñến 1066kbps Tần số lấy mẫu giảm nửa so với MPEG-1 (16; 22,05; 24kHz) • Khả ña kênh, tốc ñộ bits mở rộng lên ñến Mbps cho ứng dụng tốc ñộ cao Cho phép nén ñồng thời nhiều kênh • Chất lượng âm tuỳ thuộc ứng dụng • Hỗ trợ khả lồng tiếng, bình luận nhiều ngôn ngữ phần bits mở rộng • MPEG-2 sử dụng mã hoá cường ñộ cao, giảm xuyên âm, mã hoá dự ñoán liên kênh mã hoá ảo ảnh kênh trung tâm ñể nhận ñược tốc ñộ bit kết hợp 384 kbps • Khung MPEG-2 ñược chia thành phần, phần ñầu MPEG-1stereo, phần mở rộng MPEG-2 chứa tất liệu surround khác MPEG-2 MPEG-2 Mono-stereo Mono-stereo channels MPEG-1 MPEG-2 MPEG-2 32;44.1;48kHz 16;22,05;24kHz multi channel Layer I Layer II Layer III 32;44.1;48kHz Layer I Layer II Layer III Layer I Layer II Layer III MPEG-2 • Mã hoá giải mã MPEG-2 channel L0 L R0 C R Matrix MPEG-1 encoder + MPEG-1 decoder T3 LS T4 RS T5 L0’ L’ R0’ C’ T3’ MPEG-2 Extension encoder Inverse Matrix MPEG-2 T4’ Extension decoder T5’ R’ LS’ RS’ MPEG-2 Trong ñó:  L0 = α (L + βC + δLS)  R0 = α (R + βC + δRS) ,α = 1 ;β =δ = 1+ 2 or α = 1; β = δ = Với R: phải, L: trái, C: trung tâm, LS:trái vòm RS: phải vòm Từ ñó dễ dàng mã hóa thuận nghịch Cấu trúc khung MPEG1 header Khung MPEG-1/2 MPEG-1 Data MPEG-1 Auxillary Data MPEG2 header MPEG2 Data AC-3 (DOLBY DIGITAL) • • • • • • • • Chuyển tải âm ña kênh ứng dụng DVD-Video, DTV DBS Phát triển từ AC-1 AC-2 Mã hoá âm từ ñến kênh, thông thường cung cấp âm 5.1 kênh: trái, phải, trung tâm, trái vòm, phải vòm kênh hiệu ứng tần số thấp kênh yêu cầu 6x48kHzx18bits=5.184Mbps chưa nén ñược mã hoá tối thiểu với tốc ñộ 384kbps (tỷ lệ 13:1) Tuy nhiên, AC-3 hỗ trợ tốc ñộ từ 32 ñến 640kbps Cung cấp khả tự chọn mức âm cho thính giả Cho phép giảm liệu trình lượng tử biểu diễn miền tần số tín hiệu âm Bộ mã hoá sử dụng băng lọc phân tích chuyển mẫu PCM thành hệ số miền tần số Mỗi hệ số biểu diễn ký hiệu mũ nhị phân gồm phần số mũ phần ñịnh trị Các tập số mũ ñược mã hoá thô qua phổ tín hiệu xem ñường bao phổ Sử dụng phân phối bít xác ñịnh số bits cần mã hoá ñịnh trị dựa vào ñường bao phổ ðường bao phổ ñịnh trị ñược lượng tử cho khối âm (1536 mẫu âm thanh) ñược ñịnh dạng thành khung chuyển ñi AC-3 (DOLBY DIGITAL) Quá trình giải mã hoàn toàn ngược lại, ñây xét trình mã hoá Các mẫu PCM Băng lọc phân tích Số mũ Mã hoá ñường bao Chỉ ñịnh bit Phần ñịnh trị Lượng tử hoá phần ñịnh trị Thông tin ñịnh bit Phần ñịnh trị ñược lượng tử hoá ðường bao phổ ñược mã hoá ðịnh dạng khung AC-3 Dòng bit AC-3 APT-X100 APT-X100 cho tỷ lệ nén 4:1 Sử dụng ñể truyền dẫn, lưu trữ tín hiệu audio mono, stereo hay ña kênh chất lượng cao Không hẳn dựa vào mô hình tâm sinh lý nghe, không trực tiếp loại thành phần không thích hợp tín hiệu audio, mà ngầm hiểu mô hình ñáp ứng nghe việc phân phối bit tần số cao Thuật toán hoàn toàn miền thời gian sử dụng mã hoá dự ñoán tuyến tính băng Hoạt ñộng với tần số lấy mẫu với ngõ 16 bits/từ mẫu Tín hiệu audio ñược chia thành băng với băng thông ñều sử dụng lọc QMF Tín hiệu ñược phân tích miền thời gian: sử dụng mã hoá dự ñoán tuyến tính ADPCM ñể lượng tử băng theo nội dung loại bỏ ñộ dư thừa băng Mã hoá khác biệt mẫu thời mẫu trước Giải mã ñược tiến hành cách ngược lại • • • • • • • • • MÃ HÓA ÂM THANH NỔI • Âm ña kênh R L L C R L C S 3/0 2/0 Stereo L C LS 3/2 R L RS LS C LFE R S 3/1 R RS 3/2 với siêu trầm (5.1) S: Surround LFE : Low Frequency Enhancement (Woofer) 15 – 120Hz Có thể ñặt MÃ HOÁ ÂM THANH NỔI • Mã hóa Trái phải (LR) Không loại bỏ ñộ dư thừa Các kênh riêng biệt ñược mã hoá ñộc lập Ngưỡng che không liên quan Hiệu với âm khác biệt kênh trái kênh phải N1 L≈R + L’ R≈L + R’ Nguồn N2 MÃ HOÁ ÂM THANH NỔI • Joint Stereo Midle-Side Khuynh hướng Joint Stereo không kết hợp ñịnh dạng chuẩn nén mp3 (MPEG1 lớp III) mà kết hợp dạng khác: MPEG AAC Middle-Side Stereo xét hai kênh liệu theo hai phương diện khác Thay lưu trữ liệu âm theo hai kênh Left Right, ta cần lưu trữ chuỗi tương tự số trung bình Average (của Left Right) sai biệt Difference (giữa Left Right) Ở dạng Middle-Side, ta lưu trữ giá trị Middle Side sau: Middle=(L+R)/2, Side=(L-R)/2 Dấu Side quan trọng, Side >0 nghĩa tín hiệu L lớn tín hiệu R Ta hoàn toàn tái tạo hai kênh L, R sau: L=Middle+Side, R=Middle-Side Ưu ñiểm khác biệt tương ñối tín hiệu audio kênh L R Kết kênh Middle lớn nhiều so với kênh Side Việc mã hoá kênh Side sử dụng bít ñể giải phóng tài nguyên mà ñược sử dụng ñể triển khai hữu hiệu kênh Middle Khi tái ñịnh dạng lại L, R kết thể tín hiệu gốc ngõ vào thực MÃ HOÁ ÂM THANH NỔI – Tính chất Kênh side sử dụng số bit Loại bỏ ñộ dư thừa cho tín hiệu mono thực tế Có thể ñược áp dụng miền thời gian lẫn tần số ðộ lợi mã hoá cao phụ thuộc tín hiệu – Biến ñổi ngược: tổng/hiệu chuẩn hoá MÃ HOÁ ÂM THANH NỔI • Stereo ghép cường ñộ cao (Intensity Stereo): Mục ñích: Tối thiểu hoá thông tin stereo ñể nhận ñược tốc ñộ bit thấp • Mã hoá tín hiệu tổng kênh + hướng kênh Truyền ñường bao, sau ñó tỷ lệ theo kênh • Kiểm chứng dựa việc cảm nhận người ñối với tần số 3kHz • Không liên quan ñến kỹ thuật suy giảm • Biên ñộ pha không quan trọng • Giảm gần 50% liệu • Không ñảm bảo thông tin pha tín hiệu • Một vài méo nhận biết ñược • Sử dụng ứng dụng tốc ñộ bit thấp MÃ HOÁ ÂM THANH NỔI L Chỉnh pha L+R Σ R Chỉnh pha ðo biên ñộ ðo biên ñộ Hướng kênh L ÷ ðo biên ñộ ÷ ðo biên ñộ L+R Hướng kênh L Hướng kênh R X X L R Hướng kênh R [...]... trước MPEG-1 12 mẫu 12 mẫu 12 mẫu Các mẫu Audio ngõ vào Lọc băng con 0 Lọc băng con 1 12 mẫu 12 mẫu 12 mẫu 12 mẫu 12 mẫu 12 mẫu Lọc băng con 2 … 12 mẫu 12 mẫu 12 mẫu Lọc băng con 31 • • Khung lớp I : 12x 32 =384 Khung lớp II, III: 12x32x3=11 52 Khung lớp I Khung lớp II và lớp III MPEG-1 – Kiến trúc Băng lọc phân tích ña pha 32 kênh MPEG1 lớp 1 ,2 s(n) 32 Lượng tử hoá Mã hoá 32 FFT LI: 5 12 LII: 1 024 Phân tích...MÃ HOÁ AUDIO CẢM QUAN • Cấu trúc dạng cây ñơn phân giải H 020 (ejω) 2 H 120 (ejω) 2 H 021 (ejω) 2 H 121 (ejω) 2 x(n) H01(ejω) H11(ejω) 2 2 MÃ HOÁ AUDIO CẢM QUAN • Cấu trúc dạng cây ña phân giải – Cấu trúc này cho ta lượng bit ngõ ra tối ưu và phù thuộc vào sự phân bố phổ của tín hiệu H 020 (ejω) 2 H 120 (ejω) 2 x(n) H01(ejω) H11(ejω) 2 2 MÃ HOÁ AUDIO CẢM QUAN • Các phương pháp... dòng số liệu từ 324 48kbps Tốc ñộ dòng số liệu từ 323 84kbps Tốc ñộ dòng số liệu từ 323 20kbps 384mẫu/khung/kênh 1152mẫu/khung/kênh 1152mẫu/khung/kênh 32 băng con ñều nhau, mỗi băng con gồm block 12 mẫu 32 băng con ñều nhau, mỗi băng con gồm block 36 mẫu 32 băng con tới hạnthành 18 MDCT Chu kỳ một khung 8ms cho kênh có fs=48kHz Chu kỳ một khung 24 ms cho kênh có fs=48kHz Chu kỳ một khung 24 ms cho kênh có... ∆ ( n) =   2 ,0 < n ≤ N − 1  N MÃ HOÁ AUDIO CẢM QUAN • MDCT (Modified DCT): DCT ñược hiệu chỉnh MDCT là phép biến ñổi trực giao tuyến tính ñược hiệu chỉnh từ DCT MDCT thuận: N −1 N N π  (2n + 1 + )(2k + 1)  ; n = 0, , N − 1; k = 0, , − 1 X (k ) = ∑ p (n) x(n)cos  2N 2 2   n =0 Và chuyểnN ñổi MDCT ngược (IMDCT): x ( n) = 4 N 2 −1 π N  ∑ p(n) X (k ) cos  2 N (2n + 1 + 2 )(2k + 1), n =... bits mở rộng • MPEG -2 sử dụng mã hoá cường ñộ cao, giảm xuyên âm, mã hoá dự ñoán liên kênh và mã hoá ảo ảnh kênh trung tâm ñể nhận ñược tốc ñộ bit kết hợp 384 kbps • Khung MPEG -2 ñược chia thành 2 phần, phần ñầu là MPEG-1stereo, phần mở rộng MPEG -2 chứa tất cả những dữ liệu surround khác MPEG -2 MPEG -2 Mono-stereo Mono-stereo 5 channels MPEG-1 MPEG -2 MPEG -2 32; 44.1;48kHz 16 ;22 ,05 ;24 kHz multi channel... số nén thấp, khoảng 2: 1, phụ thuộc vào ñộ phức tạp của tín hiệu nguồn Thường sử dụng kỹ thuật mã hoá dự ñoán trong miền thời gian KỸ THUẬT NÉN AUDIO – Thuật toán vi sai: Tín hiệu âm thanh có ñặc tính lặp ñi lặp lại nên xuất hiện sự dư thừa số liệu Thông tin lặp sẽ ñược loại bỏ trong quá trình mã hoá và ñược ñưa vào lại trong quá trình giải mã sử dụng kỹ thuật DPCM Các tín hiệu audio ñầu tiên ñược phân... số thấp và cao Sử dụng mã hoá Hufman, Lempel-Zip ñể nén KỸ THUẬT NÉN AUDIO • Nén tổn hao Hệ thống thính giác của con người không thể phân biệt các thành phần phổ có biên ñộ nhỏ giữa các thành phần phổ có biên ñộ lớn Hệ số nén lớn, khoảng 20 :1 phụ thuộc vào quá trình nén và giải nén và chất lượng audio yêu cầu – Các kỹ thuật ñược sử dụng: - Kỹ thuật che (masking) ñối với các thành phần tín hiệu trong... mục ñích giảm thiểu dung lượng MPEG-1 Ví dụ: Sau khi phân tích, mức của 16 băng con ñầu là: Band 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 Level (db) 0 8 12 10 6 2 10 60 35 20 15 2 3 5 3 1 Nếu mức của băng con thứ 8 là 60 thì nó che 12 dB ở băng con thứ 7 và 15 dB ở băng con thứ 9 Băng con 7 có mức 10dB15dB: gởi ñi Chỉ có các mức lớn hơn mức che là ñược gởi ñi thay vì... Dữ liệu Băng lọc 32 phân tích ña pha 32 kênh ↓ 32 MDCT Vòng lặp chỉ ñịnh bit Lượng tử hoá Mã hoá Huffman M U X s(n) FFT Phân tích tâm sinh lý âm học SMR kênh Mã thông Thông tin thêm tin thêm MPEG-1 • Thuật toán cơ bản – Tiến hành chia ngõ vào thành 32 băng con bởi các băng lọc • Lấy 32 mẫu PCM trong cùng một thời ñiểm, kết quả là 32 hệ số tần số ở ngõ ra – Trong MPEG-1 lớp I thì tập 32 giá trị PCM ñược... Layer II Layer III 32; 44.1;48kHz Layer I Layer II Layer III Layer I Layer II Layer III MPEG -2 • Mã hoá và giải mã MPEG -2 channel L0 L R0 C R Matrix MPEG-1 encoder + MPEG-1 decoder T3 LS T4 RS T5 L0’ L’ R0’ C’ T3’ MPEG -2 Extension encoder Inverse Matrix MPEG -2 T4’ Extension decoder T5’ R’ LS’ RS’ MPEG -2 Trong ñó:  L0 = α (L + βC + δLS)  R0 = α (R + βC + δRS) ,α = 1 1 ;β =δ = 1+ 2 2 or α = 1; β = δ ... trước MPEG-1 12 mẫu 12 mẫu 12 mẫu Các mẫu Audio ngõ vào Lọc băng Lọc băng 12 mẫu 12 mẫu 12 mẫu 12 mẫu 12 mẫu 12 mẫu Lọc băng … 12 mẫu 12 mẫu 12 mẫu Lọc băng 31 • • Khung lớp I : 12x 32 =384 Khung... vừa ñạt chất lượng cao MÃ HOÁ AUDIO CẢM QUAN • Cấu trúc dạng ñơn phân giải H 020 (ejω) 2 H 120 (ejω) 2 H 021 (ejω) 2 H 121 (ejω) 2 x(n) H01(ejω) H11(ejω) 2 2 MÃ HOÁ AUDIO CẢM QUAN • Cấu trúc dạng... mở rộng MPEG -2 chứa tất liệu surround khác MPEG -2 MPEG -2 Mono-stereo Mono-stereo channels MPEG-1 MPEG -2 MPEG -2 32; 44.1;48kHz 16 ;22 ,05 ;24 kHz multi channel Layer I Layer II Layer III 32; 44.1;48kHz

Ngày đăng: 14/11/2015, 20:38

TỪ KHÓA LIÊN QUAN