Giáo trình xử lý âm thanh và hình ảnh các chuẩn mã hóa âm thanh và nén ảnh trong truyền thông đa phương tiện tài liệu, ebook, giáo trình

23 661 0
Giáo trình xử lý âm thanh và hình ảnh   các chuẩn mã hóa âm thanh và nén ảnh trong truyền thông đa phương tiện   tài liệu, ebook, giáo trình

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Xử lý âm hình anh Chương 4: Các chuẩn mã hóa âm Chương 4: Các chuẩn mã hóa âm nén ảnh truyền thơng đa phương tiện 4.1 Các chuẩn mã hóa tín hiệu thoại Phần tập trung chủ yếu vào giới thiệu văn tắt hình thành phát triển tiêu chuẩn mã hoá Một kỹ thuật xem phố biến phần tiêu chuẩn Tiêu chuẩn mã hóa thoại tồn thực cần thiết cho việc thông tin liên lạc cho phép người quan tâm có thê sử dụng phát triển sản phẩm dịch vụ dựa tham chiếu Một tiêu chuẩn phát triển đội ngũ chuyên gia thông qua quãng thời gian dài, với việc thử nghiệm rộng rãi đánh giá lặp lăp lại nhiều lần để đảm bảo tập hợp yêu cầu đáp ứng Chỉ có tổ chức với nguồn lực lớn tổ chức thực công việc khó khăn, phức tạp Thời gian cần thiết để hoàn thành tiêu chuẩn kể từ bắt đầu kết thúc khoảng 4.5 năm Điêu nghĩa tiêu chn khơng có lơi khơng thê cải tiên thêm Trên thực tê tiêu chuân thường xuất cải tiên chuân có trước phù hợp với ứng dụng tương lai Một sô tơ chức chn hóa liên quan đên mã hóa tín hiệu thoại giới thiệu sau đây: e© Liên minh viễn thơng quốc tế (ITU): Phân ban chuẩn hóa viễn thông ITU qTU-T) chịu trách nhiệm xây dựng chuân liên quan đên mã hóa thoại cho ứng dụng mạng điện thoại bao gôm mạng không dây cô định e Hiệp thoại Hoa thoại theo hội công nghiệp cho ứng dụng Ky (ANSI) TIA di động số khu thời gian— TDMA viễn thơng (TIA): Đảm nhiệm tiêu chuẩn mã hóa đặc biệt TIA thành phần Viện tiêu chuẩn quốc gia thành công việc phát triển tiêu chuẩn cho điện vực Bắc Mỹ bao gồm hệ thống đa truy nhập phân chia đa truy nhập phân chia theo mã- CDMA e© _ Viện tiêu chuẩn viễn thơng Châu Âu (ETSI): ETSI có thành viên từ nước Châu Âu công ty tơ chức nhà sản xuất thiết bị viễn thong ETSI tổ chức theo ứng dụng nhóm có ảnh hưởng lớn mã hóa thoại nhóm đặc nhiệm di động GSM - có số tiêu chuẩn hữu dụng ứng dụng triển khai nhiều nơi giới 121 Xử lý âm hình anh Chương 4: Các chuẩn mã hóa âm e Bộ quốc phòng Hoa Kỳ (DOD): DOD tham gia thiết lập tiêu chuẩn mã hóa thoại, biết đến tiêu chuân Liên hợp chủng quốc Hoa Kỳ, ứng dụng chủ yếu quân ® Trung tâm nghiên cứu phát triển cho hệ thống vô tuyến Nhật Bản (RCR): Các tiêu chuẩn di động số Nhật Bản xây dựng RCR Bảng 4.l mô tả van tắt chuân mã hóa thoại: Các chuân | vym G.711 1972 G.721 G.722 G.726,727 1988 Thuật toán Tốc độ Ung dung | MOS | u&A-law, ĐCM 64 kbps Mang truyén ke, 4.3 | 0.125 ms ADPCM 32 kbps Cáp biển 4.0 | 0.125 ms Subband ADPCM 48-64 kbps ISDN, Thoai hội nghỉ | 1988 | VBR-ADPCM | 16-24-32-40kbps | PCS/cordless G.728 1992 | Delay 40 | 02ms ore 0.125 ms LD-CELP 16 kbps Mạng nuyền 4.2 | 0.625 ms G.729 1995 | CS-ACELP kbps Manga động | xo | 15ms G.723.1 1995 VN GSM-FR 1989 | LTP_RPE | 1995 18-54 1S-96 5.27/6.3 kbps Thoại thây hình (Videophone) | 3.5-3.7 | 37.5 ms 13 kbps H.323, H.324 Mạng di động OS Chau Au 3.7 20 ms ACELP 13 kbps Mang didong | Chau Au 49 20 ms 1989 VSELP kbps Bắc MỹTDMA 3.5 20 ms 1993 | QCELP carne Bắc Mỹ- 33 | 20ms | 1994| VSELP 5.6 kbps DoD_FS1015 | 1996 LPC-10 2.4 kbps GSM-EFR GSMHR DoD_FS1016 | G.722.2 1990 2001 CELP AMR_WB ACELP P 4.8 kbps Mang di động Mạng di động CDMA Mạng di động | Chau Au Quân Quân VoIP, Thoai 662385kbp Lượng tử hoá tile Xứ lý âm hình anh S Di Chương 4: Các chuẩn mã hóa âm CHải lượng tử liệu DPCM hệ số DC anh nhận can ———x+ từ đạng lưu trữ Giaiméa entra — > ay Giải lượng từ hoa Giải quét Zigzag cac số AC Ảnh khỏi phục + ——| Chuyển đổi lchúi 5xö thành thứ tự quét mảnh Cũng giả trị moidiém anh thêm 128 Ff Biển đủi 2DIDCT 8x8 Hình 4.2: Sơ đồ trình giải nén theo chuẩn JPEG 4.3.2 Chuẩn JPEG-2000 Chuan JPEG ban dau da thu đón nhận rộng rãi có mặt khắp nơi thơng qua ứng dụng máy tính: khn dạng cho ảnh chụp web toàn cầu sử dụng rộng rãi lưu trữ hình ảnh Hơn nữa, ảnh sơ hóa ngày phố biến với người dùng yêu cầu chất lượng ngày tăng lên, đề xử lý ảnh tăng theo Nén hình ảnh khơng làm giảm dung lượng lưu trữ yêu cầu băng thơng, mà cịn cho để ngun phớp tách, ghép dé sáp xêp xử lý đáp ứng mục tiêu ứng dụng thiết bị cụ thể Ngoài ra, yêu cầu hiệu suất nén tốt với tỷ số nén cao dẫn tới phát triên chuẩn JPEG-2000 Hệ thơng nén JPEG-2000 có tỉ lệ xuyên âm thấp han chuẩn công nghệ JPEG truyện thông, cho dù JPEG-2000 chuân hoàn toàn mà phát triên từ tiêu chuân có Điều quan trọng hơn, cho phép tách phân giải khác nhau, điểm ảnh, miền quan tâm, thành phân nữa, tất chúng đưa vào dòng bit nén đơn Nó cho phép ứng dụng xử lý truyền thông tin cân thiết cho thiết bị nào, từ ảnh nguồn mã hóa theo chn JPEG-2000 Tính tương thích ưu điểm nỗi trội mà kỹ thuật xử lý JPEG truyền thống gặp nhiều khó khăn Không giống tiêu chuẩn JPEG truyền thống, kỹ thuật mã hóa dựa biển đối cosin rời rạc (DCT — Discrete Cosin Tranform) dùng mã hóa Huffmaan, JPEG-2000 sử dụng kỹ thuật rmã hóa dang song roi rac (DWT — Descrete Wavelet Transform) dung mã số học Sử dụng DWT cho phép nâng cao độ phân giải tần số mang tính khơng gian 128 Xứ lý âm hình anh Chương 4: Các chuẩn mã hóa âm thê biến đối hình ảnh Sơ đồ khối trình nén giải nén theo chuẩn JPEG-2000 mơ tả hình 4.3 đây: Ảnh gốc Í %ữ lý trước biến đỏi L j Anh mãhoác Giải mã hố — Biến đơi thn liên \_thanh phan J Giai lương từ hoá " — Bien doi riêng thành phân / Bien do: ngwoc riêng thành phần Mã hoá ` Bien doi ngược liên thành phần Xử lý sau biến đổi — Ảnh sau ma hoa + ) (a) |£ành khỏi phục hy) (b) Hình 4.3: Sơ đồ trình nén giải nén theo chuẩn JPEG-2000 Bước 1: Xử lý trước biến đổi Do sử dụng biến đổi Wavelet, JPEG2000 cân có đữ liệu ảnh đầu vào dạng đối xứng qua Xử lý trước biến đối giai đoạn đảm bảo đữ liệu đưa vào nén ảnh có dạng Ở phía giải mã, giai đoạn xử lý sau biến đôi trả lại giá trị gốc ban đầu cho dỡ liệu ảnh Bước 2: Biến đối liên thành phần Giai đoạn loại bỏ tính tương quan thành phần ảnh JPEG-2000 sử dụng hai loại biến đổi liên thành phân biến đôi màu thuận nghịch (Reversible Color Transform - RCT) va bién d6i mau khong thuan nghich (Irreversible Color Transform - ICT) biến đơi thuận nghịch làm việc với giá trị nguyên, biến đôi không thuận nghịch làm việc với giá trị thực ICT RCT chuyên liệu ảnh từ không gian màu RGB sang YCrCb RCT áp dụng hai dạng thức nén có tơn thất khơng tơn thất, cịn ICT áp dụng cho nén có tơn thất Việc áp dụng biến đơi trước nén ảnh khơng năm ngồi mục đích làm tăng hiệu nén Các thành phân Cr, Cb có ảnh hưởng tất tới cảm nhận hình ảnh mắt thành phần độ chói Y có ảnh hưởng tất lớn tới ảnh Bước 3: Biến đổi riêng thành phan Biến đối riêng thành phần áp dụng JPEG-2000 biến đổi Wavelet Bước 4: Lượng tử hoá - Giải lượng tử hoá Các hệ số phép biến đổi tiến hành lượng tử hố Q trình lượng tử hố cho phép đạt tỷ lệ nén cao hon cách thể giá trị biến độ xác tương ứng cân thiết với mức tiết ảnh cần nén Các hệ số biến đối 129 Xử lý âm hình anh Chương 4: Các chuẩn mã hóa âm lượng tử hố theo phép lượng tử hố vơ hướng Các hàm lượng tử hố khác áp dụng cho băng khác thực theo biêu thức: /(x.vì=) L | AX, V J⁄ TA sem Ù '(X.] } (4.1) với bước lượng tử, U(+, y) giá trị bang dau vao; V(x, y) 1a giá trị sau lượng tử hoá Trong dạng biến đổi nguyên, đặt bước lượng tử 1.Với dạng biến đơi thực bước lượng tử chọn tương ứng cho băng riêng rẽ Bước lượng tử băng phải có dịng bít truyền để phía thu giải lượng tử cho ảnh Cơng thức giải lượng tử hố là: Ulx.y)}= [PF (x.]Ì+?sgnÏ |x w lịA (4.2) r tham số xác định dấu làm tròn, giá tri U(x, y); V(x, y) tuong img 1a cdc gid trị khôi phục giá trị lượng tử hố nhận JPEG-2000 khơng cho trước r nhiên thường chọn z = 1/2 Bước 5: Mã hoá JPEG-2000 theo khuyến nghị uỷ ban JPEG quốc tế sử dụng nhiều phương pháp mã hoá khác nhiều cách biến đổi Wavelet khác để có thé thu chất lượng ảnh tương ung với ứng dụng cần xử lý Điều giúp cho JPEG2000 mém dẻo nhiều so với JPEG Việc áp dụng phương pháp mã hoá khác mở rộng sang lĩnh vực nén ảnh động biến đôi Wavelet Trong thực tế phương pháp mã hoá ảnh áp dụng nén ảnh biến đơi Wavelet JPEG-2000 có hai phương pháp coi sở áp dụng nhiều nhất: phương pháp SPIHT phuong phap EZW (Embedded Zerotree Wavelet Encoder) JPEG-2000 chuẩn nén tạo khả nén ảnh tốt đáng kê so với JPEG Với chất lượng hình ảnh, thơng thường JPEG-2000 nén ảnh gấp lần so với JPEG Với tỷ số nén cao, chất lượng hình ảnh giảm Tuy nhiên điều đồng nghĩa với việc tăng độ phức tạp yêu cầu lưu trữ q trình mã hóa giải mã Một tác động khác điều hình ảnh có thê tốn nhiều thời gian lưu trữ hiển thị 4.4 Các chuẩn nén Video MPEG-1, 2, 4, MPEG-21 4.4.1 Tông quan MPEG _ MPEG (Moving Picture Expert Group) dugc doi vao nam 1988 nhằm mục đích chn hố cho nén tín hiệu âm video Nén tín hiệu video theo chuân MPEG phương pháp nén ảnh động làm giảm dư thừa không gian (như JPEG) mà làm giảm dư thừa thời gian khung ảnh, khác biệt so với JPEG 130 Xử lý âm hình anh Chương 4: Các chuẩn mã hóa âm MPEG khong phai công cụ nén đơn lẻ mà ưu điểm nén ảnh dùng MPEG chơ MPEG có tập hợp cơng cụ mã hố chn, chúng có thê kêt hợp với cách linh động đê phục vụ cho loạt ứng dụng khác Nén MPEG kết hợp hài hoà bốn kỹ thuật bản: Tiên xử lý (Preprocessing), đoán trước chuyển động cdc frame mã hoá (temporal prediction), bù chuyên động giải mã (motion compensation) mã lượng tử hoá (quatisation coding) Các lọc tiền xử lý lọc thông tin không cần thiết từ tín hiệu video thơng tin khó mã hố khơng quan trọng cho cảm thụ mắt người Kỹ thuật đoán chuyên động dựa nguyên tắc ảnh chuỗi video dường có liên quan mật thiết với theo thời gian: Mỗi frame thời điểm định có nhiều khả giống với Írame đứng phía trước phía sau Các mã hố tiến hành quét phân nhỏ frame gọi macro blocks, sau phát macro block không thay đổi từ frame tới frame khác Bộ mã hoá tiên đoán trước xuất macro blocks biét vị trí hướng chun động Do thay đổi khối frame hién tai (motion compesated residual) va cac khối tiên đốn truyền tới bên phía thu Phía bên thu tức giải mã lưu trữ sẵn thông tin mà không thay đối từ frame tới frame khác nhớ đệm chúng dùng để điền thêm cách đêu đặn vào vị trí trống ảnh khơi phục Nén tín hiệu video thực nhờ việc loại bỏ dư thừa không gian (spatial coding) thời gian (temporal coding) Trong MPEG, việc loại bỏ dư thừa thời gian (nén liên ảnh) thực trước hết nhờ sử dụng tính chất giống ảnh liên tiếp (Inter-frame techniques) Chúng ta sử dụng tính chất để tạo ảnh nhờ vào thông tin từ ảnh gửi trước (“predicted”) Do phía mã hoá, ta cần gửi ảnh có thay đổi so với ảnh trước, sau ta lại dùng phương pháp nén vê không gian để loại bỏ dư thừa khơng gian ảnh sai khác Nén không gian dựa nguyên tắc phát giống điểm ảnh (pixels) lân cận (Intra-frame coding techniques) JPEG áp dụng phương pháp nén theo không gian thiết kế để xử lý truyền ảnh tĩnh Tuy nhiên nén tín hiệu theo phương pháp JPEG có thê dùng để nén ảnh cách độc lập dãy tín hiệu video ứng dụng thường gọi JPEG động (Motlon JPEG) Trong chu kỳ gửi dãy ảnh theo kiểu JPEG động, ảnh nén nhờ loại bỏ độ dư thừa khơng gian, sau ảnh nén nhờ loại bỏ độ dư thừa thời gian (nén liên ảnh) Quá trình lặp lặp lại cho dãy ảnh tín hiệu video Thuật toán nén MPEG dựa phép biến đổi DCT cho khối anh 8x8 picxels để tìm điểm ảnh nội dung trùng thừa khơng gian cách có hiệu điểm ảnh ảnh Tuy nhiên, trường hợp có mối tương quan chặt chẽ các ảnh tức trường hợp hai ảnh liên tiếp có nhau, kỹ thuật Inter-frame coding techniques dùng với việc tiên đoán dư thừa không gian để tạo thành kỹ thuật tiên đoán bù chuyển động 131 Xử lý âm hình anh Chương 4: Các chuẩn mã hóa âm anh (Motion compesated prediction between frames) Trong nhiều sơ đồ nén MPEG, nguoi ta thường kêt hợp việc tiên đoán bù chuyên động theo thời gian phép biên đôi thông tin theo không gian đê đạt hiệu nén cao (Hybrid DPCM/DCT coding of video) Hâầu hết sơ đồ nén MPEG dùng kỹ thuật lây mẫu bố xung (Subsampling) lượng tu hoa (Quantization) trudc ma hoa Lay mẫu bổ xung nhằm mục đích để làm giảm kích thước ảnh đầu vào theo theo chiều ngang chiêu dọc, giảm số lượng điểm ảnh trước mã hoá Cũng nên nhớ số trường hợp người ta cịn lây mẫu bơ xung theo thời gian để làm giảm số lượng ảnh dãy ảnh trước mã hoá Đây xem kỹ thuật nhằm loại bỏ dư thừa dựa vào khả lưu ảnh mắt người cảm thụ Thường thường, có thé phân biệt thay đổi độ sáng ảnh (changes in Brightness) tốt so với thay đối màu (Chromaticity changes) Do trước hết sơ đồ nén MPEG tiến hành chia ảnh thành thành phần Y (độ chói) U, V (các thành phân hiệu mẫu) Các tín hiệu video thành phan sé duoc lay mau (samples) va s6 hod (digitised) dé tao nén điểm ảnh rời rạc theo tỷ lệ 4:2:2 4:2:0 Kỹ thuật tiên đoán bù chuyên động sử dụng công cụ mạnh để làm giảm dư thừa không gian ảnh Khái niệm bù chuyên động dựa phán đoán hướng chuyền động ảnh tức ảnh thành phân dãy video thay gần Kỹ thuật tiên đoán bù chuyên động ảnh xem biện pháp đề hạn chế bớt thông số chuyền động việc dùng vector chuyên động để mô tả dịch chuyển điểm ảnh Kết tiên đoán tốt điểm ảnh dựa tiên đoán bù chuyển động từ ảnh mã hoá truyền phía trước Cả hai độ) vectors chuyên động (hướng chuyền động) Tuy nhiên có mơi quan hệ tương quan chặt chẽ (rùng khơng gian), vector chun động có thê ảnh gồm pixels lân cận (MPEG -1 MPEG thông số, sai số chuyển động (biên truyền tới phía bên nhận điểm ảnh khơng gian dùng cho khối điểm -2 dùng khối 16 x16 pixels) 4.4.2 Cầu trúc dịng bít Đề tạo khả chống lỗi truyền tín hiệu qua kênh có nhiễu, ước đốn phải xác lập lại (reset) thường xuyên ảnh nén khung hay nén ước đoán phân đoạn thành nhiều lát nhỏ (slice) cho việc tái đồng giải mã phía thu Cấu trúc dịng MPEG gồm lớp: lớp dãy ảnh (sequence), lớp nhóm ảnh (GOP), lớp ảnh (pictrue), lớp cắt lát dòng bit (slice), lớp macroblock, lớp khối (Block) Mỗi lớp hỗ trợ chức định: chức xử lý tín hiệu (DCT, bù chuyển động) hai chức logic (tái đồng bộ, điểm truy xuất ngẫu nhiên) Quá trình tạo dòng bit MPEG ghép kênh: kết hợp dòng liệu vào, dòng liệu ra, điều chỉnh đồng quản lý đệm Cú pháp dòng MPEG bao gồm: lớp dịng bit (stream), lớp gói (pack) lớp gói tin (packet) hình 4.5 132 Xử lý âm hình anh Chương 4: Các chuẩn mã hóa âm Khối: Khối 8x8 điểm ảnh tín hiệu chói tín hiệu màu dùng cho phương pháp nén DCT Tổ hợp cấu trúc khối (macroblock): câu trúc khối nhóm tương ứng với lượng thông tin chứa đựng kích thước 16x16 điểm ảnh trúc khối xác định lượng thơng tin chứa thay đổi tùy theo câu mẫu sử dụng Thông tin cấu trúc khối mang dạng (là câu khối Y hay Cr, Cb) vector bù chuyên động tương ứng khối Câu trúc trúc Mảng (Slice): mảng bao gồm vài cau trúc khơi kề Kích thước lớn mảng có thé bao gom tồn ảnh kích thước nhỏ mảng cau truc khối Thông tin đầu mảng chứa đựng vị trí mảng toàn ảnh, hệ số cân lượng tử Ảnh (Picture): lớp ảnh cho phép giải mã xác định loại ảnh mã hóa Thơng tin đầu dùng để thứ tự truyền khung để giải mã có thê xếp ảnh lại theo thứ tự Trong thông tin đầu ảnh cịn chứa thơng tin đồng bộ, độ phân giải phạm vi vector chuyển động Trong MPEG, có loại ảnh khác dùng đề mã hoá cho khối ảnh: e Kiéu anh ‘Intra’ (T-pictures) ảnh mã hoá cách độc lập mà không cần tham khảo tới ảnh khác Hiệu nén tín hiệu đạt loại bỏ thừa khơng gian mà khơng có yếu tố thời gian tham gia vào trình I-pictures dùng cách tuần hoàn để tạo thành điểm tựa cho dịng liệu q trình giải mã e© Ảnh “Predictive' (P-pictures) có thê sử dụng ảnh I P sát phía trước để bù chun động dùng để tham khảo cho việc tiên đoán ảnh khác Mỗi khối ảnh P-picture mã theo kiểu tiên đoán (predicted) mã cách độc lập (Intra-coded) Do sử dụng nén theo không gian thời gian, hiệu nén P-pIctures tăng lên cách đáng kê so với ]-pictures e Anh ‘Bidirectionally-Predictive’ pictures hay B- Pictures cé thé str dung cdc anh I P phía trước phía sau cho việc bù chuyên động cho kết nén cao Mỗi khối B-pictures có thê tiên đốn theo chiều ngược, xi, hai hướng mã cách độc lập Để tiên đốn ngược từ ảnh phía sau nó, mã hố tiễn hành xếp lại ảnh từ thứ tự xuất cách tự nhiên sang thứ tự khác ảnh đường truyện Do từ đầu mã hoá, B- -pictures truyền sau ảnh dùng để tham khảo phía trước phía sau Điều tạo độ trễ phải xếp lại thông tin, độ trễ lớn hay nhỏ tuỳ thuộc vào số ảnh B-pictures liên tiếp truyên Nhóm ảnh (GOP): Cac anh I, P, B-pictures thuong xuất theo thứ tự lặp lặp lại cách tuân hoàn, ta có khái niệm vê nhóm ảnh GOP (Group of 133 Xử lý âm hình anh Chương 4: Các chuẩn mã hóa âm Pictures) Đối với chuẩn nén MPEG, chất lượng ảnh phụ thuộc vào tỷ lệ nén khuôn hình mà cịn phụ thuộc vào độ dài nhóm ảnh GOP Nhóm ảnh khái niệm MPESG, đơn vị mang thơng tin độc lập MPEG GOP bắt buộc phải bắt đầu ảnh I cho phép xác định điểm bắt đầu để tìm kiếm biên tập (thơng tin đầu gồm 25 bit chứa mã định thời điều khiển) tiếp sau loại ảnh P B Một ví dụ GOP dạng ảnh tự nhiên xuất theo thứ tự sau: B, Bz I; By Bs B7 Bg Po Bio Buy Piz Thứ tự xuất chúng đường truyền bị thay đổi xếp lại mã hoá sau: I; Bị Bo Ps Ba Bs Po By Bs Pi Bio Bu Cau tric GOP có thé mô tả hai tham số: N 1A s6 cdc anh GOP va Xí khoảng cách ảnh P-pIctures Nhóm GĨP miêu tả NV = 12 vàM =3 Doan (chương trình) video: đoạn video bao gồm thơng tin đầu, số nhóm ảnh thông tin kết thúc đoạn Thông tin đầu đoạn video chứa đựng kích thước chiêu ảnh, kích thước điểm ảnh, tốc độ bit đòng video số, tân số ảnh đệm tối thiểu cần có Đoạn video thơng tin đầu tạo thành dịng bit mã hóa goi la dong co ban (Elementary Stream) 2222 anh 8x8 (Block) Y Cr Cb Marcroblock i _ a Mang Khung (Frame) (Slice) S NT Khối điểm Nhóm anh (Group Of Pitues) Hình 4.4: Cấu trúc dòng bit MPEG 134 Xử lý âm hình anh Thơng tin đầu đoạn Chương 4: Các chuẩn mã hóa âm Thơng tin kết Dịng số thúc đoạn Đoạn video thứ n-Í Đoạn video thứ n Đoạn video thứ n+Ï Thông tin dau nhom anh GOP#p | | GOP#p:l GOP#p+2 || GOP#p+3 GOPip+4 Thông tin đầu khung ảnh Khung | Khung B Khung P Khung B Khung | Thông tin đầu mảng MB | MB | MB | MB | MB | MB | MB | MB | MB | MB | MB | MB | MB MB = Macroblock Thuộc tính MB Vector chuyen k động vlylylyleœlc Hệ số DCT | EOB | | | Khdi 8x8 điểm chói | | Hình 4.5: Kiến trúc dòng liệu MPEG 4.4.3 Nguyên lý hoạt động Hoạt động mã hóa, phụ thuộc vào loại hình ảnh, mã hóa thời điểm xét Quá trình nén theo chuan MPEG kết hợp nén ảnh nén liên ảnh Tín hieu đầu vào có dạng 4:2:2 4:2:0 nén liên ảnh nhằm tạo ảnh khác biệt đầu cộng Ảnh khác biệt sau nén ảnh qua bước: biến 135 Xử lý âm hình anh Chương 4: Các chuẩn mã hóa âm đối DCT, lượng tử hóa, mã hóa Cuối ảnh trộn với vector chuyên động đưa đên khuyêch đại đệm thu ảnh nén Ta xét ví dụ nén theo phương pháp trên, dùng ảnh [ P câu trúc GOP (Hình 4.6) Ảnh thứ nhóm phải mã hóa ảnh loại I Trong trường hợp này, sau lây mẫu lần đầu, tín hiệu video truyền đến khối biến đôi DCT cho MB riêng, sau lượng tử mã hóa entropy Tín hiệu từ lượng tử hóa đưa đến lượng tử hóa ngược biến d6i DCT ngược, sau lưu vào nhớ ảnh Trong trường hợp mã hóa ảnh loại P, mạch nén chuyên động làm việc Trên sở so sánh ảnh xét ảnh nhớ, xác định vector chuyển động, sau dự báo ảnh Sự chênh lệch ảnh xét dự báo ảnh biến đổi DCT, lượng tử hóa mã hóa entropy Cũng trường hợp ảnh loại I, tín hiệu từ lượng tử hóa giải lượng tử hóa biến đơi DCT ngược cộng với ảnh dự báo xét lưu vào nhớ Tốc độ bit tín hiệu video nén khơng có định, phụ thuộc vào nội dung ảnh xét Ngược lại, đầu mã hóa, dịng bit phải cố định để xác định tốc độ cho dung lượng kênh truyền Do đó, đầu mã hóa phải có nhớ đệm đủ lớn Bộ mã hóa phải kiểm tra trạng thái đầy nhớ đệm Khi số liệu nhớ đệm gần dung lượng cực đại, hệ số biễn đổi DCT ngược lượng tử hóa xác Trong trường hợp ngược lại, có nghĩa nhớ đệm chứa số liệu ít, việc lượng tử hóa hệ số tăng lên Điều khiến tốc độ bit Bảng lượng tử " Anh dv doan Lượng DCT tử hóa |Mãhóal "| entropy |Trện| : _ |Khuyếch| Video nến *Ì đại đệm Anh so sanh » r _| Xác định vector chuyển động Vector chuyén déng a 4:2:0 ry Video |a:2-2 Điêu khiển nhớm anh Hình 4.6: Bộ mã hóa MPEG tiêu biểu 136 Xử lý âm hình anh Chương 4: Các chuẩn mã hóa âm Q trình giải mã: Theo lý thuyết, trình giải mã ngược lại với q trình mã hóa minh họa hình 4.7 Vào | VLD | „| Giải lượng tử »| Ỳ Bộ mã hoá ước đoán | DCT @ A >| Tái lập trậttự | | Ra khung ảnh Hệ số DCT Các vectơ chuyển động | -| _ Ước đoán chuyển động | Lưu trữ khung ảnh tham khảo Hình 4.7: Bộ giải mã MPEG tiêu biểu Chuỗi tín hiệu vào giải mã entropy VLD (Variable-Length Decoder) Sau tách số liệu ảnh (hệ số biến đôi DCT) khỏi vector chuyên động Số liệu giải lượng tử hóa biến đôi DCT ngược Trong trường hợp ảnh loại I bắt đầu nhóm ảnh chuỗi, nhận ảnh đầu hồn chỉnh cách Nó lưu nhớ ảnh sử dụng để giải mã ảnh Trong trường hợp ảnh loại P thực giải lượng tử biễn đôi DCT ngược với việc sử dụng vector chuyên động ảnh lưu vào nhớ ảnh Trên sở xác định dự báo ản xét Ta nhận ảnh sau cộng dự báo ảnh kết biến đôi DCT ngược Ảnh lưu vào nhớ đê có thê sử dụng chuẩn giải mã ảnh 4.4.4 Các chuẩn nén MPEG 4.4.4.1 MPEG-1 Chuẩn đâu tiên đưa MPEG, có tên gọi phơ biễn MPEG-1, thiết kê đê cung câp việc nén video audio cho việc lưu trữ phát lại CD-ROM Chuan MPEG-1 bao gém phan Phan dé cập tới van dé hệ thông (bao gồm ghép kênh video audio mã hóa), phân đề cập tới video nén phân audio nén Phân (video) phát triển với mục đích hỗ trợ việc mã hóa có hiệu video cho ứng dụng phát lại CD tạo chất lượng video tương đương tốt băng video VHS vê tốc độ bit CD (khoảng 1,2 Mbps đôi với video) Khi mà hau hét ứng dụng người tiêu dùng đòi hỏi cần giải mã phát lại, không bao gồm mã hóa nảy sinh u cầu phải tối thiểu hóa phức tạp giải mã Do đó, q trình 137 Xử lý âm hình anh Chương 4: Các chuẩn mã hóa âm giải mã MPEG-1 xem đơn giản so với mã hóa (khơng giống JPEG, mã hóa giải mã có mức độ phức tạp tương tự nhau) Cac dac tinh cia MPEG-1 Tín hiệu video đầu vào tới bd ma héa video (Y:Cr:Cb) với độ phân giải không gian thông thường Mỗi khung video xử lý theo khối vùng 16x16 pixel khung hiên thị Vùng MPEG-1 c6é khuén dang 18 4:2:0 352x288 352x240 pixels macroblock, tương ứng với tạo từ 16x16 mẫu độ sáng, 8x8 mẫu Cr 8x8 mẫu Cb (vì Cr Cb phải nửa độ phân giải ngang dọc thành phần độ sáng) Một macroblock bao gồm khối 8x8: khối độ sáng (Y), khối Cr khối Cb Mỗi khung video mã hóa để tạo ảnh mã hóa Có loại chính: ảnh L, ảnh P ảnh B (Chuân xác định thêm loại ảnh ảnh D loại hiêm sử dụng ứng dụng thực tê) Ảnh loại I: khơng có dự đốn bù chuyển động Ảnh loại I sử dụng để làm tham khảo cho ảnh dự đoán xa Ảnh loại P: sử dụng dự đoán bù chuyên động từ ảnh tham khảo (ảnh P ảnh I có trước ảnh P tại) Do ảnh loại P dự đốn sử dụng dự đoán chuyên tiêp thân ảnh P có thê sử dụng làm tham khảo cho ảnh dự đoán xa anh Ảnh loại B: sử dụng dự đoán bù chuyển động từ ảnh tham khảo, ảnh P và/hoặc I trước sau ảnh B Hai vectơ chuyển động tạo cho macroblock ảnh B: tới vùng thích hợp ảnh tham khảo trước (một vectơ chuyên tiếp) tới vùng thích hợp ảnh tham khảo tương lai (vectơ tiếp) Một macroblock dự đốn bù chun động có thê thực theo cách: dự đoán chuyên tiếp sử dụng vecto chuyên tiếp, dự đoán hồi tiếp sử dụng vecto hồi tiếp dự đoán hai chiều (trong tham khảo dự đốn thực cách lây trung bình tham khảo dự đốn chuyển tiếp hoi tiếp) Thơng thường, mã hóa chọn chế độ dự đoán (chuyên tiếp, hồi tiếp hay hai chiều) cho tạo lượng thấp macroblock sai phân Bản thân ảnh loại B không sử dụng tham khảo dự đoán cho khung dự đoán xa Chuan MPEG-1 không thực định nghĩa thiết kế mã hóa: thay vào đó, chuẩn mơ tả cú pháp mã hóa giải mã “tham khảo' giả thuyết Trong thực tế, cú pháp chức mơ tả chuẩn có ý nghĩa mã hóa phải chứa chức định 4.4.4.2 MPEG-2 Ung dung giai tri quan video mã hóa (sau lưu trữ CD-ROM) truyền hình số Để cung cấp lựa chọn cải tiến cho truyền hình tương tự, vài 138 Xử lý âm hình anh Chương 4: Các chuẩn mã hóa âm đặc tính chủ yếu yêu câu nguyên lý mã hóa video Nó phải hỗ trợ hiệu kích thước khung lớn (thường 720x576 hay 720x480 pixel cho độ phân giải ITU-R 601) mã hóa video kết hợp Với độ phân giải chất lượng truyền hình, video kết hợp tạo hình ảnh video mịn MPEG-2 yêu câu đời nhằm đáp ứng MPEG-2 bao gồm phần chính: Video, Audio (dựa mã hóa audio MPEG1) Systems (định nghĩa, phân tiệt MPEG-I1, ghép kênh truyện lng audio/visual mã hóa) Những điêm nâng cao thêm vào MPEG-2 bao gom: Mã hóa hiệu video với chất lượng truyễn hình: Ứng dụng quan trọng MPEG-2 truyện hình sơ quảng bá Các chức MPEG-2 đánh giá có hiệu mã hóa độ phân giải trun hình tơc độ bịt khoảng từ 3-5 Mbps Hỗ trợ mã hóa video két hop: MPEG-2 video có vài đặc tính hỗ trợ mã hóa cách linh hoạt video kết hợp Hai trường tạo khung kết hợp hồn chỉnh có thê mã hóa hình ảnh riêng biệt, trường mã hóa thành ảnh I, P B Các ảnh trường P B có thê dự đoán từ trường khung khác từ trường khác khung Kha nang phan cap: Những chế độ tiên tiến JPEG mô tả trước dạng mã hóa phan cap Mot luong bit ma hoa phan cap bao gôm lớp sở nhiêu lớp tăng cường Lớp sở có thê giải mã đê tạo chuỗi video có thê nhận diện mà có chât lượng nhìn bị hạn chê, chi chât lượng cao có thê tạo việc giải mã lớp sở cộng với lớp tăng cường, với lớp tăng cường thêm vào nâng cao chât lượng chuôi giải mã MPEG-2 hỗ trợ chê độ phân câp: > Phân cấp theo không gian > Phân cấp theo thời gian > Phan cap SNR > Phân vùng liệu Profile level: Hầu hết ứng dụng yêu cầu tập nhỏ giới hạn chức diện rộng hỗ trợ MPEG-2 Đê khun khích khả liên kêt đơi với ứng dụng “chủ yêu' bât kỳ (ví dụ trun hình sơ), chn bao gơm tập profile level đê nghị, môi tập định nghĩa tập nhật định chức cua MPEG-2 Môi profile xác định tập khả khả quan trọng Cịn mơi level xác định độ phân giải không gian thời gian Chuân MPEG-2 định nghĩa kết hợp định đề nghị cho profile level Main profile/low level (chỉ sử dụng mã hóa khung) thực chât MPEG-1 Main profile/main level phu hợp với truyện hình sơ quảng bá kệt hợp profile/level sử dụng rộng rãi nhât Main profile/high level phù hợp với truyện hình độ nét cao (HDTV) 139 Xử lý âm hình anh Chương 4: Các chuẩn mã hóa âm 4.4.4.3 MPEG-4 Các chuẩn MPEG-I MPEG-2 xử lý khung video hoàn chỉnh, khung mã hóa đơn vị Tiêng lẻ Chuân MPEG-4 phát triên với mục đích mở rộng khả chn trước theo sơ hướng Hỗ trợ ứng dụng có tốc độ bit thấp: MPEG-I MPEG-2 có hiệu chấp nhận mã hóa tốc độ bit khoảng Mbps Tuy nhiên, nhiêu ứng dụng nối bật (đặc biệt ứng dụng dựa Internet) yêu câu tốc độ bit truyền thập nhiều MPEG-1 không hỗ trợ việc nén hiệu tốc độ bit thấp Hỗ trợ mã hóa dựa đối tượng: Có thể nói hầu hết thay đơi ngun tắc chuẩn MPEG-4 hướng đến mã hóa dựa đối tượng hay dựa nội dung, cảnh video có thê xử lý tập đối tượng đối tượng cận cảnh chuỗi khung hình chữ nhật Loại mã hóa mở dải rộng khả năng, ví dụ mã hóa độc lập đối tượng khác cảnh, dùng lại thành phan canh, ghép lai (cac vat thể từ số nguồn kết hợp cảnh) độ tương tác cao Khái niệm sở sử dụng MPEG-4 Visual VO độc (Video Object) Một cảnh video (VS) (một chuỗi khung video) số VO MPEG-4 cung cấp công cụ cho phép VO lập, mở nhiều khả Dưới dạng VO, “khungˆ mặt phẳng đối tượng video (VOP — Video Object Plane) Một cảnh tạo thành từ mã hóa cách tương đương với hồn chỉnh có thê mã hóa VOP đơn hình chữ nhật điều tương đương với ảnh dạng MPEG-I Mã hóa dựa cơng cụ: MPEG-I1 có độ linh động hạn chế, MPEG-2 đưa khái niệm cho ứng công cụ mã khung chuẩn “bộ công cụ” gôm profile level mà có thê kết hợp theo nhiều cách dụng khác MPEG-4 mở rộng đặc điểm thành tập hợp hóa có độ linh hoạt cao phép dải ứng dụng hóa cho phép cơng cụ thêm vào “bộ công cụ' Chuẩn MPEG-4 thiết lập nhờ cơng cụ mã hóa chức có thê tăng thêm phiên chuẩn phát triển, danh sách công cụ tiếp tục tăng lên 4.4.4.4 MPEG-7 Mục tiêu MPEG-7 xác định tập hợp chuẩn mô tả dùng để mô tả nhiêu loại thông tin đa phương tiện với codec chuân, sở liệu khác chí thơng tin nghe-nhìn tương tự Các mô tả với chê mô tả kêt hợp với thân nội dung đê tạo phương pháp tìm kiêm tài liệu nhanh có hiệu người dùng Các mức mơ tả 140 ... | 2744] 3G Bảng 4.1: Các chuẩn mã hoá thoại 122 35 | 24.5 ms 45ms 15-25 ms Xử lý âm hình anh Chương 4: Các chuẩn mã hóa âm 4.2 Các chuẩn mã hóa âm 4.2.1 Các chuẩn mã hóa âm ISO/MPEG Từ năm 1988,... anh Hình 4.6: Bộ mã hóa MPEG tiêu biểu 136 Xử lý âm hình anh Chương 4: Các chuẩn mã hóa âm Q trình giải mã: Theo lý thuyết, trình giải mã ngược lại với q trình mã hóa minh họa hình 4.7 Vào |... đầu vào có dạng 4:2:2 4:2:0 nén liên ảnh nhằm tạo ảnh khác biệt đầu cộng Ảnh khác biệt sau nén ảnh qua bước: biến 135 Xử lý âm hình anh Chương 4: Các chuẩn mã hóa âm đối DCT, lượng tử hóa, mã hóa

Ngày đăng: 22/02/2017, 22:12

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan