L: Cường độ sáng nhỏ nhất,
5. Các chuẩn nén dữ liệu đa phương tiện.
5.4. ITU-T H.324 và H
H.320 là chuỗi các chuẩn với H.261 cho nén video đã được thiết kế cho hội thảo truyền hình và điện thoại truyền hình trên các kênh ISDN có tốc độ trong khoảng 64 Kbps và 2 Mbps.
Chuẩn mới của ITU là H.324 mở rộng khả năng cho điện thoại truyền hình ở tốc độ
64 Kbps. Trong H.324 có các chuẩn: – H.263 cho nén video.
– G.723 cho nén tiếng nói. – H.223 cho đa hợp.
– H.245 cho điều khiển.
H.263 hỗ trợ 5 kích cở ảnh khác nhau từ Sub-QCIF (128x96 pixels) đến 16CIF (1408x1152 pixels).
– Sơđồ nén H.263 bao gồm một thuật toán lõi và 4 mã hoá tuỳ chọn. Thuật toán lõi giống như H.261 và MPEG-1 video.
– Sự khác nhau chính là dùng nén chuyển động nữa pixel để tăng độ chính xác. Các cú pháp không tương thích với H.261
Bốn mã hoá tuỳ chon của H.263 là:
– Unrestricted motion vector mode (Kiểu vector chuyển động không giới hạn): Trong kiểu này, các vector chuyển động theo điểm ngoài ảnh. Các điểm ảnh góc
được dùng để dự đoán cho các điểm ảnh không tồn tại.
– Syntax-based arithmetic coding mode (Kiểu mã hoá cơ sở cú pháp số học): Trong kiểu này, các hệ số lượng hoá DCT được dùng. Nó làm tăng hệ số nén đến 20% so với mã hoá số học dùng các bảng mã hoá chiều dài biến cốđịnh.
– Advanced prediction mode (Kiểu dự đoán tiên tiến): Trong kiểu này dùng cả hai macroblock (16x16 pixels) và block (8x8 pixels) làm các đơn bị cơ bản cho bù chuyển động của thành phần độ sáng P-picture.
– PB-frames mode (Kiểu frame P-picture và B-picture): Một PB-frame bao gồm hai ảnh (P-picture và B-picture) được mã hoá trong một đơn vị. Vậy các vector chuyển động của 2 ảnh trong PB-frame có liên quan với nhau Một PB-frame chỉ truyền một vector chuyển động cho 2 ảnh.
Bốn mã hoá tuỳ chon của H.263 có thể dùng chung hoặc riêng biệt trừ kiểu Kiểu dự đoán tiên tiến phải dùng chung với Kiểu vector chuyển động không giới hạn. Khi tất cả
các tuỳ chọn được cài đặt, H.263 có thể cho cùng chất lượng video với H.261 nhưng chỉ
với phân nữa tốc độ bit. So sánh với MPEG-1 ở tốc độ 1.5 Mbps thì H.263 cho chất lượng video tốt hơn. H.263 cũng gia tăng khả năng phục hồi lỗi nên có thể ứng dụng trong truyền thông di động nơi có hệ số lỗi cao.
5.5. JBIG
JBIG là một chuẩn của ISO, nó đặc tả một giải thuật nén không mất cho các ảnh nhị
của Fax nhóm 3 và nhóm 4. Trong ảnh nhị phân, mỗi điểm ảnh biểu diễn bởi 1 bit. Nén JBIG trên cơ sở một tổ hợp của mã hoá dựđoán và số học.
JBIG cũng có thể được dùng cho ảnh trắng đen (gray-scale) hay ngay cả ảnh màu bằng nén không mất bởi ứng dụng một cách đơn giản thuật toán mỗi thời điểm một bản
đồ bit (bit plan). JBIG cũng làm việc tốt lên đến 6 bit / pixel (ngoài phạm vi kiểu nén không mất JPEG làm việc tôt hơn).
6. Tóm tắt.
Chúng ta đã giới thiệu nhiều kỹ thuật nén hình ảnh và âm thanh. Vì video yêu cầu nhiều băng thông, các kỹ thuật nén hình ảnh và video được nhấn mạnh. Để có được một hệ số nén cao tại một vài chất lượng hình ảnh, một tổ hợp của các kỹ thuật này đã được
ứng dụng trong các hệ thống thực hành. Việc chọn một phương pháp nào đó phụ thuộc rất nhiều vào ứng dụng. Năm chuẩn nén quốc tế cho mã hóa nghe nhìn đã được đề nghị
cho các ứng dụng khác nhau. Khả năng và ứng dụng chính có thể tóm tắt như sau: – JPEG: Nén ảnh tỉnh, màu, trắng đen, video chuyển động.
– H.261: Nén video trong Videophony, videoconferencing.
– MPEG-1: VHS-quality video (1.5 Mbps), video storage applications – MPEG-2: Studio-quality video (4 Mbps), HDTV (20 Mbps).
– MPEG-4: very-low-bit-rate video applications, personal videophony. – MPEG AUDIO (MPEG-1, 2, 4): Nén âm thanh CD-quality.
– H.263: Nén video cho videophony (64 Kbps) mobile communication. – JBIG: Nén ảnh nhị phân (bilevel image) facsimile transmission.
Với sự hoàn thiện của các chuẩn làm cho: phần mềm, chipsets, sản phẩm bo mạch phù hợp với các chuẩn trở nên phổ biến. Các sản phẩm này đã, đang và sẽ được sử
dụng rộng rãi và làm cho dễ dàng trong việc phát triển các ứng dụng đa phương tiện. Như vậy, quan sát các yêu cầu của các ứng dụng trong tương lai, hướng tới của các kỹ thuật mã hóa hình ảnh phát triển xa hơn là sử dụng mã hóa băng con (subband) và mã hóa mô hình (model-based coding). Mã hóa hình ảnh Fractal cũng có tiềm năng trong các hệ thống phân phối thông tin đa phương tiện. Với hiểu biết xa hơn về hệ
thống thị giác của con người và sự phát triển của trí tuệ nhân tạo, hình ảnh và video số
Chương 4