CÁC GIẢI PHÁP KỸ THUẬT CÔNG NGHỆ ĐỂ TRIỂN KHAI IPTV TRÊN MẠNG xDSL
4 c Tham chiếu nhiều ảnh bù chuyển động
c. Tham chiếu nhiều ảnh bù chuyển động
Ảnh P trong MPEG-2 là ảnh dự đoán được tham chiếu từ một ảnh trước đó, còn ảnh B là ảnh dự đoán 2 chiều được tham chiếu từ nhiều ảnh I hoặ P trước và sau nó.
Trong chuẩn nén H.264, ảnh hiện tại có thể tham chiếu bởi nhiều ảnh, điều này cho phép tăng hiệu suất nén. Một lượng lớn các ảnh được giải nén và lưu trong bộ giải nén.
Trong các chuẩn nén trước đó, thứ tự các ảnh dùng cho mục đích tham chiếu bù chuyển động và thứ tự các ảnh thể hiện có mối quan hệ chặt chẽ với nhau. Tuy nhiên, chuẩn nén H.264 đã khắc phục nhược điểm này bằng cách cho phép bộ giải nén lựa chọn thứ tự các ảnh tham chiếu.
Hình 3.10. Tham chiếu đa ảnh d. Dự đoán trong ảnh
Các mẫu của một macroblock được dự đoán bằng cách chỉ sử dụng phần thông tin của macroblock được truyền đi trong một ảnh.
Trong chuẩn nén H.264/AVC, có hai loai dự đoán trong ảnh cho thành phần chói Y. Loại thứ nhất là intra 4*4 và loại thứ 2 là intra 16*16. Trong INTRA 4*4, các phần tử ảnh có kích thước 16*16 được chia thành 16 phần có
kích thước 4*4, việc dự đoán được thực hiên với từng phần riêng biệt. Có 9 mode dự đoán tùy chọn đối với các block thành phần chói Y kích thước 4*4, 4 mode đối với thành phần chói Y kích thước 16*16, 4 mode cho thành phần màu Cr, Cb. Bộ nén sẽ lựa chọn mode dự đoán sao cho sự khác biệt giữa P và block được mã hóa là nhỏ nhất.
e. Mode dự đoán thành phần chói Y 4x4
Có 9 mode dự đoán thành phần chói Y kích thước 4*4, đó là: Mode 0: dự đoán theo chiều dọc
Mode 1: dự đoán theo chiều ngang
Mode 2: dự đoán dựa trên trung bình tất cả các mẫu xung quanh từ bên trái và từ trên của khối dữ liệu hiện tại.
Mode 3: dự đoán dự trên các mẫu có độ nghiêng 45 độ từ phải sang trái. Mode 4: dự đoán dự trên các mẫu có độ nghiêng 45 độ từ trái sang phải. Mode 5: sử dụng phép ngoại suy với góc có độ nghiêng 26,6 độ so với chiều dọc. Mode 6: sử dụng phép ngoại suy với góc có độ nghiêng 26,6 độ so với chiều ngang Mode 7: sử dụng phép ngoại suy với góc có độ nghiêng 26,6 độ so với chiều dọc bên phải
Mode 8: sử dụng phép ngoại suy với góc có độ nghiêng 26,6 độ từ so với chiều ngang.
Hình 3.12. Mode dự đoán 16*16 liên ảnh f. Mode dự đoán thành phần chói Y 16*16
Như dã nói trình bày ở trên, một mode dự đoán được áp dụng cho toàn bộ một macro thành phần chói kích thước 16*16. Có 4 mode dự đoán đó là dự đoán theo chiều dọc, dự đoán theo chiều ngang, dự đoán phẳng. Đối với mode dự đoán phẳng, một hàm tuyến tính được sử dụng giữa các mẫu từ bên trái và từ trên xuống so với mẫu dự đoán hiện tại. Mode này hoạt động hiệu quả giữa các vùng có độ chói liên tục thay đổi. Các mode hoạt động giống như đối với thành phần chói kích thước 4*4, chỉ khác là chúng hoạt động đối với toàn bộ macroblock thay vì với 16 phần kích thước 4*4.
g. Các mode dự đoán các thành phần màu Cr và Cb
Dự đoán trong ảnh đối với các thành phần màu của một macroblock tương tự như đối với thành phần chói Y có kích thước 16*16. Bởi vì tín hiệu màu có sự thay đổi liên tục trong hầu hết các trường hợp. Nó luôn áp dụng cho các khối 8*8 sử dụng dự đoán ngang, dọc, DC và sự đoán phẳng.
h. Loại bỏ dư thừa không gian
Biến đổi Cosine rời rạc DCT hai chiều trong các chuẩn MPEG-1, MPEG-2 nhằm mục đích loại bỏ phần dư thừa không gian. DCT được áp dụng cho các khối 8*8. trong H.264/AVC, DCT được áp dụng với hệ số nguyên. Kích thước khối thay đổi, có thể là 16*16, 4*4, hoặc trong trường hợp đặc biệt có thể dùng khối kích thước 2*2. Việc sử dụng khối có kích thước nhỏ hơn so với các chuẩn nén trước đó cho phép bộ mã hóa tương thích
tốt hơn với biên của các đối tượng chuyển động.
Có 3 loại biến đổi khác nhau được sử dụng trong MPEG-4 Part 10, đó là:
- Một biến đổi Hadamard áp dụng cho mảng 2 chiều kích thước 4*4 các
hệ số 1 chiều DC của thành phần chói Y trong mode 16*16.
- Một biến đổi Hadamard áp dụng cho mảng 2 chiều kích thước 2*2 các
hệ số 1 chiều DC của thành phần màu Cr, Cb.
- Một biến đổi dựa trên DCT áp dụng cho tất cả các block kích thước 4x4.
Dữ liệu trong 1 macroblock được truyền di theo thứ tự như trong hình sau: Nếu macroblock được mã hóa sử dụng mode Intra 16*16, thì block đó sẽ được dán nhãn là “-1”, và bao gồm các hệ số một chiều được biến đổi trong mỗi block độ chói 4*4, và được truyền đi đầu tiên. Sau đó, các block độ chói từ 0-15 được truyền đi theo trật tự như trong hình vẽ (các hệ số một chiều trong một macroblock được mã hóa sử dụng mode Intra 16*16 không được gửi đi). Block 16 và 17 được gửi đi,bao gồm 2 mảng kích thước 2*2 các hệ số một chiều các thành phần màu Cr, Cb. Cuối cùng là các block từ 18-25 (không có các hệ số một chiều).
i. Mã hóa Entropy
Hình 3.14. Mã hóa Entropy
Mã hoá số học nhị phân thích nghi với ngữ cảnh (Context-adaptive binary arithmetic coding - CABAC)
- Mã hoá có độ dài từ mã thay đổi thích nghi với ngữ cảnh (Context-
adaptive variable-length coding - CAVLC)
- Mã hoá có độ dài từ mã thay đổi (Common variable-length coding -
VLC)
k. Bộ lọc deblocking
Cấu trúc khối cơ bản của H.264 là 4x4 cho biến đổi và bù chuyển động. Do vậy, ảnh sẽ hình thành các đường biên giữa các khối. Bộ lọc sẽ triệt tiêu các biên này để hình ảnh được tự nhiên hơn.
Một bộ lọc được sử dụng cho mỗi macroblock được mã hóa nhằm làm giảm méo. Bộ lọc deblocking được sử dụng sau biến đổi ngược ở bộ mã hóa(trước khi tái tạo lại và lưu trữ) và ngược lại đối với bộ giải mã. Bộ lọc giúp cải thiện chất lượng hình ảnh. Hình ảnh được lọc sẽ sử dụng để làm dự đoán bù chuyển động cho các hình ảnh trong tương lai và điều này có thể giúp
cải thiện chất lượng nén bởi vì những hình ảnh đã được lọc chân thực hơn so với các ảnh không được lọc.
l. Thứ tự macroblock mềm dẻo
Để cung cấp các phương pháp che giấu hiệu quả trong các kênh có khuynh hướng bị lỗi với các ứng dụng độ trễ thấp, H.264 / AVC hỗ trợ một đặc điểm gọi là thứ tự macroblock mềm dẻo (FMO - Flexible Macroblock Ordering). FMO định rõ một giản đồ (pattern) ấn định các macroblock trong ảnh vào một hoặc vài nhóm slice. Mỗi nhóm slice được truyền riêng biệt. Nếu một nhóm slice bị mất, các mẫu trong các macroblock bên cạnh về mặt không gian, thuộc về các nhóm slice được thu đúng, có thể được sử dụng cho che dấu hiệu quả lỗi.
3.1.2.2.4. Ưu điểm của H.264/AVC
- Chất lượng hình ảnh tốt: H.264 là chuẩn nén sử dụng công nghệ âm
thanh, hình ảnh mới khả năng nén tôt hơn so với các chuẩn nén trước đó. Do đó, chuẩn nén cung cấp dịch vụ phân phát hình ảnh chất lượng cao qua mạng băng thông giới hạn.
- Yêu cầu băng thông thấp: Chất lượng hình ảnh của H.264 gần giống với
MPEG-2 nhưng H.264 cần ít băng thông để truyền tải tín hiệu với cùng chất lượng. Đặc điểm này rất phù hợp để sử dụng trong hệ thống IPTV.
- Có khả năng kết hợp với các thiết bị xử lí video có sẵn như MPEG-2 và
hạ tầng mạng dựa trên IP đã có sẵn.
- Hỗ trợ truyên hình độ phân giải cao: Khi sử dụng tối ưu chuẩn nén thể
làm có thể làm tăng khả năng truyền dữ liệu của mạng. Do đó các nhà cung cấp dịch vụ truyền thông có thể sử dụng chuẩn nén này để cung cấp chương trình video độ phân giải cao qua mạng sẵn có.
- Hỗ trợ nhiều ứng dụng: chuẩn nén H.264 được sử dụng trong nhiều ứng
dụng, với nền khác nhau thì có những yêu cầu riêng. Ví dụ, ứng dụng truyền đa điểm trong IPTV yêu cầu phải hiện thị hình ảnh ở dạng chuẩn truyền hình, trong khi, đối với các ứng dụng giải trí di động, hình ảnh phải hiển thị được trên
các thiết bị di động. Để phù hợp với mọi ứng dụng, chuẩn nén H.264 có rất nhiều profile và level. Đặc điểm của profile và level là tốc độ bit và kích thước ảnh.
- Có thể truyền độc lập: Chuẩn nén H.264 có thể truyền qua nhiều giao
thức như ATM, RTP,UDP, TCP và các dong MPEG-2.
- Dễ dàng thích nghi với các mạng chất lượng kém nhờ cơ chế sửa lỗi. 3.1.2.2.5. Các ứng dụng của H.264/AVC
Chuẩn nén này được thiết kế cho các ứng dụng sau:
- Truyền hình quảng bá qua qua vệ tinh, cáp, mặt đất… - Truyền hình tương tác, video theo yếu cầu (VoD). - Lưu trữ đĩa quang, băng từ, DVD.
- Tích hợp dịch vụ qua ISDN, LAN, DSL, mạng không dây, mạng di động,
modem
- Nhắn tin đa phương tiện MMS qua ISDN, DSL, LAN mạng di động.
Còn nhiều ứng dụng được phát triển trên mạng hiện tại như video, phone…