Chuẩn MPEG-2:

Một phần của tài liệu công nghệ truyền hình iptv (Trang 74 - 79)

MPEG 2 chủ yếu dùng cho nén tín hiệu số video, được mở rộng dựa trên chuẩn MPEG

để hỗ trợ việc nén dữ liệu để truyền Video số chất lượng cao. Chuẩn MPEC-2 được chia thành hai loại nén hình và nén tiếng.

Công nghệ truyền hình IPTV

4.1.1 Quá trình nén MPEG:

+Phần đầu tiên của nén bao gồm 1 quá trình tiền đồng bộ. Quá trình này cơ bản bao gồm việc làm giảm kích thước của các frame. Làm giảm kích thước của các frame chính là làm giảm số lượng bit , điều này cũng giúp giảm băng thông cần thiết để truyền tín hiệu. Tuy nhiên, quá trình này không phải không có trở ngại. Ví dụ, sự giảm kích thước của khung có thể

thường xuyên gây ra những lỗi tỉ số cạnh (giống như sai tỉ lệ 4/3 hay 16/9) khi được thể hiện trên màn hình TV có độ phân giải thấp.

+Phần 2 của quá trình nén tin hiệu là chia 1 frame ảnh ra thành các block có kích thước 8 nhân 8 pixel –khối mã hóa nhỏ nhất trong giải thuật của MPEG. Có 3 loại block; độ chói Y, thành phần màu đỏ Cr hoặc xanh Cb. Các loại block thành phần màu mang thông tin về những màu khác nhau của hình ảnh trong khi độ chói mang thông tin về những phần màu đen hoặc trắng của hình ảnh.

+Khi hoàn thành 2 phần trên, MPEG sẽ thực hiện 1 hàm toán được gọi là DCT (Discrete cosine transform: biến đổi cosin rời rạc) với mỗi block riêng biệt. Biến đổi DCT

được thực hiện trên một block gồm 8 pixel và 8 dòng của ảnh thật đã lấy mẫu để cho ra một ma trận 8 x 8 với các điểm là các hệ số DCT. Các hệ số DCT nói lên sự biến đổi tần số giữa các mẫu theo chiều ngang và dọc. Phép toán DCT được mô tả như sau:

Các block ban đầu sẻđược tái tạo lại một cách chính xác sử dụng phép biến đổi DCT ngược hay còn gọi là IDCT:

Công nghệ truyền hình IPTV

Trong đó:

x,y : là tọa độ của ảnh gốc u,v : tọa độ của hệ số DCT

N : kích thước ma trận thực hiện phép biến đổi

Nguyên tắc thực hiện hàm này bao gồm việc chia các block thành các phần tùy theo mức

độ quan trọng. Những phần quan trọng sẽđươc giữ nguyên cho tới bước tiếp theo trong khi các phần còn lại sẽ bị giảm bớt. Điều này sẽđảm bảo rằng mắt người không chú ý tới việc những phần không quan trọng của block bị bỏ bớt khi tốc bít bị hạn chế.

+ Bước tiếp theo trong MPEG là quá trình lượng tử hóa làm giảm số bit của các block: Ví dụ: cho 1 DCT:

Khi truyền các hệ số DCT, MPEG thực hiện theo các đường zig-zag: 12, 6, 6, 0, 4, 3, 0, 0………, 0

Việc lượng tử hóa được thực hiện theo 2 bước:

Bước 1: nhóm các hệ số khác 0, các hệ sốđi theo số 0 và các hệ số 0. (12), (6), (6), (0,4), (3), (0,…,0)

Bước 2: tiến hành truyền các nhóm: .

Công nghệ truyền hình IPTV

+ Khi tất cả các block trong frame đều đã được nén lại, MPEG sẽ ngắt các frame thành 1 dạng mới gồm nhiều block gọi l à macro block. Mỗi macroblock có kích thước 16 x16 chứa các block độ chói và block thành phần màu. Nếu có sự khác biệt giữa frame cuối cùng và frame hiện tại, các thiết bị nén MPEG sẽ chuyển những block mới này tới 1 vị trí mới trên frame hiện tại. Điều này giúp không phải gửi đi những hình ảnh mới hoàn toàn, do đó có thể tích kiệm băng thông. Có 2 cách để thực hiện điều đó:

Nén theo không gian là làm giảm các bít trên từng frame riêng biệt. điều này có thể đạt

được do các pixel luôn đứng cạnh nhau trong các frame thường có giá trị giống nhau. Do đó thay về mã hóa từng pixel riêng biệt. Kĩ thuật nén theo không gian này mã hóa sự khác biệt giữa các pixel cạnh nhau. Số lượng bít cần thiết để mã hóa những khác biệt này ít hơn số

lượng bít cần thiết để mã hóa từng pixel riêng biệt.

Nén theo thời gian là làm giảm các bit giữa các frame liên tục. Trong quá trình sản xuất video có những thông tin được lặp lại giữa những frame liên tiếp. VD: nếu trên hình có 1 bức tường , bức tường vẫn xuất hiện liên tục trong 30 hình tiếp theo, mà không thay đổi ( bức tường đó không thay đổi trong vòng 1s) . thay vì mã hóa 30 lần liên tục trong 1s, nên nén theo thời gian chỉ gửi đi các thông tin dựđoán chuyển động giữa những frame hình, trong trương hợp của bức tường trong VD trên, dựđoán chuyển động được đặt = 0.

Có nhiều phuơng thức khác nhau để nén 1 frame hình. VD như với 1 frame hình có độ phức tạp cao thì cần phương pháp nén có yếu tố nén theo không gian thấp bởi vì chỉ có 1 phần rất nhỏ

các pixel được lặp lại. Nếu tốc đọ bit có sự thay đổi lớn thì khó có thể truyền đi trong mạng IP, vì thế nhiều bộ mã hóa bao gồm cả chức năng đệm để có thểđiều khiển và quản lí tốc độ chung mà tại đó các bit được truyền đi tới tầng tiếp theo của hệ thống sản xuất video.

+Bước tiếp theo của quá trình nén MPEG là mã hóa các macroblock thành các slice. Slice là 1 chuỗi ảnh đặt nằm ngang cạnh nhau từ trái sang phải. Nhiều slice kết hợp với nhau tạo thành 1 hình. Mỗi slice được mã hóa độc lập với nhau để hạn chế lỗi. Nếu dòng dữ liệu (Bitstream) có chứa lỗi, bộ giải mã có thể bỏ qua và tiếp tục ở Slide kế tiếp. Nhiều Slide trên dòng dữ liệu cho phép che dấu lỗi tốt hơn và được dùng để cải thiện chất lượng hình ảnh

Công nghệ truyền hình IPTV (adsbygoogle = window.adsbygoogle || []).push({});

4.1.2 Các ảnh trong chuẩn nén MPEG:

Chuẩn nén MPEG định nghĩa 3 loại ảnh:

Intra-frame (I-frame)---- frame được mã hóa riêng biệt không phụ thuộc các frame trước đó hoặc tiếp theo.Mã hóa theo hệ thống được sử dụng gần giống như nén JPEG. Đây là frame độc lập và được sử dụng để tạo ra các loại frame khác.

P-frame ( forward predicted frame)---- khung dựđoán ảnh tiếp theo là khung dựđoán ảnh dựa trên các frame I trước đó. MPEG không thực sự mã hóa ảnh mà chứa các thông tin về

chuyển động cho phép IPTVCD có thể tái tạo lại frame. P-frame yêu cầu ít băng thông hơn I- frame, điều này là yếu tố quan trọng đối với mạng dựa trên IPTV.

B-frame (Bi-directional predicted frame )---- frame dự đoán hướng: B-frame là frame

đc tạo thành từ việc kết hợp các thông tin từ cả I-frame và P-frame. Mã hóa B-frame thì tương tự với P-frame, ngoại trừ các vecto chuyển động phụ thuộc vào các vùng trong các khung tham khảo sau đó. B-frame chiếm ít dung lượng hơn là I-frame va P-frame. Vì thế

dòng Mpeg video gồm nhiều B-frame thì chiếm dung lượng thấp hơn so với dòng chứa các frame I va P. Thậm chí, B-frame giúp làm tối thiểu băng thông cần thiết đối với các dòng MPEG video. Tuy nhiên, B-frame cũng có hạn chế đó là độ trễ. Do IPTVCD phải kiểm tra 2 khung trước và sau trước khi tạo ra B-frame.

3 loại ảnh trên kết hợp với nhau tạo thành 1 chuỗi các frame đc gọi là nhóm ảnh (GOP). Mỗi nhóm ảnh bắt đầu bằng một frame I và có một số các frame B và P, Mỗi nhóm ảnh MPEG có cấu trúc như sau:

[I B B B P B B B P B B B P B B B P]

Mỗi nhóm ảnh cần bắt đầu với một khung I, mặc dù kích thước của mỗi nhóm ảnh là khác nhau, nhưng trung bình mỗi nhóm ảnh trong IPTV có khoảng 12 đến 15 frame. Mỗi cấu trúc của một nhóm ảnh thông thường có thểđược miêu tả bởi 2 thông số: N là sốảnh trong một nhóm và M là khoảng cách giữa các frame. Các nhóm ảnh được chia thành 2 loại: nhóm đóng và nhóm mở. Với nhóm đóng, khung B cuối cùng không yêu cầu khung I đầu tiên cho nhóm

Công nghệ truyền hình IPTV

ảnh tiếp theo để giải mã, trong khi với nhóm mở cần yêu cầu kung cuối là khung I cho nhóm

ảnh tiếp theo. Các nhóm ảnh sau đó được kết hợp với nhau để tạo thành dòng video. Mỗi dòng video bắt đầu bằng một đoạn mã, theo sau đó là một header và kết thúc với một mã duy nhất.

Thứ tự các khung được truyền đi trên mạng băng rộng thì khác với thứ tự các khung trong chuổi bit đầu vào của bộ mã hóa. Bởi vì bộ giải mã trong IPTVCD cần xử lý các frame I và P trước khi tạo ra khung B. Mối quan hệ tổng thể giữa các chuỗi ảnh, ảnh, các slice, các khối macro, các khối và các điểm ảnh được minh họa ở hình sau:

Hình 4.1: Cấu trúc chuỗi video

Mặc dù MPEG-2 được sử dụng trong truyền hình cáp và vệ tinh, nhưng MPEG-2 có những hạn chế đối với các mạng có băng thông giới hạn.Do đó một công nghệ nén mới với nhiều tính năng đã được phát triển trong những năm gần đây với mục đích truyền video qua mạng băng thông giới hạn. MPEG-4 part 10 được sử dụng trong hạ tầng mạng IPTV.

Một phần của tài liệu công nghệ truyền hình iptv (Trang 74 - 79)