a. Giới thiệu
Chuẩn nén MPEG (Moving Picture Expert Group) là chuỗi các chuẩn nén video với mục đích là mã hoá tín hiệu hình ảnh và âm thanh ở tốc độ từ 1,5 50 Mbit/s. Nén dữ liệu audio với tỉ lệ từ 5:1 10:1.
MPEG - 1: nén ảnh động có kích thước 320 x 240, tốc độ bit còn từ 1 Mbit/s đến 1,5 Mbi/s dùng cho ghi hình trên băng từ và đĩa quang (CD), đồng thời truyền dẫn trong các mạng.
MPEG - 2: được sử dụng cho các ứng dụng cao hơn với tốc độ còn
10Mbit/s, để truyền tín hiệu truyền hình số thông thường.
MPEG - 3: nén tín hiệu số xuống còn 50 Mbit/s để truyền tín hiệu truyền hình có độ phân giải cao.
MPEG - 4: dùng cho nén hình ảnh video với ít khung hình và yêu cầu làm tươi chậm. Tốc độ dữ liệu yêu cầu là 940 Kbit/s. MPEG - 4 đã phát triển các tiêu chuẩn mã hoá đối với tốc độ bit rất thấp.
MPEG - 7: mô tả thông lin của rất nhiều loại phương tiện, cho phép khả năng tìm kiếm nhanh và hiệu quả theo yêu cầu người dùng.
Tiêu chuẩn MPEG là sự kết hợp giữa nén trong ảnh và nén liên ảnh. Tức là phương pháp nén có tổn hao dựa trên biến đổi DCT và bù chuyển động.
b. Các cấu trúc ảnh
Ảnh loại I (Intra Picture): là ảnh được mã hoá riêng, tương tự như việc mã hoá ảnh tĩnh trong JPEG. Ảnh I chứa đựng dữ liệu để tái tạo lại toàn bộ hình ảnh và cho phép truy cập ngẫu nhiên. Tuy nhiên đạt tỉ lệ nén thấp nhất.
Ảnh loại P (Predicted pictre): là ảnh được mã hoá có bù chuyển động từ các ảnh I hoặc P ở phía trước (ảnh dự đoán trước). Ảnh P cho tỷ số nén cao hơn ảnh I, có thể làm một ảnh so sánh cho việc bù chuyển động các ảnh P và B khác.
Ảnh loại B (Bi Directional Predicted Pictutre): là ảnh được mã hoá sử dụng bù chuyển động từ các ảnh I hoặc P ở phía trước và ở phía sau (ảnh dự đoán hai
- Giải quyết được các vấn đề thay đổi ảnh cũng như không dự báo được sự thay đổi về nội dung hình ảnh.
- Việc sử dụng bù chuyển động từ hai ảnh cho tỷ số tín hiệu/tạp âm tốt hơn nếu như chỉ sử dụng bù chuyển động từ một ảnh.
- Ảnh B không sử dụng là ảnh so sánh cho ảnh khác nên nó có thể mã hoá với số lượng bit thấp và không gây lỗi trễ trên đường truyền.
Ảnh loại D (Dc-coded Pictre): là ảnh được sử dụng trong MPEG - 1 và MPEG - 4 nhưng không được sử dụng ở MPEG -2. Ảnh có các thành phần một chiều ở đầu ra DCT được thể hiện.
c. Nhóm ảnh (GOP)
Nhóm ảnh GOP (Group Of Picture) mang thông tin độc lập của MPEG. Công nghệ MPEG sử dụng 3 loại ảnh I, P, B. Trong đó ảnh P, B không phải là một ảnh hoàn chỉnh mà chỉ chứa sự khác biệt giữa ảnh đó và ảnh xuất hiện trước nó (đối với P) hay sự khác biệt với cả khuôn hình xuất hiện trước và sau nó (đối với B). Để có một khuôn hình hoàn chỉnh, ảnh P và B cần phải có dữ liệu từ các ảnh lân cận. Mỗi nhóm ảnh bắt buộc phải bắt đầu bằng một ảnh I hoàn chỉnh sau đó là các ảnh P và B. Nhóm ảnh có thể mở (Open) hoặc đóng (Close).
Hình 2.20. Cấu trúc Gop mở (a) và đóng (b)
Ảnh P (ảnh 4) được dự báo trước trên cơ sở ảnh I (ảnh I). ảnh B được dự đoán từ hai hướng, ảnh B (ảnh 2) và ảnh B (ảnh 3) được dự đoán từ hai ảnh, ảnh I (ảnh I) và ảnh P (ảnh 4). Ảnh B (ảnh 5) được dự đoán từ 2 ảnh, ảnh P (ảnh 4) và ảnh I tiếp theo (ảnh 6). Thứ tự truyền ảnh và hiện ảnh trên màn hình là không giống nhau.
d. Cấu trúc dòng bit MPEG video
Cấu trúc số liệu video MPEG - 1 và MPEG - 2 bao gồm 6 lớp:
Khối: khối 8 x 8 các điểm ảnh tín hiệu chói và tín hiệu màu dùng cho phương pháp nén DCT.
Tổ hợp khối: một nhóm các khối tương ứng với lượng thông tin chứa đựng trong kích thước 16 x 16 điểm trên các bức ảnh, xác định lượng thông tin chứa trong đó sẽ thay đổi tuỳ theo cấu trúc mẫu được sử dụng.
Mảng (Slice): bao gồm các cấu trúc khối liền nhau, có thể bao gồm toàn bộ bức ảnh hoặc một cấu trúc khối. Thông tin đầu của mảng chứa đựng vị trí của mảng trong toàn bộ ảnh và hệ số cân bằng lượng tử. Kích thước thông tin đầu của mảng được xác định bằng số lỗi cho phép xuất hiện trong mảng đối với một ứng dụng nhất định. Hệ số DC tham chiếu dùng trong mã hoá DCPM được so chuẩn tại đầu mỗi mảng.
Ảnh: lớp ảnh cho phép bộ giải mã xác định loại của ảnh được mã hoá là ảnh I, P hay B. Thông tin đầu chỉ thứ tự truyền khung để bộ giải mã sắp xếp ảnh theo thứ tự đúng. Thông tin đầu của ảnh còn chứa các thông tin về đồng bộ, độ phân giải và phạm vi của véctơ chuyển động.
Nhóm ảnh (GOP): là tổ hợp của nhiều khung I, P và B, được xác định bằng tham số m và n. Thông tin đầu gồm 25 bit chứa mã định thời và điều khiển.
Đoạn video: bao gồm thông tin đầu, một số nhóm ảnh và thông tin kết thúc đoạn. Đoạn thông tin đầu của đoạn video chứa đựng kích thước mỗi chiều của ảnh, kích thước của ảnh, tốc độ dòng video, tần số ảnh và bộ đệm tối thiểu cần có.
e. Nguyên lý nén MPEG
Nguyên tắc hoạt động.
Hoạt động của bộ mã hoá, phụ thuộc vào loại hình ảnh là mã hoá tại thời điểm đang xét. Nén MPEG là sự kết hợp giữa nén trong ảnh và nén liên ảnh. Dạng thức đầu vào là Rec - 601 4:2:2 hoặc 4:2:0 được nén liên ảnh trước tạo ra được ảnh khác biệt ở đầu ra bộ cộng, sau đó lại được nén trong ảnh qua các bước: biến đổi DCT, lượng tử hoá, mã hoá. Cuối cùng ảnh này được trộn cùng với véctơ chuyển động
Hình 2.21. Sơ đồ khối quá trình mã hoá MPEG
Tốc độ bit của tín hiệu video được nén không cố định, phụ thuộc vào nội dung ảnh đang xét. Tại đầu ra bộ mã hoá, dòng bit phải cố định để xác định tốc độ cho dung lượng kênh truyền. Vì vậy, tại đầu ra bộ mã hoá phải có bộ nhớ đệm phải đủ lớn. Khi số liệu trong bộ nhớ đệm gần bằng dung lượng cực đại thì hệ số biến đổi DCT được lượng tử hoá ít chuẩn xác hơn.
Quá trình giải mã
Giai đoạn 1 là tách mã hoá entropy ra. Sau đó tách số liệu ảnh ra khỏi véctơ chuyển động. Số liệu sẽ được giải lượng tử hoá và biến đổi DCT ngược.
Trường hợp ảnh loại I bắt đầu ở mỗi nhóm ảnh trong chuỗi, sẽ nhận được ảnh đầu ra hoàn chỉnh bằng cách trên. Nó được lưu trong bộ nhớ ảnh và được sử dụng để giải mã các ảnh tiếp theo.
Trong trường hợp ảnh P sẽ thực hiện giải lượng tử hoá và biến đổi DCT ngược với việc sử dụng các véctơ chuyển động và lưu vào bộ nhớ ảnh sớm hơn.
Trên cơ sở đó, xác định được dự báo ảnh đang xét. Ta nhận ra ảnh sau khi cộng dự báo ảnh và kết quả biến đổi DCT ngược. Ảnh này cũng được lưu vào bộ nhớ để sử dụng khi giải mã các ảnh tiếp theo.
Hình 2.22. Giải mã MPEG