Các thành phần ảnh cơ bản trong chuẩn nén MPEG

Một phần của tài liệu 240426 (Trang 27 - 31)

Các tiêu chuẩn MPEG, cấu trúc dữ liệu đều ở dạng lớp. Bao gồm các thành phần cơ bản sau đây:

Hình 2.6: Cấu trúc lớp dữ liệu trong MPEG

Khối (Block): Là đơn vị cơ bản cho chuyển đổi DCT. Bao gồm 8x8 điểm

ảnh tín hiệu chĩi hoặc tín hiệu màu.

Macro Block: Là nhĩm các khối DCT tương ứng với thơng tin của một cửa

sổ 16x16 điểm ảnh gốc. Cĩ nhiều dạng Macro Block khác nhau phụ thuộc vào cấu trúc lấy mẫu được sử dụng.

Lớp nhĩm ảnh (GOP layer)

Lớp khung (Frame layer)

MB MB MB MB MB MB MB MB MB MB Khung I Khung B Khung P Khung B Khung I Khung B Khung I Khung B Khung P Khung B Khung I Khung B

GOP #p GOP #p+1 GOP #p+2 GOP #p+3 GOP #p+4 GOP #p+5

Chuỗi video #1 Chuỗi video #2

Chuỗi video #n

Đặc điềm MB Vecto chuyển động Khối Y Khối Y Khối Y Khối Y Khối CB Khối CR

Các hệ số DCT EOB 8x8 điểm chĩi Lớp chuỗi ảnh (Sequence layer) Sequence header) Sequence

end code Dịng sơ cấp

GOP header

Frame header

Slice header

Lớp lát (Slice layer)

Dữ liệu khung CCIR-601

Lớp MB (Macrokblock

layer)

Lớp khối DCT (Block layer)

Hình 2.7: Cấu trúc Macroblock của các dạng lấy mẫu

Phần đầu đề (header) của Macroblock chứa thơng tin phân loại (Y hay CB, CR) và vector bù chuyển động tương ứng.

Lát (slice): Được cấu thành từ một hay một số MB liên tiếp nhau.

Phần header của slice chứa thơng tin về vị trí của nĩ trong ảnh và tham số quét lượng tử (quantized scaling factor). Kích cỡ của slice quyết định bởi mức bảo vệ lỗi cần cĩ trong ứng dụng vì bộ giải mã sẽ bỏ qua slice bị lỗi. Hệ số một chiều DC được định vị tại điểm bắt đầu mỗi slice.

Ảnh: Lớp ảnh cho bên thu biết về loại mã hố khung ( I,P,B). Phần

header mang thứ tự, ngồi ra cịn cĩ một số thơng tin bổ sung như thơng tin đồng bộ, độ phân giải và vector chuyển động.

Nhĩm ảnh (GOP-group of picture): Gồm cấu trúc các ảnh I, B và P. Mỗi

nhĩm bắt đầu bằng ảnh I cung cấp điểm vào ra và tìm kiếm. Phần header chứa 25 bit thời gian và chế độ điều khiển cho VTR và thơng tin thời gian.

Chuỗi Video (Video Sequence): Lớp chuỗi bao gồm phần header, một

hoặc một số nhĩm ảnh (Picture Group) và phần kết thúc chuỗi (Sequence end Code). Thơng tin quan trọng nhất của phần header là kích thước (dọc, ngang) của mỗi ảnh, tốc độ bit, tốc độ ảnh và dung lượng địi hỏi bộ đệm dữ liệu bên thu. Thơng tin chuỗi ảnh và phần header của chuỗi là dịng bit đã mã hố, cịn gọi là dịng video cơ bản.

Trong MPEG cĩ các cấu trúc nhĩm ảnh điển hình như sau:

1 2 3 4 3 4 1 2 3 4 5 6 7 8 9 10 11 12 5 6 6 2 5 1 1 2 3 4 4 3 4:2:2 Macroblock 4:4:4 Macroblock 4:2:0 Macroblock 4:1:1 Macroblock Y Y CB CR CB CR CB/B CR/R Y/G Y CB CR 5 7 8 6

Hình 2.8: Các cấu trúc nhĩm ảnh trong tiêu chuẩn MPEG b) Sự phân loại ảnh trong MPEG

Tiêu chuẩn nén video MPEG định nghĩa 3 loại ảnh: ảnh I, ảnh B và ảnh P.

Ảnh I: (Intra - Coded Picture)

Các ảnh I được mã hố theo mode Intra để cĩ thể giải mã mà khơng cần sử dụng dữ liệu từ bất cứ một ảnh nào khác. Đặc điểm của phương pháp mã hố này như sau:

+ Chỉ loại bỏ được sự dư thừa khơng gian.

+ Dùng các điểm trong cùng một khung để tạo dự báo.

+ Khơng cĩ bù chuyển động.

+ Các thơng tin được mã hố rõ ràng, minh bạch nên số lượng bit yêu cầu lớn. Do được mã hố Intra, ảnh I bao giờ cũng là ảnh đầu tiên trong một nhĩm ảnh hay một chuỗi ảnh. Nĩ cung cấp thơng tin khởi động các ảnh tiếp theo trong nhĩm.

Ảnh P (Predictive Code Picture)

Ảnh P được mã hố liên ảnh một chiều (Interframe một chiều):

+ Dự báo Inter một chiều.

F1 F2 F3 F4 F5 F6 F7 F8 F9 F10

I B B P B B P B B I

I B I I B P I P

Khung CCIR-601 nguyên thủy

Khung đã nén

Cấu trúc IBBPBBPBBI

+ Ảnh dự báo được tạo ảnh tham chiếu trước đĩ (dự báo nhân quả). Ảnh tham chiếu này cĩ thể là ảnh I hoặc ảnh P gần nhất.

+ Cĩ sử dụng bù chuyển động. Thơng tin ước lượng chuyển động của các khối nằm trong vector chuyển động (motion vector). Vector này xác định Macroblock nào được sử dụng từ ảnh trước.

Do vậy ảnh P bao gồm cả những MB mã hố Inter (I - MB) là những macroblock chứa thơng tin lấy từ ảnh tham chiếu và những MB mã hố Intra là những MB chứa thơng tin khơng thể mượn từ ảnh trước. Ảnh P cĩ thể được sử dụng làm ảnh tham chiếu tạo dự báo cho ảnh sau.

Ảnh B (Bidirectionally Predicted Pictures)

Ảnh B là ảnh mã hố liên ảnh hai chiều. Tức là :

+ Cĩ sử dụng bù chuyển động.

+ Dự báo khơng nhân quả, ảnh dự báo gồm các macroblock của cả khung hình trước đĩ và sau đĩ.

Việc sử dụng thơng tin lấy từ ảnh trong tương lai hồn tồn cĩ thể thực hiện được vì tại thời điểm mã hố thì bộ mã hố đã sẵn sàng truy cập tới ảnh phía sau. Ảnh B khơng được sử dụng làm ảnh tham chiếu tạo dự báo cho các ảnh sau.

Hình 2.9: Nội suy bù chuyển động

Khung dự báo (P) = Khung trước – Khung hiện hành + Vecto chuyển động

Khung kề trước (n) Khung hiện hành (n+1) Vùng khơng bao phủ

Dự báo bù chuyển động bù ảnh P

Khung dự báo (B) = Khung trước – Khung hiện hành + Vecto chuyển động hai chiều

Khung hiện hành (n) Vị trí nội suy

Đường di chuyển của vật thể

Khung kề trước (n-1) Khung kề sau (n+1)

Thứ tự truyền dẫn và thứ tự hiển thị ảnh:

Chuỗi ảnh MPEG thường cĩ cấu trúc IBBPBBPBBI nhưng thứ tự truyền dẫn và thứ tự hiển thị ảnh là khác nhau do khi tạo ảnh B cần thơng tin từ cả khung quá khứ và tương lai. Như vậy cĩ nghĩa, ảnh trong tương lai cần phải được truyền dẫn trước. Trong khi đĩ, lúc hiển thị phải theo đúng thứ tự nguồn. Để thực hiện điều này, lớp ảnh (Picture layer) của dịng dữ liệu MPEG cĩ thơng tin về số thứ tự ảnh để trợ giúp hiển thị.

Hình 2.10: Thứ tự truyền dẫn và thứ tự hiển thị ảnh

Một phần của tài liệu 240426 (Trang 27 - 31)

Tải bản đầy đủ (PDF)

(112 trang)