Không chồng chéo, cách đều nhau, kích thước cố định, khối kết hợp nhỏ

Một phần của tài liệu Luận văn - Xử lí âm thanh và hình ảnh hoàn chỉnh (Trang 54 - 56)

hình chữ nhật

Để tránh các khó khăn gặp phải trong dự toán chuyển động và bù chuyển động với các khối hình tùy ý, kỹ thuật khối kết hợp đã được đề xuất bởi Jain và Jain (1981) dựa trên mô hình chuyển động đơn giản sau đây.

Một hình ảnh được phân chia thành một tập hợp các khối không chồng chéo nhau, cách đều nhau, kích thước cố định, khối nhỏ hình chữ nhật và chuyển động dịch trong mỗi khối được giả định là thống nhất. Mặc dù mô hình này đơn giản chỉ xem xét chuyển động dịch các loại chuyển động, chẳng hạn như xoay và phóng to các đối tượng, có thể được xếp sát nhau bởi các dịch chuyển của các khối nhỏ cung cấp các khối này là đủ nhỏ. Sự quan sát này, ban đầu được thực hiện bởi Jain và Jain, đã được

Vectơ dịch chuyển cho các khối này được ước tính bằng cách tìm kiếm tốt nhất đối tác của chúng xuất hiện trong khung trước. Theo cách này, dự toán chuyển động dễ dàng hơn đáng kể cho các khối hình tùy ý. Kể từ khi chuyển động của mỗi khối được mô tả bởi một vector chuyển động, thông tin bên trên vectơ chuyển động giảm. Hơn nữa, thông tin dạng hình chữ nhật được biết đến với bộ mã hóa và giải mã, và do đó không cần phải mã hóa nữa.

Hình 11.1. Khối kết hợp.

Kích thước khối phải được lựa chọn chính xác. Nói chung, nhỏ hơn kích thước khối, chính xác hơn là xấp xỉ. Nó là rõ ràng, tuy nhiên, kích thước khối nhỏ hơn dẫn đến nhiều vectơ chuyển động được ước tính và mã hóa. Như một sự thỏa hiệp, kích thước của 16x16 được coi là một lựa chọn tốt. (Điều này đã được quy định trong các tiêu chuẩn quốc tế về mã hóa video chẳng hạn như H.261, H.263, MPEG-1 và MPEG- 2.) Lưu ý rằng đối với dự toán tốt hơn kích thước khối 8x8 đôi khi được sử dụng. Hình 11.1 được sử dụng để minh họa cho kỹ thuật khối kết hợp. Trong hình 11.1 (a) một khung hình ảnh phổ biến tại thời điểm tn được phân đoạn thành các khối hình chữ nhật không chồng chéo nhau có kích thước pxq. Như đã đề cập ở trên, trong thực tế phổ biến các khối vuông p = q = 16 được sử dụng thường xuyên nhất. Hãy xem xét một trong các khối trung tâm tại (x, y). Người ta cho rằng khối được dịch toàn bộ.

Do đó, chỉ có một vectơ ước tính cho khối này. Hình 11.1 (b) hiển thị khung hình trước đó: các khung hình được mở ra trong một khoảnh khắc hình chữ nhật khung tương quan tn-1. Để ước tính vector chuyển,một cửa sổ tìm kiếm hình chữ nhật được mở ra trong khung tn-1 tại trung tâm các điểm ảnh (x,y). Hãy xem xét một điểm ảnh trong cửa sổ tìm kiếm, một cửa sổ tương quan hình chữ nhật giống nhau kích thước pxq để mở ra các điểm ảnh nằm ở trung tâm. Một một số biện pháp tương tự (tương quan) được tính toán. Sau khi quá trình kết hợp này đã được hoàn thành cho tất cả các điểm ảnh ứng cử trong cửa sổ tìm kiếm, các cửa sổ tương quan tương ứng sự giống nhau lớn nhất để phù hợp nhất với các khối đang được xem xét trong khung tn. Vị trí tương đối giữa hai khối (khối và sự phù hợp của nó) cung cấp cho các vectorchuyển động. Được hiển thị trong hinh 11.1b. Kích thước của cửa sổ tìm kiếm được xác định bởi kích thước của cửa sổ tương quan và sự dịch chuyển tối đa có thể theo bốn hướng: lên, xuống, về bên phải và về bên trái. Trong Hình 11.2 bốn số lượng được giả định là như nhau và được ký hiệu là d. Lưu ý rằng d được ước tính từ một kiến thức về chuyển động dịch thuật, trong đó bao gồm tốc độ chuyển động lớn nhất có thể và khoảng thời gian giữa hai khung hình liên tiếp, ví dụ: tn – tn-1.

Một phần của tài liệu Luận văn - Xử lí âm thanh và hình ảnh hoàn chỉnh (Trang 54 - 56)