Kỹ thuật dự doán bù chuyển động

Một phần của tài liệu Bài giảng xử lý âm thanh và hình ảnh-p6 potx (Trang 32 - 34)

.

Ngoài sự thay đổi vị trí toạđộ, sự thay đổi về cường độ sáng của đối tượng ảnh từ frane này tới frame khác cũng tạo nên ảnh chuyển động. Trong kỷ thuật bù chuyển động, ảnh của frame hiện hành được dự báo từ ảnh của frame kế trước bằng cách làm xấp xỉ chuyển động giữa hai frame và bù chuyển động đó: sự khác nhau giữa frame hiện hành và frame dự báo được gọi là phần dư thừa bù chuyển động; và kỹ thuật nén liên ảnh chính là đưa vào việc mã hoá phần dư thừa bù chuyển động này.

Cường độ chói màu của ảnh còn gọi là năng lượng hiển thị hình ảnh. Đối với ảnh động, đặc trưng về năng lượng ảnh của phần dư thừa bù chuyển động thấp hơn nhiều so với ảnh gốc. Do đó, việc mã hoá phần dư thừa thay vì mã hoá cả xâu ảnh video nên đã giúp tránh được phần dư thừa này bị mã hoá lặp nhiều lần. Như vậy, việc xác định phần ảnh động để làm xấp xỉ chuyển động là quá trình khôi phục một ảnh bằng cách dùng các phần ảnh trong frame trước đó cùng với các thông tin về chuyển động của frame này chính là công việc bù chuyển động. Sự đánh giá chuyển động của ảnh có thể thực hiện trên toàn khung: người ta chia mỗi khung thành các ô mẫu nhỏ (thường lấy 8x8 pixel/1ô), sau đó đánh giá chuyển động của từng ô. Hình 3.56 minh hoạ chuyển động chiếc xe máy kéo với một cặp khung liền kề từ xâu ảnh động đểđánh giá ô nào biểu diễn phần ảnh tĩnh và ô nào biểu diễn phần ảnh động. Việc đánh giá này dẫn tới hai vấn đề:

(1). Phải xác định biên và khoảng dịch chuyển của vùng ảnh chuyển động giữa hai khung.

(2). Phải xác định cái gì được điền vào không gian trống do vùng ảnh đã chuyển động. 3 2 Khung 1 Khung 2 Hình 3.56: Khảo sát ô mẫu pixel của ảnh chuyển động

Phép xấp xỉ và bù chuyển động chính là giải quyết hai yêu cầu nêu ở trên trong hệ thống mã hoá nén và giải mã nén: đầu tiên bộ giải mã phải lưu ảnh trước (Khung 1) trong khi tạo lại ảnh tiếp theo (Khung 2); khi bộ mã hoá thực hiện mã hoá khung 2 thì đồng

thời phải tạo lại mỗi ảnh (sau khi mã hoá nó) để dự báo cho bộ giải mã tạo lại ảnh này (khung 2) vì bộ giải mã không có chức năng tạo lại các ô mẫu bù chuyển động.

Phương pháp dự đoán để tìm ra các chi tiết ảnh thay thế giữa hai khung hình (frame) liền kề và tạo ra một vector chuyển động chỉ rõ vị trí mới của đối tượng ảnh chuyển động được nêu như ở trên hình 3.57. Ở đây, vector chuyển động sẽ phối hợp với các ô ở trong biên biểu diễn vùng chuyển động được mã hoá trước đó để lặp lại các ô này tại vị trí mới của ảnh. Các ô mẫu ở vị trí hiện tại sẽ phối hợp trong số các ô của khung ảnh trước đó, sử dụng chúng như là thành phần dựđoán trong bảng mã hoá đã được thiết lập trước đó: thành phần dựđoán này được lấy từđầu vào của khung trước để tạo ra một khung dựđoán có sai số thông tin nhỏ. Sai lệch giữa ô hiện tại và ô dựđoán của nó trong khung ảnh trước sẽ tạo ra ô mẫu dựđoán bù chuyển động.

Vùng tìm kiếm được xác định nằm trong biên của vùng ảnh có chứa các ô mẫu ảnh chuyển động của khung ảnh hiện tại, nó bao phủ cả vị trí hiện tại và vị trí trước đó của ô mẫu chuyển động đang khảo sát. Kích thước của vùng tìm kiếm được quyết định bởi độ phức tạp của quá trình phối hợp ô mẫu ảnh chuyển động của vị trí trước và vị trí hiện tại, thường vùng này lấy kích thước 16x16 hay 24x24 pixel.

Để giảm thiểu công việc nặng nhọc của quá trình xác định vector chuyển động, người ta có thể xử lý ảnh động theo các bước:

(1). Bước xử lý thô: Đầu tiên, giảm độ phân giải của ảnh xử lý, chẳng hạn ảnh 720x480 giảm xuống 360x240 (pixel); khi đó số bit cần xử lý giảm nhiều và vùng dự đoán trở nên lớn hơn, do đó ảnh dựđoán chuyển động mức thô xác định được nhanh hơn.

(2). Bước xử lý tinh: Sau khi có ảnh dựđoán thô, người ta tiến hành phép dựđoán vector chuyển động chính xác bằng cách xác định vị trí chính xác của các đối tượng chuyển động giữa hai khung ảnh với độ phân giải 720x480.

(3). Tiếp tục lặp hai bước trên cho đến hết các khung của xâu ảnh động.

Vị trí ô 8x8 pixel lúc đầu Vector chuyển động Vị trí ô 8x8 pixel hiện tại

a. khung thứ i Vùng tìm kiếm b. khung i+1

Một phần của tài liệu Bài giảng xử lý âm thanh và hình ảnh-p6 potx (Trang 32 - 34)