Đoán trước sự thay đổi lĩnh vực chia nhỏ gói dữ liệu

Một phần của tài liệu Luận văn - Xử lí âm thanh và hình ảnh hoàn chỉnh (Trang 87 - 91)

Như đã chỉ ra ở mục 11.5, mô hình khối dựa trên giả định chuyển động liên tục

trong mỗi khối dẫn đến dự toán và bồi thườngchuyển động không đáng tin cậy. Điều này có hiệu lực khối trở nên rõ ràng hơn và nghiêm trọng cho các khu vực không liên

tụcchuyển động trong khung hình ảnh. Điều này là bởi vì có hai hoặc nhiều khu vực trong một khối trong các lĩnh vực, từng có mộtchuyển động khác nhau. Sử dụng một vector chuyển động đại diệnvà bồi thường cho kết quả toàn bộ khối trong một dự đoán đáng kể lỗi tăng.

Orchard (1993) đã đề xuất một kỹ thuật phân khúc chuyển động lĩnh vực tiên đoán để cải thiện dự toán và bồi thường chuyển động dọc theo ranh giới của các đối tượng di chuyển. Cải thiện đáng kể độ chính xác của khung hình chuyển động bồi thường đạt được thông qua thư giãn các mô hình hạn chế blockbased theo những ranh giới chuyển động. Đó là, đối với những khối liên quan đến ranh giới chuyển động, lĩnh vực chuyển động giả định độ phân giải điểm ảnh thay vì độ phân giải khối.

Hai vấn đề chính đã được giải quyết để thực hiện ý tưởng. Một là vấn đề phân khúc. Được biết, các thông tin phân khúc là cần thiết ở cuối nhận bồi thường chuyển động. Điều này đưa đến một sự gia tăng lớn trong thông tin bên hông. Để duy trì gần như cùng một số lượng mã hóa chi phí là khối kết hợpkỹ thuật thông thường, các phân đoạn chuyển động lĩnh vực đã được đề xuất được thực hiện dựa trên các khung hình trước đó được giải mã. Chương trình này được dựa trên sau khi quan sát hình dạng của một đối tượng di chuyển khôn thay đổi từ khung này sang khung khác..

Hình 11.19: Khung hình thứ 20 của sự phối hợp giữa chuỗi “điện thoại di động và lịch”

Hình 11.20: Khung hình thứ 20 của sự phối hợp chuỗi “bàn đánh bóng bàn”

Phần này tương tự như kỹ thuật đệ quy PEL (mà sẽ đượcthảo luận chi tiết trong chương kế tiếp) với ý nghĩa là cả hai kỹ thuật hoạt động ngược: dựa trên giải mã khung trước đây. Mỗi phần khác nhau từ phương pháp đệ quy PEL ở chỗ nó chỉ sử dụng trước đó bộ giải mã các khung hình để dự đoán hình dạng bị gián đoạn trong quá trình chuyển động, không phải là toàn bộ chuyển động trong quá trình riêng của mình. Vector chuyển động được ước tính bằng cách sử dụng khung hình hiện tại ở bộ mã hóa. Do đó, phương án này có khả năng đạt được độ chính xác cao trong chuyển động và đồng thời nó không gây ra sự gia tăng lớn trong thông tin so với các phân đoạn trường chuyển động.

Một vấn đề khác là làm như thế nào để đạt được một trường chuyển động có độ phân giải điểm ảnh được giới hạn. Để tránh các vector chuyển động bổ sung cần được mã hóa và truyền, các vector chuyển động áp dụng vào những đoạn này trong những vùng không liên tục được lựa chọn từ một tập hợp là lựa chọn chuyển động từ một bộ cơ sở dữ liệu của những vector chuyền động lân cận. Kết quả là, công nghệ được đề xuất phải có khả năng xây dựng lại tính không liên tục trong chuyển động tại độ phân

Một số giải thuật sử dụng từng loại công nghệ trường chuyển đoạn phải phát triển và công năng của chúng đã được kiểm tra và đánh giá trên video thực sự (Orchard, 1993). Hai trong số 40 khung đã được kiểm tra chuỗi và được sử dụng ở “bàn Tennis” và chuỗi “bóng đá”. Khuôn chứa sự chuyển động nhanh của bóng đá và sự phóng đại của camera, trong khi nó chứa đựng những đối tượng nhỏ một cách tương đối về số lượng của chuyển động và quét camera. Có một vài thuật toán được đề xuất để so sánh với các khối ghép tiêu chuẩn dưới dạng dự báo lỗi năng lượng điểm ảnh trung bình tiêu chuẩn và số bít trên một khung yêu cầu để viết mã dự báo lỗi. Đối với dự báo lỗi năng lượng điểm ảnh trung bình, thuật toán trên đã giảm khoảng cách từ -0.7 đến -2,8dB của chuỗi “bàn Tennis” , và từ -1,3 đến -4,8 dB với chuỗi “bóng đá”. Đối với số bít trên một khung yêu cầu cho mã dự báo lỗi, giảm từ 20 đến 30%.

Một phần của tài liệu Luận văn - Xử lí âm thanh và hình ảnh hoàn chỉnh (Trang 87 - 91)