Khớp khối đa lưới

Học thuyết khớp khối đa lưới được biết đến đầu tiên trong toán học (Hackbusch và Trottenberg, 1982). Đó là 1 cấu trúc tính toán hữu dụng trong việc xử lý hình ảnh bên cạnh quá trình đa giải được miêu tả trong mục 11.3.6. Hình 11.5 cho thấy một biểu đồ với 3 mức khác nhau sử dụng để minh họa 1 cấu trúc đa lưới. Mặc dù là 1 cấu trúc theo bậc, mỗi mức trong bậc có cùng 1 đáp án. Một vài thuật toán dựa trên cấu trúc đa lưới đã được phát triển để cải thiện kỹ thuật khớp khối. Hai phương pháp cải tiến được giới thiệu ở dưới đây:

Hình 11.15: Cấu trúc phân cấp 3 mức khác nhau

Khớp khối ngưỡng đa lưới- Nhận thấy rằng mô hình chuyển động dựa trên khối (giả

định 1 chuyển động đồng đều trong 1 khối có kích thước cố định) trong kỹ thuật khớp khối có thể có 1 vài hạn chế, Chan et al (1990) đã đề xuất 1 kỹ thuật khớp khối với kích thước khối biến thiên. Ý tưởng chủ đạo là sử dụng chiến lược chia nhỏ và hợp nhất với 1 cấu trúc đa lưới để phân đoạn 1 bức ảnh trong 1 loạt khối kích thước biến thiên, mỗi một khối trong đó có 1 chuyển động gần như đồng đều. Một cấu trúc cây nhị phân (gọi là cây nhánh) được sử dụng để ghi lại mối quan hệ giữa những khối có kích thước khác nhau.

Đặc biệt, 1 bức ảnh ban đầu được chia thành 1 loạt các khối hình vuông bằng việc cắt ảnh này 1 cách luân phiên theo chiều ngang và chiều dọc. Đối với mỗi khối được tạo ra, việc ghép khối được tiến hành ghép với phần khung ảnh trước của nó. Sau đó, việc khớp chính xác về tổng lỗi bình phương được so sánh với ngưỡng cho trước. Nếu nó nhỏ hơn hoặc bằng ngưỡng cho trước thì khối vẫn ko đổi trong toàn bộ quá trình và vecto chuyển động ước lượng là kết quả cuối cùng. Nếu không, khối sẽ được chia nhỏ làm 2 và khớp khối mới được thực hiện tại mỗi một khối trong 2 khối con này. Qúa trình sẽ tiếp diễn cho đến khi hoặc vecto ước lượng thỏa mãn yêu cầu chính xác đặt ra hoặc kích thước khối đạt mức tiền định nhỏ nhất. Tại điểm này, Chan et al đề nghị tiến

hành 1 quá trình hòa nhập. Các khối bên cạnh ở cùng các nút giao điểm trong cây nhị phân sẽ được kiểm tra để làm rõ liệu nó đã được kết hợp hay chưa, VD, liệu 1 khối kết hợp này có gần giống với độ chính xác cần thiết của 1 khối trong khung được dựng lại trước đó hay không. Chú ý rằng việc hợp nhất có thể phụ thuộc vào các trường hợp đặc thu.

Hình 11.16 cho ta một biểu đồ khối gồm khớp khối đa lưới. Chú ý rằng nó giống với những gì được nêu trong hình 11.8 về khớp khối ngưỡng đa giải đã nêu trong mục 11.3.6. Quan sát này phản ánh sự đồng dạng giữ cấu trúc đa lưới và cấu trúc đa giải: về cơ bản, cả 2 đều có thứ bậc và có thể dễ dàng chia nhỏ cũng như hợp nhất. Một ví dụ về sự phân tích và và cây nhị phân tương ứng được nêu trong hình 11.17.

Chan et al (1990) đã cho thấy: với một bức ảnh của một con chuột máy tính và một đồng xu, khớp khối với kích thước biến thiên cho trước đã đạt được tới mức 6-dB về SNR và giảm khoảng 30% trong bít yêu cầu so với khớp khối kích thước cố định(16x16). Đối với một vài chuỗi hội thảo truyền hình điển hình thì thuật toán này luôn luôn cho kết quả tốt hơn kỹ thuật khớp khối với kích thước cố định về mặt cái thiện SNR của ảnh được dựng lại với cùng tỷ lệ bit.

Sử dụng một thuật toán tương tự do Xia và Shi (1996) đưa ra về phân đoạn dựa trên cây 4 nhánh. Kỹ thuật tính toán ngưỡng cũng giống như kỹ thuật được Shi và Xia (1997) sử dụng và nhấn mạnh việc giảm mức độ tính toán phức tạp. Kết quả là đối với loại đầu-vai của các chuỗi điện thoại truyền hình thì thuật toán ngưỡng khớp khối đa lưới cho hiệu quả tốt hơn ngưỡng phân giải khối phù hợp với thuật toán. Đối với các chuỗi video chứa các chi tiết phức tạp hơn và di động,tuy nhiên,so sánh hiệu suất vòng ra bị đảo ngược

Một vài nhận xét có thể được thực hiện như một kết luận cho kỹ thuật ngưỡng.Mặc dù nó cần để mã hóa và truyền cây – thùng hoặc cây – dây chập bốn như một phần thông tin, và để giải quyết vấn đề ngưỡng đặt trước,tổng thể,các thuật toán đề xuất đạt được hiệu suất tốt hơn so với khối phù hợp với kích thước cố định. Với sự linh hoạt cung cấp thông qua các phương pháp thay đổi kích thước,cách tiếp cận đề suất có khả năng khiến cho mô hình của chuyển động thống nhất trong mỗi khối chính xác so với khối phù hợp với kích thước cố định có thể làm

Hinh 11.16 : Sơ đồ của nhiều khối kết hợp

Chặn nhiều lưới tối ưu phù hợp – như đã chỉ ra ở chương 10, mục tiêu cuối cùng của dự đoán chuyển động và đền bù chuyển động trong bối cảnh của video mã hóa để cung cấp một mã hiệu quả cao trong thời gian thực.Nói cách khác,dự đoán chính xác chuyển động thực sự không phải là mục tiêu cuối cùng , mặc dù ước tính chính xác chuyển động được chắc chắn mong muốn. Điểm này được trình bày bởi Bierling (1988).Ở đó,các yêu cầu khác nhau cùng liên quan tới chuyển động bồi thường mã hóa và chuyển động nội suy được bồi thường.Trong khi trước đây đòi hỏi phải có véc tơ chuyển động dẫn đến lỗi dự đoán tối thiểu và đồng thời một số lượng thấp của các thông tin véc tơ chuyển động, sau này đòi hỏi các dự toán chính xác.

Hoàn tất phù hợp cho khối Khối kết hợp Tách khối Bạn có hài lòng với các tiêu chí đặt ra Bạn có hài lòng với các tiêu chí đặt ra Kích thước khối có đạt được tới mức cho phép Kích thước khối có đạt được tới mức cho phép

Điều này đã được nói tới rất nhiều Dufaux and Moscheni (1995).Họ nêu rõ dàng trong bối cảnh mã hóa video,ước lượng thực sự của chuyển động trong không gian thế giới 3D không phải là mục tiêu cuối cùng.

Hình 11.17 : Nhiều lưới chặn kết hợp

Thay vào đó, dự toán chuyển động nên có thể cung cấp dự đoán thời gian và tại cùng một thời gian yêu cầu thông tin chi phí thấp. Trong một từ, tổng số

lượng thông tin mà cần phải được mã hóa nênđược giảm thiểu. Dựa trên quan sát này, kỹ thuật phù hợp với nhiều lưới với một tiêu chí entropy tiên tiến đã được đề xuất (hệ số entropy).

Kể từ khi nó thuộc về thể loại của ngưỡng đa phù hợp với khối lưới, nó chia sẻ nhiều điểm tương đồng với những người Chan et al(1990) và Xia và Shi(1996). Nó cũng mang một số ngưỡng phù hợp với khối đa độ phân giải (Shi và Xia, năm 1997). Điều gì thực sự phân biệt này phương pháp tiếp cận từ các thuật toán khác là quy tắc quyết định phân khúc của nó. Thay vì một ngưỡng định trước, thuật toán làm việc với một dữ liệu ngẫu nhiên thích ứng tiêu chuẩn,nhằm mục đích kiểm soát các phân khúc để đạt được một giải pháp tối ưu theo cách như vậy mà tổng số các bit cần thiết để đại diện cho cả hai lỗi dự báo và trên không chuyển động được giảm thiểu. Quyết định chia tách khối được thực hiện chỉ khi các chi phí chuyển động thêm liên quan đến phân chia thấp hơn so với lợi ích thu được từ dự đáon lỗi ít hơn do dự toán chuyển động chính xác hơn. Không chỉ là tối ưu trong ý thức tiết kiệm bit, nhưng nó cũng giúp loại bỏ sự cần thiết phải thiết lập một ngưỡng.

Số lượng bit cần thiết cho chuyển động mã hóa thông tin có thể được ước tính một cách đơn giản. Theo như các lỗi dự đoán là có liên quan, các bit cần thiết có thể được đại diện bởi entropy tổng số các lỗi dự đoán, có thể được ước tính bằng cách sử dụng một biểu thức phân tích được trình bày bởi Dupfaux(1994) và Monscheni et al. (1993). Lưu ý rằng chi phí mã hóa thông tin phân khúc quad-tree là không đáng kể so với sử dụng cho mã hóa dự đoán lỗi và vectơ chuyển động, và do đó, bỏ qua trong việc xác định các tiêu chí.

Hình 11.18 : Khung hình thứ 20 của chuỗi “ vườn hoa”

Ngoài tiêu chí entropy này, một thủ tục tiên tiến hơn là áp dụng trong thuật toán để xuống dự các vectơ chuyển động giữa hai lưới liên tiếp trong các thô - tốt lặp đi lặp lại quá trình sàng lọc.

Cả hai đánh giá chất lượng và số lượng trong các thí nghiệm chứng minh hiệu suất tốt của nó.Nó đã được báo cáo rằng, khi PSNR là cố định, tỷ lệ bit tiết kiệm cho "Vườn hoa" trình tự là 10-20%, "Calendardi động" 6-12%, và "bóng bàn" lên đến 8%. Điều này có thể được dịch ra tiếng đạt được trong PSNR từ 0,5 đến 1,5 dB. Chủ quan,chất lượng hình ảnh được cải thiện rất nhiều. Đặc biệt, cạnh di chuyển trở nên sắc nét hơn. Con số 11,18,11,19 và 11,20 hiển thị một khung từ “Vườn hoa”,”Lịch điên thoại di động” và “Bóng bàn” trình tự tương ứng.

Tóm tắt: Độ nhạy vi phân

Đo lường chất lượng chủ quan