Thuật toán và Kỹ thuật Xử lí Âm thanh và Hình ảnh Hiện đại

MỤC LỤC

CÁC THUẬT NGỮ VIẾT TẮT

MAD Mean Administrative Delay (Series E) Thời gian trễ quản MSE Maintenance Sub-Entities (Series M) Các thực thể bảo. DPCM Differential pulse-code modulation Điều chế xung mã vi phân DM Delta modulation Điều chế delta. RGB Red-green-blue Mô Hình Màu CRT Cathode Ray Tube Ống tia cathode NTSC National Television System.

GIỚI THIỆU

Tính khả thi của việc nén hình ảnh và video

Dư thừa thống kê
Dự phòng PSYCHOVISUAL

Biết Kretzmer thiết kế mà chúng ta phải nghiên cứu và hiểu dự phòng để loại bỏ sự dư thừa, một số thiết bị thử nghiệm như một autocorrelator hình ảnh và một probabiloscope để đo lường một số thống kê số lượng tín hiệu truyền hình và xuất bản tác phẩm xuất sắc của mình (Kretzmer, 1952). Việc này dẫn đến kết quả ta thu được nền sáng chói, ở mức xám hệ thống thị giác của con người ( HSV ) phân biệt các đối tượng dễ dàng hơn.Mặt khác sự chênh lệch về cường độ sáng có thể nhỏ hơn, nếu như nền là tối.Chú ý rằng, phương trình 1.2 là phương trình Loga của phản ứng của hệ thống thị giác của con người, và các giác quan khác của con người cũng tuân theo định luật này. Hơn nữa,thực tế nghiên cứu đã chỉ ra rằng ngưỡng ∆ I tăng chậm hơn so với dự đoán từ định luật Weber.Một số chức năng độ nhạy tương phản chính xác hơn đã được trình bày trong tài liệu.( Legge and Foley ,1980),cho biết rằng phương trình hàm số mũ đã được thay thế bới phương trình tuyến tính trong định luật Weber.

Kết cấu mặt nạ đôi khi còn được gọi là chi tiết phụ thuộc (Connor và cộng sự, 1972), không gian mặt nạ (Netravali và Presada, 1977; Lim, 1990), hoặc mặt nạ hoạt động (Mitchell et al,1997.).Nó khẳng định rằng ngưỡng phân biệt đối xử làm tăng với các chi tiết hình ảnh ngày càng tăng.Đó là, kết cấu mạnh mẽ hơn, lớn hơn ngưỡng phân biệt. Trong hỡnh 1.8,nú cú thể được quan sỏt thấy rằng lỗi phụ ngẫu nhiờn là ớt rừ ràng hơn trong khu vực kết cấu mạnh mẽ hơn trong khu vực trơn tru nếu so sánh, ví dụ, phần tối của đám mây (góc trên bên phải của hình ảnh) với cácdiện tích mặt nước (góc dưới bên phải của hình ảnh).Đây là một xác nhận của mặt nạ kết cấu.

Hình 1.2 : (a) Một bức ảnh của "Boy và Girl," hồ sơ cá nhân Cường độ (b) cùng hàng 318, (c) Cường độ hồ sơ dọc theo cột 262, (d) Vị trí của dòng 318 và 262 cột.

Đo lường chất lượng hình ảnh

Đo lường chất lượng chủ quan

Các quan sát viên được mời để đánh giá chủ quan chất lượng hình ảnh của những khung hình.Cụ thể, các quan sát viên được yêu cầu xếp hạng những hình ảnh dựa theo chất lượng đo kiểm của bức ảnh. Từ tập hình ảnh thử nghiệm này, chúng ta có thể sản xuất, mã hóa vùng tham số, mức ưu tiên có thể được sử dụng để nghiên cứu tác động của tham số (s) đang được khảo sát. Một ví dụ về việc sử dụng phương pháp này để nghiên cứu tác động của thay đổi độ phân giải hình ảnh và số lượng mức lượng tử hóa trong chất lượng hình ảnh có thể được tìm thấy trong (Huang, 1965).

Kết quả là, hình ảnh trong một cột được sắp xếp theo thứ tự theo chất lượng hình ảnh và chất lượng hoặc các biện pháp suy giảm này sau đó được gán cho những hình ảnh trong một cột. Một ví dụ được trình bày trong mục 1.2.2.3, trong đó sử dụng các kỹ thuật lượng tử hóa IGS để đạt được nén chất lượng cao (sử dụng chỉ có bốn bit cho lượng tử hóa thay vì tám bit thông thường) mà không cần thêm vào đường ngưỡng vi sai. Giới thiệu ở đây là một phát triển mới trong đánh giá chất lượng hình ảnh,và là một đo lường chất lượng khách quan dựa trên nhận thức thị giác của con người (Webster et al, 1993).

Đó là, nó sử dụng đánh giá đạt được thông qua đánh giá chủ quan như là một tiêu chí để tìm kiếm cho các phép đo khách quan mới để có đánh giá khách quan gần giống với một trong những chủ quan nào nhất có thể. Dưới hình thức một cặp video thử nghiệm, các video đầu vào và video đầu vào suy giảm, được gửi đến một khối đánh giá chủ quan cũng như các khối lựa chọn một tính năng thống kê. Việc đánh giá chủ quan chất lượng hình ảnh thông thường như đã giới thiệu trong phần mục trước được thực hiện trong khối đánh giá chủ quan, trong đó bao gồm một bảng điều khiển lớn của các nhà quan sát, ví dụ như, 48 cộng sự quan sát ở Webster.

Hai tính năng được lựa chọn: đó là nhận biết về thông tin không gian (số lượng không gian chi tiết) và sự cảm nhận thông tin thời gian (số lượng biến đổi độ chói theo thời gian), liên quan đến các điểm ảnh.

Hình 1.11. Hệ thống xử lý âm thanh hình ảnh

KHỐI KẾT HỢP

Thủ tục tìm kiếm
Những cải tiến mới 1. Cấu trúc khối kết hợp

Từ 3/4 của các điểm ảnh trong cửa sổ và ngăn chặn không tham gia vào việc tính toán phù hợp, tuy nhiên, việc sử dụng của một thủ tục lấy mẫu con như vậy có thể ảnh hưởng đến tính chính xác chuyển động ước tính của các vectơ, đặc biệt là trong trường hợp của kích thước khối nhỏ. Trong thực tế, một số vectơ chuyển động tính toán ở cấp độ phân giải thấp hơn có thể là không chính xác và có được tinh chế hơn nữa, trong khi những người khác có thể là tương đối chính xác và có thể cung cấp chuyển động bồi thường thỏa đáng cho các khối tương ứng. Làm việc với các thực nghiệm phức tạp chuyển động khá khác nhau cho thấy rằng các thuật toán đề xuất làm giảm thời gian xử lý từ 14 đến 20 % , trong khi vẫn duy trì gần như cùng một chất lượng hình ảnh tái tạo so với các thuật toán nhanh nhất đa phân giải hiện có kết hợp khối ( Tzovaras et al , 1994).

So với phương pháp 1, tổng lượng tính toán (khoảng 0,16 x 106) được tiến hành về hoạt động ngưỡng, nhưng tiết kiệm tính toán lớn (bổ sung khoảng 2,16x106) đạt được bằng cách khấu trừ từ quá trình xử lý những khối mà có giá trị thời gian trễ quản lý trung bình ở cấp độ phân giải đầy đủ là ít hơn so với tiêu chuẩn chính xác được xác định trước. Túm lại, nú là rừ ràng rằng với ba trỡnh tự kiểm tra khỏc nhau, khối đa phõn giải ngưỡng phù hợp với thuật toán hoạt động nhanh hơn so với khối đa phân giải nhanh nhất hiện có trên xuống kết hợp thuật toán trong khi đạt được gần như cùng một chất lượng hình ảnh tái tạo. Điều này là bởi vì, với một tốc độ bit cao, một lượng vừa đủ củachuyển động bồi thường dự báo lỗi có thể được truyền đến kết thúc nhận được, vì thế nâng cao hiệu quả thị giác chủ quan đến mức độ như vậymà các hiện vật khối không xuất hiện để được gây phiền nhiễu.

Khớp khối ngưỡng đa lưới- Nhận thấy rằng mô hình chuyển động dựa trên khối (giả định 1 chuyển động đồng đều trong 1 khối có kích thước cố định) trong kỹ thuật khớp khối có thể có 1 vài hạn chế, Chan et al (1990) đã đề xuất 1 kỹ thuật khớp khối với kích thước khối biến thiên. Một vài nhận xét có thể được thực hiện như một kết luận cho kỹ thuật ngưỡng.Mặc dù nó cần để mã hóa và truyền cây – thùng hoặc cây – dây chập bốn như một phần thông tin, và để giải quyết vấn đề ngưỡng đặt trước,tổng thể,các thuật toán đề xuất đạt được hiệu suất tốt hơn so với khối phù hợp với kích thước cố định. Chặn nhiều lưới tối ưu phù hợp – như đã chỉ ra ở chương 10, mục tiêu cuối cùng của dự đoán chuyển động và đền bù chuyển động trong bối cảnh của video mã hóa để cung cấp một mã hiệu quả cao trong thời gian thực.Nói cách khác,dự đoán chính xác chuyển động thực sự không phải là mục tiêu cuối cùng , mặc dù ước tính chính xác chuyển động được chắc chắn mong muốn.

Có một số loại tiêu chí kết hợp khác nhau có thể được sử dụng cho kết hợp khối Kể từ khi được đưa ra các chỉ tiêu khác nhau này không gây ra sự khác biệt quan trọng trong khối kết hợp, sự khác biệt có nghĩa là tuyệt đối vì thế được ưa chuộng do tính đơn giản của nó trong việc thực hiện. Với một chiến lược phân chia hợp lí nhất kỹ thuật khối kết hợp nhiều lưới tạo ngưỡng trong một hình ảnh thành một biến kích thước của khối, trong đó kinh nghiệm của mỗi một chuyển động đều thống nhất Một cấu trúc cây (bin-tree hoặc quad-tree) được sử dụng để ghi lại các mối quan hệ giữa các biến kích thước khối. Từ quan điểm này, khối kết hợp nhiều lưới nói trên, quyết định tách một khối được thực hiện chỉ khi các bit được sử dụng để mã hóa các vector chuyển động thêm liên quan đến chia tách là ít hơn so với các bit được lưu từ mã hóa dự đoán giảm lỗi do chính xác hơn dự toán.