5.2 Một số phương pháp đánh giá khách quan chất lượng hình ảnh trong các ứng
5.2.6 Phương pháp đánh giá chất lượng hình ảnh video trong các ứng dụng đa phương tiện
phương tiện theo giải thuật NR-BLINDSII
Giải thuật BLINDSII sử dụng mô hình thống kê phân cảnh tự nhiên (NSS) của các
55
hệ số biến đổi cosin rời rạc từ hình ảnh và một mô hình suy luận Bayes đơn giản để dự đoán mức chất lượng hình ảnh từ các đặc tính trích xuất. Các đặc tính dựa trên một mô hình NSS của các hệ số DCT của hình ảnh. Các thông số ước lượng của mô hình sử dụng để tạo thành các đặc tính mô phỏng chất lượng cảm nhận con người. Những đặc tính này được sử dụng trong phương pháp suy luận Bayes đơn giản để dự đoán mức chất lượng. Thuật toán BLIINDS-II, yêu cầu giai đoạn thử nghiệm bằng phương pháp đánh giá chủ quan để xây dựng cơ sở dữ liệu và áp dụng một mô hình xác suất đơn giản để dự đoán mức chất lượng. Với các đặc tính được trích xuất từ hình ảnh cần kiểm tra, mức chất lượng có khả năng xuất hiện nhiều nhất được chọn là điểm chất lượng dự đoán của hình ảnh đó.
Bước đầu tiên của giải thuật là tính toán hệ số biến đổi cosin rời rạc 2 chiều của hình ảnh. Giai đoạn này bao gồm việc phân vùng ảnh thành các khối kích thước n x n bằng nhau, gọi là các khối hình ảnh cục bộ, sau đó tính toán hệ số DCT 2 chiều trên mỗi khối. Việc khai thác hệ số được thực hiện cục bộ trong miền không gian. Giai đoạn thứ hai áp dụng một mô hình mật độ Gauss tổng quát cho mỗi khối hệ số DCT, cũng như cho các phân vùng cụ thể trong từng khối DCT.
Sau đó tính toán các hàm của các thông số mô hình Gaussian. Đây là những đặc tính được sử dụng để dự đoán điểm số chất lượng hình ảnh. Các đặc tính này được xác định tương ứng với sự thay đổi chất lượng hình ảnh, và tương quan với đánh giá chủ quan của con người về chất lượng. Giai đoạn thứ tư sử dụng một mô hình Bayes đơn giản để có thể dự đoán một mức điểm chất lượng cho hình ảnh. Phương pháp Bayes tối đa hóa khả năng hình ảnh có mức điểm chất lượng dựa trên các đặc tính trích xuất từ hình ảnh. Kết quả là hình ảnh có điểm chất lượng nhất định cho các đặc tính trích xuất được mô phỏng như một GGD đa chiều.
5.2.7 Phương pháp đánh giá khách quan chất lượng hình ảnh video trong các ứng dụng đa phương tiện theo giải thuật NR- NIQE ứng dụng đa phương tiện theo giải thuật NR- NIQE
Giải thuật NIQE (Natural Umage Quality Evaluator – Đánh giá chất lượng hình ảnh tự nhiên), dựa trên việc xây dựng một bộ sưu tập “nhận thức chất lượng” của các đặc tính thống kê dựa trên một mô hình thống kê phân cảnh tự nhiên (NSS – natural scene statistic) miền không gian đơn giản. Những đặc tính này có nguồn gốc từ một tập các hình ảnh nguyên bản. Kết quả thực nghiệm cho thấy phương pháp này mang lại hiệu năng tương đương phương pháp đánh giá chủ quan [7].
Phương pháp đánh giá này trước hết dựa trên việc xây dựng một bộ sưu tập các đặc tính "nhận biết chất lượng" và đưa vào một mô hình Gaussian đa biến (MVG). Các đặc tính nhận biết chất lượng có nguồn gốc từ một mô hình thống kê phân cảnh tự nhiên đơn giản nhưng rất thường gặp (NSS). Chất lượng của một hình ảnh cần đánh giá sẽ được xác định bằng khoảng cách giữa một mô hình Gaussian đa biến (MVG) của các đặc tính NSS được trích xuất từ hình ảnh đó, và một mô hình MVG của những
56
đặc tính nhận biết chất lượng trích xuất từ cơ sở dữ liệu phân cảnh tự nhiên.
Mô hình đánh giá chất lượng hình ảnh này thành lập dựa trên nhận biết có liên quan đến những đặc tính NSS miền không gian trích xuất từ các khối hình ảnh cục bộ. Mô hình NSS không gian cổ điển [10] được sử dụng bắt đầu bằng việc tiền xử lý hình ảnh bởi quá trình loại bỏ trung bình cục bộ và bình thường hóa bộ chia:
(1)
Trong đó i {1,2,…M}, j {1,2,…N} là những chỉ số không gian, M và N là kích thước hình ảnh, và:
(2)
(3)
tương ứng là ước lượng trung bình cục bộ và độ tương phản, trong đó là hàm trọng số Gauss đối xứng tròn 2 chiều, được lấy mẫu tới 3 độ lệch chuẩn (K=L=3).
Các hệ số (1) đã được quan sát đáng tin cậy theo một phân bố Gauss được tính toán từ hình ảnh tự nhiên có ít hoặc không có biến dạng [10]. Đây là mô hình lý tưởng , tuy nhiên, mô hình này không sử dụng được khi những hình ảnh không xuất phát từ một nguồn tự nhiên (ví dụ như đồ họa máy tính) hoặc khi hình ảnh tự nhiên bị biến dạng bất thường. Mức độ thay đổi có thể là dấu hiệu của mức độ biến dạng tri giác.
NIQE chỉ sử dụng các đặc tính NSS từ tập các hình ảnh tự nhiên và không bị ràng buộc với bất kỳ loại biến dạng cụ thể.
Một khi các hệ số hình ảnh (1) được tính toán, hình ảnh được phân chia thành các khối cục bộ P x P. Sau đó các đặc tính NSS cụ thể được tính từ các hệ số của mỗi khối. Vì con người có xu hướng đánh giá cao chất lượng hình ảnh từ những vùng hình ảnh sắc nét, do vậy các khối hình ảnh sắc nét nên được lựa chọn để làm nổi bật phương pháp đánh giá.
Trước đây, trường phương sai (3) phần lớn đã được bỏ qua trong phân tích hình ảnh dựa trên NSS, nhưng nó là một nguồn thông tin hình ảnh phong phú có thể được sử dụng để định lượng độ sắc nét hình ảnh cục bộ. Lập chỉ mục b = 1, 2,... B, tương ứng với các khối PxP, tính toán độ lệch cục bộ trung bình tại mỗi khối b như sau:
57
(4)
Trong đó hiển thị độ sắc nét cục bộ
Khi độ sắc nét của mỗi khối được xác định, những khối có độ sắc nét > T được lựa chọn. Ngưỡng T được chọn là p lần của độ sắc nét đỉnh của hình ảnh. Trong các mô phỏng trong luận văn này sử dụng giá trị p = 0,75. Theo quan sát thực nghiệm thấy rằng chỉ có hiệu suất thay đổi không đáng kể khi p thay đổi trong khoảng [0,6;0,9].
Cho một bộ sưu tập các khối hình ảnh tự nhiên được lựa chọn như trên, số liệu thống kê của chúng được đặc trưng bởi các đặc tính NSS “nhận biết chất lượng” được tính toán từ mỗi khối được chọn [11] . Nghiên cứu trước đây về chất lượng hình ảnh dựa trên NSS đã chỉ ra rằng sự phân bố Gaussian tổng quát có khả năng thu lại hiệu quả những phản ứng thay đổi của các hệ số (1) của các phiên bản tự nhiên và phiên bản méo mó của hình ảnh [13]. Phân phối Gaussian tổng quát (GGD) với trung bình không (zero mean) được cho bởi:
(5) Trong đó hàm gammar như sau:
(6)
Các thông số của GGD (,), có thể được ước lượng một cách đáng tin cậy bằng cách sử dụng phương pháp được đề xuất trong [14] . Các ký hiệu của các hệ số hình ảnh được chuyển đổi (1) đã được quan sát theo một cấu trúc khá thường xuyên. Tuy nhiên, biến dạng làm ảnh hưởng cấu trúc tương quan này. Sai số này có thể ghi lại bằng cách phân tích sự phân bố mẫu của từng cặp hệ số liền kề theo phương ngang, theo chiều dọc và đường chéo: ^ I(i; j)^ I(i; j+1), ^ I(i; j)^ I(i+1; j), ^ I(i; j)^ I(i+1; j+1) and ^ I(i; j)^ I(i+1; j 1) với đó i {1,2,…M}, j {1,2,…N} [3].
Các kết quả của hệ số lân cận đều được mô hình theo một phân bố Gauss tổng quát đối xứng chế độ không (AGGD) [15]:
(7)
58
Các thông số của AGGD (, l, r) có thể được ước lượng tin cậy nhờ sử dụng phương pháp mô tả trong [15]. Giá trị trung bình của phân bố:
(8)
Một mô hình đơn giản của các đặc tính NSS được tính toán từ các khối hình ảnh tự nhiên có thể đạt được bằng cách kết hợp chúng với một mô hình mật độ Gauss đa biến (MVG).
(9) Trong đó (x1, ….xk) là những đặc tính NSS đã được tính toán và và là ma trận giá trị trung bình và ma trận phương sai của mô hình MVG, được ước lượng bằng cách sử dụng thủ tục ước lượng tối đa tiêu chuẩn. Ở đây lựa chọn một bộ 125 hình ảnh tự nhiên khác nhau với kích thước thay đổi từ 480 x 320 đến 1280 x 720 để có được mô hình Gauss đa biến. Những hình ảnh được lựa chọn phải đảm bảo rằng không có sự trùng lặp xảy ra đối với nội dung hình ảnh thử nghiệm.
Chỉ số NIQE thu được bằng cách tính toán 36 đặc trưng NSS xác định từ các khối hình ảnh kích thước giống nhau PxP của hình ảnh cần đánh giá chất lượng, kết hợp chúng với mô hình MVG (9), sau đó so sánh mô hình MVG đó với mô hình MVG của hình ảnh tự nhiên. Kích thước khối hình ảnh đã được thiết lập là 96 x 96 trong mô phỏng của luận văn. Tuy nhiên, theo quan sát, hiệu suất ổn định với các kích thước khối hình ảnh từ 32x32 đến 160x160.
Cuối cùng, chất lượng của hình ảnh suy giảm được thể hiện như sự sai lệch giữa mô hình MVG từ các đặc trưng NSS của hình ảnh tự nhiên và MVG tương ứng với các đặc trưng được trích xuất từ hình ảnh suy giảm:
trong đó 1, 2, và 1, 2 là các vectơ trung bình và ma trận phương sai của mô hình MVG tự nhiên và mô hình MVG của hình ảnh suy giảm.