Kết quả đánh giá dữ liệu hình ảnh thử nghiệm theo giải thuật NR-NIQE

Một phần của tài liệu Nghiên cứu các phương pháp đánh giá chất lượng video trong các ứng dụng đa phương tiện (Trang 66)

Chỉ số đánh giá NIQE (tỉ lệ nghịch với chất lượng hình ảnh) cho tập hình ảnh thử nghiệm như sau:

Bảng 14 Chỉ số NIQE chuỗi hình ảnh thử nghiệm (1)

Hình ảnh Hình ảnh tham chiếu

a1 a2 a3 a4 a5

Chỉ số NIQE 5,5721 5,5721 6,0809 7,0540 8,8128 10,1810 Bảng 15 Chỉ số NIQE chuỗi hình ảnh thử nghiệm (2)

Hình ảnh Hình ảnh tham chiếu

b1 b2 b3 b4 b5

Chỉ số NIQE 5,8709 5,8709 6,0813 7,9187 8,9388 11,3768

Như vậy chỉ số NIQE hình ảnh tăng dần từ a1 cho tới a5, b1 tới b5, điều đó có nghĩa là chất lượng hình ảnh giảm dần từ a1 cho tới a5, b1 tới b5, cho thấy rằng giải thuật NR-NIQE có kết quả đánh giá khá tương quan với cảm nhận chủ quan của con người cũng như kết quả đánh giá bởi chỉ số PSNR.

69

Như vậy về mặt hiệu năng, giải thuật NR-NIQE có tương quan tốt với cảm nhận chủ quan của con người theo đúng lý thuyết.

70

CHƯƠNG 6. KẾT LUẬN VÀ KHUYẾN NGHỊ 6.1 Kết luận

Đánh giá chất lượng Video cho các ứng dụng đa phương tiện là một bài toán lớn và phức tạp, có các phương pháp đánh giá chủ quan và đánh giá khách quan. Luận văn đã đề cập đến từng phương pháp đánh giá và đưa ra các so sánh các phương pháp cũng như ưu nhược điểm của mỗi phương pháp đồng thời mô phỏng giải thuật NR-NIQE bằng ngôn ngữ Matlab.

Có hai phương pháp đánh giá chính là:

1. Phương pháp đánh giá chủ quan;

Với phương pháp đánh giá chủ quan cho kết quả đ ánh giá bằng điểm MOS đánh giá tổng thể chất lượng Video và Audio. Phương pháp này đánh giá bằng cảm nhận trực giác có tính đến các yếu tố đặc tính cảm nhận của thị giác và thính giác.

Đánh giá theo phương pháp này khó khăn về mặt tổ chức và thực hiện bởi nó đòi hỏi phải có đội ngũ chuyên gia, được đào tạo kỹ lưỡng, thậm chứ phải cần chứng chỉ đánh giá đối những người trong tổ đánh giá, phương pháp này còn bị ảnh hưởng bởi cảm tính của người đánh giá, thiết tính khách quan. Phụ thuộc nhiều vào yếu tố con người. Tuy nhiên điểm đánh giá MOS là điểm đánh giá tổng thể chất lượng âm thanh và hình ảnh (Audio và Video) có thể được sử dụng để các đánh giá chất lượng, so sánh hoặc cam kết chất lượng dịch vụ của các nhà cung cấp dịch vụ Video đa phương tiện.

Khi sử dụng các phương pháp chủ quan để đánh giá một hệ thống mới thì các phương pháp DSIS (EBU), DSCQS là rất phù hợp. Phương pháp SAMVIQ phù hợp với đánh giá chất lượng hình ảnh video trong các ứng dụng truyền hình số. Phương pháp DCR sẽ được ưu tiên sử dụng khi kiểm tra độ chính xác truyền dẫn các nguồn tín hiệu. Trong khi đó phương pháp ACR rất phù hợp cho các bài thử nghiệm khả năng, ACR- HR phù hợp với nhưng thử nghiệm lớn, được cung cấp tất cả các video tham chiếu tại mức chất lượng ít “tốt” nhất

Để có được các tham số khách quan có thể sử dụng phương pháp đánh giá khách quan bằng các tham số chất lượng (Metric) và quy đổi sang điểm MOS tương ứng như phần phụ lục C nêu trong luận văn này.

71

Gồm có các các mô hình tham chiếu sau:

- Mô hình tham chiếu đầy đủ (Full reference); - Mô hình tham chiếu rút gọn (Reduce - reference); - Mô hình không tham chiếu (Non/zero - reference).

Mục tiêu của các mô hình có tham chiếu là đưa ra kết quả đánh giá chất lượng Video thông qua việc so sánh với tham chiếu gốc cho kết quả đánh giá chính xác mức độ suy giảm chất lượng Video từ quá trình xử lý, mã hóa, điều chế, đóng gói truyền trên mạng truyền tải và giải mã đến thiết bị đầu cuối người sử dụng.

Mô hình tham chiếu đầy đủ và tham chiếu rút gọn cho kết quả đánh giá tốt nhất nhưng đòi hỏi phải có các thiết bị đo, và các thiết bị đo này thông qua các thật toán sẽ đánh giá mức độ suy giảm chất lượng Video và đưa ra kết quả đánh giá tổng thể hoặc quy ra điểm MOS.

Các phương pháp này có thể đánh giá mức độ suy giảm chất lượng tại từng chặng như mã hóa, truyền tải, giải mã và chất lượng tổng thể.

6.2 Khuyến nghị

Việc khuyến nghị áp dụng các phương pháp đánh giá được tổng kết trong Bảng 16 Bảng 16 Khuyến nghị áp dụng các phương pháp đánh giá

Phương pháp đánh giá Hệ thống mới Giám sát và kiểm tra định kỳ Hệ thống truyền hình số Hệ thống có chất lượng hình ảnh cực cao. Thử nghiệm từng khả năng ảnh hưởng chất lượng Kiểm tra mức độ chất lượng của nguồn tín hiệu Đánh giá các nội dung có chất lượng gần tương đương nhau Phương pháp ACR x Phương x

72 pháp ACR- HR Phương pháp DCR x x Phương pháp PC x x Các phương pháp khách quan x x x x

Tuy nhiên để loại bỏ được các yếu tố cảm tính của con người, phương pháp đánh giá chủ quan chỉ nên áp dụng cho các doanh nghiệp đánh giá, và cam kết chất lượng dịch vụ bằng điểm MOS.

 Đối với các cơ quan quản lý nhà nước:

- Sử dụng phương pháp đánh giá khách quan đánh giá các tham số chất lượng. - Xây dựng tiêu chất lượng cho các loại hình dịch vụ như:

- Xây dựng tiêu chuẩn chất lượng dịch vụ MobleTV; - Xây dựng tiêu chuẩn chất lượng dịch vụ InternetTV; - Xây dựng tiêu chuẩn chất lượng dịch vụ IPTV;

- Xây dựng tiêu chuẩn chất lượng dịch vụ hội nghị truyền hình (Video Conference);

- Xây dựng tiêu chuẩn chất lượng dịch vụ điện thoại thấy hình (Video call)

 Đối với các thiết bị và công cụ đo kiểm chất lượng dịch vụ Video

Với xu hướng phát triển các ứng dụng đa phương tiện thì thị phần dịch vụ Âm thanh và hình ảnh truyền hình (Audio và Video) ngày càng phát triển, và chiếm một thị phần không nhỏ trong các dịch vụ gia tăng của ngành Viễn thông cũng như phát thanh và truyền hình thì việc giám chất lượng dịch vụ rất quan trọng và cần thiết nhằm

73

đảm bảo cạnh tranh lành mạnh và đảm bảo quyền lợi người tiêu dùng, quyền và trách nhiệm của các nhà cung cấp dịch vụ.

Trên thế giới hiện nay đã có nhiều hãng cung cấp thiết bị dùng cho mục đích này chẳng hạn như các hãng Sony, các hãng Spirent comminications cung cấp các thiết bị đo kiểm chất lượng dịch vụ truyền hình(Video) trên nền IP; Như hệ thống Fit4 Chromatic – là hệ thống đo kiểm chất lượng Video trong thông tin di dộng MobileTV (Video Quality Measurement System), hoặc SMPTE (Society of Motion Picture & Television Engineers), Video Service Forum (VSF) cung cấp thông quan trọng về các tiêu chuẩn hình ảnh động cùng với các tiêu chuẩn của ITU-R. Các thiết bị chẳng hạn như N2X, PXI-6542, NI Digital Video Analyzer của National Instrument. Hoặc các máy phân tích chất lượng âm thanh và hình ảnh (Video and Audio Quality Analysis - VQS1000) và Phần mềm phân tích đánh giá hình ảnh của Tektronik (PQASW).

74

PHỤ LỤC A

HƯỚNG DẪN CHO NGƯỜI QUAN SÁT (ACR, ACR-HR, DCR, PC)

Các nội dung sau có thể được sử dụng làm cơ sở để hướng dẫn cho những người quan sát liên quan đến các thí nghiệm kiểm tra thông qua các phương pháp ACR, ACR-HR, DCR hoặc PC.

Ngoài ra, các hướng dẫn cần cung cấp thông tin về khoảng thời gian kiểm tra, thời gian tạm dừng, thử nghiệm sơ bộ và các chi tiết khác hữu ích cho các quan sát viên. Những thông tin này không bao gồm ở đây vì nó phụ thuộc vào việc thực hiện cụ thể.

A.1 ACR và ACR-HR

Xin chào và cảm ơn bạn đã đến.

Trong thí nghiệm này, bạn sẽ xem các chuỗi video ngắn trên màn hình trước mặt bạn. Sau mỗi khoảng thời gian chuỗi được hiển thị bạn nên đánh giá chất lượng của nó bằng cách sử dụng một trong năm cấp độ của thang đo dưới đây.

5 Rất tốt (Excellent) 4 Tốt (Good)

3 Trung bình (Fair) 2 Kém (Poor) 1 Xấu (Bad)

Quan sát cẩn thận toàn bộ các chuỗi video trước khi thực hiện đánh giá của bạn.

A.2 DCR

Xin chào và cảm ơn bạn đã đến.

Trong thí nghiệm này, bạn sẽ xem các chuỗi video ngắn trên màn hình trước mặt bạn. Mỗi chuỗi sẽ được trình bày hai lần với sự chuyển tiếp nhanh: trong mỗi cặp chỉ có chuối thứ hai được xử lý. Vào cuối mỗi phần trình bày bạn nên đánh giá sự suy yếu của chuỗi thứ hai đối với chuỗi đầu tiên. Bạn sẽ thể hiện đánh giá của mình bằng cách sử dụng thang đo sau:

5 -Imperceptible (không thể nhận thấy)

4 -Perceptible but not annoying (Nhận thấy nhưng không gây khó chịu) 3- Slightly annoying (hơi khó chịu)

75

1 -Very annoying (cực kỳ khó chịu)

Quan sát cẩn thận toàn bộ các cặp chuỗi video trước khi thực hiện đánh giá của bạn.

A.3 PC

Xin chào và cảm ơn bạn đã đến.

Trong thí nghiệm này, bạn sẽ xem các chuỗi video ngắn trên màn hình trước mặt bạn. Mỗi chuỗi sẽ được trình bày hai lần với sự chuyển tiếp nhanh: mỗi lần thông qua một cách mã hóa khác nhau. Trình tự của các chuỗi và sự kết hợp các mã hóa trong các cặp khác nhau là ngẫu nhiên. Vào cuối mỗi phần trình bày bạn nên bày tỏ ý kiến của mình bằng cách đánh dấu vào một trong những lựa chọn dưới đây. Bạn đánh dấu vào hộp 1 nếu bạn thích chuỗi đầu tiên hoặc đánh dấu vào hộp 2 nếu bạn thích chuỗi thứ hai của cặp

Quan sát cẩn thận toàn bộ các cặp chuỗi video trước khi thực hiện đánh giá của bạn.

76

PHỤ LỤC B

CÁC HÀM MÔ PHỎNG PHƯƠNG PHÁP NIQE TRONG MATLAB

a) Hàm tính toán đặc tính

function feat = computefeature(structdis) % Input - MSCn coefficients

% Output - Compute the 18 dimensional feature vector feat = [];

[alpha betal betar] = estimateaggdparam(structdis(:)); feat = [feat;alpha;(betal+betar)/2];

shifts = [ 0 1;1 0 ;1 1;1 -1]; for itr_shift =1:4

shifted_structdis = circshift(structdis,shifts(itr_shift,:)); pair = structdis(:).*shifted_structdis(:);

[alpha betal betar] = estimateaggdparam(pair);

meanparam = (betar-betal)*(gamma(2/alpha)/gamma(1/alpha)); feat = [feat;alpha;meanparam;betal;betar];

end

b) Hàm tính trung bình khối cục bộ function val = computemean(patch) val = mean2(patch);

c) Hàm ước lượng thông số

function [alpha betal betar] = estimateaggdparam(vec) gam = 0.2:0.001:10; r_gam = ((gamma(2./gam)).^2)./(gamma(1./gam).*gamma(3./gam)); leftstd = sqrt(mean((vec(vec<0)).^2)); rightstd = sqrt(mean((vec(vec>0)).^2)); gammahat = leftstd/rightstd; rhat = (mean(abs(vec)))^2/mean((vec).^2);

rhatnorm = (rhat*(gammahat^3 +1)*(gammahat+1))/((gammahat^2 +1)^2); [min_difference, array_position] = min((r_gam - rhatnorm).^2);

77

alpha = gam(array_position);

betal = leftstd *sqrt(gamma(1/alpha)/gamma(3/alpha)); betar = rightstd*sqrt(gamma(1/alpha)/gamma(3/alpha)); d) Hàm ước lượng mô hình thông số

function [mu_prisparam cov_prisparam] = estimatemodelparam(folderpath,... blocksizerow,blocksizecol,blockrowoverlap,blockcoloverlap,sh_th)

% Find the names of images in the folder current = pwd; cd(sprintf('%s',folderpath)) names = ls; names = names(3:end,:); cd(current) % --- %Number of features

% 18 features at each scale featnum = 18;

% --- % Make the directory for storing the features

mkdir(sprintf('local_risquee_prisfeatures'))

% --- % Compute pristine image features

for itr = 1:size(names,1) itr im = imread(sprintf('%s\\%s',folderpath,names(itr,:))); if(size(im,3)==3) im = rgb2gray(im); end im = double(im); [row col] = size(im);

78 block_colnum = floor(col/blocksizecol); im = im(1:block_rownum*blocksizerow, ... 1:block_colnum*blocksizecol); window = fspecial('gaussian',7,7/6); window = window/sum(sum(window)); scalenum = 2; warning('off') feat = []; e) Hàm tính toán chất lượng

function quality = computequality(im,blocksizerow,blocksizecol,... blockrowoverlap,blockcoloverlap,mu_prisparam,cov_prisparam) featnum = 18; if(size(im,3)==3) im = rgb2gray(im); end im = double(im); [row col] = size(im);

block_rownum = floor(row/blocksizerow); block_colnum = floor(col/blocksizecol);

im = im(1:block_rownum*blocksizerow,1:block_colnum*blocksizecol); [row col] = size(im);

block_rownum = floor(row/blocksizerow); block_colnum = floor(col/blocksizecol); im = im(1:block_rownum*blocksizerow, ... 1:block_colnum*blocksizecol); window = fspecial('gaussian',7,7/6); window = window/sum(sum(window)); scalenum = 2; warning('off') feat = [];

79

for itr_scale = 1:scalenum

u = imfilter(im,window,'replicate'); mu_sq = mu.*mu;

sigma = sqrt(abs(imfilter(im.*im,window,'replicate') - mu_sq)); structdis = (im-mu)./(sigma+1);

feat_scale = blkproc(structdis,[blocksizerow/itr_scale blocksizecol/itr_scale], ... [blockrowoverlap/itr_scale blockcoloverlap/itr_scale], ... @computefeature); feat_scale = reshape(feat_scale,[featnum .... size(feat_scale,1)*size(feat_scale,2)/featnum]); feat_scale = feat_scale'; if(itr_scale == 1)

sharpness = blkproc(sigma,[blocksizerow blocksizecol], ... [blockrowoverlap blockcoloverlap],@computemean); sharpness = sharpness(:);

end

feat = [feat feat_scale]; im =imresize(im,0.5); end distparam = feat; mu_distparam = nanmean(distparam); cov_distparam = nancov(distparam); % Compute quality invcov_param = pinv((cov_prisparam+cov_distparam)/2); quality = sqrt((mu_prisparam-mu_distparam)* ... invcov_param*(mu_prisparam-mu_distparam)');

80

PHỤ LỤC C

CÁC THAM SỐ CHẤT LƯỢNG VIDEO ĐA PHƯƠNG TIỆN

C.1 Các tham số chất lượng Video C.1.1 Các lớp Video C.1.1 Các lớp Video

Chất lượng video cao nhất được xem xét như trong [ITU-R BT.601], video mã hóa PCM tuyến tính 8 bit/pixel trong định dạng Y,CR,CB - 4:2:2.

Các lớp video và các thuộc tính tương ứng của từng lớp được mô tả trong Bảng 17 Bảng 17 Định nghĩa của các lớp video

TV 0 Không tổn hao nén: [ITU-R BT.601], 8-bit/pixel, video được sử dụng cho các ứng dụng không cần nén.

TV 1 Chỉ dùng trong giai đoạn sau sản xuất nội dung, nhiều lớp xử lý, biên tập và truyền thông tin trong nội bộ nhà sản xuất chương trình. Có thể sử dụng để truyền nội dung cho điểm ở xa. Trực giác mà nói thì nó nguyên bản so với TV0.

TV 2 Được sử dụng cho các điều chỉnh đơn giản, ít phiên bản chỉnh sửa, điều chỉnh khuân chữ ký tự/logo, chèn chương trình. Cảm nhận gần như trong suốt hơn so với TV0.

TV 3 Được sử dụng truyền phát đến nhà/khách hàng. Ví dụ hệ thống cáp từ điểm đầu cuối địa phương đến nhà khách hàng với chất lượng hội nghị truyền hình từ mức trung bình cao.

MM 4 Tất cả các khung được mã hóa. Ví dụ: Hội nghị truyền hình chất lượng trung bình. Thông thường ≥ 30fps

MM 5 Các khung hình có thể bị rớt ở bộ giải mã.

MM 6 Một loạt ảnh tĩnh. Không cung cấp chuyển động đầy đủ (Ví dụ: giám sát, đồ họa).

C.1.2 Yêu cầu tốc độ khung hình (FR) đối với các ứng dụng

Yêu cầu tốc độ khung hình (Frame rate) đối với các lớp video TV3, MM4, MM5 và MM6 là các lớp video được mã hóa trong các ứng dụng đa phương tiện như điện thoại truyền hình, hội nghị truyền hình, Video theo yêu cầu và các ứng dụng phục hồi và lưu trữ khác.

81 Lớp Video Các khuyến nghị áp dụng Tốc độ khung hình

Yêu cầu về trễ khung hình

Tốc độ bit video TV 3 [ITU-R BT.601] Tối đa FR

Frame repeat (Note 2) 1.5 to 8 MM 4a [ITU-R BT.601] ~30 hoặc ~25 fps Độ trễ <= 150 ms Biến động trễ <=50 ms ~1.5 MM 4b CIF(352x240) ~30 hoặc ~25 fps Độ trễ <= 150 ms Biến động trễ <= 50 ms ~0.7 MM 5a CIF 10-30 fps Độ trễ <= 1000 ms Biến động trễ <= 500 ms ~0.2 MM 5b ≤ CIF 1-15 fps Độ trễ <= 1000 ms Biến động trễ <= 500 ms ~0.05

MM 6 CIF-16CIF Limit → 0 fps Không hạn chế < 0.05,

Limit → 0 fps NOTE1–Thông thường là 30fps cho hệ thống 525 dòng và 25fps cho hệ thống 625 dòng.

NOTE2–Tất cả các hệ thống phát quảng bá đều phải liên tục, nhưng không nhất thiết phải đòi hỏi độ trễ một chiều và biến đổi trễ quá thấp. Với hầu hết các ứng dụng phát quảng bá, độ trễ thấp, thường nằm trong khoảng 50 – 500ms đối với hội nghị truyền hình chất lượng cao, với các ứng dụng đàm thoại độ trễ thường nhỏ hơn 150ms (xem [b-ITU-T G.114]). Biến đổi trễ thường được cho phép trong một giải giá trị nhưng không dẫn đến các hiệu ứng time – wraping gây khó chịu khi xem.

82

Các tham số chất lượng theo phương pháp chủ quan

Các tham số chất lượng theo phương pháp chủ quan

Các tham số Mô tả

MOS-V Đánh giá theo MOS, có giá trị 1-5 bao gồm các ảnh hưởng của mã hóa video, tốc độ khung hình, mất gói và cấu trúc nhóm hình ảnh GoP (Group of Picture)

MOS-A Đánh giá chất lượng âm thanh theo MOS, có giá trị 1-5 bao gồm ảnh hưởng của mã hóa âm thanh, tốc độ bit, tốc độ lất

Một phần của tài liệu Nghiên cứu các phương pháp đánh giá chất lượng video trong các ứng dụng đa phương tiện (Trang 66)

Tải bản đầy đủ (PDF)

(89 trang)