Trong phần này, cách tiếp cận và thiết lập thử nghiệm của chúng tôi được mô tả, tiếp theo là quy trình đã được tuân theo và thiết kế các điểm yếu và lỗi được giới thiệu trong các thử nghiệm của chúng tôi.
Bảng 1: Video câu hỏi và câu trả lời có thể xảy ra
Câu hỏi Câu trả lời có thể xảy ra Điểm Chất lượng kỹ thuật
của video này có chấp nhận được không
Có/không 1 hoặc 0
Đánh giá của bạn về chất lượng kỹ thuật
trong video là:
Nội dung của video là: Rất thú vị/Thú vị/Trung lập/ Nhàm chán/ Rất nhàm chán
5 đến 1 Trải nghiệm xem tổng
thể của bạn (Chất lượng kỹ thuật nội dung) trong quá trình phát lại video là:
Xuất sắc/ Tốt/ Khá/ Kém/ Xấu/ Tồi tệ
5 đến 0
A . Thiết lập thử nghiệm
Thí nghiệm diễn ra trong một môi trường được kiểm soát tại Đại học
Toronto. 30 đối tượng đã tham gia vào các thí nghiệm. Tất cả các đối tượng đã hoàn thành thí nghiệm. Điều kiện tham gia là có thị lực bình thường hoặc đã được điều chỉnh về mức bình thường và chưa tham gia thử nghiệm đánh giá chất lượng video trong sáu tháng trước ngày thử nghiệm. Tất cả các đối tượng trên 18 tuổi
Tất cả các đối tượng đều sử dụng cùng một máy tính với cùng một cấu hình. Mỗi đối tượng đánh giá tổng cộng 30 phiên video, kéo dài khoảng 90 phút. Các video được hiển thị theo thứ tự ngẫu nhiên để kiểm soát các hiệu ứng có thể xảy ra. Mỗi video được sử dụng trong thử nghiệm có độ phân giải 512 × 288 pixel và tốc độ khung hình là 30 khung hình / giây (fps). Các video hoàn chỉnh có độ dài từ 73 đến 123 giây với thời lượng trung bình là 94,1 giây. Các phiên video bao gồm 22 đoạn giới thiệu phim ngắn (teaser-trailer) và 8 đoạn phim ngắn.
Để đánh giá video, chúng tôi đã sử dụng phương pháp Danh mục tuyệt đối (ACR) . Sau mỗi video, mỗi đối tượng trả lời 4 câu hỏi dựa trên trải nghiệm xem của họ. Chúng tôi đã sử dụng thang điểm 6 mở rộng cho các câu hỏi liên quan đến chất lượng kỹ thuật, nhưng vẫn giữ thang điểm 5 cho câu hỏi đánh giá nội dung . Các câu hỏi và thang điểm tương ứng được nêu trong Bảng I. Câu hỏi đầu tiên đề cập đến việc đối tượng có chấp nhận chất lượng kỹ thuật hay không. Ba câu hỏi còn lại liên quan đến TQ, CQ và OX. Các video được chọn ở mức trung tính, không quá thú vị và cũng không quá nhàm chán.
B. Quy trình thí nghiệm
Thử nghiệm bao gồm bốn phần sau:
1) Đầu tiên, các đối tượng đã trả lời bảng câu hỏi trước để thu thập thông tin nhân khẩu học, thói quen xem video và sở thích chất lượng video của họ
2) Tiếp theo, một buổi đào tạo được sử dụng để giúp họ làm quen với việc đánh giá video. Họ đã xem 5 video và trả lời bảng câu hỏi dùng để đánh giá video. 5 video này bao gồm Suy giảm tính toàn vẹn và Lỗi khả năng khôi phục hoặc Lỗi về khả năng tiếp cận theo thứ tự đã xác định trước. Tuy nhiên, các câu trả lời cho bảng câu hỏi không được sử dụng trong bất kỳ phân tích nào
3) Trong phần đánh giá video, tất cả 30 video được chia thành ba phiên và 10 video được đánh giá trong mỗi phiên. Mỗi video có một hoặc hai lỗi Hỗ trợ tiếp cận hoặc hai loại suy giảm Tính toàn vẹn / Không thể khôi phục được chỉ định ngẫu nhiên, như sẽ được mô tả trong phần sau.
Có 10 phút giải lao sau mỗi phiên. Sau mỗi video, các đối tượng trả lời bốn câu hỏi trong Bảng I
Câu hỏi đầu tiên đề cập đến khả năng chấp nhận video. Câu hỏi thứ hai liên quan đến nhận thức của đối tượng về TQ, câu hỏi thứ ba là đánh giá của CQ và câu hỏi cuối cùng hỏi trải nghiệm nhìn tổng thể của đối tượng. Đối tượng trả lời các câu hỏi đánh giá bằng cách sử dụng các nhãn từ. Các giá trị số tương ứng với các nhãn từ được hiển thị trong cột thứ ba của Bảng I. Giá trị Điểm được sử dụng để tính điểm sMOS. Các đối tượng đã xem video với các dạng khiếm khuyết và thất bại khác nhau.
4) Trong phần cuối cùng, các đối tượng trả lời một bảng câu hỏi sau cho sở thích xem.