Kết quả đánh giá qua mã hóa nội khung

Đối với việc so sánh mã hóa nội khung, bao gồm khả năng mã hóa nội khung và mã hóa entropy. Cả hai bài so sánh sẽ sử dụng cùng 3 nguồn video. Bảng 3.9 tóm tắt các cấu hình của bộ mã sử dụng cho hai bài so sánh này.

Bài so sánh đầu tiên là so sánh giữa hai bộ mã H.264 Baseline và VP8 Good. Hình 4.15 thể hiện các kết quả của tốc độ bit (được dựa theo các hệ số lượng tử) so với chất lượng, được đo theo SSIM.

Các thanh lỗi tương ứng với độ lệch chuẩn của các khung hình, và các điểm dữ liệu của chúng là SSIM trung bình của tất cả các khung hình trong đoạn phim. Do vậy, đoạn phim được mã hóa mong muốn rằng SSIM trung bình của nó lớn nhưng thanh lỗi thì phải nhỏ. Đối với thanh lỗi lớn chỉ ra rằng đoạn phim được mã hóa biến đổi lớn về chất lượng.

VP8 có SSIM cao hơn với cùng một tốc độ bít trong cả 3 đoạn phim. Đặc tính thống kê theo SSIM giữa VP8 và H.264 đối với các đoạn phim độ phân giải thấp hơn thì lớn hơn so với các đoạn phim có độ phân giải cao hơn dù có lợi tức giảm dần. Hơn nữa, đoạn phim Parkrun có một mức chi tiết cao nên gây khó khăn

60 Vương Gia Thiết

cho việc nén sử dụng dự đoán nội khung. Từ hai nguyên nhân này dẫn đến đặc tính thống kê SSIM cao hơn đối với đoạn phim Foreman và Crew.

Điều đáng chú ý ở đây là H.264 Baseline không sử dụng biến đổi DCT 8 x 8 mà VP8 thiếu cân bằng nén vi sai ở các độ phân giải HD. DCT 8 x 8 là công cụ để duy trì chất lượng ở các độ phân giải cao hơn vì mẫu của chúng có kích thước lớn hơn.

Hình 4.15. So sánh theo tốc độ bít và SSIM của H.264 Baseline và VP8 Good

Khi các hệ số lượng tử tăng, tốc độ bit tăng thì sẽ có nhiều giá trị 0 hơn cần được mã hóa. Bộ mã hóa entropy lúc này giống như bộ mã hóa entropy nhị phân của VP8, nén các chuỗi 0 rất tốt. Ở tốc độ bit thấp hơn, sự sai khác SSIM giữa H.264 và VP8 lớn hơn so với ở tốc độ bit cao vì bộ mã hóa entropy mạnh mẽ của VP8. Điều này thể hiện rằng bộ mã entropy của VP8 tốt hơn nhiều so với CAVLC, bộ mã entropy H.264 Baseline sử dụng.

Đối với bài so sánh với mã hóa nội khung thứ hai, H.264 High sử dụng để so sánh với VP8 Best. Hai cấu hình này chỉ thay đổi tham số giữa hai bài so sánh. Hình 4.16 thể hiện kết quả và cũng giống như trong hình 4.15.

61 Vương Gia Thiết

Hình 4.16. So sánh theo tốc độ bít và SSIM của H.264 High và VP8 Best

Đối với so sánh này, các kết quả gần như đồng nhất giữa VP8 và H.264. VP8 kém hơn H.264 một chút khi các hệ số lượng tử tăng lên, H264 cũng có hệ năng trung bình cao hơn không nhiều. Tuy nhiên, các kết quả sai lệch không nhiều nên khi tốc độ bit càng cao thì kết quả cho ra càng khó đánh giá.

Để đưa ra được ý nghĩa thống kê từ kết quả của PSNR và SSIM, t-test cho phân bố Student và Welch được sử dụng. Đầu tiên, t-test cho phân bố Welch sử dụng để xem các giá trị phương sai có bằng nhau không. Độ lệch chuẩn, σ đã biết. Nếu kết quả của trị số p nhỏ hơn giá trị được chọn đối với α = 0.1, theo giả thuyết không thì các phương sai bằng nhau sẽ bị loại bỏ. Nếu các phương sai không bằng nhau, t-test theo phân bố Welch dùng cho các giá trị SSIM hoặc PSNR trung bình tương ứng với các độ lệch chuẩn của chúng. Mặt khác, t-test với phân bố Student được sử dụng khi giả sử rằng các phương sai là bằng nhau.

Các bài so sánh đều sử dụng bộ lọc 2 bước và không có dữ liệu giả nào trước đó. Giả thuyết không đối với các tham số chất lượng là không có sự khác biệt giữa H.264 và VP8. Nếu giả thuyết không bị loại bỏ, điều này chỉ ra là có khác biệt về ý nghĩa thống kê của cả 2 chuẩn nén.

62 Vương Gia Thiết

Bảng 4.5 thể hiện các giá trị p được lấy mẫu. Ngoặc vuông chỉ ra ý nghĩa thống kê đối với α = 0.1. Đối với α, ý nghĩa thống kê chỉ ra các giá trị phương sai là khác nhau theo PSNR của đoạn phim Foreman. Do đó, giá trị p theo PSNR đối với phim Foreman tính được theo t-test phân bố Student. Đối với đoạn phim Crew, đặc tính thống kê nhỏ hơn giá trị PSNR trung bình nên VP8 vượt trội hơn H.264. Mặt khác, đối với các đoạn phim khác đặc tính thống kê rất nhỏ.

Bảng 4.5. Các giá trị p đối với PSNR và SSIM trung bình tính theo σ

Đoạn phim Giá trị p PSNR Giá trị p PSNR, σ Giá trị p SSIM Giá trị p SSIM, σ

Foreman 0,37246 [0,00886] 0,22581 0,35943

Crew [0,01505] 0,30333 0,40258 0,19586

Parkrun 0,34615 0,20152 0,16909 0,10522

Kết quả đánh giá qua mã hóa nội khung

Bộ mã hóa, công cụ cơ bản

Các thông tin cần đánh giá