Trong Phần 3.2.1 cho ta thấy sự khác nhau về đặc tính thống kê của H.264 và VP8 trong các khung dự đoán. VP8 không có các khung dự đoán 2 chiều (B-frame) và thay khung dự đoán nội bằng khung golden và altref.
Để so sánh chất lượng của việc mã hóa liên khung của VP8 và H.264, các cấu hình được sử dụng trong bảng 3.10. Cấu hình --b-adapt của x264 nhằm sử dụng phương pháp lựa chọn B frame hay P frame. Giá trị 0 đằng sau đó là lựa chọn chỉ B frame, 1 là mặc định nghĩa là sử dụng thuật toán tiệm cận nhanh để quyết định khi nào là B frame, còn 2 là sử dụng thuật toán tiệm cận chậm.
44 Vương Gia Thiết
Tham số --b-bias mô tả thuật toán lựa chọn B-frame hay P-frame hơn. Trọng số 0 nghĩa là xác suất ngang nhau. Giá trị <0, nhỏ nhất là -100, nghĩa là xác suất P- frame cao hơn. Ngược lại, giá trị >0, lớn nhất là 100, nghĩa là xác suất B-frame cao hơn.
Tham số -r để xác định số khung tham chiếu sẽ sử dụng. Đối với VP8 chỉ tham chiếu một khung từ chính P-frame nhưng altref frame có thể tham chiếu tùy ý.
Bảng 3.10. Các cấu hình để so sánh mã hóa liên khung
Bộ mã hóa Các tham số Mô tả
x264-default --profile high -I 120 Mặc định cho từng cấu hình x264
vp8-default --good --kf-max-dist=120 --passes=2 Mặc định cho từng câu hình vpxenc
x264 (1) -b 0 -r 1 --b-adapt 1 --b-bias 0 Không B frame và chỉ 1 tham chiếu
x264 (2) -b 3 -r 3 --b-adapt 1 --b-bias 0 Mặc định cho x264
x264 (3) -b 16 -r 3 --b-adapt 2 --b-bias -50 Nhiều B-frame nhưng xác suất thấp x264 (4) -b 16 -r 3 --b-adapt 2 --b-bias 0 Nhiều B-frame, xác suất như nhau x264 (5) -b 16 -r 3 --b-adapt 2 --b-bias 100 Nhiều B-frane và xác suất cao
x264 (6) -b 119 -r 3 --b-adapt 0 --b-bias 0 Chỉ có B-frame
x264 (7) -b 119 -r 9 --b-adapt 0 --b-bias 0 Chỉ có B-frame, nhiều tham chiếu
vp8 (8) --auto-alt-ref=0 --arnr-maxframes=0
--arnr-strength=0 --arnr-type=0
Mặc định cho VP8
vp8 (9) --auto-alt-ref=1 --arnr-maxframes=4
--arnr-strength=2 --arnr-type=3
Cho phép sử dụng Altref frame
vp8 (10) --auto-alt-ref=1 --arnr-maxframes=7 --arnr-strength=6 --arnr-type=3
Cho phép sử dụng Altref, bộ lọc ARNR bậc cao
Trong các hình đã được mô tả, các tham số --arnr-maxframes, --arnr-type và
--arnr-strength sử dụng cho altref frame. Các tham số này cấu hình việc lọc ảnh theo nhóm các khung hình sẽ đến sau nghĩa là số lượng khung hình sẽ được nén được lưu vào bộ đệm hay còn gọi là khung tương lai. Bộ lọc này được gọi là bộ lọc tạm thời và hoàn toàn có thể mặc định là không sử dụng. Như ta thấy với cấu hình vp8 (10) thì bộ lọc này có số khung tương lai bằng 7, bậc bộ lọc bằng 6. --auto-alt-
45 Vương Gia Thiết
ref cho phép sao lưu lại các golden frame đã đến trước trong bộ đệm. Việc sử dụng
–auto-alt-ref có thể cải thiện chất lượng rất nhiều.
Trong bài so sánh chúng ta sẽ sử dụng đoạn phim Ice độ phân giải 4CIF và đoạn phim Parkrun phân giải 720p. Sử dụng hai đoạn phim này nhằm chỉ ra lợi ích của mã hóa liên khung cải tiến giống với B-frame.
Trong Chương 3 chúng ta thấy được các cấu hình phục vụ việc so sánh 3 nội dung chính gồm: chất lượng băng thông đường truyền, mã hóa nội khung và liên khung. Đây chính là 3 vấn đề quan trọng trong thực tiễn của môt bộ mã hóa. Để so sánh chính xác, các kết quả thể hiện cụ thể trong Chương 4.
46 Vương Gia Thiết
CHƢƠNG IV. KẾT QUẢ VÀ PHÂN TÍCH 4.1. Kết quả đánh giá chất lƣợng và băng thông
Đối với đoạn phim Akiyo ở độ phân giải CIF với tốc độ 25 và 50 kbps, 6 cấu hình cho VP8 và H.264 được biểu diễn trong hình 4.1.
Các biểu đồ thể hiện 5 điểm theo thứ tự trên xuống lần lượt là PSNR lớn nhất, điểm tứ phân vị thứ 3, trung vị, tứ phân vị thứ nhất và PSNR nhỏ nhât. Tốc độ bit thì được biểu diễn theo đường thẳng.
Trong hình 4.1, rõ ràng là VP8 thể hiện tốt hơn H.264 về độ phức tạp mã hóa, thường với giá trị nhỏ nhất của VP8 gần như bằng với giá trị của tứ nhị phân thứ 3 trong kết quả của H.264. Theo như đồ thị ta thấy là H.264 có tốc độ bit cao hơn so với VP8. Ở cấu hình Fastest, chất lượng của H264 giảm đáng kể trong khi trong tất cả các cấu hình VP8 vẫn duy trì ở mức ngang nhau.
Trong hình 4.2 thể hiện các giá trị PSNR đối với mỗi khung hình Slowest và Fastest của H.264 và VP8. Đối với cấu hình slowest, VP8 bắt đầu tốt hơn trong khi H.264 có chất lượng tăng dần khi số khung hình tăng lên. Trong cấu hình fastest, VP8 hoàn toàn hơn H.264 cho đến khi có I-frame thứ nhất đến tại khung hình thứ 251 thể hiển bởi đường thẳng đứng bên trong đồ thị. Nếu số khung hình lớn hơn nữa thì H.264 đủ khả năng để cải thiện được chất lượng lúc ban đầu.
H.264 thể hiện tốt hơn với tốc độ bit 50 kbps cho đoạn phim Akiyo. Hình 4.3 biểu diễn kết quả của 6 cấu hình VP8 và H.264 được mã hóa ở 50 kbps. H.264 thì tốc độ bit không đổi giữ ở 50 kbps trong khi VP8 biến đổi từ 10 đến 15 kbps và thậm chí thấp hơn tuy nhiên PSNR của VP8 lại cao hơn.
Trong hình 4.4, ta lại nhìn thấy rằng VP8 slowest ở thời điểm bắt đầu có chất lượng tốt hơn hẳn H.264. Tuy nhiên là đến I-frame 251 thì H.264 đã bắt kịp với chất lượng của VP8 và thậm chí là còn tốt hơn. Ở cấu hình fastest, VP8 thể hiện chất lượng khá đồng đều, H.264 vẫn thay đổi nhanh tại thời điểm có I-frame.
47 Vương Gia Thiết
Hình 4.1. Đoạn phim Akiyo độ phân giải CIF, 25kbps
48 Vương Gia Thiết
Trong các cấu hình chúng ta chọn ban đầu, rõ ràng là việc VP8 không có I- frame nào ngoại trừ I-frame ban đầu thì chất lượng sẽ phụ thuộc nhiều vào kênh truyền, với kênh truyền ổn định thì VP8 thể hiện khả năng rất tốt so với H.264.
Các giá trị p từ các giá trị PSNR đối với các khung hình thu được được thể hiện trong bảng 4.1 và 4.2. Giả thuyết không, các giá trị giống nhau, bị gạt đi trong từng trường hợp sử dụng t-test phân bố Welch ở mức α = 0.1. Các cấu hình sẽ lần lượt so sánh với các cấu hình khác nên có một sự đối xứng trên đường chéo chính ở các bảng 4.1 và 4.2.
Hình 4.3. Đoạn phim Akiyo độ phân giải CIF, 50kbps
Từ hình 4.2 và 4.4, nhìn chung thì VP8 có chất lượng tốt hơn H.264 trong điều kiện băng thông thấp, độ phân giải thấp và cảnh chuyển động chậm. Thực tế, các đoạn phim đều thể hiện thông số không giống nhau tuy nhiên kết luận đưa ra cũng cho thấy được tính đúng đắn trong đánh giá.
49 Vương Gia Thiết
Hình 4.4. So sánh theo khung hình cho đoạn phim Akiyo độ phân giải CIF, 50kbps Bảng 4.1. Giá trị p đối với cấu hình Fastest và Lowest cho phim Akiyo, 25kbps
H.264 Lowest VP8 Lowest H.264 Fastest VP8 Fastest
H.264 Lowest 2,05390 x 10-62 1,51689 x 10 -29 3,00968 x 10 -21
VP8 Lowest 2,05390 x 10-62 1,03356 x 10-194 1,50411 x 10-183
H.264 Fastest 1,51689 x 10 -29 1,03356 x 10-194 1,65574 x 10-128
VP8 Fastest 3,00968 x 10 -21 1,50411 x 10-183 1,65574 x 10-128
Bảng 4.2. Giá trị p đối với cấu hình Fastest và Lowest cho phim Akiyo, 50kbps
H.264 Lowest VP8 Lowest H.264 Fastest VP8 Fastest
H.264 Lowest 1,47290 x 10-35 1,63758 x 10 -80 5,15901 x 10 -11
VP8 Lowest 1,47290 x 10-35 5,14471x 10-230 6,74000x 10-27
H.264 Fastest 1,51689 x 10 -29 5,14471x 10-230 2,12953x 10-194
VP8 Fastest 3,00968 x 10 -21 6,74000x 10-27 2,12953x 10-194
Đoạn phim Students
Ở đây chúng ta không sử dụng bất kỳ hạn chế gì cho I-frame. Chúng ta sử dụng hai so sánh: một là với I-frame xuất hiện mỗi 300 khung và thứ hai là xuất hiễn mỗi 30 khung.
50 Vương Gia Thiết
Hình 4.5. Đoạn phim Students độ phân giải CIF, 25kbps, khoảng I-frame là 300
Hình 4.5 thể hiện kết quả kiểm thử của đoạn phim Students được mã ở tốc độ bit 25 kbps. Khoảng I-frame được đặt là 300. Trong lần so sánh này, VP8 cũng vẫn thể hiện tốt khả năng của nó, nhưng khi tắt bộ tối ưu méo tốc độ trong cấu hình Fast và Fastest đòi hỏi tốc độ bit cao hơn nhiều. Còn PSNR thì cũng tăng theo tốc độ bit.
Các khung hình của đoạn phim Students được mã ở tốc độ 25 kbps và khoảng I-frame là 300 thể hiện trong hình 4.6. Đường chấm dọc thể hiện vị trí của I-frame. Nhìn chung, VP8 chất lượng tồi đi mỗi khi có I-frame và chất lượng lại được tăng lên đáng kể so với trước trong khi H.264 thì ngược lại. Điều này hoàn toàn đúng với cơ chế của chúng với đặc tính thích nghi theo luồng bit.
Bảng 4.3 liệt kê các giá trị p cho đoạn phim Students ở tốc độ bit 25 kbps và khoảng I-frame 300. Giả thuyết không bị loại bỏ với mức α = 0.1 do không hề có sự khác biệt nào rõ rệt giữa hai khung hình loại trừ H.264 Slowest với VP8 Slowest. Giá trị 0 ở đây chỉ ra rằng phần mềm tính toán ra một con số rất nhỏ và giá trị p
51 Vương Gia Thiết
Hình 4.6. So sánh theo khung hình cho đoạn phim Students độ phân giải CIF, 25kbps, khoảng I-frame là 300
Bây giờ chúng ta sẽ sử dụng đoạn phim Students với mã hóa tốc độ 25 kbps nhưng với Khoảng I-frame là 30 nghĩa là với đoạn phim có tốc độ 30 FPS thì cứ mỗi 1 giây thì có 1 I-frame xuất hiện. Trên thực tế, điều này là bình thường vì trong môi trường băng thông không ổn định thì thời gian khôi phục các khung hình bị mất phải ngắn.
Bảng 4.3. Giá trị p đối với cấu hình Fastest và Lowest cho phim Students, 25kbps, khoảng I-frame là 300
H.264 Lowest VP8 Lowest H.264 Fastest VP8 Fastest
H.264 Lowest 0.95957 1,86571 x 10 -35 5,99763 x 10 -168
VP8 Lowest 0.95957 4,07072 x 10-43 9,04820 x 10-11
H.264 Fastest 1,86571 x 10 -35 4,07072 x 10-43 0
VP8 Fastest 5,99763 x 10 -168 9,04820 x 10-11 0
Hình 4.7 thể hiện thống kê của 6 cấu hình đối với 2 bộ mã. H.264 và VP8 thể hiện khá giống nhau trong cấu hình Slowest nhưng với cấu hình Fast và Fastest thì VP8 đòi hỏi tốc độ bit cao hơn từ 25 kbps lên tới hơn 50 kbps.
52 Vương Gia Thiết
PSNR của từng khung hình được thể hiện trong hình 4.10. Đường VP8 Fastest thường xuyên ở trên các cấu hình khác tuy nhiên băng thông yêu cầu của nó yêu cầu cao gấp đôi như thể hiện trong hình 4.7. Còn VP8 Slowest thì thể hiện sự ổn định đối với giá trị PSNR so với các cấu hình khác.
Hình 4.7. Đoạn phim Students độ phân giải CIF, 25kbps, khoảng I-frame là 30
Bảng 4.4 thể hiện các giá trị p cho đoạn phim Students mã ở tốc độ 25 kbps với khoảng I-frame là 30. Trong từng trường hợp này, giả thuyết 0 đều bị loại bỏ với α = 0.1. Điều này chỉ ra là không có cấu hình nào khác nhau nhiều.
Trong phần này, với tần suất I-frame lớn cho việc đảm bảo khôi phục nhanh khung hình bị lỗi thì VP8 thể hiện chất lượng kém hơn so với H.264. Hơn nữa, trong cấu hình Fastest có tham số --cpu-used=5 thì băng thông yêu cầu tăng lên đáng kể. Mà việc tăng băng thông sẽ dẫn đến tăng số khung ảnh hưởng tới BER của kênh hoặc tỉ lệ khung bị rớt. Để khắc phục điều này, VP8 phải sử dụng bộ tối ưu méo tốc độ nhưng tốc độ xử lý sẽ chậm đi.
53 Vương Gia Thiết
Hình 4.8. So sánh theo khung hình cho đoạn phim Students độ phân giải CIF, 25kbps, khoảng I-frame là 30
Bảng 4.4. Giá trị p đối với cấu hình Fastest và Lowest cho phim Students, 25kbps, khoảng I-frame là 30
H.264 Lowest VP8 Lowest H.264 Fastest VP8 Fastest
H.264 Lowest 4,33874 x 10-09 6,58930 x 10 -71 2,50456 x 10 -133
VP8 Lowest 4,33874 x 10-09 1,05294 x 10-45 1,18135 x 10-11
H.264 Fastest 6,58930 x 10 -71 1,05294 x 10-45 1,08694 x 10-322
VP8 Fastest 2,50456 x 10 -133 1,18135 x 10-11 1,08694 x 10-322
Để đánh giá các kết quả SSIM chúng ta sẽ sử dụng các đoạn phim như trong bảng 3.7 cho độ phân giải 720p và 3.8 cho 1080p.
Trong hình 4.9 là biểu đồ kết quả cho 3 đoạn phim Old Town Cross, Duck Off như đã nói trong phần 3.3.1. Từ viết tắt “DO” đại diện cho “cảnh chi tiết ngoài trời”, “CO” là “cảnh thành phố”, và “Sin” là Sintel - đoạn phim 3D.
54 Vương Gia Thiết
Hình 4.9. SSIM của 3 đoạn phim DO, CO, Sin ở 720p, 3000kbps
Đối với DO, H.264 tốt hơn VP8. Điều này thể hiện rằng VP8 thiếu việc lượng tử hóa thích nghi.
Các giá trị SSIM đối với các khung hình được thể hiện trong hình 4.10, đường thằng đứng thể hiện chuyển đổi giữa các đoạn phim lần lượt trong bảng CO. Đối với đoạn Old Town Cross, cấu hình H.264 High và Baseline tốt hơn VP8 Best.
Đối với đoạn phim Stockholm, cũng như Old Town Cross, SSIM của VP8 bắt đầu thấp do các cảnh vật chi tiết. Tuy nhiên VP8 tăng lên một cách ổn định tới H.264 High và hơn hẳn với H.264 Baseline.
Ở đoạn phim Ducks Take Off, VP8 bắt đầu rất cao do các cảnh vật không được chi tiết hơn. Chất lượng này giảm nhanh chóng khi đoàn vịt bay từ mặt nước. Chất lượng VP8 lúc này nằm giữa H.264 High và H.264 Baseline.
Trong đoạn phim In to Tree, VP8 có chất lượng tăng rất ổn định và vượt qua các cấu hình của H.264.
55 Vương Gia Thiết
Hình 4.10. Khung hình SSIM của đoạn phim CO ở 720p, 3000kbps
Các kết quả cho SSIM trong 3 đoạn phim độ phân giải 1080p được thể hiện trong hình 4.11. Biểu đồ này cũng theo cấu trúc như trong hình 4.9. Điều này có nghĩa là VP8 tốt hơn H.264 Baseline ở tất cả các đoạn phim. Đối với H.264 High thì VP8 ở mức trung bình, tùy theo từng đoạn phim khác nhau. Chữ viết tắt “SF” thay thế cho “đoạn phim thể thao”, “OP” là “đoạn phim cảnh động ngoài trời” và “Sin” vẫn là Sintel – đoạn phim 3D.
Đối với đoạn phim Sintel, VP8 tốt hơn H.264 Baseline không nhiều nhưng cũng gần với H.264 High. Sự khác nhau ở đây được xem như không đáng kể. Còn với đoạn phim thể thao VP8 tốt hơn nhiều so với H.264 Baseline.
Các khung hình trong đoạn phim cảnh động ngoài trời được chi tiết hơn trong hình 4.11. Hình 4.12 thể hiện các giá trị SSIM của H.264 Baseline, High và VP8 Best. Các đường thẳng đứng thể hiện khi một đoạn phim mới bắt đầu cần một độ dịch lớn về mặt chất lượng cho các bộ mã hóa thích nghi nhanh chóng.
56 Vương Gia Thiết
Hình 4.11. SSIM của 3 đoạn phim SF, OP, Sin ở 720p, 5000kbps
Đối với đoạn phim Blue Sky, đoạn phim đầu tiên như đã được nhắc trong bảng 3.8. Cấu hình H.264 High có chất lượng tốt nhất, và cả 3 cấu hình trong