Phân tích, so sánh đánh giá khách quan kết quả ứng dụng

Một phần của tài liệu 28027_171220200199738VoNgocTuanK34LuanVan (Trang 61)

CHƯƠNG 2 CÁC KỸ THUẬT MÃ HÓA VIDEO

3.4. Phân tích, so sánh đánh giá khách quan kết quả ứng dụng

Phân tích và đánh giá chất lượng mã hóa H.265/HEVC nói chung là cơng việc phức tạp vì nó có thể tiến hành nhiều cách khác nhau. Ví dụ như hiệu suất nén, độ phức tạp, chất lượng hình ảnh, ứng dụng của tối ưu hóa tốc độ, độ trễ mã hóa... Trong phần này sẽ trình bày phương pháp đánh giá chất lượng H.265/HEVC so với H.264/AVC một cách khách quan và thể hiện sự vượt trội về hiệu quả nén của H.265/HEVC.

3.4.1. Thiết lập các điều kiện để thực hiện

3.4.1.1. Mơ hình mã hóa

Để đưa ra kết quả phân tích đánh giá khách quan trong so sánh chất lượng mã hóa H.265/HEVC và H.264/AVC, luận văn dựa vào phần mềm mã nguồn mở tham chiếu đã được các tổ chức chuẩn hóa chạy trên nền C++.

Đối với H.265/HEVC phần mềm mã nguồn mở tham chiếu được gọi là HM (HEVC Test Model), được phát triển trên nền tảng C++ mã nguồn mở dùng cho cải tiến và nghiên cứu.

Đối H.264/AVC phần mềm mã nguồn mở tham chiếu được gọi là JM (Joint Test Model). Được phát triển như một nền tảng thử nghiệm thông dụng cho đánh giá mã hóa H.264/AVC, trong phiên bản JM19 đã phát triển cấu hình gọi là “HM-Like” để thống nhất trong việc so sánh mã hóa với phần mềm HM. Trong chương này, để phục vụ cho việc so sánh và đánh giá, các phiên bản phần mềm mã nguồn mở mới nhất của H.265/HEVC và H.264/AVC là HM 16.7 và JM 19 được sử dụng.

Các thơng số cấu hình cho H.264/AVC và H.265/HEVC được chọn chi tiết thơng qua bảng dưới đây.

Bảng 3.4. Thiết lâp cấu hình hai bộ mã hóa tham chiếu HM 16.7 và JM 19

Codec H.264/AVC H.265/HEVC

Encoder JM 19 HM16.7

Profile High Main High Main

Level 5.1 5.1

Reference Frames 4 4

Motion Estimation EPZS TZ

Entropy encode CABAC CABAC

Search Range 128 128 Group of Pictures 8 8 Hierarchical Encoding On On Temporal Levels 4 4 Intra Period 1s 1s Deblocking Filter On On 8x8 Transform On -

Coding Unit size / depth - 64 / 4

Transform Unit size min / max - 4 / 32

Rate Control OFF OFF

Internal Bit Depth 8 8

3.4.1.2. Cấu trúc dự đoán

Để đánh giá và so sánh chất lượng mã hóa ta dựa vào các cấu trúc dự đoán sau. (1) All Intra (AI).

(2). Low Delay P picture (LDP). (3). Low Delay B picture (LDB). (4). Random Access (RA).

Trong các cấu hình này, giá trị QP (Thơng số lượng tử hóa) có thể được điều chỉnh bởi thêm giá trị “QP Offset”. Có nghĩa là điều kiện thử nghiệm chung định nghĩa ảnh đầu tiên (QP của ảnh I là QPI) và QP của ảnh tiếp theo được xuất phát từ:

QP = QPI +QPoffset.

với QP offset được xác định qua kiểu ảnh P, hay ảnh.

Hình ảnh I đề cập đến hình ảnh có thể được giải mã độc lập mà khơng u cầu dữ liệu dự đốn từ các ảnh đã giải mã khác. Thơng thường, hình ảnh P (predicted) u cầu dữ liệu mẫu hình ảnh từ một ảnh I, P hoặc B khác để tạo ra từng khối mẫu dự đoán. Một ảnh B (bi-predicted), yêu cầu dữ liệu mẫu hình ảnh từ hai hình I, P hoặc B khác để tạo ra từng khối mẫu dự đốn.

All Intra (AI)

Trong cấu hình này, mỗi ảnh được mã hóa dưới dạng ảnh I, bởi vì khơng sử dụng dự đốn Inter, nên nó thích hợp cho các ứng dụng trễ thấp và tốc độ bitrate cao. QP

offset trong trường hợp này nên cấu hình là giá trị 0 vì QP được giữ khơng đổi trong tồn bộ chuỗi, hình 3.4 cho thấy một ví dụ về dự đốn này.

Hình 3.4. Cấu trúc dự đốn chỉ có ảnh I Random Access (RA)

Trong cấu hình này, một cấu trúc ảnh B được sử dụng. Hình 3.5 là ví dụ của cấu trúc dự đốn này. Hiệu suất mà hóa của cấu trúc dự đốn này cao hơn các cấu hình AI, vì có dự đốn trong ảnh và liên ảnh.

Tuy nhiên nó lại có độ trễ lớn hơn, là do sự xắp xếp lại các hình ảnh. Có thể kiểm sốt được lỗi lan truyền và dễ dàng truy cập ngẫu nhiên, ảnh I được chèn vào theo chu kỳ. Giá trị QP offset cho mỗi ảnh được tổng hợp trong hình 3.5.

Hình 3.5. Cấu trúc dự đốn Random Access Low-Delay P (LDP)

Trong cấu hình này, ảnh đầu tiên được mã hóa ảnh I và các ảnh tiếp theo được mã hóa theo ảnh P. Do khơng có sự xếp đặt lại các hình ảnh và chỉ sử dụng dự đốn từ các ảnh q khứ, độ trễ mã hóa trong cấu hình này có thể là nhỏ. Hình 3.6 biểu diễn cấu hình mã hóa này. Giá trị QP offset được tổng hợp như sau:

Hình 3.6. Cấu trúc dự đốn Low-delay P và Low-delay B Low-Delay B (LDB)

Trong cấu hình này, tương tự như cấu hình trước (low-delay P), khơng cho phép sắp xếp lại hình ảnh. Ảnh đầu tiên được mã hóa dưới dạng ảnh I và các ảnh tiếp theo được mã hóa theo ảnh B. hơn nữa vì ảnh q khứ B được sử dụng cho dự đốn, một trễ mã hóa thấp, tương tự như LDP nhưng có hiệu suất mã hóa cao hơn do có dự đốn bi- prediction.

3.4.1.3. Chuỗi video và quy trình đánh giá

Chuỗi video đánh giá

Các chuỗi video kiểm tra được định nghĩa theo kích thước ảnh và ứng dụng. Chúng được phân thành 4 loại video:

- Video loại A dành cho đánh giá chất lượng mã hóa của HDTV 1080p và tập hợp các chuỗi HDTV với kích thước ảnh 1.920x1080 pixel.

- Video loại B có kích thước hình ảnh 1280x720 pixel, được sử dụng để đánh giá chất lượng mã hóa các ứng dụng yêu cầu độ trễ thấp như truyền thông trực quan.

- Video loại C là chuỗi kiểm tra có kích thước ảnh tương ứng là 352x288 pixel. Các trình tự kiểm tra trong loại này để đánh giá chất lượng của các ứng dụng di động. Đặc điểm video này có chi tiết khơng gian thấp và chi tiết chuyển động thấp.

- Video loại D là tập hợp các chuỗi kiểm tra có kích thước ảnh tương ứng là 352x288 pixel. Các trình tự kiểm tra trong loại C và D đánh giá chất lượng của các ứng dụng di động. Đặc điểm video này có chi tiết khơng gian trung bình và chi tiết chuyển động cao hơn loại C.

Các trình tự được liệt kê như sau:

Bảng 3.5. Chuỗi video tham chiếu kiểm tra [25]

Phân

Loại Tên Video

Tỷ lệ khung hình Số khung Tốc độ khung Tỷ lệ lấy mẫu Số bit mẫu A crowd run_yuv 1920x1080 200 50 4:2:0 8 B ducks_take_off 1280x720 200 50 4:2:0 8 C akiyo_yuv 352x288 300 50 4:2:0 8 D news_yuv 352x288 300 50 4:2:0 8

Quy trình đánh giá

Trình tự thực hiện chạy mã hóa trên phần mềm HM 16.7 và JM 19.0 đối với từng loại video, bằng cách thay đổi các giá trị thông số lượng tử hóa QP để thu được các giá trị PSNR và Bitrate từng loại video được mã hóa và mỗi video được được thực hiện trên 4 cấu trúc dự đoán theo các kiểm tra như sau:

 TEST 1: All Intra (AI).

 TEST 2: Low-Delay P (LDP).  TEST 3: Low-Delay B (LDB).  TEST 4: Random Access (RA).

Việc phân tích kết quả dựa trên giá trị PSNR_YUV cho mỗi video và bitrate được tính trung bình cho tất cả các khung. Và giá trị PSNR_YUV được tính như sau [18].

(3.4)

Để trực quan trong việc so sánh, sử dụng phép nội suy để tính tốn và vẽ đồ thị PSNR_YUV và bitrate.

Ngoài ra dựa trên kết quả thu được sau mã hóa video, tiến hành đánh giá trị tiết kiệm bitrate (BitSaving) của mã hóa H.265/HEVC so với H.264/AVC, và được tính như sau [19].

(3.5)

3.4.2. Phân tích kết quả đánh giá khách quan

Để đưa ra kết quả phân tích đánh giá khách quan trong so sánh chất lượng mã hóa H.265/HEVC và H.264/AVC, luận văn dựa vào phần mềm mã nguồn mở tham chiếu đã được các tổ chức chuẩn hóa chạy trên nền C++.

Đối với H.265/HEVC phần mềm mã nguồn mở tham chiếu được gọi là HM (HEVC Test Model), được phát triển trên nền tảng C++ mã nguồn mở dùng cho cải tiến và nghiên cứu.

Đối H.264/AVC phần mềm mã nguồn mở tham chiếu được gọi là JM (Joint Test Model). Được phát triển như một nền tảng thử nghiệm thơng dụng cho đánh giá mã hóa H.264/AVC, trong phiên bản JM19 đã phát triển cấu hình gọi là “HM-Like” để thống nhất trong việc so sánh mã hóa với phần mềm HM. Phiên bản phần mềm mã nguồn mở mới nhất của H.265/HEVC và H.264/AVC là HM 16.7 và JM 19 được sử dụng.

3.4.2.1. Mã hóa All Intra (AI-TEST 1)

Trong kết quả kiểu dự đoán AI, các đoạn video được mã hóa trong hai chuẩn H.264 và H.265 chỉ sử dụng chế độ dự đoán trong ảnh (Intra), các ảnh I mã hóa độc lập nhau, lần lượt mã hóa cho các video loại B (720p), loại C (352x288), loại D (352x288). Các giá trị QP thay đổi từ 24, 26, 28, 30, 32 để thu được các đoạn video có giá trị PSNR_YUV và các giá trị bitrate khách nhau thể hiện trên hình 3.7. Giá trị chi tiết thể hiện ở phụ lục D.

Hình 3.7. Kết quả mã hóa AI

Các đồ thị ở bên phải hình 3.7 cho ta thấy, tại cùng một giá trị bitrate được mã hóa nhưng chất lượng mã hóa của H.265 tốt hơn so với mã hóa H.264.

Các đồ thị ở phía trái hình 3.7 thể hiện tại các giá trị khác nhau của QP ta có được các đoạn video có chất lượng PSNR_YUV tương đương nhau ( Phần PSNR trong mã hóa H.265 có phần lớn hơn).

Ba hàng trên hình 3.7 tương ứng với mã hóa video loại B, loại C và loại D. Nhưng điều quan trọng là tại các giá trị QP như nhau (cùng chất lượng hình ảnh) thì khả năng nén của H.265/HEVC như thế nào.

Xem xét bảng chi tiết kết quả mã hóa video loại B (720p), cùng chất lượng mã hóa AI (cùng QP) thì mã hóa H.265 trung bình tiết kiệm được 21,69% lượng bit so với H.264.

Bảng 3.6. Bảng kết quả mã hóa AI video loại B

QP

H.265/HEVC H.264/AVC Tiết kiệm bit

H.265 so với H264 (%) YUV_PSNR (dB) Tốc độ bit (Mbp/s) YUV_PSNR (dB) Tốc độ bit (Mbp/s) 24 39.38 61.16 39.41 75.23 -23.01 26 38.10 48.03 38.01 59.21 -23.29 28 36.99 38.46 36.84 47.81 -24.31 30 36.00 31.65 35.72 38.49 -21.62 32 34.85 25,01 34.52 30.27 -21.06 36 32.71 15.84 32.33 18.51 -16.85

Xu hướng kết quả của mã hóa đối với video loại C và loại D cũng tương tự như loại B (thể hiện trên hình 3.7), nhưng do mức độ chuyển động, kết cấu của từng loại ảnh khác nhau nên giá trị tiết kiệm bitrate sẽ khác nhau. Tiết kiệm bit của H.265/HEVC so với H.264/AVC đối với loại C đạt 22,19% và loại D đạt 20,58%.

Kết luận trường hợp mã hóa AI.

Trong trường hợp của All Intra Main các video được mã hóa theo các ảnh I độc lập với nhau nên sự cải thiện về bitrate mã hóa H.265/HEVC đã cải thiện được 21,45% lượng bit tiết kiệm so với H.264/AVC. Đồng thời, H.265/HEVC sẽ cho chất lượng ảnh tốt hơn so với H264/AVC ở cùng một tốc độ bit.

3.4.2.2. Mã hóa Low delay P (LDP- TEST 2)

Trong trường hợp này, các khung ảnh được mã hóa dựa vào ảnh trước đó, ảnh được mã hóa bắt đầu với ảnh I sau đó là các ảnh P, chỉ dự đốn một chiều và có sự dự đoán trong ảnh và liên ảnh trong trường hợp này.

Kết quả mã hóa tại các giá trị QP khác nhau, theo thứ tự Loại A, loại B, loại C, loại D tương ứng với 4 hàng của hình 3.8.

Các đồ thị bên phải hình 3.8 cho ta thấy, tại cùng một giá trị bitrate được mã hóa nhưng chất lượng mã hóa của H.265 vượt trội so với mã hóa H.264

Các đồ thị bên trái hình 3.8, trong trường hợp này thể hiện cùng một giá trị QP ta thu được giá trị PSNR_YUV của mã hóa H.264/AVC lớn hơn mã hóa H.265/HEVC. Nhưng trong các trường hợp này các giá trị PSNR_YUV đều lớn hơn 30dB và khoảng sai khác không nhiều nên chất lượng video mã hóa khó mã phân biệt được bằng mắt người. Như vậy trong trường hợp này có thể xem chất lượng gần tương đương nhau tại cùng một giá trị QP. Nhưng điều quan trọng là tại các giá trị QP như nhau (cùng chất lượng hình ảnh) thì khả năng nén của H.265/HEVC như thế nào.

Xem xét kết quả mã hóa video loại A, thể hiện bảng sau:

Bảng 3.7. Bảng kết quả mã hóa LDP video loại A

QP

H.265/HEVC H.264/AVC

Tiết kiệm bitrate H.265 so với H.264 (%) PSNR_YUV (dB) Tốc độ bit (Mbp/s) PSNR_YUV (dB) Tốc độ bit Bitrate (Mbp/s) 30 34,72 15,28 37,48 24,81 -62,35 32 33,38 11,55 36,09 19,26 -66,73 34 32,18 8,81 34,77 14,89 -68,87 36 31,03 6,66 33,46 11,39 -71,02

Trong bảng 3.11 thể hiện, chất lượng tương đương nhau, cùng giá trị QP trong mã hóa LDP thì mã hóa H.265 trung bình tiết kiệm được 67,24% lượng bit so với H.264.

Xu hướng kết quả của mã hóa đối với các loại video loại B, loại C, loại D cũng tương đương với loại A (thể hiện hình 3.8). Nhưng do mức độ chuyển động, kết cấu từng loại ảnh khác nhau nên có những giá trị tiết kiệm bit khác nhau, mặt khác trong trường hợp này sử dụng dự đoán liên ảnh (inter) và trong ảnh (intra) nên kết quả tiết kiệm bit trung bình vượt trội so với mã hóa AI và kết quả là: loại B đạt -108,03%, loại C đạt -65,42%, loại D đạt -55,10%

Kết luận trong trường hợp mã hóa LDP

Trong trường hợp mã hóa các ảnh P, có sự dự đốn liên ảnh từ các ảnh trước đó, hiệu quả trong trường hợp này cao hơn trường hợp dự đốn AI. Trung bình lượng tiết kiệm bit trong mã hóa H.265/HEVC đạt 73,94% so với mã hóa H.264/AVC. Đồng thời, H.265/HEVC sẽ cho chất lượng ảnh tốt hơn so với H264/AVC ở cùng một tốc độ bitrate.

3.4.2.3. Mã hóa Low delay B (LDB- TEST 3)

Trong trường hợp này, ảnh đầu tiên được mã hóa theo ảnh I, ảnh tiếp theo được mã hóa theo ảnh B, là kiểu dự đốn hai chiều và kết quả mã hóa thể hiện ở hình 3.9 theo thứ tự loại A, loại B, loại C, loại D, tương với 4 hàng trong hình.

Phần bên phải hình 3.9 thể hiện cùng giá trị bitrate được mã hóa, chất lượng mã hóa H.265 tốt hơn H.264.

Phần bên trái hình 3.9 thể hiện tại các giá trị QP tương ứng với các giá trị PSNR_YUV. Trong trường hợp này giá trị PSNR_YUV trong mã hóa H.264 lớn hơn H.265, tuy nhiên sự chênh lêch PSNR_YUV nhỏ và các giá trị đều lớn hơn 30dB, vì vậy khả năng mắt người khó có thể phân biệt được, nên có thể xem chất lượng là tương đương nhau tại các giá trị QP được mã hóa. Điều quan trọng là tại các giá trị QP thì tốc độ bitrate đạt bao nhiêu trong hai chuẩn mã hóa.

Xét kết quả mã hóa loại A, thể hiện ở bảng 3.12 sau.

Bảng 3.8. Bảng kết quả mã hóa LDB video loại A (1080p)

QP

H.265/HEVC H.264/AVC Tiết kiệm bit

H.265 so với H.264 (%) PSNR_YUV (dB) Bitrate (Mbp/s) PSNR_YUV (dB) Bitrate (Mbp/s) 30 34,72 15,28 36,37 19,97 -30,65 32 33,38 11,55 34,92 15,21 -31,67 34 32,18 8,81 33,59 11,60 -31,65 36 31,03 6,66 32,30 8,79 -32,03

Trong bảng 3.12 thể hiện, chất lượng tương đương nhau, cùng giá trị QP trong mã hóa LDB thì mã hóa H.265 trung bình tiết kiệm được 31,5% lượng bit so với H.264.

Xu hướng kết quả đạt được tương tự như trường hợp mã hóa video loại A, giá trị tiết kiệm bit trung bình đạt -52,18% với loại B, -170,69% với loại C và -120,77% đối với loại D.

Kết luận trong mã hóa LDB.

Trong kiểu mã hóa này, được dự đốn hai chiều của ảnh B, hiệu suất bitrate đạt được trong trường hợp này cao hơn với trường hợp mã hóa LDP, lượng tiết kiệm bit trung bình của H.265 so với H.264 đạt -93,78 %.

3.4.2.4. Mã hóa Random Access (RA- TEST 4)

Trong trường hợp này có đầy đủ các loại dự đốn trong ảnh và liên ảnh, các ảnh I được chèn vào theo chu kỳ.

Kết quả đạt được cũng tương tự với các kết quả mã hóa AI, LDP, LDB là cùng giá trị QP thì chất lượng video tương đương nhau. Cùng giá trị bitrate thì chất lượng

Một phần của tài liệu 28027_171220200199738VoNgocTuanK34LuanVan (Trang 61)

Tải bản đầy đủ (PDF)

(110 trang)