Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 16 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
16
Dung lượng
148 KB
Nội dung
HỌC VIỆN CƠNG NGHỆ BƯU CHÍNH VIỄN THƠNG - Trần Thanh Phong NGHIÊN CỨU VÀ ĐÁNH GIÁ CHUẨN MÃ HÓA VIDEO AV1 Chuyên ngành: Kỹ thuật Viễn thông Mã số: 8.52.02.08 TÓM TẮT ĐỀ ÁN TỐT NGHIỆP THẠC SĨ HÀ NỘI – NĂM 2023 Đề án tốt nghiệp hoàn thành tại: HỌC VIỆN CƠNG NGHỆ BƯU CHÍNH VIỄN THƠNG Người hướng dẫn khoa học: TS Nguyễn Thị Thu Hiên Phản biện 1: PGS.TS Đặng Thế Ngọc Phản biện 2: TS Dư Đình Viên Đề án tốt nghiệp bảo vệ trước Hội đồng chấm đề án tốt nghiệp thạc sĩ Học viện Cơng nghệ Bưu Viễn thơng Vào lúc: 10 15 phút ngày 29 tháng năm 2023 MỞ ĐẦU Internet trở thành khía cạnh quan trọng xã hội, cung cấp nhiều dịch vụ khác giúp đơn giản hóa sống người Hai số tính mà internet cung cấp dễ dàng truy cập chia sẻ nội dung đa phương tiện phong phú Video chất lượng cao mong muốn điều thường tăng chi phí băng thơng internet lưu trữ Điều thúc đẩy nhu cầu chuẩn nén video với hiệu nén tốt đồng thời giảm tiêu thụ băng thơng mạng Vì tầm quan trọng việc triển khai chuẩn nén video cần thiết Từ AV1 cho đời nhằm đáp ứng nhu cầu AV1 định dạng nén video mã nguồn mở hệ mới, dự định mã hóa kế thừa VP9 Google đối thủ tiêu chuẩn HEVC Bộ mã hóa miễn phí quyền phát triển Alliance for Open Media Nhóm thành lập để xử lý với thách thức mà tiêu chuẩn mã hóa video cũ đối mặt AV1 cho tiết kiệm băng thông khoảng 30% so với VP9 HEVC, đồng thời cải thiện đáng kể chất lượng hình ảnh tốc độ bit tương đương Một số tên tuổi lớn giới công nghệ bao gồm Microsoft, Cisco, Google, Amazon chí Netflix gần bắt đầu áp dụng chuẩn mã hóa AV1 để cách mạng hóa dịch vụ video trực tuyến Nhận thấy tính thiết thực đề tài, học viên xin chọn hướng nghiên cứu “Nghiên cứu và đánh giá chuẩn mã hóa video AV1” làm đề án tốt nghiệp Nội dung nghiên cứu đề án tốt nghiệp bao gồm cấu trúc chương sau: CHƯƠNG 1: TỔNG QUAN VỀ MÃ HÓA VIDEO CHƯƠNG 2: CHUẨN MÃ HÓA VIDEO AV1 CHƯƠNG 3: ĐÁNH GIÁ CHẤT LƯỢNG MÃ HÓA VIDEO CHUẨN AV1 SO VỚI CHUẨN HEVC 2 CHƯƠNG 1: TỔNG QUAN VỀ MÃ HÓA VIDEO 1.1 Giới thiệu mã hóa video Trong thập kỷ qua, ứng dụng video dựa web trở nên phổ biến, với thiết bị đại sở hạ tầng mạng thúc đẩy tăng trưởng nhanh chóng việc tiêu thụ nội dung có độ phân giải cao, chất lượng cao Do đó, người sử dụng băng thông chiếm ưu video theo yêu cầu (VoD), phát trực tiếp video đàm thoại, với ứng dụng lên bao gồm thực tế ảo trò chơi đám mây, vốn phụ thuộc nhiều vào độ phân giải cao độ trễ thấp Điều đặt thách thức với sở hạ tầng truyền dẫn tạo nhu cầu mạnh mẽ công nghệ nén video hiệu cao Mã hóa video lĩnh vực nghiên cứu quan trọng gần thúc đẩy nhu cầu ngày tăng video kỹ thuật số Ultra-High Defnition (UHD) ứng dụng truyền hình kỹ thuật số, video trực tiếp hội nghị truyền hình Video kỹ thuật số khơng nén yêu cầu số lượng lớn số lượng bit truyền qua Internet Do để tiết kiệm khơng gian lưu trữ truyền băng thông kênh truyền hạn chế ln cần phải mã hóa tín hiệu video Ngun lý việc mã hóa video dựa kỹ thuật giảm dư thừa thông tin sau: - Dư thừa thông tin miền không gian - Dư thừa thông tin miền thời gian - Dư thừa thông tin liệu ảnh sau mã hóa Ưu điểm việc nén video là: 1.2 - Tiết kiệm băng thông kênh truyền (trong thời gian thực nhanh hơn) - Kéo dài thời gian sử dụng thiết bị lưu trữ, giảm chi phí đầu tư thiết bị lưu trữ - Giảm dung lượng thơng tin mà khơng làm tính trung thực hình ảnh Các phương pháp mã hóa video 1.2.1 Phân loại kỹ thuật nén video Nén video phân thành hai loại, nén khơng tổn hao nén có tổn hao 1.2.2 Phương pháp mã hóa video dự đốn Mã hóa video dự đốn có bước phát triển mạnh mẽ vài năm trở lại đây, nhiều thuật tốn mã hóa khác đề xuất cải tiến Sự phát triển chuẩn nén quốc tế thúc đẩy cải tiến ứng dụng mã hóa video Các chuẩn nén video dự đốn bao gồm MPEG-1, MPEG-2, MPEG-4, H.261, H.263, H.264 / MPEG-4 AVC tiêu chuẩn mã hóa video hiệu suất cao HEVC 1.2.3 Phương pháp mã hóa video phân tán Mã hóa video phân tán phát triển theo hai cách tiếp cận Cách tiếp cận đầu tiên, đề xuất nhóm nghiên cứu trường Đại học Stanford, theo hướng mã hóa tồn khung hình, cách tiếp cận thứ hai theo phương pháp mã hóa khối 1.2.4 Sơ đờ tởng qt của mã hóa video 1.3 Các chuẩn mã hóa video phở biến 1.3.1 Chuẩn H.264/AVC H.264/MPEG-4 Part 10 hay gọi AVC (Mã hóa video cải tiến) giới thiệu lần vào năm 2003, nhanh chóng trở thành tiêu chuẩn nén video phổ biến để ghi, nén truyền phát hình ảnh, mang đến chất lượng hiển thị cao với khả tiết kiệm băng thông nửa so với MPEG-2 trước Chuẩn H.264 đời hợp tác phát triển tổ chức ITU-T ISO/IEC 1.3.2 Chuẩn H.265/HEVC Vào tháng năm 2013, thông số kỹ thuật cho codec hệ tiếp theo, H.265, cịn gọi Mã hóa video hiệu cao (HEVC), hoàn thiện Trong thử nghiệm sử dụng video Full HD, tốc độ bit giảm 36% so với AVC PSNR Trong thử nghiệm trực quan, khác biệt lên tới 70% 1.3.3 Chuẩn mã hóa VP9 Sự phát triển internet đặt yêu cầu cho việc phân phối video Khi nhu cầu tăng lên, giải pháp thay ngày hiệu yêu cầu Với ý nghĩ đó, Google bắt đầu dự án WebM vào năm 2010, định dạng phương tiện mở tạo cho nội dung trực tuyến dựa VP8 cho video Vorbis cho âm 1.4 Kết luận chương Chương đề án trình bày sở lý thuyết nén video, nguyên lý mã hóa video nói chung, sơ đồ chức khối chuẩn mã hóa video số tiêu chuẩn mã hóa video phổ biến H.264, H.265, VP9 Ngoài dựa kỹ thuật giới thiệu chuẩn mã hóa thấy tiến hóa, nâng cấp chuẩn mã hóa sau đáp ứng cầu ngày khắt khe cơng nghệ mã hóa video 4 CHƯƠNG 2: CHUẨN MÃ HÓA VIDEO AV1 2.1 Những điểm nởi bật thiết kế và tính của mã hóa AV1 2.1.1 Phân vùng khới Trong AV1, khung hình video phân vùng thành siêu khối (SB) có kích thước 128×128 64×64 điểm ảnh Kích thước tối đa đơn vị mã hóa (CTU) tăng lên 128x128 lớn so với kích thước tối đa HEVC 64x64 2.1.2 Dự đốn nợi ảnh AV1 hỗ trợ 56 cơng cụ dự đốn hướng khác để khám phá dư thừa không gian kết cấu hướng Trong HEVC sử dụng 33 chế độ định hướng khác để dự đoán nội AV1 hỗ trợ nhiều dự đốn khơng định hướng như: dự đoán DC, dự đoán Paeth, dự đoán Mịn, Mịn Dọc, Mịn Ngang, dự đoán lọc dựa đệ quy (RBF), Chromafrom luma (CFL) Ngồi cịn có hai chế độ đặc biệt hiệu chế độ Sao chép khối nội ảnh chế độ bảng màu 2.1.3 Dự đoán liên ảnh AV1 sử dụng dự đoán kết hợp nâng cao bù chuyển động cong vênh, bù chuyển động khối chồng lấp (OBMC), tham chiếu vecto chuyển động không gian thời gian động Dự đoán liên khung AV1 mở rộng số lượng khung tham chiếu lên đến Các khung tham chiếu có sẵn là: - Khung Quá khứ, Khung Quá khứ 2, Khung Quá khứ 3: Khung khứ lân cận; - Khung Vàng: Khung khứ, tham chiếu nhiều lần q trình mã hóa; - Khung ALTREF: Khung tham chiếu tương lai xây dựng thông qua lọc; - Khung ALTREF 2: Khung tham chiếu tương lai lọc trung gian Khung Vàng Khung ALTREF; - Khung BWDREF: Khung tham chiếu tương lai có mà không cần áp dụng lọc 2.1.4 Bộ lọc vòng AV1 bao gồm ba lọc vòng lọc bỏ khối, lọc tăng cường định hướng ràng buộc (CDEF) lọc khơi phục vịng lặp (LRF) 5 2.1.5 Biến đởi mã hóa AV1 cách biến đổi phức tạp sử dụng, hỗ trợ bốn chế độ: DCT (Biến đổi Cosine rời rạc), ADST (Biến đổi hình sin rời rạc khơng đối xứng), fipADST IDTX (Biến đổi nhận dạng) 2.1.6 Mã hóa entropy Mã hóa entropy AV1 dựa mã hóa số học đa ký hiệu thích ứng ký hiệu với ký hiệu mã hóa hệ số đồ mức 2.2 Cú pháp mức cao Ở cấp độ cao hơn, cấu trúc AV1 đóng gói Đơn vị dịng bit mở (OBU) tương tự NAL thơng số kỹ thuật AVC HEVC Mỗi OBU có tiêu đề, cung cấp thông tin xác định tải trọng Ví dụ loại OBU có luồng bit video AV1 OBU tiêu đề trình tự, OBU tiêu đề khung, OBU siêu liệu, OBU dấu phân tách tạm thời OBU nhóm gạch Trong OBU bao gồm chuỗi byte có độ dài thay đổi Một OBU chứa tiêu đề tải trọng Tiêu đề xác định loại OBU định kích thước tải trọng 2.3 Các kỹ thuật mã hóa video 2.3.1 Phân vùng khới mã hóa Một siêu khối phân vùng đệ quy thành kích thước khối nhỏ để mã hóa AV1 kế thừa thiết kế phân vùng khối đệ quy sử dụng VP9 Để giảm chi phí chung cho việc mã hóa chế độ dự đốn cho tín hiệu video có tính tương quan cao, tình thường thấy video 4K, AV1 hỗ trợ kích thước khối mã hóa tối đa 128×128 mẫu độ sáng Các tùy chọn phân vùng phép cấp độ khối bao gồm 10 khả AV1 cho phép loại phân vùng khối sau: – Không chia: khối không bị chia, giữ nguyên tỷ lệ 1:1 kích thước bình phương tại; – Ngang Thẳng đứng: khối chia thành hai phần với tỷ lệ 1:2 2:1; – Ngang A, Ngang B, Thẳng đứng A, Thẳng đứng B: khối chia thành ba phần, bao gồm hai khối bậc hai khối hình chữ nhật; – Thẳng đứng 4, Ngang 4: khối chia thành bốn phần với tỷ lệ 1:4 4:1, – Phân tách: nút cụ thể phân vùng, nút tạo đệ quy bốn có kích thước nửa kích thước nút Loại phân vùng không áp dụng cho kích thước nút × 2.3.2 Dự đốn nợi ảnh 2.3.2.1 Dự đốn nợi ảnh có hướng Dự đốn nội ảnh có hướng AV1 bao gồm ba bước: (i) lọc mảng tham chiếu, (ii) lấy mẫu mảng tham chiếu (iii) dự đoán khối AV1 mở rộng tùy chọn dự đốn nội ảnh có hướng dựa VP9 để hỗ trợ mức độ chi tiết cao Tám chế độ định hướng ban đầu VP9 sử dụng làm sở AV1, với tín hiệu bổ sung để tinh chỉnh góc dự đốn Q trình bao gồm tối đa ba bước theo chiều kim đồng hồ ngược chiều kim đồng hồ, bước cho phép tín hiệu bổ sung để điều chỉnh góc dự đốn 2.3.2.2 Dự đốn nợi ảnh khơng định hướng Ngồi chế độ Dự đốn nội ảnh có hướng, có năm chế độ Dự đốn nội ảnh khơng định hướng Dự đốn DC, Dự đoán Mịn, Dự đoán Mịn Ngang, Dự đoán Mịn Đứng Dự đoán PEATH, thường sử dụng để dự đốn vùng mịn VP9 có hai chế độ dự đốn bên khơng định hướng: Dự đốn DC Dự đoán TM AV1 mở rộng điều cách thêm ba chế độ dự đoán mới: Dự đoán Mịn, Dự đoán Mịn Đứng Dự đoán Mịn Ngang Ngồi ra, chế độ dự đốn thứ tư Dự đốn PAETH thay chế độ có Dự đốn TM 2.3.2.3 Dự đốn nợi ảnh dự bộ lọc đệ quy AV1 áp dụng chế độ để nội suy (bộ lọc bên trong) mẫu tham chiếu trước dự đoán Điều làm giảm tác động nhiễu lượng tử hóa Năm chế độ dự đoán nội ảnh đệ quy xác định AV1 Mỗi chế độ định tám lọc chạm 2.3.2.4 Dự đoán CfL Dự đoán Chroma từ Luma (gọi tắt CfL) kỹ thuật dự đoán AV1 áp dụng Đúng tên gọi, dự đốn màu sắc ảnh (sắc độ) dựa giá trị độ sáng (độ sáng) Các giá trị độ sáng mã hóa giải mã trước, sau CfL đưa dự đốn học màu sắc Khi dự đoán tốt, điều làm giảm lượng thơng tin màu mã hóa, tiết kiệm không gian 2.3.2.5 Bảng màu Chế độ bảng màu áp dụng khối mã hóa nội chế độ dự đốn DC Chế độ bảng màu áp dụng cho khối độ sáng khối sắc độ áp dụng kích thước khối lớn 8×8 chiều rộng chiều cao nhỏ 64 2.3.2.6 Sao chép khối nợi ảnh AV1 cho phép mã hóa bên tham chiếu trở lại khối cấu trúc lại trước khung, theo cách tương tự cách mã hóa liên kết tham chiếu đến khối từ khung trước Nó hữu ích cho video có nội dung hình thường chứa kết cấu, mẫu ký tự lặp lại khung 2.3.3 Dự đoán liên ảnh 2.3.3.1 Các khung tham chiếu mở rợng AV1 sử dụng tối đa bảy khung tham chiếu Ngồi khung có VP9 Khung Quá khứ (quá khứ gần nhất), khung Vàng (quá khứ xa) khung ALTREF (tương lai lọc theo thời gian), có thêm hai khung gần khứ (Khung Quá khứ 2, Quá khứ 3) hai khung tương lai (BWDREF ALTREF2) 2.3.3.2 Dự đoán véc tơ chuyển đợng khơng gian Các dự đốn véc tơ chuyển động khơng gian xác định cách sử dụng khối lân cận không gian, bao gồm khối lân cận không gian liền kề (lân cận trực tiếp khối phía bên trái) khối không liền kề khối lân cận không gian (gần không liền kề với khối tại) 2.3.3.3 Dự đoán véc tơ chuyển đợng thời gian Ngồi khối lân cận khơng gian, dự đoán MV gọi dự đốn MV theo thời gian bắt nguồn cách sử dụng khối hình ảnh tham chiếu xếp theo thứ tự 2.3.3.4 Dự đốn đợng MV Các dự đốn động MV dự đốn khối lân cận khơng gian khung khối lân cận thời gian khung tham chiếu 2.3.3.5 Bù chuyển động tịnh tiến Các mơ hình chuyển động tịnh tiến giả định tất điểm ảnh khối mã hóa có chung MV, MV biểu diễn với độ xác 1/8 điểm ảnh Bộ lọc nội suy chuyển đổi theo hướng ngang dọc khối mã hóa Mỗi hướng chọn từ ba lọc đáp ứng xung hữu hạn Mịn, Thường, Sắc theo thứ tự tăng dần tần số cắt 2.3.3.6 Bù chuyển động cong vênh Không giống bù chuyển động thông thường, mơ hình chuyển động tịnh tiến khối tham chiếu khối mục tiêu, chuyển động cong vênh sử dụng mơ hình affine 2.3.3.7 Bù chuyển đợng khối chờng lên (OMBC) OMBC khai thác thông tin chuyển động lân cận không gian để cải thiện chất lượng dự đoán cho điểm ảnh gần ranh giới bên trái Đầu tiên, quét qua lân cận phía tìm tối đa bốn khối tham chiếu có khung tham chiếu với khối 2.3.3.8 Dự đốn kết hợp liên ảnh-nợi ảnh Chế độ kết hợp dự đoán nội ảnh dự đoán tịnh tiến liên ảnh Khối dự đoán mội ảnh tạo cách sử dụng chế độ dự đoán Dự đoán DC, Dự đoán Thẳng đứng, Dự đoán Ngang Dự đoán Mịn SMOOTH khối dự đoán liên ảnh tạo cách sử dụng dự đoán liên ảnh đơn với chuyển động tịnh tiến 2.3.4 Biến đởi mã hóa 2.3.4.1 Biến đởi kích thước khối AV1 mở rộng kích thước khối biến đổi tối đa lên 64x64 Kích thước khối biến đổi tối thiểu 4x4, kích thước khối biến đổi hình chữ nhật N × N/2, N/2 × N, N × N/4 N/4 × N 2.3.4.2 Các loại biến đởi Các biến đổi sơ cấp bao gồm bốn loại biến đổi khác DCT, ADST, Flip ADST, IDTX dẫn đến tổng cộng 16 biến đổi 2-D 2.3.5 Lượng tử hóa Các hệ số biến đổi lượng tử hóa số lượng tử hóa mã hóa entropy Tham số lượng tử hóa (QP) AV1 nằm khoảng từ đến 255 Tại QP định, kích thước bước lượng tử hóa cho hệ số DC nhỏ kích thước cho hệ số AC Ánh xạ từ QP tới kích thước bước lượng tử cho hệ số DC AC 9 2.3.6 Mã hóa Entropy 2.3.6.1 Mã hóa entropy đa ký hiệu Một cơng cụ mã hóa số học M-ary áp dụng để mã hóa entropy phần tử cú pháp Mỗi phần tử cú pháp liên kết với bảng chữ gồm M phần tử, M giá trị số nguyên khoảng từ đến 16 2.3.6.2 Mã hóa hệ số bản đờ mức Các giá trị hệ số mã hóa nhiều đồ cấp độ với giá trị ký hiệu Các đồ mức mã hóa thành ba mặt phẳng cấp, cụ thể mặt phẳng cấp thấp, cấp trung bình cấp cao, mặt phẳng ký hiệu mã hóa thành mặt phẳng riêng biệt Các mặt phẳng cấp thấp hơn, trung bình cấp cao tương ứng với phạm vi cường độ hệ số khác (lần lượt 0–2, 3–14, 15 trở lên) 2.3.7 Bộ lọc vòng 2.3.7.1 Bộ lọc giải khối AV1 hỗ trợ lọc FIR 4, 14 chạm cho thành phần độ sáng lọc FIR 6-chạm cho thành phần sắc độ Các lọc áp dụng q trình gỡ lỗi lọc thơng thấp Để tránh làm mịn mức cạnh thực tế kết cấu, điều kiện biên kiểm tra gỡ khối 2.3.7.2 Bợ lọc CDEF Hình ảnh lọc chia thành khối 8 điểm ảnh, đủ lớn để ước tính hướng đáng tin cậy Đối với hướng d , số dòng k gán cho điểm ảnh trung bình điểm ảnh cho dòng k xác định Hướng tối ưu tìm thấy cách giảm thiểu sai số bình phương tính tổng bình phương khác biệt giá trị điểm ảnh riêng lẻ giá trị trung bình cho dịng tương ứng 2.3.7.3 Bợ lọc LR Bộ lọc khơi phục vịng lặp (LRF) áp dụng đơn vị khối 64×64, 128×128 256×256 đơn vị gọi đơn vị khơi phục vịng lặp (LRU) Với LRU, AV1 cho phép lựa chọn hai lọc sau: i) Bộ lọc Wiener, ii) Bộ lọc tự dẫn (SGF) 10 2.3.8 Cấu hình, profile và mức AV1 xác định ba cấu hình cho giải mã Main, High Professional Cấu hình Main cho phép độ sâu bit 10 bit mẫu với lấy mẫu chroma 4:0:0 4:2:0 Cấu hình High bổ sung thêm hỗ trợ lấy mẫu chroma 4:4:4 Cấu hình Professional mở rộng khả để hỗ trợ đầy đủ cho lấy mẫu chroma 4:0:0, 4:2:0, 4:2:2 4:4:4 với độ sâu màu 8, 10 12 bit CHƯƠNG 3: ĐÁNH GIÁ CHẤT LƯỢNG MÃ HÓA VIDEO CHUẨN AV1 SO VỚI CHUẨN HEVC 3.1 Một số tham số sử dụng để đánh giá 3.1.1 PSNR (Peak Signal to Noise Ratio) Phương pháp để đánh giá chất lượng hình ảnh video biết đến sử dụng nhiều PSNR PSNR sử dụng phổ biến tính đơn giản Tuy nhiên, giá trị PSNR xem bất lợi, đánh giá thấp đặc điểm hệ thống thị giác nhận thức người điều kiện góc nhìn khoảng cách Ngồi ra, PSNR tính tốn khác cho thành phần độ sáng sắc độ Tỉ số tín hiệu đỉnh nhiễu (PSNR) số dùng để tính tỉ lệ cơng suất tối đa tín hiệu cơng suất nhiễu làm ảnh hưởng đến độ trung thực biểu diễn tín hiệu Tính tốn PSNR dựa khác biệt tín hiệu gốc tín hiệu nhiễu Sự khác biệt sai số bình phương trung bình (MSE) hình ảnh 3.1.2 Chỉ sớ tương đờng cấu trúc (SSIM) SSIM số đánh giá chất lượng hình ảnh tham chiếu đầy đủ để đo độ tương đồng hình ảnh từ ba thành phần: độ chói (luminance), tương phản (contrast) cấu trúc (structure) 3.1.3 Thời gian mã hóa Thời gian xử lý video thơng qua mã hóa/giải mã phép đo quan trọng Tăng thời gian xử lý có nghĩa tăng độ phức tạp đó, cần nhiều sức mạnh tính tốn 3.1.4 Đại lượng Bjontegaard Delta Bjontegaard Delta tham số để tính tốn mối quan hệ đường cong theo tỷ lệ biến dạng (RD) Tỷ lệ cần bốn điểm đường cong RD để thực phép tính Bjontegaard Delta dùng để so sánh chất lượng nén video hai hệ thống mã hóa 11 video khác Phép tính tỷ lệ gồm hai phần BD-PSNR (tính dB) BD-Rate (tính %) 3.2 Khảo sát cơng cụ chạy thử nghiệm 3.2.1 FFMpeg 3.2.2 MediaInfor 3.2.3 Thông số kỹ thuật phần cứng 3.3 Một số kịch bản và đánh giá kết quả 3.3.1 Thử nghiệm với video độ phân giải CIF Bảng 3.1: Kết quả thử nghiệm với video độ phân giải CIF Tốc độ Thời gian mã hóa Chuỗi akiyo container mobile foreman bit PSNR (dB) SSIM (giây) AV1 HEVC AV1 HEVC AV1 HEVC 103.880 197.709 400.643 448.317 106.905 207.176 218.913 287.996 0.488 0.705 0.877 1.019 0.460 0.638 0.733 1.036 46.6494 49.2413 50.7491 51.7467 39.9794 42.0774 43.2481 44.1358 43.5443 46.0721 47.5207 48.5123 36.7734 39.3015 40.9096 42.0210 0.9914 0.9956 0.9966 0.9972 0.9568 0.9710 0.9771 0.9809 0.9833 0.9892 0.9919 0.9934 0.9356 0.9578 0.9685 0.9746 100 200 300 400 80.921 207.390 212.869 257.130 0.527 0.720 0.902 1.429 29.1011 32.0564 33.4645 34.3231 25.7575 28.6862 30.2149 31.3374 0.9250 0.9580 0.9696 0.9746 0.8469 0.9126 0.9347 0.9474 100 200 300 400 100.005 161.828 199.812 248.101 0.710 0.972 1.204 1.661 35.8440 38.4530 39.9670 40.9351 32.9459 35.6272 37.2125 38.3279 0.9403 0.9635 0.9727 0.9770 0.8997 0.9352 0.9509 0.9509 (Kbps) 100 200 300 400 100 200 300 400 Bảng 3.2: Kết quả BD-PSNR và BD-Rate HEVC và AV1 ở video độ phân giải CIF Chuỗi Akiyo Container Mobile Foreman Trung bình BD-PSNR (dB) 3.169 2.737 3.302 2.801 3.002 BD-Rate (%) -57.809 -54.868 -57.157 -51.800 -55.40 12 3.3.2 Thử nghiệm với video độ phân giải HD Bảng 3.3: Kết quả thử nghiệm với video độ phân giải HD Tốc độ Thời gian mã hóa Chuỗi Pedestrian Area Blue Sky bit (Kbps) 1000 1500 2000 2500 1000 1500 2000 2500 (giây) AV1 1121.166 1633.413 1904.446 2158.390 965.854 1251.155 1468.919 1570.546 PSNR (dB) SSIM HEVC AV1 HEVC AV1 HEVC 7.130 7.835 8.709 8.552 2.631 2.269 3.634 3.690 41.4027 42.3326 42.8760 43.2416 36.8309 38.3369 39.3081 40.0309 38.1152 39.6644 40.6716 41.3289 34.3694 35.9984 37.1019 37.9080 0.9623 0.9672 0.9698 0.9714 0.9577 0.9674 0.9722 0.9752 0.9319 0.9463 0.9543 0.9590 0.9348 0.9510 0.95924 0.9643 Bảng 3.4: Kết quả BD-PSNR và BD-Rate HEVC và AV1 ở video độ phân giải HD Chuỗi Pedestrian Area Blue Sky Trung bình BD-PSNR (dB) 2.589 2.296 2.442 BD-Rate (%) -61.428 -45.874 -53.651 3.3.3 Thử nghiệm với video độ phân giải 4K Hình 3.8: Kết quả thử nghiệm với video đợ phân giải 4K Tốc độ Thời gian mã hóa Chuỗi bit (giây) AV1 PSNR SSIM HEVC AV1 HEVC AV1 HEVC (Kbps) 4000 4902.673 14.344 46.0866 44.3173 0.9849 0.9801 6000 6017.928 16.231 46.6512 45.1699 0.9861 0.9823 Netflix 8000 7180.806 17.438 46.9779 45.6280 0.9867 0.9834 Narrator 10000 7449.699 33.892 47.2043 45.9331 0.9872 0.9841 Kết BD-PSNR BD-Rate HEVC AV1 video độ phân giải 4K BD-PSNR = 1.476 (dB); BD-Rate = -64.053 % 3.3.4 Đánh giá kết quả thử nghiệm Nhìn chung, với kết thực nghiệm đạt cho thấy số ưu điểm chuẩn mã hóa video AV1 so sánh với HEVC chất lượng mã hóa tốt với tốc độ bit tiết kiệm băng thông sử dụng 13 Cụ thể, giá trị BD-PSNR trung bình sai khác chuẩn mã hóa AV1 HEVC đạt cho chuỗi video tương ứng thử nghiệm 1, 2, dB, 2.44 dB, 1.476 dB Điều cho thấy AV1 cho chất lượng tốt tốc độ bit so với HEVC Tương tự vậy, số SSIM thu thử nghiệm cho thấy rõ chất lượng chuẩn mã hóa AV1 thường tốt so với HEVC Hiệu mã hóa AV1 cịn thể qua đại lượng BD-Rate thử nghiệm, kết BD-Rate cho giá trị âm có nghĩa AV1 nâng cao hiệu mã hóa HEVC mặt giảm tốc độ bit cho chất lượng video tốt Cụ thể, thử nghiệm AV1 giúp cải thiện hiệu đáng kể tiết kiệm đến 57% bitrate thử nghiệm 53,65% 64% thử nghiệm Tuy nhiên, để đạt kết AV1 lại có thời gian mã hóa lớn nhiều so với HEVC Ví dụ tốc độ bit 10Mbps, HEVC mã hóa video 4K hết 18 giây AV1 hết 7449 giây, thời gian mã hóa lớn khoảng 225 lần Để AV1 trở thành chuẩn mã hóa sử dụng phổ biến ứng dụng video trực tuyến chất lượng cao, việc giảm thời gian mã hóa so với chuẩn mã hóa truyền thống H.264, HEVC quan trọng Một số giải pháp xem xét đến sau: Tối ưu hóa hỗ trợ thiết bị phần cứng, phần mềm để phù hợp với kiến trúc mã hóa AV1 Nghiên cứu áp dụng kỹ thuật để giảm độ phức tạp dự đoán/bộ biến độ: 3.4 Kết luận chương Trong chương trình bày tham số đánh giá chất lượng mã hóa video, xây dựng thử nghiệm đánh giá chất lượng mã hóa chuẩn AV1 so với HEVC qua số tham số như: thời gian mã hóa, tỉ lệ PSNR, SSIM, BD-PSNR BD-Rate Mỗi thử nghiệm đánh giá dựa chuỗi video đầu vào có độ phân giải khác CIF, HD, 4K tốc độ bit thay đổi Cuối số đánh giá kết thử nghiệm chuẩn nén AV1 HEVC KẾT LUẬN Sau thời gian nghiên cứu thực đề án tốt nghiệp, kết học viên đạt sau Thứ nhất, giới thiệu tổng quan mã hóa video, phương pháp mã hóa 14 video, số tiêu chuẩn mã hóa video; Thứ hai, nghiên cứu chuẩn mã hóa video AV1 điểm bật thiết kế, tính năng, cú pháp mức cao, kỹ thuật mã hóa cải tiến so với chuẩn nén trước chưa áp dụng; Thứ ba, đề án xây dựng kịch chạy thử nghiệm, đánh giá chất lượng mã hóa AV1 so với HEVC qua số tham số tiêu biểu để thấy rõ hiệu chuẩn mã hóa AV1 Để đánh giá chất lượng mã hóa chuẩn AV1, đề án sử dụng phần mềm mã nguồn mở FFMpeg Các thử nghiệm sử dụng phầm mềm chương cho thấy chất lượng hình ảnh thu sử dụng chuẩn mã hóa video AV1 cải thiện nhiều so với HEVC Hơn nữa, AV1 đạt hiệu nén cao HEVC, nhiên mã hóa phức tạp địi hỏi tài ngun tính tốn nhớ thời gian mã hóa lớn KIẾN NGHỊ Hướng phát triển đề án đánh giá thêm chất lượng mã hóa AV1 khía cạnh điều chỉnh tham số lượng tử hóa, thay đổi đơn vị mã hóa (CTU), thay đổi độ sâu bit màu Đồng thời, xem xét đề xuất giải pháp giảm thiểu thời gian mã hóa Ngồi học viên mong muốn tiếp tục nghiên cứu theo mô hình gắn liền với thực tế streaming AV1 tảng truyền hình OTT dựa giao thức HLS, MPEGDASH áp dụng cơng nghệ mã hóa truyền khối độ trễ thấp Mục tiêu hướng tới đánh giá độ ổn định, chất lượng hình ảnh, khả tương thích AV1 thiết bị đầu cuối để mang đến trải nghiệm tốt cho người sử dụng dịch vụ truyền hình