1. Trang chủ
  2. » Giáo Dục - Đào Tạo

Nghiên cứu thuật toán mã hóa video theo chuẩn HEVC với kích thước nhóm khung hình thay đổi theo nội dung tt

22 56 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Nội dung

HỌC VIỆN CƠNG NGHỆ BƯU CHÍNH VIỄN THƠNG - Đào Thị Huyền NGHIÊN CỨU THUẬT TỐN MÃ HĨA VIDEO THEO CHUẨN HEVC VỚI KÍCH THƯỚC NHĨM KHUNG HÌNH THAY ĐỔI THEO NỘI DUNG Chuyên ngành: HỆ THỐNG THÔNG TIN Mã số: 8.48.01.04 TÓM TẮT LUẬN VĂN THẠC SĨ KỸ THUẬT (Theo định hướng ứng dụng) HÀ NỘI - 2019 Luận văn hồn thành tại: HỌC VIỆN CƠNG NGHỆ BƯU CHÍNH VIỄN THÔNG Người hướng dẫn khoa học: TS VŨ HỮU TIẾN Phản biện 1: ……………………………………………………… Phản biện 2: ……………………………………………………… Luận văn bảo vệ trước Hội đồng chấm luận văn thạc sĩ Học viện Cơng nghệ Bưu Viễn thông Vào lúc: ngày tháng năm Có thể tìm hiểu luận văn tại: - Thư viện Học viện Công nghệ Bưu Viễn thơng MỞ ĐẦU Trong kỹ thuật mã hóa video đại, chuẩn nén video HEVC hứa hẹn khả tạo đoạn video với dung lượng nửa so với người tiền nhiệm H.264/AVC chiếm tới 80% nội dung video lưu trữ mà không làm giảm chất lượng video Nhờ vào chuẩn nén này, nhà mạng viễn thơng cung cấp dịch vụ thoại video trực tuyến chất lượng cao hơn,có thể cung cấp đoạn video với độ phân giải lên đến 8K mà không cần bổ sung tài nguyên mạng lưới Chuẩn HEVC có điểm hạn chế tương tư với chuẩn mã hóa khác khả tối ưu hiệu mã hóa sử dụng GOP với kích thước cố định Để khắc phục vấn đề đề tài thực nghiên cứu chuẩn HEVC với tính cải tiến, thay đổi kích thước GOP theo nội dung Luận văn gồm nội dung sau: - Mở đầu - Chương 1: Tổng quan mã hóa video - Chương 2: Nghiên cứu thuật tốn mã hóa video theo chuẩn HEVC với kích thước nhóm khung hình thay đổi theo nội dung - Chương 3: Mơ phỏng, đánh giá hiệu thuật tốn - Kết luận Thông qua việc nghiên cứu chuẩn video HEVC phương pháp mã hóa video theo nhóm ảnh GOP, luận văn đưa đề xuất phương pháp thay đổi kích thước GOP theo nội dung video thơng qua phương pháp học máy (Machine Lerning) Tác giả mong muốn áp dụng tiến cơng nghệ học máy để tối ưu dung lượng video mà chất lượng video trì mức tốt, mang lại hiệu lưu trữ, truyền tải video với chất lượng tốt mà kỹ thuật cũ chưa làm CHƯƠNG 1: TỔNG QUAN VỀ MÃ HÓA VIDEO 1.1 Giới thiệu chung Nguyên tắc để tạo video từ trước đến phát liên tục nhiều hình ảnh giây Khi hình ảnh chuyển động liên tục (motion picture) phát liên tục với tốc độ trình chiếu từ 18 hình/giây trở lên, mắt ghi nhận chuỗi hình ảnh liên tục, tạo thành đoạn phim 1.2 Nguyên tắc mã hóa video 1.2.1 Nguyên tắc mã hóa video Các frame chuỗi video pixel frame thường có mối tương quan định Ngồi ra, đặc điểm mắt người nhạy cảm với số thơng tin hình ảnh theo khơng gian thời gian nên loại bỏ mà khơng làm suy giảm chất lượng video theo góc độ cảm nhận người dùng Dựa vào đặc điểm này, xây dựng thuật tốn mã hóa video để tiết kiệm băng thông đảm bảo chất lượng video mức chấp nhận 1.2.2 Kỹ thuật giảm dư thừa thông tin miền không gian a) Mã hóa dự báo Tại thời điểm ban đầu, phương pháp giảm dư thông không gian đưa dựa việc dự báo giá trị pixel dựa vào giá trị pixel mã hóa trước Phương pháp gọi “Điều chế xung mã sai phân” (Differential Pulse Code Modulation – DPCM) b) Mã hóa biến đổi Q trình mã hóa thực cách biến đổi giá trị pixel sang miền không gian khác trước loại bỏ liệu không cần thiết Ý tưởng việc áp dụng mã hóa biến đổi vào việc mã hóa ảnh lượng hầu hết ảnh tập trung chủ yếu miền tần số thấp biểu diễn hệ số sau biến đổi Q trình lượng tử hóa sử dụng với mục đích giữ lại hệ số miền tần số thấp loại bỏ hệ số miền tần số cao c) Lượng tử hóa hệ số DCT 1.2.3 Kỹ thuật giảm dư thừa thông tin miền thời gian Kỹ thuật giảm dư thừa thông tin miền thời gian thực dựa việc tìm khác khung hình liên tiếp Đối với đối tượng tĩnh ảnh, khác biệt gần Do đối tượng không cần nhiều thông tin để mã hóa Ngược lại, đối tượng chuyển động nhiều, khác biệt khung hình lớn 1.2.4 Sơ đồ tổng quát mã hóa video Hình 1.6 mơ tả sơ đồ tổng quát mã hóa video sử dụng chuẩn mã hóa H.261, H.264, MPEG-1, MPEG-2 H.264/MPEG-4 part 10 Hình 1.6 Sơ đồ nguyên lý tổng quát mã hóa video a) Intraframe/Interframe loop Trong chế độ mã hóa liên ảnh, giá trị khác biệt pixel khung hình khung hình dự đốn dựa vào khung hình trước mã hóa truyền Tại phía thu, sau giải mã, giá trị khác biệt cộng với khung hình dự đốn bên thu đưa để xây dựng lên khung hình Trong chế độ mã hóa nội ảnh, giá trị dự đoán dựa khối pixel liền kề trước khung hình b) Ước lượng chuyển động Các vector chuyển động gán cho nhóm pixel (block) Việc ước lượng chuyển động thực kênh chói (kênh Y) khung hình c) Inter/Intra switch Inter/Intra switch có tác dụng chuyển đổi hai chế độ liên ảnh nội ảnh d) DCT e) Lượng tử hóa Có hai loại lượng tử hóa Một loại có dead zone sử dụng cho hệ số AC hệ số DC MB mã hóa liên ảnh Loại lại khơng có dead zone sử dụng cho hệ số DC MB nội ảnh f) Variable Length Coding Các hệ số sau lượng tử mã hóa mã có độ dài thay đổi Ngồi ra, giá trị vector chuyển động mã hóa mã với hệ số lượng tử g) Giải lượng tử biến đổi DCT ngược Để tái tạo khung hình thời, hệ số DCT sau lượng tử giải lượng tử biến đổi DCT ngược Sau đó, giá trị cộng với khung hình trước mã hóa lưu giữ để tái tạo lại khung hình thời Khung hình thời lại lưu giữ để dùng cho q trình dự đốn khung hình h) Bộ đệm Trước truyền tín hiệu video kênh truyền có băng thơng cố định bit lưu đệm để điều tiết việc truyền Bộ đệm trường hợp nhớ có hai cổng ghi đọc Cổng ghi có nhiệm vụ nhận liệu bit sau mã hóa Cổng đọc có nhiệm vụ đọc liệu với tốc độ ổn định Mỗi liệu đọc đệm giải phóng liệu đệm Trong trường hợp có liệu ghi vào nhiều liệu đọc (với video có nhiều chuyển động) đệm gửi thơng tin phản hồi tới lượng tử để tăng mức lượng tử Khi liệu mã hóa hệ số DCT bị giảm Ngược lại, với video có chuyển động lượng tử giảm mức lượng tử để cải thiện chất lượng video Quá trình gọi ổn định tốc độ bit (Constant Bit Rate) Với mã hóa có tốc độ bit thay đổi (Variable Bit Rate– VBR) đệm khơng sử dụng mức lượng tử giữ ngun suốt q trình mã hóa 1.3 Giải mã hóa video Về bản, q trình giải mã hóa bao gồm bước giống trình mã hóa thứ tự ngược lại Hình 1.7 mơ tả q trình giải mã hóa tín hiệu video Ban đầu liệu nhận tín hiệu mã hóa tách thành hai phần: liệu mã hóa giá trị khác biệt liệu mã hóa giá trị vector chuyển động Vector chuyển động đưa vào dự đốn để dự đốn khung hình Dữ liệu mã hóa giá trị khác biệt khung hình khung hình trước giải mã Entropy, giải luợng tử, biến đổi DCT ngược Sau biến đổi DCT ngược ta khung hình hiệu số khung hình khung hình dự đốn Sau cộng với khung hình dự đốn, ta thu khung hình tái tạo khung hình Hình 1.7 Sơ đồ giải mã hóa tín hiệu video 1.4 Các tiêu chuẩn cho mã hóa tín hiệu video Trên giới có hai tổ chức đưa tiêu chuẩn cho mã hóa video Tổ chức Viễn thông quốc tế (International Standards Organisation – ISO) Hiệp hội Viễn thông quốc tế (International Telecommunications Union – ITU) 1.5 Định dạng file video Một số định dạng file tiêu biểu: AVI, MKV, WMV, MP4 Kết luận chương Trong chương 1, tác giả trình bày vắn tắt kiến thức mã hóa giải mã hóa video, giới thiệu nguyên tắt quy trình mã hóa vài giải mã, đồng thời biểu diễn lưu đồ mã hóa, giải mã hình ảnh minh họa 6 CHƯƠNG 2: NGHIÊN CỨU THUẬT TỐN MÃ HĨA VIDEO THEO CHUẨN HEVC VỚI KÍCH THƯỚC NHĨM KHUNG HÌNH THAY ĐỔI THEO NỘI DUNG 2.1 Chuẩn video HEVC H.265/HEVC chuẩn mã hóa video hoàn toàn với tên gọi đầy đủ High Efficiency Video Coding (HEVC) Hiệp hội Viễn thông Quốc tế ITU-T thông qua bắt đầu nhà phát triển đưa vào sản phẩm thương mại H.265 hứa hẹn mang lại khả nén cao gấp đôi so với người tiền nhiệm H.264/AVC (Advance Video Coding) dùng phổ biến chiếm tới 80% nội dung video lưu trữ 2.1.1 Những điểm nội bật thiết kế tính mã hóa HEVC Lớp mã hóa video HEVC thực cách tiếp cận lai (dự đoán ảnh/liên ảnh mã hóa biến đổi 2D) sử dụng tất tiêu chuẩn nén video kể từ H.261 Sơ đồ khối mã hóa video HEVC thể Hình 2.3 Hình 2.3 Sơ đồ khối mã hóa HEVC Mỗi ảnh đầu vào chia thành khối ảnh, sau mã hóa truyền tải đến giải mã Ảnh chuỗi video mã hoá sử dụng dự đoán ảnh Đối với ảnh lại chuỗi sử dụng chế độ mã hóa dự đốn liên ảnh theo thời gian Các tín hiệu dư thừa dự đoán ảnh liên ảnh biến đổi phép biến đổi không gian tuyến tính Sau hệ số biến đổi định cỡ, lượng tử hóa, mã hóa Entropy, truyền với thơng tin dự đốn a) Cấu trúc đơn vị mã hóa (CTU) khối mã hóa (CTB) Hình 2.4 Cấu trúc CTU CTU (Coding Tree Unit – đơn vị mã hóa) đơn vị mã hóa cấp cao HEVC Hình 2.4 minh họa cấu trúc ảnh HEVC chia thành CTU CTU đơn vị logic thường bao gồm ba khối: mẫu chói (Y), hai mẫu màu (Cb Cr) phần tử cú pháp liên quan Mỗi khối gọi CTB (Coding Tree Block – Khối mã hóa) 8 Hình 2.5 Cấu trúc CTB b) Đơn vị mã hóa (CU) khối mã hóa (CB) Mỗi CTB chia thành nhiều CB (Coding Block – Khối mã hóa) khác Hình 2.6 minh họa cách chia nhỏ thành cấu trúc CB CTB 64x64 CB điểm định xem có có thực dự đốn liên ảnh nội ảnh hay khơng, kiểu dự đốn mã hóa CU (Coding Unit – Đơn vị mã hóa) 9 Hình 2.6 Cấu trúc CTB chia nhỏ c) Đơn vị dự đoán (PU) khối dự đoán (PB) Mỗi CB chia thành PB (Prediction Block – Khối dự đốn) để lưu trữ thơng tin dự đốn HEVC hỗ trợ kích cỡ PB khác từ 4x4 64x64 Hình 2.7 Cấu trúc PB 10 d) Đơn vị biến đổi (TU) khối biến đổi (TB) Mỗi CB chia thành TB (Transform Block – Khối biến đổi) khác lưu trữ thông tin biến đổi phần dư Hình 2.8 Cấu trúc TB e) Tín hiệu hóa vector chuyển động Dự đốn vector chuyển động tiên tiến (AMVP) sử dụng dựa liệu từ PB liền kề hình ảnh tham chiếu f) Bù chuyển động g) Dự đoán ảnh Các chế độ dự đoán ảnh chọn mã hóa dẫn xuất chế độ xảy dựa PB lân cận giải mã trước h) Điều khiển lượng tự hóa Như H.264 / MPEG-4 AVC, lượng tử hóa tái thiết đồng (URQ) dùng HEVC, với ma trận định cỡ (scale) lượng tử hóa hỗ trợ cho kích thước khối biến đổi khác i) Mã hóa Entropy Mã hóa số học nhị phân thích ứng ngữ cảnh (CABAC) sử dụng để mã hóa Entropy Nó tương tự sơ đồ CABAC H.264 / MPEG-4 AVC, có thêm số cải tiến để cải thiện tốc độ lưu lượng (đặc biệt cho kiến trúc xử lý song song), hiệu suất nén, để giảm nhớ ngữ cảnh j) Bộ lọc bỏ khối trong-vòng Một lọc bỏ khối giống lọc H.264 / MPEG-4 AVC dùng vòng lặp dự đốn liên ảnh Tuy nhiên, thiết kế đơn giản hóa trình đưa định lọc, làm thuận lợi để xử lý song song k) Bù thích ứng mẫu (SAO) Một ánh xạ biên độ phi tuyến tính đưa vào vòng lặp dự đoán liên ảnh đằng sau lọc bỏ khối Mục đích để tái tạo tốt biên độ tín hiệu ban đầu 11 cách sử dụng bảng look-up, bảng mô tả vài thơng số bổ sung mà chúng xác định cách phân tích biểu đồ phía mã hóa 2.1.2 Các kỹ thuật mã hóa video HEVC a) Biểu diễn lấy mẫu ảnh b) Phân chia hình ảnh thành đơn vị mã hóa c) Phân chia CTB thành CB d) Khối dự đoán (PB) đơn vị dự đoán (PU) e) Phân chia cấu trúc thành đơn vị biến đổi khối biến đổi f) Dự đoán ảnh g) Dự đốn liên ảnh h) Mã hóa Entropy h) Bộ lọc vòng 2.2 Các thuật tốn mã hóa, giải mã hóa 2.2.1 Các kỹ thuật mã hóa khơng liệu bao gồm: a) Mã hố với độ dài (của từ mã) thay đổi (VLC) Phương pháp gọi mã hố Huffman mã hoá Entropy, dựa khả xuất giá trị biên độ trùng hợp ảnh thiết lập từ mã ngắn cho giá trị có tần suất xuất cao từ mã dài cho giá trị lại Khi thực giải nén, thiết lập mã trùng hợp sử dụng để tái tạo lại giá tri tín hiệu ban đầu b) Mã hóa với độ dài (của từ mã) động (RLC) Phương pháp dựa lặp lại giá trị mẫu để tạo mã đặc biệt biểu diễn bắt đầu kết thúc giá trị lặp lại Chỉ mẫu có giá trị khác khơng mã hố c) Biến đổi cosin rời rạc (DCT) 2.2.2 Các kỹ thuật mã hóa có liệu bao gồm: a) Lấy mẫu (Subsampling) Đây phương pháp mã hóa có hiệu quả, song độ phân giải ảnh sau giải mã hóa giảm so với ảnh ban đầu Vì vậy, kỹ thuật lấy mẫu khơng áp dụng cho tín hiệu chói 12 b) Điều xung mã vi sai (DPCM) Là phương pháp mã hóa dự đốn, thay truyền tồn mẫu, kỹ thuật mã hóa truyền khác giá trị mẫu Giá trị sai lệch cộng vào giá trị mẫu giải mã trình giải nén để tạo lại giá trị mẫu cần thiết c) Lượng tử hóa mã hóa VLC hệ số DCT Phối hợp ba kỹ thuật cho phép biểu diễn khối điểm ảnh số bit, tạo hiệu nén cao 2.3 Mã hóa video theo nhóm ảnh (GOP – Group of Picture) GOP đơn vị mang thông tin độc lập chuẩn video Mỗi GOP bắt buộc phải bắt đầu ảnh hồn chỉnh I, tiếp sau loạt ảnh P B Hiệu việc mã hóa phụ thuộc trực tiếp kích thước GOP cấu trúc bên 2.4 Mã hóa video với GOP biến đổi kích thước theo nội dung video Với cấu trúc GOP tĩnh, mã hóa gặp khó khăn việc đưa dự đốn bù chuyển động ảnh có thay đổi lớn nội dung ảnh liên tiếp video Với GOP biến đổi, dựa thay đổi nội dung bối cảnh video, mã hóa điều chỉnh kích thước GOP với N=3 N=6 Nhờ vào đó, thời điểm có thay đổi lớn nội dung ảnh, video mã hóa ảnh I cho hiệu cao dự đoán bù chuyển động độ sắc nét Thuật tốn cấu tạo theo ba quy trình chính: - Phân đoạn video: Phát thay đổi lớn ảnh để xác định điểm phân đoạn video - Tạo GOP: Đặt khung ảnh I đầu đoạn video, theo sau ảnh P B theo thứ tự xác định phần lại phân đoạn - Mã hóa video: Mã hóa chuỗi video cách sử dụng GOP tạo 2.4.1 Tạo GOP Các điểm chuyển tiếp nội dung video thời điểm tốt để chèn ảnh I Vì vậy, ảnh đầu thủ tục PB định nghĩa ảnh I Trong khoảng thời gian hai ảnh I liên tiếp, loại ảnh khác định vị theo thứ tự tùy ý có cấu trúc mong muốn (định dạng GOP) để đạt hiệu mã hóa tốt 13 2.4.2 Đánh giá ưu nhược điểm GOP a) Công cụ mô đánh giá Để đánh giá ảnh hưởng kích thước GOP đến chất lượng video, sử dụng hai loại công cụ mô phỏng: LTE System Level Simulator (LTE-SLS) sử dụng để mô mạng LTE LTEVidSim công cụ để đánh giá chất lượng truyền video qua mạng LTE Hình 2.21 Bốn video mẫu cho việc mơ b) Kết đánh giá Video với lượng chuyển động vừa phải nhiều thông tin chi tiết cho khung cảnh màu nền: flower garden Video thứ hai với thời gian chuyển động nhanh, đối tượng lớn khung cảnh phức tạp: football Video thứ ba với chuyển động, khác biệt khung ảnh nhỏ dẫn đến việc mã hóa dễ dàng hơn: silent Video thứ tư với chuyển động vừa phải hình ảnh tĩnh máy ảnh, chưa thông tin chi tiết so với flower garden: coastguard Kết thu ảnh hưởng độ dài GOP đến chất lượng video từ việc mô thể qua biểu đồ tương quan PSNR, MOS với giá trị kích thước GOP khác 14 (a) PSNR Video Flower garden (b) PSNR tổng hợp loại video (c) MOS Video Flower garden (d) MOS tổng hợp loại video Hình 2.22 Biểu đồ kết mô độ dài GOP Kết rõ ràng thử nghiệm cho tỷ lệ mã hóa khơng giải nhu cầu Các video có khung cảnh đơn giản vả mức độ chuyển động thấp tăng tỷ lệ mã hóa cách tăng độ dài GOP, ngược lại với video với mực độ phức tạp màu sắc tính chuyển động cao cần tốc độ bít cao hơn, độ dài GOP phải giảm xuống để trì chất lượng thay tăng tỷ lệ mã hóa Từ thấy mức độ ảnh hưởng độ dài GOP đến chất lượng video vô quan trọng mã hóa truyền tải video 2.5 Đề xuất phương pháp thay đổi kích thước GOP theo nội dung video 2.5.1 Kiến trúc mã hóa đề xuất Trong kiến trúc mã hóa đề xuất, thành phần cấu hình GOP H.265 liên kết với lựa chọn GOP thông minh sử dụng kỹ thuật học máy (Machine Learning) có khả tín tốn cấu hình kích thước GOP tối ưu dựa đặc tính khung hình đầu vào Sơ đồ khối kiến trúc mã hóa đề xuất biểu diễn hình 2.23 15 Hình 2.23 Sơ đồ khối kiến trúc mã hóa đề xuất Bộ lựa chọn GOP thơng minh có cấu trúc gồm thành phần bản: - Bộ trích chọn đặc trưng: có chức trích xuất đặc tính khung hình đầu vào bao gồm thành phần khác biệt khung hình so với khung hình trước vectơ chuyển động - Hệ tư vấn: sử dụng đặc tính gửi từ Bộ trích chọn đặc trưng đưa cấu trúc GOP phù hợp đưa vào H.265 2.5.2 Kỹ thuật tạo GOP thích ứng phương pháp học máy a) Định nghĩa đặc tính Các đặc tính chọn phải phản ánh đầy đủ tính chất nội dung video, đặc tính phải mơ tả rõ thông tin kết cấu nội dung khung hình thơng tin vectơ chuyển động Các đặc tính bao gồm: Sum of Absolute Difference (SAD), Difference of Histogram (DoH), Average of Motion Vectors (AMV), Number of Motion Vectors (NMV ), Average Subsequence Variance (ASV), Average Subsequence Mean (ASM), DC value Variance (DCV), DC value Mean (DCM), AC value Variance (ACV) and AC value Mean (ACM) b) Training Classification Classification q trình xây dựng mơ hình lớp từ tập hợp ghi có chứa nhãn lớp Decision Tree mơ hình học máy dự đốn định giá trị đích mẫu dựa giá trị thuộc tính khác liệu có sẵn 16 - Mơ hình J48 training: Mơ hình J48 phải đào tạo ngoại tuyến lần trước sử dụng cho giai đoạn phân loại - Thử nghiệm tính trích xuất: Đối với video đầu vào, năm khung hình coi chuỗi tính đề xuất trích xuất từ chuỗi - J48 Classification:: Việc phân loại thực cho tập hợp tính trích xuất với mơ hình đào tạo J48 Đầu phân loại kích thước GOP cho chuỗi bao gồm năm khung hình 2.5.3 Giới thiệu phần mềm WEKA mơ hệ tư vấn a) Giới thiệu tổng quan WEKA Chương trình WEKA giúp người dùng khai thác kế hoạch Machine Learning qua hai lựa chọn bao gồm: phân loại hồi quy, chọn chạy tập hợp liệu thuật toán muốn sử dụng b) Giới thiệu môi trường Explorer 2.6 Kết luận chương Trong chương này, đề tài trình bày nội dung chuẩn mã hóa video HEVC, kỹ thuật mã hóa video theo GOP, kỹ thuật biến đổi kích thước GOP theo nội dung video, từ đề xuất phương pháp mã hóa video với GOP biến đổi theo nội dung video sử dụng kỹ thuật học máy Trong chương này, đề tài giới thiệu công cụ xử lý liệu học máy WEKA sử dụng để mô hiệu thuật tốn chương 17 CHƯƠNG 3: MƠ PHỎNG ĐÁNH GIÁ HIỆU NĂNG THUẬT TỐN 3.1 Các bước mơ Bước 1: Tạo liệu Bước 2: Training Bước 3: Kiểm tra Bảng 3.1 Đặc điểm chuỗi video thử nghiệm Test sequences Spatial resolution Number of frames Quantization parameters 300 {26,30,34,38} 150 {25,29,34,40} Pamphlet 150 {25,29,34,40} Harbour 150 {25,29,34,40} Coastguard Suzie 176x144 Hình 3.1 Chuỗi Video thử nghiệm 18 3.2 Phân tích kết mơ Kết đánh giá hiệu tỷ lệ sai lệch RD cho bốn chuối video thử nghiệm trình bày bảng 3.2 Bảng 3.2 Hiệu RD cho thử nghiệm Sequence Coastguard QP 26 30 34 38 Average Suzie 26 30 34 38 Average Pamphlet 26 30 34 38 Average Harbour Average 26 30 34 38 GOP2 Bitrate PSNR 27760 38.18 17131 34.87 9838 31.88 5256 29.14 14996 33.52 18424 41.58 10869 38.56 5725 35.41 2667 32.24 9421.3 36.95 23894 41.15 15670 37.42 9013.6 33.18 3897.7 28.86 13119 35.15 45657 38.04 29714 34.18 16805 30.36 7646.2 26.24 24955 32.2 GOP4 Bitrate PSNR 28242 34.65 16140 32.48 8228 30.36 3781 28.23 14098 31.43 19719 41.26 11172 38.23 5588 35.15 2353 32.04 9708 36.67 23128 41.35 14901 37.51 8567.7 33.24 3667.9 28.91 12566 35.25 45680 37.62 28618 33.73 15472 30.03 6768.9 26.09 24135 31.86 Adaptive GOP Bitrate PSNR 27735 38.14 17058 34.84 9760 31.85 5199 29.12 14938 33.49 18565 41.34 10530 38.26 5283 35.29 2270 32.19 9162 36.77 22454 41.37 14505 37.56 8349.8 33.29 3587 28.95 12224 35.29 45338 37.81 28830 33.96 15890 30.23 7082.9 26.22 24285 32.06 Theo kết biểu diễn bảng 3.2, giá trị PSNR phương pháp đề xuất tốt giá trị GOP tương đương với giá trị GOP2 Giá trị bitrate phương pháp đề xuất cao giá trị GOP4 thấp giá trị GOP2 Do đó, việc lựa chọn GOP2 GOP4 phụ thuộc vào cân PSNR Bitrate Kết cho thấy mức độ suy giảm chất lượng video (về giá trị PSNR) phương pháp đề xuất không đáng kể tiết kiệm nhiều bitrate Bảng 3.2 cho thấy khả tối ưu bitrate phương pháp đề xuất 3,37% 9,62% so với GOP2 GOP4, tương ứng 19 Hình 3.1 Hình 3.2 Hình 3.3 Hình 3.4 Hình 3.1, 3.2, 3.3 3.4 mô tả kết hiệu phương pháp đề xuất với phương pháp sử dụng toàn GOP toàn GOP Hình 3.3 đường cong RD (Rate – Distortion) phương pháp đề xuất cao hai phương pháp lại Hình 3.1, 3.2 phương pháp đề xuất cho chất lượng video tương đương với phương pháp GOP = 2, hình 3.4 phương pháp đề xuất tương đương với GOP cao GOP Như vậy, với việc áp dụng mơ hình học máy, ta ln chọn độ dài GOP phù hợp kết chất lượng Video đầu cao 3.3 Kết luận chương Trong chương này, tác giả xây dựng mơ hình mơ thực tế, trình bày bước mơ thuật tốn mã hóa video theo chuẩn HEVC với kích thước GOP thay đổi theo nội dung Đồng thời phân tích, so sánh kết thu để từ đánh giá hiệu thuật toán 20 KẾT LUẬN VÀ KIẾN NGHỊ Bên cạnh kiến thức mã hóa giải mã hóa video làm tảng sở cho việc nghiên cứu lĩnh vực âm hình ảnh, đề tài nghiên cứu đánh giá tường minh ảnh hưởng GOP đến chất lượng hiệu thuật tốn mã hóa video, từ thấy quan trọng việc điều chỉnh kích thước GOP phù hợp việc tối ưu cân hiệu mã hóa chất lượng video Giải vấn đề tối ưu khả mã hóa cho nhiều loại video với đặc tính chuyển động phức tạp khác mã hóa, điều mà thuật tốn mã hóa khơng làm kích thước GOP thông thường ấn định giá trị suốt q trình mã hóa Trên sở này, đề xuất phương pháp mã hóa với GOP thích ứng hay GOP với kích thước biến đổi theo nội dung video sử dụng kỹ thuật học máy Kiến trúc mã hóa đề xuất xây dựng tảng mã hóa HEVC bản, cải tiến cách kết hợp thành phần điều khiển cấu hình GOP hoạt động ngun lý trích chọn thơng tin, ghi nhớ đặc tính tư vấn cấu hình phương pháp học máy Hồn thành mơ phỏng, đánh giá hiệu kiến trúc mã hóa đề xuất dựa cơng cụ xây dựng sẵn Mathlab chương trình mơ hệ tư vấn WEKA Trong q trình làm đề tài, trình bày báo cáo tác giả cố gắng đưa đầy đủ thông tin, thuyết minh khoa học Tuy nhiên thời gian trình độ hạn chế, luận văn khơng tránh khỏi thiếu xót Tác giả mong muốn nhận góp ý để đề tài hồn thiện mạng lại giá trị thiết thực sống Và có điều kiện nghiên cứu tiếp, tác giả nghiên cứu chuyên sâu nhằm đề xuất thuật tốn mã hóa video kỹ thuật tạo GOP thích ứng xử lý phương pháp học máy tối ưu để trích chọn đặc trưng GOP tốt nhằm đem lại hiệu xử lý cao xác Tác giả xin chân thành cảm ơn TS Vũ Hữu Tiến, thầy cô khoa Hệ thống Thơng tin tận tình giúp đỡ hỗ trợ tác giả hoàn thành luận văn Xin trân trọng cảm ơn!./ ... thay đổi kích thước GOP theo nội dung Luận văn gồm nội dung sau: - Mở đầu - Chương 1: Tổng quan mã hóa video - Chương 2: Nghiên cứu thuật tốn mã hóa video theo chuẩn HEVC với kích thước nhóm khung. .. VIDEO THEO CHUẨN HEVC VỚI KÍCH THƯỚC NHĨM KHUNG HÌNH THAY ĐỔI THEO NỘI DUNG 2.1 Chuẩn video HEVC H.265 /HEVC chuẩn mã hóa video hồn tồn với tên gọi đầy đủ High Efficiency Video Coding (HEVC) Hiệp hội... thức mã hóa giải mã hóa video, giới thiệu ngun tắt quy trình mã hóa vài giải mã, đồng thời biểu diễn lưu đồ mã hóa, giải mã hình ảnh minh họa 6 CHƯƠNG 2: NGHIÊN CỨU THUẬT TỐN MÃ HĨA VIDEO THEO CHUẨN

Ngày đăng: 05/02/2020, 11:27

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w