Nghiên cứu tiêu chuẩn nén h.264 và ứng dụng trong truyền hình có độ phân giải cao (HDTV) (tt)

25 426 2
Nghiên cứu tiêu chuẩn nén h.264 và ứng dụng trong truyền hình có độ phân giải cao (HDTV) (tt)

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Nghiên cứu tiêu chuẩn nén h.264 và ứng dụng trong truyền hình có độ phân giải cao (HDTV) (tt)Nghiên cứu tiêu chuẩn nén h.264 và ứng dụng trong truyền hình có độ phân giải cao (HDTV) (tt)Nghiên cứu tiêu chuẩn nén h.264 và ứng dụng trong truyền hình có độ phân giải cao (HDTV) (tt)Nghiên cứu tiêu chuẩn nén h.264 và ứng dụng trong truyền hình có độ phân giải cao (HDTV) (tt)Nghiên cứu tiêu chuẩn nén h.264 và ứng dụng trong truyền hình có độ phân giải cao (HDTV) (tt)Nghiên cứu tiêu chuẩn nén h.264 và ứng dụng trong truyền hình có độ phân giải cao (HDTV) (tt)Nghiên cứu tiêu chuẩn nén h.264 và ứng dụng trong truyền hình có độ phân giải cao (HDTV) (tt)Nghiên cứu tiêu chuẩn nén h.264 và ứng dụng trong truyền hình có độ phân giải cao (HDTV) (tt)Nghiên cứu tiêu chuẩn nén h.264 và ứng dụng trong truyền hình có độ phân giải cao (HDTV) (tt)Nghiên cứu tiêu chuẩn nén h.264 và ứng dụng trong truyền hình có độ phân giải cao (HDTV) (tt)Nghiên cứu tiêu chuẩn nén h.264 và ứng dụng trong truyền hình có độ phân giải cao (HDTV) (tt)Nghiên cứu tiêu chuẩn nén h.264 và ứng dụng trong truyền hình có độ phân giải cao (HDTV) (tt)Nghiên cứu tiêu chuẩn nén h.264 và ứng dụng trong truyền hình có độ phân giải cao (HDTV) (tt)Nghiên cứu tiêu chuẩn nén h.264 và ứng dụng trong truyền hình có độ phân giải cao (HDTV) (tt)

HỌC VIỆN CÔNG NGHỆ BƢU CHÍNH VIỄN THÔNG - Nguyễn Đức Thiệp NGHIÊN CỨU TIÊU CHUẨN NÉN H.264 ỨNG DỤNG TRONG TRUYỀN HÌNH ĐỘ PHÂN GIẢI CAO (HDTV) CHUYÊN NGÀNH: KỸ THUẬT VIỄN THÔNG MÃ SỐ: 60.52.02.08 TÓM TẮT LUẬN VĂN THẠC SĨ HÀ NỘI – 2017 Luận văn hoàn thành tại: HỌC VIỆN CÔNG NGHỆ BƢU CHÍNH VIỄN THÔNG - Người hướng dẫn khoa học: TS Nguyễn Quý Sỹ Phản biện 1: PGS.TS Lê Nhật Thăng Phản biện 2: TS Phạm Mạnh Lâm Luận văn bảo vệ trước Hội đồng chấm luận văn thạc sĩ Học viện Công nghệ Bưu Viễn thông Vào lúc: 00 ngày 05 tháng 08 năm 2017 thể tìm hiểu luận văn tại: - Thư viện Học viện Công nghệ Bưu Viễn thông LỜI MỞ ĐẦU Trong kỹ thuật truyền hình, việc nén Video vấn đề quan trọng cho việc truyền tải chương trình truyền hình Những Video thường liệu dung lượng lớn, với truyền hình độ phân giải cao (HDTV) không nén tiêu thụ khoảng 1,5 Gb/s đến 2Gb/s băng thông, để truyền tải khó Với chuẩn H.264/MPEG-4 AVC nay, nhà cung cấp nội dung mã hóa video HD (High Definition) full HD với dung lượng từ 5Mb/s đến 10Mb/s, tùy thuộc vào độ phân giải, chất lượng yêu cầu phương thức mã hóa Do chuẩn nén video đời nhằm loại bỏ liệu dư thừa mà đảm bảo chất lượng Tiêu chuẩn mã hóa (nén) H.264 chuẩn tiên tiến, tạo đột phá, cho phép nén video cách tốt đồng thời cải thiện chất lượng so với tiêu chuẩn nén trước Với mong muốn đóng góp thêm nghiên cứu tiêu chuẩn nén H.264 ứng dụng H.264, người viết lựa chọn đề tài “Nghiên cứu tiêu chuẩn nén H.264 ứng dụng truyền hình độ phân giải cao (HDTV)” Luận văn em gồm chương: Chương 1: Nghiên cứu sở lý thuyết số hóa tín hiệu nén video số Chương 2: Nghiên cứu tiêu chuẩn nén H.264/AVC Chương 3: Ứng dụng tiêu chuẩn nén H.264/AVC truyền hình độ phân giải cao HDTV CHƢƠNG 1: NGHIÊN CỨU VỀ SỞ LÝ THUYẾT CỦA SỐ HÓA TÍN HIỆU VIDEO NÉN VIDEO SỐ 1.1 Mục đích nén tín hiệu Với phát triển khoa học kỹ thuật, ngày sản xuất cảm biến màu độ phân giải lên đến 16 triệu pixel tương đương với ảnh độ phân giải 4096x4096 pixels, thực tế ứng dụng cần độ phân giải cao dùng lại 1920x1080 pixel, để tiết kiệm không gian lưu trữ băng thông kênh truyền cần nén tín hiệu 1.2 Quá trính số hóa tín hiệu Quá trình số hoá tín hiệu tương tự, bao gồm trình lọc trước (prefiltering), lấy mẫu, lượng tử mã hoá Quá trình lọc trước nhằm loại bỏ tần số không cần thiết tín hiệu nhiễu, lọc gọi lọc chống nhiễu xuyên kênh Aliasing 1.3 Tốc độ bít thông lƣợng kênh truyền tín hiệu số 1.3.1 Tốc độ bit Là số lượng bit truyền hay lưu trữ đơn vị thời gian C = fs * n (bit/s) 1.3.2 Thông lượng kênh truyền tín hiệu số: Là tốc độ số liệu cực đại truyền kênh truyền độ rộng băng tần B C = B.log2(1 + S ) (bps) N 1.4 Quá trình biến đổi tín hiệu màu Một ảnh chuyển từ RGB sang YUV nhằm giảm dung lượng lưu trữ truyền đi, trình giải mã, trước hiển thị ảnh biến đổi ngược lại thành RGB 1.5 Các tiêu chuẩn lấy mẫu video tín hiệu số + Tiêu chuẩn 4:4:4 + Tiêu chuẩn 4:2:2 + Tiêu chuẩn 4:2:0 + Tiêu chuẩn 4:1:1 1.6 Mô hình nén tín hiệu Video Hình 1.1: Sơ đồ khối nén tín hiệu video 1.6.1 Nén tín hiệu Video: Tín hiệu video dải phổ nằm khoảng -> 6Mhz, thành phần tần số cao xuất đường viền hình ảnh nên lượng phổ tập trung miền tần số cao mà chủ yếu tập trung miền tần số thấp Điều nghĩa số lượng bit miền tần số thấp nhiều miền tần số cao Trong hệ thống nén, tỉ số nén tham số quan trọng đánh giá khả nén hệ thống, ta gọi n1, n2 số lượng bit tín hiệu trước sau nén nên ta công thức sau: Tỷ số nén Nb = n1 n2 1.6.2 Lượng tin trung bình Thông tin ký hiệu xác suất p(ai) lượng tin xác định theo công thức sau: I(ai) = log2[ ] = -log2 p(ai) p (ai ) Gọi lượng tin trung bình hình ảnh H(X) tính công thức sau: N H(X) =  p(ai) * log2[ N ] = -  p(ai) * log2 p(ai) p (ai ) Xác suất phân bố nhiều lượng tin trung bình entropy nhỏ Entropy đạt giá trị cực đại phân bố đều, ký hiệu xác suất lớn số Entropy nhỏ 1.7 Phân loại kĩ thuật nén Nén video chia thành hai họ lớn: Nén không tổn hao nén tổn hao + Nén không tổn hao quy trình biểu diễn ký hiệu dòng bit nguồn thành dòng từ mã cho ảnh khôi phục hoàn toàn giống ảnh gốc, thuật toán phụ thuộc vào cách thống kê nội dung liệu thường dựa việc thay nhóm ký tự trùng lặp nhóm ký tự đặc biệt khác ngắn mà không quan tâm đến ý nghĩa dòng bit liệu, nên đòi hỏi phải thiết bị lưu trữ đường truyền lớn + Nén tổn hao: ảnh khôi phục không hoàn toàn giống ảnh gốc, dạng nén thích hợp cho việc lưu trữ truyền ảnh tĩnh, ảnh video qua mạng băng thông hạn chế Các dạng nén thường hệ số nén cao từ 2:1 đến 100:1 1.8 Quá trình biến đổi Một số phép biến đổi phổ biến như: 1.8.1 Điều xung mã vi sai DPCM Các phương pháp nén dùng DPCM dựa nguyên tắc phát giống khác điểm ảnh gần để loại bỏ thông tin dư thừa Trong DPCM phần khác mẫu-mẫu truyền đi, khác cộng vào giá trị mẫu giải mã hành phía giải mã để tạo giá trị mẫu phục hồi 1.8.2 Mã hóa biến đổi Nhằm biến đổi hệ số miền thời gian (video số), không gian 2D (bức ảnh tĩnh) thành hệ số miền tần số Các hệ số tương quan phổ lượng tập trung hơn, thuận tiện cho việc loại bỏ thông tin dư thừa - Biến đổi cosin rời rạc DCT - Biến đổi Hadamard 1.9 Quá trình lƣợng tử Sau thực biến đối DCT, hệ số lượng tử hoá dựa bảng lượng tử Q(u,v) với 0≤u, v≤ n-1, n kích thước khối loại lượng tử hóa chủ yếu: 1.9.1 Lượng tử vô hướng Lượng tử giá trị cách độc lập hay nói cách khác ánh xạ mẫu tín hiệu ngõ vào tạo thành hệ số lượng tử ngõ Đây trình tổn hao giải lượng tử, xác định xác giá trị gốc từ số nguyên làm tròn 1.9.2 Lượng tử vector Là trình biểu diễn tập vector (mỗi vector gồm nhiều giá trị) tập số hữu hạn ký hiệu ngõ ra, bảng mã ánh xạ giá trị xấp xỉ với giá trị gốc 1.10 Quá trình mã hóa Bộ mã hóa chức loại bỏ độ dư thừa ký tự ngõ lượng tử hóa ánh xạ ký tự thành từ mã tạo thành dòng bit ngõ loại mã hóa như: mã hóa dự đoán, mã hóa VLC, mã hóa số học nhị phân, mã hóa theo hình dạng… Mã hóa độ dài thay đổi: Kỹ thuật mã hóa độ dài thay đổi VLC dựa xác suất giá trị biên độ giống ảnh để lựa chọn từ mã để mã hoá Các loại mã hóa VLC như: mã hóa Huffman, mã hoá RLC, mã hóa ExpGolomb… 1.11 Tiêu chuẩn đánh giá chất lƣợng ảnh nén Để đánh giá chất lượng ảnh (hay khung ảnh video) đầu mã hoá, người ta thường sử dụng tham số truyền thống sau để đánh giá: + Sai số bình phương trung bình + Tỉ số tín hiệu nhiễu đỉnh + Sai số tuyệt đối trung bình + Tổng sai số tuyệt đối 1.12 Kết luận chƣơng Chương phân tích sở lý thuyết kĩ thuật nén tín hiệu, số hóa tín hiệu, trình biến đổi tín hiệu màu, phân loại nguyên lý nén, kỹ thuật sử dụng nén Video, phép biến đổi kỹ thuật mã hóa, … Để hiểu rõ công nghệ nén tín hiệu video trình phát triển chuẩn nén qua thời kì, Chương trình bày khái quát chuẩn nén MPEG nói chung sâu chi tiết chuẩn nén H.264/AVC CHƢƠNG 2: NGHIÊN CỨU TIÊU CHUẨN NÉN H.264/AVC 2.1 Tổng quan chuẩn video Hiện giới hai tổ chức chịu trách nhiệm việc đưa chuẩn nén giải nén video ITU ISO - Tổ chức ITU – International Telecommunications Union chuyên tập trung vào ứng dụng truyền thông với dòng video chuẩn H.26x, với dung lượng lưu trữ nhỏ hiệu cao việc truyền tải mạng Dòng H.26x bao gồm chuẩn H.261, H.262, H.263, H.264[15] - Tổ chức ISO – International Standards Organization đưa dòng MPEG chủ yếu tập trung phát triển ứng dụng đa người dùng (phim, video, ) Dòng MPEG bao gồm chuẩn MPEG-1, MPEG-2, MPEG4 Hai tổ chức lập nên nhóm JVT – Joint Video Team để đưa chuẩn H.264 (tổ chức ISO gọi chuẩn MPEG-4 Part 10) H.264 xem dòng nén video hệ thứ Hình 2.1: Quá trình phát triển dòng video H.26x MPEG 2.2 Cấu trúc H.264 2.2.1 Không gian màu YCrCb kiểu lấy mẫu 4:2:0 Trong H.264/AVC không gian màu YCrCb chia màu hiển thị thành thành phần Y, Cr, Cb Trong đó, Y gọi thành phần luma – đại diện cho độ sáng hình ảnh Cb Cr thành phần chroma - đại diện cho thông tin màu xanh màu đỏ hình ảnh Bởi mắt người nhạy cảm chroma luma, H.264 sử dụng cấu trúc lấy mẫu: thành phần chroma số điểm ảnh ¼ so với số điểm ảnh thành phần luma Đây kiểu lấy mẫu 4:2:0 2.2.2 Macroblock Một ảnh xử lý chia thành nhiều macroblock Mỗi macroblock ứng với vùng ảnh gồm 16x16 điểm ảnh ảnh Macroblock đơn vị xử lý cho dự đoán bù chuyển động số chuẩn nén video thông dụng MPEG-1, MPEG-2, MPEG-4, H.261, H.263 H.264 Chuẩn H.264 thực lấy mẫu theo định dạng 4:2:0 Vì thế, macroblock 16x16 điểm ảnh bao gồm 256 thành phần luma Y, 64 thành phần chroma màu xanh 64 thành phần chroma màu đỏ Cr 2.2.3 Slice Ảnh mã hóa chia thành nhiều slice Một slice chứa nhiều macroblock loại slice ảnh chứa nhiều loại slice khác Các ảnh mã hóa profile chứa slice loại P I, ảnh mã hóa profile profile mở rộng chứa tập slice kiểu I, P, B, SI SP Bảng 2.1: Các loại slice mã hóa H.264 Loại Slice I (Intra) Mô tả Chứa macroblock I (mỗi macroblock Profile hỗ trợ Tất dự đoán từ liệu mã hóa slice) P (Predicted) Chứa macroblock P (mỗi macroblock Tất phần chia macroblock dự đoán từ danh sách ảnh tham chiếu list /hoặc từ macroblock I) B (Bi-predictive ) Chứa macroblock B (mỗi macroblock Profile phần chia macroblock dự đoán từ mở rộng danh sách ảnh tham chiếu list và/hoặc list và/hoặc maroblock I) SP (Switching P) Chứa macroblock kiểu I và/hoặc P, cung Profile mở cấp khả chuyển đổi dễ dàng rộng luồng bit mã hóa SI (Switching I) Chứa macroblock SI (loại maroblock đặc Profile mở biệt mã hóa Intra), cung cấp khả rộng chuyển đổi dễ dàng luồng bit mã hóa 2.2.4 Profile Chuẩn H.264 bao gồm profile Mỗi profile hỗ trợ tập chức công cụ mã hóa xác định cho nén giải nén nhằm để tạo luồng bit nén ứng với profile • Profile (Baseline Profile): Hỗ trợ mã hóa Inter mã hóa Intra (dùng slice I slice P), nén entropy sử dụng thuật toán mã hóa chiều dài thay đổi ứng ngữ cảnh CAVLC Các ứng dụng profile điện thoại video, hội nghị trực tuyến hệ thống truyền thông không dây • Profile (Main Profile): Ngoài slice I, P mã hóa, profile mã hóa video dùng slice B Mã hóa entropy dùng thuật toán mã hóa số học ứng ngữ cảnh (CABAC) Profile ứng dụng cho hệ thống broadcast truyền hình kỹ thuật số, hệ thống lưu trữ liệu • Profile mở rộng (Extended Profile): Ngoài kỹ thuật sử dụng profile phần profile chính, profile mở rộng sử dụng thêm slice SI SP mã hóa ảnh 2.3 Qui trình nén giải nén H.264 2.3.1 Quy trình nén Một Frame Fn chia thành marcroblock Với block macroblock đưa vào trình dự đoán Inter Intra kết block dự đoán P Trong trình dự đoán Intra, P tính từ slice mã hóa, giải mã tái xây dựng Còn trình dự đoán Inter P tính từ dự đoán bù chuyển động hai ảnh chọn từ ảnh tham chiếu list list Block dự đoán P trừ với block block Dn khác hai block Sau đó, block Dn biến đổi T (thường DCT) lượng tử hóa Q kết cho X Hình 2.2: Quá trình nén H.264/AVC Kết trình tái cấu trúc mã hóa entropy X, với thông tin cần 10 cho trình giải mã block tham số lượng tử , thông tin vector chuyển động, … chuyển thành luồng liệu NAL cho việc truyền tải lưu trữ Song song với trình tái cấu trúc mã hóa entropy X, hệ số X lượng tử hóa ngược Q-1 biến đổi ngược T-1 cho block D‟n Block dự đoán P cộng với D‟n để tạo block tái cấu trúc uF‟n Một lọc áp dụng lên block uF‟n để làm giảm nhiễu kết F‟n 2.3.1.1 Dự đoán 2.3.1.1.1 Dự đoán Inter Dự đoán Inter hay dự đoán bù chuyển động (Motion Compensation Prediction) dạng dự đoán sử dụng thông dụng H.264 Dự đoán Inter lợi dụng thực tế liệu điểm ảnh ảnh cần mã hóa tính tương đồng cao với liệu ảnh mã hóa trước Dự đoán Inter bao gồm quy trình chính: quản lý danh sách ảnh tham chiếu, tính toán vector chuyển động nội suy giá trị sub-sample Quản lý danh sách ảnh tham chiếu Mỗi nén giải nén quản lý danh sách gồm ảnh tham chiếu nhằm phục vụ cho dự đoán bù chuyển động macroblock mã hóa Inter slice P Danh sách List chứa ảnh giải nén, ảnh trước sau ảnh theo thứ tự hiển thị hai loại ảnh khác lưu danh sách ảnh tham chiếu bao gồm: • Ảnh ngắn hạn (shortterm picture): ảnh vừa thực trình nén tái xây dựng giải nén Ảnh xác định số khung ảnh • Ảnh dài hạn (longterm picture): ảnh lưu lâu nhớ ảnh tham chiếu Ảnh dài hạn lưu danh sách ảnh tham chiếu thay loại bỏ Ảnh xác định giá trị longtermpicnum Vector chuyển động Mỗi maroblock partition sub-macroblock partition macroblock mã hóa Inter dự đoán từ vùng ảnh kích thước ảnh tham chiếu Vector chuyển động thể dịch chuyển hai vùng ảnh, tham chiếu, vị trí tọa độ 1/4 khoảng cách hai pixel ứng với thành phần luma 1/8 ứng với thành phần chroma (Cr Cb) Tuy nhiên, điểm ảnh vị trí không tồn ảnh tham chiếu nên cần phải tính phép nội suy từ điểm ảnh lân cận mã hóa 11 ảnh tham chiếu Phép nội suy vị trí sub-sample ảnh tham chiếu Hình 2.3: Nội suy điểm ảnh vị trí half-pixel ảnh tham chiếu[17] Các điểm ảnh half-pixel (điểm ảnh điểm ảnh vị trí nguyên ảnh tham chiếu) nội suy trước Mỗi điểm ảnh half-pixel nằm liền kề với điểm ảnh vị trí nguyên (ví dụ b, h, m, s hình 2.3 nội suy từ điểm ảnh vị trí nguyên cách sử dụng lọc FIR gồm hệ số (Finite Impulse Response) với giá trị hệ số (1/32,−5/32, 5/8, 5/8,−5/32, 1/32) Chẳng hạn, half-pixel b tính từ giá trị theo chiều ngang ứng với pixel E, F, G, H, I, J theo công thức sau: b = round((E − 5F + 20G + 20H − 5I + J) /32) Tương tự, h nội suy từ điểm ảnh A, C, G, M, R, T Khi tất điểm ảnh half-pixel kề với điểm ảnh vị trí nguyên tính hết, vị trí half-pixel lại tính cách nội suy từ vị trí halfpixel tính theo chiều ngang chiều thẳng đứng so với vị trí half-pixel lại 2.3.1.1.2 Dự đoán Intra Trong trình nén ảnh, dự báo Inter lúc sử dụng Đặc biệt, cảnh chuyển đoạn phim, ảnh cảnh độ tương đồng so với ảnh truớc Lúc đó, dự đoán Intra cho ảnh nén sử dụng 12 Trong dự đoán Intra, block dự doán P tạo thành dựa block mã hóa trước ảnh Block khác biệt cách trừ block cho block dự đoán P Block khác biệt thực trình biến đổi, lượng tử nén entropy (hình 2.4) Hình 2.4: Mô hình dự báo Intra Đối với thành phần luma, block dự đoán P gồm 4x4 điểm ảnh (Intra 4x4) 16x16 điểm ảnh (Intra 16x16) Trong ảnh, dự đoán Intra 4x4 dùng cho vùng ảnh nhiều chi tiết thay đổi, Intra 16x16 dùng cho vùng ảnh tính tương đồng cao 2.3.1.2 Biến đổi lượng tử hóa Quá trình biến đổi DCT thực với block macroblock thu tập hệ số biến đổi Các hệ số lượng tử hóa nhiều phương pháp khác nhau, chẳng hạn hệ số chia giá trị nguyên, … Quá trình lượng tử làm giảm độ xác hệ số biến đổi với mức độ khác Nếu giá trị lượng tử cao đồng nghĩa với việc xuất nhiều hệ số biến đổi giá trị Điều làm tăng hiệu suất nén ảnh bù lại chất lượng ảnh sau giải nén giảm ngược lại Thông thường sau trình lượng tử, hầu hết hệ số giá trị 0, vài hệ số khác Biến đổi DCT lượng tử vô hướng Biến đổi áp dụng cho block X gồm NxN điểm ảnh (thông thường phần liệu khác biệt sau trình dự đoán) Sau trình biến đổi tạo block Y gồm NxN hệ số biến đổi Quá trình biến đổi xuôi FDCT biến đổi DCT ngược (Inverse DCT) biểu diễn dựa theo ma trận biến đổi A sau • Biến đổi xuôi FDCT (Forward DCT) block gồm NxN điểm ảnh sau: 13 Y = AXAT • Biến đổi DCT ngược (Inverse DCT): X = ATYA Lượng tử hóa: trình biến đổi tập giá trị tín hiệu X thành tập giá trị tín hiệu Y thay cho X cho số bit cần dùng để biểu diễn cho Y X loại lượng tử: lượng tử vô hướng lượng tử vector 2.3.1.3 Tái xếp Trong nén, block 4x4 hệ số biến đổi lượng tử ánh xạ thành mảng gồm 16 phần tử theo thứ tự zig-zag 2.3.1.4 Mã hóa luồng bit nén hay mã hóa Entropy Trong trình nén video, số giá trị phải mã hóa để tạo thành luồng bit nén để lưu trữ truyền dẫn nhằm phục vụ cho giải nén loại mã hóa entropy sử dụng H.264 mã hóa Exp-Golomb, mã hóa CAVLC, mã hóa CABAC Mã hóa Entropy Exp-Golomb: Mã hóa Exp-Golomb dùng để nén thành phần liệu luồng video cần mã hóa ngoại trừ phần liệu block khác biệt Mã hóa chiều dài thay đổi ứng ngữ cảnh CAVLC CAVLC (Context-based Adaptive Variable Length Coding): mã hóa chiều dài thay đổi ứng ngữ cảnh Đây dạng mã hóa entropy mà bảng từ mã (codeword table) áp dụng cho block cần mã hóa chiều dài thay đổi dựa vào phần liệu mã hóa trước (các block lân cận mã hóa) CAVLC phương pháp mã hóa entropy profile H.264dùng để mã hóa block khác biệt 4x4 2x2 gồm hệ số lượng tử sau block tái xếp Mã hóa nhị phân số học ứng ngữ cảnh CABAC CABAC (Context-based Adaptive Binary Arithmetic Coding): mã hóa nhị phân số học ứng ngữ cảnh Giống CAVLC, CABAC mã hóa phần liệu dựa phần liệu trước mã hóa block lân cận CABAC đạt tỉ lệ nén tốt dựa vào việc lựa chọn mô hình thích hợp cho liệu cần mã hóa theo ngữ cảnh ước lượng hợp lý dựa thống kê cục dùng mã hóa số học (arithmetic coding) thay cho mã hóa chiều dài thay đổi (variable-length coding) CAVLC CABAC dùng mã hóa số học nghĩa giá trị nhị phân (0 1) mã hóa Nếu giá trị nhị phân (chẳng hạn hệ số biến đổi, vector chuyển động) 14 „nhị phân hóa‟ để chuyển thành dạng nhị phân trước dùng mã hóa số học Mã hóa CABAC dùng profile 2.3.1.5 Lọc tách khối Lọc thực với macroblock sau giải nén để làm mờ cạnh block cung cấp khả hiển thị hình ảnh sau giải nén tốt Đây cải tiến H.264 so với chuẩn nén video trước Tại nén, lọc tách khối thực cho macroblock trước trình lưu trữ macroblock làm tham chiếu cho dự đoán sau Các maroblock sau lọc sử dụng cho việc dự doán bù chuyển động cho ảnh tương lai Tại giải nén, lọc thực trước macroblock tái xây dựng hiển thị Hình 2.5: Thứ tự lọc cạnh thành phần luma chroma macroblock 2.3.2 Quy trình giải nén Hình 2.6: Quy trình giải nén video chuẩn H.264/AVC 15 Bộ giải nén nhận luồng bit nén truyền dẫn nén, thực giải nén entropy tái xếp thành phần liệu để tạo tập hệ số biến đổi lượng tử X Sau đó, tập hệ số X lượng tử ngược biến đổi ngược để tạo block khác biệt D‟n Bộ giải nén dùng thông tin từ việc giải nén luồng bit để tạo block dự đoán P hai phương pháp dự đoán (Inter Intra), block giống với block dự đoán tạo nén Block P cộng với block khác biệt D‟n để tạo thành block uF‟n Block uF‟n lọc tách khối để tạo thành block F‟n lọc để dùng cho việc hiển thị 2.3.2.1 Giải mã luồng bit nén Bộ giải nén nhận luồng bit nén H.264, tiến hành giải nén thành phần liệu, tái tạo lại thông tin nén nén hệ số biến đổi lượng tử, thông tin dự đoán, Sau thông tin được dùng để thực lại trình biến đổi lượng tử ngược nhằm tái xây dựng lại chuỗi gồm ảnh video 2.3.2.2 Rescaling biến đổi ngược Các hệ số biến đổi lượng tử re-scaled (mỗi hệ số nhân với giá trị nguyên để phục hồi lại giá trị ban đầu nó) 2.3.2.3 Tái xây dựng Với macroblock, giải nén tạo block P giống với block tạo nén Bộ giải nén cộng block với phần block khác biệt tạo thành trình giải nén để tái xây dựng block Sau đó, block lọc dùng để hiển thị phần ảnh video 2.4 Những ƣu điểm chuẩn nén H.264 so với chuẩn trƣớc • Ƣu điểm nén không gian: Chuẩn nén H.264 hai cải tiến lĩnh vực nén không gian Trước hết, lập mã tiến hành nén không gian macroblock 16x16 điểm ảnh thay block 8x8 trước Điều giúp tăng cường đáng kể khả nén không gian hình ảnh chứa nhiều khoảng lớn điểm ảnh giống Thứ hai thao tác nén tiến hành miền không gian trước công đoạn DCT diễn Chuẩn nén H.264 so sánh macroblock thời với macroblock kế bên khung, tính toán độ chênh lệch, sau gởi đoạn chênh lệch tới DCT Điều giúp cải thiện khả nén ảnh chi tiết 16 • Ƣu điểm nén thời gian: Điểm cải tiến lớn H2.64 chế độ mã hoá Những phương pháp tiên tiến chế độ khiến cho nén thời gian đạt đến cấp độ cao nhiều, với chất lượng chuyển động tốt so với chuẩn MPEG trước • Kích cỡ khối: Ở chế độ khối, MPEG-2 hỗ trợ macroblock 16x16 điểm ảnh, không đủ độ phân giải để mã hoá xác chuyển động phức tạp phi tuyến tính, ví dụ phóng hay to thu nhỏ Ngược lại, H.264 lại tăng cường hiệu chỉnh chuyển động cách cho phép lập mã biến đổi kích cỡ thành phần chói macroblock Việc phân chia macroblock cho phép lập mã xử lý vài loại chuyển động tuỳ theo độ phức tạp chuyển động nguồn lực tốc độ bit Nhìn chung, kích cỡ phân chia lớn phù hợp với việc xử lý chuyển động khu vực giống ảnh, kích cỡ phân chia nhỏ lại ích xử lý chuyển động chỗ nhiều chi tiết Kết chất lượng hình ảnh cao hơn, bị vỡ khối + Độ xác hiệu chỉnh chuyển động + Chọn nhiều hình tham chiếu + Giải khối tích hợp • Ƣu điểm lƣợng tử hóa biến đổi: Chấm di động 8x8 DCT với dung sai lỗi làm tròn phần cốt lõi chuẩn MPEG trước H.264 độc đáo chỗ sử dụng biến đổi không gian nguyên (gần giống DCT) khối 4x4 điểm ảnh Kích cỡ nhỏ giúp giảm bớt tượng “kết khối”, thông số nguyên tuyệt đối giúp loại bỏ nguy không thích ứng lập mã giải mã phép biến đổi ngược • Ƣu điểm má hóa entropy: Sau tiến hành hiệu chỉnh, biến đổi lượng tử hoá chuyển động, lập mã MPEG trước vạch symbol biểu diễn vector chuyển động hệ số lượng tử hoá thành bit thực Ví dụ chuẩn nén MPEG-2 sử dụng phương pháp mã chiều dài biến thiên tĩnh (VLC-Variable-length code) tối ưu hoá môi trường video thời gian thực (trong nội dung cảnh biến đổi theo thời gian) Chuẩn nén H.264 sử dụng mã hoá thuật toán nhị phân theo tình CABAC (Context-Adaptive Binary Arithmetic Coding) Hiệu suất mã hoá CABAC cao hẳn nhờ khả thích nghi với thay đổi xảy phân bổ symbol 17 2.5 Kết luận chƣơng Chương vào chi tiết chuẩn mã hóa H.264 như: Cấu trúc codec H.264 (bộ mã hóa giải mã hóa), cấu trúc liệu H.264, profile H.264 số kỹ thuật H.264, ưu điểm chuẩn nén H.264 so với chuẩn mã hóa video trước Chƣơng 3: ỨNG DỤNG TIÊU CHUẨN NÉN H.264/AVC TRONG TRUYỀN HÌNH ĐỘ PHÂN GIẢI CAO HDTV 3.1 Các thông số kỹ thuật đặc trƣng cho hệ thống Truyền hình độ phân giải cao HDTV 3.1.1 Khái niệm Truyền hình HDTV HDTV viết tắt chữ High Definition Television (truyền hình độ nét cao), so với SDTV độ phân giải cuả hình tạo từ 720x480 hay 768x576 tạo 400.000 pixel HDTV độ phân giải hình taọ từ 1280x720 gần triệu pixel (Ready HD) hay 1920x1080 triệu pixel (Full HD) độ phân giải HDTV gấp từ 2,5 đến lần SDTV Vì HDTV thể hình ảnh chi tiết ro nét Sự khác biệt lớn SDTV HDTV độ phân giải Hệ thống HDTV quảng bá xác định với ba thông số chính: • Kích thƣớc khung định nghĩa số lượng pixel ngang x số pixe dọc, ví dụ 1280 x 720 1920 x 1080 • Chức quét hệ thống xác định chữ i cho cách quét xen kẽ p cho quét liên tục • Tốc độ khung xác định số lượng khung/giây 3.1.2 Kỹ thuật xử lý tín hiệu thông số đặc trưng Đối với truyền hìn số độ phân giải tiêu chuẩn (SDTV) - Số hoá tín hiệu kiểu PCM - Số bít /mẫu: bít hay 10 bít - Định dạng mẫu: 4: 2: sản xuất thường 4: 2: truyền dẫn (thường áp dụng ) - Nén tín hiệu: MPEG2 - Ghép kênh kiểu xác xuất thống kê theo thời gian - Điều chế: 4-PSK , QAM, COFDM tuỳ theo hệ thống truyền hình - Loại mã sửa sai đường truyền: 3/4; 4/5; 5/6… 18 - Tốc độ bít: sản xuất thường cỡ khoảng 20 Mb/s, truyền dẫn thường cỡ khoảng 3Mb/s Đối với truyền hình số độ phân giải cao (HDTV) Về bản, khâu xử lý tương tự hệ thống truyền hình SDTV khác chỗ kỹ thuật nén sử dụng MPEG2 hay MPEG4, H.264 Tốc độ bít đương nhiên cao hơn, truyền dẫn phát sóng lên tới 20 Mb/s, tỷ lệ khuôn hình 16/9 3.2 Ứng dụng H.264 truyền dẫn phát sóng HDTV Sản phẩm Truyền hình chương trình Truyền hình sau hoàn thành xong khâu từ tiền kỳ đến hậu kỳ Một công việc đưa chương trình đến máy thu hình người xem Sử dụng phương tiện kỹ thuật áp dụng cách xử lý tín hiệu hình ảnh âm như: Truyền trực tiếp dây dẫn, truyền dạng sóng điện từ dùng thiết bị như: Máy phát hình mặt đất, vệ tinh, cáp quang để đưa tín hiệu tới máy thu phủ sóng toàn quốc 3.2.1 Sơ đồ tổng quan truyền dẫn phát sóng Đài Truyền hình Hình 3.1: Các tín hiệu vào phòng tổng khống Nhiệm vụ phòng Tổng khống chế Là phòng điều hành Trung tâm sản xuất chương trình truyền hình để từ làm nhiệm vụ chuyển mạch, phân đường chọn nguồn tín hiệu vào phân 19 chia tín hiệu đài phát hình mặt đất, phát lên vệ tinh studio hay phòng máy Các tín hiệu vào phòng tổng khống chế mô tả hình 3.1 3.2.2 Truyền dẫn phát sóng HDTV kênh Truyền hình Quốc Phòng 3.2.2.1 Chuẩn file phát sóng kênh Hiện QPVN phát chuẩn mpeg2, mpeg4, h264 sau thử nghiệm với chuẩn khác dùng file video chuẩn H.264 thông số sau Video Format: H.264 Field Order: Progressive TV Standard: PAL Aspect: Square Pixels (1.0) Profile: Main Frame rate: 25 fps WxH: 1920X1080 Level: 4.1 Bitrate Encoding: CBR (Tốc độ bít không đổi) Target Bitrate [Mbps]: 20 Audio Audio Format: AAC Audio Codec: AAC Channels: Stereo Sample Rate: 48000 Hz Audio Quality: High Bitrate [kbps]: 320 + m file phát sóng sau trộn (mix) Mức thấp khoảng - 20 dB Mức cao khoảng - dB + m file không trộn: - Kênh (Thuyết minh) khoảng - 6dB - Kênh (Tiếng động nền) khoảng - 20 db đến - 15dB (khoảng 70 kênh 1) 20 3.2.2.2 Sơ đồ tổng quan Kênh Nhiệm vụ phòng phát sóng: + Phát chương trình trực tiếp: Các tin thời sự, tọa đàm… Studio + Phát chương trình từ băng thành phẩm: Chuyên đề, phim truyện… + Phát trực tiếp chương trình thu qua vệ tinh: Bóng đá, thời trị… + Phát tường thuật trực tiếp kiện bên qua hệ thống thu phát truyền hình trực tiếp xe truyền hình lưu động: Quốc hội họp… + Phát thẳng tín hiệu trường quay tin thời (6h00, 12h, 20h…) số tin thông báo đột xuất Theo sơ đồ hình 3.3 ta lấy Master Control Router 32x32 làm trung tâm, khối bên trái nguồn input, khối bên phải output + Khối H.264: nhận file chuẩn phát sóng là: mpeg-4, H.264 Tất định dạng file khác mà đạo diễn nhận từ phòng tư liệu, file từ phía đối tác bên ngoài… phải convert sang định dạng H.264 trước đưa vào phát sóng Mặc dù thống chuẩn file video phát sóng H.264 nói trên, nhiên dự phòng máy tính convert file video sang chuẩn H.264 Mục đích việc dự phòng ích số trường hợp sau: • chương trình đạo diễn nhận từ phòng tư liệu định dạng mpg, avi, mov • đối tác bên nhiều lý khác mà đưa file định dạng theo yêu cầu thời gian phát sóng cận kề, việc yêu cầu đối tác xuất file lại với chuẩn file phù hợp không khả thi vào thời điểm dùng máy convert file • nhiều lý mà kỹ thuật dựng xuất chương trình không chuẩn H.264 quy định (mặc dù chuẩn file H.264, số thông số khác chưa phù hợp) mà thời gian để kỹ thuật dựng xuất lại không khả thi nhiều lý giải pháp dùng máy convert file hợp lý Ở dùng phần mềm Adobe Premiere (Hình 3.2) chủ yếu để xuất lại file cho chuẩn phát sóng 21 Hình 3.2: Phần mềm convert Adobe Premiere Pro CC 2017 Hình 3.3: Sơ đồ truyền dẫn phát sóng kênh Truyền hình Quốc phòng Về khối bên trái (nguồn input): tín hiệu từ server phát sóng K2-EDGE main backup vào ACO (tự động chuyển đổi tín hiệu) vào router + Thiết bị đầu AG file đệm sóng chuẩn MPEG 4, H.264 dùng cho cố sóng chuyển sang nguồn để phát 22 + Frame1,2(1801): dùng để cắm tín hiệu vào như: tín hiệu Live, liveU… + CG convert : tín hiệu Key, fill : để bắn logo, chữ chạy, POPUP + FIBER : dùng cho tín hiệu quang trắng + Studio1,2… n: tín hiệu từ trường quay vào + X50: up/down converter tín hiệu , Hiện dùng cho tín hiệu VTV1 để tiếp sóng hàng ngày + Tín hiệu đồng lấy từ anten GPS đưa qua TG800 đưa vào khuếch đại (video amplifier) đến thiết bị Nếu anten GPS bị hỏng TG800 chuyển chế độ internal tự phát xung đồng Khối bên phải output: tín hiệu main backup đưa vào Frame1,2(3901) qua Frame LOGO HD SD đưa qua ACO để dự phòng hai tín hiệu bị mất, sau vào khuếch đại đưa đến encoder truyền dẫn đến Tổng khống chế Viettel 3.2.2.3 Ƣu nhƣợc điểm việc ứng dụng triển khai chuẩn nén H.264/AVC cho truyền dẫn phát sóng HDTV Kênh H.264/AVC giảm tốc độ bit xuống 50 so với chuẩn MPEG-2 Tốc độ bít MPEG-2 40 Mbps tốc độ bít H.264 20 Mbps (đối với truyền dẫn phát sóng kênh) Với hiệu suất sử dụng băng thông tăng từ 30 đến 131%, số chương trình mà H.264/AVC mang lại tăng gấp ba so với việc dùng MPEG-2, ví dụ phát 21-26 chương trình SDTV 5-6 chương trình HDTV transponder 36Mhz Tỉ lệ nén H.264 ½ so với nén MPEG-2 Chất lượng nén video H.264 rõ nét nén video MPEG-2 Chi phí đầu tư cho hệ thống truyền dẫn phát sóng HDTV chuẩn H.264 thấp nhiều so với chi phí đầu tư chuẩn MPEG-2, AVI… trước Hệ thống truyền dẫn phát sóng H.264 nhỏ gọn, không cồng kềnh, thao tác dễ dàng, không phức tạp Tuy nhiên, H.264 đòi hỏi cấp độ phức tạp cao phần cứng phần mềm trình mã hóa lẫn giải mã Một số kênh, đài truyền hình địa phương muốn tiếp sóng trực tiếp kênh khó khăn hệ thống truyền dẫn, tiếp sóng không đồng 3.3 Kết luận chƣơng H.264 tỉ lệ nén cao nên phạm vi ứng dụng rộng bao gồm tất 23 hình thức nén video kĩ thuật số từ Internet bit-rate thấp streaming ứng dụng để phát sóng HDTV Điện ảnh kĩ thuật số ứng dụng với gần lossless mã hóa Chương trình bày ứng chuẩn nén H.264 truyền hình độ phân giải cao, cụ thể truyền dẫn phát sóng chuẩn full HD kênh Truyền hình Quốc phòng Việt Nam KẾT LUẬN HƢỚNG PHÁT TRIỂN CỦA ĐỀ TÀI Trong luận văn trình bày chuẩn nén H.264/AVC ứng dụng chuẩn nén H.264 truyền hình độ phân giải cao Chuẩn nén H.264 đánh dấu bước ngoặt lĩnh vực nén video, áp dụng kỹ thuật tiên tiến nhằm mục đích sử dụng băng thông hiệu đem lại chất lượng ảnh cao Với kỹ thuật này, MPEG-4 AVC 24 giảm tốc độ bit xuống 50 so với chuẩn MPEG-2 Tuy nhiên, MPEG-4 AVC đòi hỏi cấp độ phức tạp cao trình mã hóa lẫn giảiChuẩn H.264 làm giảm băng thông cần thiết để truyền video so với hệ thống cung cấp dựa MPEG Video phân phối với chất lượng cao chất lượng sử dụng tốc độ bit thấp Nhờ đó, hãng truyền hình khả cung cấp dịch vụ chất lượng cao, mở rộng khác biệt hết với mức chi phí hợp lý hiệu Hướng phát triển luận văn nghiên cứu hệ nén, thực nghiệm nén với chuẩn mã hóa H.265 (HEVC - High Efficiency Video Coding) Đồng thời nghiên cứu thêm phương pháp để nén video hiệu Áp dụng kiến thức nghiên cứu kết thực nghiệm vào thực tế ... với tiêu chuẩn nén trước Với mong muốn đóng góp thêm nghiên cứu tiêu chuẩn nén H.264 ứng dụng H.264, người viết lựa chọn đề tài Nghiên cứu tiêu chuẩn nén H.264 ứng dụng truyền hình có độ phân giải. .. Chƣơng 3: ỨNG DỤNG TIÊU CHUẨN NÉN H.264/ AVC TRONG TRUYỀN HÌNH CÓ ĐỘ PHÂN GIẢI CAO HDTV 3.1 Các thông số kỹ thuật đặc trƣng cho hệ thống Truyền hình độ phân giải cao HDTV 3.1.1 Khái niệm Truyền hình. .. giải cao (HDTV) Luận văn em gồm chương: Chương 1: Nghiên cứu sở lý thuyết số hóa tín hiệu nén video số Chương 2: Nghiên cứu tiêu chuẩn nén H.264/ AVC Chương 3: Ứng dụng tiêu chuẩn nén H.264/ AVC truyền

Ngày đăng: 23/10/2017, 11:20

Hình ảnh liên quan

Hình 1.1: Sơ đồ khối nén tín hiệu video - Nghiên cứu tiêu chuẩn nén h.264 và ứng dụng trong truyền hình có độ phân giải cao (HDTV) (tt)

Hình 1.1.

Sơ đồ khối nén tín hiệu video Xem tại trang 5 của tài liệu.
Hình 2.1: Quá trình phát triển các dòng video H.26x và MPEG - Nghiên cứu tiêu chuẩn nén h.264 và ứng dụng trong truyền hình có độ phân giải cao (HDTV) (tt)

Hình 2.1.

Quá trình phát triển các dòng video H.26x và MPEG Xem tại trang 8 của tài liệu.
Bảng 2.1: Các loại slice mã hóa trong H.264 - Nghiên cứu tiêu chuẩn nén h.264 và ứng dụng trong truyền hình có độ phân giải cao (HDTV) (tt)

Bảng 2.1.

Các loại slice mã hóa trong H.264 Xem tại trang 9 của tài liệu.
Hình 2.2: Quá trình nén H.264/AVC - Nghiên cứu tiêu chuẩn nén h.264 và ứng dụng trong truyền hình có độ phân giải cao (HDTV) (tt)

Hình 2.2.

Quá trình nén H.264/AVC Xem tại trang 10 của tài liệu.
Hình 2.3: Nội suy các điểm ảnh tại các vị trí half-pixel trong ảnh tham chiếu[17] - Nghiên cứu tiêu chuẩn nén h.264 và ứng dụng trong truyền hình có độ phân giải cao (HDTV) (tt)

Hình 2.3.

Nội suy các điểm ảnh tại các vị trí half-pixel trong ảnh tham chiếu[17] Xem tại trang 12 của tài liệu.
Hình 2.4: Mô hình dự báo Intra - Nghiên cứu tiêu chuẩn nén h.264 và ứng dụng trong truyền hình có độ phân giải cao (HDTV) (tt)

Hình 2.4.

Mô hình dự báo Intra Xem tại trang 13 của tài liệu.
Hình 2.6: Quy trình giải nén video của chuẩn H.264/AVC - Nghiên cứu tiêu chuẩn nén h.264 và ứng dụng trong truyền hình có độ phân giải cao (HDTV) (tt)

Hình 2.6.

Quy trình giải nén video của chuẩn H.264/AVC Xem tại trang 15 của tài liệu.
Hình 2.5: Thứ tự lọc các cạnh của thành phần luma và chroma trong 1 macroblock - Nghiên cứu tiêu chuẩn nén h.264 và ứng dụng trong truyền hình có độ phân giải cao (HDTV) (tt)

Hình 2.5.

Thứ tự lọc các cạnh của thành phần luma và chroma trong 1 macroblock Xem tại trang 15 của tài liệu.
Hình 3.2: Phần mềm convert Adobe Premiere Pro CC 2017 - Nghiên cứu tiêu chuẩn nén h.264 và ứng dụng trong truyền hình có độ phân giải cao (HDTV) (tt)

Hình 3.2.

Phần mềm convert Adobe Premiere Pro CC 2017 Xem tại trang 22 của tài liệu.
Hình 3.3: Sơ đồ truyền dẫn phát sóng của kênh Truyền hình Quốc phòng - Nghiên cứu tiêu chuẩn nén h.264 và ứng dụng trong truyền hình có độ phân giải cao (HDTV) (tt)

Hình 3.3.

Sơ đồ truyền dẫn phát sóng của kênh Truyền hình Quốc phòng Xem tại trang 22 của tài liệu.

Từ khóa liên quan

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan