Nghiên cứu về một số chuẩn nén sử dụng trong hệ thốngtruyền hình 3D

66 1K 4
Nghiên cứu về một số chuẩn nén sử dụng trong hệ thốngtruyền hình 3D

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Nghiên cứu về một số chuẩn nén sử dụng trong hệ thốngtruyền hình 3D

LỜI CẢM ƠN Trên đường thành công không vắng bóng người thầy đầy nhiệt huyết, giúp đỡ bạn bè đặc biệt niềm tin gia đình Trong suốt năm ngồi giảng đường đại học vừa qua, em nhận nhiều kiến thức bổ ích hành trang để em bước vào đời Để hoàn thành đồ án này, em xin tỏ lòng biết ơn sâu sắc đến thầy giáo ThS Nguyễn Đình Thạch, tận tình hướng dẫn em suốt trình viết đồ án tốt nghiệp Em chân thành cảm ơn quý Thầy, Cô trong tổ môn “Điện tử viễn thông” khoa Điện-Điện Tử Tàu Biển- Trường Đại Học Hàng Hải Việt Nam, tận tình truyền đạt kiến thức năm em học tập Với vốn kiến thức hạn chế không tránh khỏi thiếu sót điều chắn, em mong nhận ý kiến đóng góp quý báu quý Thầy Cô bạn để kiến thức em lĩnh vực hoàn thiện Hải Phòng, ngày 21 tháng 12 năm 2015 Sinh viên thực Phạm Thị Quyên i LỜI CAM ĐOAN Tôi xin cam đoan công trình nghiên cứu riêng hướng dẫn khoa học thầy giáo ThS Nguyễn Đình Thạch Các nội dung nghiên cứu, kết đề tài trung thực chưa công bố hình thức trước Ngoài ra, đồ án có thông tin trích dẫn ghi rõ nguồn gốc Nếu phát có gian lận xin hoàn toàn chịu trách nhiệm nội dung đồ án Sinh viên thực Phạm Thị Quyên ii Mục Lục DANH MỤC CÁC CHỮ VIẾT TẮT v DANH MỤC CÁC HÌNH .viii LỜI MỞ ĐẦU .1 .1 CHƯƠNG I: TỔNG QUAN VỀ TRUYỀN HÌNH 3D 1.1Giới thiệu truyền hình 3D .2 1.1.1Khái niệm chất 1.1.2Tiêu chuẩn sản xuất hiển thị .4 1.1.3Các hệ công nghệ truyền hình 3D 1.1.4 Phân loại hình 3D 1.2Khái quát kỹ thuật lập thể 1.3Nguyên tắc tạo hình ảnh truyền hình 3D 1.3.1 Thiết bị hộ trợ hiển thị 3D 1.3.2Hiển thị 3D không sử dụng thiết bị hỗ trợ 1.4Cơ chế truyền dẫn tín hiệu truyền hình 3D .17 1.5Tái tạo tín hiệu truyền hình 3D 19 1.6 Biểu diễn hình ảnh 3DTV 19 1.6.1 Nén không gian 19 1.6.2 Ghép kênh theo thời gian 20 1.6.3 2D kết hợp với siêu liệu (2D + M) 20 1.6.4 Gửi tín hiệu mã hóa màu 20 CHƯƠNG II: KỸ THUẬT NÉN HÌNH ẢNH 3D SỬ DỤNG BỘ GHÉP DPCM/DCT 21 2.1 Mô hình hệ thống nén chung 21 2.2 Phân loại kỹ thuật nén 22 2.2.1 Dự đoán tuyến tính (DPCM- Differential Pulse Code Modulation) .22 2.2.2 Biến đổi cosin rời rạc ( DCT) .23 2.2.3 Mã hoá chạy dài RLC (Run Length Coding) 23 2.2.4 Mã hoá độ dài thay đổi VLC (Variable Length Coding) .23 2.3 Nén liệu sử dụng phương pháp điều chế xung mã vi sai DPCM 24 iii 2.3.1 Xử lý giải tương quan công nghệ DPCM 24 2.3.2 Kỹ thuật tạo dự đoán 25 2.4 Nén liệu sử dụng biến đổi cosin rời rạc DCT .27 2.5 Kỹ thuật nén hình ảnh 3D sử dụng ghép DPCM/DCT .30 2.5.1 Lập sơ đồ mã hóa ghép DPCM/DCT 31 2.5.2 Tạo lập đồ cho kỹ thuật nén hình ảnh ba chiều 32 2.5.3 Giải tương quan Inter-band .32 2.5.4 Giải tương quan intra-band .34 2.6 Lập sơ đồ lượng tử hóa liệu hình ảnh 35 2.6.1 Lựa chọn bảng lượng tử .36 2.6.2 Thay đổi giải tương quan liệu hình ảnh 37 2.7 Mã hóa Entropy hệ số lượng tử hóa hình ảnh phụ 38 2.8 Nâng cao để giảm tương quan theo chiều dọc Intra-band 40 CHƯƠNG III: KỸ THUẬT NÉN HÌNH ẢNH 3D THEO TIÊU CHUẨN H246/AVC 43 3.3.1Sự phân hình ảnh macroblocks slices 44 3.3.3.1Lớp mã hóa Video (VCL-Video coding layer) 48 3.3.3.2Lớp mạng trừu tượng mạng (Networl Abstraction Layer – NAL) .49 3.4.2 Bù chuyển động slice P .51 3.4.3Bù chuyển động slices B 52 3.5.1Mã hóa entropy .54 3.5.2Bộ lọc tách khối vòng (IN-LOOP DEBLOCKING FILTER) 54 Ứng dụng 55 KẾT LUẬN VÀ KIẾN NGHỊ 56 TÀI LIỆU THAM KHẢO .58 iv DANH MỤC CÁC CHỮ VIẾT TẮT 3D Three-Dimensional ITU International Telecommunication Union HDTV High definition television DFT Discrete Fourier transform DCT Discrete Cosine Transform FDCT Forward Discrete Cosine Transformation IDCT Inverse discrete cosine transform VLC Variable Length Coding RLC Run Length Coding PCM Pulse code modula DPCM Differential pulse code modula DC Direct Current AC Alternating current EOB End of subimage block JPEG Joint Photographic Experts Group AVC Advanced Video Coding ITU-T International Telecommunication Union – Telecommunication SD Standard Definition HD High definition VCEG Video Coding Experts Group MPEG Moving Picture Experts Group MVC Multiview video coding NAL Network Abstraction Layer v VCL Video coding layer IDR Instantaneous decoding refresh CAVLC Context-based adaptive variable-length coding CABAC Context-based adaptive binary arithmetic coding MB Macroblock P Predictive B Bi-predictive SP Switching Predictive SI Switching Intra I Intra ME Motion estimation MC Motion compensated vi DANH MỤC CÁC HÌNH Hình 1.1 Mô tả tạo thành hình ảnh 3D Hình 1.2 Hiển thị truyền hình 3D sử dụng kính Hình 1.3 Biểu diễn loại kính hiển thị Hình 1.4 Hình ảnh mô tả hiển thị ghép màu Hình 1.5 Kính phân cực giống loại kính râm thông thường Hình 1.6 Phương pháp hoạt động rào cản thị sai –công nghệ 11 hiển thị autostereoscopic 3D Hình 1.7 Phương pháp hoạt động ống kính dạng thấu 12 kính- công nghệ hiển thị autostereoscopic 3D Hình 1.8 Biểu diễn nguyên tắc hiển thị lập thể đa điểm 13 Hình 1.9 Cho thấy hình hiển thị hai điểm tạo 14 nhiều vùng xem Hình 1.10 Biểu diễn thay đổi vùng nhìn người 15 xem di chuyển đầu họ Hình 1.11 Biểu diễn điểm hiển thị autostereo với thùy 16 Hình 1.12 Biểu diễn 16 điểm hiển thị autostereo với 16 thùy nhất, với nhiều người sử dụng Hình 1.13 Chu trình phát sóng truyền hình 3D 18 Hình 2.1 Mô hình chung hệ thống nén video 21 Hình 2.2 Cấu trúc mã hóa giải mã DPCM 24 Hình 2.3 Sơ đồ cấu trúc mã hóa giải mã DPCM có dự 26 đoán Hình 2.4 Minh họa trình mã hóa DCT chiều 28 Hình 2.5 Quá trình mã hóa DCT hai chiều 29 Hình 2.6 Khối DCT ba chiều 30 Hình 2.7 Sơ đồ mã hóa video dựa sở ghép 31 DPCM/DCT Hình 2.8 Dự đoán tuyến tính cho giải tương quan viii 34 hình ảnh miền không gian Hình 2.9 Độ lệch chuẩn trung bình giải tương quan hệ 37 số hình ảnh phụ phương pháp ghép DPCM / DCT Hình 2.10 Sơ đồ quét quét zig zag 39 Hình 2.11 Quá trình quét hệ số DCT sử dụng mã RLC để 40 mã hóa tín hiệu Hình 2.12 Kế hoạch nén hình ảnh 3D tích hợp dựa sở 41 ghép DPCM/DCT Hình 2.13 Thay đổi mã hóa ghép DPCM / DCT để cải thiện 42 giảm tương quan intra-band theo chiều dọc Hình 2.14 Quá trình quét zig zag với 63 hệ số AC 42 Hình 3.1 Cấu trúc dòng video H264/AVC 45 Hình 3.2 Mã hóa H264/MPEG-4 AVC 46 Hình 3.3 Mô tả khối NAL với phần payload nội dung 49 video Hình 3.4 Nguyên lý bù chuyển động 50 Hình 3.5 Phân vùng macroblock (trên) sub- 51 macroblock (dưới) để dự đoán bù chuyển động Hình Bù chuyển động đa khung, vector 52 chuyển động thông số tham khảo hình ảnh (D) truyền Hình 3.7 Bù chuyển động slice B 53 Hình 3.8 Sử dụng lọc tách khối với hình nén hình ảnh 55 Hình ảnh bên trái không sử dụng lọc tách khối, hình ảnh bên phải sử dụng lọc tách khối ix LỜI MỞ ĐẦU Ngày phát triển khoa học kỹ thuật kéo theo nhu cầu người ngày cao Và số nhu cầu thiết yếu giải trí truyền hình Trong thời gian gần đây, truyền hình 3D lên xu hướng thời đại, người ta cho truyền hình 3D giúp người trải nghiệm góc nhìn khác nhau, cảm xúc mà hai góc nhìn bình thường đáp ứng Kể từ sau phim 3D Avatar mắt rạp Vincom Hà Nội, 3D trở thành hướng quan trọng công nghệ điện ảnh Và tự hỏi: Khi khán giả truyền hình xem chương trình 3D qua ảnh truyền hình? Để giải đáp câu hỏi em xin chọn đề tài: “Nghiên cứu số chuẩn nén sử dụng hệ thống truyền hình 3D “ Nhằm đánh giá khả phát triển với kỹ thuật truyền hình ảnh công nghệ 3D Phần nội dung đồ án phân bố thành chương sau: - CHƯƠNG I: Tổng quan truyền hình 3D CHƯƠNG II: Kỹ thuật nén hình ảnh 3D sử dụng ghép DPCM/DCT CHƯƠNG III: Kỹ thuật nén hình ảnh 3D theo tiêu chuẩn H246/AVC Do thời gian kiến thức hạn chế nên không tránh khỏi thiếu sót Em mong nhận góp ý, bảo thầy, cô để em rút kinh nghiệm bổ sung kiến thức cho sau Em xin gửi lời cảm ơn chân thành tới thầy giáo Nguyễn Đình Thạch tạo điều kiện hướng dẫn tận tình em suốt thời gian em làm đồ án Qua em xin chân thành cảm ơn thầy, cô giáo tổ môn “Điện tử viễn thông” khoa điện-điện tử tàu biển trường đại học Hàng Hải tạo điều kiện để em làm đồ án Em xin chân thành cám ơn.! Hải Phòng Ngày 21 tháng 11 năm 2015 CHƯƠNG I: TỔNG QUAN VỀ TRUYỀN HÌNH 3D 1.1 Giới thiệu truyền hình 3D 1.1.1 Khái niệm chất a Khái niệm Công nghệ truyền hình 3D có đến 100 năm lịch sử, với ý tưởng ứng dụng hình ảnh lập thể nhiếp ảnh gia người Anh từ năm 1890 Nhưng đến phim bom 3D Avatar trình chiếu năm 2009 truyền hình 3D trở thành nàn sóng công nghệ truyền hình giới Có thể thấy chất lượng truyền hình 3D tầm cao so với truyền hình 2D truyền thống Truyền hình công nghệ 3D tập trung vào bốn lĩnh vực trọng điểm: âm nhạc, thể thao, nghệ thuật điện ảnh Hiện có nhiều chương trình truyền hình như: phim truyện, phim hoạt hình, du lịch, thử nghiệm phiên 3D Sự kiện đánh dấu cho bùng nổ truyền hình 3D chắn phải nhắc đến kiện World Cup 2010, thời điểm nhiều khán giả quốc gia giới chiêm nghưỡng với trận cầu đỉnh cao tường thuật trực tiếp với công nghệ So với công nghệ 2D cho hình ảnh hai chiều chiều rộng chiều cao, công nghệ 3D dựa vào đặc điểm cảm nhận của mắt não người để tạo hiệu ứng cho chiều sâu ảnh Công nghệ 3D tạo cho người xem có cảm giác giới thực chương trình truyền kênh giải trí, phim truyện,… Cùng nội dung truyền hình 3D phát cách đồng thời phát làm hai hình ảnh cảnh, mắt phải nhận hình ảnh, mắt trái nhận hình ảnh lại Khi xem truyền hình 3D yêu cầu sử dụng kính đặc dụng, hình ảnh từ hai mắt nhận xếp khít vào tạo cho người xem cảm nhận hiệu ứng 3D Hiệu ứng gọi ảo giác lập thể Theo Liên minh viễn thống Quốc tế (ITU), truyền hình 3D hệ thống tạo độ sâu ảnh giống cảnh thực tế mà cảm nhận gới thực tiến, mã hóa cải thiện hiệu hơn, tăng hiệu kênh truyền, truyền dẫn video chất lượng cao Với đời tiêu chuẩn H.264 / MPEG-4 AVC (Advanced Video Coding ) cải thiện đáng kể khả nén video Tiêu chuẩn phát triển nhóm phối hợp video ITU-T nhóm chuyên gia mã hóa video (VCEG-Video Coding Experts Group) nhóm chuyên gia ảnh động ISO / IEC (MPEG- Moving Picture Experts Group ) chuẩn hóa mở rộng công nghệ gọi mã hóa video đa điểm (MVCmultiview video coding) H264/AVC cải thiện đáng kể hiệu giảm tỷ lệ bit méo tốc độ bít đó, tiết kiệm tốc độ bít gần hai lần so với tiêu chuẩn trước MPEG video 3.2 Bản chất nén video H264/AVC H264/AVC phát triển dựa ưu điểm chuẩn trước để giảm bớt độ dư thừa dư liệu (đặc biệt chuẩn H263/ AVC MPEG-4 ) hiệu nén cao H264 phân chia hình ảnh thành slice, slice gồm nhiều khối khác Với độ phân giải ảnh khác lấy mẫu thành phần tín hiệu chói khác nhau, thành phần tín hiệu màu lấy mẫu theo chiều ngang chiều dọc với tần số thấp H264 khai thác dư thừa mặt không gian thời gian Trong không gian hình ảnh khung có thay đổi chi tiết ảnh, dựa thay đổi để dự đoán hình ảnh thực bù chuyển động Giảm bớt dư thừa liệu mặt thời gian ảnh giống lặp lại nhiều lần khung liên tiếp, dựa lặp ta cần mã hóa chúng để giảm dung lượng bit cần truyền cho chất lượng nén đạt hiệu cao 3.3 Kỹ thuật nén video H264/ AVC 3.3.1 Sự phân hình ảnh macroblocks slices Mỗi ảnh chuỗi video chia thành nhiều khối macroblocks với kích thước cố định mà vùng ảnh hình chữ nhật bao gồm 16 × 16 mẫu 44 thành phần luma, trường hợp lấy mẫu thành phần chroma video theo tiêu chuẩn 4: 2:0, có × mẫu hai thành phần chroma Tất mẫu luma chroma macroblock dự báo không gian thời gian, kết dự báo biểu diễn chuyển đổi mã hóa Mỗi thành phần màu dự đoán chia thành khối Mỗi khối biến đổi số nguyên lần, biến đổi hệ số gọi lượng tử hóa mã hóa entropy Các macroblocks chia thành slice, đại diện cho vùng ảnh giải mã độc lập với H.264 / MPEG4-AVC hỗ trợ năm loại slice-mã hóa (I, P, B, SP, SI) Đơn giản slice I Trong slice I tất macroblocks mã hóa mà tham gia hình ảnh khác chuỗi video Trước hình ảnh mã hóa sử dụng để tạo thành tín hiệu dự báo cho macroblocks để mã hóa dự báo slice P slice B (trong P viết tắt predictive B viết tắt bi-predictive) Hai loại slice lại slices SP (switching P) slices SI (switching I) , quy định cho chuyển đổi hiệu từ mã hóa bitstreams tốc độ bit khác 45 Hình 3.1: Cấu trúc dòng video H264/AVC Một ảnh bao gồm tập hợp slices biểu diễn toàn frame field Phân chia hình ảnh quét sen kẽ để tạo hình ảnh riêng biệt cho vùng đạt hiệu cao, với mục đích truy cập ngẫu nhiên field mã hóa cách sử dụng slices I field thứ hai dự đoán bù chuyển động Trong số hiển thị phần khung mã hóa hiệu chế độ field, trường hợp khác mã hóa hiệu chế độ frame Do đó, H.264 / MPEG4-AVC hỗ trợ chuyển đổi thích nghi macroblock mã hóa frame field Hai khối macroblocks liền kề theo chiều dọc khung mã hoá, chia thành hai frame phân chia thành hai field Quá trình dự báo mã hóa dự báo tiến hành cách sử dụng phân đoạn chọn 3.3.2 Mã hóa NAL Fn T Q Recoder ME F’n-1 MC inter P Choose intra prediction Intra predictio n intra + F’n Fitter + Hình 3.2: Mã hóa H264/MPEG-4 AVC Trong đó: 46 Entropy encode Fn ảnh F(n -1): Ảnh trước F’n: Ảnh cấu trúc lại Fitter: lọc tách khối ME: dự đoán chuyển động MC: bù chuyển động Choose intra prediction: chọn kiểu dự đoán intra Inter prediction: dự đoán intra T, : Biến đổi DCT thuận ngược Q, : Lượng tử vô hướng giải lượng tử Recoder: xếp trật tự Entropy encoder: mã hóa entropy Nguyên lý: Ảnh chia thành khối macroblock có kích thước x 4, x 8, 16 x 16 Ảnh mã hóa intra, ảnh lại mã hóa inter cách dử dụng dự đoán bù chuyển động từ ảnh mã hóa trước Bộ dự đoán chuyển động có nhiệm so sánh macroblock ảnh với khối ảnh trước đó, để tìm chi tiết ảnh gần giống hai khối, đồng thời dự đoán chuyển động truyền MB ảnh tham khảo với MB ảnh cần mã hóa đến trừ để tìm độ sai lệch hai khối ảnh Độ sai lệch đưa vào biến đổi DCT thuận để tạo loạt hệ số DCT, hệ số đưa vào lượng tử hóa vô hướng nhằm giảm dung lượng cần truyền Tại hệ số lương tử chia làm hai hướng khác Một hướng hệ số xếp theo trật tự để thực mã hóa entropy, dung lượng bít giảm nữa, hướng khác hệ số lượng tử đưa vào giải lượng tử biến đổi DCT ngược tạo khối sai số, kết hợp với tín hiệu dự đoán để thực lọc tách khối 47 nhằm làm giảm hiệu ứng khối tái tạo lại ảnh ban đầu Dữ liệu đầu mã hóa entropy kết hợp với vector chuyển động thông tin ảnh để truyền kênh thông qua dòng bít nén đơn vị NAL 3.3.3 Định dạng mã hóa liệu Chuẩn H.264/AVC chia thành hai lớp phụ : lớp mã hóa video (Video Coding Layer – VCL) lớp trừu tượng mạng (Network Abstraction Layer – NAL) Đầu trình mã hóa liệu lớp VCL (Chuỗi bit biểu diễn liệu video mã hóa) ánh xạ vào đơn vị lớp mạng trừu tượng NAL trước truyền dẫn hay lưu trữ Tín hiệu đầu lớp chuỗi slice ảnh Dòng bit lớp NAL tổ chức thành gói rời rạc gọi khối NAL Mục đích việc phân chia lớp VCL NAL để phân biệt đặc tính mã hóa lớp VCL đặc tính truyền dẫn lớp NAL 3.3.3.1 Lớp mã hóa Video (VCL-Video coding layer) VCL H.264 / MPEG-4 AVC phương mã hóa dựa khối ghép video H.264 / MPEG-4 AVC bao gồm tính cho phép cải thiện đáng kể hiệu suất nén so với tiêu chuẩn mã hóa video trước AVC sử dụng phương pháp tiếp cận video mã hóa dựa sở khối slice, tăng linh hoạt khả thích ứng so với hệ trước Một ảnh video mã hóa gồm hay nhiều slices Mỗi slice bao gồm số nguyên khối macroblock Số lượng khối macroblock ảnh không cố định •Slices I : Trong macroblock sử dụng mã hóa ảnh cách sử dụng tiên đoán không gian từ vùng lân cận •Slices P: Có hỗ trợ mã hóa ảnh liên ảnh, dự đoán mã hóa cách sử dụng tín hiệu dự đoán cho vùng dự đoán •Slices B: Có hỗ trợ mã hóa ảnh, mã hóa dự đoán liên ảnh, mã hóa hai chiều cách sử dụng hai tín hiệu dự đoán kết hợp với trọng số trung bình để hình thành vùng dự đoán 48 H.264 hỗ trợ mã hóa giải mã video theo chuẩn 4:2:0 quét liên tục xen kẽ Khung quét xen kẽ bao gồm trường (trên dưới) tách biệt theo thời gian với định dạng mặc định Khối macroblock đánh số theo thứ tự quét khung 3.3.3.2 Lớp mạng trừu tượng mạng (Networl Abstraction Layer – NAL) Các khối hình 3.3 mô tả khối NAL với phần payload nội dung video Nó chứa loại payload khác thông tin điều khiển Những khối xếp vào loại khối VCL (non-VCL unit) Các khối NAL kết hợp với thành chuỗi, định dạng nên khối truy cập Hình 3.3: Mô tả khối NAL với phần payload nội dung video Mã hóa H.264 / MPEG-4 AVC luồng liệu video tổ chức thành đơn vị NAL, gói liệu chứa đựng số nguyên byte Một đơn vị NAL bắt đầu với số byte kiểu liệu đơn vị NAL Các byte lại đại diện cho liệu payload Đơn vị NAL xếp vào lớp video mã hóa (VCL), có chứa mã hóa liệu cho vùng nội dung hình ảnh (mã hóa slice hay phân vùng liệu slice) non-VCL đơn vị NAL, có chứa liên kết thông tin bổ sung Hai loại non-VCL đơn vị NAL tập hợp thông số gói thông tin tăng cường bổ sung (SEI) Trình tự hình ảnh tham số thay đổi thông tin cho chuỗi video mã hóa Gói tin SEI không ảnh hưởng đến chất trình giải mã với 49 mẫu chuỗi video mã hóa Tuy nhiên, cung cấp thêm thông tin để hỗ trợ trình giải mã hay ảnh hưởng đến trình thao tác bitstream hiển thị Tập hợp đơn vị NAL liên tiếp kết hợp với hình ảnh mã hóa gọi đơn vị truy cập Một tập hợp đơn vị liệu liên tiếp với đặc tính định gọi chuỗi video mã hóa Một chuỗi video mã hóa (cùng với kết hợp tham số) đại diện cho phận giải mã độc lập bitstream video Một chuỗi video mã hóa luôn bắt đầu với đơn vị truy cập (IDR- instantaneous decoding refresh), tín hiệu có đơn vị truy cập IDR tất đơn vị truy cập bitstream giải mã mà không cần giải mã hình ảnh trước 3.4 Kỹ thuật nén liên ảnh 3.4.1 Nguyên lý bù chuyển động T Fn Q ME F’(n-1) MC P uF’n Hình 3.4 : Nguyên lý bù chuyển động Hình ảnh cần mã hóa (Fn) ảnh dự đoán mã hóa F’(n-1) đưa vào dự đoán chuyển động ME, thực so sánh hai khối ảnh tạo vector chuyển động để đưa vào khối bù chuyển động MC Tại vector 50 chuyển động kết hợp với ảnh dự đoán tạo độ sai lệch ảnh Sự khác biệt với hình ảnh đưa vào trừ để tạo thông tin khác biệt hai ảnh Dn Dn thực nén ảnh 3.4.2 Bù chuyển động slice P Ngoài kiểu mã hóa intra macroblock,còn có kiểu mã hóa dự đoán bù chuyển động , thực slice P Mỗi macroblock phân chia thành khối có kích thước cố định sử dụng để mô tả chuyển động Phân vùng với khối luma có kích thước 16 × 16, 16 × 8, × 16, × mẫu Khi khối mẫu phân chia thành bốn gọi sub-macroblock, có kích thước × mẫu luma, cú pháp bổ sung truyền cho × submacroblock Yếu tố cú pháp xác định sub-macroblock tương ứng, mã hóa dự đoán bù chuyển động với khối luma có kích thước mẫu × 8, × 4, × 8, × Hình 3.8 minh họa phân vùng Hình 3.5: Phân vùng macroblock (trên) sub-macroblock (dưới) để dự đoán bù chuyển động Các tín hiệu dự báo mã hóa dự báo khối M × N tín hệu luma thu cách tìm khối ảnh tham khảo giải mã để giá trị dự đoán nhỏ , chuyển động quy định vector chuyển 51 động tịnh tiến số tham chiếu hình ảnh Vì macroblock mã hóa cách sử dụng bốn sub-macroblocks × 8, sub-macroblock mã hóa cách sử dụng bốn khối × tín hiệu luma tối đa 16 vector chuyển động truyền cho macroblock P – slice Hình 3.6 : Bù chuyển động đa khung, vector chuyển động thông số tham khảo hình ảnh (D) truyền H.264 / MPEG4-AVC hỗ trợ dự đoán bù chuyển động đa hình ảnh Nó sử dụng hiều hình ảnh để làm ảnh tham khảo cho dự đoán bù chuyển động Ngoài chế độ macroblock mô tả trên, macroblock slice-P mã hóa mode gọi SKIP Đối với mode này, không tín hiệu lỗi dự báo lượng tử hay vector chuyển động mà có số tham chiếu không truyền 3.4.3 Bù chuyển động slices B Trong H.264 / MPEG4-AVC slice B định nghĩa khác không giống MPEG2 video, hình ảnh B sử dụng hình ảnh tham khảo 52 cho dự đoán bù chuyển động Như vậy, khác biệt slice B slice P H.264/MPEG4-AVC slice B mã hóa hai chiều cách sử dụng hai tín hiệu dự đoán kết hợp với trọng số trung bình để hình thành vùng dự đoán Tùy thuộc vào list hình ảnh tham khảo sử dụng để hình thành tín hiệu dự đoán, có bốn loại khác dự đoán liên ảnh phân biệt slice B: list 0, list 1, dự đoán hai chiều dự đoán trực tiếp Hình 3.7 :Bù chuyển động slice B Với phân vùng tương tự quy định slice P, ba loại dự đoán liên ảnh khác slices B lựa chọn riêng cho phân vùng macroblock phân vùng sub-macroblock Ngoài ra, macroblocks slice-B sub-macroblocks mã hóa gọi phương thức trực tiếp mà không cần phải truyền tải thông tin chuyển động bổ sung Nếu liệu dự đoán dư thừa truyền cho macroblock mã hóa trực tiếp, gọi SKIP macroblocks skip sử dụng slice P đạt hiệu cao 3.5 Nén ảnh 53 3.5.1 Mã hóa entropy Trong H.264 / MPEG4-AVC, nhiều yếu tố cú pháp mã hóa cách sử dụng cấu trúc cao, mã hóa có chiều dài biến đổi (VLC) kích thước vô hạn, gọi lệnh mã hóa Exponential-Golomb Một vài yếu tố cú pháp mã hóa cách sử dụng biểu diễn mã đơn với chiều dài cố định Đối với yếu tố cú pháp lại, hai loại mã hóa entropy hỗ trợ mã hóa thích nghi nội dung CAVLC (context-based adaptive variable-length coding ) CABAC (context-based adaptive binary arithmetic coding) Cấu hình mã hóa entropy dành cho triển khai có độ phức tạp thấp (đặc biệt dựa phần mềm) Mã exponential- Golomb sử dụng cho gần tất yếu tố cú pháp trừ lượng tử chuyển đổi hệ số, phương pháp phức tạp gọi mã hóa chiều dài biến đổi thích nghi nội dung CAVLC Khi sử dụng CAVLC, mã hóa chuyển đổi bảng VLC khác cho yếu tố cú pháp khác tùy thuộc vào giá trị yếu tố cú pháp truyền trước slice Mã hóa hiệu suất entropy cải tiến tốt sử dụng cấu hình thứ hai gọi CABAC So với CAVLC, CABAC cung cấp tỷ lệ bit giảm khoảng 10-20 % cho chất lượng video với mục tiêu mã hóa tín hiệu SDTV / HDTV 3.5.2 Bộ lọc tách khối vòng (IN-LOOP DEBLOCKING FILTER) Do lượng tử hóa thô tốc độ bit thấp, mã hóa dựa sở khối thường dẫn đến làm gián đoạn tập trung thị giác dọc theo mép khối Việc loại bỏ nhiễu khối cung cấp cải tiến đáng kể tạo cho người xem có cảm nhận chất lượng ảnh cao Với mục đích đó, H.264 / MPEG4-AVC định nghĩa lọc tách khối mà hoạt động vòng lặp mã hóa dự đoán tạo thành thành phần cần thiết trình giải mã Quá trình lọc biểu diễn mức độ cao nội dung thích ứng cấp độ khác từ cấp độ slices với cấp độ biên, đến cấp độ mẫu Kết dạng khối ( 54 blockiness ) giảm mà không ảnh hưởng đến nhiều độ sắc nét nội dung Do chất lượng ảnh chủ quan cải thiện đáng kể Các lọc làm giảm tốc độ bit khoảng từ 5-10 % tạo chất lượng ảnh tương tự video không lọc Hình 3.8: Sử dụng lọc tách khối với hình nén hình ảnh Hình ảnh bên trái không sử dụng lọc tách khối, hình ảnh bên phải sử dụng lọc tách khối Ứng dụng H264/ MPEG AVC đánh dấu bước ngoặt lớn công nghệ nén video H264 áp dụng kỹ thuật tiên tiến nhằm sử dụng băng thông hiệu cho chất lượng nén ảnh cao hơn, tốc độ bit giảm xuống 50% so với chuẩn MPEG H264 dần thay MPEG tương lai lĩnh vực như: • • Truyền hình quảng bá qua vệ tinh, cáp , mặt đất,… Truyền luồng internet tốc độ bít thấp, truyền thông video qua mạng internet, truyền hình số mặt đất, tin nhắn đa phương tiện MMS…qua mạng ISDN, LAN, vệ tinh,…Đặc biệt H264/ AVC sử dụng rộng rãi hệ thống truyền hình phát triển mạng tương lai 55 KẾT LUẬN VÀ KIẾN NGHỊ Kết Luận Sau tháng làm đồ án với giúp đỡ thầy giáo ThS Nguyễn Đình Thạch nỗ lực thân em hoàn thành đồ án theo tiến độ nhiệm vụ đồ án giao Sau hoàn thành đồ án em hiểu thêm nhiều vấn đề kỹ thuật sử dụng công nghệ truyền hình 3D Đây công nghệ thúc đẩy phát triển nghành công nghiệp truyền hình nước nói chung giới nói riêng Hiện khán giả không cần phải tới rạp hay phải có tivi đời mới xem phim 3D, mà nhà chúng có không gian riêng ta với gia đình tận hưởng phim 3D đặc sắc Với tính bật, độ nét cao, hình ảnh trung thực, sống động thu hút lượng khán giả lớn nghành truyền hình Tuy nhiên thách thức lớn mà nhà sản xuất truyền hình phải đồi mặt, yêu cầu kỹ thuật cung chương trình cần linh hoạt để đáp ứng nhu cầu người tiêu dùng Bên cạnh lợi ích mà công nghệ truyền hình 3D đạt gặp nhiều khó khăn thách thức phải đối mặt đồng thời đưa giải pháp để đổi mới, nâng cao chất lượng nội dung, hình ảnh phát sóng đáp ứng nhu cầu thông tin, giải trí thu hút tầng lớp nhân dân Kiến nghị Tối ưu hóa chất lượng truyền liệu truyền hình 3D giải pháp thúc đẩy phát triển nghành công nghệ 3D tương lai gần Các kết trình bày nghiên cứu số thu chưa phải kết cuối Mỗi phần nghiên cứu tiếp tục 56 phát triển theo sáng kiến để thu kết tối ưu Dưới đề nghị nghiên cứu phát triển tương lai: • Công nghệ rào chắn thị sai sử dụng thấu kính phương pháp xác cho hình ảnh 3D chất lượng cao nhiều công ty lớn sử dụng công nghệ thân thiện với khách hàng Hy vọng tương lai gần công nghệ cải tiến lên tầm cao giúp người dùng cảm thụ video 3D cách tối ưu vị trí xem • Để người dùng có trải nghiệm tối ưu video 3D cần sử dụng phương thức nén tiên tiến chất lượng hình ảnh cao, giảm tốc độ bit đáng kể trình truyền dẫn lưu trữ nội dung 57 TÀI LIỆU THAM KHẢO Đỗ Hoàng Tiến, Vũ Đức Lý, Giáo trình truyền hình, NXB khoa học kỹ thuật Hà Nội-2001 Học viện kỹ thuật quân khoa vô tuyến điện tử, Kỹ thuật truyền dẫn số, Nhà xuất Quân Đội Nhân Dân Hà Nội-2001 Matthew Charles Forman, Compression of Integral Three-Dimensional Television Pictures, De Montfort University September 1999 Vittal Reddy Mandadi , The gynamics and intricacies of 3DTV broadcasting – A Survey, thesis work 2011 58

Ngày đăng: 02/08/2016, 09:37

Từ khóa liên quan

Mục lục

  • DANH MỤC CÁC CHỮ VIẾT TẮT

  • DANH MỤC CÁC HÌNH

  • LỜI MỞ ĐẦU

  • CHƯƠNG I: TỔNG QUAN VỀ TRUYỀN HÌNH 3D

    • 1.1 Giới thiệu về truyền hình 3D

      • 1.1.1 Khái niệm và bản chất

      • 1.1.2 Tiêu chuẩn sản xuất và hiển thị

      • 1.1.3 Các thế hệ của công nghệ truyền hình 3D

      • 1.1.4 Phân loại màn hình 3D

      • 1.2 Khái quát kỹ thuật lập thể

      • 1.3 Nguyên tắc tạo hình ảnh trong truyền hình 3D

        • 1.3.1 Thiết bị hộ trợ hiển thị 3D

        • 1.3.2 Hiển thị 3D không sử dụng các thiết bị hỗ trợ

        • 1.4 Cơ chế truyền dẫn tín hiệu truyền hình 3D

        • 1.5 Tái tạo tín hiệu truyền hình 3D

        • 1.6 Biểu diễn hình ảnh 3DTV

          • 1.6.1 Nén không gian

          • 1.6.2 Ghép kênh theo thời gian

          • 1.6.3 2D kết hợp với siêu dữ liệu (2D + M)

          • 1.6.4 Gửi tín hiệu mã hóa màu

          • CHƯƠNG II: KỸ THUẬT NÉN HÌNH ẢNH 3D SỬ DỤNG BỘ GHÉP DPCM/DCT

            • 2.1 Mô hình hệ thống nén chung

            • 2.2 Phân loại kỹ thuật nén

              • 2.2.1 Dự đoán tuyến tính (DPCM- Differential Pulse Code Modulation)

              • 2.2.2 Biến đổi cosin rời rạc ( DCT)

Tài liệu cùng người dùng

Tài liệu liên quan