Tìm hiểu kỹ thuật nén MPEG Video Coding II MPEG 4

36 313 0
Tìm hiểu kỹ thuật nén MPEG Video Coding  II MPEG  4

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Môn công nghệ đa phương tiện của trường Đại học Công nghiệp Hà Nội. Đề tài: Tìm hiểu kỹ thuật nén MPEG Video Coding I MPEG 1. Moving Picture Experts Group (MPEG) Nhóm các chuyên gia hình ảnh động (MPEG được phát âm là ˈɛm peg: empeg) là một nhóm các quy tắc hoạt động được thành lập bởi ISO và IEC để thiết lập các tiêu chuẩn cho việc truyền tải âm thanh và video.

TRƯỜNG ĐH CÔNG NGHIỆP HÀ NỘI Khoa: CÔNG NGHỆ THÔNG TIN Mơn học: CƠNG NGHỆ ĐA PHƯƠNG TIỆN BÀI TẬP LỚN TÌM HIỂU KĨ THUẬT NÉN MPEG CODING    GVHD: Nguyễn Thị Mỹ Bình Nhóm – Lớp CNTT2 Ngơ Nguyễn Chí Cơng 1041360103 Nguyễn Ngọc Cương 1041360 Nguyễn Huy Anh 1041360 LỜI CẢM ƠN Lời chúng em xin chân thành cảm ơn Ban giám hiệu trường Đại Học Công Nghiệp Hà Nội tạo điều kiện để sinh viên chúng em có mơi trường học tập thoải mái sở hạ tầng sở vật chất Chúng em xin cảm ơn khoa Công nghệ thông giúp chúng em mở mang kiến thức vấn đề xung quanh máy tính Qua chúng em nhận thức cách đầy đủ toàn diện tầm quan trọng ngành công nghệ thông tin công xây dựng phát triển đất nước ngày giàu mạnh Chúng em chân thành cảm ơn Nguyễn Thị Mỹ Bình hướng dẫn tận tình để nhóm chúng em hồn thành tập lớn môn học Hi vọng thông qua nỗ lực tìm hiểu tất thành viên, nhóm chúng em giúp bạn hiểu rõ trình xây dụng sản phẩm đa phương tiện số tính hỗ trợ phần mềm Ngồi ra, nhóm mong muốn giới thiệu tới bạn tính hay, ưu điểm bậc phần mềm khác MPEG kĩ thuật nén thông minh chiếm thị phần nhiều việc làm sản phẩm đa phương tiện Nó mang đến mơi trường làm việc đại, thân thiện có sẵn Sự xuất MPEG4 làm cân nén video chuẩn H263 chuẩn H264 Hà Nội, tháng 12 năm 2018 Page | MỤC LỤC PHẦN 1: TỔNG QUAN VỀ MPEG I Tổng quan MPEG Giới thiệu Các tiêu chuẩn II Tìm hiểu kĩ MPEG Cấu trúc dòng bit .6 Nguyên lí nén MPEG .11 Nguyên lí giải nén MPEG 13 PHẦN 2: PHÂN TÍCH CHUẨN H263 14 Tổng quan .14 Lịch sử tảng 14 Các phiên .15 PHẦN 3: MPEG CODING 19 I Tổng quan 19 II Tìm hiểu thêm MPEG coding .21 PHẦN 4: Những giải mã MPEG-4 có sẵn 32 Page | PHẦN 1: TỔNG QUAN VỀ MPEG I Tổng quan MPEG Giới thiệu Moving Picture Experts Group (MPEG) - "Nhóm chun gia hình ảnh động" (MPEG phát âm /ˈɛm peg/: em-peg) nhóm quy tắc hoạt động thành lập ISO IEC để thiết lập tiêu chuẩn cho việc truyền tải âm video Chuẩn MPEG lần mắt vào năm 1988 sáng kiến Hiroshi Yasuda (Tập đoàn Nippon Telegraph Telephone) Leonardo Chiariglione, chủ tịch nhóm kể từ thành lập Hội nghị MPEG diễn vào tháng năm 1988 Ottawa, Canada Tính đến cuối năm 2005, MPEG lên tới 350 thành viên tham gia hội nghi từ lĩnh vực công nghiệp, trường đại học viên nghiên cứu khác Danh pháp thức MPEG ISO/IEC JTC1/SC29 WG11 Các tiêu chuẩn Chuẩn MPEG gồm phận khác Mỗi phận lại bao gồm đặc điểm kỹ thuật định Các tiêu chuẩn xác định Cơ cấu (Profiles) Cấp độ (Levels) Cơ cấu nhằm xác định tập hợp công cụ có sẵn, Cấp độ xác định phạm vi giá trị thích hợp cho thuộc tính liên quan đến chúng Một số tiêu chuẩn MPEG thay đổi cải tiến và/hoặc phiên MPEG tiêu chuẩn hóa định dạng nén tiêu chuẩn phụ sau đây: MPEG-1 (1993): Mã hóa hình ảnh động âm liên quan việc lưu trữ kỹ thuật số đa phương tiện lên đến 1,5 Mbit/s (ISO/IEC 11172) Chuẩn nén MPEG cho âm video Nó thường giới hạn khoảng 1,5 Mbit/s mặt kỹ thuật bit rate cao nhiêu Nó thiết kế phép hình ảnh chuyển động âm mã hóa Page | thành bitrate Đĩa CD Nó sử dụng Video CD dùng cho video chất lượng thấp DVD Nó dùng dịch vụ truyền hình vệ tinh truyền hình cap kỹ thuật số trước MPEG-2 trở nên phổ biến Để đáp ứng yêu cầu bit thấp, MPEG-1 downsamples hình ảnh, tần số ảnh 24–30 Hz, cho chất lượng mức trung bình Nó bao gồm MPEG-1 Audio Layer III định dạng nén âm phổ biến (MP3) MPEG-2 (1995): Mã hóa chung cho hình ảnh chuyển động thông tin âm liên quan (ISO/IEC 13818) Tiêu chuẩn truyền tải video âm có chất lượng truyền hình Chuẩn MPEG-2 hỗ trợ qt xen kẽ HD video MPEG-2 xem trọng chọn làm chương trình nén cho phát sóng truyền hình kỹ thuật số, dịch vụ kỹ thuật số vệ tinh, truyền hình cap kỹ thuật số, SVCD DVD Video Nó sử dụng Đĩa Blu-ray, thường dùng MPEG-4 Part 10 SMPTE VC-1 cho nội dung HD MPEG-3: MPEG-3 xử lý chuẩn hóa scalable and nén đa độ phân giải dành cho HDTV nhân thấy khơng cần thiết nên đuọc xác nhập vào MPEG-2; kết không tiêu chuẩn MPEG-3 Đừng nhầm lẫn MPEG-3 với MP3, MP3 âm MPEG-1 MPEG-2 Lớp III MPEG-4 (1998): Mã hóa đối tượng nghe nhìn (ISO/IEC 14496) MPEG-4 sử dụng cơng cụ mã hóa phức tạp để đạt yếu tố nén cao MPEG-2 Ngồi việc mã hóa video hiệu hơn, MPEG-4 tiến gần tới ứng dụng đồ họa máy tính Với cấu phức tạp hơn, giải mã MPEG-4 hiệu trỏ thành xử lý việc dựng hình chiều kết cấu bề mặt MPEG-4 hỗ trợ Intellectual Property Management and Protection (IPMP) (Quản lý bảo vệ sở hữu trí tuệ), việc cung cấp sở để sử dụng công nghệ độc quyền để quản lý bảo vệ nội dung quản lý quyền kỹ thuật số Nó hỗ trợ MPEG-J, chương trình giải pháp đầy đủ để tạo ứng dụng tương tác tùy chỉnh đa phương tiện (Ứng dụng Java với môi trường Java API) nhiều tính khác Một số tiêu chuẩn video hiệu cao (mới Video MPEG-2) đáng ý là: - MPEG-4 Part (Simple and Advanced Simple Profile) - MPEG-4 AVC (MPEG-4 Part 10 H.264) MPEG-4 AVC sử dụng HD DVD Đĩa Blu-ray, với VC-1 and MPEG2 Page | MPEG-4 cọn chương trình nén over-the-air Brazil (ISDB-TB), dựa truyền hình ky thuật số gốc Nhật Bản (ISDB-T) Ngoài ra, tiêu chuẩn sau ký hiệu tương tự: - MPEG-7 (2002): Giao diện mô tả nội dung đa phương tiện (ISO/IEC 15938) - MPEG-21 (2001): Khuôn khổ đa phương tiện (MPEG-21) (ISO/IEC 21000) MPEG mô tả tiêu chuẩn multimedia framework and cung cấp cho IPMP Hơn nữa, gần tiêu chuẩn trên, MPEG bát đầu theo tiêu chuẩn quốc tế; tiêu chuẩn nắm giữ nhiều công nghệ cho ứng dụng (Ví dụ, MPEG-A bao gồm số cơng nghệ định dạng đa phương tiện.) - MPEG-A (2007): Multimedia application format (MPEG-A) (ISO/IEC 23000) - MPEG-B (2006): MPEG systems technologies (ISO/IEC 23001) - 5MPEG-C (2006): MPEG video technologies (ISO/IEC 23002) - MPEG-D (2007): MPEG audio technologies (ISO/IEC 23003) - MPEG-E (2007): Multimedia Middleware (ISO/IEC 23004) (còn gọi M3W) - Supplemental media technologies (2008) (ISO/IEC 29116) - MPEG-V (2011): Media context and control (ISO/IEC 23005) (còn gọi Information exchange with Virtual Worlds) - MPEG-M (2010): MPEG eXtensible Middleware (MXM) (ISO/IEC 23006) - MPEG-U (2010): Rich media user interfaces (ISO/IEC 23007) - MPEG-H (2013): High Efficiency Coding and Media Delivery in Heterogeneous Environments (ISO/IEC 23008) - MPEG-DASH (2012): Information technology – Dynamic adaptive streaming over HTTP (DASH) (ISO/IEC 23009) II Tìm hiểu kĩ MPEG Cấu trúc dòng bit Page | - Cấu trúc dòng MPEG gồm lớp:  Lớp khối (block) : gồm khối 8x8 điểm ảnh tín hiệu chói tín hiệu màu dùng cho phương pháp nén DCT  Lớp macroblock: lớp tổ hợp cấu trúc khối nhóm khối tương ứng với lượng thơng tin chứa đựng kích thước 16x16 điểm ảnh Cấu trúc khối xác định lượng thơng tin chứa thay đổi tùy theo cấu trúc mẫu sử dụng Thông tin cấu trúc khối mang dạng vector bù chuyển động  Lớp cắt lát dòng bít (slice): Mảng bao gồm cấu trúc khối kề Kích thước lớn mảng bao gồm tồn ảnh kích thước nhỏ mảng cấu trúc khối Thơng tin chứa đựng vị trí mảng tồn bơj ảnh, hệ số cân lượng tử  Lớp ảnh (picture): cho phép giải mã xác định loại ảnh mã hóa Thơng tin đầu dùng để thứ tự truyền khung (để mã hóa xếp ảnh lại theo thứ tự đúng) thông tin đồng bọ, độ phân giải phạm vi vector chuyển động Trong nén MPEG người ta sử dụng loại ảnh sau:  Ảnh I (Intra Pictures): mã hóa độc lập mà không ccàn tham khảo ảnh khác Hiệu nén tín hiệu đạt loại bỏ dư thừa khơng gian mà khơng có yếu tố thời gian tham gia vào trình Ảnh I dùng cách tuần hoàn để tạo thành điểm tựa cho dòng liệu q trình giải mã  Ảnh P (Predicted Pictures): mã hoá từ ảnh I ảnh P trước để bù chuyển động dùng để tham khảo cho việc tiên đoán ảnh Mỗi khối ảnh ảnh P mã hóa theo kiểu tiên đốn mã hóa cách độc lập Do sử dụng nén không gian thời gian nen hiệu nén ảnh P cao đáng kể so với ảnh I  Ảnh B (Bidirectionally Predictive Pictures) sử dụng ảnh I P phía trướ phía sau để bù chuyển động cho tỷ lệ nén cao Mỗi khối ảnh B tiên đaons theo chiều ngược, xi, hai hướng mã hóa độc lập nhiên để tiên đaons ngược từ ảnh phía sau mã hóa phải ắp xếp lại ảnh Do tạo độ trễ phảo xếp lại thông tin, độ trễ lớn hay nhỏ phụ thuộc vào số ảnh B liên tiếp truyền Page |  Lớp nhóm ảnh (GOP): ảnh I, P, B thường xuất theo thứ tự lặp lặp lại cách tuần hoàn Vì xuất nhóm ảnh GOP Chất lượng ảnh không phụ thuộc vào tỷ lệ nén khn hình mà phụ thuộc vào độ dài nhóm ảnh GOP Chúng đơn vị mang thơng tin độc lập MPEG bắt buộc phải bắt đầu ảnh I Tiếp sau loạt ảnh P B Cấu trúc GOP mô tả bửoi tham số: N(số ảnh GOP) M(khoảng cách ảnh P)  Lớp dãy ảnh (sequence): đoạn video bao gồm thông tin đầu, số nhóm ảnh thơng tin kết đoạn - Mỗi lớp hỗ trợ chức định: chức xử lý ín hiệu (DCT bù chuyển động) Hai chức logic (tái đồng bộ, điẻm truy xuất ngẫu nhiên) Hình 1: Cấu trúc dòng bít MPEG Page | Hình 2: Kiến trúc dòng liệu MPEG Page | Hình 3: Cấu trúc ảnh MPEG - Q trình tạo dòng bít MPEG ghép kênh: kết hợp dòng liệu vào, dòng liệu ra, điều chỉnh đồng quản lý đệm Cú pháp dòng MPEG bao gồm: lớp dòng bit (stream), lớp gói (back) lớp gói tin (backet) Page | 10 triển khai phổ biến MPEG-4 ASP có lẽ DivX XviD, có sẵn số codec khác Là tiêu chuẩn, thay Codec cụ thể, giải mã chứng nhận để phát lại MPEG-4 ASP phát video tuân thủ theo tiêu chuẩn mã hóa với cơng cụ Nói cách khác, giải mã DivX khơng gặp vấn đề phát video XviD Lịch sử MPEG-4 ASP: thiết kế ban đầu chủ yếu xoay quanh việc sử dụng Truyền phát thương mại hội nghị video, MPEG-4 không nhận nhiều ý từ công chúng rò rỉ số mã Microsoft cho định dạng nén WMV (Windows Media Video) dựa chủ yếu vào MPEG-4 Phần 2, bao gồm ASP số 21 hồ sơ Mã phân phối dạng DivX 3.11 Alpha Dự án Mayo: Tính khả dụng mã nguồn Microsoft tạo đủ quan tâm nhà phát triển để bắt đầu Project Mayo, gọi OpenDivX Việc phát triển OpenDivX kết thúc nhà phát triển ban đầu định tạo mã hóa thương mại hình thành DivXNetworks Bộ giải mã DivX họ phần lớn chịu trách nhiệm cho quan tâm sớm người tiêu dùng MPEG4 Các nhà phát triển khác định tiếp tục phát triển nguồn mở tiếp tục tạo XviD Khi hai codec trưởng thành, nhiều công ty ý số mã hóa MPEG-4 ASP bán Bộ chứa: Vì khơng có Bộ chứa MPEG-4 thức sau phát triển MPEG-4 AVC (H.264), người có sở thích MPEG-4 ban đầu nhận thấy chứa AVI Microsoft sử dụng để giữ âm video MP3 MPEG-4 Tuy nhiên, với tiến chứa phần mềm tiêu dùng, có chứa tốt nhiều, chẳng hạn MP4 (bộ chứa MPEG-4 thức), MKV (bộ chứa Matroska) chí MPG (Luồng chương trình MPEG-2) lựa chọn tốt hơn, hai để hỗ trợ tính mã hóa video đại tính di động từ hệ điều hành sang hệ điều hành khác AVI định dạng cụ thể Microsoft Windows Hỗ trợ phần cứng: Với việc phát hành KISS DP-450 vào năm 2002, lần Giải mã MPEG-4 có sẵn đầu phát DVD độc lập Các tập tin AVI phải sử dụng xảy cố với số tính MPEG-4 ASP Bất chấp vấn đề, thị trường phát triển bao gồm chương trình chứng nhận thức từ nhiều Page | 22 nhà cung cấp codec, bao gồm DivX, XviD Nero Digital, tồn Ngoài hỗ trợ AVI, nhiều người chơi hỗ trợ chứa MP4 DivX chí tạo phần mở rộng cho chứa AVI phép sử dụng menu đơn giản, tương tự DVD Các tính MPEG-4 Part ASP : MPEG-4 ASP chia sẻ số tính với mã hóa video MPEG-2, khác biệt theo số cách quan trọng Là phần gia đình MPEG-4, có hiệu chút, không hiệu MPEG-4 AVC, phát triển sau Điều có nghĩa kích thước tệp nhỏ tệp MPEG-2 với chất lượng tương đương Video xen kẽ: Mặc dù hỗ trợ Hồ sơ ASP, mã hóa xen kẽ khơng có sẵn tất mã hóa Do hỗ trợ MPEG-4 đầu DVD khơng tồn ngày đầu mã hóa MPEG-4 HTPC hiếm, nên hầu hết thứ mã hóa vài năm đầu phát triển DivX tiến để phù hợp với hình máy tính mà chúng xem Vì phần lớn nguồn đến từ phim, tiến bộ, thực vấn đề Tuy nhiên, bạn mã hóa để hiển thị TV analog, chẳng hạn thơng qua trình phát DVD độc lập, có lẽ bạn muốn đảm bảo bạn sử dụng codec có khả mã hóa xen kẽ May mắn thay, điều trở thành tính chuẩn cho mã hóa giải mã B Frames: Cấu hình MPEG-4, Cấu hình đơn giản triển khai phổ biến khác, thiết kế để sử dụng với CPU có cơng suất thấp Kết khơng có khung B cho phép Các khung B, khung mã hóa hai chiều dự đốn u cầu hai khung tham chiếu giải mã, so với Khung tham chiếu đơn yêu cầu cho khung P Vì ASP không thiết kế với giới hạn phần cứng nên hỗ trợ khung B Qpel: Quarter-Pixel Motion Compensation cho phép phép tính sử dụng để phát chuyển động (cho mục đích dự đốn) xác MPEG-2 Mặc dù rõ ràng bạn lưu trữ tồn pixel, điều khơng có nghĩa chuyển động video bạn tăng theo pixel Bằng cách tăng độ xác lên 1/4 pixel (từ độ xác Half Pixel MPEG-2) cải thiện, đơi có nghĩa chất lượng tốt với tốc độ Bitrate tương đương Đầu DVD độc lập cũ có hỗ trợ MPEG-4 ASP không phát lại tệp Page | 23 mã hóa Qpel, khơng phải vấn đề mẫu Trong tương lai: Với việc hoàn thiện MPEG-4 Phần 10 (AVC / H.264) việc áp dụng để sử dụng công nghệ từ điện thoại di động đến phim truyền hình kỹ thuật số phim Blu-ray, khiến cho MPEG-4 trở nên lỗi thời Vì giải mã AVC khơng có khả giải mã video ASP, điều có nghĩa phần cứng phức tạp hơn, phức tạp cho đầu phát DVD độc lập để hỗ trợ hai Với chất lượng hình ảnh nén vượt trội AVC, có lý để gắn bó với MPEG-4 ASP xa tương lai III Về thông số kĩ thuật Các thông số trừu tượng: Tuân thủ mã hóa / giải mã MPEG4 Visual ASP (Advanced Simple Profile) cấp từ 1~5.1       Kích thước ảnh : lên đến D1(720×480) Đặc điểm kĩ thuật Tốc độ bit : 32kbps~8Mbps Tỷ lệ khung hình : YUV 4:2:0 (D1, VGA, QVGA, CIF, QCIF, SQCIF) Chức tùy chọn : Error concealment, image improvement filter Hỗ trợ I-VOP, P-VOP and B-VOP Dự đoán DC / AC, bù chuyển động 1/4 pixel, bù chuyển động khối × (4MV, giải mã), định lượng MPEG Tiêu thụ điện thấp, hình ảnh chất lượng cao control kiểm soát tốc độ, chức phát thay đổi cảnh tự động, v.v Thông số kỹ thuật giao diện dễ dàng kết nối xử lý   Hiệu suất MPEG4 Encode/Decode D1(720 x 480) 30 fps   Page | 24 B-Frames: Bộ mã hóa MPEG có tùy chọn sử dụng dự đoán nội suy tiến / lùi Các khung thường gọi khung dự đoán nội suy hai chiều viết tắt khung B Như ví dụ việc sử dụng khung I, P B, xem xét nhóm hình ảnh tồn khung hình đưa I, B, P, B, P, B, I, B, P, B, P, B, Như ví dụ I P trước đây, khung I mã hóa theo khơng gian khung P dự đoán chuyển tiếp dựa khung I P trước Tuy nhiên, khung B mã hóa dựa dự đốn chuyển tiếp từ khung I P trước đó, dự đốn ngược từ khung I P thành cơng Như vậy, chuỗi ví dụ xử lý mã hóa cho khung B dự đoán từ khung I khung P đầu tiên, khung B thứ hai dự đoán từ khung P thứ hai thứ ba, khung B thứ ba dự đoán từ khung P thứ ba khung I nhóm ảnh Từ ví dụ này, thấy dự đốn lạc hậu đòi hỏi khung tương lai sử dụng để dự đốn ngược mã hóa truyền trước, khơng theo thứ tự Q trình tóm tắt Hình 7.16 Khơng có giới hạn xác định cho số lượng khung B liên tiếp sử dụng nhóm hình ảnh tất nhiên số lượng tối ưu phụ thuộc vào ứng dụng Tuy nhiên, hầu hết ứng dụng chất lượng phát sóng có xu hướng sử dụng khung B liên tiếp (I, B, B, P, B, B, P,) làm đánh đổi lý tưởng hiệu nén chất lượng video Page | 25 Mã hóa B-Frames: Ưu điểm việc sử dụng B-frames hiệu mã hóa Trong hầu hết trường hợp, khung B dẫn đến bit mã hóa tổng thể Chất lượng cải thiện trường hợp đối tượng chuyển động tiết lộ khu vực ẩn chuỗi video Dự đoán ngược trường hợp cho phép mã hóa đưa định thơng minh cách mã hóa video khu vực Ngồi ra, khung B không sử dụng để dự đoán khung tương lai, lỗi tạo không lan truyền thêm chuỗi Một nhược điểm đệm tái tạo nhớ mã hóa giải mã phải nhân đơi kích thước để chứa khung neo Điều gần không vấn đề mã hóa tương đối đắt tiền ngày DRAM rẻ tiền này, trở thành vấn đề giải mã Một nhược điểm khác thiết phải có độ trễ tồn hệ thống khung phân phối khơng theo thứ tự Hình [*] Hầu hết hệ thống chiều chịu đựng chậm trễ này, chúng gây khó chịu ứng dụng hệ thống hội nghị truyền hình Quarter-pixel motion: Quarter-pixel motion (còn gọi chuyển động Q-pel chuyển động Qpel) đề cập đến việc sử dụng phần tư khoảng cách pixel (hoặc vị trí mẫu luma) làm độ xác vectơ chuyển động để ước tính chuyển động bù chuyển động sơ đồ nén video Nó sử dụng nhiều định dạng mã hóa video đại MPEG-4 ASP, H.264 / AVC HEVC Mặc dù vectơ chuyển động có độ xác cao cần nhiều bit để mã hóa, đơi chúng dẫn đến việc nén tổng thể hiệu hơn, cách tăng chất lượng tín hiệu dự đốn *Phương pháp nội suy: Quarter pixel motion, giống nửa pixel, đạt thông qua phép nội suy Đề án cụ thể khác sử dụng thiết kế khác nhau: Page | 26  VC-1 sử dụng phép nội suy hai chiều  H.264 / AVC sử dụng lọc vòi cho phép nội suy nửa pixel sau nội suy tuyến tính đơn giản để đạt độ xác phần tư pixel từ liệu nửa pixel  HEVC sử dụng lọc 7-tap 8-tap tách rời Khả tương thích phần cứng MPEG-4 ASP: Các video mã hóa với vectơ chuyển động xác phần tư pixel đòi hỏi cơng suất xử lý cao gấp đơi để mã hóa cơng suất xử lý cao 30-60% để giải mã Do đó, phép khả tương thích phần cứng rộng hơn, Qpel bị tắt cấu hình mã hóa DivX mặc định Tuy nhiên, với trình phát độc lập hỗ trợ định dạng phức tạp VC-1 H.264, hỗ trợ Qpel MPEG-4 ASP trở nên phổ biến Global motion compensation (GMC): Global motion compensation (GMC) loại bỏ chuyển động camera có chủ ý không mong muốn GMC áp dụng rộng rãi để ghép video và, mô-đun xử lý trước, để phân tích video dựa chuyển động Mặc dù thuật toán GMC tiên tiến thường ước tính thỏa đáng khung hình liên tiếp, hiệu suất chúng bị giảm video khơng bị giới hạn giới thực, ví dụ: video có tiền cảnh chiếm ưu thế, ví dụ, vật thể chuyển động đồng Kể từ GMC chuyển đổi khung thành tọa độ bù chuyển động toàn cầu thực cách xếp tầng, thất bại GMC khung gây tổn hại nghiêm trọng đến kết cuối Do đó, chúng tơi đề xuất GMC mạnh mẽ, gọi RGMC, dựa ước tính tương đồng cách sử dụng kết khớp Trước tiên, RGMC ngăn chặn tác động tiền cảnh cách phân cụm điểm trùng khớp loại bỏ liên quan đến tiền cảnh, kết khớp sai Để xác minh đồng nhất, chúng tơi đề xuất mơ hình xác suất kết hợp lỗi khớp điểm chính, tính quán cạnh sau chuyển đổi đồng nhất, lịch sử chuyển động thông tin chuyển động camera trước Page | 27 Lưu đồ thuật toán RGMC: (a) màu biểu thị cụm vectơ chuyển động khác nhau, (b) cụm hợp nhất, (c) lịch sử chuyển động (d) video bù chuyển động Quantization (lượng tử hóa xử lý ảnh): Mặc dù với MPEG-4 ASP, ta sử dụng loại lượng tử hóa h.263, ASP cho phép sử dụng loại tùy chỉnh Mặc dù loại h.263 mang lại cho bạn hình ảnh mềm mại (tốt cho mã hóa 1CD) ma trận MPEG mặc định tốt cho tốc độ bit cao hơn, giữ nhiều chi tiết ma trận tùy chỉnh phổ biến Lượng tử hóa màu làm giảm số lượng màu sử dụng ảnh; điều quan trọng để hiển thị hình ảnh thiết bị hỗ trợ số lượng màu hạn chế để nén số loại hình ảnh định Hầu hết trình soạn thảo bitmap nhiều hệ điều hành tích hợp hỗ trợ cho lượng tử hóa màu Các thuật tốn lượng tử hóa màu đại phổ biến bao gồm thuật toán màu gần (đối với bảng màu cố định), thuật toán cắt trung bình thuật tốn dựa octrees Người ta thường kết hợp lượng tử hóa màu với phối màu để tạo ấn tượng số lượng màu lớn loại bỏ tạo tác dải Lượng tử hóa tần số để nén hình ảnh: Mắt người tốt nhìn thấy khác biệt nhỏ độ sáng khu vực tương đối lớn, không tốt việc phân biệt cường độ xác biến thể độ sáng tần số cao (thay đổi nhanh) Thực tế cho phép người giảm lượng thông tin cần thiết cách bỏ qua Page | 28 thành phần tần số cao Điều thực cách đơn giản chia thành phần miền tần số cho số cho thành phần đó, sau làm tròn đến số ngun gần Đây hoạt động tổn thất tồn q trình Do đó, thơng thường, nhiều thành phần tần số cao làm tròn thành nhiều phần lại trở thành số dương âm nhỏ Vì tầm nhìn người nhạy cảm với độ chói so với sắc độ, nên thu nén cách làm việc khơng gian màu khơng phải RGB tách hai (ví dụ, YCbCr) định lượng riêng kênh Ma trận lượng tử hóa: Một codec video điển hình hoạt động cách chia hình ảnh thành khối riêng biệt (8 × pixel trường hợp MPEG) Các khối sau chuyển đổi cosine rời rạc (DCT) để tính tốn thành phần tần số, theo chiều ngang chiều dọc Khối kết (cùng kích thước với khối ban đầu) sau nhân trước mã tỷ lệ lượng tử hóa chia phần tử theo ma trận lượng tử hóa làm tròn phần tử kết Ma trận lượng tử hóa thiết kế để cung cấp độ phân giải nhiều cho thành phần tần số dễ nhận biết thành phần nhận biết (thường tần số thấp tần số cao) việc chuyển đổi nhiều thành phần thành 0, mã hóa với hiệu cao Nhiều mã hóa video (như DivX, Xvid 3ivx) tiêu chuẩn nén (như MPEG-2 H.264 / AVC) cho phép sử dụng ma trận tùy chỉnh Mức độ giảm thay đổi cách thay đổi mã tỷ lệ lượng tử hóa, chiếm băng thơng so với ma trận lượng tử hóa đầy đủ Đây ví dụ ma trận hệ số DCT: Page | 29 Một ma trận lượng tử hóa phổ biến là: Việc phân chia phần tử ma trận hệ số DCT khôn ngoan với ma trận lượng tử hóa làm tròn số ngun cho kết quả: Ví dụ: sử dụng −415 (hệ số DC) làm tròn đến số ngun gần Thơng thường q trình dẫn đến ma trận với giá trị chủ yếu góc bên trái (tần số thấp) Bằng cách sử dụng thứ tự zigzag để nhóm mục nhập khác khơng chạy mã hóa độ dài, ma trận lượng tử hóa lưu trữ hiệu nhiều so với phiên không lượng tử hóa Adaptive Quantization(Lượng tử hóa thích ứng): Lượng tử hóa thích ứng (AQ) chứng tỏ cơng cụ mã hóa hiệu để cải thiện hiệu suất mã hóa video Bài viết trình bày phương pháp AQ tạm thời theo cảm nhận để cải thiện hiệu suất mã hóa chủ quan cho Mã hóa video hiệu cao (HEVC) Trước tiên, đưa thuật tốn ước tính chuyển động theo định Page | 30 hướng chất lượng cảm nhận, thực với mơ hình biến dạng khơng gian-thời gian (JND) đáng ý Sau đó, tính nhận thức miền thời gian đề xuất để phát triển phương pháp AQ chúng tơi, tạo độ lệch tham số lượng tử hóa (QP) khác cho đơn vị mã hóa (CU) Phương pháp đề xuất sử dụng đầy đủ đặc điểm thời gian nhận thức CU, tạo phân phối bù QP thân thiện với thị giác Các thử nghiệm tiến hành HM16.0 (phần mềm tham chiếu HEVC) với SSIM (Số liệu số tương tự cấu trúc) số biến dạng, đạt mức tiết kiệm 8,08% 7,95% cho mức độ trễ thấp (PDP) Thấp Cấu hình -Delay-B (LDB) trung bình, tương ứng Đánh giá chất lượng chủ quan chứng minh phương pháp AQ đề xuất đạt chất lượng hình ảnh tương đương HM16.0 phương pháp đề xuất mang lại mức giảm bitrate đáng ý Biểu đồ trừu tượng: Page | 31 PHẦN 4: Những giải mã MPEG-4 có sẵn XviD: XviD codec tiếng MPEG-4 XviD biết với tên khác MPEG-4 Part 2.Nó thường lưu trữ dạng File.AVI.MP4… Ngoài ra, Xvid đối thủ cạnh tranh DivX Pro Codec (Xvid DivX viết ngược) Ngược lại với codec DivX, độc quyền phần mềm phát triển DivX, Inc, Xvid phần mềm miễn phí phân phối theo điều khoản GNU General Public License DivX: DivX codec MPEG-4 DivX thương hiệu sản phẩm tạo DivX, Inc (trước DivXNetworks, Inc) "DivX" viết tắt "Digital Video Express" Đây codec phổ biến nhiều đầu đọc DVD hỗ trợ DivX trở thành phổ biến khả để nén đoạn video dài thành kích cỡ nhỏ trì chất lượng hình ảnh tương đối cao Ví dụ đem so sánh MPEG-2 với DivX chất lượng tương đương, nhờ bit-rate thấp nên Video DivX nhẹ nửa so với MPEG-2 Có hai DivX codec MPEG-4 Part codec DivX thường H.264/MPEG-4 AVC codec DivX Plus HD Đây nhiều codec thường để nén, nhờ mà âm video đa phương tiện chuyển giao cho ổ đĩa cứng Ffmpeg: FFmpeg dự án phần mềm miễn phí bao gồm phần mềm khổng lồ gồm thư viện chương trình để xử lý video, âm tệp luồng đa phương tiện khác Cốt lõi chương trình FFmpeg, thiết kế để xử lý tệp video âm dựa dòng lệnh sử dụng rộng rãi để chuyển mã định dạng, chỉnh sửa (cắt xén ghép), chia tỷ lệ video, hiệu ứng hậu kỳ video tuân thủ tiêu chuẩn (SMPTE, ITU) Page | 32 FFmpeg bao gồm libavcodec, thư viện codec âm / video sử dụng nhiều sản phẩm phần mềm thương mại miễn phí, libavformat (Lavf), thư viện mux demux chứa âm / video chương trình dòng lệnh ffmpeg lõi để chuyển mã tập tin đa phương tiện FFmpeg xuất theo Giấy phép Cơng cộng GNU Ít 2.1+ Giấy phép Công cộng GNU 2+ (tùy thuộc vào tùy chọn bật) Tên dự án lấy cảm hứng từ nhóm tiêu chuẩn video MPEG, với "FF" cho "chuyển tiếp nhanh" Logo sử dụng mơ hình ngoằn ngo cho thấy cách codec video MPEG xử lý mã hóa entropy FFmpeg phần quy trình làm việc hàng trăm dự án phần mềm khác thư viện phần cốt lõi trình phát phương tiện phần mềm VLC đưa vào xử lý lõi cho kho lưu trữ tệp YouTube iTunes Các mã cho việc mã hóa / giải mã hầu hết định dạng tệp âm video biết bao gồm, làm cho hữu ích cho việc chuyển mã tệp phương tiện phổ biến không phổ biến thành định dạng chung FFmpeg chạy Microsoft Window Page | 33 3ivx: 3ivx codec video, tạo 3ivx Technologies, có trụ sở Sydney, Úc, cho phép tạo luồng liệu tuân thủ MPEG4 Nó thiết kế xung quanh nhu cầu giảm sức mạnh xử lý để sử dụng chủ yếu hệ thống nhúng Các phiên xuất vào năm 2001 3ivx cung cấp plugin lọc cho phép luồng liệu MPEG-4 bao bọc vận chuyển Microsoft ASF AVI, vận chuyển QuickTime Apple Nó cho phép tạo luồng liệu MP4 cung cấp codec âm để tạo luồng âm AAC Nó khơng hỗ trợ video H.264 (MPEG-4 Phần 10) Chỉ hỗ trợ video MPEG-4 Phần Bộ giải mã mã hóa thức cung cấp cho Microsoft Windows, Mac OS BeOS, với phát hành cũ không rõ ràng cho Amiga Linux Ngồi ra, FFmpeg giải mã video mã hóa 3ivx Cơng ty đáng ý hỗ trợ HĐH Haiku, cung cấp cổng codec 3ivx Trình trì cổng 3ivx sản xuất trình trích xuất QuickTime MOV trình trích xuất MPEG-4 cho Haiku Tính đến năm 2005, họ cơng ty hỗ trợ Haiku hình thức Phiên dùng thử ngày 3ivx liên kết thông qua hệ điều hành Microsoft Windows cho trình phát phương tiện QuickTime iTunes Gỡ cài đặt 3ivx không đặt lại tệp 3IVX.dll trình phát phương tiện cập nhật Gỡ cài đặt khơi phục trình phát phương tiện khơng giải vấn đề Windows liên kết chúng với 3IVX.dll hết hạn gỡ cài đặt Do đó, tệp mp4 khơng thể phát QuickTime iTunes nơi Windows tìm kiếm vắng mặt 3IVX.dll Cài đặt 3ivx MPEG-4 5.0 trở lên khắc phục cố (sau bạn gỡ cài đặt muốn) Phần mềm 3ivx có sẵn (trong phiên Mac OS X Windows) với loạt máy quay Flip Video từ Pure Digital 3ivx gần phát triển SDK máy khách phát trực tiếp HTTP cho điện thoại Windows Windows để phát lại nội dung HLS ứng dụng UI đại Windows Page | 34 Nero Digital: Nero Digital thương hiệu áp dụng cho codec nén âm video tương thích MPEG-4 phát triển Nero AG Đức Ateme Pháp Các codec âm tích hợp vào cơng cụ mã hóa âm Nero Digital Audio + cho Microsoft Windows codec âm & video tích hợp vào phần mềm trích xuất Recode DVD Nero Nero chứng nhận số thiết bị đầu phát / đầu ghi DVD tương thích với Nero Digital, cấp phép công nghệ codec cho nhà sản xuất mạch tích hợp Các codec video phát triển Ateme, theo vấn với nhà phát triển Nero AG, Ivan Dimkovic, codec âm phiên cải tiến Bộ mã hóa PsyTEL AAC cũ Dimkovic Bộ giải mã âm có sẵn dạng gói độc lập miễn phí có tên Nero AAC Codec Nero Digital tạo luồng định dạng chứa 3GP / MPEG-4 Phần 14 (".mp4") bao gồm hai video hai codec âm thanh: - ASP (một khoảng 20 cấu hình xác định MPEG4 Phần 2) AVC (còn gọi MPEG-4 Phần 10 H.264) AAC-LC (cấu hình AAC sử dụng rộng rãi định nghĩa MPEG-4 Phần 3) HE-AAC (được định nghĩa MPEG-4 Phần 3, gọi "aacPlus" nhãn hiệu tương tự khác) Các codec tuân thủ theo tiêu chuẩn ISO / IEC, ngoại trừ thông tin phụ đề chương Các luồng video Nero Digital tạo phát lại số trình phát phần cứng độc lập trình phát phương tiện phần mềm Nero Showtime riêng công ty Recode khơng thể trích xuất đĩa phim DVD mã hóa, nhập hình ảnh DVD giải mã để mã hóa Nero Digital khơng gửi codec dạng mơ-đun DirectShow VfW độc lập, ngăn không cho chúng sử dụng để chỉnh sửa video cho mục đích chung Sản phẩm khơng kèm với trình chỉnh sửa video Page | 35 *MPEG-4 ASP phần cứng: Một số chip giải mã phần cứng hệ xử lý cơng cụ quan trọng mà ASP cung cấp (ví dụ QPEL GMC) Các chip ngày mạnh hỗ trợ ví dụ QPEL Warppoint GMC (không hỗ trợ GMC 3WP bây giờ) Để hỗ trợ người chơi, sử dụng chip lâu đời nhất, DivXNetworks Nero tạo thứ gọi Hồ sơ MPEG-4 riêng, cụ thể Hồ sơ rạp hát nhà DXN (DXN HTP) Hồ sơ tiêu chuẩn ND (ND StP) Mọi người chơi tối thiểu để xử lý DXN HTP ND StP (bên cạnh nội dung khác) nhận Chứng nhận từ DivXNetworks / Nero Khi mã hóa theo HTP / StP chẳng hạn, bạn sử dụng QPEL GMC sử dụng B-Frame đó, HTP / StP đánh đổi chất lượng khả sử dụng với chip giải mã phần cứng cũ tất nhiên chứng nhận riêng tư giúp DivXNetworks Nero thiết lập tên thương hiệu họ nhiều Vẫn biểu thức xác cho chúng tơi cần trình phát hỗ trợ MPEG-4 ASP @ L5, trình phát cung cấp điều này, bạn phát mã hóa sau MPEG-4 ASP (cho dù sử dụng mã hóa nào) mà khơng gặp vấn đề Page | 36 ... 10-bit 4: 2:2 SDTV 180 10-bit 4: 2:2 1920×1080 30p/30i 600 12-bit 4: 4 :4 1920×1080 30p/30i 900 12-bit 4: 4 :4 2K×2K 30p 1,350 12-bit 4: 4 :4 4K×2K 30p 1,800 12-bit 4: 4 :4 4K×2K 60p 3,600 MPEG- 4 Phần... định đầy đủ " II Tìm hiểu thêm MPEG coding MPEG- 4 ASP (MPEG Coding 2), hay Active Simple Profile, tiêu chuẩn nén video định nghĩa MPEG- 4 Phần Các Page | 21 triển khai phổ biến MPEG- 4 ASP có lẽ DivX... chuẩn MPEG- 3 Đừng nhầm lẫn MPEG- 3 với MP3, MP3 âm MPEG- 1 MPEG- 2 Lớp III MPEG- 4 (1998): Mã hóa đối tượng nghe nhìn (ISO/IEC 144 96) MPEG- 4 sử dụng cơng cụ mã hóa phức tạp để đạt yếu tố nén cao MPEG- 2

Ngày đăng: 22/12/2018, 06:36

Mục lục

  • II. Tìm hiểu kĩ hơn về MPEG

    • 1. Cấu trúc dòng bit

    • 2. Nguyên lí nén MPEG

    • 3. Nguyên lí giải nén MPEG

    • PHẦN 2: PHÂN TÍCH CHUẨN H263

      • Tổng quan

      • Lịch sử và nền tảng

      • II. Tìm hiểu thêm về MPEG 4 coding 2

      • PHẦN 4: Những bộ giải mã MPEG-4 có sẵn

Tài liệu cùng người dùng

Tài liệu liên quan