Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 31 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
31
Dung lượng
916,16 KB
Nội dung
TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI VIỆN CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG ──────── * ─────── BÁO CÁO MÔN HỌC XỬ LÝ DỮ LIỆU ĐA PHƯƠNG TIỆN ĐỀ TÀI 13: Phương pháp tiên tiến nén video AVC ứng dụng Nhóm sinh viên thực hiện: MSSV Sok Sereirathana Bùi Thị Hường Bùi Kim Khánh Trần Thị Tình 20114612 20111538 20111678 20112123 Giảng viên hướng dẫn: PGS.TS Nguyễn Thị Hoàng Lan Hà Nội, tháng 05 năm 2015 Mục lục Xử lý liệu đa phương tiện Nhóm 13_Đề tài 13 Page Xử lý liệu đa phương tiện Lời mở đầu Cuộc sống ngày gắn liền với công nghệ thông tin Chiếc máy tính nói riêng, hay ngành công nghệ thông tin nói chung không xa lại với người Công nghệ thông tin không đóng vai trò then chốt sản xuất, xây dựng… mà trở thành công cụ thường xuyên lĩnh vực giải trí giúp người thư giãn sau làm việc căng thẳng Chắc hẳn xem video đĩa DVD, máy vi tính hay trang web chia sẻ trực tuyến youtube.com, clip.vn… Chúng ta thương nghe đến thuật ngữ mã hóa hay nén chuẩn MPEG-2, H264… Vậy chúng có tác dụng việc lưu trữ, truyền nhận? Trong vài năm trở lại chuẩn mã hóa MPEG H26x chuẩn nén sử dụng rộng rãi Để rõ điều nhóm chúng em chọn đề tài: “Phương pháp tiên tiến nén video AVC ứng dụng” Phân công công việc: - Phần 1: Tìm hiểu chung phương pháp nén AVC – Sok Sereirathana - Phần 2: Tìm hiểu chuẩn MPEG-4/H264 AVC – Trần Thị Tình - Phần 3: So sánh phương pháp nén MPEG-1 MPEG-4 – Bùi Thị Hường - Phần 4: Ứng dụng thử nghiệm nén video theo chuẩn MPEG-4 đo lường hiệu giải pháp – Bùi Kim Khánh Trong trình tìm hiểu hoàn thành báo cáo, chúng em giúp đỡ giảng dạy cô Nguyễn Thị Hoàng Lan Do kiến thức chưa vững tìm hiểu hạn chế nên không tránh khỏi thiếu sót, mong góp ý cô Chúng em xin chân thành cảm ơn! Nhóm 13_Đề tài 13 Page Xử lý liệu đa phương tiện Tìm hiểu chung 1.1 Khái niệm AVC (Advanced Video Coding): phương pháp nén video tiên tiến thuộc chuẩn MPEG-4 Nó cải tiến dựa phương pháp nén video sở theo chuẩn MPEG-1 MPEG-4 Part 10 /H264 hay AVC (Advanced Video Coding) định dạng nén video, hay chuẩn nén video (hay biết tên CODEC), định dạng dùng phổ biến công nghệ mã hóa, phân phối xử lý video nói chung.H264 phát triển ITU-T Video Coding Experts Group (VCEG) ISO/IEC JTC1 Moving Picture Experts Group (MPEG), nhóm thuộc tổ chức chuẩn hóa quốc tế.Mục đích đời H264 nhằm tạo định dạng video chất lượng cao với chi phí lưu trữ truyền phát thấp so với định dạng trước (MPEG1, MPEG2, H263,…) mà không yêu cầu phức tạp mặt thiết kế ứng dụng phần cứng Cũng yêu cầu nên thân H264 chia làm nhiều “chuẩn” (profile level) để phù hợp với thiết bị khác Giới thiệu vấn đề : Cần truyền tải liệu video môi trường mạng không “Heterogeneity” đến nhiều máy client với điều kiện thể khác với nhiều mức tốc độ liệu mà đảm bảo chất lượng trình diễn video Một số khái niệm chủ yếu hay gặp: • Heterogeneity: Không mạng Không môi trường máy client • Simulcast: Khả mã hóa truyền tải video đến client theo tốc độ liệu • Transcoding: Khả truyền tải liệu video với tốc độ thấp hơn, đa tốc độ tùy theo yêu cầu • Scalability: Khả phân mảnh tốc độ dòng video để truyền dòng liệu video với đa tốc độ tùy theo yêu cầu Kỹ thuật SVC (Scalable Video Coding) sử dụng phương pháp để thể tiên tiến 1.2 Lịch sử phát triển MPEG-4 part ISO công bố vào 1999, tiêu chuẩn cho nhũng ứng dụng truyền thông đa phương tiện với tốc độ bit thấp cho ứng dụng truyền hình quảng bá tương lai Tuy nhiên chất lượng chưa đạt mong muốn, Nhóm 13_Đề tài 13 Page Xử lý liệu đa phương tiện mà ISO/ĨEC (MPEG) ITU họp tác thành lập nhóm Joint Video Team (JVT), đề nghiên cứu phát triên chuấn mã hóa tiên tiến Advanced Video Coding (AVC) Và đến 2003 cho đời chuẩn MPEG-4 part 10, tên theo tiêu chuẩn ĨSO/IEC 14496-10 H.246 AVC ITƯ hay gọi MPEG-4 H.264/AVC, gọi tắt H.264/AVC 1.3 Ứng dụng MPEG4 Part 10 /H264 hay AVC định dạng video, tất nhiên nhiệm vụ H264 đóng vai trò chuẩn mã hóa nén video Hiện H264 sử dụng nhiều thiết bị, dịch vụ Đơn cử thiết bị đầu Blu-ray, dịch vụ phát video trực tuyến qua internet YouTube, iTunes Store, Vimeo,… phần mềm Adobe Flash Player, Silverlight, VLC, dịch vụ truyền hình HDTV, truyền hình vệ tinh Ngoài H264 hãng công nghệ phát triển để phục vụ cho mục đích khác như: XAVC: Định dạng thu video hỗ trợ độ phân giải lên tới 4K (4096×2160) tốc độ khung hình lên tới 60 FPS • AVCHD: Được phát triển Sony Panasonic, dùng để thu video độ phân giải cao, sử dụng nhiều đĩa Blu-ray máy PlayStation Về H264 thêm số tính đặc biệt phục vụ cho thiết bị hãng • 1.4 Đặc điểm chuẩn nén MPEG4 Part 10 /H264 hay AVC • Dự đoán không gian định hướng kiểu mã hóa Intra: hồ trợ tới 17 kiều dự đoán, làm cho việc dự đoán mẫu xác hơn, đạt hiệu nén cao • Bù chuyển động với kích thước nhỏ thay đổi Tiêu chuẩn mang lại mềm dẻo cho lựa chọn kích thước hình dạng, kích thước bù chuyến động nhỏ 4x4 Điều mang lại hiệu suất 15% so với MPEG-2 Bù chuyển động % làm giảm tính phức tạp xử lý nội suy so với tiêu chuẩn trước Nhóm 13_Đề tài 13 Page Xử lý liệu đa phương tiện • • • • • Bù chuyển động với nhiều hình tham khảo Do camera thay đổi góc quay hay chuyển qua lại cảnh, việc đoán trước chuyền động phức tạp ta cần phải có nhiều frame tham khảo để nâng cao hiệu suất chất lượng H.264/AVC cho phép sử dụng tối đa 32 frame tham khảo MPEG-2 sử dụng frame tham khảo mang tính chất chu kỳ Bù chuyển động với nhiều hình tham khảo chậm trình mã hóa giải mã tăng chất lượng ảnh với tỉ số nén Tách riêng hình tham khảo hình hiển thị: tiêu chuân trước có phụ thuộc hình tham khảo hình hiển thị, H.264/AVC mã hóa chọn hình ảnh đổ tham khảo gần với hình ảnh mã hóa cho mục đích tham khảo dự đoán nên có thê hiển thị với tính linh hoạt cao, khoảng thời gian trễ loại bỏ Giảm dư thừa không gian tốt hơn: sử dụng phép biến đổi nguyên thay sử dụng phép biến đổi DCT MPEG-2, làm giảm ảnh hưởng sai số làm tròn Lượng tử hóa thích nghi: trình mã hóa với tốc độ bit biến thiên, sử dụng lượng tử hóa thích nghi, frame nén với lượng tử khác phụ thuộc vào chất hình ảnh chúng thông qua việc điều khiển tốc độ bit Ví dụ phần chuyển động hay phần hình ảnh sẫm màu khó nhận biết xử lý với hệ số lượng tử lớn (độ nén cao hơn, dung lượng nhỏ hon), phần hay hệ thống mắt người ý nhiều xử lý với hệ số lượng tử thấp (độ nén nhỏ hơn, dung lượng lớn hơn) H.264/AVC cho phép sử dụng tới 52 mức lượng tử MPEG-2 có 31 mức Sử dụng lọc tách khối: Trái ngược với tiền xử lý hay hậu xử lý, lọc tách khối áp dụng suốt trình mã hóa frame đơn lẻ, trước sử dụng đế tham khảo cho frame đến sau Cải tiến giúp tránh tượng kết khối làm ảnh hưởng đến chất lượng hình ảnh, đặc biệt với tốc độ bit thấp Nhưng tốc độ mã hóa, giải mã bị giảm sút • Kiểu dự đoán trọng so H.264/AVC hỗ trợ trình mờ dần hay tối dần khung hình đoạn film có hiệu ứng mò' dần (những frame đến sau giống so với frame trước nó, có sắc độ khác chút), Nhóm 13_Đề tài 13 Page Xử lý liệu đa phương tiện • Mã hóa Entropy thích nghi: H.264/AVC sử dụng phương pháp mã hóa phức tạp CAVLC CABAC thay biến đồi VCL tĩnh MPEG-2, nên hiệu mã hóa cao rõ rệt Một số đặc tính làm tăng cường khả chống sai số liệu : • Thông số cài đặt cấu trúc: tập họp thông số nhằm tăng cường cho thông tin đầu mục trình truyền hiệu Ở tiêu chuẩn trước, số thông tin quan trọng thông tin đầu mục chuỗi ảnh ảnh hưởng lớn đến trình giải mã Còn H.264/AVC thông tin tách riêng tạo tính linh hoạt chuyên dụng • Cấu trúc cú pháp NAL: Mồi cấu trúc cú pháp H.264/AVC đặt gói dừ liệu vật lý gọi NAL • Hỗ trợ kỳ thuật xếp thứ tự mềm dẻo FMO xếp thứ tự slice ASO • Hỗ trợ ảnh chuyển mạch đồng SI/SP kỳ thuật phân vùng liệu (Data Partitioning) Chức H.264/AVC tổng hợp chức sau: • Hiệu suất nén: hiệu suất nén mục tiêu MPEG-1, MPEG-2 Do H.264/AVC, việc cải tiến hiệu suất mã hóa luồng dừ liệu sè mở rộng khả ứng dụng thực tiễn Tiêu chuẩn H.264/AVC tiết kiệm lên đến 50% tốc độ bit so với MPEG-1, MPEG-2, MPEG-4 part mã hóa cấp độ • Khả tương tác: cho phép người sử dụng tương tác trực tiếp nội dung chương trình xem • Kiêu truy nhập phố biến: tăng cường khả chống lỗi mội truờng khắc nhiệt, cung cấp công cụ cần thiết để giải việc mát gói liệu truyền mạng gói lỗi bit môi trường không dây Nhóm 13_Đề tài 13 Page Xử lý liệu đa phương tiện MPEG-4/H264 AVC 2.1 Kiến trúc phân lớp MPEG-4/H264 AVC H.264/AVC Codec bao gồm khối : video coding layer ( VCL) network abstraction layer ( NAL) Hình 2.1: Cấu trúc phân lớp mã hóa H.264/AVC Tín hiệu vào nén trước tiên khối VCL thành dòng bit- bitstream Chức khối VCL nén nội dung video hiệu Network abstraction layer ( NAL) khái niệm mới, thiết kế cho việc truyền tải dòng bit nén môi trường mạng lưu trữ khác Những ứng dụng bao gồm : quảng bá mạng mặt đất, dây cáp vệ tinh; mạng IP, wireless kênh ISDN Trong lớp này, thông tin header thêm vào dòng bit nén để điều khiển loại tầng giao vận phương tiện lưu trữ Giao diện NAL thiết kế phép liệu video nén phù hợp với giao thức kiến trúc mạng khác 2.2 Cấu trúc dòng bit Dòng bit hai dạng: dòng NAL unit ( NALU) dòng byte Dòng NALUs bao gồm chuỗi NALU Định dạng NALU biểu diễn sau: Nhóm 13_Đề tài 13 Page Xử lý liệu đa phương tiện Hình 2.2: Cấu trúc dòng bit - - Trong header NALU: Bit bit bits sử dụng để có hay không NALU chứa chuỗi (tập hợp) tham số picture mảnh picture tham chiếu bits sử dụng để loại NALU units, tương ứng với loại liệu mang NALU unit Có tổng cộng 32 loại NALUs 32 loại chia làm dạng: VCL NALUs non-VCL NALUs VCL units mang liệu tương ứng với VCL Trái lại non-VCL NALUs mang thông tin : thông tin tăng cường bổ sung (SEI), chuỗi tập hợp tham số picture, dấu giới hạn truy cập thông tin khác Trong dòng NALU, NALUs giải mã theo trình tự Dòng byte - bytestream- khởi tạo từ dòng NALU cách xếp NALUs trình tự giải mã thêm NALU mã bắt đầu Dòng NALU lấy từ dòng byte cách loại bỏ mã bắt đầu 2.3 Sơ đồ mã hóa Sơ đồ mã hóa H.264/AVC tương tự so với chuẩn video khác Bộ mã hóa theo chuẩn MPEG4/H264 có khối (khối dự đoán, khối biến đổi, khối lượng tự hóa, mã hóa entropy) giống chuẩn trước (MPEG-1, MPEG-2, MPEG-4, H.261, H.263), khối chức có thay đổi quan trọng Nhóm 13_Đề tài 13 Page Xử lý liệu đa phương tiện Hình 2.3: Sơ đồ mã hóa theo chuẩn H.264/AVC Lớp mã hoá video H264/AVC kết hợp mã hoá không gian, mã hoá thời gian mã chuyển vị Ảnh tách thành khối, ảnh dãy điểm truy cập ngẫu nhiên mã hoá “Intra”- mã hoá ảnh, có nghĩa không dùng thông tin ảnh khác mà dùng thông tin chứa ảnh Mỗi mẫu khối Frame Intra dự đoán nhờ dùng mẫu không gian bên cạnh khối mã hoá trước Đối với tất ảnh lại dãy điểm truy cập ngẫu nhiên, mã hoá “Inter” sử dụng, dùng dự đoán bù chuyển động từ ảnh mã hoá trước đó.Quá trình mã hoá cho dự đoán liên ảnh (bù chuyển động) gồm việc lựa chọn liệu chuyển động, ảnh tham chiếu dịch chuyển không gian ứng dụng cho tất việc lấy mẫu khối Bộ mã hoá lựa chọn mã hoá Intra Inter cho miền hình dạng khối ảnh Mã hoá Intra điểm truy cập chuỗi mã hoá, việc giải mã bắt đầu tiếp tục cách xác Mã hoá Intra sử dụng mode dự đoán không gian riêng rẽ để làm giảm độ dư thừa không gian tín hiệu gốc ảnh đơn Mã hoá Inter (dự đoán chiều hay nhiều chiều) việc sử dụng dự đoán liên ảnh hiệu cho block giá trị lấy mẫu từ vài ảnh giải mã trước Nhóm 13_Đề tài 13 Page 10 Xử lý liệu đa phương tiện điện thoại hình Main Profile thiết kế cho thiết bị lưu trữ số truyền hình quảng bá Extended Profile với mục đích ứng dụng cho dịch vụ đa phương tiện mạng Internet Ngoài có High Profile định nghĩa độ trung thực vùng mở rộng cho ứng dụng như: đóng góp nội dung, phân phối nội dung, việc dàn dựng studio xử lý trình gửi thông tin Các High Profile : High, High 10, High 4:2:2, High 4:4:4 Trong đó: - High Profile: hỗ trợ cho việc lấy mẫu 8- bít video với chuẩn 4:2:0 - High 10 Profile: hỗ trợ cho việc lấy mẫu 10-bít video với chuẩn 4:2:0 - High 4:2:2 Profile: hỗ trợ cho việc lấy mẫu 10 –bít cho thành phần màu với chuẩn 4:2:2 - High 4:4:4 Profile hỗ trợ cho việc lấy mẫu 12-bít cho thành phần màu với chuẩn 4:4:4 Các Profile có phần mã hoá chung phần mã hoá riêng hình sau: Các phần chung cho tất Profile : - Slice I (Slice mã hoá ảnh): Slice mã hoá việc sử dụng dự đoán từ - mẫu mã hoá bên Slice Slice P (Predictive-coded Slice ): Slice mã hoá việc sử dụng dự đoán liên ảnh từ ảnh tham chiếu mã hoá trước sử dụng hầu hết cho Vector chuyển động hệ số tham chiếu để dự đoán giá trị mẫu cho Block CAVLC (Context-based Adaptive Variable Lengh Coding):mã hoá độ dài biến đổi tương thích với tình huống, cho mã hoá Entropy • Baseline Profile Nhóm 13_Đề tài 13 Page 17 Xử lý liệu đa phương tiện - Thứ tự Macro-Block linh hoạt (Flexible Macro-Block order): Macro-Block - không cần thiết thứ tự quét mành Bản đồ định vị Macro-Block cho nhóm Slice Thứ tự Slice (Arbitrary Slice order): địa Macro-Block Macro-Block Slice ảnh nhỏ địa Macro-Block vài Slice khác có trước ảnh mã hoá Slice dư thừa (Redundant Slice ): Slice thuộc liệu mã hoá dư thừa thu từ hay khác tỷ lệ mã hoá, so với liệu mã hoá trước Slice • Main Profile - B Slice (Bi-directionally predictive-coded Slice ): Slice mã hoá việc sử dụng dự • • - đoán liên ảnh từ ảnh tham chiếu mã hoá trước đó, sử dụng hầu hết hai Vector chuyển hệ số tham chiếu để dự đoán giá trị mẫu Block Dự đoán có trọng số (weighted prediction): phân chia hoạt động việc áp dụng thừa số trọng số để lấy mẫu liệu dự đoán bù chuyển động Block CABAC (Context-based Adaptive Binary Arithmetic Coding): mã hóa thuật toán nhị phân tương thích với tình huống, cho mã hoá Entropy Extended Profile Bao gồm tất phần Baseline Profile: thứ tự Macro-Block linh hoạt, thứ tự Slice bất kỳ, Slice dư thừa Slice SP: Slice mã hoá đặc biệt để có khả chuyển đổi dòng video, tương tự việc mã hoá Slice P Slice SI: Slice chuyển đổi tương tự việc mã hoá Slice I Sự phân chia liệu: liệu mã hoá đặt phân chia liệu tách rời, phân chia đặt đơn vị lớp khác Slice B Dự đoán có trọng số High Profile Bao gồm tất phần Main Profile: Slice B, dự đoán có trọng số, CABAC Kích cỡ khối biến đổi tương thích: biến đổi nguyên khối x 4, x cho việc lấy mẫu thành phần chói Các ma trận phân chia lượng tử hoá: phân chia khác tuỳ theo tần số riêng kết hợp với hệ số biến đổi trình lượng tử hoá để làm tối ưu chất lượng chủ thể Nhóm 13_Đề tài 13 Page 18 Xử lý liệu đa phương tiện Nhóm 13_Đề tài 13 Page 19 Xử lý liệu đa phương tiện 3.1 So sánh phương pháp nén MPEG-1 MPEG-4 Mô hình tổng quát 3.2 Nén video theo chuẩn MPEG-1 Chuẩn MPEG-1 xuất vào 11/1992 chuẩn khởi đầu cho việc nén ảnh động tảng phát triển cho chuẩn nén khác họ MPEG, mệnh danh chuẩn “khởi động thiết bị số” MPEG-1(mã ISO/IEC 11172): dùng để ghi CD-ROM, VCD, 352x240, 2530 ảnh/s, tốc độ từ 1.2-1.5 Mbit/s Sơ đồ trình nén: Nhóm 13_Đề tài 13 Page 20 Xử lý liệu đa phương tiện Đầu vào: frame ảnh video Đầu ra: dòng bit mã hóa Sơ đồ nén gồm có phần chính: - Khối mã hóa DCT, IDCT - Khối lượng tử hóa & lượng tử hóa ngược - Khối dự đoán, bù chuyển động Chức khối sau: - Khối DCT thực phép biến đổi Cosin rời rạc đối tượng sai khác frame frame dự đoán (đối với frame I, DCT thực biến đổi khối điểm ảnh frame) IDCT thực phép biến đổi Cosin ngược, phục hồi lại sai khác mã hóa, sử dụng cho trình dự đoán bù chuyển động - Lượng tử hóa: rời rạc hóa tín hiệu theo bước lượng tử, rời rạc hóa giá trị khối điểm ảnh qua biến đổi DCT Nhóm 13_Đề tài 13 Page 21 Xử lý liệu đa phương tiện - Khối dự đoán chuyển động: thực tìm vector chuyển động khối điểm ảnh dựa theo frame frame tham chiếu(frame dự đoán trước nó) Vector chuyển động mã hóa truyền - Khối bù chuyển động có nhiệm vụ khôi phục lại frame dự đoán vector chuyển động frame tham chiếu Từ frame dự đoán frame tại, ta lấy thông tin sai khác, thông tin đưa đến mã hóa DCT MPEG1 phối hợp kĩ thuật DPCM DCT, có đặc điểm nén giống kỹ thuật Nếu khối sơ đồ nén DPCM, hiệu nén phụ thuộc nhiều vào khối dự đoán, MPEG-1 lại khối dự đoán bù chuyển động Về chất, dự đoán bù chuyển động MPEG1 khối tiên đoán DPCM Tuy mặt tính toán, độ phức tạp giải thuật, dự đoán chuyển động tốn chi phí cao; bù lại, độ xác dự đoán lại cao nhiều so với giải thuật dự đoán DPCM Khối DCT biến đổi khối điểm ảnh theo công thức định nghĩa sẵn Tức DCT có ý nghĩa làm tăng giải tương quan block ảnh ý nghĩa định đến hiệu nén sơ đồ Thêm nữa, kế thừa từ DPCM nên MPEG1 có sai số mã hóa gây khối lượng tử hóa Nhưng MPEG1, sai số điều chỉnh, theo làm tăng chất lượng video Khi ta tăng số bit lượng tử hóa, tức sai số lượng tử hóa giảm, tín hiệu sau lượng tử hóa gần với tín hiệu thực tế Mô tả trình nén sau: Frame I (frame đầu tiên) mã hóa toàn theo phương pháp mã hóa ảnh JPEG, vector chuyển động = 0, frame trở thành frame tham chiếu frame thứ Nhóm 13_Đề tài 13 Page 22 Xử lý liệu đa phương tiện Frame thứ 2: nhận frame tham chiếu frame dự đoán trước (frame 1) Bộ đánh giá chuyển động xác định vector chuyển động dựa vào frame frame Bộ bù chuyển động tạo frame dự đoán frame cách kết hợp vector chuyển động frame tham chiếu (là frame 1) Từ frame frame dự đoán nó, ta mã hóa sai khác chúng, đưa lên đường truyền sau lượng tử hóa Các frame sau tiếp tục trình 3.3 Nén video theo chuẩn MPEG-4 MPEG-4 (1998): mã ISO/IEC 14496 liệu đa phương tiện truyền thông ứng dụng tương tác đa phương tiện, đồng liệu (tốc độ bit thấp) MPEG-4 Video định dạng sử dụng để lưu trữ hiệu nội dung video video streaming qua Internet mạng di động, cho ứng dụng chuyên nghiệp lưu trữ video studio MPEG4 dựa MPEG-1 tiêu chuẩn MPEG-2 chúng đồ họa video lossy chuẩn thuật toán nén.Tuy nhiên, MPEG-4 liệu video đầu vào kích thước nhỏ ưa thích cho streaming trực tuyến hay lưu trữ với không gian ổ đĩa giới hạn Đây chủ yếu MPEG-4 dựa công nghệ wavelet nén hình ảnh màu sắc mức 20: đến 300: hình ảnh màu xám 20: đến 50: Hơn Nhóm 13_Đề tài 13 Page 23 Xử lý liệu đa phương tiện nữa, chế nén MPEG4 phức tạp chút so với MPEG2 Điều MPEG4 cần thuật toán tốt để quét xác định pixel loại bỏ, để giảm kích thước liệu Wikipedia liệt kê sau tính MPEG4: • MPEG-4 cho phép nhà phát triển phần mềm phần cứng khác để tạo đối tượng đa phương tiện sở hữu khả tốt khả thích ứng linh hoạt để cải thiện chất lượng dịch vụ công nghệ truyền hình kỹ thuật số, đồ họa hoạt hình, World Wide Web phần mở rộng họ • Các nhà cung cấp mạng liệu sử dụng MPEG-4 cho minh bạch liệu Với giúp đỡ thủ tục chuẩn, MPEG-4 liệu giải thích chuyển thành dạng tín hiệu khác tương thích với mạng có sẵn • Các định dạng MPEG-4 cung cấp người dùng cuối với loạt tương tác với đối tượng hoạt hình khác • Tín hiệu Digital Rights Management tiêu chuẩn hóa, đến cộng đồng MPEG Quản lý Sở hữu trí tuệ bảo vệ (IPMP) MPEG4 nhận phổ biến năm qua Một định dạng thông dụng mp4 MPEG-4 Part 12 phát triển từ tập tin MOV Apple cuối dẫn đến MPEG-4 Part 14, định dạng MP4 Các MP4 định dạng container Điều có nghĩa sử dụng để lưu trữ liệu audio / video MP4 video âm xem trực tiếp qua internet Nhóm 13_Đề tài 13 Page 24 Xử lý liệu đa phương tiện MPEG-4/H264 AVC phương pháp nén tiên tiến, phát triển sở MPEG-4 Phương pháp có ưu điểm bật như: + Hiệu suất nén: hiệu suất nén mục tiêu MPEG-1, MPEG-2 Do H.264/AVC, việc cải tiến hiệu suất mã hóa luồng dừ liệu sè mở rộng khả ứng dụng thực tiễn Tiêu chuẩn H.264/AVC tiết kiệm lên đến 50% tốc độ bit so với MPEG-1, MPEG-2, MPEG-4 part mã hóa cấp độ + Khả tương tác: cho phép người sử dụng tương tác trực tiếp nội dung chương trình xem + Kiểu truy nhập phố biến: tăng cường khả chống lỗi mội truờng khắc nghiệt, cung cấp công cụ cần thiết để giải việc mát gói liệu truyền mạng gói lỗi bit môi trirờng không dây Một số công cụ sử dụng để làm tăng hiệu nén phương pháp nén MPEG-4: + Dự đoán hệ số AC/DC mà hệ số macroblock dự đoán từ hệ số macroblock bên cạnh từ số liệu thân macroblock + Nội suy nhiều chiều tạo thích hợp cho macroblock, giảm lượng lưu ảnh lỗi, làm giảm số bit cần phải mã hóa Tuy nhiên, nội suy nhiều chiều đòi hỏi nhiều thuật toán hơn, phức tạp bù chuyển động cao + Kích thước thay đổi xuống khối 4x4 cung cấp độ lợi mã hóa Nhóm 13_Đề tài 13 Page 25 Xử lý liệu đa phương tiện Ứng dụng thử nghiệm Thử nghiệm ứng dụng nén chuẩn MPEG-4 đo lường hiệu giải pháp nén Quá trình thử nghiệm: - Các phần mềm sử dụng: + MSU Video Quality Measurement Tool Free 64-bit hoàn toàn miễn phí, có khả tính toán độ tổn hao, tỉ số nén + Xilisoft Video Converter Ultimate: phần mềm hoàn toàn miễn phí, có khả chuyển đổi định dạng, phương thức mã hóa video Video đầu vào: file video đuôi avi, nén theo chuẩn mpeg : video.avi Nhóm 13_Đề tài 13 Page 26 Xử lý liệu đa phương tiện Video đầu ra: file video đuôi mp4, nén chuẩn mpeg-4: mp4.mp4 Công thức tỉ số nén: Tỉ số nén= Dung lượng liệu trước nén/ Dung lượng liệu sau nén Nhóm 13_Đề tài 13 Page 27 Xử lý liệu đa phương tiện Ta tính tỉ số nén 49,98 Công thức tính độ tổn hao: Sử dụng phần mềm MSU Video Quality Measurement Tool Free 64-bit Giao diện phần mềm: Nhóm 13_Đề tài 13 Page 28 Xử lý liệu đa phương tiện Sau tính toán, Kết độ tổn hao xuất file excel: Nhóm 13_Đề tài 13 Page 29 Xử lý liệu đa phương tiện Ở đây, độ tổn hao PSNR = 35.74062 Nhóm 13_Đề tài 13 Page 30 Xử lý liệu đa phương tiện Tài liệu tham khảo Slide giảng môn Xử lý liệu đa phương tiện, Truyền thông đa phương tiện- PGS.TS Nguyễn Thị Hoàng Lan- Đại học Bách Khoa Hà Nội H.264-and-MPEG-4-Video-Compression-Video-Coding-for-Next-Generation- Multimedia Image and Video Compression for Multimedia Engineering MPEG-4 video encoder and decoder implementation on RMI AIchemy Au1200 processor for video phone applications Báo cáo “Tìm hiểu chuẩn nén MPEG H26x”- Nhóm sinh viên Trường Đại học Bách Khoa Hà Nội Nhóm 13_Đề tài 13 Page 31 [...]... Video là một định dạng được sử dụng để lưu trữ hiệu quả các nội dung video và video streaming qua Internet và các mạng di động, cũng như cho các ứng dụng chuyên nghiệp như lưu trữ video trong studio MPEG4 dựa trên MPEG-1 và tiêu chuẩn MPEG-2 và như chúng là một đồ họa và video lossy chuẩn thuật toán nén. Tuy nhiên, đối với MPEG-4 dữ liệu video đầu vào kích thước nhỏ hơn và do đó được ưa thích cho streaming... tiện Ứng dụng thử nghiệm 4 Thử nghiệm ứng dụng nén chuẩn MPEG-4 và đo lường hiệu năng giải pháp nén Quá trình thử nghiệm: - Các phần mềm sử dụng: + MSU Video Quality Measurement Tool Free 64-bit hoàn toàn miễn phí, có khả năng tính toán độ tổn hao, tỉ số nén + Xilisoft Video Converter Ultimate: cũng là một phần mềm hoàn toàn miễn phí, có khả năng chuyển đổi định dạng, phương thức mã hóa video Video... đầu vào: 1 file video đuôi avi, nén theo chuẩn mpeg : video. avi Nhóm 13_Đề tài 13 Page 26 Xử lý dữ liệu đa phương tiện Video đầu ra: 1 file video đuôi mp4, nén chuẩn mpeg-4: mp4.mp4 Công thức tỉ số nén: Tỉ số nén= Dung lượng dữ liệu trước nén/ Dung lượng dữ liệu sau nén Nhóm 13_Đề tài 13 Page 27 Xử lý dữ liệu đa phương tiện Ta có thể tính được tỉ số nén bằng 49,98 Công thức tính độ tổn hao: Sử dụng. .. liệu đa phương tiện MPEG-4/H264 AVC là một phương pháp nén tiên tiến, phát triển trên cơ sở MPEG-4 Phương pháp này có những ưu điểm nổi bật như: + Hiệu suất nén: hiệu suất nén là mục tiêu chính trong MPEG-1, MPEG-2 Do đó ở H.264 /AVC, việc cải tiến hiệu suất mã hóa các luồng dừ liệu sè mở rộng khả năng ứng dụng của nó trong thực tiễn Tiêu chuẩn H.264 /AVC tiết kiệm lên đến 50% tốc độ bit so với MPEG-1,... lượng chủ thể Nhóm 13_Đề tài 13 Page 18 Xử lý dữ liệu đa phương tiện Nhóm 13_Đề tài 13 Page 19 Xử lý dữ liệu đa phương tiện 3 3.1 So sánh phương pháp nén MPEG-1 và MPEG-4 Mô hình tổng quát 3.2 Nén video theo chuẩn MPEG-1 Chuẩn MPEG-1 xuất hiện vào 11/1992 là chuẩn khởi đầu cho việc nén các ảnh động và đây cũng là nền tảng phát triển cho các chuẩn nén khác trong họ MPEG, nó được mệnh danh là chuẩn “khởi... thông dụng nhất của nó là mp4 MPEG-4 Part 12 được phát triển từ tập tin MOV của Apple và cuối cùng dẫn đến MPEG-4 Part 14, đó là định dạng MP4 Các MP4 là định dạng container Điều này có nghĩa rằng nó có thể được sử dụng để lưu trữ dữ liệu audio và / hoặc video MP4 video và âm thanh cũng có thể được xem trực tiếp qua internet Nhóm 13_Đề tài 13 Page 24 Xử lý dữ liệu đa phương tiện MPEG-4/H264 AVC là một phương. .. picture được mã hóa và thứ hai bao gồm những phương thức chuyển đổi và mã hóa entropy Một vài công cụ được dùng trong H.264 /AVC để cải thiện dự đoán inter và intra sẽ được miêu tả trong phần sau: Bù chuyển động với khối có kích thước nhỏ được sử dụng, thường sử dụng khối 4x4 Bù chuyển động với độ chính xác ¼ pixel được sử dụng trong H.264 /AVC Bù chuyển động được sử dụng trong MPEG-4 Part2 nhưng H.264 còn... chuyển động và frame tham chiếu của nó (là frame 1) Từ frame 2 và frame dự đoán của nó, ta mã hóa sự sai khác giữa chúng, đưa lên đường truyền sau khi đã lượng tử hóa Các frame sau tiếp tục quá trình như trên 3.3 Nén video theo chuẩn MPEG-4 MPEG-4 (1998): mã ISO/IEC 14496 dữ liệu đa phương tiện trong truyền thông và các ứng dụng tương tác đa phương tiện, đồng bộ dữ liệu (tốc độ bit thấp) MPEG-4 Video là... sử dụng bộ lọc tách khối vòng ( DFs) là một tính năng khác để giảm sự giả tưởng block và cải thiện chất lượng video Sự khác biệt giữa MPEG-1/2 và H.264 là trong H.264 sử dụng DF (deblocking filter) trong vòng lặp bù chuyển động, vì vậy nó có thể được sử dụng để cải thiện dự đoán interframe và cải thiện hiệu quả nén H.264 biến đổi khối có kích thước 4x4 thay vì sử dụng 8x8 như trong môt số chuẩn nén. .. chuẩn nén, một macroblock bao gồm một khối 16x16 tín hiệu độ chói và tương ứng với hai khối tín hiệu màu được sử dụng như là một phép xử lý cơ bản Hình 2.8: Cách chia Macroblock (MB) trong H264 3.5 Các Profile và các Level Các Profile và các Level xác định các điểm bắt buộc Các điểm bắt buộc này được thiết kế để tạo thuận tiện cho sự linh hoạt giữa các ứng dụng khác nhau của tiêu chuẩn H264 /AVC Profile ... Page Xử lý liệu đa phương tiện Tìm hiểu chung 1.1 Khái niệm AVC (Advanced Video Coding): phương pháp nén video tiên tiến thuộc chuẩn MPEG-4 Nó cải tiến dựa phương pháp nén video sở theo chuẩn... đa phương tiện MPEG-4/H264 AVC phương pháp nén tiên tiến, phát triển sở MPEG-4 Phương pháp có ưu điểm bật như: + Hiệu suất nén: hiệu suất nén mục tiêu MPEG-1, MPEG-2 Do H.264 /AVC, việc cải tiến. .. trữ, truyền nhận? Trong vài năm trở lại chuẩn mã hóa MPEG H26x chuẩn nén sử dụng rộng rãi Để rõ điều nhóm chúng em chọn đề tài: Phương pháp tiên tiến nén video AVC ứng dụng Phân công công việc: