1. Trang chủ
  2. » Luận Văn - Báo Cáo

Tìm hiểu kỹ thuật nén MPEG Video Coding I MPEG 1

52 2 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 52
Dung lượng 1,37 MB

Nội dung

BỘ CÔNG NGHIỆP TR ƯỜNG ĐẠI HỌC CÔNG NGHIỆP HÀ NỘI KHOA CÔNG NGHỆ THÔNG TIN  BÁO CÁO BÀI TẬP LỚN CƠNG NGHỆ ĐA PHƯƠNG TIỆN Giáo viên: Nhóm - Lớp - Khoá Thành viên: Đề tài: Nguyễn Thị Mỹ Bình Nhóm – CNTT2-K10 Trần Tuấn Ngọc Lê Văn Dũng Nguyễn Huy Hợp Tìm hiểu kỹ thuật nén MPEG Video Coding I – MPEG–1 HÀ NỘI - 2018 Mục lục Tìm hiểu kỹ thuật nén MPEG Video Coding I – MPEG–1 LỜI MỞ ĐẦU Lời chúng em xin chân thành cảm ơn Ban giám hiệu trường Đại Học Công Nghiệp Hà Nội tạo điều kiện để sinh viên chúng em có mơi trường học tập thoải mái sở hạ tầng sở vật chất Chúng em xin cảm ơn khoa Công nghệ thông giúp chúng em mở mang kiến thức vấn đề xung quanh máy tính Qua chúng em nhận thức cách đầy đủ toàn diện tầm quan trọng ngành công nghệ thông tin công xây dựng phát triển đất nước ngày giàu mạnh Chúng em chân thành cảm ơn Nguyễn Thị Mỹ Bình hướng dẫn tận tình để nhóm chúng em hồn thành tập lớn môn học Hi vọng thông qua nỗ lực tìm hiểu tất thành viên, nhóm chúng em giúp bạn hiểu rõ trình xây dụng sản phẩm đa phương tiện số tính hỗ trợ phần mềm Ngồi ra, nhóm mong muốn giới thiệu tới bạn tính hay, ưu điểm bậc phần khác Tìm hiểu kỹ thuật nén MPEG Video Coding I – MPEG–1 Phần 1: Tổng quan MPEG I Tìm hiểu chung MPEG Giới thiệu Moving Picture Experts Group (MPEG) - "Nhóm chuyên gia hình ảnh động" (MPEG phát âm /ˈɛm peg/: em-peg) nhóm quy tắc hoạt động thành lập ISO IEC để thiết lập tiêu chuẩn cho việc truyền tải âm video MPEG không đơn giản công cụ nén đơn lẻ mà ưu điểm nén ảnh MPEG chỗ MPEG có tập hợp cơng cụ mã hóa chuẩn, chúng kết hợp với cách linh động để phục vụ cho loạt ứng dụng khác Chuẩn MPEG lần mắt vào năm 1988 sáng kiến Hiroshi Yasuda (Tập đoàn Nippon Telegraph Telephone) Leonardo Chiariglione, chủ tịch nhóm kể từ thành lập Hội nghị MPEG diễn vào tháng năm 1988 Ottawa, Canada Tính đến cuối năm 2005, MPEG lên tới 350 thành viên tham gia hội nghi từ lĩnh vực công nghiệp, trường đại học viên nghiên cứu khác Danh pháp thức MPEG ISO/IEC JTC1/SC29 WG11 Các tiêu chuẩn Chuẩn MPEG gồm phận khác Mỗi phận lại bao gồm đặc điểm kỹ thuật định Các tiêu chuẩn xác định Cơ cấu (Profiles) Cấp độ (Levels) Cơ cấu nhằm xác định tập hợp cơng cụ có sẵn, Cấp độ xác định phạm vi giá trị thích hợp cho thuộc tính liên quan đến chúng Một số tiêu chuẩn MPEG thay đổi cải tiến phiên MPEG tiêu chuẩn hóa định dạng nén tiêu chuẩn phụ sau đây: MPEG-1 (1993): Mã hóa hình ảnh động âm liên quan việc lưu trữ kỹ thuật số đa phương tiện lên đến 1,5 Mbit/s (ISO/IEC 11172) Chuẩn nén MPEG cho âm video Nó thường giới hạn khoảng 1,5 Mbit/s mặt kỹ thuật bit rate cao nhiều Nó thiết kế phép hình ảnh chuyển động âm mã hóa thành bit rate Đĩa CD Nó sử dụng Video CD dùng cho video chất lượng thấp DVD Nó dùng dịch vụ truyền hình vệ tinh truyền hình cáp kỹ Tìm hiểu kỹ thuật nén MPEG Video Coding I – MPEG–1 thuật số trước MPEG-2 trở nên phổ biến Để đáp ứng yêu cầu bit thấp, MPEG-1 downsamples hình ảnh, tần số ảnh 24–30 Hz, cho chất lượng mức trung bình Nó bao gồm MPEG-1 Audio Layer III định dạng nén âm phổ biến (MP3) MPEG-2 (1995): Mã hóa chung cho hình ảnh chuyển động thông tin âm liên quan (ISO/IEC 13818) Tiêu chuẩn truyền tải video âm có chất lượng truyền hình Chuẩn MPEG-2 hỗ trợ quét xen kẽ HD video MPEG-2 xem trọng chọn làm chương trình nén cho phát sóng truyền hình kỹ thuật số, dịch vụ kỹ thuật số vệ tinh, truyền hình cap kỹ thuật số, SVCD DVD Video Nó sử dụng Đĩa Blu-ray, thường dùng MPEG-4 Part 10 SMPTE VC-1 cho nội dung HD MPEG-3: MPEG-3 xử lý chuẩn hóa scalable and nén đa độ phân giải dành cho HDTV nhân thấy khơng cần thiết nên đuọc xác nhập vào MPEG-2; kết khơng cịn tiêu chuẩn MPEG-3 Đừng nhầm lẫn MPEG-3 với MP3, MP3 âm MPEG-1 MPEG2 Lớp III MPEG-4 (1998): Mã hóa đối tượng nghe nhìn (ISO/IEC 14496) MPEG-4 sử dụng cơng cụ mã hóa phức tạp để đạt yếu tố nén cao MPEG-2 Ngoài việc mã hóa video hiệu hơn, MPEG-4 tiến gần tới ứng dụng đồ họa máy tính Với cấu phức tạp hơn, giải mã MPEG-4 hiệu trỏ thành xử lý việc dựng hình chiều kết cấu bề mặt MPEG-4 hỗ trợ Intellectual Property Management and Protection (IPMP) (Quản lý bảo vệ sở hữu trí tuệ), việc cung cấp sở để sử dụng công nghệ độc quyền để quản lý bảo vệ nội dung quản lý quyền kỹ thuật số Nó hỗ trợ MPEG-J, chương trình giải pháp đầy đủ để tạo ứng dụng tương tác tùy chỉnh đa phương tiện (Ứng dụng Java với môi trường Java API) nhiều tính khác Một số tiêu chuẩn video hiệu cao (mới Video MPEG-2) đáng ý là: • • MPEG-4 Part (Simple and Advanced Simple Profile) MPEG-4 AVC (MPEG-4 Part 10 H.264) MPEG-4 AVC sử dụng HD DVD Đĩa Blu-ray, với VC-1 and MPEG-2 Tìm hiểu kỹ thuật nén MPEG Video Coding I – MPEG–1 MPEG-4 cọn chương trình nén over-the-air Brazil (ISDBTB), dựa truyền hình ky thuật số gốc Nhật Bản (ISDB-T) Ngoài ra, tiêu chuẩn sau ký hiệu tương tự: • MPEG-7 (2002): Giao diện mơ tả nội dung đa phương tiện (ISO/IEC 15938) • MPEG-21 (2001): Khuôn khổ đa phương tiện (MPEG-21) (ISO/IEC 21000) MPEG mô tả tiêu chuẩn multimedia framework and cung cấp cho IPMP Hơn nữa, gần tiêu chuẩn trên, MPEG bát đầu theo tiêu chuẩn quốc tế; tiêu chuẩn nắm giữ nhiều cơng nghệ cho ứng dụng (Ví dụ, MPEG-A bao gồm số công nghệ định dạng đa phương tiện.) • • • • • • • • • • • II MPEG-A (2007): Multimedia application format (MPEG-A) (ISO/IEC 23000) MPEG-B (2006): MPEG systems technologies (ISO/IEC 23001) 5MPEG-C (2006): MPEG video technologies (ISO/IEC 23002) MPEG-D (2007): MPEG audio technologies (ISO/IEC 23003) MPEG-E (2007): Multimedia Middleware (ISO/IEC 23004) (còn gọi M3W) Supplemental media technologies (2008) (ISO/IEC 29116) MPEG-V (2011): Media context and control (ISO/IEC 23005) (còn gọi Information exchange with Virtual Worlds) MPEG-M (2010): MPEG eXtensible Middleware (MXM) (ISO/IEC 23006) MPEG-U (2010): Rich media user interfaces (ISO/IEC 23007) MPEG-H (2013): High Efficiency Coding and Media Delivery in Heterogeneous Environments (ISO/IEC 23008) MPEG-DASH (2012): Information technology – Dynamic adaptive streaming over HTTP (DASH) (ISO/IEC 23009) Tìm hiểu kỹ MPEG Cấu trúc dịng bit Tìm hiểu kỹ thuật nén MPEG Video Coding I – MPEG–1 Cấu trúc dịng MPEG gồm lớp: • Lớp khối (block) : gồm khối 8x8 điểm ảnh tín hiệu chói tín hiệu màu dùng cho phương pháp nén DCT • Lớp macroblock: lớp tổ hợp cấu trúc khối nhóm khối tương ứng với lượng thơng tin chứa đựng kích thước 16x16 điểm ảnh Cấu trúc khối xác định lượng thông tin chứa thay đổi tùy theo cấu trúc mẫu sử dụng Thông tin cấu trúc khối mang dạng vector bù chuyển động • Lớp cắt lát dịng bít (slice): Mảng bao gồm cấu trúc khối kề Kích thước lớn mảng bao gồm tồn ảnh kích thước nhỏ mảng cấu trúc khối Thông tin chứa đựng vị trí mảng tồn ảnh, hệ số cân lượng tử • Lớp ảnh (picture): cho phép giải mã xác định loại ảnh mã hóa Thơng tin đầu dùng để thứ tự truyền khung (để mã hóa xếp ảnh lại theo thứ tự đúng) thông tin đồng bộ, độ phân giải phạm vi vector chuyển động Trong nén MPEG người ta sử dụng loại ảnh sau: o Ảnh I (Intra Pictures): mã hóa độc lập mà khơng cần tham khảo ảnh khác Hiệu nén tín hiệu đạt loại bỏ dư thừa không gian mà yếu tố thời gian tham gia vào q trình Ảnh I dùng cách tuần hoàn để tạo thành điểm tựa cho dịng liệu q trình giải mã o Ảnh P (Predicted Pictures): mã hoá từ ảnh I ảnh P trước để bù chuyển động dùng để tham khảo cho việc tiên đoán ảnh Mỗi khối ảnh ảnh P mã hóa theo kiểu tiên đốn mã hóa cách độc lập Do sử dụng nén không gian thời gian nén hiệu nén ảnh P cao đáng kể so với ảnh I Tìm hiểu kỹ thuật nén MPEG Video Coding I – MPEG–1 o Ảnh B (Bidirectionally Predictive Pictures) sử dụng ảnh I P phía trước phía sau để bù chuyển động cho tỷ lệ nén cao Mỗi khối ảnh B tiên đốn theo chiều ngược, xuôi, hai hướng mã hóa độc lập nhiên để tiên đốn ngược từ ảnh phía sau mã hóa phải ắp xếp lại ảnh Do tạo độ trễ phải xếp lại thông tin, độ trễ lớn hay nhỏ phụ thuộc vào số ảnh B liên tiếp truyền • Lớp nhóm ảnh (GOP): ảnh I, P, B thường xuất theo thứ tự lặp lặp lại cách tuần hồn Vì xuất nhóm ảnh GOP Chất lượng ảnh không phụ thuộc vào tỷ lệ nén khn hình mà cịn phụ thuộc vào độ dài nhóm ảnh GOP Chúng đơn vị mang thông tin độc lập MPEG bắt buộc phải bắt đầu ảnh I Tiếp sau loạt ảnh P B Cấu trúc GOP mô tả tham số: N(số ảnh GOP) M(khoảng cách ảnh P) • Lớp dãy ảnh (sequence): đoạn video bao gồm thơng tin đầu, số nhóm ảnh thơng tin kết đoạn Mỗi lớp hỗ trợ chức định: chức xử lý tín hiệu (DCT bù chuyển động) Hai chức logic (tái đồng bộ, điểm truy xuất ngẫu nhiên) Tìm hiểu kỹ thuật nén MPEG Video Coding I – MPEG–1 Hình 1: Cấu trúc dịng bit MPEG Q trình tạo dịng bít MPEG ghép kênh: kết hợp dịng liệu vào, dòng liệu ra, điều chỉnh đồng quản lý đệm Cú pháp dòng MPEG bao gồm: lớp dịng bit (stream), lớp gói (back) lớp gói tin (backet) Tìm hiểu kỹ thuật nén MPEG Video Coding I – MPEG–1 10 Hình 2: Kiến trúc dịng liệu MPEG Tìm hiểu kỹ thuật nén MPEG Video Coding I – MPEG–1 38 vectơ chuyển động (MV) nửa pixel nửa pel Độ xác MV mịn khả khớp xác nén hiệu Tuy nhiên, có đánh đổi với độ xác cao MV Finer dẫn đến kích thước liệu lớn hơn, số lượng lớn phải lưu trữ khung cho MV, tăng độ phức tạp mã hóa tăng mức độ nội suy macroblock yêu cầu cho mã hóa giải mã giảm lợi nhuận (mức tăng tối thiểu) với MV có độ xác cao Half-pel chọn đánh đổi lý tưởng Do macroblocks lân cận có vectơ chuyển động giống nhau, thơng tin dư thừa nén hiệu cách lưu trữ mã hóa DPCM Chỉ có số lượng chênh lệch (nhỏ hơn) MV cho macroblock cần lưu trữ dịng bit cuối Khung P có vectơ chuyển động macroblock, liên quan đến khung neo trước Khung B, nhiên, sử dụng hai vectơ chuyển động; từ khung neo trước từ khung neo tương lai [49] Các macroblocks phần viền / màu đen mã hóa vào video khơng nằm xác ranh giới macroblock, gây tàn phá với dự đoán chuyển động Thông tin phần đệm / đường viền khối ngăn chặn macroblock khớp với khu vực khác video đó, thơng tin lỗi dự đốn lớn đáng kể phải mã hóa cho số hàng chục macroblocks dọc theo viền hình Mã hóa lượng tử hóa DCT (xem bên dưới) gần khơng hiệu có độ tương phản hình ảnh lớn / sắc nét khối Một vấn đề chí nghiêm trọng tồn với macroblocks chứa nhiễu cạnh đáng kể, ngẫu nhiên , hình ảnh chuyển sang màu đen (điển hình) Tất vấn đề áp dụng cho tiếng ồn cạnh Ngồi ra, tính ngẫu nhiên thêm vào đơn giản nén đáng kể Tất hiệu ứng làm giảm chất lượng (hoặc tăng tốc độ bit) video cách đáng kể DCT Mỗi khối 8x8 mã hóa cách áp dụng phía trước biến đổi cosin rời rạc (FDCT) sau q trình lượng tử hóa Q trình FDCT (tự nó) mặt lý thuyết khơng mát đảo ngược cách áp dụng DCT nghịch đảo ( IDCT ) để tái tạo giá trị ban đầu (trong trường hợp khơng có lỗi lượng tử hóa làm trịn nào) Trong thực tế, có số lỗi làm trịn (đơi lớn) giới thiệu cách lượng tử hóa mã hóa (như mơ tả phần tiếp theo) lỗi xấp xỉ IDCT giải mã Độ xác tối thiểu cho phép xấp Tìm hiểu kỹ thuật nén MPEG Video Coding I – MPEG–1 39 xỉ IDCT giải mã xác định theo ISO / IEC 23002-1 (Trước năm 2006, định IEEE 1180 -1990.) Quá trình FDCT chuyển đổi khối 8x8 giá trị pixel không nén (giá trị độ sáng độ lệch màu) thành mảng lập mục giá trị hệ số tần số 8x8 Một số hệ số DC (cao phương sai) , đại diện cho giá trị trung bình tồn khối 8x8 63 hệ số khác hệ số AC nhỏ mặt thống kê , giá trị dương âm, giá trị biểu thị độ lệch hình sin so với giá trị khối phẳng biểu thị hệ số DC Một ví dụ khối FDCT 8x8 mã hóa: Do giá trị hệ số DC tương quan thống kê từ khối sang khối khác, nên nén mã hóa DPCM Chỉ có lượng chênh lệch (nhỏ hơn) giá trị DC giá trị hệ số DC khối bên trái cần biểu diễn dịng bit cuối Ngồi ra, chuyển đổi tần số thực cách áp dụng DCT cung cấp chức giải mã thống kê để tập trung hiệu tín hiệu vào giá trị biên độ cao trước áp dụng lượng tử hóa (xem bên dưới) Lượng tử hóa Lượng tử hóa (của liệu số) trình giảm độ xác tín hiệu, cách chia thành số kích thước bước lớn (nghĩa tìm bội số gần loại bỏ phần dư / mơ đun) Bộ lượng tử hóa mức khung số từ đến 31 (mặc dù mã hóa thường bỏ qua / vơ hiệu hóa số giá trị cực trị) để xác định lượng thơng tin bị xóa khỏi khung định Bộ lượng tử hóa mức khung hình Tìm hiểu kỹ thuật nén MPEG Video Coding I – MPEG–1 40 mã hóa lựa chọn động để trì tốc độ bit người dùng định định (ít phổ biến hơn) người dùng định trực tiếp Trái với niềm tin phổ biến, lượng tử hóa mức khung cố định (do người dùng đặt) khơng mang lại mức chất lượng khơng đổi Thay vào đó, số liệu tùy ý cung cấp mức độ khác chất lượng, tùy thuộc vào nội dung khung Cho hai tệp có kích thước giống hệt nhau, tệp mã hóa tốc độ bit trung bình trơng tốt tệp mã hóa với lượng tử hóa cố định (bitrate biến) Tuy nhiên, mã hóa lượng tử khơng đổi sử dụng để xác định xác tốc độ bit tối thiểu tối đa để mã hóa video định Một ma trận lượng tử chuỗi 64-số (0-255) kể encoder cách tương đối quan trọng hay không quan trọng mẩu thông tin thị giác Mỗi số ma trận tương ứng với thành phần tần số định hình ảnh video Một ví dụ ma trận lượng tử hóa: Lượng tử hóa thực cách lấy số 64 giá trị tần số khối DCT, chia chúng cho lượng tử hóa mức khung, sau chia chúng cho giá trị tương ứng chúng ma trận lượng tử hóa Cuối cùng, kết làm trịn xuống Điều làm giảm đáng kể loại bỏ hoàn tồn thơng tin số thành phần tần số hình ảnh Thơng thường, thơng tin tần số cao quan trọng mặt thị giác tần số cao lượng tử hóa mạnh nhiều (giảm mạnh) MPEG-1 thực sử dụng hai ma trận lượng tử hóa riêng biệt, cho khối bên (khối I) cho khối liên khối (khối P khối B) để việc lượng tử hóa loại khối khác thực độc lập đó, hiệu Tìm hiểu kỹ thuật nén MPEG Video Coding I – MPEG–1 41 Q trình lượng tử hóa thường làm giảm số lượng đáng kể hệ số AC xuống 0, (được gọi liệu thưa thớt ) sau nén hiệu mã hóa entropy (nén khơng liệu) bước Một ví dụ khối DCT lượng tử hóa: Lượng tử hóa giúp loại bỏ lượng lớn liệu bước xử lý tổn thất mã hóa video MPEG-1 Đây nguồn chủ yếu hầu hết định dạng MPEG-1 video đồ tạo tác nén , blockiness , màu dải , tiếng ồn , rung , màu , et al Điều xảy video mã hóa với tốc độ bit khơng đủ mã hóa buộc phải sử dụng lượng tử hóa mức khung cao (lượng tử hóa mạnh ) thơng qua phần lớn video Mã hóa Entropy Một số bước trình mã hóa video MPEG-1 lossless, có nghĩa chúng đảo ngược giải mã, để tạo giá trị (bản gốc) giống hệt Vì bước nén liệu không liệu không thêm nhiễu vào thay đổi nội dung (không giống lượng tử hóa), đơi gọi mã hóa ồn Vì nén khơng mát nhằm mục đích loại bỏ nhiều dư thừa tốt, nên gọi mã hóa entropy lĩnh vực lý thuyết thông tin Các hệ số khối DCT lượng tử hóa có xu hướng khơng phía bên phải Có thể đạt mức nén tối đa cách quét zig-zag Tìm hiểu kỹ thuật nén MPEG Video Coding I – MPEG–1 42 khối DCT bên trái sử dụng kỹ thuật mã hóa Độ dài Run Các hệ số DC vectơ chuyển động mã hóa DPCM Mã hóa chiều dài chạy (RLE) phương pháp nén lặp lại đơn giản Một chuỗi ký tự liên tiếp, bao lâu, thay vài byte, lưu ý giá trị lặp lại lần Ví dụ: định nói "năm số", bạn biết họ có nghĩa số: 99999 RLE đặc biệt hiệu sau lượng tử hóa, số lượng đáng kể hệ số AC (được gọi liệu thưa ) biểu diễn vài byte Điều lưu trữ bảng Huffman chiều đặc biệt mã hóa độ dài chạy ký tự kết thúc chạy Huffman Coding phương pháp mã hóa entropy phổ biến sử dụng video MPEG-1 để giảm kích thước liệu Dữ liệu phân tích để tìm chuỗi lặp lại thường xuyên Các chuỗi sau đưa vào bảng đặc biệt, với liệu lặp lại thường xuyên gán mã ngắn Điều giữ cho liệu nhỏ tốt với hình thức nén Khi bảng xây dựng, chuỗi liệu thay mã (nhỏ nhiều) chúng, tham chiếu mục nhập thích hợp bảng Bộ giải mã đơn giản đảo ngược trình để tạo liệu gốc Đây bước cuối quy trình mã hóa video, đó, kết mã hóa Huffman gọi "dịng bit" video MPEG-1 Cấu hình GOP cho ứng dụng cụ thể I-frames lưu trữ thông tin khung hồn chỉnh khung phù hợp để truy cập ngẫu nhiên Khung P cung cấp nén vectơ chuyển động so với khung trước (I P) Khung B cung cấp khả nén tối đa yêu cầu khung trước khung để tính tốn Do đó, việc xử lý khung B địi hỏi nhiều đệm phía giải mã Một cấu hình Nhóm Hình ảnh(GOP) nên lựa chọn dựa yếu tố Các chuỗi I-frame cho phép nén nhất, hữu ích cho truy cập ngẫu nhiên, FF / FR khả chỉnh sửa Trình tự khung I P cho phép nén vừa phải thêm mức độ truy cập ngẫu nhiên định, chức FF / FR Các chuỗi I-, P- B cho độ nén cao làm tăng đáng kể độ trễ mã hóa / giải mã Do đó, cấu không phù hợp cho ứng dụng điện thoại video hội nghị video Tốc độ liệu điển hình khung hình I bit pixel khung hình P 0,1 bit pixel khung B, 0,015 bit pixel Tìm hiểu kỹ thuật nén MPEG Video Coding I – MPEG–1 43 Nén âm theo MPEG-1 Âm MPEG-1 sử dụng âm tâm lý để giảm đáng kể tốc độ liệu theo yêu cầu luồng âm Nó làm giảm loại bỏ hồn tồn số phần định âm mà suy tai người nghe , chúng tần số mà tai có độ nhạy hạn chế bị che âm khác (thường to hơn) Mã hóa kênh: - Đơn điệu Âm chung - mã hóa cường độ Âm chung - M / S mã hóa cho Lớp Âm Dual (hai kênh đơn sắc không tương thích ) Tốc độ lấy mẫu : 32000, 44100 48000 Hz Tốc độ bit cho lớp I: 32, 64, 96, 128, 160, 192, 224, 256, 288, 320, 352, 384, 416 448 kbit / s Tốc độ bit cho lớp II: 32, 48, 56, 64, 80, 96, 112, 128, 160, 192, 224, 256, 320 384 kbit / s Tốc độ bit cho lớp III: 32, 40, 48, 56, 64, 80, 96, 112, 128, 160, 192, 224, 256 320 kbit / s Âm MPEG-1 chia thành lớp Mỗi lớp cao phức tạp mặt tính tốn thường hiệu tốc độ bit thấp lớp trước Các lớp tương thích ngược với cơng nghệ tái sử dụng lớp cao thực lớp thấp Bộ giải mã Lớp II "Đầy đủ" phát âm Lớp I, âm Lớp III, tất trình phát cấp cao "đầy đủ" Lớp I MPEG-1 Layer I khơng khác phiên đơn giản Layer II [13] Lớp I sử dụng kích thước khung 384 mẫu nhỏ cho độ trễ thấp độ phân giải tốt Đây lợi cho ứng dụng hội nghị truyền hình, chỉnh sửa phịng thu, v.v Nó có độ phức tạp thấp Lớp II để tạo điều kiện cho mã hóa thời gian thực phần cứng có sẵn vào khoảng năm 1990 Lớp I thấy việc áp dụng hạn chế thời gian đáng ý sử dụng Digital Compact Cassette khơng cịn tồn Philips với tốc độ bit 384 kbit / s Với cải tiến hiệu suất đáng kể xử lý kỹ thuật số kể từ giới thiệu, Lớp I nhanh chóng trở nên khơng cần thiết lỗi thời Tìm hiểu kỹ thuật nén MPEG Video Coding I – MPEG–1 44 Các tệp âm lớp I thường sử dụng phần mở rộng mp1 m1a Lớp II MPEG-1 Layer II ( MP2 xôngoften gọi không xác MUSICAM ) [51] định dạng âm bị thiết kế để cung cấp chất lượng cao với tốc độ khoảng 192 kbit / s cho âm Giải mã âm MP2 đơn giản mặt tính tốn , liên quan đến MP3, AAC , v.v Lịch sử / Âm nhạc MPEG-1 Layer II lấy từ giải mã âm MUSICAM ( Kiểu mặt nạ điều chỉnh mã hóa đa chuỗi điều chỉnh theo mẫu phổ biến , phát triển Trung tâm cộng đồng d'tudes de télévision et téléc truyền thông (CCett), Philips , Acadut für Rundfunktechnik (IRT) phần sáng kiến nghiên cứu phát triển liên phủ châu Âu EUREKA 147 để phát triển phát truyền hình kỹ thuật số Hầu hết tính Âm MPEG-1 kế thừa trực tiếp từ MUSICAM, bao gồm ngân hàng lọc, xử lý miền thời gian, kích thước khung âm thanh, v.v Tuy nhiên, cải tiến thực thuật toán MUSICAM thực tế không sử dụng MPEG-1 cuối Chuẩn âm lớp II Việc sử dụng rộng rãi thuật ngữ MUSICAM để Lớp II hồn tồn khơng xác khơng khuyến khích lý kỹ thuật pháp lý Chi tiết kỹ thuật Lớp II / MP2 mã hóa miền thời gian Nó sử dụng ngân hàng lọc đa pha 32 độ trễ thấp để ánh xạ tần số thời gian; có phạm vi chồng lấp (nghĩa đa hình) để ngăn cưa Mơ hình tâm lý học dựa nguyên tắc mặt nạ thính giác , hiệu ứng che lấp đồng thời ngưỡng nghe tuyệt đối (ATH) Kích thước khung Lớp II cố định mức 1152-mẫu (hệ số) Miền thời gian đề cập đến cách phân tích lượng tử hóa thực mẫu / khối ngắn, rời rạc dạng sóng âm Điều mang lại độ trễ thấp số lượng nhỏ mẫu phân tích trước mã hóa, trái ngược với mã hóa miền tần số (như MP3), phải phân tích nhiều lần mẫu trước định cách chuyển đổi phát âm mã hóa Điều cung cấp hiệu suất cao xung phức tạp, ngẫu nhiên thời (như nhạc cụ gõ tiếng vỗ tay), giúp tránh vật tiếng vang trước Tìm hiểu kỹ thuật nén MPEG Video Coding I – MPEG–1 45 Ngân hàng lọc 32 băng tần trả 32 hệ số biên độ , cho dải tần / phân đoạn có kích thước âm thanh, rộng khoảng 700 Hz (tùy thuộc vào tần số lấy mẫu âm thanh) Sau đó, mã hóa sử dụng mơ hình âm học để xác định băng chứa thông tin âm quan trọng đó, lượng tử hóa khơng nghe thấy được, ý Mơ hình tâm lý học áp dụng cách sử dụng Biến đổi Fourier nhanh 1024 điểm (FFT) Trong số 1152 mẫu khung, 64 mẫu đầu cuối dải tần số bị bỏ qua cho phân tích Họ có lẽ khơng đủ quan trọng để thay đổi kết Mơ hình tâm lý học sử dụng mơ hình mặt nạ xác định theo kinh nghiệm để xác định dải đóng góp nhiều vào ngưỡng mặt nạ mức độ nhiễu lượng tử mà loại chứa mà không nhận biết Bất kỳ âm ngưỡng tuyệt đối thính giác (ATH) bị loại bỏ hồn tồn Các bit có sẵn sau gán cho băng tương ứng Thơng thường, băng quan trọng chúng chứa âm nhỏ (hệ số nhỏ hơn) so với băng lân cận (tức tần số tương tự) với âm to (hệ số lớn hơn) Ngồi ra, thành phần "tiếng ồn" thường có tác dụng che khuất đáng kể thành phần "âm sắc" Các băng quan trọng giảm độ xác cách lượng tử hóa Điều liên quan đến việc nén dải tần số (biên độ hệ số), tức tăng mức nhiễu Sau đó, tính tốn hệ số khuếch đại, để giải mã sử dụng để mở rộng lại băng đến dải tần số thích hợp Lớp II tùy chọn sử dụng mã hóa âm cường độ cao , dạng âm chung Điều có nghĩa tần số kHz hai kênh kết hợp / trộn xuống thành kênh (đơn âm), thông tin "kênh bên" cường độ tương đối (âm lượng, biên độ) kênh bảo tồn mã hóa vào dịng bit riêng biệt Khi phát lại, kênh đơn phát qua loa trái phải, với thông tin cường độ áp dụng cho kênh để tạo ảo giác cho âm Thủ thuật tri giác gọi không liên quan đến âm Điều cho phép giảm thêm tốc độ bit âm mà khơng nhiều độ trung thực nhận thấy, thường không sử dụng với tốc độ bit cao khơng cung cấp âm chất lượng cao (trong suốt) Tìm hiểu kỹ thuật nén MPEG Video Coding I – MPEG–1 46 Chất lượng Các chuyên gia kiểm tra âm chủ quan, điều kiện quan trọng triển khai, cho thấy MP2 cung cấp khả nén âm suốt mức 256 kbit / giây cho âm CD 16 bit 44,1 kHz cách sử dụng triển khai tham chiếu sớm (các mã hóa gần thực tốt nữa) Tỷ lệ nén 1: cho âm CD đặc biệt ấn tượng gần với giới hạn ước tính entropy nhận thức , 1: Đạt độ nén cao nhiều đơn giản không loại bỏ số thơng tin cảm nhận MP2 tiêu chuẩn mã hóa âm bị ưa chuộng hiệu suất mã hóa âm đặc biệt cao vật liệu âm quan trọng castanet, dàn nhạc giao hưởng, giọng nam nữ transitor lượng cao phức tạp đặc biệt âm gõ vỗ tay Thử nghiệm gần MPEG Multichannel (dựa MP2), bị xâm phạm chế độ ma trận (vì khả tương thích ngược) tốc độ thấp chút so với codec âm gần nhiều, chẳng hạn Dolby Digital (AC-3) Mã hóa âm nâng cao(AAC) (chủ yếu nằm phạm vi lỗi lỗi thực vượt trội số trường hợp, chẳng hạn tiếng vỗ tay khán giả) Đây lý khiến âm MP2 tiếp tục sử dụng rộng rãi Tuy nhiên, thử nghiệm xác minh âm MPEG-2 AAC đạt kết luận khác biệt, cho thấy AAC cung cấp hiệu suất vượt trội cho MP2 với tốc độ nửa Lý cho chênh lệch với kiểm tra trước sau không rõ ràng, thật kỳ lạ, mẫu tiếng vỗ tay đáng ý khơng có kiểm tra sau Các tệp âm lớp II thường sử dụng phần mở rộng mp2 m2a Lớp III / MP3 Bài chi tiết: Lớp âm MPEG-1 III MPEG-1 Layer III ( MP3 ) định dạng âm bị thiết kế để cung cấp chất lượng chấp nhận khoảng 64 kbit / s cho âm đơn âm qua liên kết ISDN kênh đơn ( BRI ) 128 kbit / s cho âm Tìm hiểu kỹ thuật nén MPEG Video Coding I – MPEG–1 47 III Ứng dụng nén MPEG Video Coding I – MPEG–1 Ứng dụng thực tế MPEG – MPEG-1 ứng dụng thiết kế CD/VCD chạy âm thanh, trình chiếu video MPEG-1 thường sử dụng tiêu chuẩn cho đĩa quang VCD Trong Thông tư số 01/2011/TT-BTTTT ngày 04/01/2011 Bộ trưởng Bộ Thông tin Truyền thông Công bố Danh mục tiêu chuẩn kỹ thuật ứng dụng công nghệ thông tin quan nhà nước quy định Khuyến nghị áp dụng tiêu chuẩn MPEG-1 xếp vào nhóm Tiêu chuẩn truy cập thông tin thường sử dụng độ phân giải 352 x 240, 352 x 288 320 x 240 Độ phân giải thấp kết hợp với tỉ lệ bitrate thấp 1,5 Mbit/s tạo dòng liệu bít thấp với thơng số hạn chế Đây thông số kỹ thuật tối thiểu mà mã hóa/giải mã xử lý được, đảm bảo cân chất lượng phim ảnh hiệu sử dụng, cho phép triển khai hệ thống phần cứng có chi phí khơng cao • Trước có ứng dụng truyền hình, nhiên năm gần chuẩn mpeg1 khơng cịn sử dụng truyền hình Tìm hiểu kỹ thuật nén MPEG Video Coding I – MPEG–1 48 • MP3: MPEG-I phần Âm Lớp III Thường gọi MP3, có định dạng tệp tin là(.mp3).là định dạng âm phổ biến ngành cơng nghiệp âm nhạc, giải trí Internet kích thước nhỏ gọn chất lượng âm tệp tin (.mp3) Định dạng âm phổ biến website nghe nhạc Tìm hiểu kỹ thuật nén MPEG Video Coding I – MPEG–1 49 • Trên thiết bị nghe nhạc cầm tay • Ứng dụng phát sóng truyền Tìm hiểu kỹ thuật nén MPEG Video Coding I – MPEG–1 50 Khảo sát nén phần mềm Lựa chọn phần mềm: Blaze Media Pro – theo đánh giá số tạp trí phần mềm nén video tốt cho hệ điều hành windows • Khảo sát nén audio Kết nén sau nén file âm có dung lượng 11mb phần mềm Tìm hiểu kỹ thuật nén MPEG Video Coding I – MPEG–1 51 • Khảo sát nén video Dữ liệu âm video thử nghiệm download http://mobile.vtc.vn/uploads/games/datatest.zip Đánh giá MPEG-1 tiêu chuẩn nén suy hao cho âm thanh, phim ảnh MPEG-1 thiết kế để nén âm thanh, phim ảnh xuống 1.5 Mbit/s (tỉ lệ nén tương ứng 26:1 6:1) tủy số nén phương pháp nén cao, nhiên ảnh hưởng trực tiếp đến chất lượng hình ảnh âm sử dụng phương pháp mà, MPEG -1 tiền đề để phát triển chuẩn nén tối ưu MPEG -2, , Hiện ứng dụng video MPEG -1 Tìm hiểu kỹ thuật nén MPEG Video Coding I – MPEG–1 52 sử dụng nhiên nhược điểm chất lượng hình ảnh nên ựng dụng video dần áp dụng chuẩn khác Điểm trội chuẩn nén áp dụng mạnh mẽ định dạng âm (.mp3) định dạng thống lĩnh thị trường nghe nhạc trực tuyến phổ biến Tìm hiểu kỹ thuật nén MPEG Video Coding I – MPEG–1 ... bit (stream), lớp g? ?i (back) lớp g? ?i tin (backet) Tìm hiểu kỹ thuật nén MPEG Video Coding I – MPEG? ? ?1 10 Hình 2: Kiến trúc dịng liệu MPEG Tìm hiểu kỹ thuật nén MPEG Video Coding I – MPEG? ? ?1 11. .. dụ: Tìm hiểu kỹ thuật nén MPEG Video Coding I – MPEG? ? ?1 31 Sơ đồ nén MPEG- 1 Tìm hiểu kỹ thuật nén MPEG Video Coding I – MPEG? ? ?1 32 Q trình nén video chuẩn MPEG- 1 • Ảnh đầu vào đưa vào trừ đánh giá... đ? ?i DCT ngược Ảnh lưu vào nhớ để sử dụng chuẩn gi? ?i mã ảnh Tìm hiểu kỹ thuật nén MPEG Video Coding I – MPEG? ? ?1 14 Phần 2: Kỹ thuật nén MPEG Video Coding I – MPEG? ? ?1 I Chuẩn nén MPEG - 1 Gi? ?i thiệu

Ngày đăng: 10/10/2022, 07:27

TRÍCH ĐOẠN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w