báo cáo đồ án môn kỹ thuật audio video đề tài tổng quan về chuẩn nén mpeg

Hiểu rõ về cơ chếhoạt động và các tiêu chuẩn của MPEG sẽ giúp tối ưu hóa quá trình truyền tải video vàâm thanh, đồng thời tạo ra các sản phẩm và dịch vụ đa phương tiện hiệu quả hơn.Công

Trang 1

TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN

KHOA ĐIỆN TỬ VIỄN THÔNG

🙞🙠🕮🙢🙜

-BÁO CÁO ĐỒ ÁN

MÔN: KỸ THUẬT AUDIO – VIDEO

ĐỀ TÀI :

TỔNG QUAN VỀ CHUẨN NÉN MPEG

Giảng viên hướng dẫn : Ths Bùi An Đông

Sinh viên thực hiện : Nhóm

Thành phố Hồ Chí Minh, tháng 04 năm 2024

Trang 2

STT HỌ VÀ TÊN MSSV CÔNG VIỆC ĐÁNH

GIÁ (1-5)

1 Nguyễn Tuấn Kiệt 20200240 Tìm tài liệu, trình bày

Trang 3

MỤC LỤC

CHƯƠNG I: MỞ ĐẦU 1

1 Lý do chọn đề tài: 1

2 Giới thiệu khái quát khái niệm và quá trình phát triển: 2

CHƯƠNG II: KHÁI QUÁT VỀ CHUẨN NÉN MPEG 3

1 Khái quát về nén MPEG 3

2 Cấu trúc dòng bit MPEG video 3

3 Các loại ảnh trong chuẩn MPEG 4

4 Nguyên lý nén MPEG 8

5 Nguyên lý giải nén MPEG 8

CHƯƠNG III: CÁC CHUẨN NÉN MPEG 12

1 Chuẩn nén MPEG-1 12

CHƯƠNG VI: KẾT LUẬN 22

Tài liệu tham khảo: 22

Trang 4

CHƯƠNG I: MỞ ĐẦU

1 Lý do chọn đề tài:

Chuẩn nén MPEG (Moving Picture Experts Group) không chỉ đóng vai trò quantrọng trong việc tiết kiệm băng thông mạng mà còn là yếu tố then chốt trong việc cảithiện trải nghiệm người dùng khi xem video trực tuyến trên Internet Hiểu rõ về cơ chếhoạt động và các tiêu chuẩn của MPEG sẽ giúp tối ưu hóa quá trình truyền tải video và

âm thanh, đồng thời tạo ra các sản phẩm và dịch vụ đa phương tiện hiệu quả hơn.Công nghệ nén video MPEG đã được tích hợp trong một loạt các ứng dụng nhưstreaming video, video conferencing, truyền hình số và nhiều lĩnh vực khác Việcnghiên cứu về chuẩn nén MPEG không chỉ mang lại kiến thức chuyên sâu mà còn giúphiểu rõ về các ứng dụng thực tiễn và tiềm năng phát triển của công nghệ này trongtương lai

Với sự phát triển không ngừng của công nghệ và nhu cầu người dùng ngày càngtăng cao về chất lượng video, việc hiểu rõ về các tiêu chuẩn nén video như MPEG làcực kỳ quan trọng Việc nghiên cứu này không chỉ giúp nâng cao kỹ năng và hiểu biết

cá nhân mà còn đóng góp vào sự phát triển toàn diện của ngành công nghiệp truyềnthông đa phương tiện

2 Giới thiệu khái quát khái niệm và quá trình phát triển:

MPEG là một tổ chức chuyên về việc phát triển các chuẩn nén video và âmthanh Các tiêu chuẩn của MPEG bao gồm MPEG-1, MPEG-2, MPEG-4, MPEG-7,MPEG-21 và MPEG-H, mỗi chuẩn đều có mục tiêu và ứng dụng cụ thể trong lưu trữ

và truyền tải nội dung đa phương tiện

Quá trình phát triển các tiêu chuẩn MPEG bắt đầu từ những năm 1980 với mụctiêu tạo ra một chuẩn nén video đồng nhất cho các dịch vụ truyền hình và lưu trữvideo Các tiêu chuẩn sau này tiếp tục phát triển để đáp ứng nhu cầu ngày càng tăngcao về chất lượng video và hiệu suất nén Quá trình này thường bao gồm nghiên cứu,thử nghiệm và thảo luận giữa các chuyên gia từ nhiều quốc gia và tổ chức khác nhau.Hiểu rõ về chuẩn nén MPEG không chỉ giúp tối ưu hóa việc sử dụng băng thông

và lưu trữ mà còn giúp cải thiện trải nghiệm người dùng và giảm chi phí cho các nhàcung cấp dịch vụ Nghiên cứu về chuẩn nén MPEG cũng đóng vai trò quan trọng trong

Trang 5

CHƯƠNG II: KHÁI QUÁT VỀ CHUẨN NÉN MPEG

1 Khái quát về nén MPEG:

- MPEG (Moving Picture Expert Group) là nhóm chuyên gia về hình ảnh,

được thành lập từ tháng 2 năm 1988 với mục tiêu là phát triển các tiêuchuẩn nén video và âm thanh để lưu trữ và truyền tải hiệu quả hơn

- Chuẩn nén MPEG là một tập hợp các kỹ thuật được sử dụng để nén dữ liệu

video và âm thanh, được sử dụng rộng rãi trong nhiều ứng dụng khác nhau,bao gồm:

 Lưu trữ video trên đĩa CD, DVD, Blu-ray: MPEG giúp giảm kíchthước tệp video, giúp dễ dàng lưu trữ và chia sẻ hơn

 Truyền tải video: MPEG giúp giảm lượng băng thông cần thiết đểtruyền tải video, giúp cho việc phát trực tuyến video, truyền hình kỹthuật số và video call trở nên khả thi hơn

 Chỉnh sửa video: MPEG giúp giảm thời gian cần thiết để chỉnh sửavideo

- Hiện nay, có nhiều tiêu chuẩn MPEG khác nhau, mỗi tiêu chuẩn được thiết

kế cho các mục đích sử dụng cụ thể Một số tiêu chuẩn MPEG phổ biến nhấtbao gồm: MPEG-1, MPEG-2, MPEG-4, MPEG-7, MPEG-H, MPEG-5(EVC)

- Việc kết hợp MPEG-4 và MPEG-7 sẽ tạo ra các giải pháp lý tưởng cho các

dịch vụ Streaming Media, các hệ thống lưu trữ và sản xuất Streaming Mediatrong thời gian tới

2 Cấu trúc dòng bit MPEG video:

Trang 6

Hình 1: Cấu trúc dòng bit MPEG video

Trong đó:

a) Lớp Chuỗi (Sequence Layer):

o Đây là đơn vị nội dung chứa thông tin về chuỗi bit video.

o Video Params: thông tin chiều cao, bề rộng, tỷ lệ khuôn hình các phần tử

ảnh

o Bitstream Params: Thông tin về tốc độ bit và các thông số khác.

b) Lớp Group of Pictures (GOP Layer):

o Lớp GOP là một nhóm các hình ảnh liên tiếp được nén cùng nhau GOP

thường bao gồm một hình ảnh I (Intra-frame) và một số hình ảnh P (Predictive-frame) hoặc B (Bidirectional-frame)

o Time code: mã định thời, xác định giờ, phút, giây, ảnh

o GOP Params: miêu tả cấu trúc GOP.

c) Lớp Pict (Picture Layer): chứa thông tin cho một hình ảnh riêng lẻ, bao gồm:

o Dữ liệu hình ảnh được nén

o Type: Cho phép bộ giải mã xác định ảnh đựơc mã hoá là ảnh I, P hay B

o Buffer Params: thông tin về Buffer (chỉ thứ tự truyền khung để bộ giải

mã có thể sắp xếp các loại ảnh theo một thứ tự đúng)

o Encode Params: chứa thông tin về đồng bộ, độ phân giải và phạm vi của

vector chuyển động

d) Lớp Slice (Slice Layer):

o Lớp Slice là một phần nhỏ của hình ảnh được mã hóa riêng biệt

o Việc chia khung hình ảnh thành các slice giúp cho việc truyền tải và giải

mã video hiệu quả hơn

e) Lớp Macro Block (MB Layer):

Trang 7

o Mỗi macroblock bao gồm một vùng nhỏ của hình ảnh (8x8 pixel) được

mã hóa bằng cách sử dụng biến đổi Cosine rời rạc (DCT) và mã hóa entropy

o Quản lý việc di chuyển của các khối hình ảnh.

o Addr Iner: Số lượng MB được bỏ qua

o Type: Loại vector chuyển động dung cho Macroblock.

o Qscale: Bảng lượng tử dùng cho Macroblock

o CBP (Coded Block Pattern): chỉ rõ Block nào được mã hoá

f) Lớp Khối (Block Layer):

o Đơn vị chuyển đổi DCT (Discrete Cosine Transform).

o Thực hiện việc biến đổi từ miền không gian sang miền tần số để nén dữ

liệu video

 Như vậy, cấu trúc dòng bit MPEG video bao gồm các thành phần này, giúp tổ chức

và lưu trữ video, âm thanh và các thông tin liên quan khác một cách hiệu quả

3. Các loại ảnh trong chuẩn MPEG:

Trong nén MPEG người ta sử dụng 3 loại ảnh sau:

o Được sử dụng làm điểm tham chiếu cho các ảnh tiếp theo trong video.

o Thường được sử dụng ở đầu video hoặc sau các cảnh quay thay đổi lớn.

 Ảnh P (Predicted Pictures):

o Được mã hóa dựa trên thông tin từ các ảnh I hoặc ảnh P trước đó.

o Sử dụng để dự đoán sự thay đổi giữa các khung hình liên tiếp

o Chỉ lưu trữ thông tin thay đổi so với ảnh tham chiếu, do đó có tỷ lệ nén

cao hơn ảnh I

Trang 8

o Có thể bị ảnh hưởng bởi lỗi trong ảnh tham chiếu, dẫn đến nhiễu trong

video

o Thường được sử dụng để nén các cảnh quay có chuyển động nhẹ.

 Ảnh B (Bidirectionally Predicted Pictures):

o Được mã hóa dựa trên thông tin từ các ảnh I, ảnh P và ảnh B trước đó.

o Có tỷ lệ nén cao nhất trong ba loại ảnh.

o Có thể bị ảnh hưởng bởi lỗi trong cả hai ảnh tham chiếu, dẫn đến nhiễu

o Số lượng ảnh I, P và B trong video được điều chỉnh tùy thuộc vào nội dung

video và yêu cầu về chất lượng

Ví dụ, video có nhiều cảnh quay tĩnh có thể sử dụng nhiều ảnh I hơn, trong khi video

có nhiều cảnh quay chuyển động nhanh có thể sử dụng nhiều ảnh P và B hơn

4. Nguyên lý nén MPEG:

Trang 9

Hình 3: Nén MPEG

- Cơ sở của công nghệ nén video MPEG là sự kết hợp giữa nén trong ảnh

(Intra-Frame Compression) và công nghệ nén liên ảnh (Inter-FrameCompression)

 Nén trong ảnh (Intra-Frame Compression): Là loại nén nhằm

giảm bớt thông tin dư thừa trong miền không gian Nén trong ảnh

sử dụng cả hai quá trình có tổn hao và không có tổn hao để giảmbớt dữ liệu trong ảnh Quá trình này không sử dụng thông tin củacác ảnh trước và sau ảnh đang xét

 Nén liên ảnh (Intra-Frame Compression):Trong tín hiệu video

có chứa thông tin dư thừa trong miền thời gian Nghĩa là với mộtchuỗi liên tục các ảnh, lượng thông tin chứa đựng trong mỗi ảnhthay đổi rất ít từ ảnh này sang ảnh khác Tính toán sự dịch chuyển

vị trí của nội dung ảnh là một phần rất quan trọng trong kỹ thuậtnén liên ảnh Trong thuật nén MPEG, quá trình xác định Vectorchuyển động được thực hiện bằng cách chia hình ảnh thành cácMacro-Block, mỗi Macro-Block có 16 x 16 phần tử ảnh (tươngđương với 4 Block, mỗi Block có 8 x 8 phần tử ảnh) Để xác địnhchiều chuyển động, người ta tìm kiếm vị trí của Macro-Block

Trang 10

trong ảnh tiếp theo, kết quả của sự tìm kiếm sẽ cho ta Vectorchuyển động của Macro-Block

- Nguyên lý nén MPEG:

1 Phân chia video thành khung hình:

 Video được chia thành các khung hình riêng biệt, mỗi khung hình là một ảnhtĩnh đại diện cho một khoảng thời gian ngắn trong video

 Kích thước khung hình và tốc độ khung hình (số khung hình mỗi giây) xác định

độ phân giải và độ mượt mà của video

2 Xác định loại khung hình:

 MPEG sử dụng ba loại ảnh chính: I (Intra-frame), P (Predicted frame) và B predictive frame) để tối ưu hóa hiệu suất nén

(Bi- Ảnh I: Được mã hóa độc lập, không dựa trên bất kỳ ảnh nào khác trong video.

 Ảnh P: Được dự đoán từ ảnh I trước đó, sử dụng kỹ thuật bù chuyển động.

 Ảnh B: Được dự đoán từ cả ảnh I và P trước và sau.

3 Nén trong ảnh (Intra-frame compression):

 Áp dụng cho từng khung hình I, không phụ thuộc vào các khung hình khác

 Mục tiêu là nén hiệu quả dữ liệu hình ảnh trong mỗi khung hình I

Bước 1: Biến đổi:

 Biến đổi dữ liệu hình ảnh từ miền không gian sang miền tần số bằng DCT(Discrete Cosine Transform)

 DCT chia nhỏ hình ảnh thành các khối nhỏ (thường là 8x8 pixel) và áp dụngphép biến đổi toán học cho mỗi khối

 Phép biến đổi DCT tập trung năng lượng hình ảnh vào các thành phần tần sốthấp, giúp loại bỏ dễ dàng hơn các thành phần tần số cao không quan trọng

Bước 2: Lượng tử hóa:

 Giảm độ chính xác của các giá trị biến đổi bằng cách chia chúng thành các bướcnhỏ hơn

 Mức độ lượng tử hóa càng cao, độ chính xác càng thấp và kích thước tệp càngnhỏ

 Lượng tử hóa loại bỏ thông tin chi tiết ít quan trọng, dẫn đến giảm chất lượngvideo nhưng tiết kiệm dung lượng lưu trữ

Bước 3: Mã hóa entropy:

Trang 11

 Mã hóa các giá trị lượng tử hóa bằng mã Huffman hoặc mã arithmetic.

 Các mã này gán các bit ngắn hơn cho các giá trị xuất hiện thường xuyên hơn vàcác bit dài hơn cho các giá trị xuất hiện ít thường xuyên hơn

 Mã hóa entropy giúp giảm thêm kích thước tệp

4 Nén liên ảnh (Inter-frame compression):

 Áp dụng cho ảnh P và B, khai thác sự tương đồng giữa các khung hình liên tiếp

để giảm kích thước tệp

 Mục tiêu là dự đoán nội dung của một khung hình dựa trên các khung hìnhtrước đó, chỉ lưu trữ thông tin thay đổi

Bước 1: Dự đoán chuyển động:

 Xác định các vùng di chuyển trong khung hình P hoặc B so với khung hìnhtham chiếu (thường là khung hình I hoặc P gần nhất)

 Sử dụng các thuật toán dự đoán chuyển động khác nhau để ước tính vị trí vàhướng di chuyển của các đối tượng trong video

Bước 3: Mã hóa bù trừ chuyển động:

 Mã hóa dữ liệu bù trừ chuyển động bằng các kỹ thuật tương tự như nén trongảnh

 Do dữ liệu bù trừ chuyển động thường có ít thông tin hơn khung hình gốc, kíchthước tệp được giảm đáng kể

Trang 12

Hình 4: Giải nén MPEG

- Nguyên lý giải nén MPEG:

 Đầu tiên là giải mã Entropy, sau đó tách dữ liệu ảnh (hệ số biến đổiDCT) ra khỏi các vector chuyển động Dữ liệu ảnh sẽ được giảilượng từ hoá và biến đổi DCT ngược

 Nếu ảnh là ảnh loại I bắt đầu ở mỗi nhóm ảnh trong chuỗi, ở đầu ra

sẽ nhận được ảnh hoàn chỉnh bằng cách trên ( vì ảnh loại I chỉ là néntrong ảnh, không có bù chuyển động, không dùng dữ liệu của ảnhkhác) Nó được lưu trữ trong bộ nhớ ảnh và được và được dùng đểgiải mã các ảnh tiếp theo

 Nếu ảnh là ảnh loại P thì cũng thực hiện giải lượng từ hóa và biến đổiDCT ngược kết hợp với việc sử dụng vector chuyển động và lưu vào

bộ nhớ ảnh sớm hơn Trên cơ sở đó xác định được dự đoán ảnh đangxét Ta nhận được ảnh ra sau khi cộng dự đoán ảnh (ảnh dự đoán) vàkết quả biến đổi DCT ngược Ảnh này cũng được lưu vào bộ nhớ để

có thể sử dụng như là chuẩn khi giải mã các ảnh tiếp theo

Giải nén MPEG là quá trình ngược lại với nén MPEG, có mục tiêu tái tạo video gốc

từ dữ liệu nén Dưới đây là giải thích từng bước chi tiết về nguyên lý giải nén MPEG:

1 Đọc tệp video MPEG:

 Đọc dữ liệu từ tệp video MPEG, bao gồm các thông tin như loại khung hình (I,

P, B), dữ liệu nén và các thông tin bổ sung khác

2 Giải mã loại khung hình:

Trang 13

 Xác định loại khung hình (I, P, B) để áp dụng các bước giải nén phù hợp.

3 Giải nén trong ảnh (Intra-frame decompression):

 Áp dụng cho khung hình I

Bước 1: Giải mã entropy:

 Giải mã các giá trị lượng tử hóa từ mã Huffman hoặc mã arithmetic

Bước 2: Giải lượng tử hóa:

 Phục hồi độ chính xác của các giá trị lượng tử hóa bằng cách nhân với các bướclượng tử hóa

Bước 3: Biến đổi nghịch:

 Áp dụng phép biến đổi nghịch DCT (Discrete Cosine Transform) để chuyển đổi

dữ liệu từ miền tần số sang miền không gian

4 Giải nén liên ảnh (Inter-frame decompression):

 Áp dụng cho khung hình P và B

Bước 1: Giải mã bù trừ chuyển động:

 Giải mã dữ liệu bù trừ chuyển động từ mã nén

Bước 2: Bù chuyển động:

 Sử dụng dữ liệu bù trừ chuyển động để dự đoán nội dung của khung hình P hoặc B dựa trên khung hình tham chiếu (thường là khung hình I hoặc P gần nhất)

Bước 3: Kết hợp dự đoán và dữ liệu gốc:

 Kết hợp dữ liệu bù trừ chuyển động với dữ liệu gốc (đã giải nén trong ảnh hoặc giải nén liên ảnh trước đó) để tái tạo khung hình P hoặc B hoàn chỉnh

Trang 14

cho video chất lượng thấp trên DVD Mục tiêu của MPEG-1 là giảm kích thước tệp

video và âm thanh để lưu trữ và truyền tải hiệu quả hơn

Đặc điểm chính của MPEG-1:

o Hỗ trợ nén video độ phân giải thấp (VCD, SVCD) và âm thanh chấtlượng CD

o Sử dụng nhiều kỹ thuật nén hiệu quả như DCT (Biến đổi Cosine rời rạc),lượng tử hóa và mã hóa entropy

o Hỗ trợ nhiều định dạng tệp phổ biến như MP3, MPEG-1 Video (VCD,SVCD), MPEG-2 Audio Layer III (MP3)

o Được ứng dụng rộng rãi trong lưu trữ video trên đĩa CD, phát nhạc MP3,truyền hình kỹ thuật số và các ứng dụng đa phương tiện khác

Lợi ích của MPEG-1:

o Giảm đáng kể kích thước tệp video và âm thanh, giúp tiết kiệm dunglượng lưu trữ và băng thông truyền tải

o Duy trì chất lượng video và âm thanh ở mức chấp nhận được cho nhiềuứng dụng

o Hỗ trợ nhiều định dạng tệp phổ biến, dễ dàng tương thích với nhiều thiết

Đặc điểm chính của MPEG-2:

o Nén tín hiệu âm thanh và video với một dải tốc độ từ 1,5 Mb/s đến 60Mb/s

o Hỗ trợ nhiều độ phân giải: MPEG-2 có thể nén video ở nhiều độ phân

giải khác nhau, từ SD (Standard Definition) đến HD (High Definition)

Trang 15

o Tỷ lệ nén cao: MPEG-2 có thể đạt được tỷ lệ nén cao, giúp giảm đáng

kể kích thước tệp video mà vẫn giữ được chất lượng hình ảnh và âmthanh chấp nhận được

o Hỗ trợ nhiều định dạng: MPEG-2 hỗ trợ nhiều định dạng video và âm

thanh khác nhau, bao gồm H.262, MP3 và AC-3

o Tương thích rộng rãi: MPEG-2 được hỗ trợ bởi nhiều thiết bị và phần

mềm khác nhau, giúp cho việc phát và xem video MPEG-2 trở nên dễdàng

Ứng dụng của MPEG-2:

 Truyền hình kỹ thuật số: MPEG-2 là chuẩn nén video được sử dụng phổ biến

nhất cho truyền hình kỹ thuật số, bao gồm DVB, ATSC và ISDB

 DVD: MPEG-2 được sử dụng để lưu trữ video trên đĩa DVD.

 CD video: MPEG-2 cũng được sử dụng để lưu trữ video trên CD video.

 Phát trực tuyến: MPEG-2 được sử dụng cho nhiều dịch vụ phát trực tuyến

video, như YouTube và Netflix

 Phần mềm đa phương tiện: MPEG-2 được hỗ trợ bởi nhiều phần mềm đa

phương tiện, như Windows Media Player và VLC Media Player

Lợi ích của MPEG-2:

o Tiết kiệm dung lượng lưu trữ: MPEG-2 giúp giảm đáng kể kích thước

tệp video, giúp tiết kiệm dung lượng lưu trữ và băng thông truyền tải

o Chất lượng hình ảnh và âm thanh tốt: MPEG-2 có thể đạt được chất

lượng hình ảnh và âm thanh chấp nhận được, phù hợp cho nhiều ứngdụng đa phương tiện

o Tương thích rộng rãi: MPEG-2 được hỗ trợ bởi nhiều thiết bị và phần

mềm khác nhau, giúp cho việc phát và xem video MPEG-2 trở nên dễdàng

Nhược điểm của MPEG-2:

o Chất lượng có thể giảm: Ở tỷ lệ nén cao, chất lượng hình ảnh và âm

thanh có thể giảm

3 Chuẩn nén MPEG-4:

Tiêu đề	Tổng Quan Về Chuẩn Nén MPEG
Tác giả	Nguyễn Tuấn Kiệt, Phạm Tuấn Kiệt, Dương Đình Linh
Người hướng dẫn	Ths. Bùi An Đông
Trường học	Trường Đại học Khoa học Tự nhiên
Chuyên ngành	Kỹ Thuật Audio - Video
Thể loại	Báo Cáo Đồ Án
Năm xuất bản	2024
Thành phố	Thành phố Hồ Chí Minh

Định dạng
Số trang	21
Dung lượng	256,78 KB