Hiểu rõ về cơ chếhoạt động và các tiêu chuẩn của MPEG sẽ giúp tối ưu hóa quá trình truyền tải video vàâm thanh, đồng thời tạo ra các sản phẩm và dịch vụ đa phương tiện hiệu quả hơn.Công
Trang 1TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
KHOA ĐIỆN TỬ VIỄN THÔNG
🙞🙠🕮🙢🙜
-BÁO CÁO ĐỒ ÁN
MÔN: KỸ THUẬT AUDIO – VIDEO
ĐỀ TÀI :
TỔNG QUAN VỀ CHUẨN NÉN MPEG
Giảng viên hướng dẫn : Ths Bùi An Đông
Sinh viên thực hiện : Nhóm
Thành phố Hồ Chí Minh, tháng 04 năm 2024
Trang 2STT HỌ VÀ TÊN MSSV CÔNG VIỆC ĐÁNH
GIÁ (1-5)
1 Nguyễn Tuấn Kiệt 20200240 Tìm tài liệu, trình bày
Trang 3MỤC LỤC
CHƯƠNG I: MỞ ĐẦU 1
1 Lý do chọn đề tài: 1
2 Giới thiệu khái quát khái niệm và quá trình phát triển: 2
CHƯƠNG II: KHÁI QUÁT VỀ CHUẨN NÉN MPEG 3
1 Khái quát về nén MPEG 3
2 Cấu trúc dòng bit MPEG video 3
3 Các loại ảnh trong chuẩn MPEG 4
4 Nguyên lý nén MPEG 8
5 Nguyên lý giải nén MPEG 8
CHƯƠNG III: CÁC CHUẨN NÉN MPEG 12
1 Chuẩn nén MPEG-1 12
2 Chuẩn nén MPEG-2 14
3 Chuẩn nén MPEG-4 19
4 Chuẩn nén MPEG-7 20
CHƯƠNG VI: KẾT LUẬN 22
Tài liệu tham khảo: 22
Trang 4CHƯƠNG I: MỞ ĐẦU
1 Lý do chọn đề tài:
Chuẩn nén MPEG (Moving Picture Experts Group) không chỉ đóng vai trò quantrọng trong việc tiết kiệm băng thông mạng mà còn là yếu tố then chốt trong việc cảithiện trải nghiệm người dùng khi xem video trực tuyến trên Internet Hiểu rõ về cơ chếhoạt động và các tiêu chuẩn của MPEG sẽ giúp tối ưu hóa quá trình truyền tải video và
âm thanh, đồng thời tạo ra các sản phẩm và dịch vụ đa phương tiện hiệu quả hơn.Công nghệ nén video MPEG đã được tích hợp trong một loạt các ứng dụng nhưstreaming video, video conferencing, truyền hình số và nhiều lĩnh vực khác Việcnghiên cứu về chuẩn nén MPEG không chỉ mang lại kiến thức chuyên sâu mà còn giúphiểu rõ về các ứng dụng thực tiễn và tiềm năng phát triển của công nghệ này trongtương lai
Với sự phát triển không ngừng của công nghệ và nhu cầu người dùng ngày càngtăng cao về chất lượng video, việc hiểu rõ về các tiêu chuẩn nén video như MPEG làcực kỳ quan trọng Việc nghiên cứu này không chỉ giúp nâng cao kỹ năng và hiểu biết
cá nhân mà còn đóng góp vào sự phát triển toàn diện của ngành công nghiệp truyềnthông đa phương tiện
2 Giới thiệu khái quát khái niệm và quá trình phát triển:
MPEG là một tổ chức chuyên về việc phát triển các chuẩn nén video và âmthanh Các tiêu chuẩn của MPEG bao gồm MPEG-1, MPEG-2, MPEG-4, MPEG-7,MPEG-21 và MPEG-H, mỗi chuẩn đều có mục tiêu và ứng dụng cụ thể trong lưu trữ
và truyền tải nội dung đa phương tiện
Quá trình phát triển các tiêu chuẩn MPEG bắt đầu từ những năm 1980 với mụctiêu tạo ra một chuẩn nén video đồng nhất cho các dịch vụ truyền hình và lưu trữvideo Các tiêu chuẩn sau này tiếp tục phát triển để đáp ứng nhu cầu ngày càng tăngcao về chất lượng video và hiệu suất nén Quá trình này thường bao gồm nghiên cứu,thử nghiệm và thảo luận giữa các chuyên gia từ nhiều quốc gia và tổ chức khác nhau.Hiểu rõ về chuẩn nén MPEG không chỉ giúp tối ưu hóa việc sử dụng băng thông
và lưu trữ mà còn giúp cải thiện trải nghiệm người dùng và giảm chi phí cho các nhàcung cấp dịch vụ Nghiên cứu về chuẩn nén MPEG cũng đóng vai trò quan trọng trong
Trang 5CHƯƠNG II: KHÁI QUÁT VỀ CHUẨN NÉN MPEG
1 Khái quát về nén MPEG:
- MPEG (Moving Picture Expert Group) là nhóm chuyên gia về hình ảnh,
được thành lập từ tháng 2 năm 1988 với mục tiêu là phát triển các tiêuchuẩn nén video và âm thanh để lưu trữ và truyền tải hiệu quả hơn
- Chuẩn nén MPEG là một tập hợp các kỹ thuật được sử dụng để nén dữ liệu
video và âm thanh, được sử dụng rộng rãi trong nhiều ứng dụng khác nhau,bao gồm:
Lưu trữ video trên đĩa CD, DVD, Blu-ray: MPEG giúp giảm kíchthước tệp video, giúp dễ dàng lưu trữ và chia sẻ hơn
Truyền tải video: MPEG giúp giảm lượng băng thông cần thiết đểtruyền tải video, giúp cho việc phát trực tuyến video, truyền hình kỹthuật số và video call trở nên khả thi hơn
Chỉnh sửa video: MPEG giúp giảm thời gian cần thiết để chỉnh sửavideo
- Hiện nay, có nhiều tiêu chuẩn MPEG khác nhau, mỗi tiêu chuẩn được thiết
kế cho các mục đích sử dụng cụ thể Một số tiêu chuẩn MPEG phổ biến nhấtbao gồm: MPEG-1, MPEG-2, MPEG-4, MPEG-7, MPEG-H, MPEG-5(EVC)
- Việc kết hợp MPEG-4 và MPEG-7 sẽ tạo ra các giải pháp lý tưởng cho các
dịch vụ Streaming Media, các hệ thống lưu trữ và sản xuất Streaming Mediatrong thời gian tới
2 Cấu trúc dòng bit MPEG video:
Trang 6Hình 1: Cấu trúc dòng bit MPEG video
Trong đó:
a) Lớp Chuỗi (Sequence Layer):
o Đây là đơn vị nội dung chứa thông tin về chuỗi bit video.
o Video Params: thông tin chiều cao, bề rộng, tỷ lệ khuôn hình các phần tử
ảnh
o Bitstream Params: Thông tin về tốc độ bit và các thông số khác.
b) Lớp Group of Pictures (GOP Layer):
o Lớp GOP là một nhóm các hình ảnh liên tiếp được nén cùng nhau GOP
thường bao gồm một hình ảnh I (Intra-frame) và một số hình ảnh P (Predictive-frame) hoặc B (Bidirectional-frame)
o Time code: mã định thời, xác định giờ, phút, giây, ảnh
o GOP Params: miêu tả cấu trúc GOP.
c) Lớp Pict (Picture Layer): chứa thông tin cho một hình ảnh riêng lẻ, bao gồm:
o Dữ liệu hình ảnh được nén
o Type: Cho phép bộ giải mã xác định ảnh đựơc mã hoá là ảnh I, P hay B
o Buffer Params: thông tin về Buffer (chỉ thứ tự truyền khung để bộ giải
mã có thể sắp xếp các loại ảnh theo một thứ tự đúng)
o Encode Params: chứa thông tin về đồng bộ, độ phân giải và phạm vi của
vector chuyển động
d) Lớp Slice (Slice Layer):
o Lớp Slice là một phần nhỏ của hình ảnh được mã hóa riêng biệt
o Việc chia khung hình ảnh thành các slice giúp cho việc truyền tải và giải
mã video hiệu quả hơn
e) Lớp Macro Block (MB Layer):
Trang 7o Mỗi macroblock bao gồm một vùng nhỏ của hình ảnh (8x8 pixel) được
mã hóa bằng cách sử dụng biến đổi Cosine rời rạc (DCT) và mã hóa entropy
o Quản lý việc di chuyển của các khối hình ảnh.
o Addr Iner: Số lượng MB được bỏ qua
o Type: Loại vector chuyển động dung cho Macroblock.
o Qscale: Bảng lượng tử dùng cho Macroblock
o CBP (Coded Block Pattern): chỉ rõ Block nào được mã hoá
f) Lớp Khối (Block Layer):
o Đơn vị chuyển đổi DCT (Discrete Cosine Transform).
o Thực hiện việc biến đổi từ miền không gian sang miền tần số để nén dữ
liệu video
Như vậy, cấu trúc dòng bit MPEG video bao gồm các thành phần này, giúp tổ chức
và lưu trữ video, âm thanh và các thông tin liên quan khác một cách hiệu quả
3. Các loại ảnh trong chuẩn MPEG:
Trong nén MPEG người ta sử dụng 3 loại ảnh sau:
o Được sử dụng làm điểm tham chiếu cho các ảnh tiếp theo trong video.
o Thường được sử dụng ở đầu video hoặc sau các cảnh quay thay đổi lớn.
Ảnh P (Predicted Pictures):
o Được mã hóa dựa trên thông tin từ các ảnh I hoặc ảnh P trước đó.
o Sử dụng để dự đoán sự thay đổi giữa các khung hình liên tiếp
o Chỉ lưu trữ thông tin thay đổi so với ảnh tham chiếu, do đó có tỷ lệ nén
cao hơn ảnh I
Trang 8o Có thể bị ảnh hưởng bởi lỗi trong ảnh tham chiếu, dẫn đến nhiễu trong
video
o Thường được sử dụng để nén các cảnh quay có chuyển động nhẹ.
Ảnh B (Bidirectionally Predicted Pictures):
o Được mã hóa dựa trên thông tin từ các ảnh I, ảnh P và ảnh B trước đó.
o Có tỷ lệ nén cao nhất trong ba loại ảnh.
o Có thể bị ảnh hưởng bởi lỗi trong cả hai ảnh tham chiếu, dẫn đến nhiễu
o Số lượng ảnh I, P và B trong video được điều chỉnh tùy thuộc vào nội dung
video và yêu cầu về chất lượng
Ví dụ, video có nhiều cảnh quay tĩnh có thể sử dụng nhiều ảnh I hơn, trong khi video
có nhiều cảnh quay chuyển động nhanh có thể sử dụng nhiều ảnh P và B hơn
4. Nguyên lý nén MPEG:
Trang 9Hình 3: Nén MPEG
- Cơ sở của công nghệ nén video MPEG là sự kết hợp giữa nén trong ảnh
(Intra-Frame Compression) và công nghệ nén liên ảnh (Inter-FrameCompression)
Nén trong ảnh (Intra-Frame Compression): Là loại nén nhằm
giảm bớt thông tin dư thừa trong miền không gian Nén trong ảnh
sử dụng cả hai quá trình có tổn hao và không có tổn hao để giảmbớt dữ liệu trong ảnh Quá trình này không sử dụng thông tin củacác ảnh trước và sau ảnh đang xét
Nén liên ảnh (Intra-Frame Compression):Trong tín hiệu video
có chứa thông tin dư thừa trong miền thời gian Nghĩa là với mộtchuỗi liên tục các ảnh, lượng thông tin chứa đựng trong mỗi ảnhthay đổi rất ít từ ảnh này sang ảnh khác Tính toán sự dịch chuyển
vị trí của nội dung ảnh là một phần rất quan trọng trong kỹ thuậtnén liên ảnh Trong thuật nén MPEG, quá trình xác định Vectorchuyển động được thực hiện bằng cách chia hình ảnh thành cácMacro-Block, mỗi Macro-Block có 16 x 16 phần tử ảnh (tươngđương với 4 Block, mỗi Block có 8 x 8 phần tử ảnh) Để xác địnhchiều chuyển động, người ta tìm kiếm vị trí của Macro-Block
Trang 10trong ảnh tiếp theo, kết quả của sự tìm kiếm sẽ cho ta Vectorchuyển động của Macro-Block
- Nguyên lý nén MPEG:
1 Phân chia video thành khung hình:
Video được chia thành các khung hình riêng biệt, mỗi khung hình là một ảnhtĩnh đại diện cho một khoảng thời gian ngắn trong video
Kích thước khung hình và tốc độ khung hình (số khung hình mỗi giây) xác định
độ phân giải và độ mượt mà của video
2 Xác định loại khung hình:
MPEG sử dụng ba loại ảnh chính: I (Intra-frame), P (Predicted frame) và B predictive frame) để tối ưu hóa hiệu suất nén
(Bi- Ảnh I: Được mã hóa độc lập, không dựa trên bất kỳ ảnh nào khác trong video.
Ảnh P: Được dự đoán từ ảnh I trước đó, sử dụng kỹ thuật bù chuyển động.
Ảnh B: Được dự đoán từ cả ảnh I và P trước và sau.
3 Nén trong ảnh (Intra-frame compression):
Áp dụng cho từng khung hình I, không phụ thuộc vào các khung hình khác
Mục tiêu là nén hiệu quả dữ liệu hình ảnh trong mỗi khung hình I
Bước 1: Biến đổi:
Biến đổi dữ liệu hình ảnh từ miền không gian sang miền tần số bằng DCT(Discrete Cosine Transform)
DCT chia nhỏ hình ảnh thành các khối nhỏ (thường là 8x8 pixel) và áp dụngphép biến đổi toán học cho mỗi khối
Phép biến đổi DCT tập trung năng lượng hình ảnh vào các thành phần tần sốthấp, giúp loại bỏ dễ dàng hơn các thành phần tần số cao không quan trọng
Bước 2: Lượng tử hóa:
Giảm độ chính xác của các giá trị biến đổi bằng cách chia chúng thành các bướcnhỏ hơn
Mức độ lượng tử hóa càng cao, độ chính xác càng thấp và kích thước tệp càngnhỏ
Lượng tử hóa loại bỏ thông tin chi tiết ít quan trọng, dẫn đến giảm chất lượngvideo nhưng tiết kiệm dung lượng lưu trữ
Bước 3: Mã hóa entropy:
Trang 11 Mã hóa các giá trị lượng tử hóa bằng mã Huffman hoặc mã arithmetic.
Các mã này gán các bit ngắn hơn cho các giá trị xuất hiện thường xuyên hơn vàcác bit dài hơn cho các giá trị xuất hiện ít thường xuyên hơn
Mã hóa entropy giúp giảm thêm kích thước tệp
4 Nén liên ảnh (Inter-frame compression):
Áp dụng cho ảnh P và B, khai thác sự tương đồng giữa các khung hình liên tiếp
để giảm kích thước tệp
Mục tiêu là dự đoán nội dung của một khung hình dựa trên các khung hìnhtrước đó, chỉ lưu trữ thông tin thay đổi
Bước 1: Dự đoán chuyển động:
Xác định các vùng di chuyển trong khung hình P hoặc B so với khung hìnhtham chiếu (thường là khung hình I hoặc P gần nhất)
Sử dụng các thuật toán dự đoán chuyển động khác nhau để ước tính vị trí vàhướng di chuyển của các đối tượng trong video
Bước 3: Mã hóa bù trừ chuyển động:
Mã hóa dữ liệu bù trừ chuyển động bằng các kỹ thuật tương tự như nén trongảnh
Do dữ liệu bù trừ chuyển động thường có ít thông tin hơn khung hình gốc, kíchthước tệp được giảm đáng kể
Trang 12Hình 4: Giải nén MPEG
- Nguyên lý giải nén MPEG:
Đầu tiên là giải mã Entropy, sau đó tách dữ liệu ảnh (hệ số biến đổiDCT) ra khỏi các vector chuyển động Dữ liệu ảnh sẽ được giảilượng từ hoá và biến đổi DCT ngược
Nếu ảnh là ảnh loại I bắt đầu ở mỗi nhóm ảnh trong chuỗi, ở đầu ra
sẽ nhận được ảnh hoàn chỉnh bằng cách trên ( vì ảnh loại I chỉ là néntrong ảnh, không có bù chuyển động, không dùng dữ liệu của ảnhkhác) Nó được lưu trữ trong bộ nhớ ảnh và được và được dùng đểgiải mã các ảnh tiếp theo
Nếu ảnh là ảnh loại P thì cũng thực hiện giải lượng từ hóa và biến đổiDCT ngược kết hợp với việc sử dụng vector chuyển động và lưu vào
bộ nhớ ảnh sớm hơn Trên cơ sở đó xác định được dự đoán ảnh đangxét Ta nhận được ảnh ra sau khi cộng dự đoán ảnh (ảnh dự đoán) vàkết quả biến đổi DCT ngược Ảnh này cũng được lưu vào bộ nhớ để
có thể sử dụng như là chuẩn khi giải mã các ảnh tiếp theo
Giải nén MPEG là quá trình ngược lại với nén MPEG, có mục tiêu tái tạo video gốc
từ dữ liệu nén Dưới đây là giải thích từng bước chi tiết về nguyên lý giải nén MPEG:
1 Đọc tệp video MPEG:
Đọc dữ liệu từ tệp video MPEG, bao gồm các thông tin như loại khung hình (I,
P, B), dữ liệu nén và các thông tin bổ sung khác
2 Giải mã loại khung hình:
Trang 13 Xác định loại khung hình (I, P, B) để áp dụng các bước giải nén phù hợp.
3 Giải nén trong ảnh (Intra-frame decompression):
Áp dụng cho khung hình I
Bước 1: Giải mã entropy:
Giải mã các giá trị lượng tử hóa từ mã Huffman hoặc mã arithmetic
Bước 2: Giải lượng tử hóa:
Phục hồi độ chính xác của các giá trị lượng tử hóa bằng cách nhân với các bướclượng tử hóa
Bước 3: Biến đổi nghịch:
Áp dụng phép biến đổi nghịch DCT (Discrete Cosine Transform) để chuyển đổi
dữ liệu từ miền tần số sang miền không gian
4 Giải nén liên ảnh (Inter-frame decompression):
Áp dụng cho khung hình P và B
Bước 1: Giải mã bù trừ chuyển động:
Giải mã dữ liệu bù trừ chuyển động từ mã nén
Bước 2: Bù chuyển động:
Sử dụng dữ liệu bù trừ chuyển động để dự đoán nội dung của khung hình P hoặc B dựa trên khung hình tham chiếu (thường là khung hình I hoặc P gần nhất)
Bước 3: Kết hợp dự đoán và dữ liệu gốc:
Kết hợp dữ liệu bù trừ chuyển động với dữ liệu gốc (đã giải nén trong ảnh hoặc giải nén liên ảnh trước đó) để tái tạo khung hình P hoặc B hoàn chỉnh
Trang 14cho video chất lượng thấp trên DVD Mục tiêu của MPEG-1 là giảm kích thước tệp
video và âm thanh để lưu trữ và truyền tải hiệu quả hơn
Đặc điểm chính của MPEG-1:
o Hỗ trợ nén video độ phân giải thấp (VCD, SVCD) và âm thanh chấtlượng CD
o Sử dụng nhiều kỹ thuật nén hiệu quả như DCT (Biến đổi Cosine rời rạc),lượng tử hóa và mã hóa entropy
o Hỗ trợ nhiều định dạng tệp phổ biến như MP3, MPEG-1 Video (VCD,SVCD), MPEG-2 Audio Layer III (MP3)
o Được ứng dụng rộng rãi trong lưu trữ video trên đĩa CD, phát nhạc MP3,truyền hình kỹ thuật số và các ứng dụng đa phương tiện khác
Lợi ích của MPEG-1:
o Giảm đáng kể kích thước tệp video và âm thanh, giúp tiết kiệm dunglượng lưu trữ và băng thông truyền tải
o Duy trì chất lượng video và âm thanh ở mức chấp nhận được cho nhiềuứng dụng
o Hỗ trợ nhiều định dạng tệp phổ biến, dễ dàng tương thích với nhiều thiết
Đặc điểm chính của MPEG-2:
o Nén tín hiệu âm thanh và video với một dải tốc độ từ 1,5 Mb/s đến 60Mb/s
o Hỗ trợ nhiều độ phân giải: MPEG-2 có thể nén video ở nhiều độ phân
giải khác nhau, từ SD (Standard Definition) đến HD (High Definition)
Trang 15o Tỷ lệ nén cao: MPEG-2 có thể đạt được tỷ lệ nén cao, giúp giảm đáng
kể kích thước tệp video mà vẫn giữ được chất lượng hình ảnh và âmthanh chấp nhận được
o Hỗ trợ nhiều định dạng: MPEG-2 hỗ trợ nhiều định dạng video và âm
thanh khác nhau, bao gồm H.262, MP3 và AC-3
o Tương thích rộng rãi: MPEG-2 được hỗ trợ bởi nhiều thiết bị và phần
mềm khác nhau, giúp cho việc phát và xem video MPEG-2 trở nên dễdàng
Ứng dụng của MPEG-2:
Truyền hình kỹ thuật số: MPEG-2 là chuẩn nén video được sử dụng phổ biến
nhất cho truyền hình kỹ thuật số, bao gồm DVB, ATSC và ISDB
DVD: MPEG-2 được sử dụng để lưu trữ video trên đĩa DVD.
CD video: MPEG-2 cũng được sử dụng để lưu trữ video trên CD video.
Phát trực tuyến: MPEG-2 được sử dụng cho nhiều dịch vụ phát trực tuyến
video, như YouTube và Netflix
Phần mềm đa phương tiện: MPEG-2 được hỗ trợ bởi nhiều phần mềm đa
phương tiện, như Windows Media Player và VLC Media Player
Lợi ích của MPEG-2:
o Tiết kiệm dung lượng lưu trữ: MPEG-2 giúp giảm đáng kể kích thước
tệp video, giúp tiết kiệm dung lượng lưu trữ và băng thông truyền tải
o Chất lượng hình ảnh và âm thanh tốt: MPEG-2 có thể đạt được chất
lượng hình ảnh và âm thanh chấp nhận được, phù hợp cho nhiều ứngdụng đa phương tiện
o Tương thích rộng rãi: MPEG-2 được hỗ trợ bởi nhiều thiết bị và phần
mềm khác nhau, giúp cho việc phát và xem video MPEG-2 trở nên dễdàng
Nhược điểm của MPEG-2:
o Chất lượng có thể giảm: Ở tỷ lệ nén cao, chất lượng hình ảnh và âm
thanh có thể giảm
3 Chuẩn nén MPEG-4: