1. Trang chủ
  2. » Luận Văn - Báo Cáo

Nghiên cứu ứng dụng của chuẩn nén MPEG-4 Part 10/H.264 kết hợp với video streaming

26 0 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Nội dung

Trang 1

HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG

VŨ THỊ HUONG £ «ANG

NGHIÊN CUU UNG” 'NG CUA SUAN NEN MPEG-4

CHUY ' GANH: KY THUẬT VIÊN THONGMA SO: 60.52.02.08

TOM TAT LUAN VAN THAC SI

HÀ NỘI - 2014

Trang 2

Luận văn được hoàn thành tại:

HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THONG

Phản biện 1: TS.Nguyễn Ngoc Mi:

Phản biện 2: PGS.1s LEM, Tú

Luận van sé duoc bảo vệ trước Hội đông cham luận văn thạc sĩ

tại Học viện Công nghệ Bưu chính Viễn thông

Vào lúc: 9 g10 30 ngày 09 tháng 08 năm 2014

Có thê tìm hiêu luận văn tại:

- Thư viện của Học viện Công nghệ Bưu chính Viễn thông

Trang 3

MỞ ĐẦU

Với sự phát triển nhanh chóng của mạng Internet băng rộng làm

thay đổi cả về nội dung và kĩ thuật truyền hình Hiện nay truyền hình có nhiều dạng khác nhau: truyền hình số, truyền hình vệ tinh, truyền

hình cáp, truyền hình Internet và IPTV IPTV đang là cấp độ cao nhất và là công nghệ truyền hình của tương lai.

Vì đữ liệu video thô chiếm một lượng lớn băng thông nên thườngsử dụng nén dé thu được hiệu quả truyền dẫn Nén cho phép các nhàcung cấp dịch vụ IPTV quảng bá các kênh video và audio chất lượng

cao qua một mang IP băng rộng Chuan nén video MPEG-4 Part 10/H.264 là một trong những định dạng hav được sử dụng nhất hiện nay để ghi, nén, phân phối video độ nét c „ với nhiều ứng dụng rộng rãi từ các ứng dụng video streaming © a ¬ternet tốc độ bit thấp tới quảng bá HDTV Chuan MPEG-4 Part 10/H ^4 kế thừa các ưu điểm của các chuẩn nén trước đó như M: 7G-2, MPE 4 nhưng MPEG-4 Part 10/H.26MPEG-4 có hiệu suất en tốt 1 + và linh hoạt hon trong việc lưu trữ và truyền dẫn.

Với đề tài:" Nghiên cứu tm, dung của chuẩn nén MPEG-4 Part

10/H.264 kết hợp -_ “ideo stre +ing", luận văn của em gồm 3

Chương 1: Tu + qu’ về các chuẩn nén trong video streaming.

Chương 2: Chua ‘én video MPEG.

Chương 3: Ung du - của bộ mã hóa MPEG-4 Part 10/H.264 va

video streaming vào IPTV.

Trang 4

CHƯƠNG 1 - TONG QUAN VE CÁC CHUAN NEN

TRONG VIDEO STREAMING

1.1 Giới thiệu

Có 2 mô hình truyền dẫn video lưu trữ trên mạng Internet đó là chế độ download và chế độ streaming Video streaming có các yêu

cầu về băng thông, độ trễ và mất mát Tuy nhiên, mạng Internet nỗ

lực tối đa hiện nay không cung cấp bất kỳ đảm bảo về QoS.

Nén video làm giảm số bit dùng dé biểu diễn từng pixel trong anh Các thuật toán nén ảnh sinh ra các tạp nhiễu (artifact) nhìn thấy được.

Nén luôn là sự được- mat giữa mức artifact và băng thông.

1.2 Các yêu cầu kỹ thuật của các chya nén trong videostreaming

e Bang thong: Dé thu được cha ‘rong chap nhan duoc

theo cảm giác, một ứng dung sti wing điển inh cần có yêu cầu

băng thông tối thiéu.

e Tré: Streamine ‡eo yêu ca ‘ré end-to-end giới hạn dé

gói có thê tới phía thu de aig lúc 4 giải mã va hién thị.

e Mất gói: “+ gói là k “ng thé tránh được trên Internet.

Do đó, mong mv “¿¡ một x_ Jeo stream mạnh tránh mat gol.

e Chức ¬ăng .nu video-cassette-recoder (VCR): Một số

ứng dung streaming su cầu các chức năng giống như VCR như là

dừng, tạm dừng/tiếp tụ‹ “i,

¢ Độ phức tạp giải mã hóa: Một số thiết bị như điện thoại

di động, thiết bị số cá nhân (PDA) yêu cầu tốn ít năng lượng Do đó,

yêu cầu độ phức tạp giải mã hóa thấp.

1.3 Các chuẩn nén trong video streaming1.3.1 Cơ sở nén

Một video clip là một chuỗi các ảnh hoặc khung Từng ảnh có thể được xử lý riêng biệt như là một ảnh tĩnh Một ví dụ điển hình là

chuẩn JPEG

s* Nén trong khung

Nén một ảnh đơn trong miền không gian được gọi là nén trong

khung.

Trang 5

s* Nén liên khung

Một chuỗi các ảnh video có sự thay đổi nhỏ từ một ảnh này tới ảnh tiếp theo, ngoại trừ một số thay đổi cảnh Nén theo thời gian hoặc liên khung loại bỏ dư thừa giữa các khung liên tiếp nhau.

“+ Thị giác

Võng mạc và vỏ não cùng nhau xử lý cảnh nhìn thấy theo cách phát hiện các biên và các đường Một kiến trúc nén tốt là phải tận dụng được cơ chế của thị giác.

1.3.2 Các thuật toản nén

Có 4 loại dư thừa chính trong tín hiệu video là: không gian, thời

gian, giác quan, thống kê.

s* Mã hóa trong khung hay nén” ông gian

Mã hóa biến đổi, trong đó một ble «c >» các pixel được biến đồi sang miền tần số, sau đó lượng tử hóa và mã › 2 entropy.

Mã hóa biến đổi

Mã hóa biến đổi chuyển Z ¡ mảng k *ng gian của các pixel block, một bản đồ bit sang miề ta số Biến a cosin rời rac DCT được thông qua rộng rãi cho video ¬dec Một số biến đổi khác được

nghiên cứu là DFT a WHT.

Nén wavelet

Cung cấp suv *u 7 en lại thời gian-tần số của ảnh va có thé thu

được cùng chất lượn, ảnh như DCT ở tỉ số nén cao hơn nhiều.

s* Nén dựa vào  hình

Đây là sự thay thé cho mã hóa dang sóng Codec cố gang mô hình hóa cảnh và sau đó phát các ký hiệu mô tả, thay vì biểu diễn lại ảnh

không gian.

Chia nhỏ (fractal)

Trong những anh nhất định, các phan của anh tương đồng với các phần khác của cùng một ảnh.Các phan giống nhau của ảnh được định

vị và sau đó áp dụng thuật toán chia nhỏ.

Mã hóa dựa trên doi twong

Mã hóa đối tượng được thông qua là cơ sở cho mã hóa MPEG-4 Một cảnh được biểu diễn lại bằng một số đối tượng video Mỗi đối

Trang 6

tượng được miéu tả bởi hình dạng, kết cau và di chuyền Thuật toán

như DCT và wavelet có thé được sử dụng dé nén các đối tượng.

Mã hóa entropy

Mã hóa entropy có thê mang lại biểu diễn ảnh ngắn hơn nhiều với bang cách sử dụng các từ mã ngắn hon cho các chuỗi bit có khả năng

hơn và từ mã dài hơn cho các chuỗi ít khả năng hơn.

Biến đổi cosin rời rac

Biến đổi này là cơ sở cho tat cả các codec video phổ biến Ảnh được chia thành các block thông thường và sau đó mỗi block biến đôi

thành block hệ số biến đổi Các hệ số được chuẩn hóa và lượng tử

s* Mã hóa độ dài thay doi (VI „

Bằng cách quét các hệ số theo due zg >zag thì kết quả dần chạytới 0 Các hệ số sau đó được ch"yên đổi t xh một chuỗi các cặpcường độ chạy Các hệ số cườnz đọ hay này sac *6 được mã hóa với

từ mã độ dài thay đôi.

s* Nón liên kh' g +y nén the 'hời gian

Co sở của loại nén nay là c ˆ phát sự sai khác giữa các khung.

Hau hết sự sai khae | ¬áckhung ` từ đối tượng chuyền động.

% Uớ ánh ch yên động

Để tạo ra vec + ch yên động, bộ mã hóa phải ước tính chuyển

động của các phần i anh Dự đoán chuyển động so sánh một khung

trước đó với khung hig ‘tai, va sau đó ước tính bao nhiêu block của

anh đã di chuyên.

1.3.3 Các bộ codec nén

1) H.261 - hội nghị video

Đây là chuẩn mã hóa video đầu tiên và là khởi đầu cho chuẩn

MPEG-1 H.261 cho điện thoại video và hội nghị video qua đường

ISDN Chuẩn định nghĩa kích thước màn hình là định dạng trung

bình chung (CIF) 352 x 288 va Quarter CIF 176 x 144 pixel, sử dung

quét tiến lên va lay mau 4:2:0 Tốc độ dữ liệu từ 64 kb/s tới 2 Mb/s được chuẩn hỗ trợ Nén dựa trên DCT với mã hóa độ dài thay đôi.

2) MPEG-I

Trang 7

Độ phân giải thông thường là nguồn hoặc định dạng đầu vào chuẩn (SIF) Độ phân giải không gian khác nhau : 352 x 288 ở 25 fps cho PAL va 351 x 240 ở 30 fps cho NTSC Chuan này sử dụng quét tiến lên Nén video giống như H.261 sử dung DCT với mã độ dai thay đối.

Chuan này được thiết kế cho các ứng dụng lưu trữ như CD-ROM, tốc độ dữ liệu lên tới 1.5 Mb/s và không hỗ trợ streaming.

3) H.263

H.263 là sự phát triển của H.261 hướng tới các ứng dụng tốc độ bit thấp, có từ năm 1992 Chuẩn H.263 hỗ trợ độ phân giải SQCIF, QCIF, CIF, 4CIF, 16 CIF H.263 hiện nay 1 chuẩn cơ sở cho mã hóa

video tự nhiên MPEG-4.

4) MPEG-2

Một hệ thống độ phân giải ca hơn, cha tượng cao cho truyền hình quảng bá, MPEG-2 dành dé ay thế ch hệ thống tổng hop tương tự (NTSC, PAL) bane ệ thống -uyén dẫn số, mã hóa DVD.

Ứng dụng chính sử dune „¿+ thông ke lớn hơn 4 Mb/s Profile

chính ở mức chính (MP@ML) › TV độ nét chuẩn với tốc độ dữ liệu

lên tới 15 Mb/s Ch uu Ay dành chỗ trợ tốc độ bit TV độ nét cao

(lên tới 80 Mb/s’ va một ofile studio chỉ có khung I (50 Mb/s).5) MP ¬-4

MPEG-4 là hệ ti 12 MPEG đầu tiên mà hỗ trợ streaming là một phan của chuẩn MPEL + phiên bản 1 hỗ trợ: Tốc độ bit điển hình từ 5 kb/s tới 10 Mb/s; định dạng quét: video trộn lẫn hoặc lũy tiễn Độ phân giải: điển hình từ sub-QCIF tới trên HDTV.

MPEG-4 không dùng bản đồ bit 2 chiều va vuông góc như các chuẩn mã hóa trước đó mà thông qua mã hóa đối tượng.

6) AVC (Advanced Video Codec, H.264)

Nhóm video kết hợp (JVT - Joint Video Team) được thành lập dé phát triển video codec tiên tiến hay AVC Nó được gọi là H.264 bởi

ITU và MPEG-4 Part 10 bởi tổ chức MPEG.

“+ Các chuẩn MPEG khác

MPEG-7

Trang 8

Đây là hệ thống được chuẩn hóa để mô tả nội dung âm

thanh-hình ảnh Điều này cho phép tìm kiếm nhanh và hiệu quả Các ảnh và âm thanh có thê được trình bày trong các trừu tượng: bố cục, mô tả văn bản của nội dung, màu sắc.

MPEG-21 là một framework cho các tai nguyên da phương tiện

tích hợp qua một dải rộng các nền tang va dịch vu Streaming media

là một phan quan trọng của framework này Một trọng tâm của

MPEG-2I là bán nội dung Chia khóa là quản lý sở hữu trí tuệ.

“ Chuan VC-1

VC-1 là viết tắt của Video Codec 1, đrợc chuẩn hóa bởi cộng đồng kỹ sư truyền hình va ảnh động SM” £ Chuan được phát hành vào 2006 Một trong những triển kh“ p ‘ile cao nhất được thông qua bởi nền tảng mã hóa đa phươns tiện WN 79 của Microsoft Một

số đặc điểm của VC-1 như sau:

e Triển khai qua một ở rộng ne “Aang.

e Hỗ trợ 3 profiler ag 'êt: simple, »>ain, advanced.

e Hỗ trợ ASF để cau trúcc ¬ø IPTV.

e Hỗ trợmô“ sain hthướcb ^k.

e Loaikk 1g bố s' g:VC-1 đưa ra một loại khung mới là BI.

e Hoạt động "“ ,nột dải rộng các công nghệ truyền tải mạng.

1.4 Kết luận

Chương | trình bày , cu cầu kỹ thuật của nén video trong video streaming, cơ sở của nén video và một số chuẩn nén phổ biến Các công nghệ nén khác nhau được phát triển cho các mục đích khác nhau Đối với ứng dụng video streaming, bộ video codec phải đảm bảo được các yêu cầu về băng thông, độ trễ, mat gói, độ phức tạp

Trang 9

Chương 2 - CHUAN NEN VIDEO MPEG VÀ

MPEG-4 PART 10/ H.26MPEG-4

2.1 Giới thiệu

MPEG là nhóm chuyên gia về hình ảnh, được thành lập vào năm 1288 với nhiệm vụ xây dựng tiêu chuẩn cho tín hiệu audio và video

SỐ Ngày nay, MPEG đã trở thành một kỹ thuật nén audio và video

phô biến nhất, tùy thuộc vào yeu cầu cụ thé của từng thiết bị sẽ có

một tiêu chuẩn thích hợp nhưng vẫn trên một nguyên lý thống nhất.

2.2 Mã hóa và giải mã MPEG

2.2.1 Cầu trúc dòng bit video MPEG

Bitstream QTs,Params_ Misc ae

Nén MPEG chia một chuỗi video thành các nhóm ảnh Từng ảnh

trong nhóm sẽ được chia thành các slice macroblock Một

macroblock bao gồm 4 block độ chói và 1 block U và V.

MPEG định nghĩa 3 loại khung trong nhóm: khung I (Intraframe),

khung dự đoán hay khung P, khung hai hướng hay khung B.

Cơ sở của công nghệ nén MPEG là kết hợp nén trong khung

(intra-frame) và nén liên khung (inter-frame).

Trang 10

Điều khiến tốc độ

| "= Dòng bit đã

Video vào ^ - Hệ số ; aig ma hoa

+ (4) DCT > Luong tu | lwong tr | Mã hóa ; Bộ ;

Hình 2.2: ơ đô ‘un MPEG

Sơ đồ nén MPEG như *ø hình 2.2 Ảnh hiện tại được so sánh

với ảnh trước tạo ra ảnh sai kha Ảnh này sau đó được nén trong ảnh qua các bước: biến 7 CT, lượn tử hóa, mã hóa Dữ liệu của ảnh sai khác và vect“ chuyc động mang thông tin về anh sau nén liên khung được dua “i bộ £ „m đầu ra.

Hình 2.3: Sơ đồ giải nén MPEG

Quá trình giải nén: đầu tiên là giải mã entropy, sau đó tách dit liệu ảnh (hệ số biến đổi DCT) ra khỏi các vector chuyển động Dữ liệu

Trang 11

ảnh sẽ được giải lượng tử hoa và biến đổi DCT ngược Nếu anh là

ảnh loại I bắt đầu ở mỗi nhóm ảnh trong chuỗi, ở đầu ra sẽ nhận được ảnh hoàn chỉnh bằng cách trên Nếu ảnh là ảnh loại P thì cũng thực hiện giải lượng tử hóa và biến đổi DCT ngược kết hợp với việc sử dụng vector chuyển động và lưu vào bộ nhớ ảnh trước Ta nhận được

ảnh sau khi cộng dự đoán anh và kết quả biến đổi DCT ngược.

2.3 Chuẩn nén MPEG-4

Vào tháng 10 năm 1998, MPEG-4 đã ra đời, với tốc độ mã hóa khoảng 1.5 Mb/s, chuan nén MPEG-4 đã giải quyết phần nào van đề tắc nghẽn mạng và sự hạn chế về băng thông MPEG-4 bao gồm các bộ phận riêng rẽ, có quan hệ chặt chẽ với r¬au và có thể được triển khai ứng dụng riêng hoặc tô hợp với các -ˆ an khác.

2.3.1 Công nghệ mã hóa và giải rv vi `9 trong MPEG-4

Bộ mã hóa [| E——] | Bộ giải mã _

-VO-I | -VO-I

ideo đã ân chia cá ộ | nạ Video da

Video đầu vào Phân chia các Bộ mã b’ j Bo L Bộ Hộ giải mã T ông đạp ideo dau ra

—————> đôi tượng x—> ghép hân ry, ———> VŒ R VO-2 các VO

video (VO) L— kênh

Bê .hóa Bộ giải mã

.O-n VO-n

Hình 2.4: Cau 1 ac bộ mã hóa và giải mã MPEG-4

Với MPEG-4, các đối tượng khác nhau trong một khung hình có

thé được mô tả, mã hóa và truyền đi một cách riêng biệt đến bộ giải

mã trong các dòng cơ bản ES khác nhau.

- _ Mã hóa hình dạng: dùng để nén đoạn thông tin, giúp xác định khu vực và đường viền bao quanh đối tượng trong khung hình

- Mã hóa kết cấu: kết cấu của một đối tượng video thường

được mã hóa bang DCT Có thé mã hóa sử dụng biến đổi wavelet.

- _ Mã hóa chuyền động: Nếu đối tượng chuyên động, thông số chuyên động cho toàn bộ đối tượng được truyền.

Trang 12

2.3.2 Các profile và level trong chuẩn MPEG-4

Object DescriptorProfile

Hình 2.5: Cac profil” à mu_ level tron, MPEG-4

MPEG-4 chia thành c4 nhóm côn, ¬^ụ gọi là các profile, mỗi

profile chỉ chứa một va’ nh ¬g cần thic của chuẩn mã hóa thích

hợp cho một phạm +“ ng dung ào đó Mỗi profile lại có một SỐ

mức level khác nk vu.

Có nhiều mm pro“.e như media profile, scene graph profile,

MPEG-J profile,

Nhóm media pro > có: audio profile, visual profile, graphics

profile Trong đó visua profile gồm có các profile sau: Simple

profile Simple scalable profile, Core profile (profile 161), Main

profile, N-bit profile, Scalable texture profile Simple face, Hybrid

profile, Basic animated texture profile.

2.4 Chuẩn nén MPEG-4 Part 10/H.264

2.4.1 Giới thiệu chung về MPEG-4 part 10/H.264

Dé cung cấp nén video tốt hơn các chuẩn nén trước đó, chuẩn MPEG-4 part 10/H.264 hay H.264/AVC được phát triển bởi nhóm

video kết hợp JVT bao gồm các chuyên gia đến từ MPEG và VCEG

của ITU-T H.264/AVC dap ứng hiệu qua mã hóa, đặc tả cú pháp đơn

giản, tích hợp mã hóa video với tất cả các giao thức và kiến trúc ghép

Trang 13

kênh hiện tại Do đó, H.264/AVC có thé hỗ trợ các ứng dụng như

video broadcasting, video streaming, video conferencing qua mạng

cô định, không dây va qua các giao thức truyền tải khác nhau Tính kế thừa của chuẩn nén MPEG-4 Part 10/H.264:

= Phân chia hình ảnh thành các block bao gồm nhiều pixel.

= Khai thác triệt dé sự dư thừa về mặt không gian tồn tại giữa

các hình ảnh liên tiếp.

" Khai thác sự phụ thuộc tạm thời của các block của các hình

ảnh liên tiếp.

= Khai thác tất cả sự dư thừa về thống kê, giảm tương quan thống kê bằng mã hóa entropy.

H.264 có những sự thay đổi quan trọn ưong chỉ tiết của các phần tử chức năng như dự đoán trong ảnh - se đổi số nguyên 4 x 4 mới, nhiều ảnh tham chiếu, các kích thước block hay đôi, độ chính xác

1/4 cho bù chuyển động, bộ lọc tác hối, cải tic nd hóa entropy.

H.264 sử dụng một số r' ương pi > để phục hồi lỗi Thiết lập tham số, thứ tự macroblo › *m dẻo, slic =huyển đổi, phương pháp

slice dư thừa được thêm vào.

2.4.2 Cầu trúc bê úa MPE 4 part 10/H.264

Lớp mã hóa ideo củ_MPEG-4/H.264 là sự kết hợp của mã hóa không gian và m 62° aời gian Bộ mã hóa có thé lựa chọn mã hóa trong anh hoặc mã I > liên ảnh cho miền khối Bộ lọc tách khối làm giảm sự nhiễu khối tại ‹ + đường biên của block Các vector chuyền

động và các mode dự đoán trong ảnh có thé làm biến đổi kích thước block trong ảnh Cuối cùng, vector chuyển động hay các mode dự đoán liên ảnh được liên kết với thông tin của hệ số biến đồi lượng tử

hóa và được mã hóa sử dụng mã entropy như CAVLC hay CABAC.

2.4.2.1 Các ảnh và bù chuyển động dùng trong MEG-4 Part

s* Chia ảnh thành các macro-block

Mỗi ảnh video, frame được chia thành các macroblock có kích

thước cố định bao phủ một diện tích ảnh hình chữ nhật gồm 16 x 16 mẫu cho các thành phan chói và 8 x 8 mẫu cho một trong hai thành phần màu.

Ngày đăng: 14/04/2024, 17:50

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN