Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 38 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
38
Dung lượng
1,84 MB
Nội dung
HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG
KHOA KỸ THUẬT ĐIỆN TỬ I
----------
PHÁT THANH TRUYỀN HÌNH
Đề tài :Chuẩn nén trong truyền hình
UHDTV
Giảng viên:Nguyễn Quốc Dinh
Nhóm thực hiện: Nhóm 04
Lớp:D11XLTH
MỤC LỤC
I, GIỚI THIỆU CHUNG VỀ UDHTV
II, KHÁI QUÁT VỀ NÉN VIDEO VÀ CHUẨN NÉN MPEG
III, CHUẨN NÉN MPEG-4 AVC/H.264
IV,CHUẨN NÉN MỚI H.265/HEVC
CHƯƠNG I
GIỚI THIỆU VỀ CÔNG NGHỆ UHDTV
1.1.
Giới thiệu về UHDTV
Ultra High Definition Television (Ultra HD Television hay UHDTV) là
công nghệ truyền hình được thiết kế để cung cấp cho người xem
nhưng trải nghiệm hình ảnh chất lượng siêu nét. UHDTV bao gồm 4K
UHD (2160p) và 8K UHD (4320p), đó là hai định dạng video kĩ thuật
số được các nhà nghiên cứu của Viện Công nghệ và Khoa học NHK
(Nhật Bản) đề xuất và được phê duyệt bởi Liên minh viễn thông quốc
tế (ITU). Công nghệ xử lý tín hiệu truyền hình UHDTV được sử dụng
cho màn hình có tỉ lệ là 16:9 và có ít nhất một đầu vào kĩ thuật số có
khả năng lưu trữ và phát video có độ phân giải tối thiểu 3840 x 2160
pixel.
Các tiêu chuẩn chất lượng của UHDTV được thực hiện theo 2 giai
đoạn trong đó tiến bộ công nghệ ở mỗi giai đoạn có thể tương đương
với bước nhảy vọt công nghệ từ truyền hình có độ nét tiêu chuẩn cũ
tới tiêu chuẩn công nghệ truyền hình độ nét cao hiện nay (HDTV).
Trong khi hình ảnh truyền hình HDTV hiện tương đương với 1-2
megapixel, hình ảnh truyền hình UHDTV giai đoạn 1 đã lên tới 8
megapixel và ở giai đoạn 2 lên tới 32 megapixel.
Chất lượng hình ảnh UHDTV song hành với độ trung thực của màu
tăng vọt và các lựa chọn về số hình ảnh trên 1 giây của UHDTV cũng
cao hơn nhiều so với HDTV. UHDTV là phát triển làm chấn động thế
giới truyền hình toàn hành tinh.
Độ phân giải 4K và 8K của UHDTV
Truyền hình UHDTV sẽ lôi cuốn toàn cầu trong tương lai gần. UHDTV
là bình minh của kỷ nguyên mới về truyền hình với mức độ thực của
hình ảnh chưa từng thấy mà người xem có thể thưởng thức.
+ Màu sắc thực hơn nhờ đường truyền băng
+ Sự rõ nét và chi tiết hơn của hình ảnh được nâng cao cho các màn
hình cỡ lớn dễ nhìn và sắc nét hơn.
+ Hệ thống âm thanh Multichanel 22.2 được phát sóng đồng thời với
UHDTV hỗ trợ chức năng âm thanh vòm.
1.2.
Khác biệt giữa UHDTV và các tivi tiêu chuẩn trước đó
Khác biệt lớn đầu tiên giữa UHDTV và một chiếc TV thường chính
là độ phân giải. Trong khi một chiếc TV truyền thống chỉ có thể hiển
thị tối đa khoảng 500 dòng và 500 cột điểm ảnh, tương ứng với độ
phân giải chỉ khoảng 500 x 500 pixel (250.000 điểm ảnh), còn TV
HDTV hiện hành có thể chia ra 1.920 cột và 1.080 dòng quét, tương
ứng với độ phân giải 1.920 x 1.080 pixel (hơn 2 triệu điểm ảnh) thì
một màn hình UHDTV có thể chia ra 3.840 cột và 2.160 dòng quét (với
UHD 4K) và 7.680 cột và 4.320 dòng quét (với UHD 8K) tương ứng với
độ phân giải 3.840 x 2.160 pixels (với UHD 4K khoảng 8 triệu điểm
ảnh) và 7.680 x 4320 pixels (với UHD 8K khoảng 33 triệu điểm ảnh)
trong Rec ITU-R BT.1769.
Như vậy, lượng điểm ảnh hiển thị được trên màn hình UHDTV nhiều
hơn gấp 40(80) lần so với TV thường và gấp 4(8) lần so với TV HDTV.
Điều đó đồng nghĩa UHDTV có thể hiển thị rất nhiều chi tiết hơn. Khác
biệt lớn thứ hai giữa UHDTV và TV thường nằm ở số cổng vào tín hiệu
ở mặt sau TV. Do phải hiển thị nhiều điểm ảnh hơn, nên một chiếc
UHDTV cần tới 3 dây cáp hình : một dây để truyền tải các hình ảnh
màu đỏ (R), một dây cho màu xanh lá (G) và một dây cho màu xanh
lam (B).
Khác biệt lớn cuối cùng là một số loại UHDTV cần có một đầu thu và
giải mã tín hiệu độ phân giải siêu nét (UHDTV receiver) thì mới có thể
bắt sóng truyền hình HD trực tiếp từ đài phát.
1.3.
Lợi ích của độ phân giải UHDTV
Trước hết, hình ảnh sẽ sắc nét và rõ ràng hơn, các pixel trên màn hình
sẽ nhỏ lại và chúng ta sẽ được hiệu ứng tương tự như trên các điện
thoại Full - HD hoặc “Retina” hiện nay. Chữ và chi tiết ảnh sẽ được
hiển thị tốt hơn, trải nghiệm xem thích thú hơn. Điều này quan trọng
bởi vì hiện nay các TV càng ngày càng lớn hơn, chúng ta thậm chí đã
có những chiếc TV gia đình với đường chéo màn hình lên đến 84 – 85
inch.
Tuy nhiên, cũng cần phải nói thêm rằng khả năng nhận biết các điểm
ảnh của mắt người còn phụ thuộc nhiều vào khoảng cách đến màn
hình. UHD chỉ thật sự có lợi ở vùng màu xanh lá cây, tức là chúng ta sẽ
cần những chiếc TV lớn 50 – 140 inch và khoảng cách xem từ 1,5m
đến xấp xỉ 5m. Mảng màu xanh càng lớn thì lơi ích càng nhiều. Chỉ khi
nào đạt được yêu cầu này thì trải nghiệm 4K(8K) của chúng ta mới
thật sự tốt.
Tỷ lệ kích thước màn hình và khoảng cách xem
Ngoài ra, nội dung 3D cũng được hưởng lợi rất nhiều khi sử dụng độ
phân giải 4K. Hiện tại, những TV 3D hay máy chiếu sử dụng kính phân
cực thụ động sẽ cắt hình ảnh Full - HD ra làm hai tương ứng với hai
mắt của chúng ta để có thể tạo hiệu ứng nổi. Chính vì thế, chúng ta chỉ
nhận được hình ảnh với độ phân giải 960 x 540 (một nửa mỗi chiều
của 1920 x 1080) mà thôi, và tất nhiên là ảnh sẽ không thể đẹp như
lúc xem 2D rồi. Còn khi áp dụng 4K, hình ảnh 3D xem qua kính thụ
động sẽ được chia thành hai ảnh Full - HD 1080p cho mỗi mắt (tức
một nửa 4K), tuyệt vời hơn là điều đương nhiên rồi.
Đối với các nhà sản xuất thiết bị, những màn hình 4K thì sẽ dễ sản
xuất hơn là áp dụng một công nghệ mới hoàn toàn như OLED, trong
khi họ vẫn có thể tiếp thị được nó ra thị trường như một chuẩn nội
dung mới hơn, xịn hơn. Như các bạn đã thấy, con số 4K cao hơn những
con số khác, và do đó nó dễ dàng được người tiêu dùng cho là “tốt
hơn”.
Chắc chắn rằng khi hỏi độ phân giải 3840 x 2160 với 1920 x 1080 cái
nào tốt hơn, nhiều người sẽ trả lời ngay rằng 4K tốt vì nó có nhiều
điểm ảnh hơn. Nhân viên bán hàng chắc chắn cũng sẽ tận dụng điểm
này để giới thiệu sản phẩm đến bạn. Tuy nhiên, lại một lần nữa 4K tốt
hơn hay không còn phụ thuộc vào nhiều yếu tố, như vấn đề khoảng
cách mà chúng ta đã thảo luận ở trên. Hiện nay cũng có những người
tiêu dùng phổ thông nói rằng “Tôi chẳng biết Full–HD là gì, nhưng mà
tôi muốn có nó”. Điều tương tự nhiều khả năng cũng sẽ diễn ra với 4K
Ultra HD.
CHƯƠNG II
KHÁI QUÁT VỀ NÉN VIDEO VÀ CHUẨN NÉN MPEG
2.1. Mục đích nén tín hiệu video
Tín hiệu video sau khi được số hoá 8 bit có tốc độ 216 Mb/s. Để có
thể truyền trong một kênh truyền hình thông thường, tín hiệu video số
cần phải được nén trong khi vẫn phải đảm bảo chất lượng hình ảnh .
Nén video trong những năm 1950 được thực hiện bằng công nghệ
tương tự với tỷ số nén thấp. Ngày nay công nghệ nén đã đạt được
những thành tựu cao hơn bằng việc chuyển đổi tín hiệu video từ
tương tự sang số. Công nghệ nén số (Digital Compressed) đòi hỏi năng
lực tính toán nhanh. Song ngày nay với sự phát triển của côngnghệ
thông tin, điều này không còn trở ngại. Như chúng ta biết tín hiệu
video có dải phổ từ 0 - 6 MHz, tuy nhiên trong nhiều trườnghợp năng
lượng phổ chủ yếu tập trung ở miền tần số thấp và chỉ có rất ít thông
tin chứa đựngở miền tần số cao.Đối với tín hiệu video số, số lượng bit
được sử dụng để truyền tải thông tin đối vớimỗi miền tần số khác
nhau, có nghĩa là: miền tần số thấp, nơi chứa đựng nhiều thông
tin,được sử dụng số lượng bít lớn hơn và miền tần số cao, nơi chứa
đựng ít thông tin, được sử dụng số lượng bít ít hơn. Tổng số bít cần
thiết để truyền tải thông tin về hình ảnh sẽ giảm một cách đáng kể và
dòng dữ liệu được “nén” mà chất lượng hình ảnh vẫn đảm bảo.Thực
chất của kỹ thuật “nén video số” là loại bỏ đi các thông tin dư thừa.
Các thông tin dư thừa trong nén video số thường là:
+ Độ dư thừa không gian giữa các pixel;
+ Độ dư thừa thời gian do các ảnh liên tiếp nhau;
+ Độ dư thừa do các thành phần màu biểu diễn từng pixel có độ
tương quancao;
+ Độ dư thừa thống kê do các kí hiệu xuất hiện trong dòng bít với xác
suất xuất hiệnkhông đều nhau;
+ Độ dư thừa tâm lý thị giác (các thông tin nằm ngoài khả năng cảm
nhận của mắt).vv…
Như vậy, mục đích của nén tín hiệu video là :
- Giảm tốc độ dòng bít của tín hiệu gốc xuống một giá trị nhất định
đủ để cóthể tái tạo ảnh khi giải nén;
- Giảm dung lượng dữ liệu trong lưu trữ cũng như giảm băng
thông cần thiết;
- Tiết kiệm chi phí trong lưu trữ và truyền dẫn dữ liệu trong khi vẫn
duy trìchất lượng ảnh ở mức chấp nhận đựơc.Với nguyên nhân và
mục đích của việc nén tín hiệu được trình bày như ở trên, ngàynay có
nhiều các chuẩn nén đã ra đời như: JPEG, M-JPEG, MPEG, DV… Trong
đó chuẩn nén MPEG được sử dụng nhiều trong nén video trong truyền
hình với thành công của chuẩnnén video MPEG-2 trong truyền hình số
và chuẩn nén MPEG-4 trong truyền hình trên mạng Internet.
2.2. Chuẩn nén MPEG
2.2.1. Khái quát về nén MPEG
- MPEG (Moving Picture Expert Group) là nhóm chuyên gia về
hình ảnh, được thành lập từ tháng 2 năm 1988 với nhiệm vụ xây dựng
tiêu chuẩn cho tín hiệuAudio và Video số. Ngày nay, MPEG đã trở
thành một kỹ thuật nén Audio và Video phổ biến nhất vì nó không chỉ
là một tiêu chuẩn riêng biệt mà tuỳ thuộc vào yêu cầu cụ thể của từng
thiết bị sẽ có một tiêu chuẩn thích hợp nhưng vẫn trên cùng một
nguyên lý thống nhất.
- Tiêu chuẩn đầu tiên được nhóm MPEG đưa ra là MPEG-1, mục tiêu
của MPEG-1là mã hoá tín hiệu Audio-Video với tốc độ khoảng 1.5Mb/s
và lưu trữ trong đĩa CD với chất lượng tương đương VHS.
- Tiêu chuẩn thứ 2 : MPEG-2 được ra đời vào năm 1990, không như
MPEG-1 chỉnhằm lưu trữ hình ảnh động vào đĩa với dung lượng bit
thấp. MPEG-2 với “công cụ ” mã hoá khác nhau đã được phát triển.
Các công cụ đó gọi là “Profiles” đượctiêu chuẩn hoá và có thể sử dụng
để phục vụ nhiều mục đích khác nhau.
- Tiêu chuẩn tiếp theo mà MPEG đưa ra là MPEG-4, được đưa ra vào
tháng 10 năm 1998, đã tạo ra một phương thức thiết lập và tương tác
mới với truyền thông nghe nhìn trên mạng Internet, tạo ra một
phương thức sản xuất, cung cấp và tiêu thụ mới các nội
dung video trên cơ sơ nội dung và hướng đối tượng (content/objectbased).
- MPEG-7: là một chuẩn dùng để mô tả các nội dung Multimedia, chứ
không phải là một chuẩn cho nén và mã hoá audio/ảnh động như
MPEG- 1, MPEG-2 hay MPEG-4. MPEG-7 sử dụng ngôn ngữ đánh dấu
mở rộng XML(Extansible Markup Language) để lưu trữ các siêu dữ
liệu Metadata, đính kèm timecode để gắn thẻ cho các sự kiện, hay
đồng bộ các dữ liệu. MPEG-7 bao gồm 3 bộ chuẩn sau:
+ Bộ các sơ đồ đặc tả (Description Schemes) và các đặc tả
(Description).
+ Ngôn ngữ xác định DDL (Description Definition Language) để định
nghĩa các sơ đồ đặc tả.
+ Sơ đồ mã hoá quá trình đặc tả.
Việc kết hợp MPEG-4 và MPEG-7 sẽ tạo ra các giải pháp lý tưởng cho
các dịch vụ Streaming Media, các hệ thống lưu trữ và sản xuất
Streaming Media trong thời gian tới
2.3. Các chuẩn nén MPEG.
2.3.1 Chuẩn nén MPEG-1
MPEG -1 được hình thành và năm 1988, là tiêu chuẩn của nhóm
chuyên gia về hình ảnh MPEG ở trong giai đoạn đầu tiên (tương ứng
với tiêu chuẩn ISO/IEC 11172 của ITU).Mục đích của MPEG -1 là
nghiên cứu một tiêu chuẩn mã hoá video và âm thanh kèm theo trong
các môi trường lưu trữ như: CD-ROM, đĩa quang … Tốc độ mã hoá
trong khoảng 1.5Mb/s.
Chuẩn nén MPEG -1 bao gồm 4 phần :
- Các hệ thống: ISO/IEC 11172 -1
- Video: ISO/IEC 11172 -2
- Audio: ISO/IEC 11172 -3
- Hệ thống kiểm tra: ISO/IEC 11172 -4
Trong các phần trên ta nghiên cứu một vài thông số trong phần Video
(ISO/IEC 11172-2).
2.3.2 Chuẩn nén MPEG-2
Chuẩn nén MPEG -2 là chuẩn nén phát triển tiếp sau MPEG -1, có kế
thừa tất cả các tiêu chuẩn của MPEG -1 và mục đích là nhằm hỗ trợ
việc truyền video số, tốc độ bít lớn hơn 4 Mb/s, bao gồm các ứng dụng
DSM (phương tiện lưu trữ số), Các hệ thống truyền hình hiện tại
(NTSC, PAL, SECAM), cáp, thu lượm tin tức điện tử, truyền hình trực
tiếp từ vệ tinh, truyền hình mở rộng (EDTV), truyền hình độ phân
giảicao (HDTV)…
Chuẩn MPEG -2 bao gồm 4 phần chính:
-Các hệ thống: ISO/IEC 13818 -1.
-Video: ISO/IEC 13818 -2
-Audio: ISO/IEC 13818 -3
-Các hệ thống kiểm tra: ISO/IEC 13818 -4.
2.3.3 Chuẩn nén MPEG-4
Ngày nay, khi nhu cầu truyền phát các ứng dụng video và đa
phương tiện mới trên hạ tầng kỹ thuật Internet đã làm nảy sinh các
yêu cầu chức năng mới không có trong các chuẩn nén MPEG -1 và
MPEG -2 hay các chuẩn nén trước đó. Tháng 10 năm 1998 với sự xuất
hiện của chuẩn nén MPEG -4 đã tạo ra một phương thức thiếtlập và
tương tác mới với truyền thông nghe nhìn trên mạng Internet, tạo ra
một phương thức sản xuất, cung cấp và tiêu thụ mới các nội dung
video trên cơ sở nội dung và
hướng đối tượng (content/object-based). Đây chính là một công nghệ
trình diễn truyền thông đa phương tiện phức hợp, có khả năng truyền
thông tại các môi trường truyền thông đa phương tiện phức hợp, có
khả năng truyền thông tại các môi trường : truyền hình số, đồ hoạ
tương tác, World Wide Web. Vì vậy, nhiệm vụ của MPEG -4 là nhằm
phát triển các chuẩn xử lý, mã hoá và hiển thị ảnh động, audio và các
tổ hợp của
chúng.MPEG -4 đang được triển khai bởi nhiều nhà vận hành mạng và
dịch vụ trên thếgiới với các dịch vụ mới đang được bổ xung để chiếm
các lợi thế cấu trúc hạ tầng băng rộng đang phát triển.
2.3.4 Tiêu chuẩn MPEG-7
MPEG (ISO/IEC SC29/WG11) cho ra đời một tiêu chuẩn mới là
MPEG-7 với mục đích để mô tả các nội dung Multimedia, chứ nó không
phải là chuẩn nén và mã hoá audio,video, ảnh động như các chuẩn
nén đã ra đời trước đó.
CHƯƠNG III
CÔNG NGHỆ NÉN ẢNH H.264/MPEG - 4 AVC
3.1. GIỚI THIỆU CHUNG
Kể từ khi mới xuất hiện vào đầu những năm 90, chuẩn nén video
MPEG-2 đã hoàn toàn thống lĩnh thế giới truyền thông. Cũng trong
thập kỷ này, chuẩn nén MPEG-2 đã được cải tiến về nhiều mặt. Giờ đây
nó có tốc độ bit thấp hơn và việc ứng dụng nó được mở rộng hơn nhờ
có các kỹ thuật như đoán chuyển động, tiền xử lý, xử lý đối ngẫu và
phân bổ tốc độ bit tùy theo tình huống thông qua ghép kênh thống kê.
Tuy nhiên, chuẩn nén MPEG-2 cũng không thể được phát triển một
cách vô hạn định. Thực tế hiện nay cho thấy chuẩn nén này đã đạt đến
hết giới hạn ứng dụng của mình trong lĩnh vực truyền truyền hình từ
sản xuất tiền kỳ đến hậu kỳ và lưu trữ Video số. Bên cạnh đó, nhu cầu
nén Video lại đang ngày một tăng cao kèm theo sự phát triển mạnh
mẽ của mạng IP mà tiêu biểu là mạng Internet. Chuẩn video MPEG-2
bị hạn chế bởi hai yếu tố trong định nghĩa ban đầu (original
definition) của nó:
• Tốc độ bit nhắm tới của video được nén là khoảng 2–15 Mb/s (đối
với main profile ở mail level). Tiêu chuẩn này không chứa giới hạn tốc
độ bit thấp hơn bất kỳ vì điều này không được yêu cầu trong định
nghĩa của bộ mã hóa tương thích. Hiển nhiên MPEG-2 cũng không
hiệu quả với tốc độ bit thấp hơn.
• Silicon cho thực hiện MPEG-2 đã bị giới hạn đến trình độ công nghệ
của những ngày đó. Điều này có nghĩa là trong năm 1994 ASIC
(application Specific Integrated Circuit) được sử dụng trong thiết kế
bộ giải mã với mật độ 120.000 gate/chip với kích thước gate 0.5 - 1 m.
Trong khi đó công nghệ tiên tiến ngày nay đã đạt 25.000.000
gate/ASIC với kích thước gate nhỏ hơn 0.1 m.
Như vậy các kỹ thuật dựa trên MPEG-2 đã bị hạn chế trong việc thực
hiện thực tế trong công nghệ ngày hôm nay. Nhiều tiêu chuẩn mã hóa
mới đã và đang nghiên cứu để khắc phục các nhược điểm của MPEG-2.
Trong đó H.264/AVC, dự án tiêu chuẩn mã hóa video của nhóm chuyên
gia mã hóa video của tổ chức ITU (ITU – T Video Coding Experts Group
– VCEG) và nhóm chuyên gia ảnh động ISO/IEC (ISO/IEC Moving
Picture Experts Group) là nổi bật hơn cả. Cái tên H.264/AVC chính là
sự kết hợp tiêu chuẩn nghiên cứu riêng của từng nhóm: nhóm ITU là
H.264, nhóm MPEG là AVC (Advanced Video Compression) tức MPEG-4
part 10. Các mục đích chính của việc nỗ lực tiêu chuẩn hóa này là phát
triển một tiêu chuẩn mã hóa video đơn giản, với chỉ tiêu kỹ thuật nén
tăng cường, và để có thể trình diễn video “thân thiện mạng” (network
– friendly), nhắm tới các ứng dụng “hội thoại” (video telephone) và
“không hội thoại” (lưu trữ, quảng bá hoặc streaming). H.264/AVC đã
thực hiện sự cải thiện đáng kể trong hiệu quả giảm tỷ lệ bit và méo ở
tốc độ bit đó, cung cấp (một cách gần đúng) hệ số tiết kiệm tốc độ bit
khoảng hai lần so với các tiêu chuẩn đang tồn tại như MPEG-2 video
3.2. CÁC PHIÊN BẢN H.26X
Theo ITU-T, các tiêu chuẩn mã hoá Video được coi là các khuyến
nghị gọi tắt là chuẩn H.26x (H.261, H.262, H.263 và H.264). Với tiêu
chuẩn ISO/IEC, chúng được gọi là MPEG-x (như MPEG-1, MPEG-2 và
MPEG-4).
3.2.1. H.261
Mục đích:
- H.261 được phát triển cho dịch vụ truyền hình hội nghị video phone
qua ISDN ở tốc độ thấp 64kbps (p= 1..30)
- Truyền hình hội nghị theo yêu cầu với chất lượng ảnh cao hơn, p ≥ 6,
tốc độ ≥ 384 kbps. - Là cơ sở của chuẩn sau này như MPEG 1,2
- Các đặc tính:
+ Trễ mã hóa < Truyền hình hội nghị song công, gây ấn
tượng◊150ms, tốt cho khán giả. Mở rộng thị trường
+ Thực hiện trên linh kiện VLSI (giá thành thấp) các dịch vụ video
phone, truyền hình hội nghị.
Các dạng ảnh đầu vào:
- Khả năng phối hợp giữa các chuẩn 625 và 525 dòng của TV, H.261 sử
dụng dạng thức trung gian chung CIF ( Common Intermediate
Format) với các tốc độ bit thấp hơn. H.261 sử dụng dạng có tốc độ nhỏ
hơn ¼ là QCIF (Quadrature).
- Với tốc độ 30 khung hình/s thì tốc độ dữ liệu của CIF là 37,3Mbps,
QCIF là 9,35 Mbps. Tốc độ càng thấp thì càng giảm số khung hình/s.
3.2.2 . H.263
Mục đích:
- Tiêu chuẩn cải tiến H.261 cho video tốc độ thấp, có thể truyền trên
mạng điện thoại công cộng PSTN, được công nhận năm 1996.
- Giống như H.261, mã hóa DCT cho các MB trong I Frame và DCT sai
biệt dự đoán trong P Frame.
- Tốc độ tối thiểu.
Ưu điểm:
- Chính xác sai biệt dự đoán tới ½ pixels
- Không hạn chế vector chuyển động.
- Mã hóa số học theo cú pháp.
- Dự đoán thuận lợi với các khung P
- Ngoài CIF, QCIF, H.263 còn hỗ trợ SQCIF, 4 CIF và 16 CIF với độ phân
giải tín hiệu chói tuần tự là 128x96, 704x576, 704x576, 1408x1152.
Độ phân giải tín hiệu sắc bằng ¼ tín hiệu chói.
3.2.3. MÃ HÓA H.264
3.2.3.1.Sơ đồ khối mã hóa H.264:
Mã hóa H.264
Trong đó:
- Fn (current): Ảnh hiện tại
- F’n-1(reference): Ảnh tham chiếu của 1 hoặc 2 khung hình được mã
hóa trước đó.
- F’n(reconstoncted): Ảnh khôi phục
- Intra prediction: Dự đoán trong ảnh
- Choose Intra Prediction: Chọn dự đoán trong ảnh
- Deblocking filter: Bộ lọc tách khối
- T, Q và T-1 , Q-1 : mã hóa separable integer transform-biến đổi
nguyên tách biệt , lượng tử hóa và giải mã T , giải lượng tử hóa tương
ứng.
- Dn, D’n: Phần ảnh sai khác vào mã hóa và ra từ giải mã
- Reorder: Sắp xếp lại - Entropy encode: Mã hóa entropy - MC(Motion
Compensation): Bù chuyển động.
- ME(Motion estimation): Đánh giá chuyển động
Định dạng mã hóa dữ liệu:
Thiết kế H. 264/ AVC hỗ trợ mã hóa video (trong định dạng 4:2:0) có
chứa các frame liên tục hoặc xen kẽ, hoặc có thể được trộn với nhau
trong cùng một dãy. Nhìn chung một frame video chứa hai field đan
xen, được cách ly về mặt thời gian bởi một chu kỳ field (nửa thời gian
của chu kỳ frame), có thể được mã hóa riêng biệt như hai ảnh field,
hoặc cùng với nhau như một ảnh frame. Một frame liên tục phải luôn
luôn được mã hóa như một ảnh frame đơn; tuy nhiên nó vẫn được
xem như gồm hai field ở cùng một thời điểm
3.2.3.2.Lớp trừu tượng mạng (NAL – Network Abstaction Layer)
Lớp trừu tượng mạng (NAL) được xác định để định dạng dữ liệu
này và cung cấp thông tin header trong cách thích hợp cho việc
chuyên chở bởi các lớp truyền tải hoặc môi trường lưu trữ. Tất cả dữ
liệu được chứa trong các khối NAL, mỗi khối chứa một số nguyên byte.
Một khối NAL xác định định dạng chung cho việc sử dụng trong cả hệ
thống định hướng gói (packet – oriented) và hệ thống định hướng
dòng bit (bitstream). Định dạng của các khối NAL là đồng nhất cho cả
việc phân phối dòng truyền tải định hướng gói và định hướng dòng
bit, ngoại trừ rằng mỗi khối NAL trong lớp truyền tải định hướng
dòng bit có thể có một tiền tố mã hóa khởi hành ở trước.
3.2.3.3. Lớp mã hóa video (Video Coding Layer)
Lớp mã hóa video (VCL-Video Coding Layer), được định rõ để biểu
diễn hiệu quả nội dung của dữ liệu video.Lớp mã hóa video của
H.264/AVC thì tương tự với các tiêu chuẩn khác như MPEG-2 video.
Nó là sự kết hợp dự đoán theo thời gian và theo không gian, và với mã
chuyển vị. Ảnh được tách thành các khối. Anh đầu tiên của dãy hoặc
điểm truy nhập ngẫu nhiên thì được mã hóa (trong khối) “Intra”, có
nghĩa là không dùng thông tin nào ngoài thông tin chứa trong bản
thân ảnh. Mỗi mẫu của một khối trong một frame Intra được dự đoán
nhờ dùng các mẫu không gian bên cạnh của các khối đã mã hóa trước
đó. Đối với tất cả các ảnh còn lại của dãy hoặc giữa các điểm truy cập
ngẫu nhiên, mã hóa “Inter” được sử dụng, dùng dự đoán bù chuyển
động từ các ảnh được mã hóa trước.
3.3. Kỹ thuật nén trong ảnh
3.3.1. Sơ đồ mã hóa trong ảnh
Intra Frame
Ảnh I thực hiện quá trình mã hóa trong ảnh cũng
tương tự mã hóa MPEG-2, nhưng cũng có những điểm khác như trình
bày ở các phần sau.
Mã hóa trong ảnh H.264
Trong đó:
F’n(reconstoncted): Ảnh khôi phục sẽ được lưu trong Memory để tìm
vector chuyển động cho Frame P tiếp theo.
3.3.2 Chọn macroblock và thứ tự trong công đoạn nén:
Chuẩn nén MPEG-4 AVC có hai cải tiến mới trong lĩnh vực nén
không
gian.
Trước hết, bộ lập mã này có thể tiến hành nén không gian tại các
macroblock 16x16 điểm ảnh thay vì các block 8x8 như trước đây. Điều
này giúp tăng cường đáng kể khả năng nén không gian đối với các hình
ảnh có chứa nhiều khoảng lớn các điểm ảnh giống nhau.
Thứ hai là thao tác nén được tiến hành trong miền không gian trước khi
công đoạn DCT diễn ra. Chuẩn nén MPEG-4 AVC so sánh macroblock
hiện thời với các macroblock kế bên trong cùng một khung, tính toán độ
chênh lệch, và sau đó sẽ chỉ gửi đoạn chênh lệch tới DCT. Hoặc là nó có
thể chia nhỏ macroblock 16x16 điểm ảnh thành các khối 4x4 nhỏ hơn và
so sánh từng khối này với các khối kế bên trong cùng một macroblock.
Điều này giúp cải thiện khả năng nén ảnh chi tiết.
3.3.3. Chuyển vị, co dãn và lượng tử hóa:
Tương tự với các tiêu chuẩn mã hóa video trước đó, H.264/AVC
cũng dùng mã chuyển vị cho dự đoán tiếp theo. Tuy nhiên trong
H.264/AVC việc chuyển vị được áp dụng cho các khối 4 x 4, và thay cho
biến đổi cosin rời rạc
(DCT) 4 x4
a/ Biến đổi nguyên tách biệt (separable integer transform)
được sử dụng, với các tính chất giống như 4 x 4 DCT về cơ bản. Vì
biến đổi ngược được xác định bởi các thuật toán nguyên chính xác nên
tránh được sự không thích nghi của biến đổi ngược. Một biến đổi 2 x 2
bổ sung được áp dụng cho bốn hệ số DC của mỗi thành phần chroma.
Nếu một macroblock được mã hóa trong mode Intra - 16 x 16, thì một
biến đổi 4 x 4 tương tự được thực hiện cho các hệ số DC 4 x 4 của tín
hiệu luma.
Ví dụ: Đầu vào là khối luma 4x4. Thực hiện biến đổi T
Đầu vào X Ra chuyển đổi W
b/ Lượng tử hóa các hệ số biến đổi
Để lượng tử hóa các hệ số biến đổi, H.264/AVC dùng lượng tử hóa
vô hướng. Một trong số 52 bộ lượng tử hóa được chọn cho mỗi
macroblock bởi tham số lượng tử hóa QP (Quantization Parameter).
Lượng tử hóa thay đổi theo khoảng cách để đạt được hiệu quả
nén cao theobiểu thức sau
Z = W round [ PF/ Qstep ]
Sau lượng tử là Z
Quét zic-zăc
Các bộ lượng tử hóa được sắp xếp sao cho có sự tăng khoảng 12.5%
trong kích thước bước lượng tử hóa khi QP tăng một đơn vị.
c/ Quét zic-zăc
Quét zic-zac bắt đầu từ hệ số DC nhằm ánh xạ ma trận 4x4 thành
vector 1x 16, đáy vector là giá trị EOB (End of Block). Nhóm các thành
phần tần số thấp vào đỉnh vector.
3.3.4. Sắp xếp lại:
Sắp xếp lại khối 1x 16 sau quét zic- zac ở trên. Thành phần DC ở đỉnh
vector 1x16, tiếp đến theo thứ tự lần lượt là 15 thành phần còn lại AC.
3.3.5.Mã hóa Entropy:
Trong H.264/AVC, hai phương pháp mã hóa entropy được hỗ trợ :
- Phương pháp mã hóa entropy mặc định (default) sử dụng một tập từ
mã mở rộng vô hạn đơn cho tất cả phần tử cấu trúc, ngoại trừ các hệ
số biến đổi được lượng tử hóa. Như vậy, thay cho việc một thiết kế
bảng VCL khác nhau cho mỗi phần tử cấu trúc, chỉ có một ánh xạ cho
một bảng từ mã đơn được thực
hiện theo thống kê dữ liệu. Bảng từ mã đơn được chọn là mã expGolomb với các tính chất giải mã rất đơn giản và hài hòa.
- Để truyền các hệ số biến đổi được lượng tử hóa, một phương pháp
tinh tế hơn gọi là mã độ dài biến đổi thích nghi hoàn cảnh CAVLC
(Context – Adaptive Variable Length Coding) được sử dụng.
Mã độ dài biển đổi thích nghi hoàn cảnh
Trong sơ đồ này, các bảng VLC được chuyển mạch tốt cho các phần tử
cấu trúc khác nhau, phụ thuộc vào phần tử cấu trúc đã được truyền.
Vì các bảng VLC được thiết kế tốt để thích nghi các thống kê có điều
kiện tương ứng, chỉ tiêu kỹ thuật mã hóa entropy được cải thiện so với
các sơ đồ dùng một bảng VLC đơn.
- Hiệu quả của mã hóa entropy có thể được cải thiện hơn nữa nếu mã
hóa số học nhị phân thích nghi hoàn cảnh CABAC (Context – Adaptive
Binary Arithmetic Coding) được sử dụng. Một mặt, việc dùng mã hóa
số học cho phép ấn định một số không nguyên vẹn (non – integer) các
bit cho mỗi symbol của bảng chữ cái và điều này là cực kỳ có ích đối
với các xác suất symbol lớn hơn 0.5. Mặt khác, việc dùng mã thích nghi
cho phép thích nghi với các thống kê symbol không tĩnh. Một tính chất
quan trọng khác của CABAC là mô hình hóa hoàn cảnh của nó. Tính
thống kê của các phần tử cấu trúc đã được mã hóa thì được sử dụng
để đánh giá các xác suất điều kiện. Các xác suất điều kiện này được sử
dụng để chuyển mạch hàng loạt model xác suất đã được đánh giá.
Trong H.264/AVC, engine cốt lõi mã hóa số học và đánh giá xác suất
kèm theo nó được xác định như các phương pháp ít phức tạp, không
dùng phép nhân mà chỉ dùng các phép dịch chuyển (shift) và các bảng
look – up. So sánh với CAVLC, CABAC thường cho giảm tốc độ bit
khoảng 10 – 15% khi mã hóa tín hiệu truyền hình có cùng chất lượng.
CHƯƠNG IV
KỸ THUẬT NÉN H.265/HEVC
4.1. Sự ra đời của chuẩn nén mới HEVC
Việc nâng cao độ phân giải trong Frame của hệ thống 2K, 4K Tv, đòi
hỏi quá trình đồng bộ hóa về việc nâng cao tốc độ số khung hình được
sử dụng trong 1s và số lượng bit được sử dụng để mã hóa các Pixels
tạo nên độ sâu mức tín hiệu. Nếu như ở hệ thống SD, HD hiện tại tốc
độ 24 hình/s cho tốc độ Frame và 8 bít cho mỗi Pixel là hoàn toàn phù
hợp thì với tín hiệu chuẩn 2K, 4K các thông số này trở nên không còn
tương thích. Trong các bài test với độ phân giải 4K hình ảnh hiển thị ở
những vùng có sự chuyển động trên màn hình đặc biệt là trong các
chương trình thể thao không còn được rõ nét với tốc độ 24 Frames/s.
Các hãng chuyên cung cấp giải pháp và thiết bị truyền hình như
Harmonic, Miranda đã khuyến cáo tốc độ Frame tối thiểu sử dụng cho
tín hiệu truyền hình độ phân giải siêu cao nên là 50, 60 Frames/s, lý
tưởng để thu được các hình ảnh mượt trong các khung hình chuyển
động là 120 Frames/s.
Một thông số các cần được tương thích khi nâng cao số lượng điểm
ảnh trong khung hình và số lượng khung hình được sử dụng trong 1s
là độ số lượng bit dùng để mã hóa các điểm ảnh hay có thể được coi là
độ sâu điểm ảnh. Thay vì việc sử dụng 8 bít để mã hóa các tín hiệu
truyền hình như trong các hệ thống SD, HD thông thường, các hệ
thống truyền hình 2K, 4K cần 10 bit mã hóa để đảm bảo thu được chất
lượng tương thích với tốc độ Frame và độ phân giải. Việc nâng cao các
tham số trên giúp cải thiện rõ rệt chất lượng của chương trình truyền
hình song luôn đi kèm với sự ra tăng của tốc độ luồng bit. Đây chính là
thách thức chủ yếu và lớn nhất trong việc áp dụng hệ thống truyền
hình độ nét siêu cao. Bảng dưới đây tóm tắt tốc độ luồng bit tương
ứng với các tham số khác nhau của hệ thống 4K-TV (3840 x 2160)
tương ứng với tỷ lệ điểm chói-màu 4:2:2
Chương trình
Bít dùng cho
điểm ảnh
Tốc độ khung
hình/s
Tốc độ luồng dữ
liệu
Chương trình
10
60
9,95 Gbps
sản xuất
Chương trình
thể thao
10
120
19,91 Gbps
Qua bảng trên chúng ta nhận thấy yếu tố tốc độ luồng dữ liệu quá cao
chính là rào cản cho việc truyền dẫn các tín hiệu chương trình Ultra
High Definition TV. Các chuẩn nén đang được sử dụng hiện thời như
MPEG2, H.264 không đủ mạnh để chuyển đổi tốc độ của các chương
trình UHDTV về tốc độ của các hệ thống truyền dẫn hiện tại. Chuẩn
nén mới HEVC (High Efficiency Video Encoding) ra mắt với việc áp
dụng các thuật toán nén mới sẽ giúp giải quyết bài toán này.
Bằng việc áp dụng các kỹ thuật mới đặc biệt là nâng cao các hướng dò
tìm trong thuật toán vector chuyển động trong cùng một Frame và
giữa các Frames liên tiếp. Chuẩn HEVC giúp giảm tốc độ luồng bit
được mã hóa xuống còn 25% so với chuẩn MPEG2 và 50% so với
H.264. Áp dụng HEVC vào tín hiệu Ultra TV thu được tốc độ luồng bít
đẩu ra là14 Mbps. Tốc độ này đang từng bước được tối ưu, cùng với
sự mở rộng băng thông của các môi trường truyền dẫn sẽ giúp hiện
thực hóa việc truyền tải luồng bít của tín hiệu có độ siêu phân giải
trong tương lai gần.
Ngày 25 tháng 1 năm 2013, ITU đã chính thức công bố chuẩn mã hóa
H.265 cho video và trong hai năm qua đã có rất nhiều các nhà sản
xuất đưa H.265 vào trong các sản phẩm thương mại ra thị trường. Về
mặt lý thuyết H.265/HEVC được đánh giá là hiệu quả hơn H.264/AVC
khoảng 30-50% (độ phân giải càng cao, hiệu suất nén càng cao)
nhưng nó có thực sự đơn giản?
Trong bài viết này chúng tôi giả định rằng bạn đã biết đến một số khái
niệm được sử dụng trong các chuẩn mã hóa video hiện nay như
H.264/AVC. HEVC sử dụng lại rất nhiều các khái niệm được định nghĩa
trong H.264. Cả hai chuẩn mã hóa này đều dựa trên các kỹ thuật mã
hóa video:
1. Phân vùng hình ảnh bằng các macroblock và sau đó lại phân vùng
tiếp trong các khối này.
2. Giảm không gian dư thừa bằng cách sử dụng các kỹ thuật nén trong
khung hình nội bộ.
3. Giảm sự dư thừa thời gian bằng sử dụng kỹ thuật nén liên khung
(dự đoán chuyển động và bù đắp chuyển động).
4. Nén các dữ liệu dư thừa sử dụng các biến đổi toán học và lượng tử
hóa.
5. Giảm dư thừa trong truyền vector chuyển động và tín hiệu sử dụng
mã hóa entropy.
Entropy thông tin là một khái niệm mở rộng của entropy trong nhiệt
động lực học và cơ học thống kê sang lĩnh vực lý thuyết thông tin.
Entropy thông tin mô tả mức độ hỗn loạn trong một tín hiệu lấy từ
một sự kiện ngẫu nhiên. Nói cách khác, entropy cũng chỉ ra có bao
nhiêu thông tin trong tín hiệu, với thông tin là các phần không hỗn
loạn ngẫu nhiên của tín hiệu.
Ý tưởng kỹ thuật sử dụng trong mã hóa video H.265, H.264
Workflow các hệ thống mã hóa video
Quá trình cơ bản để mã hóa video cho AVC và HEVC như hình trên.
Video đầu vào được chia ra thành các khối n x n pixel và được mã hóa
trong các đơn vị khối này. Các khối đầu vào được mã hóa thành bit
stream (dãy tín hiệu nhị phân bao gồm 0 và 1) thông qua các quá
trình bao gồm dự đoán và trực giao biến đổi.
Dự đoán là kỹ thuật cốt lõi trong mã hóa video. Trong quá trình mã
hóa khung hình tại thời điểm t, nếu khung hình thời điểm t-1 có những
thành phần giống khung hình trước thì chỉ những khác biệt mới được
gửi đi. Khi một đối tượng di chuyển từ bức hình của khung hình đầu
đến khung hình tiếp theo, nó sẽ xác định một vector chuyển động và
vector này được gửi đến bộ mã hóa để sử dụng trong dự đoán vị trí.
Với các đối tượng không chuyển động, ví dụ như đám mây trong hình,
sẽ không cần gửi đi vector chuyển động, đây gọi là dự đoán liên khung
(inter-prediction). Nếu dự đoán được hoàn thành trong 1 khung hình
thì được gọi là dự đoán nội bộ (intra-prediction).
Thay vì các macroblock 16x16 như trong H.264, H.265 phân vùng hình
ảnh thành cây mã hóa (các CTB - ). Kích thước CTB có thể là 64x64,
32x32 hoặc 16x16, các nghiên cứu chỉ ra rằng CTB lớn giúp việc mã
hóa có hiệu quả cao nhưng bên cạnh đó thời gian mã hóa cũng sẽ lớn.
Bạn có thể tưởng tượng bạn có một file text 10GB, nếu chia file này
thành 10 file kích thước 10GB, vậy khi nén 10 file này riêng lẻ thì hiệu
quả nén sẽ không thể bằng nén riêng file 10GB nhưng cũng vì thế mà
thời gian nén file 10GB sẽ lớn hơn tổng thời gian nén 10 file riêng lẻ.
Mỗi CTB có thể được phân chia một cách đệ quy trong một cấu trúc
chia 4 bao gồm các khối nhỏ 32x32, 16x16 hoặc 8x8 gọi là đơn vị mã
hóa vùng CU (xem hình minh họa dưới). CU là đơn vị cơ bản của các
dự đoán trong HEVC, các đơn vị nhỏ được sử dụng trong các khu vực
nhiều chi tiết như biên của một hình trong khi các đơn vị lớn được sử
dụng trong các khu vực nội biên.
Kỹ thuật phân vùng ảnh trong HEVC
4.2 So sánh giữa H.264 và H.265
So sánh tốc độ luồng bít giữa HEVC và MPEG2, AVC~MPEG4
HEVC có tỷ lệ nén dữ liệu gấp đôi so với H.264/MPEG-4 AVC ở cùng
một mức độ chất lượng video. Nói cách khác nó có thể được sử dụng
để cung cấp chất lượng hình ảnh được cải thiện đáng kể tại cùng một
tốc độ bit . Hỗ trợ 8K UHD (Ultra high definition television) và độ phân
giải lên đến 8192x4320 (4320P)
H.265/HEVC cũng mang lại những cải tiến về tiếng ồn, không gian
màu sắc và quan trọng nhất để giám sát một phạm vi hoạt động nâng
cao.
Bảng so sánh các đặc tính kỹ thuật trong H.265 và H.264
Kỹ thuật nén
AVC
HEVC
Đơn vị mã hóa cơ bản
Khối 16x16 MB hoặc 8x8,16x16,32x32,
16x32
64x64
Temporal Prediction
Square,Symmetric
rectangular
Spatial Prediction
9+4 maximum modes 33+2 maximum modes
Transform Size
4x4,8x8,two-stage
16x16
4x4,8x8,16x16,32x32
plusnon-square
versions
Transform Type
DCT
DCT và DST
In-Loop Filtering
Deblocking
Deblocking, SAO
Square, Symmetric and
Asymmetric
rectangular
Entropy
CABAC hoặc CAVLC
CABAC
Bảng so tổng hợp thông số bit rate của H.265 so với H.264
Chuẩn mã hóa
H.265/HEVC
Tỉ lệ bit rate giảm TB so với H.264/MPEG-4 AVC
480p
720p
1080p
4K UHD
52%
56%
62%
64%
Ứng dụng các tiêu chuẩn mới trong hầu hết các camera IP sẽ còn phải
mất còn vài năm nữa. Thông thường, sau khi tiêu chuẩn được phát
triển, phải mất vài năm cho việc sử dụng chúng sau đó mới ứng dụng
vào các thị trường khác nhau, bắt đầu với thị trường dành người tiêu
dùng và sau đó vào an ninh và các thị trường khác nhỏ hơn.
Hiện nay, hầu hết đều sử dụng định dạng mã hóa video hàng đầu là
H.264/MPEG-4, được phát triển vào năm 1999 và chỉ gần đây mới trở
thành một chuẩn trong thị trường an ninh, hơn một thập kỷ sau khi
nó đã được phê duyệt. H.265/HEVC cũng có thể mất vài năm để phổ
biến hơn nữa.
4.3.Các sự kiện xoay quanh chuẩn nén mới H.265/HEVC
Trong năm 2012
- 29/2/2012, tại Đại hội di động thế giới 2012, Qualcomm trình diễn
một bộ giải mã HEVC chạy trên một máy tính bảng Android, với một
Qualcomm Snapdragon xử lý lõi kép S4 tốc độ 1,5 GHz
- 22/8/2012, Ericsson thông báo rằng bộ mã hóa HEVC đầu tiên của
thế giới, Ericsson SVP 5500. Các Ericsson SVP 5500 HEVC mã hóa
được thiết kế để mã hóa thời gian thực của video để giao cho các thiết
bị di động .
- 02/09/2012 Vanguard Software Solutions (VSS) đã công bố phần
mềm mã hóa HEVC chạy ở 1080p30 (1920x1080, 30fps) trên một bộ
xử lý Intel Xeon duy nhất. Bộ mã hóa này đã được chứng minh tại IBC
2012
- 06/9/2012, Tổng công ty Rovi thông báo rằng một Main Concept
SDK cho HEVC sẽ được phát hành vào đầu năm 2013 ngay sau khi
HEVC được chính thức phê chuẩn. Các HEVC MainConcept SDK bao
gồm một bộ giải mã, mã hóa, và đa vận chuyển cho Microsoft
Windows , Mac OS , Linux , iOS , và Android .
- 09/09/2012, ATEME chứng minh tại triển lãm thương mại một bộ
mã hóa HEVC với độ phân giải 3840x2160p ở 60 fps
Trong năm 2013
- 07/01/2013, ViXS System thông báo rằng họ sẽ giới thiệu các phần
cứng SoC có khả năng chuyển mã video tới 10 hồ sơ chính của HEVC
tại CES 2013. Cùng ngày Tổng công ty Rovi thông báo rằng sau khi
tiêu chuẩn HEVC được phát hành rằng họ có kế hoạch hỗ trợ thêm cho
HEVC SDK MainConcept
- 08/01/2013, Broadcom công bố BCM7445 là một Ultra HD con chip
giải mã có khả năng giải mã HEVC lên tới 4096x2160p ở 60 fps
- 08/01/2013, Vanguard công bố sự sẵn có của V.265, một phần mềm
mã hóa chuyên nghiệp HEVC có khả năng hiệu suất thời gian thực
- 04/02/2013, NTT DoCoMo công bố rằng bắt đầu từ tháng ba sẽ bắt
đầu cấp giấy phép thực hiện các phần mềm giải mã HEVC. Trong một
tài liệu JCT-VC NTT DoCoMo cho thấy bộ giải mã phần mềm HEVC của
họ có thể giải mã 3840x2160 ở 60 fps
- 19/04/2013, SES công bố lần đầu tiên UltraHD sử dụng các tiêu
chuẩn HEVC với độ phân giải 3840x2160 và tốc độ bit 20 Mbit/s
- 09/05/2013, NHK và Mitsubishi Electric thông báo rằng họ đã cùng
nhau phát triển bộ mã hóa HEVC đầu tiên cho 8K Ultra HDTV, còn
được gọi là Super Hi-Vision (SHV) cho phép nó để mã hóa 10-bit video
với độ phân giải 7680x4320 ở 60 fps.
- 04/06/2013, Tổng công ty Rovi phát hành MainConcept HEVC SDK
1.0
- 08/08/2013, Nippon Telegraph and Telephone bố việc phát hành
HEVC-1000 mã hóa phần mềm SDK của họ hỗ trợ 10 Thông tin chính,
độ phân giải lên đến 7680x4320, và tỷ lệ khung hình lên đến 120 fps
- 21/08/2013, Microsoft phát hành một DirectX Video Acceleration
(DXVA) cho HEVC hỗ trợ hồ sơ cá nhân chính. DXVA 2.0 ứng dụng cho
các hoạt động: phân tích bitstream, deblocking, nghịch đảo lượng tử
mở rộng quy mô, nghịch đảo chế biến, và bồi thường chuyển động.
- 11/09/2013, ViXS System công bố XCode 6400 SoC hỗ trợ độ phân
giải 4K 60 fps, 10 hồ sơ chính của HEVC, và Re
- Từ ngày 12-17/2013 Chương trình IBC tại Amsterdam, HEVC là một
chủ đề quan trọng
- 29/10/2013, Elemental Technologies công bố hỗ trợ xử lý video thời
gian thực 4K HEVC
- 14/11/2013, các nhà phát triển DivX công bố thông tin HEVC hiệu
suất giải mã sử dụng một CPU i7 Intel 3,5 GHz. DivX 10.1 Beta bộ giải
mã có khả năng xử lý 210,9 fps ở 720p, 101.5 fps ở độ phân giải
1080p, và 29,6 fps ở 4K
- 18/12/2013, ViXS System thông báo lô hàng của họ XCode 6400 SoC
là SoC đầu tiên hỗ trợ 10 hồ sơ chính của HEVC
Trong năm 2014
- 15/01/2014, oViCs công bố VIC-1 HEVC bộ giải mã hỗ trợ 10 Thông
tin chính lên đến 4K với 120 fps
[...]...2.3.1 Chuẩn nén MPEG-1 MPEG -1 được hình thành và năm 1988, là tiêu chuẩn của nhóm chuyên gia về hình ảnh MPEG ở trong giai đoạn đầu tiên (tương ứng với tiêu chuẩn ISO/IEC 11172 của ITU).Mục đích của MPEG -1 là nghiên cứu một tiêu chuẩn mã hoá video và âm thanh kèm theo trong các môi trường lưu trữ như: CD-ROM, đĩa quang … Tốc độ mã hoá trong khoảng 1.5Mb/s Chuẩn nén MPEG -1 bao gồm 4... tra: ISO/IEC 11172 -4 Trong các phần trên ta nghiên cứu một vài thông số trong phần Video (ISO/IEC 11172-2) 2.3.2 Chuẩn nén MPEG-2 Chuẩn nén MPEG -2 là chuẩn nén phát triển tiếp sau MPEG -1, có kế thừa tất cả các tiêu chuẩn của MPEG -1 và mục đích là nhằm hỗ trợ việc truyền video số, tốc độ bít lớn hơn 4 Mb/s, bao gồm các ứng dụng DSM (phương tiện lưu trữ số), Các hệ thống truyền hình hiện tại (NTSC,... Kỹ thuật nén trong ảnh 3.3.1 Sơ đồ mã hóa trong ảnh Intra Frame Ảnh I thực hiện quá trình mã hóa trong ảnh cũng tương tự mã hóa MPEG-2, nhưng cũng có những điểm khác như trình bày ở các phần sau Mã hóa trong ảnh H.264 Trong đó: F’n(reconstoncted): Ảnh khôi phục sẽ được lưu trong Memory để tìm vector chuyển động cho Frame P tiếp theo 3.3.2 Chọn macroblock và thứ tự trong công đoạn nén: Chuẩn nén MPEG-4... các hình ảnh mượt trong các khung hình chuyển động là 120 Frames/s Một thông số các cần được tương thích khi nâng cao số lượng điểm ảnh trong khung hình và số lượng khung hình được sử dụng trong 1s là độ số lượng bit dùng để mã hóa các điểm ảnh hay có thể được coi là độ sâu điểm ảnh Thay vì việc sử dụng 8 bít để mã hóa các tín hiệu truyền hình như trong các hệ thống SD, HD thông thường, các hệ thống truyền. .. (NTSC, PAL, SECAM), cáp, thu lượm tin tức điện tử, truyền hình trực tiếp từ vệ tinh, truyền hình mở rộng (EDTV), truyền hình độ phân giảicao (HDTV)… Chuẩn MPEG -2 bao gồm 4 phần chính: -Các hệ thống: ISO/IEC 13818 -1 -Video: ISO/IEC 13818 -2 -Audio: ISO/IEC 13818 -3 -Các hệ thống kiểm tra: ISO/IEC 13818 -4 2.3.3 Chuẩn nén MPEG-4 Ngày nay, khi nhu cầu truyền phát các ứng dụng video và đa phương tiện mới... Tiêu chuẩn MPEG-7 MPEG (ISO/IEC SC29/WG11) cho ra đời một tiêu chuẩn mới là MPEG-7 với mục đích để mô tả các nội dung Multimedia, chứ nó không phải là chuẩn nén và mã hoá audio,video, ảnh động như các chuẩn nén đã ra đời trước đó CHƯƠNG III CÔNG NGHỆ NÉN ẢNH H.264/MPEG - 4 AVC 3.1 GIỚI THIỆU CHUNG Kể từ khi mới xuất hiện vào đầu những năm 90, chuẩn nén video MPEG-2 đã hoàn toàn thống lĩnh thế giới truyền. .. tiến mới trong lĩnh vực nén không gian Trước hết, bộ lập mã này có thể tiến hành nén không gian tại các macroblock 16x16 điểm ảnh thay vì các block 8x8 như trước đây Điều này giúp tăng cường đáng kể khả năng nén không gian đối với các hình ảnh có chứa nhiều khoảng lớn các điểm ảnh giống nhau Thứ hai là thao tác nén được tiến hành trong miền không gian trước khi công đoạn DCT diễn ra Chuẩn nén MPEG-4... hóa tín hiệu truyền hình có cùng chất lượng CHƯƠNG IV KỸ THUẬT NÉN H.265/HEVC 4.1 Sự ra đời của chuẩn nén mới HEVC Việc nâng cao độ phân giải trong Frame của hệ thống 2K, 4K Tv, đòi hỏi quá trình đồng bộ hóa về việc nâng cao tốc độ số khung hình được sử dụng trong 1s và số lượng bit được sử dụng để mã hóa các Pixels tạo nên độ sâu mức tín hiệu Nếu như ở hệ thống SD, HD hiện tại tốc độ 24 hình/ s cho tốc... hiệu chuẩn 2K, 4K các thông số này trở nên không còn tương thích Trong các bài test với độ phân giải 4K hình ảnh hiển thị ở những vùng có sự chuyển động trên màn hình đặc biệt là trong các chương trình thể thao không còn được rõ nét với tốc độ 24 Frames/s Các hãng chuyên cung cấp giải pháp và thiết bị truyền hình như Harmonic, Miranda đã khuyến cáo tốc độ Frame tối thiểu sử dụng cho tín hiệu truyền hình. .. có trong các chuẩn nén MPEG -1 và MPEG -2 hay các chuẩn nén trước đó Tháng 10 năm 1998 với sự xuất hiện của chuẩn nén MPEG -4 đã tạo ra một phương thức thiếtlập và tương tác mới với truyền thông nghe nhìn trên mạng Internet, tạo ra một phương thức sản xuất, cung cấp và tiêu thụ mới các nội dung video trên cơ sở nội dung và hướng đối tượng (content/object-based) Đây chính là một công nghệ trình diễn truyền