Chuẩn nén trong truyền hình UHDTV

HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG KHOA KỸ THUẬT ĐIỆN TỬ I ---------- PHÁT THANH TRUYỀN HÌNH Đề tài :Chuẩn nén trong truyền hình UHDTV Giảng viên:Nguyễn Quốc Dinh Nhóm thực hiện: Nhóm 04 Lớp:D11XLTH MỤC LỤC I, GIỚI THIỆU CHUNG VỀ UDHTV II, KHÁI QUÁT VỀ NÉN VIDEO VÀ CHUẨN NÉN MPEG III, CHUẨN NÉN MPEG-4 AVC/H.264 IV,CHUẨN NÉN MỚI H.265/HEVC CHƯƠNG I GIỚI THIỆU VỀ CÔNG NGHỆ UHDTV 1.1. Giới thiệu về UHDTV Ultra High Definition Television (Ultra HD Television hay UHDTV) là công nghệ truyền hình được thiết kế để cung cấp cho người xem nhưng trải nghiệm hình ảnh chất lượng siêu nét. UHDTV bao gồm 4K UHD (2160p) và 8K UHD (4320p), đó là hai định dạng video kĩ thuật số được các nhà nghiên cứu của Viện Công nghệ và Khoa học NHK (Nhật Bản) đề xuất và được phê duyệt bởi Liên minh viễn thông quốc tế (ITU). Công nghệ xử lý tín hiệu truyền hình UHDTV được sử dụng cho màn hình có tỉ lệ là 16:9 và có ít nhất một đầu vào kĩ thuật số có khả năng lưu trữ và phát video có độ phân giải tối thiểu 3840 x 2160 pixel. Các tiêu chuẩn chất lượng của UHDTV được thực hiện theo 2 giai đoạn trong đó tiến bộ công nghệ ở mỗi giai đoạn có thể tương đương với bước nhảy vọt công nghệ từ truyền hình có độ nét tiêu chuẩn cũ tới tiêu chuẩn công nghệ truyền hình độ nét cao hiện nay (HDTV). Trong khi hình ảnh truyền hình HDTV hiện tương đương với 1-2 megapixel, hình ảnh truyền hình UHDTV giai đoạn 1 đã lên tới 8 megapixel và ở giai đoạn 2 lên tới 32 megapixel. Chất lượng hình ảnh UHDTV song hành với độ trung thực của màu tăng vọt và các lựa chọn về số hình ảnh trên 1 giây của UHDTV cũng cao hơn nhiều so với HDTV. UHDTV là phát triển làm chấn động thế giới truyền hình toàn hành tinh. Độ phân giải 4K và 8K của UHDTV Truyền hình UHDTV sẽ lôi cuốn toàn cầu trong tương lai gần. UHDTV là bình minh của kỷ nguyên mới về truyền hình với mức độ thực của hình ảnh chưa từng thấy mà người xem có thể thưởng thức. + Màu sắc thực hơn nhờ đường truyền băng + Sự rõ nét và chi tiết hơn của hình ảnh được nâng cao cho các màn hình cỡ lớn dễ nhìn và sắc nét hơn. + Hệ thống âm thanh Multichanel 22.2 được phát sóng đồng thời với UHDTV hỗ trợ chức năng âm thanh vòm. 1.2. Khác biệt giữa UHDTV và các tivi tiêu chuẩn trước đó Khác biệt lớn đầu tiên giữa UHDTV và một chiếc TV thường chính là độ phân giải. Trong khi một chiếc TV truyền thống chỉ có thể hiển thị tối đa khoảng 500 dòng và 500 cột điểm ảnh, tương ứng với độ phân giải chỉ khoảng 500 x 500 pixel (250.000 điểm ảnh), còn TV HDTV hiện hành có thể chia ra 1.920 cột và 1.080 dòng quét, tương ứng với độ phân giải 1.920 x 1.080 pixel (hơn 2 triệu điểm ảnh) thì một màn hình UHDTV có thể chia ra 3.840 cột và 2.160 dòng quét (với UHD 4K) và 7.680 cột và 4.320 dòng quét (với UHD 8K) tương ứng với độ phân giải 3.840 x 2.160 pixels (với UHD 4K khoảng 8 triệu điểm ảnh) và 7.680 x 4320 pixels (với UHD 8K khoảng 33 triệu điểm ảnh) trong Rec ITU-R BT.1769. Như vậy, lượng điểm ảnh hiển thị được trên màn hình UHDTV nhiều hơn gấp 40(80) lần so với TV thường và gấp 4(8) lần so với TV HDTV. Điều đó đồng nghĩa UHDTV có thể hiển thị rất nhiều chi tiết hơn. Khác biệt lớn thứ hai giữa UHDTV và TV thường nằm ở số cổng vào tín hiệu ở mặt sau TV. Do phải hiển thị nhiều điểm ảnh hơn, nên một chiếc UHDTV cần tới 3 dây cáp hình : một dây để truyền tải các hình ảnh màu đỏ (R), một dây cho màu xanh lá (G) và một dây cho màu xanh lam (B). Khác biệt lớn cuối cùng là một số loại UHDTV cần có một đầu thu và giải mã tín hiệu độ phân giải siêu nét (UHDTV receiver) thì mới có thể bắt sóng truyền hình HD trực tiếp từ đài phát. 1.3. Lợi ích của độ phân giải UHDTV Trước hết, hình ảnh sẽ sắc nét và rõ ràng hơn, các pixel trên màn hình sẽ nhỏ lại và chúng ta sẽ được hiệu ứng tương tự như trên các điện thoại Full - HD hoặc “Retina” hiện nay. Chữ và chi tiết ảnh sẽ được hiển thị tốt hơn, trải nghiệm xem thích thú hơn. Điều này quan trọng bởi vì hiện nay các TV càng ngày càng lớn hơn, chúng ta thậm chí đã có những chiếc TV gia đình với đường chéo màn hình lên đến 84 – 85 inch. Tuy nhiên, cũng cần phải nói thêm rằng khả năng nhận biết các điểm ảnh của mắt người còn phụ thuộc nhiều vào khoảng cách đến màn hình. UHD chỉ thật sự có lợi ở vùng màu xanh lá cây, tức là chúng ta sẽ cần những chiếc TV lớn 50 – 140 inch và khoảng cách xem từ 1,5m đến xấp xỉ 5m. Mảng màu xanh càng lớn thì lơi ích càng nhiều. Chỉ khi nào đạt được yêu cầu này thì trải nghiệm 4K(8K) của chúng ta mới thật sự tốt. Tỷ lệ kích thước màn hình và khoảng cách xem Ngoài ra, nội dung 3D cũng được hưởng lợi rất nhiều khi sử dụng độ phân giải 4K. Hiện tại, những TV 3D hay máy chiếu sử dụng kính phân cực thụ động sẽ cắt hình ảnh Full - HD ra làm hai tương ứng với hai mắt của chúng ta để có thể tạo hiệu ứng nổi. Chính vì thế, chúng ta chỉ nhận được hình ảnh với độ phân giải 960 x 540 (một nửa mỗi chiều của 1920 x 1080) mà thôi, và tất nhiên là ảnh sẽ không thể đẹp như lúc xem 2D rồi. Còn khi áp dụng 4K, hình ảnh 3D xem qua kính thụ động sẽ được chia thành hai ảnh Full - HD 1080p cho mỗi mắt (tức một nửa 4K), tuyệt vời hơn là điều đương nhiên rồi. Đối với các nhà sản xuất thiết bị, những màn hình 4K thì sẽ dễ sản xuất hơn là áp dụng một công nghệ mới hoàn toàn như OLED, trong khi họ vẫn có thể tiếp thị được nó ra thị trường như một chuẩn nội dung mới hơn, xịn hơn. Như các bạn đã thấy, con số 4K cao hơn những con số khác, và do đó nó dễ dàng được người tiêu dùng cho là “tốt hơn”. Chắc chắn rằng khi hỏi độ phân giải 3840 x 2160 với 1920 x 1080 cái nào tốt hơn, nhiều người sẽ trả lời ngay rằng 4K tốt vì nó có nhiều điểm ảnh hơn. Nhân viên bán hàng chắc chắn cũng sẽ tận dụng điểm này để giới thiệu sản phẩm đến bạn. Tuy nhiên, lại một lần nữa 4K tốt hơn hay không còn phụ thuộc vào nhiều yếu tố, như vấn đề khoảng cách mà chúng ta đã thảo luận ở trên. Hiện nay cũng có những người tiêu dùng phổ thông nói rằng “Tôi chẳng biết Full–HD là gì, nhưng mà tôi muốn có nó”. Điều tương tự nhiều khả năng cũng sẽ diễn ra với 4K Ultra HD. CHƯƠNG II KHÁI QUÁT VỀ NÉN VIDEO VÀ CHUẨN NÉN MPEG 2.1. Mục đích nén tín hiệu video Tín hiệu video sau khi được số hoá 8 bit có tốc độ 216 Mb/s. Để có thể truyền trong một kênh truyền hình thông thường, tín hiệu video số cần phải được nén trong khi vẫn phải đảm bảo chất lượng hình ảnh . Nén video trong những năm 1950 được thực hiện bằng công nghệ tương tự với tỷ số nén thấp. Ngày nay công nghệ nén đã đạt được những thành tựu cao hơn bằng việc chuyển đổi tín hiệu video từ tương tự sang số. Công nghệ nén số (Digital Compressed) đòi hỏi năng lực tính toán nhanh. Song ngày nay với sự phát triển của côngnghệ thông tin, điều này không còn trở ngại. Như chúng ta biết tín hiệu video có dải phổ từ 0 - 6 MHz, tuy nhiên trong nhiều trườnghợp năng lượng phổ chủ yếu tập trung ở miền tần số thấp và chỉ có rất ít thông tin chứa đựngở miền tần số cao.Đối với tín hiệu video số, số lượng bit được sử dụng để truyền tải thông tin đối vớimỗi miền tần số khác nhau, có nghĩa là: miền tần số thấp, nơi chứa đựng nhiều thông tin,được sử dụng số lượng bít lớn hơn và miền tần số cao, nơi chứa đựng ít thông tin, được sử dụng số lượng bít ít hơn. Tổng số bít cần thiết để truyền tải thông tin về hình ảnh sẽ giảm một cách đáng kể và dòng dữ liệu được “nén” mà chất lượng hình ảnh vẫn đảm bảo.Thực chất của kỹ thuật “nén video số” là loại bỏ đi các thông tin dư thừa. Các thông tin dư thừa trong nén video số thường là: + Độ dư thừa không gian giữa các pixel; + Độ dư thừa thời gian do các ảnh liên tiếp nhau; + Độ dư thừa do các thành phần màu biểu diễn từng pixel có độ tương quancao; + Độ dư thừa thống kê do các kí hiệu xuất hiện trong dòng bít với xác suất xuất hiệnkhông đều nhau; + Độ dư thừa tâm lý thị giác (các thông tin nằm ngoài khả năng cảm nhận của mắt).vv… Như vậy, mục đích của nén tín hiệu video là : - Giảm tốc độ dòng bít của tín hiệu gốc xuống một giá trị nhất định đủ để cóthể tái tạo ảnh khi giải nén; - Giảm dung lượng dữ liệu trong lưu trữ cũng như giảm băng thông cần thiết; - Tiết kiệm chi phí trong lưu trữ và truyền dẫn dữ liệu trong khi vẫn duy trìchất lượng ảnh ở mức chấp nhận đựơc.Với nguyên nhân và mục đích của việc nén tín hiệu được trình bày như ở trên, ngàynay có nhiều các chuẩn nén đã ra đời như: JPEG, M-JPEG, MPEG, DV… Trong đó chuẩn nén MPEG được sử dụng nhiều trong nén video trong truyền hình với thành công của chuẩnnén video MPEG-2 trong truyền hình số và chuẩn nén MPEG-4 trong truyền hình trên mạng Internet. 2.2. Chuẩn nén MPEG 2.2.1. Khái quát về nén MPEG - MPEG (Moving Picture Expert Group) là nhóm chuyên gia về hình ảnh, được thành lập từ tháng 2 năm 1988 với nhiệm vụ xây dựng tiêu chuẩn cho tín hiệuAudio và Video số. Ngày nay, MPEG đã trở thành một kỹ thuật nén Audio và Video phổ biến nhất vì nó không chỉ là một tiêu chuẩn riêng biệt mà tuỳ thuộc vào yêu cầu cụ thể của từng thiết bị sẽ có một tiêu chuẩn thích hợp nhưng vẫn trên cùng một nguyên lý thống nhất. - Tiêu chuẩn đầu tiên được nhóm MPEG đưa ra là MPEG-1, mục tiêu của MPEG-1là mã hoá tín hiệu Audio-Video với tốc độ khoảng 1.5Mb/s và lưu trữ trong đĩa CD với chất lượng tương đương VHS. - Tiêu chuẩn thứ 2 : MPEG-2 được ra đời vào năm 1990, không như MPEG-1 chỉnhằm lưu trữ hình ảnh động vào đĩa với dung lượng bit thấp. MPEG-2 với “công cụ ” mã hoá khác nhau đã được phát triển. Các công cụ đó gọi là “Profiles” đượctiêu chuẩn hoá và có thể sử dụng để phục vụ nhiều mục đích khác nhau. - Tiêu chuẩn tiếp theo mà MPEG đưa ra là MPEG-4, được đưa ra vào tháng 10 năm 1998, đã tạo ra một phương thức thiết lập và tương tác mới với truyền thông nghe nhìn trên mạng Internet, tạo ra một phương thức sản xuất, cung cấp và tiêu thụ mới các nội dung video trên cơ sơ nội dung và hướng đối tượng (content/objectbased). - MPEG-7: là một chuẩn dùng để mô tả các nội dung Multimedia, chứ không phải là một chuẩn cho nén và mã hoá audio/ảnh động như MPEG- 1, MPEG-2 hay MPEG-4. MPEG-7 sử dụng ngôn ngữ đánh dấu mở rộng XML(Extansible Markup Language) để lưu trữ các siêu dữ liệu Metadata, đính kèm timecode để gắn thẻ cho các sự kiện, hay đồng bộ các dữ liệu. MPEG-7 bao gồm 3 bộ chuẩn sau: + Bộ các sơ đồ đặc tả (Description Schemes) và các đặc tả (Description). + Ngôn ngữ xác định DDL (Description Definition Language) để định nghĩa các sơ đồ đặc tả. + Sơ đồ mã hoá quá trình đặc tả. Việc kết hợp MPEG-4 và MPEG-7 sẽ tạo ra các giải pháp lý tưởng cho các dịch vụ Streaming Media, các hệ thống lưu trữ và sản xuất Streaming Media trong thời gian tới 2.3. Các chuẩn nén MPEG. 2.3.1 Chuẩn nén MPEG-1 MPEG -1 được hình thành và năm 1988, là tiêu chuẩn của nhóm chuyên gia về hình ảnh MPEG ở trong giai đoạn đầu tiên (tương ứng với tiêu chuẩn ISO/IEC 11172 của ITU).Mục đích của MPEG -1 là nghiên cứu một tiêu chuẩn mã hoá video và âm thanh kèm theo trong các môi trường lưu trữ như: CD-ROM, đĩa quang … Tốc độ mã hoá trong khoảng 1.5Mb/s. Chuẩn nén MPEG -1 bao gồm 4 phần : - Các hệ thống: ISO/IEC 11172 -1 - Video: ISO/IEC 11172 -2 - Audio: ISO/IEC 11172 -3 - Hệ thống kiểm tra: ISO/IEC 11172 -4 Trong các phần trên ta nghiên cứu một vài thông số trong phần Video (ISO/IEC 11172-2). 2.3.2 Chuẩn nén MPEG-2 Chuẩn nén MPEG -2 là chuẩn nén phát triển tiếp sau MPEG -1, có kế thừa tất cả các tiêu chuẩn của MPEG -1 và mục đích là nhằm hỗ trợ việc truyền video số, tốc độ bít lớn hơn 4 Mb/s, bao gồm các ứng dụng DSM (phương tiện lưu trữ số), Các hệ thống truyền hình hiện tại (NTSC, PAL, SECAM), cáp, thu lượm tin tức điện tử, truyền hình trực tiếp từ vệ tinh, truyền hình mở rộng (EDTV), truyền hình độ phân giảicao (HDTV)… Chuẩn MPEG -2 bao gồm 4 phần chính: -Các hệ thống: ISO/IEC 13818 -1. -Video: ISO/IEC 13818 -2 -Audio: ISO/IEC 13818 -3 -Các hệ thống kiểm tra: ISO/IEC 13818 -4. 2.3.3 Chuẩn nén MPEG-4 Ngày nay, khi nhu cầu truyền phát các ứng dụng video và đa phương tiện mới trên hạ tầng kỹ thuật Internet đã làm nảy sinh các yêu cầu chức năng mới không có trong các chuẩn nén MPEG -1 và MPEG -2 hay các chuẩn nén trước đó. Tháng 10 năm 1998 với sự xuất hiện của chuẩn nén MPEG -4 đã tạo ra một phương thức thiếtlập và tương tác mới với truyền thông nghe nhìn trên mạng Internet, tạo ra một phương thức sản xuất, cung cấp và tiêu thụ mới các nội dung video trên cơ sở nội dung và hướng đối tượng (content/object-based). Đây chính là một công nghệ trình diễn truyền thông đa phương tiện phức hợp, có khả năng truyền thông tại các môi trường truyền thông đa phương tiện phức hợp, có khả năng truyền thông tại các môi trường : truyền hình số, đồ hoạ tương tác, World Wide Web. Vì vậy, nhiệm vụ của MPEG -4 là nhằm phát triển các chuẩn xử lý, mã hoá và hiển thị ảnh động, audio và các tổ hợp của chúng.MPEG -4 đang được triển khai bởi nhiều nhà vận hành mạng và dịch vụ trên thếgiới với các dịch vụ mới đang được bổ xung để chiếm các lợi thế cấu trúc hạ tầng băng rộng đang phát triển. 2.3.4 Tiêu chuẩn MPEG-7 MPEG (ISO/IEC SC29/WG11) cho ra đời một tiêu chuẩn mới là MPEG-7 với mục đích để mô tả các nội dung Multimedia, chứ nó không phải là chuẩn nén và mã hoá audio,video, ảnh động như các chuẩn nén đã ra đời trước đó. CHƯƠNG III CÔNG NGHỆ NÉN ẢNH H.264/MPEG - 4 AVC 3.1. GIỚI THIỆU CHUNG Kể từ khi mới xuất hiện vào đầu những năm 90, chuẩn nén video MPEG-2 đã hoàn toàn thống lĩnh thế giới truyền thông. Cũng trong thập kỷ này, chuẩn nén MPEG-2 đã được cải tiến về nhiều mặt. Giờ đây nó có tốc độ bit thấp hơn và việc ứng dụng nó được mở rộng hơn nhờ có các kỹ thuật như đoán chuyển động, tiền xử lý, xử lý đối ngẫu và phân bổ tốc độ bit tùy theo tình huống thông qua ghép kênh thống kê. Tuy nhiên, chuẩn nén MPEG-2 cũng không thể được phát triển một cách vô hạn định. Thực tế hiện nay cho thấy chuẩn nén này đã đạt đến hết giới hạn ứng dụng của mình trong lĩnh vực truyền truyền hình từ sản xuất tiền kỳ đến hậu kỳ và lưu trữ Video số. Bên cạnh đó, nhu cầu nén Video lại đang ngày một tăng cao kèm theo sự phát triển mạnh mẽ của mạng IP mà tiêu biểu là mạng Internet. Chuẩn video MPEG-2 bị hạn chế bởi hai yếu tố trong định nghĩa ban đầu (original definition) của nó: • Tốc độ bit nhắm tới của video được nén là khoảng 2–15 Mb/s (đối với main profile ở mail level). Tiêu chuẩn này không chứa giới hạn tốc độ bit thấp hơn bất kỳ vì điều này không được yêu cầu trong định nghĩa của bộ mã hóa tương thích. Hiển nhiên MPEG-2 cũng không hiệu quả với tốc độ bit thấp hơn. • Silicon cho thực hiện MPEG-2 đã bị giới hạn đến trình độ công nghệ của những ngày đó. Điều này có nghĩa là trong năm 1994 ASIC (application Specific Integrated Circuit) được sử dụng trong thiết kế bộ giải mã với mật độ 120.000 gate/chip với kích thước gate 0.5 - 1 m. Trong khi đó công nghệ tiên tiến ngày nay đã đạt 25.000.000 gate/ASIC với kích thước gate nhỏ hơn 0.1 m. Như vậy các kỹ thuật dựa trên MPEG-2 đã bị hạn chế trong việc thực hiện thực tế trong công nghệ ngày hôm nay. Nhiều tiêu chuẩn mã hóa mới đã và đang nghiên cứu để khắc phục các nhược điểm của MPEG-2. Trong đó H.264/AVC, dự án tiêu chuẩn mã hóa video của nhóm chuyên gia mã hóa video của tổ chức ITU (ITU – T Video Coding Experts Group – VCEG) và nhóm chuyên gia ảnh động ISO/IEC (ISO/IEC Moving Picture Experts Group) là nổi bật hơn cả. Cái tên H.264/AVC chính là sự kết hợp tiêu chuẩn nghiên cứu riêng của từng nhóm: nhóm ITU là H.264, nhóm MPEG là AVC (Advanced Video Compression) tức MPEG-4 part 10. Các mục đích chính của việc nỗ lực tiêu chuẩn hóa này là phát triển một tiêu chuẩn mã hóa video đơn giản, với chỉ tiêu kỹ thuật nén tăng cường, và để có thể trình diễn video “thân thiện mạng” (network – friendly), nhắm tới các ứng dụng “hội thoại” (video telephone) và “không hội thoại” (lưu trữ, quảng bá hoặc streaming). H.264/AVC đã thực hiện sự cải thiện đáng kể trong hiệu quả giảm tỷ lệ bit và méo ở tốc độ bit đó, cung cấp (một cách gần đúng) hệ số tiết kiệm tốc độ bit khoảng hai lần so với các tiêu chuẩn đang tồn tại như MPEG-2 video 3.2. CÁC PHIÊN BẢN H.26X Theo ITU-T, các tiêu chuẩn mã hoá Video được coi là các khuyến nghị gọi tắt là chuẩn H.26x (H.261, H.262, H.263 và H.264). Với tiêu chuẩn ISO/IEC, chúng được gọi là MPEG-x (như MPEG-1, MPEG-2 và MPEG-4). 3.2.1. H.261 Mục đích: - H.261 được phát triển cho dịch vụ truyền hình hội nghị video phone qua ISDN ở tốc độ thấp 64kbps (p= 1..30) - Truyền hình hội nghị theo yêu cầu với chất lượng ảnh cao hơn, p ≥ 6, tốc độ ≥ 384 kbps. - Là cơ sở của chuẩn sau này như MPEG 1,2 - Các đặc tính: + Trễ mã hóa < Truyền hình hội nghị song công, gây ấn tượng◊150ms, tốt cho khán giả. Mở rộng thị trường + Thực hiện trên linh kiện VLSI (giá thành thấp) các dịch vụ video phone, truyền hình hội nghị. Các dạng ảnh đầu vào: - Khả năng phối hợp giữa các chuẩn 625 và 525 dòng của TV, H.261 sử dụng dạng thức trung gian chung CIF ( Common Intermediate Format) với các tốc độ bit thấp hơn. H.261 sử dụng dạng có tốc độ nhỏ hơn ¼ là QCIF (Quadrature). - Với tốc độ 30 khung hình/s thì tốc độ dữ liệu của CIF là 37,3Mbps, QCIF là 9,35 Mbps. Tốc độ càng thấp thì càng giảm số khung hình/s. 3.2.2 . H.263 Mục đích: - Tiêu chuẩn cải tiến H.261 cho video tốc độ thấp, có thể truyền trên mạng điện thoại công cộng PSTN, được công nhận năm 1996. - Giống như H.261, mã hóa DCT cho các MB trong I Frame và DCT sai biệt dự đoán trong P Frame. - Tốc độ tối thiểu. Ưu điểm: - Chính xác sai biệt dự đoán tới ½ pixels - Không hạn chế vector chuyển động. - Mã hóa số học theo cú pháp. - Dự đoán thuận lợi với các khung P - Ngoài CIF, QCIF, H.263 còn hỗ trợ SQCIF, 4 CIF và 16 CIF với độ phân giải tín hiệu chói tuần tự là 128x96, 704x576, 704x576, 1408x1152. Độ phân giải tín hiệu sắc bằng ¼ tín hiệu chói. 3.2.3. MÃ HÓA H.264 3.2.3.1.Sơ đồ khối mã hóa H.264: Mã hóa H.264 Trong đó: - Fn (current): Ảnh hiện tại - F’n-1(reference): Ảnh tham chiếu của 1 hoặc 2 khung hình được mã hóa trước đó. - F’n(reconstoncted): Ảnh khôi phục - Intra prediction: Dự đoán trong ảnh - Choose Intra Prediction: Chọn dự đoán trong ảnh - Deblocking filter: Bộ lọc tách khối - T, Q và T-1 , Q-1 : mã hóa separable integer transform-biến đổi nguyên tách biệt , lượng tử hóa và giải mã T , giải lượng tử hóa tương ứng. - Dn, D’n: Phần ảnh sai khác vào mã hóa và ra từ giải mã - Reorder: Sắp xếp lại - Entropy encode: Mã hóa entropy - MC(Motion Compensation): Bù chuyển động. - ME(Motion estimation): Đánh giá chuyển động Định dạng mã hóa dữ liệu: Thiết kế H. 264/ AVC hỗ trợ mã hóa video (trong định dạng 4:2:0) có chứa các frame liên tục hoặc xen kẽ, hoặc có thể được trộn với nhau trong cùng một dãy. Nhìn chung một frame video chứa hai field đan xen, được cách ly về mặt thời gian bởi một chu kỳ field (nửa thời gian của chu kỳ frame), có thể được mã hóa riêng biệt như hai ảnh field, hoặc cùng với nhau như một ảnh frame. Một frame liên tục phải luôn luôn được mã hóa như một ảnh frame đơn; tuy nhiên nó vẫn được xem như gồm hai field ở cùng một thời điểm 3.2.3.2.Lớp trừu tượng mạng (NAL – Network Abstaction Layer) Lớp trừu tượng mạng (NAL) được xác định để định dạng dữ liệu này và cung cấp thông tin header trong cách thích hợp cho việc chuyên chở bởi các lớp truyền tải hoặc môi trường lưu trữ. Tất cả dữ liệu được chứa trong các khối NAL, mỗi khối chứa một số nguyên byte. Một khối NAL xác định định dạng chung cho việc sử dụng trong cả hệ thống định hướng gói (packet – oriented) và hệ thống định hướng dòng bit (bitstream). Định dạng của các khối NAL là đồng nhất cho cả việc phân phối dòng truyền tải định hướng gói và định hướng dòng bit, ngoại trừ rằng mỗi khối NAL trong lớp truyền tải định hướng dòng bit có thể có một tiền tố mã hóa khởi hành ở trước. 3.2.3.3. Lớp mã hóa video (Video Coding Layer) Lớp mã hóa video (VCL-Video Coding Layer), được định rõ để biểu diễn hiệu quả nội dung của dữ liệu video.Lớp mã hóa video của H.264/AVC thì tương tự với các tiêu chuẩn khác như MPEG-2 video. Nó là sự kết hợp dự đoán theo thời gian và theo không gian, và với mã chuyển vị. Ảnh được tách thành các khối. Anh đầu tiên của dãy hoặc điểm truy nhập ngẫu nhiên thì được mã hóa (trong khối) “Intra”, có nghĩa là không dùng thông tin nào ngoài thông tin chứa trong bản thân ảnh. Mỗi mẫu của một khối trong một frame Intra được dự đoán nhờ dùng các mẫu không gian bên cạnh của các khối đã mã hóa trước đó. Đối với tất cả các ảnh còn lại của dãy hoặc giữa các điểm truy cập ngẫu nhiên, mã hóa “Inter” được sử dụng, dùng dự đoán bù chuyển động từ các ảnh được mã hóa trước. 3.3. Kỹ thuật nén trong ảnh 3.3.1. Sơ đồ mã hóa trong ảnh Intra Frame Ảnh I thực hiện quá trình mã hóa trong ảnh cũng tương tự mã hóa MPEG-2, nhưng cũng có những điểm khác như trình bày ở các phần sau. Mã hóa trong ảnh H.264 Trong đó: F’n(reconstoncted): Ảnh khôi phục sẽ được lưu trong Memory để tìm vector chuyển động cho Frame P tiếp theo. 3.3.2 Chọn macroblock và thứ tự trong công đoạn nén: Chuẩn nén MPEG-4 AVC có hai cải tiến mới trong lĩnh vực nén không gian. Trước hết, bộ lập mã này có thể tiến hành nén không gian tại các macroblock 16x16 điểm ảnh thay vì các block 8x8 như trước đây. Điều này giúp tăng cường đáng kể khả năng nén không gian đối với các hình ảnh có chứa nhiều khoảng lớn các điểm ảnh giống nhau. Thứ hai là thao tác nén được tiến hành trong miền không gian trước khi công đoạn DCT diễn ra. Chuẩn nén MPEG-4 AVC so sánh macroblock hiện thời với các macroblock kế bên trong cùng một khung, tính toán độ chênh lệch, và sau đó sẽ chỉ gửi đoạn chênh lệch tới DCT. Hoặc là nó có thể chia nhỏ macroblock 16x16 điểm ảnh thành các khối 4x4 nhỏ hơn và so sánh từng khối này với các khối kế bên trong cùng một macroblock. Điều này giúp cải thiện khả năng nén ảnh chi tiết. 3.3.3. Chuyển vị, co dãn và lượng tử hóa: Tương tự với các tiêu chuẩn mã hóa video trước đó, H.264/AVC cũng dùng mã chuyển vị cho dự đoán tiếp theo. Tuy nhiên trong H.264/AVC việc chuyển vị được áp dụng cho các khối 4 x 4, và thay cho biến đổi cosin rời rạc (DCT) 4 x4 a/ Biến đổi nguyên tách biệt (separable integer transform) được sử dụng, với các tính chất giống như 4 x 4 DCT về cơ bản. Vì biến đổi ngược được xác định bởi các thuật toán nguyên chính xác nên tránh được sự không thích nghi của biến đổi ngược. Một biến đổi 2 x 2 bổ sung được áp dụng cho bốn hệ số DC của mỗi thành phần chroma. Nếu một macroblock được mã hóa trong mode Intra - 16 x 16, thì một biến đổi 4 x 4 tương tự được thực hiện cho các hệ số DC 4 x 4 của tín hiệu luma. Ví dụ: Đầu vào là khối luma 4x4. Thực hiện biến đổi T Đầu vào X Ra chuyển đổi W b/ Lượng tử hóa các hệ số biến đổi Để lượng tử hóa các hệ số biến đổi, H.264/AVC dùng lượng tử hóa vô hướng. Một trong số 52 bộ lượng tử hóa được chọn cho mỗi macroblock bởi tham số lượng tử hóa QP (Quantization Parameter). Lượng tử hóa thay đổi theo khoảng cách để đạt được hiệu quả nén cao theobiểu thức sau Z = W round [ PF/ Qstep ] Sau lượng tử là Z Quét zic-zăc Các bộ lượng tử hóa được sắp xếp sao cho có sự tăng khoảng 12.5% trong kích thước bước lượng tử hóa khi QP tăng một đơn vị. c/ Quét zic-zăc Quét zic-zac bắt đầu từ hệ số DC nhằm ánh xạ ma trận 4x4 thành vector 1x 16, đáy vector là giá trị EOB (End of Block). Nhóm các thành phần tần số thấp vào đỉnh vector. 3.3.4. Sắp xếp lại: Sắp xếp lại khối 1x 16 sau quét zic- zac ở trên. Thành phần DC ở đỉnh vector 1x16, tiếp đến theo thứ tự lần lượt là 15 thành phần còn lại AC. 3.3.5.Mã hóa Entropy: Trong H.264/AVC, hai phương pháp mã hóa entropy được hỗ trợ : - Phương pháp mã hóa entropy mặc định (default) sử dụng một tập từ mã mở rộng vô hạn đơn cho tất cả phần tử cấu trúc, ngoại trừ các hệ số biến đổi được lượng tử hóa. Như vậy, thay cho việc một thiết kế bảng VCL khác nhau cho mỗi phần tử cấu trúc, chỉ có một ánh xạ cho một bảng từ mã đơn được thực hiện theo thống kê dữ liệu. Bảng từ mã đơn được chọn là mã expGolomb với các tính chất giải mã rất đơn giản và hài hòa. - Để truyền các hệ số biến đổi được lượng tử hóa, một phương pháp tinh tế hơn gọi là mã độ dài biến đổi thích nghi hoàn cảnh CAVLC (Context – Adaptive Variable Length Coding) được sử dụng. Mã độ dài biển đổi thích nghi hoàn cảnh Trong sơ đồ này, các bảng VLC được chuyển mạch tốt cho các phần tử cấu trúc khác nhau, phụ thuộc vào phần tử cấu trúc đã được truyền. Vì các bảng VLC được thiết kế tốt để thích nghi các thống kê có điều kiện tương ứng, chỉ tiêu kỹ thuật mã hóa entropy được cải thiện so với các sơ đồ dùng một bảng VLC đơn. - Hiệu quả của mã hóa entropy có thể được cải thiện hơn nữa nếu mã hóa số học nhị phân thích nghi hoàn cảnh CABAC (Context – Adaptive Binary Arithmetic Coding) được sử dụng. Một mặt, việc dùng mã hóa số học cho phép ấn định một số không nguyên vẹn (non – integer) các bit cho mỗi symbol của bảng chữ cái và điều này là cực kỳ có ích đối với các xác suất symbol lớn hơn 0.5. Mặt khác, việc dùng mã thích nghi cho phép thích nghi với các thống kê symbol không tĩnh. Một tính chất quan trọng khác của CABAC là mô hình hóa hoàn cảnh của nó. Tính thống kê của các phần tử cấu trúc đã được mã hóa thì được sử dụng để đánh giá các xác suất điều kiện. Các xác suất điều kiện này được sử dụng để chuyển mạch hàng loạt model xác suất đã được đánh giá. Trong H.264/AVC, engine cốt lõi mã hóa số học và đánh giá xác suất kèm theo nó được xác định như các phương pháp ít phức tạp, không dùng phép nhân mà chỉ dùng các phép dịch chuyển (shift) và các bảng look – up. So sánh với CAVLC, CABAC thường cho giảm tốc độ bit khoảng 10 – 15% khi mã hóa tín hiệu truyền hình có cùng chất lượng. CHƯƠNG IV KỸ THUẬT NÉN H.265/HEVC 4.1. Sự ra đời của chuẩn nén mới HEVC Việc nâng cao độ phân giải trong Frame của hệ thống 2K, 4K Tv, đòi hỏi quá trình đồng bộ hóa về việc nâng cao tốc độ số khung hình được sử dụng trong 1s và số lượng bit được sử dụng để mã hóa các Pixels tạo nên độ sâu mức tín hiệu. Nếu như ở hệ thống SD, HD hiện tại tốc độ 24 hình/s cho tốc độ Frame và 8 bít cho mỗi Pixel là hoàn toàn phù hợp thì với tín hiệu chuẩn 2K, 4K các thông số này trở nên không còn tương thích. Trong các bài test với độ phân giải 4K hình ảnh hiển thị ở những vùng có sự chuyển động trên màn hình đặc biệt là trong các chương trình thể thao không còn được rõ nét với tốc độ 24 Frames/s. Các hãng chuyên cung cấp giải pháp và thiết bị truyền hình như Harmonic, Miranda đã khuyến cáo tốc độ Frame tối thiểu sử dụng cho tín hiệu truyền hình độ phân giải siêu cao nên là 50, 60 Frames/s, lý tưởng để thu được các hình ảnh mượt trong các khung hình chuyển động là 120 Frames/s. Một thông số các cần được tương thích khi nâng cao số lượng điểm ảnh trong khung hình và số lượng khung hình được sử dụng trong 1s là độ số lượng bit dùng để mã hóa các điểm ảnh hay có thể được coi là độ sâu điểm ảnh. Thay vì việc sử dụng 8 bít để mã hóa các tín hiệu truyền hình như trong các hệ thống SD, HD thông thường, các hệ thống truyền hình 2K, 4K cần 10 bit mã hóa để đảm bảo thu được chất lượng tương thích với tốc độ Frame và độ phân giải. Việc nâng cao các tham số trên giúp cải thiện rõ rệt chất lượng của chương trình truyền hình song luôn đi kèm với sự ra tăng của tốc độ luồng bit. Đây chính là thách thức chủ yếu và lớn nhất trong việc áp dụng hệ thống truyền hình độ nét siêu cao. Bảng dưới đây tóm tắt tốc độ luồng bit tương ứng với các tham số khác nhau của hệ thống 4K-TV (3840 x 2160) tương ứng với tỷ lệ điểm chói-màu 4:2:2 Chương trình Bít dùng cho điểm ảnh Tốc độ khung hình/s Tốc độ luồng dữ liệu Chương trình 10 60 9,95 Gbps sản xuất Chương trình thể thao 10 120 19,91 Gbps Qua bảng trên chúng ta nhận thấy yếu tố tốc độ luồng dữ liệu quá cao chính là rào cản cho việc truyền dẫn các tín hiệu chương trình Ultra High Definition TV. Các chuẩn nén đang được sử dụng hiện thời như MPEG2, H.264 không đủ mạnh để chuyển đổi tốc độ của các chương trình UHDTV về tốc độ của các hệ thống truyền dẫn hiện tại. Chuẩn nén mới HEVC (High Efﬁciency Video Encoding) ra mắt với việc áp dụng các thuật toán nén mới sẽ giúp giải quyết bài toán này. Bằng việc áp dụng các kỹ thuật mới đặc biệt là nâng cao các hướng dò tìm trong thuật toán vector chuyển động trong cùng một Frame và giữa các Frames liên tiếp. Chuẩn HEVC giúp giảm tốc độ luồng bit được mã hóa xuống còn 25% so với chuẩn MPEG2 và 50% so với H.264. Áp dụng HEVC vào tín hiệu Ultra TV thu được tốc độ luồng bít đẩu ra là14 Mbps. Tốc độ này đang từng bước được tối ưu, cùng với sự mở rộng băng thông của các môi trường truyền dẫn sẽ giúp hiện thực hóa việc truyền tải luồng bít của tín hiệu có độ siêu phân giải trong tương lai gần. Ngày 25 tháng 1 năm 2013, ITU đã chính thức công bố chuẩn mã hóa H.265 cho video và trong hai năm qua đã có rất nhiều các nhà sản xuất đưa H.265 vào trong các sản phẩm thương mại ra thị trường. Về mặt lý thuyết H.265/HEVC được đánh giá là hiệu quả hơn H.264/AVC khoảng 30-50% (độ phân giải càng cao, hiệu suất nén càng cao) nhưng nó có thực sự đơn giản? Trong bài viết này chúng tôi giả định rằng bạn đã biết đến một số khái niệm được sử dụng trong các chuẩn mã hóa video hiện nay như H.264/AVC. HEVC sử dụng lại rất nhiều các khái niệm được định nghĩa trong H.264. Cả hai chuẩn mã hóa này đều dựa trên các kỹ thuật mã hóa video: 1. Phân vùng hình ảnh bằng các macroblock và sau đó lại phân vùng tiếp trong các khối này. 2. Giảm không gian dư thừa bằng cách sử dụng các kỹ thuật nén trong khung hình nội bộ. 3. Giảm sự dư thừa thời gian bằng sử dụng kỹ thuật nén liên khung (dự đoán chuyển động và bù đắp chuyển động). 4. Nén các dữ liệu dư thừa sử dụng các biến đổi toán học và lượng tử hóa. 5. Giảm dư thừa trong truyền vector chuyển động và tín hiệu sử dụng mã hóa entropy. Entropy thông tin là một khái niệm mở rộng của entropy trong nhiệt động lực học và cơ học thống kê sang lĩnh vực lý thuyết thông tin. Entropy thông tin mô tả mức độ hỗn loạn trong một tín hiệu lấy từ một sự kiện ngẫu nhiên. Nói cách khác, entropy cũng chỉ ra có bao nhiêu thông tin trong tín hiệu, với thông tin là các phần không hỗn loạn ngẫu nhiên của tín hiệu. Ý tưởng kỹ thuật sử dụng trong mã hóa video H.265, H.264 Workflow các hệ thống mã hóa video Quá trình cơ bản để mã hóa video cho AVC và HEVC như hình trên. Video đầu vào được chia ra thành các khối n x n pixel và được mã hóa trong các đơn vị khối này. Các khối đầu vào được mã hóa thành bit stream (dãy tín hiệu nhị phân bao gồm 0 và 1) thông qua các quá trình bao gồm dự đoán và trực giao biến đổi. Dự đoán là kỹ thuật cốt lõi trong mã hóa video. Trong quá trình mã hóa khung hình tại thời điểm t, nếu khung hình thời điểm t-1 có những thành phần giống khung hình trước thì chỉ những khác biệt mới được gửi đi. Khi một đối tượng di chuyển từ bức hình của khung hình đầu đến khung hình tiếp theo, nó sẽ xác định một vector chuyển động và vector này được gửi đến bộ mã hóa để sử dụng trong dự đoán vị trí. Với các đối tượng không chuyển động, ví dụ như đám mây trong hình, sẽ không cần gửi đi vector chuyển động, đây gọi là dự đoán liên khung (inter-prediction). Nếu dự đoán được hoàn thành trong 1 khung hình thì được gọi là dự đoán nội bộ (intra-prediction). Thay vì các macroblock 16x16 như trong H.264, H.265 phân vùng hình ảnh thành cây mã hóa (các CTB - ). Kích thước CTB có thể là 64x64, 32x32 hoặc 16x16, các nghiên cứu chỉ ra rằng CTB lớn giúp việc mã hóa có hiệu quả cao nhưng bên cạnh đó thời gian mã hóa cũng sẽ lớn. Bạn có thể tưởng tượng bạn có một file text 10GB, nếu chia file này thành 10 file kích thước 10GB, vậy khi nén 10 file này riêng lẻ thì hiệu quả nén sẽ không thể bằng nén riêng file 10GB nhưng cũng vì thế mà thời gian nén file 10GB sẽ lớn hơn tổng thời gian nén 10 file riêng lẻ. Mỗi CTB có thể được phân chia một cách đệ quy trong một cấu trúc chia 4 bao gồm các khối nhỏ 32x32, 16x16 hoặc 8x8 gọi là đơn vị mã hóa vùng CU (xem hình minh họa dưới). CU là đơn vị cơ bản của các dự đoán trong HEVC, các đơn vị nhỏ được sử dụng trong các khu vực nhiều chi tiết như biên của một hình trong khi các đơn vị lớn được sử dụng trong các khu vực nội biên. Kỹ thuật phân vùng ảnh trong HEVC 4.2 So sánh giữa H.264 và H.265 So sánh tốc độ luồng bít giữa HEVC và MPEG2, AVC~MPEG4 HEVC có tỷ lệ nén dữ liệu gấp đôi so với H.264/MPEG-4 AVC ở cùng một mức độ chất lượng video. Nói cách khác nó có thể được sử dụng để cung cấp chất lượng hình ảnh được cải thiện đáng kể tại cùng một tốc độ bit . Hỗ trợ 8K UHD (Ultra high definition television) và độ phân giải lên đến 8192x4320 (4320P) H.265/HEVC cũng mang lại những cải tiến về tiếng ồn, không gian màu sắc và quan trọng nhất để giám sát một phạm vi hoạt động nâng cao. Bảng so sánh các đặc tính kỹ thuật trong H.265 và H.264 Kỹ thuật nén AVC HEVC Đơn vị mã hóa cơ bản Khối 16x16 MB hoặc 8x8,16x16,32x32, 16x32 64x64 Temporal Prediction Square,Symmetric rectangular Spatial Prediction 9+4 maximum modes 33+2 maximum modes Transform Size 4x4,8x8,two-stage 16x16 4x4,8x8,16x16,32x32 plusnon-square versions Transform Type DCT DCT và DST In-Loop Filtering Deblocking Deblocking, SAO Square, Symmetric and Asymmetric rectangular Entropy CABAC hoặc CAVLC CABAC Bảng so tổng hợp thông số bit rate của H.265 so với H.264 Chuẩn mã hóa H.265/HEVC Tỉ lệ bit rate giảm TB so với H.264/MPEG-4 AVC 480p 720p 1080p 4K UHD 52% 56% 62% 64% Ứng dụng các tiêu chuẩn mới trong hầu hết các camera IP sẽ còn phải mất còn vài năm nữa. Thông thường, sau khi tiêu chuẩn được phát triển, phải mất vài năm cho việc sử dụng chúng sau đó mới ứng dụng vào các thị trường khác nhau, bắt đầu với thị trường dành người tiêu dùng và sau đó vào an ninh và các thị trường khác nhỏ hơn. Hiện nay, hầu hết đều sử dụng định dạng mã hóa video hàng đầu là H.264/MPEG-4, được phát triển vào năm 1999 và chỉ gần đây mới trở thành một chuẩn trong thị trường an ninh, hơn một thập kỷ sau khi nó đã được phê duyệt. H.265/HEVC cũng có thể mất vài năm để phổ biến hơn nữa. 4.3.Các sự kiện xoay quanh chuẩn nén mới H.265/HEVC Trong năm 2012 - 29/2/2012, tại Đại hội di động thế giới 2012, Qualcomm trình diễn một bộ giải mã HEVC chạy trên một máy tính bảng Android, với một Qualcomm Snapdragon xử lý lõi kép S4 tốc độ 1,5 GHz - 22/8/2012, Ericsson thông báo rằng bộ mã hóa HEVC đầu tiên của thế giới, Ericsson SVP 5500. Các Ericsson SVP 5500 HEVC mã hóa được thiết kế để mã hóa thời gian thực của video để giao cho các thiết bị di động . - 02/09/2012 Vanguard Software Solutions (VSS) đã công bố phần mềm mã hóa HEVC chạy ở 1080p30 (1920x1080, 30fps) trên một bộ xử lý Intel Xeon duy nhất. Bộ mã hóa này đã được chứng minh tại IBC 2012 - 06/9/2012, Tổng công ty Rovi thông báo rằng một Main Concept SDK cho HEVC sẽ được phát hành vào đầu năm 2013 ngay sau khi HEVC được chính thức phê chuẩn. Các HEVC MainConcept SDK bao gồm một bộ giải mã, mã hóa, và đa vận chuyển cho Microsoft Windows , Mac OS , Linux , iOS , và Android . - 09/09/2012, ATEME chứng minh tại triển lãm thương mại một bộ mã hóa HEVC với độ phân giải 3840x2160p ở 60 fps Trong năm 2013 - 07/01/2013, ViXS System thông báo rằng họ sẽ giới thiệu các phần cứng SoC có khả năng chuyển mã video tới 10 hồ sơ chính của HEVC tại CES 2013. Cùng ngày Tổng công ty Rovi thông báo rằng sau khi tiêu chuẩn HEVC được phát hành rằng họ có kế hoạch hỗ trợ thêm cho HEVC SDK MainConcept - 08/01/2013, Broadcom công bố BCM7445 là một Ultra HD con chip giải mã có khả năng giải mã HEVC lên tới 4096x2160p ở 60 fps - 08/01/2013, Vanguard công bố sự sẵn có của V.265, một phần mềm mã hóa chuyên nghiệp HEVC có khả năng hiệu suất thời gian thực - 04/02/2013, NTT DoCoMo công bố rằng bắt đầu từ tháng ba sẽ bắt đầu cấp giấy phép thực hiện các phần mềm giải mã HEVC. Trong một tài liệu JCT-VC NTT DoCoMo cho thấy bộ giải mã phần mềm HEVC của họ có thể giải mã 3840x2160 ở 60 fps - 19/04/2013, SES công bố lần đầu tiên UltraHD sử dụng các tiêu chuẩn HEVC với độ phân giải 3840x2160 và tốc độ bit 20 Mbit/s - 09/05/2013, NHK và Mitsubishi Electric thông báo rằng họ đã cùng nhau phát triển bộ mã hóa HEVC đầu tiên cho 8K Ultra HDTV, còn được gọi là Super Hi-Vision (SHV) cho phép nó để mã hóa 10-bit video với độ phân giải 7680x4320 ở 60 fps. - 04/06/2013, Tổng công ty Rovi phát hành MainConcept HEVC SDK 1.0 - 08/08/2013, Nippon Telegraph and Telephone bố việc phát hành HEVC-1000 mã hóa phần mềm SDK của họ hỗ trợ 10 Thông tin chính, độ phân giải lên đến 7680x4320, và tỷ lệ khung hình lên đến 120 fps - 21/08/2013, Microsoft phát hành một DirectX Video Acceleration (DXVA) cho HEVC hỗ trợ hồ sơ cá nhân chính. DXVA 2.0 ứng dụng cho các hoạt động: phân tích bitstream, deblocking, nghịch đảo lượng tử mở rộng quy mô, nghịch đảo chế biến, và bồi thường chuyển động. - 11/09/2013, ViXS System công bố XCode 6400 SoC hỗ trợ độ phân giải 4K 60 fps, 10 hồ sơ chính của HEVC, và Re - Từ ngày 12-17/2013 Chương trình IBC tại Amsterdam, HEVC là một chủ đề quan trọng - 29/10/2013, Elemental Technologies công bố hỗ trợ xử lý video thời gian thực 4K HEVC - 14/11/2013, các nhà phát triển DivX công bố thông tin HEVC hiệu suất giải mã sử dụng một CPU i7 Intel 3,5 GHz. DivX 10.1 Beta bộ giải mã có khả năng xử lý 210,9 fps ở 720p, 101.5 fps ở độ phân giải 1080p, và 29,6 fps ở 4K - 18/12/2013, ViXS System thông báo lô hàng của họ XCode 6400 SoC là SoC đầu tiên hỗ trợ 10 hồ sơ chính của HEVC Trong năm 2014 - 15/01/2014, oViCs công bố VIC-1 HEVC bộ giải mã hỗ trợ 10 Thông tin chính lên đến 4K với 120 fps [...]...2.3.1 Chuẩn nén MPEG-1 MPEG -1 được hình thành và năm 1988, là tiêu chuẩn của nhóm chuyên gia về hình ảnh MPEG ở trong giai đoạn đầu tiên (tương ứng với tiêu chuẩn ISO/IEC 11172 của ITU).Mục đích của MPEG -1 là nghiên cứu một tiêu chuẩn mã hoá video và âm thanh kèm theo trong các môi trường lưu trữ như: CD-ROM, đĩa quang … Tốc độ mã hoá trong khoảng 1.5Mb/s Chuẩn nén MPEG -1 bao gồm 4... tra: ISO/IEC 11172 -4 Trong các phần trên ta nghiên cứu một vài thông số trong phần Video (ISO/IEC 11172-2) 2.3.2 Chuẩn nén MPEG-2 Chuẩn nén MPEG -2 là chuẩn nén phát triển tiếp sau MPEG -1, có kế thừa tất cả các tiêu chuẩn của MPEG -1 và mục đích là nhằm hỗ trợ việc truyền video số, tốc độ bít lớn hơn 4 Mb/s, bao gồm các ứng dụng DSM (phương tiện lưu trữ số), Các hệ thống truyền hình hiện tại (NTSC,... Kỹ thuật nén trong ảnh 3.3.1 Sơ đồ mã hóa trong ảnh Intra Frame Ảnh I thực hiện quá trình mã hóa trong ảnh cũng tương tự mã hóa MPEG-2, nhưng cũng có những điểm khác như trình bày ở các phần sau Mã hóa trong ảnh H.264 Trong đó: F’n(reconstoncted): Ảnh khôi phục sẽ được lưu trong Memory để tìm vector chuyển động cho Frame P tiếp theo 3.3.2 Chọn macroblock và thứ tự trong công đoạn nén: Chuẩn nén MPEG-4... các hình ảnh mượt trong các khung hình chuyển động là 120 Frames/s Một thông số các cần được tương thích khi nâng cao số lượng điểm ảnh trong khung hình và số lượng khung hình được sử dụng trong 1s là độ số lượng bit dùng để mã hóa các điểm ảnh hay có thể được coi là độ sâu điểm ảnh Thay vì việc sử dụng 8 bít để mã hóa các tín hiệu truyền hình như trong các hệ thống SD, HD thông thường, các hệ thống truyền. .. (NTSC, PAL, SECAM), cáp, thu lượm tin tức điện tử, truyền hình trực tiếp từ vệ tinh, truyền hình mở rộng (EDTV), truyền hình độ phân giảicao (HDTV)… Chuẩn MPEG -2 bao gồm 4 phần chính: -Các hệ thống: ISO/IEC 13818 -1 -Video: ISO/IEC 13818 -2 -Audio: ISO/IEC 13818 -3 -Các hệ thống kiểm tra: ISO/IEC 13818 -4 2.3.3 Chuẩn nén MPEG-4 Ngày nay, khi nhu cầu truyền phát các ứng dụng video và đa phương tiện mới... Tiêu chuẩn MPEG-7 MPEG (ISO/IEC SC29/WG11) cho ra đời một tiêu chuẩn mới là MPEG-7 với mục đích để mô tả các nội dung Multimedia, chứ nó không phải là chuẩn nén và mã hoá audio,video, ảnh động như các chuẩn nén đã ra đời trước đó CHƯƠNG III CÔNG NGHỆ NÉN ẢNH H.264/MPEG - 4 AVC 3.1 GIỚI THIỆU CHUNG Kể từ khi mới xuất hiện vào đầu những năm 90, chuẩn nén video MPEG-2 đã hoàn toàn thống lĩnh thế giới truyền. .. tiến mới trong lĩnh vực nén không gian Trước hết, bộ lập mã này có thể tiến hành nén không gian tại các macroblock 16x16 điểm ảnh thay vì các block 8x8 như trước đây Điều này giúp tăng cường đáng kể khả năng nén không gian đối với các hình ảnh có chứa nhiều khoảng lớn các điểm ảnh giống nhau Thứ hai là thao tác nén được tiến hành trong miền không gian trước khi công đoạn DCT diễn ra Chuẩn nén MPEG-4... hóa tín hiệu truyền hình có cùng chất lượng CHƯƠNG IV KỸ THUẬT NÉN H.265/HEVC 4.1 Sự ra đời của chuẩn nén mới HEVC Việc nâng cao độ phân giải trong Frame của hệ thống 2K, 4K Tv, đòi hỏi quá trình đồng bộ hóa về việc nâng cao tốc độ số khung hình được sử dụng trong 1s và số lượng bit được sử dụng để mã hóa các Pixels tạo nên độ sâu mức tín hiệu Nếu như ở hệ thống SD, HD hiện tại tốc độ 24 hình/ s cho tốc... hiệu chuẩn 2K, 4K các thông số này trở nên không còn tương thích Trong các bài test với độ phân giải 4K hình ảnh hiển thị ở những vùng có sự chuyển động trên màn hình đặc biệt là trong các chương trình thể thao không còn được rõ nét với tốc độ 24 Frames/s Các hãng chuyên cung cấp giải pháp và thiết bị truyền hình như Harmonic, Miranda đã khuyến cáo tốc độ Frame tối thiểu sử dụng cho tín hiệu truyền hình. .. có trong các chuẩn nén MPEG -1 và MPEG -2 hay các chuẩn nén trước đó Tháng 10 năm 1998 với sự xuất hiện của chuẩn nén MPEG -4 đã tạo ra một phương thức thiếtlập và tương tác mới với truyền thông nghe nhìn trên mạng Internet, tạo ra một phương thức sản xuất, cung cấp và tiêu thụ mới các nội dung video trên cơ sở nội dung và hướng đối tượng (content/object-based) Đây chính là một công nghệ trình diễn truyền

Định dạng
Số trang	38
Dung lượng	1,84 MB