Truyền hình Việt Nam đã trải qua nhiều giai đoạn phát triển, từ truyền hình đen trắng, truyền hình màu và hiện nay truyền hình số đang phát triển mạnh mẽ trên tất cả mọi lĩnh vực: truyền hình cáp, truyền hình số mặt đất DVB-T, truyền hình số qua vệ tinh.
ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ Mai Thị Lan Oanh CÁC CHUẨN NÉN VÀ ỨNG DỤNG TRUYỀN VIDEO TRÊN MẠNG INTERNET KHOÁ LUẬN TỐT NGHIỆP ĐẠI HỌC HỆ CHÍNH QUY Ngành : Điện Tử - Viễn Thông HÀ NỘI - 2005 Mai Thị Lan Oanh - K46 DB - Trang i ĐẠI HỌC CÔNG NGHỆ ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ Mai Thị Lan Oanh CÁC CHUẨN NÉN VÀ ỨNG DỤNG TRUYỀN VIDEO TRÊN MẠNG INTERNET KHOÁ LUẬN TỐT NGHIỆP ĐẠI HỌC HỆ CHÍNH QUY Ngành : Điện Tử - Viễn Thông Cán hướng dẫn: TS Ngô Thái Trị Cán đồng hướng dẫn: TS Đinh Quốc Tuấn HÀ NỘI - 2005 Mai Thị Lan Oanh - K46 DB - Trang ii ĐẠI HỌC CÔNG NGHỆ LỜI CẢM ƠN Em xin bày tỏ lịng kính trọng biết ơn sâu sắc tới thầy giáo, TS.Ngô Thái Trị, người thầy trực tiếp dạy hướng dẫn em tận tình, cho em định hướng ý kiến quý báu cơng nghệ truyền hình Em xin bày tỏ lòng biết ơn sâu sắc tới TS Đinh Quốc Tuấn, người thầy giúp đỡ em nhiều, cho em nhiều kiến thức bổ ích thời gian em thực tập Phịng Cơng Nghệ Thơng Tin – ĐTHVN thời gian em làm luận văn Đồng thời, em xin gửi lời cảm ơn chân thành tới tất Anh, Chị Trung Tâm Tin Học Đo lường – ĐTHVN tạo điều kiện giúp đỡ em tận tình thời gian em thực tập trung tâm Em xin chân thành cảm ơn tất thầy cô Trường Đại Học Công Nghệ- Đại Học Quốc Gia Hà Nội nhiệt tình giảng dạy giúp đỡ em thời gian em học tập trường Con xin gửi đến Bố Mẹ gia đình tình thương yêu lịng biết ơn Bố Mẹ gia đình ln nguồn động viên chỗ dựa vững cho đời Tôi xin cảm ơn bạn lớp động viên giúp đỡ thời gian thực luận văn Vì thời gian có hạn , luận văn em khơng tránh khỏi khiếm khuyết Rất mong nhận góp ý thầy cô bạn Hà Nội 30/5/ 2005 Sinh viên Mai Thị Lan Oanh Mai Thị Lan Oanh - K46 DB - Trang iii ĐẠI HỌC CÔNG NGHỆ TĨM TẮT NỘI DUNG Trong kỹ thuật truyền hình, việc nén Video vấn đề qua trọng cho việc truyền tải chương trình truyền hình Và trở thành vấn đề nóng hổi truyền hình số đời, với tín hiệu Video sau số hố (8 bít) có tốc độ bít 216 Mbít/s, khơng thể truyền kênh truyền hình thơng thường khơng nén Khi đó, chuẩn nén MPEG-2 với tốc độ mã hố từ 4Mbít/s đến 30Mbít/s đưa để thực nhiệm vụ Ngày nay, truyền hình mạng Internet phát triển, chuẩn nén Video H.264/MPEG -4 Part 10 đưa ra, với tốc độ mã hố 1.5Mbít/s có khả tương tác tới đối tượng , phù hợp với môi trường truyền tải mạng Internet Nghiên cứu chuẩn nén MPEG (MPEG -1, MPEG -2, MPEG -4, MPEG -7) - giới thiệu chương chương đặc biệt chuẩn nén H.264/MPEG -4 Part 10 cho ứng dụng nén Video truyền mạng Internet- giới thiệu chương Chương nói chi tiết cách mã hố, giải mã video ưu việt MPEG -4 Part 10 so với chuẩn nén trước Mai Thị Lan Oanh - K46 DB - Trang iv ĐẠI HỌC CÔNG NGHỆ DANH SÁCH CÁC CHỮ VIẾT TẮT ADSL : Asymmetric Digital Subcriber Line CABAC: Context-based Apdaptive Binary Arithmetic Coding CAVLC: Context-based Apdaptive Variable Length Codinh DCT : Discrete Cosine Transform DVB : DVB – Terrestrial DVB-C : DVB – Cable DVB-S : DVB – Satellite DVB-T : Digital Video Broadcasting ES : Elementary Stream FMO : Flexible Macro-Block Ordery GOP : Group of Picture IEC : International Electrotechnical Commission (Part of the ISO) ISO : International Standard Organization ITU : Inernational Telecommunication Union MB : Macro-Block MPEG : Moving Picture Expert Group NTSC : National Television System Committee PAL : Phase Alternative Line RLC : Run Length Coding RVLC : Reversible Variable Length Codes SAD : Summation of Absolute Difference SI : Switching Intra Picture SIF : Source Intermediate Format SP : Switching Prediction Picture VLC : Variable Length Coding VO : Video Object Mai Thị Lan Oanh - K46 DB - Trang v ĐẠI HỌC CÔNG NGHỆ DANH SÁCH CÁC HÌNH Hình 1: Cấu trúc dịng Bít MPEG Video ………………………………………… Hình 2: Cấu trúc ảnh MPEG ……………………………………………………… Hình 3: Nén MPEG ………………………………………………………………… Hình 4: Giải nén MPEG …………………………………………………………… Hình 5: Quá trình biến đổi sang định dạng SIF kích thước mảng điểm ảnh………… ……………………………………………………………………… 12 Hình 6: Tính tốn giá trị cho điểm ảnh lọc thập phân …………… 12 Hình 7: Chuẩn nén MPEG -2 …………………………………………………… 16 Hình 8: Giải mã phân cấp theo SNR …………………………………………… 17 Hình 9: Giải mã phân cấp theo khơng gian ……………………………………… 18 Hình 10: Sự tổ hợp khung hình MPEG -4 ……………………………… 22 Hình 11: Cấu trúc mã hố giải mã Video MPEG -4………………… 23 Hình 12: Profile Level MPEG -4 ……………………………………… 25 Hình 13: Phạm vi MPEG -7…………………………………………………… 28 Hình 14: Truyền hình trực tuyến mạng………………………………………32 Hình 15: Cấu trúc mã hố Video H264…………………………………… 36 Hình 16: Các phần mã hố riêng Profile H264……………………… 37 Hình 17: Sơ đồ mã hố Video H264/MPEG Part 10………………………… 39 Hình 18: Các mode MPEG-4……………………………………………… 42 Hình 19: Phân chia Macro-Block cho bù chuyển động ………………………… 43 Hình 20: Bù chuyển động nhiều Frame – Vector chuyển động, tham số tham chiếu ảnh (∆) truyền đi………………………………………… 45 Hình 21: Ảnh nội suy B (dự đốn hai chiều) ………………………………………46 Hình 22: chuyển đổi sử dụng ảnh SP……………………………………………… 49 Hình 13: Sơ đồ khối CABAC ………………………………………………… 55 Hình 24: Tác dụng lọc tách khối ảnh nén nhiều ………… 56 Hình 25: Sơ đồ giải mã Video H264/MPEG -4 Part 10 ………………………… 57 Hình 26: Ví dụ Mã hố chiều dài biến đổi ngược …………………………… 59 DANH SÁCH CÁC BẢNG BIỂU Bảng 1: Tính chất định dạng ảnh SIF bản: 13 Bảng 2: Tham số theo tiêu chuẩn MPEG -1: .15 Bảng :Bảng thơng số Profiles Levels tín hiệu chuẩn MPEG -2 .20 Mai Thị Lan Oanh - K46 DB - Trang vi ĐẠI HỌC CÔNG NGHỆ MỤC LỤC LỜI CẢM ƠN iii TÓM TẮT NỘI DUNG iv DANH SÁCH CÁC CHỮ VIẾT TẮT v DANH SÁCH CÁC HÌNH vi DANH SÁCH CÁC BẢNG BIỂU vi LỜI MỞ ĐẦU Chương I: KHÁI QUÁT VỀ NÉN TÍN HIỆU VIDEO VÀ CHUẨN NÉN MPEG 1.1 Mục đích nén Video 1.2 Chuẩn nén MPEG 1.2.1 Khái quát nén MPEG 1.2.2 Cấu trúc dòng bit MPEG video 1.2.3 Các loại ảnh chuẩn MPEG : 1.2.4 Nguyên lý nén MPEG 1.2.5 Nguyên lý giải nén MPEG ChươngII: CÁC CHUẨN NÉN MPEG 11 2.1 Chuẩn nén MPEG-1 11 2.1.1 Giới thiệu khái quát 11 2.1.2 Định dạng trung gian SIF (Source Intermediate Format) 11 2.1.3 Cấu trúc dịng bít tham số MPEG-1 14 2.2 Chuẩn nén MPEG-2 16 2.2.1 Giới thiệu MPEG-2 16 2.2.2 Mã hoá giải mã video 16 2.2.3 Profiles Levels 18 2.2.4 MPEG -2 với phát sóng sản xuất chương trình 21 2.3 Chuẩn nén MPEG-4 21 2.3.1 Khái quát MPEG-4 21 2.3.2 Công nghệ mã hoá giải mã video MPEG-4 22 2.3.3 Các Profiles Levels chuẩn MPEG-4 24 2.4 Tiêu chuẩn MPEG-7 26 2.4.1 Giới thiệu chuẩn MPEG-7 26 2.4.2 Đối tượng (Objectives) cách miêu tả liệu MPEG -7 27 2.4.3 Phạm vi ứng dụng tiêu chuẩn MPEG-7 28 ChươngIII: CHUẨN NÉN VIDEO MPEG-4 VÀ ỨNG DỤNG TRONG TRUYỀN HÌNH TRÊN MẠNG INTERNET 29 3.1 Giới thiệu tổng quan truyền hình Internet 29 3.2 Lựa chọn H.264/ MPEG -4 part 10 cho truyền hình mạng Internet 33 3.2.1 Giới thiệu chung H.264 /MPEG-4 part 10 33 3.2.2 Tính kế thừa chuẩn nén H.264/MPEG- part 10 35 3.3 Tiêu chuẩn H.264/MPEG - Part 10 35 3.3.1 Lớp trừu tượng mạng NAL (Network Abstaction Layer) 35 3.3.2 Các Profile Level 36 3.3.3 Kỹ thuật mã hoá video 39 Mai Thị Lan Oanh - K46 DB - Trang vii ĐẠI HỌC CÔNG NGHỆ 3.3.3.2 Các ảnh bù chuyển động dùng H264/MPEG Part 10 40 3.3.3.3 Xác định Vector chuyển động (Motion Estimation) 49 3.3.3.4 Nén video 51 3.3.3.5 Bộ lọc tách khối 55 3.3.4 Kỹ thuật giải mã video 57 3.3.4.1 Bù chuyển động 57 3.3.4.2 Khôi phục lỗi (Error Resiliency) 57 3.3.5 So sánh hiệu mã hoá H264/MPEG Part 10 với tiêu chuẩn trước 59 KẾT LUẬN 61 TÀI LIỆU THAM KHẢO 63 Mai Thị Lan Oanh - K46 DB - Trangviii ĐẠI HỌC CƠNG NGHỆ LỜI MỞ ĐẦU Truyền hình Việt Nam trải qua nhiều giai đoạn phát triển, từ truyền hình đen trắng, truyền hình màu truyền hình số phát triển mạnh mẽ tất lĩnh vực: truyền hình cáp, truyền hình số mặt đất DVB-T, truyền hình số qua vệ tinh Khi Internet phát triển mạnh trở thành hệ thống có quy mơ tồn cầu, trở nên phổ cập nhanh lĩnh vực, việc kết nối chương trình hình với hệ thống viễn thơng – Internet, cơng nghệ truyền hình đời truyền hình Internet Thực tế nay, có nhiều hãng Việt Nam giới cung cấp dịch vụ truyền hình trực tuyến (Online Television), khán giả cần truy cập vào địa Web- Site nhà cung cấp dịch vụ xem trực tiếp chương trình truyền hình theo thời thực real-time(cịn gọi phương thức Dowload and Play)hay tải File chương trình truyền hình máy tính cá nhân (gọi phương thức Dowload Stream-File) Nói kỹ thuật truyền hình có nhiều kỹ thuật như: kỹ thuật ghi hình, kỹ thuật dựng hình, kỹ thuật nén Video, kỹ thuật truyền tải khuôn khổ luận văn này, em xin tìm hiểu kỹ thuật nén Video Vấn đề nén Video truyền hình khơng phải vấn đề mẻ Với cơng nghệ truyền hình đời, có công nghệ nén Video phù hợp Nén Video từ năm 1950 thực công nghệ tương tự với tỷ số nén thấp Ngày công nghệ nén đạt hiệu cao nhờ chuyển đổi tín hiệu Video từ tương tự sang số Với đề tài “Các chuẩn nén ứng dụng truyền Video mạng Internet”, mục đích khố luận em tìm hiểu số chuẩn nén MPEG ứng dụng nén video sử dụng, đặc biệt chuẩn nén H264/MPEG Part 10 Nội dung gồm chương: Chương 1: Lý phải nén tín hiệu Video nén MPEG (Moving Picture Expert Group) nhóm chun gia hình ảnh, với nhiệm vụ xây dựng tiêu chuẩn cho tín hiệu Audio Video số Trong việc nén video, MPEG đạt tỷ số nén tốt so với chuẩn nén trước JPEG, M-JPEG, DV… Chương 2: Giới thiệu khái quát chuẩn nén mà nhóm MPEG xây dựng để nén video lưu trữ Trong đó, MPEG -1 với mục đích mã hố Video âm kèm theo môi trường lưu trữ đĩa CD-ROM, đĩa quang với tốc độ bít 1.5 Mbit/s; MPEG -2 có kế thừa tiêu chuẩn MPEG -1 mục đích nhằm hỗ trợ việc truyền Video số tốc độ bít khoảng – 30 Mbít/s; sau truyền hình Internet đời chuẩn nén tương ứng MPEG -4 với nhiệm vụ nhằm Mai Thị Lan Oanh - K46 DB - Trang ĐẠI HỌC CÔNG NGHỆ phát triển chuẩn xử lý, mã hoá hiển thị ảnh động, audio tổ hợp chúng Còn MPEG -7 chuẩn dùng để mô tả nội dung Multimedia, chuẩn dùng để nén mã hố audio hay ảnh động chuẩn trước Chương 3: nội dung khố luận Em nghiên cứu tìm hiểu kỹ thuật mã hoá Video/ ảnh động sử dụng chuẩn nén H.264/MPEG -4 Part 10 ứng dụng cho truyền hình mạng Internet H264/MPEG Part 10 có nhiều ưu việt việc nén Video so với chuẩn MPEG-2 – thành cơng việc nén video truyền hình kỹ thuật số đời trước Phần cuối phần kết luận, phần tổng kết lại mà em làm khoá luận Đồng thời, Em nêu lên vài nhận định hướng phát triển đề tài Mai Thị Lan Oanh - K46 DB - Trang ĐẠI HỌC CÔNG NGHỆ Chuơng 3: Chuẩn nén Video MPEG -4 ứng dụng truyền hình mạng Internet Hình 22: chuyển đổi sử dụng ảnh SP 3.3.3.3 Xác định Vector chuyển động (Motion Estimation) Trong thực DCT lượng tử hóa phục vụ cho nén khơng gian bên Frame, xác định vetor chuyển động sử dụng để nén dư thừa thời gian, ví dụ miền thời gian qua hai Frame liên tiếp Để làm cảnh tiêu biểu, từ phim truyện ví dụ từ 25 – 30 frame liên tiếp hiển thị giây tivi hay máy chiếu phim Tuy nhiên, không may vài giây bất kỳ, chuỗi hình ảnh lưu lại giống nhau.Phơng khơng thay đổi tất cả, đặc tính cịn lại tương tự Frame liên tiếp giống Việc xác định vetor chuyển động thực phép phân tích hai frame liên tiếp xác định miền hình ảnh có thay đổi hay chuyển động ảnh Trong nhiều trường hợp miền lưu lại xác ảnh dự đốn đủ từ mã hoá đến giải mã để hiển thị miền ảnh dự đốn Nếu miền di chuyển theo hướng xác định, thuật toán xác định vetor chuyển động điều khiển trình giải mã để sử dụng mảnh (piece) hình ảnh ảnh dự đốn, để di chuyển lượng định hướng xác định Trên thực tế điều hoàn thành việc gửi vetor chuyển động dịng bít MPEG -4 Vetor dẫn để giải mã việc chọn phần thích hợp ảnh giải mã trước sử dụng thiết lập lại dịng khung hình Nó làm tỷ lệ nén cao Trên thực tế, vài loại nội dung nén với phạm vi lớn dẫn tới thiếu hành động hình ảnh Một ví dụ “lời mở Mai Thị Lan Oanh - K46 DB- Trang 49 ĐẠI HỌC CÔNG NGHỆ Chuơng 3: Chuẩn nén Video MPEG -4 ứng dụng truyền hình mạng Internet đầu” nội dung , người phát viên, tạo dịng MPEG -4 nén chặt Đó điều mong đợi, việc xác định vector chuyển động hàm ước lượng cao Việc tìm kiếm qua hình ảnh cho tất vật (các vùng) thay đổi vị trí cần đến nhiều tính tốn.Tuy nhiên có 1/15 đến 1/30 giây để làm điều trước khung đến để xử lý Để hiểu tốt cách khác việc thực xác định vector chuyển động, quan sát kỹ thao tác bàn tay Về bản, việc xácđịnh vector chuyển động cần chia hình ảnh thành khối nhỏ lấy khối thời gian vị trí khác phía ảnh trước để xác định khớp Việc so khớp làm việc tính tốn khác điểm ảnh (pixel) khối ảnh việc so khớp vị trí ảnh trước Như vậy, số (giá trị SAD “Summation of Absolute Difference” = tổng khác tuyệt đối) thu biểu thị “how well- tốt nào” khối riêng biệt thích hợp với vị trí ảnh trước Nếu giá trị SAD khơng (zero) nghĩa điểm ảnh (pixel) xác vị trí ảnh trước đó, vị trí cho khối tìm Nếu khơng vị trí khớp hồn tồn, thuật tốn có hai lựa chọn : - Đầu tiên : kết luận tất khác lớn nghĩa câu hỏi đặt thực thể không tồn ảnh trước hay di chuyển xa so với vị trí trước hay vị trí sau - Trong trường hợp thứ hai, giá trị SAD nhỏ khác không (nonezero) chấp nhận thoả mãn nhiên thoả mãn khơng hồn tồn Trong tiêu chuẩn MPEG -4, với 16 x 16 điểm ảnh khối thoả mãn cho tất vị trí vùng tìm kiếm, phạm vi xa từ vị trí gốc khối (block) di chuyển hai khung (frame) Điển hình vùng tìm kiếm +/- 16 điểm ảnh Khi đó, với vị trí tìm kiếm 256(=16 x 16) điểm ảnh block so sánh với ảnh trước Với định dạng CIF độ phân giải (352 x 288) 30 ảnh (frame) giây (frame/s) cho dòng video, số so sánh sau: - Mỗi Macro-Block có: 16 x 16 = 256 pixel; - Mỗi Macro-BLock thoả mãn vị trí tìm kiếm là: 16 x 16 =256; - Mỗi khung hình (frame) bao gồm 396 block; Mai Thị Lan Oanh - K46 DB- Trang 50 ĐẠI HỌC CÔNG NGHỆ Chuơng 3: Chuẩn nén Video MPEG -4 ứng dụng truyền hình mạng Internet - 30 khung hình xử lý giây Như vậy, tổng khác (cả cộng trừ) giây kết là: 256 x 256 x 396 x 30 = 778.567.680 Ví dụ xử lý đa có khả thực việc cộng trừ chu kỳ đồng hồ, xử lý cần chạy với tần số 779 MHz để thực xác định vector chuyển động Có hai giải pháp tiêu biểu sau: Nhẹ nhàng dùng thuật tốn tối ưu Có trợ giúp phần cứng xác định vector chuyển động 3.3.3.4 Nén video Nén theo miền thời gian Những dư thừa mặt thời gian hình ảnh giống lặp lặp lại từ khung sang khung khác, ví dụ khung khơng chuyển động chương trình đối thoại truyền hình Vì vậy, để giảm bớt độ dư thừa ta phải tiến hành nén theo miền thời gian Khi mã hoá hoạt động chế độ “giữa khối”, khối phải qua cơng đoạn hiệu chỉnh chuyển động Q trình phát chuyển động diễn khối khối tương ứng một ảnh tham chiếu lưu trữ từ trước, sau tạo khối “chênh lệch” “lỗi” thao tác làm giảm bớt liệu Block cách hiệu phải biểu diễn chuyển động mà thơi Tiếp đến công đoạn biến đổi Cosine rời rạc DCT để bắt đầu nén theo miền không gian Khi mã hoá hoạt động chế độ “trong khối”, khối bỏ qua công đoạn hiệu chỉnh chuyển động tới thẳng công đoạn DCT Nén theo miền không gian Dư thừa mặt không gian khối có chứa điểm ảnh tương tự giống hệt Trong nhiều trường hợp điểm ảnh thường khơng thay đổi nhiều Như có nghĩa tần số thay đổi giá trị điểm ảnh khối thấp Những khối gọi khối có tần số khơng gian thấp Bộ lập mã lợi dụng đặc điểm cách chuyển đổi giá trị điểm ảnh khối thành thông tin tần số công đoạn biến đổi Cosine rời rạc Mai Thị Lan Oanh - K46 DB- Trang 51 ĐẠI HỌC CÔNG NGHỆ Chuơng 3: Chuẩn nén Video MPEG -4 ứng dụng truyền hình mạng Internet * Biến đổi Cosine rời rạc (DCT) Biến đổi Cosine hàm mà làm biến đổi liệu hỉnh ảnh thể hệ toạ độ X-Y sang miền tần số Công đoạn DCT biến đổi giá trị điểm ảnh khối thành mạng lưới gồm hệ số ngang dọc đặt không gian tần số Khi khối ban đầu có tần số khơng gian thấp, DCT tập hợp lượng tần số vào góc tần số thấp mạng lưới Nhờ vậy, hệ số tần số thấp góc có giá trị cao Một số lượng lớn hệ số khác lại mạng lưới hệ số có tần số cao, lượng thấp có giá trị thấp Tại đây, hệ số DC vài hệ số tần số thấp hàm chứa phần lớn thông tin mô tả khối ban đầu Có nghĩa lập giải mã loại bỏ phần lớn hệ số tần số cao lại mà khơng làm giảm chất lượng hình ảnh khối Bộ lập mã chuẩn bị hệ số cho công đoạn cách quét chéo mạng lưới theo đường zig-zag, hệ số DC qua vị trí hệ số ngang dọc tăng dần Do tạo chuỗi hệ số xếp theo tần số Ưu điểm độc đáo H264/MPEG Part 10 chỗ sử dụng biến đổi không gian nguyên(gần giống với DCT) khối x điểm ảnh Ta xét biến đổi nguyên cho cấu trúc x sau: + Cho hệ số DCT khối liệu đầu vào x F, cơng thức xác cho : X=HFHT (1) Trong ma trận H HT ma trận chuyển vị ma trận H Các giá trị a,b, c : Tuy nhiên đơn giản ta cho giá trịc =0.5 để đảm bảo tính trực giao giá trị a, b lựa chọn sau: Mai Thị Lan Oanh - K46 DB- Trang 52 ĐẠI HỌC CÔNG NGHỆ Chuơng 3: Chuẩn nén Video MPEG -4 ứng dụng truyền hình mạng Internet Do phép nhân trình biến đổi tránh phải kết hợp với q trình lượng tử hố, phương trình (1) viết thành : Trong : + Ma trận H cho : + Ma trận SF : biểu diễn phép nhân tích trực tiếp phần tử với phần tử (the element by Ký hiệu element multiplication ) ma trận tương ứng So sánh với MPEG-2, ta thấy Slice có khối chứa giá trị hệ số DC khối có giá trị có giá trị khác nhau, khối gán thêm giá trị dự đoán khối, tạo thành chuỗi dịng khối Cịn với MPEG4 dự đoán xa Chỉ cần khối dự đốn tồn hàng hệ số dự đốn tồn cột bên trái hệ số từ khối * Lượng tử hố Q trình lượng tử hố q trình biến đổi có thơng tin, làm giảm bớt số lượng bít cần thiết để biểu diễn hệ số Dựa hệ số tỷ lệ xích (có thể điều chỉnh mã hố), lượng tử hoá cân đối tất giá trị hệ số Do phần lớn hệ số từ DCT mang lượng cao giá trị thấp nên lượng tử hoá bắt đầu số giá trị cao đầu chuỗi, theo sau hàng dài hệ số Mai Thị Lan Oanh - K46 DB- Trang 53 ĐẠI HỌC CÔNG NGHỆ Chuơng 3: Chuẩn nén Video MPEG -4 ứng dụng truyền hình mạng Internet lượng tử hố Bộ lập mã Entropy theo dõi số lượng giá trị liên tiếp chuỗi mà khơng cần mã hố chúng, nhờ vật giảm bớt khối lượng liệu chuỗi Để lượng tử hóa hệ số biến đổi, H264/MPEG Part 10 dùng phương pháp lượng tử hóa vơ hướng Các lượng tử hoá lựa chọn cho Macro-Block dựa vào tham số lượng tử hoá QP (Quantization Parameter) Các lượng tử hoá xếp cho có tăng khoảng 12.5% kích thước bước lượng tử hoá QP tăng đơn vị Nhìn chung hệ số biến đổi lượng tử hoá khối quét zig-zag truyền nhờ dùng phương pháp mã hoá Entropy * Mã hoá Entropy Mã hố Entropy tiêu chuẩn trước MPEG -1,2,4, H.261, H.263 bảng cố định mã hoá biến đổi theo chiều dài (VLC) Các tiêu chuẩn xác định mã hoá từ phân bố xác suất video chung thay cho mã Huffman xác đến chuỗi video Tuy nhiên H.264 sử dụng VLC khớp với biểu tượng mã hoá đặc trưng ngữ cảnh Tất phần tử cú pháp, ngoại trừ liệu dư thừa, mã hoá mã ExpGolomb Để mà đọc liệu dư thừa (các hệ số biến đổi lượng tử hố) ta sử dụng phương pháp qt Zig-Zag (xen kẽ nhau) hay quét (không xen kẽ hay phân trường) Để mã hoá liệu dư thừa, phương pháp phức tạp gọi CAVLC(mã hoá chiều dài biến đổi tương thích theo tình huống) phát triển Ngồi ra, CABAC (mã hố thuật tốn nhị phân tương thích theo tình huống) phát triển Mail Profile High Profile, CABAC có khả mã hố tốt độ phức tạp cao so với CAVLC + Mã hố chiều dài biến đổi tương thích theo tình - Context-based Adaptive Variable Length Coding (CAVLC) Sau biến đổi lượng tử hoá, xác suất hệ số zero hay +/-1 lớn CAVLC xử lý hệ số zero +/-1 theo cách khác với mức hệ số Tổng số số zero +/-1 mã hoá Các hệ số khác mức chúng mã hố + Mã hố thuật tốn nhị phân tương thích theo tình – Context –based Adaptive Binary Arithmetic Coding (CABAC) CABAC dùng thuật toán để mã hoá, để đạt hiệu nén tốt hơn, mơ hình có khả cho phần tử biểu tượng cập nhật hình 28 Q trình xử lý mã hố CABAC bao gồm bước sau đây: Mai Thị Lan Oanh - K46 DB- Trang 54 ĐẠI HỌC CÔNG NGHỆ Chuơng 3: Chuẩn nén Video MPEG -4 ứng dụng truyền hình mạng Internet Cập nhật ước lượng xác suất Mơ hình hố tình Nhị phân hoá Ước lượng xác suất Phương tiện mã hoá Bộ mã hố thuật tốn nhị phân tương thích Hình 23: Sơ đồ khối CABAC - Bước 1: Nhị phân hố; biểu tượng giá trị khơng phải nhị phân (như hệ số biến đổi hay Vector chuyển động) đồ để chuỗi nhị phân trước mã hố thuật tốn Quá trình xử lý giống việc xử lý việc biến đổi biểu tượng liệu thành mã hoá chiều dài biến đổi, mã nhị phân mã hoá tốt mã hoá thuật tốn trước để truyền - Bước 2: phạm vi làm mơ hình: phạm vi mơ hình có khả cho hay nhiều phần tử biểu tượng nhị phân Một mơ hình có khả lựa chọn để việc lựa chọn tương ứng phụ thuộc vào phần tử cú pháp mã hố trước - Bước 3: thuật toán mã hoá nhị phân:Một mã hoá thuật tốn mã hố phần tử theo mơ hình có khả lựa chọn với việc cập nhật mơ hình tiếp sau 3.3.3.5 Bộ lọc tách khối Một đặc trưng riêng mã hoá dựa sở khối nhìn thấy cấu trúc khối Các mép khối cấu trúc lại với độ xác phần tử ảnh (pixel) bên nhìn chung dạng khối (blocking) xem nhiễu “artifact” dễ nhìn thấy với phương pháp nén Do nguyên nhân mà H.264/MPEG-4 Part 10 sử dụng lọc tách khối (Deblocking Filter) để làm giảm tượng tách khối, ngăn chặn việc truyền tạp âm mã hố tích luỹ Tại lọc này, cường độ lọc điều khiển giá trị nhiều phần tử cấu trúc Các chuẩn nén trước khơng sử dụng lọc tách khối việc bổ sung phức tạp, mặt khác việc chia nhiễu khối làm giảm việc sử dụng MC xác nửa phần tử ảnh Một nửa phần tử ảnh thu cách lọc tuyến tính (bilinear filtering)của phần tử ảnh nguyên vẹn bên cạnh phát huy vai trị làm “nhẵn” mã hố tạp âm miền phần tử ảnh nguyên vẹn Mai Thị Lan Oanh - K46 DB- Trang 55 ĐẠI HỌC CÔNG NGHỆ Chuơng 3: Chuẩn nén Video MPEG -4 ứng dụng truyền hình mạng Internet H.264 sử dụng lọc tách khối để việc thực việc mã hoá cao việc thực phức tạp Việc lọc áp dụng cho mép Block x Macro-Block Quá trình điều khiển lọc tách khối thành phần chói thực cạnh mẫu 16 x 16 (16-sample) trình xử lý lọc tách khối cho thành phần màu thực cạnh mẫu x Bộ lọc tách khối áp dụng tương thích với vài mức(level) sau: - Mức mảng (Slice Level): Mặt mạnh của việc lọc toàn điều chỉnh tới đặc điểm riêng chuỗi video - Mức cạnh khối (Block – edge Level ): mặt mạnh việc lọc phụ thuộc vào việc định dự đoán Inter/Intra, chuyển động khác nhau, việc hiển thị dư thừa mã hoá Block tham gia Đặc biệt việc lọc mạnh áp dụng cho Macro-Block với đặc điểm phẳng để loại bỏ “sự nghiêng nhân tạo (tilting artifacts)” - Mức lấy mẫu (Sample Level): giá trị mẫu điểm bắt đầu phụ thuộc vào lượng tử hóa dừng việc lọc cho mẫu riêng biệt Tính khối bị giảm mà không ảnh hưởng nhiều đến độ sắc nét nội dung, kết cải thiện đáng kể chất lượng hình ảnh Hình 24: Tác dụng lọc tách khối ảnh nén nhiều Trái: khơng có lọc tách khối; Phải: có lọc tách khối Mai Thị Lan Oanh - K46 DB- Trang 56 ĐẠI HỌC CÔNG NGHỆ Chuơng 3: Chuẩn nén Video MPEG -4 ứng dụng truyền hình mạng Internet 3.3.4 Kỹ thuật giải mã video Dịng Bít đầu vào Giải mã Entropy Giải lượng tử hoá & + ∑ Biến đổi ngược + Bộ lọc tách khối Lựa chọn Inter/Intra Mode Video đầu Bộ đệm ảnh Ảnh dự đốn Bù chuyển động Hình 25: Sơ đồ giải mã Video H264/MPEG -4 Part 10 3.3.4.1 Bù chuyển động Bù chuyển động thực việc thiết lập lại khung hình (frame) sở Vector nhận được, liệu khung hình delta nhận (dữ liệu khác hai khung hình liên tiếp) hình ảnh mã hố trước Vì vậy, liệu delta nhận, dịng khung hình thiết lập lại việc cộng liệu khung hình delta với liệu từ khung hình giải mã trước vị trí riêng dẫn Vector chuyển động nhận 3.3.4.2 Khôi phục lỗi (Error Resiliency) Một nhiệm vụ quan trọng giải mã làm thích hợp khôi phục lại từ lỗi chắn xảy ra, đặc biệt kết nối qua liên kết dễ xảy lỗi mạng không dây Lỗi đàn hồi bao gồm ba loại kỹ thuật khác sử dụng lỗi phát Việc phát lỗi xảy trường hợp sau: - Trong trường hợp có lỗi, lỗi thực phát hiện; - Trong trường hợp có lỗi, lỗi khơng phát hiện; - Trong trường hợp khơng có lỗi, giải mã biết khơng có lỗi; Nếu lỗi phát hiện, hệ thống giải mã lỗi đàn hồi cố gắng che giấu lỗi Các đặc trưng lỗi đàn hồi bổ sung hệ thống MPEG -4 việc sử Mai Thị Lan Oanh - K46 DB- Trang 57 ĐẠI HỌC CÔNG NGHỆ Chuơng 3: Chuẩn nén Video MPEG -4 ứng dụng truyền hình mạng Internet dụng tiêu chuẩn thiết lập công cụ cung cấp tiêu chuẩn MPEG -4 để phát lỗi Cho hệ thống MPEG -4 tương thích, có khả làm việc với hệ thống MPEG -4 khác, phải tn theo cơng cụ chuẩn hố phát lỗi Tuy nhiên, phương pháp mà công cụ bổ sung làm tăng nơi cung cấp Codec, theo cách đó, làm cho tốt xấu thiết lập thuật tốn hệ thống tương thích hồn tồn với tiêu chuẩn MPEG -4 Đồng lại ( Resynchronisation) Bộ cơng cụ Đồng lại cố gắng để đồng lại giải mã dịng bít sau lỗi hay loạt lỗi phát Nhìn chung, liệu điểm đồng trước bị lỗi điểm nơi mà đồng thiết lập lại, loại bỏ Nếu phương pháp đồng lại có ảnh hưởng đến việc xác định số lượng liệu bị loại bỏ giải mã, khả loại công cụ khác để khôi phục liệu hay để che giấu ảnh hưởng lỗi phải nâng cấp nhiều Khơi phục liệu (Data Recovery) Sau đồng vừa thiết lập lại, công cụ khôi phục liệu cố gắng khôi phục lại liệu thường bị Các cơng cụ khơng đơn giản mã hố lỗi, mà kỹ thuật địi hỏi cao mã hoá liệu cho loại lỗi đàn hồi Ví dụ, cơng cụ riêng vừa xác nhận nhóm Video (Video Group) mã hoá chiều dài biến đổi ngược RVLC (Reversible Variable Length Codes) Trong phương pháp này, từ mã hoá chiều dài biến đổi thiết kế để đọc hướng tiến hướng lùi Hình 26 minh hoạ cho ví dụ sử dụng RVLC hình Nhìn chung, tình vậy, nơi mà tăng vọt lỗi làm sai lạc phần liệu, tất liệu hai điểm đồng bị Tuy nhiên, hình 26, RVLC làm cho vài liệu khôi phục Chú ý đến thông số QP HEC hình sau thể trường dành riêng (Field Reserved) phần đầu header gói video cho thơng số lượng tử hoá mã hoá mở rộng header, theo thứ tự định sẵn Mai Thị Lan Oanh - K46 DB- Trang 58 ĐẠI HỌC CÔNG NGHỆ Chuơng 3: Chuẩn nén Video MPEG -4 ứng dụng truyền hình mạng Internet Hình 26: Ví dụ Mã hoá chiều dài biến đổi ngược 3.3.5 So sánh hiệu mã hoá H264/MPEG Part 10 với tiêu chuẩn trước Qua q trình tìm hiểu kỹ thuật mã hoá H264/MPEG Part 10 MPEG-2, ta thấy số ưu điểm H264/MPEG Part 10 so với MPEG-2 là: • Dự đốn hệ số AC/DC mà hệ số Macro-Block dự đốn từ hệ số Macro-Block bên cạnh từ số liệu thân Macro-Block Việc giải mã Macro-Block phải thay đổi khác với thuật toán dịng bít đơn giản trước để đưa vào số tính tốn cho hệ số • Các cơng cụ toán học CAVLC CABAC cho cải thiên đáng kể mã hố Entropy • Trong bù chuyển động MPEG-2 Part hạn chế đến nội suy hai chiều ½ pixel H264/MPEG Part 10 cho phép Vector chuyển động xác đến ¼ pixel sau dùng nội suy nhiều chiều(Bi-cubic) Nội suy nhiều chiều tạo thích hợp cho Macro-Block , giảm lượng lưu ảnh lỗi, làm giảm số bít cần phải mã hố Tuy nhiên nội suy nhiều chiều địi hỏi nhiều thuật toán hơn, phức tạp thực bù chuyển động cao • Việc dùng lọc tách khối hai phía mã hố giải mã làm giảm không liên tục biên khối hệ số chất lượng khác sử dụng cho khối cạnh gây Điều làm giảm nhiễu khối thường thấy mã hố MPEG-2 tốc độ bít thấp nằm vịng bù chuyển động, mã hố giải mã cịn đồng Cơng cụ có ảnh hưởng đến tính phức tạp mã hố giải mã số biên khối thực tế lọc tách khối thực module riêng biệt Mai Thị Lan Oanh - K46 DB- Trang 59 ĐẠI HỌC CÔNG NGHỆ Chuơng 3: Chuẩn nén Video MPEG -4 ứng dụng truyền hình mạng Internet • Kích thước khối thay đổi từ 16 x 16 xuống cịn x Khi kích thước khối giảm cung cấp độ lợi mã hố mà khơng có tăng đáng kể tính phức tạp • Các Header tương đối lớn MPEG-2(trong Sequence, Picture, Slice ) để biểu diễn OverHead cố định dòng liệu OverHead không đáng kể tốc độ Mb/s tốc độ vài trăm Kb/s chúng dễ nhận thấy Vì H264/MPEG Part 10 thực Header hiệu Qua trình thực nghiệm cho tiết kiệm tốc độ bít trung bình H264/MPEG Part 10 so với MPEG-2 khoảng 65% Như hiệu nén H264/MPEG Part 10 tăng lên đáng kể Hiệu nén tăng H264/MPEG Part 10 tạo phạm vi ứng dụng hội kinh doanh Mai Thị Lan Oanh - K46 DB- Trang 60 ĐẠI HỌC CÔNG NGHỆ Kết luận KẾT LUẬN Khoá luận “Các chuẩn nén ứng dụng truyền Video mạng Internet” đạt số kết sau: Nêu lên truyền hình mạng Internet cách thức truy cập để xem chương trình truyền hình Tìm hiểu nguyên tắc chung việc nén tín hiệu video nhóm MPEG nén ảnh nén liên ảnh kết hợp với dự đoán bù chuyển động- đầy khác biệt so với chuẩn nén JPEG, M-JPEG… trước Và tập hợp chuẩn nén MPEG, chuẩn nén khác có nhiệm vụ khác đặt Với MPEG-1 nhiệm vụ mã hố âm hình ảnh để lưu trữ thiết bị lưu trữ như: CD-ROM, đĩa quang… sử dụng định dạng trung gian cho nguồn tín hiệu SIF để phù hợp với hệ thống quét truyền hình khác MPEG -2 kế thừa tất tiêu chuẩn MPEG -1 mục đích nhằm hỗ trợ cho việc truyền Video số, MPEG -2 chia ảnh thành Macro-Block sử dụng phương pháp nén ảnh với ảnh I nén liên ảnh kết hợp dự đoán bù chuyển động với ảnh P ảnh B Tỷ số nén MPEG -2 tốt nhiều so với MPEG -1 MPEG -4 với nhiệm vụ nhằm phát triển chuẩn xử lý, mã hoá hiển thị ảnh động, audio tổ hợp chúng MPEG -4 khác so với MPEG -2 khung hình khơng mã hố tồn khung hình mà miêu tả đối tượng riêng rẽ sau mã hố đối tượng MPEG -4 chia Macro-Block thành Block nhỏ Trong bù chuyển động MPEG-2 Part hạn chế đến nội suy hai chiều ½ pixel H264/MPEG Part 10 cho phép Vector chuyển động xác đến ¼ pixel sau dùng nội suy nhiều chiều(Bi-cubic) Và cịn nhiều điểm ưu việt khác Do hiệu nén chuẩn nén MPEG -4 tốt so với MPEG -2 MPEG -7 chuẩn dùng để mô tả nội dung Multimedia, chuẩn cho nén mã hoá audio/ảnh động MPEG-1, MPEG-2 hay MPEG-4 MPEG-7 sử dụng ngôn ngữ đánh dấu mở rộng XML(Extansible Markup Language) để lưu trữ siêu liệu Metadata, đính kèm timecode để gắn thẻ cho kiện, hay đồng liệu Với nhiều tính ưu việt trên, hướng đặt là: liệu MPEG -4 sử dụng cho việc lưu trữ MPEG -1 hay dùng cơng nghệ truyền hình số MPEG -2 Thực tế cho thấy, ứng dụng mơi trường mạng nói chung truyền hình tương tác nói riêng – theo APB(04/2004)- Đài Truyền hình Nhật Bản NHK, TBS, NTV TV Asahi TV Tokyo thức chấp nhận đưa chuẩn Mai Thị Lan Oanh - K46 DB- Trang 61 ĐẠI HỌC CÔNG NGHỆ Kết luận H264/MPEG Part 10 cho phát sóng số mặt đất, cho thu di động, khả khả tiềm ẩn chuẩn mã hố trình diễn video H264/MPEG Part 10 Do vậy, đề tài nghiên cứu bước nghiên cứu ứng dụng H264/MPEG Part 10 cho truyền hình số cho thu di động hay cải tạo chất lượng truyền hình Internet để đạt chất lượng hình ảnh tốt truyền hình số Mai Thị Lan Oanh - K46 DB- Trang 62 ĐẠI HỌC CÔNG NGHỆ TÀI LIỆU THAM KHẢO [1] Đinh Quốc Tuấn - Đề tài nghiên cứu khoa học cấp nghành “Truyền hình mạng Internet giải pháp cung cấp chương trình VTV qua mạng Internet ”, Trung tâm tin học Đo lường – ĐTHVN, Hà Nội – 7/2004 Đỗ Hoàng Tiến, Vũ Đức Lý - Truyền hình số, Nhà xuất Khoa Học Kỹ Thuật, Hà Nội – 2001 Ngô Thái Trị - Truyền hình số, Hà Nội – 2002 Nguyễn Minh Hồng – Chuyên đề “Chuẩn nén MPEG -4 khả ứng dụng truyền hình”, Trung tâm Tin học Đo lường – ĐTHVN,Hà Nội-1/2001 Nội san Khoa học Kỹ thuật Truyền hình – số năm từ 2001-2005 H.264 & IPTV Over DSL – White Paper On H264/MPEG-4 -2004, http://www.envivio.com Hantro Products Oy, Oulu, Finland “ MPEG4 Codec Overview ” ISO/IEC JTC1/SC29/WG11 N4030 March 2001- http://www.hantro.com [2] [3] [4] [5] [6] [7] [8] José M Martínez (UAM-GTI, ES) ,“MPEG-7 Overview“- ISO/IEC JTC1/SC29/WG11N5525 Pattaya, March 2003 - http://www.mp7c.org/ [9] Ralf Schäfer, Thomas Wiegand and Heiko Schwarz - “The emerging H.264/AVC Standard “- EBU TECHNICAL REVIEW – January 2003 Soon-kak Kwon, A Tamhankar, K.R Rao - “Overview of H.264 / MPEG-4 Part 10 ” http://www.mpeg.org [10] [11] Thomas Wiegand, Gary J Sullivan, Gisle Bjontegaard, and Ajay Luthra “Overview of the H.264 / AVC Video Coding Standard ” - IEEE TRANSACTIONS ON CIRCUITS AND SYSTEMS FOR VIDEO TECHNOLOGY, JULY 2003 [12] http://www.vtc.com.vn., http://www.vdconline.com Mai Thị Lan Oanh - K46 DB- ĐẠI HỌC CÔNG NGHỆ ... chuẩn nén đời như: JPEG, M-JPEG, MPEG, DV… Trong chuẩn nén MPEG sử dụng nhiều nén video truyền hình với thành cơng chuẩn nén video MPEG-2 truyền hình số chuẩn nén MPEG-4 truyền hình mạng Internet. .. ứng dụng truyền hình mạng Internet Mai Thị Lan Oanh - K46 DB- Trang 31 ĐẠI HỌC CÔNG NGHỆ Chuơng 3: Chuẩn nén Video MPEG -4 ứng dụng truyền hình mạng Internet Hình 14: Truyền hình trực tuyến mạng. .. ChươngIII: CHUẨN NÉN VIDEO MPEG-4 VÀ ỨNG DỤNG TRONG TRUYỀN HÌNH TRÊN MẠNG INTERNET 3.1 Giới thiệu tổng quan truyền hình Internet Truyền hình Việt Nam trải qua nhiều giai đoạn phát triển, truyền hình