CÁC CÔNG NGHỆ NÉN TÍN HIỆU VIDEO TRONG TRUYỀN HÌNH SỐ

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang	58
Dung lượng	578,05 KB

Nội dung

CÁC CÔNG NGHỆ NÉN TÍN HIỆU VIDEO TRONG TRUYỀN HÌNH SỐ Nén nhằm giảm tốc độ bit của các dòng dữ liệu tốc độ cao mà vẫn đảm bảo chất lượng hình ảnh hoặc âm thanh cần truyền tải. Tín hiệu Video sau khi được số hoá (8 bit) có tốc độ bằng 216 Mb/s. Để có thể truyền trong một kênh truyền hình thông thường, thì tín hiệu video số cần phải được nén trong khi vẫn đảm bảo được chất lượng hình ảnh. Chương 2 nêu các nội dung này nhằm xây dựng nội dung lý luận cho các giải pháp sẽ đưa ra trong chương tiếp theo (chương 3) về ứng dụng công nghệ nén trong sản xuất chương trình truyền hình. 2.1. Tổng quan về kỹ thuật nén Video số 2.1.1. Khái niệm chung 2.1.1.1. Mục đích của nén Video số Nén video có hai lợi ích quan trọng thấy rõ: Thứ nhất: nén video giúp chúng ta có thể sử dụng nguồn video số đã được mã hoá để truyền đi hay lưu trữ một cách có hiệu quả ngay cả trên những môi trường truyền dẫn không hỗ trợ những file video chưa được nén lúc đầu. Ví dụ, một đĩa DVD sẽ chỉ có thể chứa được vài giây một đoạn video nguyên bản không qua nén ở độ phân giải và tốc độ khung hình tương đương với chất lượng tương ứng trên tivi truyền hình sẽ không thể sử dụng như lý giải ở trên. Thứ hai: quá trình nén video cho phép việc sử dụng những nguồn video đã qua nén cho quá trình lưu trữ hay truyền đi một cách có hiệu quả. Ví dụ, với một kênh truyền dẫn tốc độ cao, việc lựa chọn và truyền đi một video nén với độ phân giải cao thậm chí cả những luồng video nén là hợp lý hơn nhiều so với việc sẽ truyền đi một video đơn lẻ với độ phân giải thấp hay từng luồng video chưa qua nén. 2.1.1.2. Bản chất của nén Khác với nguồn dữ liệu một chiều nh− nguồn âm, đặc tuyến đa chiều của nguồn hình ảnh cho thấy: nguồn ảnh chứa nhiều sự d− thừa hơn các nguồn thông tin khác. Đó lμ:  Sự d− thừa về mặt không gian (spatial redundancy): Các điểm ảnh kề nhau trong một mμnh có nội dung gần giống nhau.  Sự d− thừa về mặt thời gian (temporal redundancy): Các điểm ảnh có cùng vị trí ở các mμnh kề nhau rất giống nhau.  Sự d− thừa về mặt cảm nhận của con ng−ời: Mắt ng−ời nhạy cảm hơn với các thμnh phần tần số thấp vμ ít nhạy cảm với sự thay đổi nhanh, tần số cao. Do vậy, có thể coi nguồn hình ảnh lμ nguồn có nhớ (memory source). Nén ảnh thực chất lμ quá trình sử dụng các phép biến đổi để loại bỏ đi các sự d− thừa vμ loại bỏ tính có nhớ của nguồn dữ liệu, tạo ra nguồn dữ liệu mới có l−ợng thông tin nhỏ hơn. Đồng thời sử dụng các dạng mã hoá có khả năng tận dụng xác suất xuất hiện của các mẫu sao cho số l−ợng bít sử dụng để mã hoá một l−ợng thông tin nhất định lμ nhỏ nhất mμ vẫn đảm bảo chất l−ợng theo yêu cầu. Nhìn chung quá trình nén vμ giải nén có thể lý giải một cách đơn giản nh− hình 2.1. Dữ liệu Dữ liệu Dữ liệu đã nén Biến đổi Mã hoá Giải mã Biến đổi ngược Dữ liệu đã nén Quá trình nén Quá trình giải nén Hình 2.1: Sơ đồ khối quá trình nén vμ giải nén  Biến đổi: Một số phép biến đổi vμ kỹ thuật đ−ợc sử dụng để loại bỏ tính có nhớ của nguồn dữ liệu ban đầu, tạo ra một nguồn dữ liệu mới t−ơng đ−ơng chứa l−ợng thông tin ít hơn. Ví dụ nh− kỹ thuật tạo sai số dự báo trong công nghệ DPCM hay phép biến đổi cosin rời rạc của công nghệ mã hoá chuyển đổi. Các phép biến đổi phải có tính thuận nghịch để có thể khôi phục tín hiệu ban đầu nhờ phép biến đổi ng−ợc.  M∙ hoá: Các dạng mã hoá đ−ợc lựa chọn sao cho có thể tận dụng đ−ợc xác suất xuất hiện của mẫu. Thông th−ờng sử dụng mã RLC (run length coding: mã hoá loạt dμi) vμ mã VLC (variable length coding): gắn cho mẫu có xác suất xuất hiện cao từ mã có độ dμi ngắn sao cho chứa đựng một khối l−ợng thông tin nhiều nhất với số bit truyền tải ít nhất mμ vẫn đảm bảo chất l−ợng yêu cầu. 2.1.1.3. Phân loại nén Các thuật toán nén có thể phân lμm hai loại: Nén không tổn thất (lossless compression) vμ nén có tổn thất (lossy compression).  Thuật toán nén không tổn thất không lμm suy giảm, tổn hao dữ liệu. Do vậy, ảnh khôi phục hoμn toμn chính xác với ảnh nguồn.  Các thuật toán nén có tổn thất chấp nhận loại bỏ một số thông tin không quan trọng nh− các thông tin không quá nhạy cảm với cảm nhận của con ng−ời để đạt đ−ợc hiệu suất nén cao hơn, Do vậy, ảnh khôi phục chỉ rất gần chứ không phải lμ ảnh nguyên thủy. Đối với nén có tổn thất, chất l−ợng ảnh lμ một yếu tố vô cùng quan trọng, Tuỳ theo yêu cầu ứng dụng mμ các mức độ loại bỏ khác nhau đ−ợc sử dụng, cho mức độ chất l−ợng theo yêu cầu. 2.1.2. Một số dạng mã hoá sử dụng trong các công nghệ nén. Các dạng mã hoá sử dụng trong công nghệ nén đều tận dụng đ−ợc xác suất xuất hiện mẫu nhằm đạt đ−ợc độ dμi mã trung bình (số bit trung bình cần để mã hoá một mẫu) lμ nhỏ nhất. Tuy nhiên, độ dμi nμy có một giới hạn d−ới mμ không một ph−ơng pháp mã hoá nμo có thể cung cấp độ dμi từ mã trung bình nhỏ hơn. Đó lμ “ entropy” của nguồn tín hiệu. 2.1.2.1. Khái niệm entropy của nguồn tín hiệu Khái niệm ”entropy” của nguồn tín hiệu đ−ợc sử dụng để đo l−ợng thông tin một nguồn tin chứa đựng. Một nguồn tin có N mẫu {s 1 ,s 2 , ,s N } với xác suất xuất hiện các mẫu t−ơng ứng lμ {p(s 1 ), p(s 2 ), , p(s N )}. Khi đó,” entropy” của nguồn tin đ−ợc định nghĩa nh− sau: [1] ∑ = −= N i ii SPSPH 1 2 )(log).( Ví dụ một nguồn tin gồm các mẫu {1,0} với: + xác suất xuất hiện mẫu “1” lμ 0,8. + xác suất xuất hiện mẫu “0” lμ 0,2. Khi đó “entropy” của nguồn lμ: H = - (0,8.log 2 0,8 + 0,2.log 2 0,2) = 0,7219 bit “Entropy” của nguồn tin quy định giới hạn d−ới tốc độ bit tại đầu ra bộ mã hoá. Ph−ơng pháp mã hoá nμo có độ dμi mã trung bình (số bit trung bình cần để mã hoá một mẫu) cμng gần giá trị H thì ph−ơng pháp mã hoá đó cμng hiệu quả. 2.1.2.2. Mã hoá với độ dμi chạy RLC (run length coding). [3] Phương pháp nén RLC này dựa trên cơ sở là sự liên tiếp lặp đi lặp lại các điểm ảnh trong ảnh số, xuất hiện là do sự tương quan giữa các điểm ảnh, đặc biệt là với các ảnh 2 mức (bi – level images). RLC tách các giá trị giống nhau và biểu diễn như là một tổng, kỹ thuật này chỉ áp dụng cho các chuỗi symbols tuyến tính. Có hai cách mã hoá RLC: 1- Tạo ra những từ mã cho mỗi độ dài chạy (động) và kết hợp với symbol nguồn. 2- Sử dụng một số độ dài chạy và một symbol nguồn nếu như symbol nguồn không phải là một số hay một ký đặc biệt để chỉ ra cho mỗi symbol nguồn. Kỹ thuật RLC được dùng cho các hệ số lượng tử hoá tốt hơn là dùng trực tiếp cho số liệu ảnh. Một dạng cải tiến của mãc RLC là mã có độ dài thay đổi VLC (Variable Length Code) dùng để biểu diễn các độ dài chạy cũng như các giá trị symbol. Cách thực hiện là tính phân bố xác xuất của độ dài chạy và các giá trị symbol. Đây là sự kết hợp của mã hoá RLC với mã hoá thống kê. 2.1.2.3. Mã hoá với độ dμi thay đổi VLC (variable length coding) (mã Huffman) Trong các công nghệ nén, mã Huffman lμ dạng mã đ−ợc sử dụng phổ biến nhất. Bảng mã Huffman có thể cho độ dμi mã trung bình để mã hoá cho một mẫu lμ nhỏ nhất do tận dụng xác suất xuất suất hiện của các mẫu trong nguồn tín hiệu. Trong đó, mẫu có xác suất xuất hiện cao nhất sẽ đ−ợc gắn với một từ mã có độ dμi ngắn nhất. Mặc dù có độ dμi mã thay đổi song mã Huffman vẫn có khả năng giải mã đúng do có thuộc tính tiền tố duy nhất (không có bất cứ từ mã nμo lại lμ phần đầu của từ mã tiếp theo). Để xây dựng cây mã Huffman gồm các b−ớc sau: 1- Liệt kê các xác suất của các symbol nguồn và tạo ra các tập nút bằng cách cho các xác suất này thành các nhánh của cây nhị phân. 2- Lấy hai nút với xác suất nhỏ nhất từ tập nút và tạo ra một xác suất mới bằng tổng xác suất của các xác suất đó. 3- Tạo ra một nút mẹ với các xác suất mới, và đánh dấu 1 cho nút con ở trên và 0 cho nút con ở dưới. 4- Tạo tiếp tập nút bằng cách thay thế 2 nút với xác xuất nhỏ nhất cho nút mới. Nếu tập nút chỉ chứa một nút thì kết thúc, ngược lại thì ta quay lại bước 2. Ph−ơng pháp mã hoá thống kê Huffman sẽ trở nên nặng nề khi số tin của nguồn quá lớn. Trong tr−ờng hợp nμy ng−ời ta dùng một biện pháp phụ để giảm nhẹ công việc mã hoá. Tr−ớc tiên liệt kê các tin của nguồn theo thứ tự xác suất giảm dần, sau đó ghép thμnh từng nhóm tin có tổng xác suất gần bằng nhau. Dùng một mã đều để mã hoá các tin trong cùng một nhóm. Sau đó xem các nhóm tin nh− một khối tin vμ dùng ph−ơng pháp Huffman để mã hoá các khối tin. Từ mã cuối cùng t−ơng ứng với mỗi tin của nguồn gồm hai phần: một phần lμ mã Huffman vμ một phần lμ mã đều. Xét ví dụ thiết lập cây mã Huffman cho một nguồn tin chứa các mẫu : {s 0 , s 1 , ,s 7 } với xác suất xuất hiện lần l−ợt lμ : p(s i ) = {0,1;0,19;0,21;0,3;0,05;0,05;0,07;0,03}. Cây mã Huffman xây dựng cho nguồn tin nμy nh− sau: 1.0 1 0.4 0 0 0.13 1 1 0.18 0 0 0 0 0 1 1 P(s 2 )=0.21 P(s 3 )=0.3 P(s 4 )=0.05 P(s 5 )=0.05 P(s 6 )=0.07 P(s 7 )=0.03 P(s 1 )=0.19 P(s 0 )=0.1 1 0011 11 10 01 0001 00101 0000 00100 Liệt kê Thiết kế mã Từ mã xác suất ` Mặc dù mã Huffman hiệu quả nh−ng chúng ta phải hiểu rằng mã hoá Huffman chỉ tối −u khi đã biết tr−ớc xác suất của mã nguồn vμ mỗi biểu tr−ng của mã nguồn đ−ợc mã hoá bằng một số bit nguyên. Đặc biệt mã hoá Huffman đ−ợc phát triển cho ảnh số nh−ng áp dụng cho rất nhiều loại ảnh, mỗi ảnh có xác suất xuất hiện biểu tr−ng của riêng nó. Do đó mã Huffman không phải lμ tối −u cho bất cứ loại ảnh đặc biệt nμo. 2.1.2.4. Mã hoá dự đoán (Predictive coding) Nh− đã nói, nguồn ảnh chứa một l−ợng thông tin rất lớn. Nếu mã hoá trực tiếp nguồn tin nμy theo PCM, tốc độ dòng bit thu đ−ợc sẽ rất cao. Mặt khác, nguồn ảnh lại chứa đựng sự d− thừa vμ tính “có nhớ”: giữa các điểm ảnh lân cận có mối quan hệ t−ơng hỗ với nhau. Mã hoá dự đoán đ−ợc xây dựng dựa trên nguyên tắc cơ bản nh− sau: ♦ Lợi dụng mối quan hệ t−ơng hỗ nμy, từ giá trị các điểm ảnh lân cận, theo một nguyên tắc nμo đó có thể tạo nên một giá trị gần giống điểm ảnh hiện hμnh. Giá trị nμy đ−ợc gọi lμ giá trị “dự báo”. ♦ Loại bỏ đi tính “có nhớ” của nguồn tín hiệu bằng một bộ lọc đặc biệt có đáp ứng đầu ra lμ hiệu giữa tín hiệu vμo s(n) vμ giá trị dự báo của nó. ♦ Thay vì l−ợng tử hoá trực tiếp các mẫu điểm ảnh, mã hoá dự đoán l−ợng tử vμ mã hoá các “sai số dự báo” tại đầu ra bộ lọc. “Sai số dự báo”lμ sự chênh lệch giữa giá trị dự báo vμ giá trị thực của mẫu hiện hμnh. Do nguồn “sai số dự báo”(error prediction source) lμ nguồn không có nhớ vμ chứa đựng l−ợng thông tin thấp, nên số bit cần để mã hoá sẽ giảm đi rất nhiều. Ph−ơng pháp tạo điểm ảnh dựa trên tổng giá trị của điểm dự đoán vμ sai số dự báo gọi lμ “điều chế xung mã vi sai (DPCM)”. Hình 2.2: Sơ đồ khối bộ mã hoá DPCM Σ Bộ dự đoán Mã hoá entropy Bộ lượng tử hoá Σ Tín hiệu video số V + e + Kênh [...]... cho các ứng dụng truyền thông video thời gian thực như video Conferencing hay điện thoại truyền hình Mặt khác, những tiêu chuẩn MPEG được thiết kế hướng tới mục tiêu lưu trữ Video chẳng hạn như trên đĩa quang DVD, quảng bá video số trên mạng cáp, đường truyền số DSL, truyền hình vệ tinh hay những ứng dụng truyền dòng video trên mạng Internet hoặc thông qua mạng không dây Với đối tượng để truyền dẫn video. .. khung sai số dự báo Sau đó ,công nghệ mã hoá chuyển đổi chuyển khung sai số nμy sang miền tần số để nén các hệ số nhờ l−ợng tử hoá vμ mã hoá Huffman tr−ớc khi truyền tải hay l−u trữ 2.3.1.1 Các thμnh phần ảnh cơ bản trong chuẩn nén MPEG Các tiêu chuẩn MPEG cấu trúc dữ liệu dạng lớp Bao gồm các thμnh phần cơ bản sau đây:  Khối (Block): Lμ đơn vị cơ bản cho chuyển đổi DCT Bao gồm 8x8 điểm ảnh tín hiệu chói... ứng dụng Video rộng MPEG-1 coi ảnh chuyển động nh− dạng thức dữ liệu máy tính (gồm các điểm ảnh) Cũng nh− các dữ liệu máy tính (ảnh vμ văn bản), ảnh video chuyển động có khả năng truyền vμ nhận bằng máy tính vμ mạng truyền thông Chúng cũng có thể đ−ợc l−u trữ trong các thiết bị l−u trữ dữ liệu số nh− đĩa CD, đĩa Winchester vμ ổ quang MPEG-1 cung cấp cả các ứng dụng đối xứng vμ không đối xứng:  Trong. .. thành các hệ số chuyển vị và mã hoá các hệ số chuyển vị đó Phương pháp này tập trung vào một số các hệ số chuyển vị mà không phải là các điểm ảnh của ảnh gốc và lượng thông tin chỉ trong một số ít hệ số chuyển vị Như vậy, số bit dùng cho quá trình mã hoá sẽ ít đi Hơn nữa, do hệ thống thị giác của con người không thể nhận biết hoàn toàn các chi tiết của ảnh khi những chi tiết đó biến đổi nhanh so với các. .. đầu là chuẩn nén MPEG-4 AVC, còn được gọi là H.264, MPEG-4 part 10, H.26L hoặc JVT 2.3 Nén Video theo tiêu chuẩn MPEG Nhóm các chuyên gia về ảnh động (Motion Pictures Expert Group-MPEG) làm việc cho tổ chức tiêu chuẩn quốc tế ISO (ISO/IEC) có nhiệm vụ nghiên cứu và phát triển các tiêu chuẩn nén, giải nén tín hiệu video, audio Hiện nay các chuẩn nén MPEG đang được sử dụng phổ biến và được các tổ chức... chức ISO/IEC, ITU (International Telecommunication Union) công nhận là chuẩn nén quốc tế, áp dụng cho các hệ truyền hình tại Mỹ, Nhật Bản, Châu âu MPEG-1: được phát triển vào năm 1988 – 1992, là tiêu chuẩn đầu tiên của MPEG Chuẩn MPEG-1 được sử dụng chủ yếu để nén tín hiệu VCD và các luồng tốc độ thấp khoảng 1.5Mbps MPEG-1 hỗ trợ nén các tín hiệu có phân giải thấp 352 x 240(60Hz) và 352 x 288(50Hz),... các biến đổi chậm, bởi vậy để mã hoá các hệ số chuyển vị ở tần số cao, ta chỉ cần một số ít bit mà chất lượng hình ảnh vẫn tốt 2.2 Các chuẩn nén video Hiệp hội viễn thông quốc tế (ITU) và tổ chức tiêu chuẩn quốc tế/Uỷ ban kỹ thuật điện tử quốc tế (ISO/IEC) là hai tổ chức phát triển các tiêu chuẩn mã hoá Video Theo ITU-T, các tiêu chuẩn mã hoá video được coi là các khuyến nghị gọi tắt là chuẩn H.26x... cho l−u trữ dữ liệu số nên đòi hỏi có sự truy cập ngẫu nhiên (Random Access) Cách thức mã hoá tốt nhất cho truy cập ngẫu nhiên lμ mã hoá Intraframe đơn thuần Song do sự d− thừa thông tin về thời gian ch−a đ−ợc loại bỏ nên hiệu suất nén rất thấp Do vậy trong tiêu chuẩn nén MPEG- 1, có sự cân bằng giữa nén trong ảnh (Intraframe) vμ nén liên ảnh (Interframe) bằng cách sử dụng các công nghệ sau đây:  Bù...V’ p + V: Tín hiệu vào e = V-P (P- sai số dự đoán) eq – là sai số lượng tử V’ = eq + p tín hiệu tạo lại Sơ đồ khối bộ mã hoá và giải mã DPCM có dạng sau: eq + Giải mã entropy Σ Bộ dự đoán Kênh tín hiệu V’ Đầu ra giải mã p Hình 2.3: Sơ đồ khối bộ giải mã DPCM Nhằm tránh các lỗi có thể xuất hiện trong khi truyền, một mẫu đầy đủ sẽ được gửi đi theo chu kỳ nhất định cho phép cập nhật được các giá trị... xứng:  Trong ứng dụng không đối xứng, ảnh động đ−ợc nén một lần, sau đó giải nén nhiều lần để truy cập thông tin, ví dụ trò chơi games  Trong ứng dụng đối xứng, quá trình nén vμ giải nén phải cân bằng nhau VD: điện thoại hình, th− điện tử Để đạt đ−ợc hiệu suất nén cao mμ vẫn giữ tốt chất l−ợng ảnh phục hồi, chuẩn MPEG-1 sử dụng cả công nghệ nén trong ảnh (Intraframe) vμ liên ảnh (Interframe) để loại . CÁC CÔNG NGHỆ NÉN TÍN HIỆU VIDEO TRONG TRUYỀN HÌNH SỐ Nén nhằm giảm tốc độ bit của các dòng dữ liệu tốc độ cao mà vẫn đảm bảo chất lượng hình ảnh. cần truyền tải. Tín hiệu Video sau khi được số hoá (8 bit) có tốc độ bằng 216 Mb/s. Để có thể truyền trong một kênh truyền hình thông thường, thì tín hiệu

Ngày đăng: 04/11/2013, 20:20

Xem thêm

CÁC CÔNG NGHỆ NÉN TÍN HIỆU VIDEO TRONG TRUYỀN HÌNH SỐ

CÁC CÔNG NGHỆ NÉN TÍN HIỆU VIDEO TRONG TRUYỀN HÌNH SỐ

Tiêu chuẩn nén video MPEG-

Cấu trúc dòng bit video MPEG-