Tài liệu tham khảo chuyên ngành tin học Tổng quan về truyền hình số
Trang 1CHưƠNG 1: TỔNG QUAN VỀ TRUYỀN HÌNH SỐ
Chương 1 của luận văn trình bầy các đặc điểm cơ bản, các vấn đề chủyếu trong quá trình chuyển đổi tín hiệu Video từ dạng tương tự sang dạng số
1.1 Giới thiệu
Truyền hình đen trắng ra đời từ những năm đầu của thập kỷ XX vớinhiều tiêu chuẩn khác nhau: L, M, N, B, G, H, I, D, K
Truyền hình màu với ba hệ: NTSC, PAL, SECAM xuất hiện vào thập
kỷ 50 đã tạo nên một bước ngoặt mới trong quá trình phát triển của côngnghệ truyền hình Cả ba hệ đều sử dụng các tín hiệu thành phần là tín hiệuchói và hai tín hiệu hiệu màu (Y, R-Y, B-Y) Điều khác nhau cơ bản làphương pháp điều chế tín hiệu hiệu màu, tần số sóng mang màu và phươngpháp ghép kênh
Do sự phát triển nhanh chóng của công nghệ điện tử với sự ra đời củacác vi mạch cỡ lớn, các bộ xử lý tín hiệu với tốc độ cao, các bộ nhớ vớidung lượng lớn và nhất là sự bùng nổ của công nghệ thông tin trong nhữngnăm gần đây, video số, truyền hình số đã hoàn toàn mang tính khả thi vàtừng bước trở thành hiện thực
Số hoá tín hiệu video thực tế là sự biến đổi tín hiệu video tương tự(Analog) sang dạng số (Digital)
Công nghệ truyền hình số đã và đang bộc lộ thế mạnh tuyệt đối so vớicông nghệ tương tự trên nhiều lĩnh vực
Tuy nhiên việc chuyển đổi tín hiệu video từ tương tự sang số cũng cónhiều vấn đề cần xem xét nghiên cứu
Tín hiệu video, theo tiêu chuẩn OIRT có tần số ≤ 6MHz vì vậy theotiêu chuẩn Nyquist để đảm bảo chất lượng, tần số lấy mẫu phải lớn hơn12MHz; với số hoá 8 bít, để truyền tải đầy đủ thông tin một tín hiệu videothành phần có độ phân giải tiêu chuẩn, tốc độ phải lớn hơn 200Mbit/s Đốivới truyền hình độ phân giải cao, tốc độ bit lớn hơn 1Gbit/s
Trang 2Dung lượng này quá lớn, các kênh truyền hình thông thường không cókhả năng truyền tải Các vấn đề mấu chốt cần xem xét trong quá trình số hoátín hiệu video bao gồm:
Tần số lấy mẫu
Phương thức lấy mẫu
Tỷ lệ giữa tần số lấy mẫu tín hiệu chói và tín hiệu hiệu màu (trongtrường hợp số hoá tín hiệu thành phần)
Nén tín hiệu video để có thể truyền tín hiệu truyền hình số trên cáckênh truyền hình thông thường trong khi vẫn đảm bảo chất lượng tínhiệu theo từng mục đích sử dụng
1.2 Sơ đồ khối tổng quát của một hệ thống truyền hình số
Sơ đồ khối của một hệ thống truyền hình số có dạng như hình 1.1
Đầu vào của thiết bị sẽ tiếp nhận tín hiệu truyền hình tương tự Trongthiết bị mã hoá (biến đổi AD), tín hiệu hình sẽ được biến đổi thành tín hiệu
số, các tham số và đặc trưng của tín hiệu này được xác định từ hệ thốngtruyền hình được lựa chọn
Tín hiệu truyền hình số được đưa tới thiết bị phát Sau đó qua kênhthông tin, tín hiệu truyền hình số đưa tới thiết bị thu cấu tạo từ thiết bị biếnđổi tín hiệu ngược lại với quá trình xử lý tại phía phát
Trang 3Giải mã tín hiệu truyền hình thực hiện biến đổi tín hiệu truyền hình sốthành tín hiệu truyền hình tương tự Hệ thống truyền hình số sẽ trực tiếp xácđịnh cấu trúc mã hoá và giải mã tín hiệu truyền hình.
Mã hoá kênh đảm bảo chống các sai sót cho tín hiệu trong kênh thôngtin Thiết bị mã hoá kênh phối hợp đặc tính của tín hiệu số với kênh thôngtin Khi tín hiệu truyền hình số được truyền đi theo kênh thông tin, các thiết
bị biến đổi trên được gọi là bộ điều chế và bộ giải điều chế
1.3 Đặc điểm của truyền hình số
Đặc điểm của truyền hình số được xem xét thông qua các ưu nhượcđiểm của nó, vì nó giải thích lý do của việc cần thiết phải thay thế truyềnhình Analog sang truyền hình số, những đặc điểm dưới đây chính là tính ưuviệt của truyền hình số so với truyền hình tương tự, bao gồm:
+ Có thể tiến hành rất nhiều quá trình xử lý trong Studio (trung tâmtruyền hình) mà tỷ số S/N không giảm Trong truyền hình tương tự thì việcnày gây méo tích luỹ (mỗi khâu xử lý đều gây méo)
+ Thuận lợi cho quá trình ghi, đọc: có thể ghi đọc vô hạn lần mà chấtlượng không bị giảm
+ Dễ sử dụng thiết bị tự động kiểm tra và điều khiển nhờ máy tính.+ Có khả năng lưu tín hiệu số trong các bộ nhớ có cấu trúc đơn giản
và sau đó đọc nó với tốc độ tuỳ ý
+ Khả năng truyền trên cự ly lớn: tính chống nhiễu cao (do việc cài
mã sửa lỗi, chống lỗi, bảo vệ…)
+ Dễ tạo dạng lấy mẫu tín hiệu, do đó dễ thực hiện việc chuyển đổi hệtruyền hình, đồng bộ từ nhiều nguồn khác nhau dễ thực hiện những kỹ xảotrong truyền hình
+ Các thiết bị số làm việc ổn định, vận hành dễ dàng và không cầnđiều chỉnh các thiết bị trong khi khai thác
+ Có khả năng xử lý nhiều lần đồng thời một số tín hiệu (nhờ ghépkênh phân chia theo thời gian)
Trang 4+ Có khả năng thu tốt trong truyền sóng đa đường Hiện tượng bóng
ma thường xảy ra trong hệ thống truyền hình tương tự do tín hiệu truyền đếnmáy thu theo nhiều đường Việc tránh nhiễu đồng kênh trong hệ thốngthông tin số cũng làm giảm đi hiện tượng này trong truyền hình quảng bá
+ Tiết kiệm được phổ tần nhờ sử dụng các kỹ thuật nén băng tần, tỉ lệnén có thể lên đến 40 lần mà hầu như người xem không nhận biết được sựsuy giảm chất lượng Từ đó có thể thấy được nhiều chương trình trên mộtkênh sóng, trong khi truyền hình tương tự mỗi chương trình phải dùng mộtkênh sóng riêng
+ Có khả năng truyền hình đa phương tiện, tạo ra loại hình thông tinhai chiều, dịch vụ tương tác, thông tin giao dịch giữa điểm và điểm Do sựphát triển của công nghệ truyền hình số, các dịch vụ tương tác này ngày càngphong phú đa dạng và ngày càng mở rộng Trong đó có sự kết hợp giữa máythu hình và hệ thống máy tính, truyền hình từ phương tiện thông tin đạichúng trở thành thông tin cá nhân
Tuy nhiên truyền hình số cũng có những nhược điểm đáng quan tâm:
+ Dải thông của tín hiệu chưa nén tăng do đó độ rộng băng tần củathiết bị và hệ thống truyền lớn hơn nhiều so với tín hiệu tương tự
+ Việc kiểm tra chất lượng tín hiệu số ở mỗi điểm của kênh truyềnthường phức tạp hơn (phải dùng mạch chuyển đổi số – tương tự)
1.4 Số hoá tín hiệu video
1.4.1 Lấy mẫu tín hiệu Video
a Lựa chọn tần số lấy mẫu
Công đoạn đầu tiên của quá trình biến đổi tín hiệu tương tự sang tínhiệu số là lấy mẫu (có nghĩa là rời rạc tín hiệu tương tự theo thời gian) Do
đó tần số lấy mẫu là một trong những thông số cơ bản của hệ thống kỹ thuật
số Có nhiều yếu tố quyết định việc lựa chọn tần số lấy mẫu Tần số lấy mẫucần được xác định sao cho hình ảnh nhận được có chất lượng cao nhất, tín
Trang 5hiệu truyền đi với tốc độ bit nhỏ nhất, độ rộng băng tần nhỏ nhất và mạchđơn giản.
Để cho việc lấy mẫu không gây méo, ta phải chọn tần số lấy mẫu thoảmãn định lý lấy mẫu Nyquist - Shannon sa 2max
Trường hợp sa < 2max sẽ xảy ra hiện tượng chồng phổ làm xuất hiệncác thành phần phụ và xuất hiện méo, ví dụ như hiệu ứng lưới trên màn hình(do các tín hiệu vô ích nằm trong băng tần video), méo sườn xung tín hiệu,làm nhoè biên ảnh (do hiệu ứng bậc thang), các điểm sáng tối nhấp nháy trênmàn hình
Trị số f sa tối ưu sẽ khác nhau cho các trường hợp: tín hiệu chói, tínhiệu màu cơ bản (R, G, B), các tín hiệu hiệu số màu, tín hiệu Video màutổng hợp Cuối cùng việc chọn tần số lấy mẫu phụ thuộc vào hệ thống truyềnhình màu
* Lấy mẫu tín hiệu video tổng hợp (video composite):
Theo định lý lấy mẫu Nyquist - Shannon thì tần số lấy mẫu phải 2lần tần số lớn nhất của tín hiệu (sẽ tránh được hiện tượng chồng phổ) Vớidải thông video là 6 MHz thì tần số lấy mẫu tối thiểu cho tín hiệu video phảilớn hơn hoặc bằng 12 MHz Tuy nhiên nếu chọn tần số lấy mẫu ( fsa ) không
có quan hệ với tần số sóng mang màu (fsc) thì có hiện tượng xuyên điều chếgiữa fsa và fsc, gây ra méo tín hiệu sau khi khôi phục Có thể chọn tần số lấymẫu fsa = 3fsc, tuy nhiên chất lượng không đáp ứng được cho Studio Tiêuchuẩn tần số lấy mẫu được áp dụng cho video số composite là: fsa = 4fsc .Như vậy tần số lấy mẫu đối với tín hiệu tổng hợp hệ PAL:
4,433 MHz 4 = 17,7344 MHz
Sử dụng cấu trúc lấy mẫu trực giao, mỗi mẫu được lượng tử hoá 8 bithoặc 10 bit sẽ tạo ra dòng bit nối tiếp có tốc độ 141,76 Mbps hoặc 177,2Mbps Tín hiệu Video tổng hợp dưới dạng số có chất lượng hạn chế dokhông thể giải quyết các vấn đề pha tải màu, can nhiễu giữa tín hiệu chói vàmàu nên không còn được sử dụng rộng rãi trong những năm gần đây
Trang 6* Lấy mẫu tín hiệu video thành phần (component)
Lấy mẫu và mã hoá tín hiệu video thành phần có ưu điểm là loại bỏđược sự phức tạp về tải tần màu và các méo khác mà lấy mẫu tín hiệu videotổng hợp không thể đạt được Khuyến nghị 601 của ITU ( ITU-R.BT601/656) đã định nghĩa chuẩn lấy mẫu Video số cho Studio truyền hìnhcủa cả hai hệ thống 625 dòng và 525 dòng dựa trên việc số hoá các thànhphần Y, CR, CB trong đó CR, CB là các tín hiệu biểu diễn tín hiệu hiệu màu R-
Y và B-Y đã qua quá trình chuyển đổi A/D, được biểu diễn chung cho cảPAL và NTSC với CR = 0,71(R-Y) và CB = 0,564(B-Y ) Tần số lấy mẫutín hiệu chói được chọn chung, bằng bội số nguyên của tần số dòng cho cảhai hệ 625 dòng & 525 dòng Tần số lấy mẫu của tín hiệu chói Y:
fSa luminance = 858 fh 525 = 864fh 625 = 13,5 MHz
Tần số lấy mẫu tín hiệu màu tuỳ thuộc theo chuẩn lấy mẫu, biểu thị tỷ
lệ lấy mẫu giữa các tín hiệu thành phần Y, CR và CB Cấu trúc lấy mẫu trựcgiao các tín hiệu Y, CR, CB theo chuẩn lấy mẫu 4:4:4 ; 4:2:2 ; 4:2:0 ; 4:1:1.Cấu trúc này được mô tả ở hình vẽ dưới [3]
Trang 7Hình 1.2 Các chuẩn lấy mẫu tín hiệu sốTrong tiêu chuẩn này, các mẫu được lượng tử và biểu diễn bằng 8 bithoặc 10 bit/mẫu Lượng tử hoá 8 bit ta có 256 mức lượng tử và 10 bit là
1024 mức lượng tử, các mức này được qui định khoảng bảo vệ cần thiết phùhợp với từng thành phần tín hiệu video
Tốc độ dòng dữ liệu theo chuẩn lấy mẫu 4: 2: 2 (PAL)
Khi lấy mẫu 10 bit: (864 + 432+ 432) 625 2510 = 270 (Mbit/s)Với hệ PAL 625 dòng: có 576 dòng tích cực, mỗi dòng tín hiệu chói đượcbiểu diễn bằng 720 mẫu ta có tốc độ dòng dữ liệu tích cực theo chuẩn lấymẫu 4: 2: 2 [3]
Khi lấy mẫu 8 bit: (720 + 360+ 360) 576 25 8 = 166 (Mbit/s)
Trang 8Khi lấy mẫu 10 bit: (720 + 360+ 360) 576 2510 = 207 (Mbit/s)Chuẩn 4:2:2 cho chất lượng hình ảnh cao nên được sử dụng là chuẩn
trong sản xuất chương trình (Studio), chuẩn 4:1:1 có chất lượng màu kém
hơn so với 4:2:2 nhưng có tốc độ bit thấp hơn nên được sử dụng làm cácchương trình thời sự, khoa học giáo dục Trong công đoạn phát sóng sửdụng chuẩn 4:2:0, chất lượng hình khi phát sóng tương đương với sử dụngthiết bị Betacam Analog
Tuy nhiên tốc độ bit lớn sẽ đòi hỏi bộ nhớ lớn khi lưu trữ và dải thôngrộng khi truyền dẫn Do đó cần phải nén dòng bit video, tức là cần phải biểudiễn dòng bit video với tốc độ bit thấp hơn mà chất lượng hình ảnh không bịsuy giảm hoặc suy giảm ở mức chấp nhận được
b Cấu trúc lấy mẫu.
Để khôi phục chính xác hình ảnh thì tần số lấy mẫu phải là bội của tần
số dòng Khi này, điểm lấy mẫu trên các dòng quét kề nhau sẽ thẳng hàngvới nhau và tránh được các méo đường biên gây ra
Như vậy, việc lấy mẫu không những phụ thuộc theo thời gian mà cònphụ thuộc vào toạ độ các điểm lấy mẫu Có 3 dạng liên kết vị trí các điểmlấy mẫu được sử dụng phổ biến cho cấu trúc lấy mẫu tín hiệu video:
Số giá trị lượng tử Q được xác định theo biểu thức:
N
Q 2 (2.4)
N – là số bit biểu diễn mỗi mẫu
Trang 9Tín hiệu số nhận được là một giá trị xấp xỉ của tín hiệu ban đầu bởi vìtất cả các giá trị nằm trong một mức lượng tử đều có một giá trị như nhau-
đó chính là mức lượng tử Q
Quá trình lượng tử hóa gây ra sai số lượng tử, đây là một nguồn nhiễukhông thể tránh khỏi trong các hệ thống số, nhiều trường hợp nó ảnh hưởngnghiêm trọng đến độ chính xác và tin cậy của tín hiệu
Biểu thức sai số lượng tử có dạng là:
eq = x - Q(x)trong đó:
eq: là sai số lượng tử
x: là giá trị các mẫu tín hiệu trước khi lượng tử
Q(x): là giá trị các mẫu tín hiệu sau khi lượng tử
eq phụ thuộc vào tính thống kê của tín hiệu đầu vào và độ rộng cácbước lượng tử
Theo định nghĩa sai số trung bình bình phương (MSE) ta có
i
) ( ) (
2
Trong lượng tử hoá tuyến tính, giả sử các lỗi có phân bố đều
Giá trị căn bình phương trung bình của eq :
12
RMS
Q Q Q Q Q Q
n+5 n+4 n+3 n+2 n+1
nThêi gian
Q
Lçi l îng tö
C¸c mÉu
H×nh 1.3: Qu¸ tr×nh l îng tö ho¸
Trang 10Trong đó di (i=1 N) là giá trị lượng tử, : bước lượng tử, fx(x) làxác suất lỗi
Tỉ số tín hiệu đỉnh trên nhiễu lượng tử của bộ lượng tử tuyến tính cólỗi phân bố đều có giá trị tính theo biểu thức:
08 , 10 02 , 6 12 2 lg
Sai số lượng tử (eq) là một nguồn nhiễu (nhiễu lượng tử) không thểtránh khỏi trong hệ thống số Với các ứng dụng trong truyền hình người ta sửdụng lượng tử hoá 8 bit, 10 bit hoặc 12 bit Hầu hết các thiết bị có chất lượngcao đều sử dụng lượng tử hoá 10 bit/mẫu ( 210 = 1024 mức lượng tử ) từ 0đến 1023 (từ 000 đến 3FF trong hệ HEX) Các mức 000, 001, 002, 003 và3FC, 3FD, 3FE, 3FF được dùng làm khoảng dự phòng mức dưới và trên củatín hiệu video, các mức còn lại để lượng tử tín hiệu video tích cực
Méo lượng tử phụ thuộc vào số mức lượng tử Đối với tín hiệu video,méo lượng tử xuất hiện ở hai dạng chính: Hiệu ứng đường viền và nhiễu hạtngẫu nhiên
Hiệu ứng đường viền xuất hiện ở những vùng có độ sáng thay đổichậm và đều theo chiều ngang, khi đó có những sọc với độ sáng cố định chiathành nhiều đường rõ nét theo chiều đứng như đường biên Nếu tăng số mứclượng tử, hiệu ứng đường viền sẽ giảm, khi sử dụng từ mã 8 bit để biểu diễnmàu, hiệu ứng đường viền hầu như không xuất hiện
Hiệu ứng hạt là loại nhiễu có dạng như sương mù xuất hiện ở vùngảnh rộng và có độ sáng đồng đều
b Phân loại
Có hai phương pháp lượng tử hoá là:
Lượng tử hoá tuyến tính có các bước lượng tử Q bằng nhau
Lượng tử hoá phi tuyến có các bước lượng tử Q khác nhau
Trang 111.4.3 Mã hoá
a Khái quát
Mã hoá là khâu cuối cùng trong biến đổi AD, là quá trình biến đổi cấutrúc nguồn tín hiệu mà không làm thay đổi tin tức, mục đích là cải thiện cácchỉ tiêu kỹ thuật của hệ thống truyền tin Dữ liệu sau mã hoá có nhiều ưuđiểm: Tính chống nhiễu cao hơn, tốc độ hình thành tương đương khả năngthông qua của kênh
Quá trình mã hoá biến đổi các mức lượng tử hoá thành chuỗi các bit
“0”, “1” Độ dài của dãy tín hiệu nhị phân này (gọi là từ mã nhị phân) đượctính bằng số lượng các con số “0”, “1” là một trong các chỉ tiêu chất lượngcủa kỹ thuật số hoá tín hiệu, nó phản ánh mức sáng, tối, màu sắc của hìnhảnh được ghi nhận và biến đổi Về nguyên tắc, độ dài dãy nhị phân này cànglớn thì độ phân giải tín hiệu càng cao, độ phân giải hiện nay là 8 bit/ mẫu
Phân loại các mã trong truyền hình số:
Các mã để mã hoá tín hiệu truyền hình
Các mã để truyền có hiệu quả cao qua kênh thông tin
Các mã để thuận tiện cho việc giải mã và đồng bộ bên thu
Các mã xử lý số tín hiệu trong các phần khác nhau của hệ thốngtruyền hình số
Về cấu trúc toán học, ta có các loại mã:
Các mã mà các tổ hợp của nó bao gồm một số các ký hiệu như nhaugọi là mã đều đặn, còn các mã mà các tổ hợp của nó bao gồm một số các kýhiệu khác nhau gọi là mã không đều đặn
Trang 12Lý thuyết mã có hai hướng nghiên cứu để khắc phục độ dư tín hiệutruyền hình:
Nghiên cứu các cấu trúc mã nâng cao độ chính xác của việc truyềntheo kênh thông tin có nhiễu (mã chống sai số, mã hiệu chỉnh…)
Nghiên cứu các mã làm triệt tiêu độ dư của tín hiệu đã mã hoátrong kênh chống nhiễu (nén tín hiệu)
Để phục vụ các yêu cầu về ghi, truyền tín hiệu video, mã hoá được sửdụng trong các trường hợp:
Mã hoá sơ cấp: Dùng để tạo tín hiệu số ở studio
Mã bảo vệ và sửa sai: Tăng khả năng chịu đựng của tín hiệu trongkênh có nhiễu
Mã truyền tuyến tính: Tăng khả năng truyền dẫn
Ban đầu, tất của các tín hiệu video số được mã hoá sơ cấp, sau đó là
mã hoá chuyển đổi Mã sơ cấp là mã cơ sở mà từ đó hình thành mã bảo vệ
1.5 Giảm tốc độ bit trong truyền hình
Nếu sử dụng PCM tuyến tính để biến đổi số tín hiệu Video tương tựthì tốc độ bit sẽ tăng rất cao và do đó thiết bị Video số cũng như thiết bịtruyền dẫn số cần phải có dải thông rất lớn so với trường hợp tín hiệu Videotương tự
Trong truyền hình số người ta thường lấy tỷ lệ tần số lấy mẫu tín hiệuchói và tần số lấy mẫu tín hiệu số màu để đánh giá chất lượng hình ảnh
sY : sc:R-Y : sc:B-Y
4 : 4 : 4 chất lượng cao nhất
4 : 2 : 2 chất lượng cao
4 : 1 : 1 chất lương trung bình
2 : 1 : 1 (dùng cho thoại truyền hình )
Việc giảm tốc độ bit dựa vào các yếu tố sau:
+ Nguồn tín hiệu Video được xem như nguồn có nhớ Các thông tinđược truyền trên hai dòng kề nhau chỉ khác nhau rất ít và được xem là
Trang 13giống nhau Nó cũng đúng cho cả hai mành (nửa mành) và 2 ảnh kề nhau.Hay nói cách khác: Một số thông tin nhất định trong tín hiệu Video có thểđược khôi phục lại ở đầu thu mà không cần truyền đi nó.
+ Dựa vào những đặc điểm sinh lý của mắt người: độ nhạy của mắt,các đặc điểm về phổ của mắt, khả năng phân biệt của mắt, độ lưu ảnh củavõng mạc nên không cần truyền đi toàn bộ thông tin chứa trong các dòng
và các mành hoặc các ảnh liên tục, các tín hiệu không truyền đi đó gọi làtín hiệu dư thừa (Redundanced Video Signal)
+ Để giảm tốc độ bit truyền hình số còn thực hiện chọn mã thích hợp
có thể thực hiện theo các nhóm sau:
DPCM: PCM phi tuyến, PCM có dự báo, PCM vi sai
Mã chuyển vị (chuyển đổi)
Mã nội suy và ngoại suy
Trong đó: PCM đòi hỏi tốc độ bit cao DPCM sử dụng đặc trưngthống kê ảnh và tín hiệu Video và cũng như đặc điểm của mắt người chophép làm giảm tốc độ bit nên trong truyền hình số người ta thường dùngphương pháp điều chế xung mã vi sai hơn cả
1.6 Phương thức truyền dẫn tín hiệu truyền hình số
Truyền hình quảng bá tiết kiệm được bộ nhớ và tiết kiệm kênh truyền.Một kênh truyền hình quảng bá truyền thống khi truyền tín hiệu truyền hình
số có thể truyền được trên 6 chương trình và mỗi chương trình có thể kèmtheo 2 đến 4 đường tiếng Ứng dụng kỹ thuật truyền hình số có nén có thểtruyền một chương trình truyền hình độ phân giải cao HDTV trên một kênhthông thường có băng thông (6-8)MHz, điều mà kỹ thuật tương tự không thểgiải quyết được
Truyền hình số có nén được sử dụng rộng rãi cho nhiều cấp chất lượngkhác nhau Từ S DTV có chất lượng tiêu chuẩn đến HDTV có chất lượng
Trang 14cao với tốc độ bit từ 5 – 24 Mb/s, được truyền dẫn và phát sóng qua cáp, qua
vệ tinh và trên mặt đất Có rất nhiều tiêu chuẩn nén dùng cho truyền hình số:MPEG-1, 2, 3, 4, 7….(Moving Picture Experts Group)
Chương trình quảng bá truyền hình số (digital video broadcastingDVB) chủ yếu sử dụng tiêu chuẩn nén MPEG-2, nó có phương thức sửa mãsai; căn cứ vào các chương trình Multimedia, sẽ chọn lựa các phương thứcđiều chế tương ứng và biên mã của các đường thông tin
Hiện nay có ba tiêu chuẩn truyền hình số là DVB (Châu Âu), ATSC(Mỹ), ISDB-T (Nhật), trong đó DVB tỏ ra có nhiều ưu điểm và có khoảng84% số nước trên thế giới trong đó có Việt Nam lựa chọn sử dụng
Mô hình hệ thống truyền dẫn DVB được mô tả như hình vẽ dưới đây:
Sau khi xác định các tiêu chuẩn của phát truyền hình số DVB, do các sựtruyền tải Multimedia khác nhau, lĩnh vực ứng dụng khác nhau nên DVB đãđược tổ chức và phân chia thành một số hệ thống, cụ thể là hệ thống quảng
bá truyền hình số vệ tinh DVB-S; hệ thống quảng bá truyền hình số cápDVB-C (Cable); hệ thống quảng bá truyền hình số vi ba DVB-M
Truyền đa chương trình Mã hoá đầu cuối cáp Điều chế QAM
Truyền đa chương trình Mã hoá kênh Điều chế QPSK
Truyền đa chương trình
Mã hoá kênh
Điều chế COFDM
Ghép kênh chương trình
Đến vệ tinh
Đến máy phát sóng trạm mặt đất
Hình 1.4: Mô hình hệ thống truyền dẫn DVB
Trang 15(Microwave); hệ thống quảng bá truyền hình số mặt đất DVB-T (Terrestrial);
hệ thống truyền hình số theo mạng tương tác DVB-I (Interact); hệ thốngtruyền hình số hệ thống cộng đồng DVB-CS (Community System)…
1.6.1 Hệ thống quảng bá truyền hình số qua cáp DVB-C
DVB-C: Hệ thống truyền dẫn qua cáp sử dụng độ rộng kênh truyền 8MHz, điều chế QAM với 64 trạng thái, tốc độ dữ liệu cực đại từ lớp truyềnMPEG-2 là 38,1 Mb/s
Trong mạng truyền hình hữu tuyến do tín hiệu hình ảnh được truyền tảitrên đường dây cáp đồng trục nên nó ít bị can nhiễu bên ngoài Trong cácnguyên tắc DVB đã quy định sử dụng các phương thức điều chế QAM, căm
cứ vào trạng thái môi trường truyền tải có thể sử dụng các tốc độ điều chếkhác nhau như 16-QAM; 128-QAM; 256-QAM
Hình 1.5 là sơ đồ của hệ thống quảng bá truyền hình số hữu tuyến.Nguồn tín hiệu truyền hình lấy nguồn từ vệ tinh thì cần một máy thu vệ tinh
số IRD (Integrated Receiver Coder) để thu các chương trình khác nhau vàchuyển đổi thành dòng dữ liệu MPEG-2, đối với tín hiệu thị tần-âm tần AVthì cần bộ giải nén biên mã số để giải mã tín hiệu, tạo ra dòng dữ liệuMPEG-2 Nguồn tín hiệu khác nhau sẽ tạo ra dòng dữ liệu MPEG-2 ở bộtrộn nhiều đường số để tiến hành trộn và thu được dòng tín hiệu có tốc độ
Máy thu vệ tinh số
Máy thu vệ tinh số
Máy thu vệ tinh số
Bộ giải điều chế số
Bộ giải điều chế số
Bộ giải điều chế số
Bộ trộn
Máy phát
Mạng hữu tuyến
Trang 16cao hơn Sau đó tín hiệu này đưa vào bộ điều chế QAM, bộ biến tần để đạtđược dải tần cần thiết cho mạng truyền hình hữu tuyến.
1.6.2 Hệ thống quảng bá truyền hình số vệ tinh DVB-S
Hệ thống truyền dẫn qua vệ tinh DVB-S có các đặc trưng như sau: Sửdụng băng tần C và Ku, điều chế số QPSK, tối ưu hoá cho từng tải riêng chotừng bộ phát đáp (Transponder: thiết bị thu phát trên vệ tinh) và công suấthiệu dụng, tốc độ dữ liệu cực đại từ lớp truyền MPEG-2 là 38,1 Mb/s
Nguyên lý truyền hình số vệ tinh trình bày ở hình 1.6 Thông tin âmtần và thị tần và các tín hiệu số trước tiên sẽ đi qua bộ nén số MPEG-2(ENC) tiến hành việc nén biên mã, tín hiệu truyền hình số với tốc độ trên200Mb/s được nén xuống còn 6Mb/s, dòng số liệu MPEG-2 bị nén nhiềuđường sẽ được đưa vào bộ trộn nhiều đường số tiến hành việc trộn, ở ngõ ra
sẽ nhận được dòng mã MPEG-2 có tốc độ cao hơn Căn cứ vào yêu cầu, cácchương trình truyền hình cần tải sẽ được thực hiện việc mã hoá, sau đó dòng
số liệu MPEG-2 được đưa vào bộ điều chế số QPSK Cuối cùng tiến hànhbiến tần, tín hiệu QPSK được điều chế tới trung tần IF, đạt tới tần số vi bacần thiết của dải sóng C hoặc Ku, thông qua anten phát tiến hành phát lên vệtinh
Sơ đồ khối của hệ thống thu truyền hình số vệ tinh như hình 1.7 Tínhiệu vệ tinh qua bộ biến tần LNB, máy thu vệ tinh số IRD sẽ tiến hành việc
Bộ điều chế QPSK
Bộ đổi tần lên Phát lên vệ tinh
Hình 1.6 Sơ đồ khối hệ thống quảng bá truyền hình số vệ tinh
Trang 17giải điều chế QPSK, giải mã đưa ra tín hiệu âm tần và thị tần, nếu dùng đầunối thu CATV ở trước thì mạng truyền hình hữu tuyến có thể được chiathành phương thức truyền tải tương tự và phương thức truyền tải số.
Trong phương thức truyền tải tương tự thì số đường truyền đạt và sốlượng máy thu bằng nhau, do tín hiệu đầu ra của máy thu vệ tinh số IRD là
AV cho nên cần phải dùng các bộ điều chế tương tự với các kênh tần khácnhau để truyền tải tín hiệu tới hộ dùng
1.6.3 Hệ thống quảng bá truyền hình số trên mặt đất DVB-T
Hệ thống phát sóng số trên mặt đất DVB-T sử dụng độ rộng kênh 8MHz, tốc độ dữ liệu cực đại từ lớp truyền MPEG-2 là 24Mb/s Người ra sửdụng phương pháp điều chế số mã hoá ghép kênh theo tần số trực giaoCOFDM do sự truyền tải của hệ thống quảng bá truyền hình số trên mặt đấttương đối đặc biệt, có hiện tượng phản xạ tín hiệu nhiều lần, can nhiễu rấtnghiêm trọng
7-Máy thu vệ tinh số
Máy thu vệ tinh số
Bộ mã hóa MPEG - 2
Bộ mã hóa MPEG - 2
Máy thu
vệ tinh số
Tivi thông thường
Trang 18Kết luận chương 1
Những nội dung đã trình bày trong chương 1 cho ta cái nhìn tổng thể
về các vấn đề của truyền hình số, vai trò của việc lựa chọn tần số lấy mẫu, sốbit lượng tử, các loại mã và sự cần thiết phải nén tín hiệu nhằm đưa truyềnhình số vào ứng dụng thực tiễn Vấn đề về nén tín hiệu video trong truyềnhình số sẽ được giải quyết trong chương 2
CHƯƠNG 2: CÁC CÔNG NGHỆ NÉN TÍN HIỆU VIDEO TRONG
TRUYỀN HÌNH SỐ
Nén nhằm giảm tốc độ bit của các dòng dữ liệu tốc độ cao mà vẫnđảm bảo chất lượng hình ảnh hoặc âm thanh cần truyền tải Tín hiệu Videosau khi được số hoá (8 bit) có tốc độ bằng 216 Mb/s Để có thể truyền trongmột kênh truyền hình thông thường, thì tín hiệu video số cần phải được néntrong khi vẫn đảm bảo được chất lượng hình ảnh Chương 2 nêu các nộidung này nhằm xây dựng nội dung lý luận cho các giải pháp sẽ đưa ra trongchương tiếp theo (chương 3) về ứng dụng công nghệ nén trong sản xuấtchương trình truyền hình
2.1 Tổng quan về kỹ thuật nén Video số
2.1.1 Khái niệm chung
2.1.1.1 Mục đích của nén Video số
Nén video có hai lợi ích quan trọng thấy rõ:
Thứ nhất: nén video giúp chúng ta có thể sử dụng nguồn video số đãđược mã hoá để truyền đi hay lưu trữ một cách có hiệu quả ngay cả trênnhững môi trường truyền dẫn không hỗ trợ những file video chưa được nénlúc đầu Ví dụ, một đĩa DVD sẽ chỉ có thể chứa được vài giây một đoạnvideo nguyên bản không qua nén ở độ phân giải và tốc độ khung hình tương
Trang 19đương với chất lượng tương ứng trên tivi truyền hình sẽ không thể sử dụngnhư lý giải ở trên.
Thứ hai: quá trình nén video cho phép việc sử dụng những nguồnvideo đã qua nén cho quá trình lưu trữ hay truyền đi một cách có hiệu quả
Ví dụ, với một kênh truyền dẫn tốc độ cao, việc lựa chọn và truyền đi mộtvideo nén với độ phân giải cao thậm chí cả những luồng video nén là hợp lýhơn nhiều so với việc sẽ truyền đi một video đơn lẻ với độ phân giải thấphay từng luồng video chưa qua nén
2.1.1.2 Bản chất của nén
Khác với nguồn dữ liệu một chiều như nguồn âm, đặc tuyến đa chiều của nguồn hình ảnh cho thấy: nguồn ảnh chứa nhiều sự dư thừa hơn các nguồn thông tin khác Đó lμ:
Sự dư thừa về mặt không gian (spatial redundancy):
Các điểm ảnh kề nhau trong một mμnh có nội dung gần giống nhau
Sự dư thừa về mặt thời gian (temporal redundancy):
Các điểm ảnh có cùng vị trí ở các mμnh kề nhau rất giống nhau
Sự dư thừa về mặt cảm nhận của con người:
Mắt người nhạy cảm hơn với các thμnh phần tần số thấp vμ ít nhạy cảm với sự thay đổi nhanh, tần số cao
Do vậy, có thể coi nguồn hình ảnh lμ nguồn có nhớ (memory source).Nén ảnh thực chất lμ quá trình sử dụng các phép biến đổi để loại bỏ đicác sự dư thừa vμ loại bỏ tính có nhớ của nguồn dữ liệu, tạo ra nguồn dữ liệumới có lượng thông tin nhỏ hơn Đồng thời sử dụng các dạng mã hoá có khảnăng tận dụng xác suất xuất hiện của các mẫu sao cho số lượng bít sử dụng
để mã hoá một lượng thông tin nhất định lμ nhỏ nhất mμ vẫn đảm bảo chất
Trang 20lượng theo yêu cầu Nhìn chung quá trình nén vμ giải nén có thể lý giải mộtcách đơn giản như hình 2.1.
Biến đổi:
Một số phép biến đổi vμ kỹ thuật được sử dụng để loại bỏ tính có nhớcủa nguồn dữ liệu ban đầu, tạo ra một nguồn dữ liệu mới tương đương chứalượng thông tin ít hơn Ví dụ như kỹ thuật tạo sai số dự báo trong công nghệDPCM hay phép biến đổi cosin rời rạc của công nghệ mã hoá chuyển đổi.Các phép biến đổi phải có tính thuận nghịch để có thể khôi phục tín hiệu banđầu nhờ phép biến đổi ngược
M∙ hoá:
Các dạng mã hoá được lựa chọn sao cho có thể tận dụng được xác suấtxuất hiện của mẫu Thông thường sử dụng mã RLC (run length coding: mãhoá loạt dμi) vμ mã VLC (variable length coding): gắn cho mẫu có xác suấtxuất hiện cao từ mã có độ dμi ngắn sao cho chứa đựng một khối lượng thôngtin nhiều nhất với số bit truyền tải ít nhất mμ vẫn đảm bảo chất lượng yêucầu
Trang 21 Thuật toán nén không tổn thất không lμm suy giảm, tổn hao dữ liệu.
Do vậy, ảnh khôi phục hoμn toμn chính xác với ảnh nguồn
Các thuật toán nén có tổn thất chấp nhận loại bỏ một số thông tinkhông quan trọng như các thông tin không quá nhạy cảm với cảmnhận của con
người để đạt được hiệu suất nén cao hơn, Do vậy, ảnh khôi phục chỉ rất gầnchứ
không phải lμ ảnh nguyên thủy
Đối với nén có tổn thất, chất lượng ảnh lμ một yếu tố vô cùng quantrọng, Tuỳ theo yêu cầu ứng dụng mμ các mức độ loại bỏ khác nhau được sửdụng, cho mức độ chất lượng theo yêu cầu
2.1.2 Một số dạng mã hoá sử dụng trong các công nghệ nén.
Các dạng mã hoá sử dụng trong công nghệ nén đều tận dụng được xácsuất xuất hiện mẫu nhằm đạt được độ dμi mã trung bình (số bit trung bìnhcần để mã hoá một mẫu) lμ nhỏ nhất Tuy nhiên, độ dμi nμy có một giới hạndưới mμ không một phương pháp mã hoá nμo có thể cung cấp độ dμi từ mãtrung bình nhỏ hơn Đó lμ “ entropy” của nguồn tín hiệu
2.1.2.1 Khái niệm entropy của nguồn tín hiệu
Khái niệm ”entropy” của nguồn tín hiệu được sử dụng để đo lượngthông tin một nguồn tin chứa đựng
Một nguồn tin có N mẫu {s1,s2, ,sN} với xác suất xuất hiện các mẫutương ứng lμ {p(s1), p(s2), , p(sN)} Khi đó,” entropy” của nguồn tin đượcđịnh nghĩa như sau: [1]
i
S P H
1
2 ( ) log
).
(
Ví dụ một nguồn tin gồm các mẫu {1,0} với:
+ xác suất xuất hiện mẫu “1” lμ 0,8
+ xác suất xuất hiện mẫu “0” lμ 0,2
Trang 22Khi đó “entropy” của nguồn lμ:
H = - (0,8.log20,8 + 0,2.log20,2)
= 0,7219 bit
“Entropy” của nguồn tin quy định giới hạn dưới tốc độ bit tại đầu ra
bộ mã hoá Phương pháp mã hoá nμo có độ dμi mã trung bình (số bit trungbình cần để mã hoá một mẫu) cμng gần giá trị H thì phương pháp mã hoá đócμng hiệu quả
2.1.2.2 Mã hoá với độ dμi chạy RLC (run length coding) i chạy RLC (run length coding) [3]
Phương pháp nén RLC này dựa trên cơ sở là sự liên tiếp lặp đi lặp lạicác điểm ảnh trong ảnh số, xuất hiện là do sự tương quan giữa các điểm ảnh,đặc biệt là với các ảnh 2 mức (bi – level images) RLC tách các giá trị giốngnhau và biểu diễn như là một tổng, kỹ thuật này chỉ áp dụng cho các chuỗi
Một dạng cải tiến của mãc RLC là mã có độ dài thay đổi VLC
(Variable Length Code) dùng để biểu diễn các độ dài chạy cũng như các giá trị symbol Cách thực hiện là tính phân bố xác xuất của độ dài chạy và các giá trị symbol Đây là sự kết hợp của mã hoá RLC với mã hoá thống kê
2.1.2.3 Mã hoá với độ dμi chạy RLC (run length coding) i thay đổi VLC (variable length coding) (mã Huffman)
Trong các công nghệ nén, mã Huffman lμ dạng mã được sử dụng phổbiến nhất Bảng mã Huffman có thể cho độ dμi mã trung bình để mã hoá cho
Trang 23một mẫu lμ nhỏ nhất do tận dụng xác suất xuất suất hiện của các mẫu trongnguồn tín hiệu.
Trong đó, mẫu có xác suất xuất hiện cao nhất sẽ được gắn với một từ
mã có độ dμi ngắn nhất Mặc dù có độ dμi mã thay đổi song mã Huffmanvẫn có khả năng giải mã đúng do có thuộc tính tiền tố duy nhất (không cóbất cứ từ mã nμo lại lμ phần đầu của từ mã tiếp theo)
Để xây dựng cây mã Huffman gồm các bước sau:
1- Liệt kê các xác suất của các symbol nguồn và tạo ra các tập nútbằng cách cho các xác suất này thành các nhánh của cây nhị phân.2- Lấy hai nút với xác suất nhỏ nhất từ tập nút và tạo ra một xác suấtmới bằng tổng xác suất của các xác suất đó
3- Tạo ra một nút mẹ với các xác suất mới, và đánh dấu 1 cho nút con
ở trên và 0 cho nút con ở dưới
4- Tạo tiếp tập nút bằng cách thay thế 2 nút với xác xuất nhỏ nhất chonút mới Nếu tập nút chỉ chứa một nút thì kết thúc, ngược lại thì taquay lại bước 2
Phương pháp mã hoá thống kê Huffman sẽ trở nên nặng nề khi số tincủa nguồn quá lớn Trong trường hợp nμy người ta dùng một biện pháp phụ
để giảm nhẹ công việc mã hoá Trước tiên liệt kê các tin của nguồn theo thứ
tự xác suất giảm dần, sau đó ghép thμnh từng nhóm tin có tổng xác suất gầnbằng nhau Dùng một mã đều để mã hoá các tin trong cùng một nhóm Sau
đó xem các nhóm tin như một khối tin vμ dùng phương pháp Huffman để mãhoá các khối tin Từ mã cuối cùng tương ứng với mỗi tin của nguồn gồm haiphần: một phần lμ mã Huffman vμ một phần lμ mã đều
Xét ví dụ thiết lập cây mã Huffman cho một nguồn tin chứa các mẫu :{s0, s1, ,s7} với xác suất xuất hiện lần lượt lμ :
0 0 0.13 1 1 0.18
0 0 0
0 1
1
P(s2)=0.21 P(s3)=0.3
P(s4)=0.05 P(s5)=0.05 P(s6)=0.07 P(s )=0.03
P(s1)=0.19 P(s0)=0.1
1
0011 11 10 01 0001 00101 0000 00100
Liệt kê Thiết kế mã Từ mã xác suất
Trang 24Mặc dù mã Huffman hiệu quả nhưng chúng ta phải hiểu rằng mã hoáHuffman chỉ tối ưu khi đã biết trước xác suất của mã nguồn vμ mỗi biểutrưng của mã nguồn được mã hoá bằng một số bit nguyên.
Đặc biệt mã hoá Huffman được phát triển cho ảnh số nhưng áp dụngcho rất nhiều loại ảnh, mỗi ảnh có xác suất xuất hiện biểu trưng của riêng nó
Do đó mã Huffman không phải lμ tối ưu cho bất cứ loại ảnh đặc biệt nμo
2.1.2.4 Mã hoá dự đoán (Predictive coding)
Như đã nói, nguồn ảnh chứa một lượng thông tin rất lớn Nếu mã hoátrực tiếp nguồn tin nμy theo PCM, tốc độ dòng bit thu được sẽ rất cao Mặtkhác, nguồn ảnh lại chứa đựng sự dư thừa vμ tính “có nhớ”: giữa các điểmảnh lân cận có mối quan hệ tương hỗ với nhau
Mã hoá dự đoán được xây dựng dựa trên nguyên tắc cơ bản như sau:
♦ Lợi dụng mối quan hệ tương hỗ nμy, từ giá trị các điểm ảnh lân cận,theo một nguyên tắc nμo đó có thể tạo nên một giá trị gần giống điểm ảnhhiện hμnh Giá trị nμy được gọi lμ giá trị “dự báo”
♦ Loại bỏ đi tính “có nhớ” của nguồn tín hiệu bằng một bộ lọc đặcbiệt có đáp ứng đầu ra lμ hiệu giữa tín hiệu vμo s(n) vμ giá trị dự báo của nó
♦ Thay vì lượng tử hoá trực tiếp các mẫu điểm ảnh, mã hoá dự đoánlượng tử vμ mã hoá các “sai số dự báo” tại đầu ra bộ lọc “Sai số dự báo”lμ
Trang 25sự chênh lệch giữa giá trị dự báo vμ giá trị thực của mẫu hiện hμnh Donguồn “sai số dự báo”(error prediction source) lμ nguồn không có nhớ vμchứa đựng lượng thông tin thấp, nên số bit cần để mã hoá sẽ giảm đi rấtnhiều.
Phương pháp tạo điểm ảnh dựa trên tổng giá trị của điểm dự đoán vμ sai số
dự báo gọi lμ “điều chế xung mã vi sai (DPCM)”
Sơ đồ khối bộ mã hoá và giải mã DPCM có dạng sau:
Nhằm tránh các lỗi có thể xuất hiện trong khi truyền, một mẫu đầy đủ
sẽ được gửi đi theo chu kỳ nhất định cho phép cập nhật được các giá trịchính xác Mã hoá DPCM cũng sử dụng thêm các kỹ thuật dự đoán và lượng
tử hoá thích nghi để hoàn thiện thêm kỹ thuật nén này
2.1.2.5 Mã hoá chuyển đổi (Transform coding)
Đối với việc mã hoá riêng rẽ từng điểm một sẽ không đạt được hiệuquả bởi ta không tận dụng được hết mối quan hệ giữa các khối điểm trongảnh số Phương pháp mã chuyển vị là một phương pháp có hiệu quả trongviệc mã hoá khối điểm thông qua biến đổi tuyến tính các điểm này thành các
hệ số chuyển vị và mã hoá các hệ số chuyển vị đó Phương pháp này tậptrung vào một số các hệ số chuyển vị mà không phải là các điểm ảnh của ảnh
e
q + Gi¶i m·
Bộ dự đoán
Mã hoá entropy
Trang 26gốc và lượng thông tin chỉ trong một số ít hệ số chuyển vị Như vậy, số bitdùng cho quá trình mã hoá sẽ ít đi.
Hơn nữa, do hệ thống thị giác của con người không thể nhận biết hoàntoàn các chi tiết của ảnh khi những chi tiết đó biến đổi nhanh so với các biếnđổi chậm, bởi vậy để mã hoá các hệ số chuyển vị ở tần số cao, ta chỉ cần một
số ít bit mà chất lượng hình ảnh vẫn tốt
2.2 Các chuẩn nén video
Hiệp hội viễn thông quốc tế (ITU) và tổ chức tiêu chuẩn quốc tế/Uỷban kỹ thuật điện tử quốc tế (ISO/IEC) là hai tổ chức phát triển các tiêuchuẩn mã hoá Video Theo ITU-T, các tiêu chuẩn mã hoá video được coi làcác khuyến nghị gọi tắt là chuẩn H.26x (H.261, H.262, H.263, H.264) Vớitiêu chuẩn ISO/IEC, chúng được gọi là MPEG-x (như MPEG-1, MPEG-2 vàMPEG-4) Những khuyến nghị của ITU được thiết kế dành cho các ứng dụngtruyền thông video thời gian thực như video Conferencing hay điện thoạitruyền hình Mặt khác, những tiêu chuẩn MPEG được thiết kế hướng tới mụctiêu lưu trữ Video chẳng hạn như trên đĩa quang DVD, quảng bá video số trênmạng cáp, đường truyền số DSL, truyền hình vệ tinh hay những ứng dụngtruyền dòng video trên mạng Internet hoặc thông qua mạng không dây Với đốitượng để truyền dẫn video là mạng Internet thì ứng cử viên hàng đầu là chuẩnnén MPEG-4 AVC, còn được gọi là H.264, MPEG-4 part 10, H.26L hoặc JVT
2.3 Nén Video theo tiêu chuẩn MPEG
Nhóm các chuyên gia về ảnh động (Motion Pictures Expert MPEG) làm việc cho tổ chức tiêu chuẩn quốc tế ISO (ISO/IEC) có nhiệm vụnghiên cứu và phát triển các tiêu chuẩn nén, giải nén tín hiệu video, audio.Hiện nay các chuẩn nén MPEG đang được sử dụng phổ biến và được các tổchức ISO/IEC, ITU (International Telecommunication Union) công nhận làchuẩn nén quốc tế, áp dụng cho các hệ truyền hình tại Mỹ, Nhật Bản, Châu âu
Group-MPEG-1: được phát triển vào năm 1988 – 1992, là tiêu chuẩn đầu tiêncủa MPEG Chuẩn MPEG-1 được sử dụng chủ yếu để nén tín hiệu VCD và
Trang 27các luồng tốc độ thấp khoảng 1.5Mbps MPEG-1 hỗ trợ nén các tín hiệu cóphân giải thấp 352 x 240(60Hz) và 352 x 288(50Hz), sử dụng biến đổi cosinrời rạc (DCT) để loại bỏ dư thừa không gian, có dự đoán và bù chuyển động.Điểm nổi bật của MPEG-1 khi đó là có hỗ trợ nén các hình ảnh quét lần lượt.
MPEG-2: Được xây dựng từ năm 1991 đến 1994 và vẫn đang được sửdụng rộng rãi đến tận bây giờ MPEG-2 có thuật toán nén tương tự nhưMPEG-1, song đã được phát triển lên tầm cao hơn, hoàn chỉnh hơn với hệthống công cụ và cấp đa dạng (Profile và Level), hỗ trợ nén cho rất nhiềuđịnh dạng tín hiệu video, part 3 là về audio MPEG-2/part 2 tương tự nhưMPEG-1 song đã có hỗ trợ nén hình ảnh quét xen kẽ Chính vì vậy, MPEG-2được sử dụng rộng rãi và chính thức trong các tiêu chuẩn truyền hình DVB,ISDB
MPEG-3: Được phát triển vào năm 1992 với mục đích áp dụng choHDTV, tuy nhiên nó bị huỷ bỏ vào năm 1993 do nhận thấy rằng: MPEG-2hoàn toàn có thể thực hiện cho HDTV
MPEG-4: Là thiết kế của MPEG nhằm hỗ trợ các ứng dụngaudio/video hướng đối tượng, các nội dung 3D và hỗ trợ quản lý bản quyềnnội dung số DRM (Digital Rights Management) Đây là một định dạng nén/
mã hoá video có khả năng truyền thông trong các môi trường băng thông rấtkhác nhau So với MPEG-2, MPEG-4 ưu việt hơn hẳn về tính năng tươngtác Hiện nay đa số các nhà cung cấp dịch vụ Multimedia như,RealNetworks, DivXNetworks, Microsoft đều đã hỗ trợ chuẩn MPEG-4trong cấu trúc hạ tầng cũng như công cụ Codecs của mình (Apple với QuickTime và các máy chủ Darwin Streaming Servers, RealNetWorks vớiRealPlayers và các máy chủ Helix Servers, DivXNetworks với DivX,Microsoft với Card Plug-ins cắm nối với Windows Media Players…) Trênmôi trường mạng sử dụng kỹ thuật TCP/UDP Streaming, chuẩn MPEG-4AVC/H.264 có thể cho phép xem truyền hình trực tuyến Online với chấtlượng khá tốt tại các tốc độ bit ≤ 500kbps
Trang 28MPEG-7: Là một chuẩn dùng để mô tả các nội dung multimedia, chứkhông phải là một chuẩn cho nén và mã hoá audio/ảnh động như MPEG-1,MPEG-2 hay MPEG-4 MPEG-7 sử dụng ngôn ngữ đánh dấu mở rộngXML để lưu trữ các siêu dữ liệu Metadata, đính kèm timecode để gắn thẻcho các sự kiện hay đồng bộ các dữ liệu MPEG-7 bao gồm 03 bộ chuẩn sau:
- Bộ các sơ đồ đặc tả (description schemes) và các đặc tả (descriptors);
- Ngôn ngữ xác định DDL (Description Definition Languae) để địnhnghĩa các sơ đồ đặc tả;
- Sơ đồ mã hoá quá trình đặc tả;
2.3.1 Nén Video theo MPEG-1
Tiêu chuẩn MPEG-1 gồm 4 phần:
Phần 1: Hệ thống (ISO/IEC 11172-1)
Phần 2: Nén video (ISO/IEC 11172-2)
Phần 3: Nén Audio (ISO/IEC 11172-3)
Phần 4: Kiểm tra (ISO/IEC 11172- 4)
MPEG-1 nghiên cứu cách thức ghép nối một hoặc vμi dòng dữ liệu chứathông tin thời gian để hình thμnh nên một dòng dữ liệu Nó cung cấp qui tắc cúpháp đồng bộ hoá quá trình phát lại cho một dải ứng dụng Video rộng
MPEG-1 coi ảnh chuyển động như dạng thức dữ liệu máy tính (gồmcác điểm ảnh) Cũng như các dữ liệu máy tính (ảnh vμ văn bản), ảnh videochuyển động có khả năng truyền vμ nhận bằng máy tính vμ mạng truyềnthông Chúng cũng có thể được lưu trữ trong các thiết bị lưu trữ dữ liệu sốnhư đĩa CD, đĩa Winchester vμ ổ quang
MPEG-1 cung cấp cả các ứng dụng đối xứng vμ không đối xứng:
Trong ứng dụng không đối xứng, ảnh động được nén một lần, sau đó giảinén nhiều lần để truy cập thông tin, ví dụ trò chơi games
Trong ứng dụng đối xứng, quá trình nén vμ giải nén phải cân bằng
nhau VD: điện thoại hình, thư điện tử
Trang 29Để đạt được hiệu suất nén cao mμ vẫn giữ tốt chất lượng ảnh phụchồi, chuẩn MPEG-1 sử dụng cả công nghệ nén trong ảnh (Intraframe) vμ liênảnh (Interframe) để loại bỏ được cả sự dư thừa không gian vμ thời gian.
Do MPEG-1 được phát triển cho lưu trữ dữ liệu số nên đòi hỏi có sựtruy cập ngẫu nhiên (Random Access) Cách thức mã hoá tốt nhất cho truycập ngẫu nhiên lμ mã hoá Intraframe đơn thuần Song do sự dư thừa thôngtin về thời gian chưa được loại bỏ nên hiệu suất nén rất thấp Do vậy trongtiêu chuẩn nén MPEG-1, có sự cân bằng giữa nén trong ảnh (Intraframe) vμnén liên ảnh (Interframe) bằng cách sử dụng các công nghệ sau đây:
Mã hoá độ dμi thay đổi (mã Huffman-VLC)
Tức lμ có sự kết kết hợp hai công nghệ nén DPCM vμ TrasformCoding Thuật toán nén MPEG-1 sử dụng bù chuyển động khối để giảm sựdư thừa thời gian với vecto chuyển động cho mỗi khối kích thước 16 x16điểm ảnh Bù chuyển động được sử dụng cho cả dự báo nhân quả vμ khôngnhân quả
Dự báo nhân quả tạo dự báo ảnh hiện hμnh từ ảnh trước đó
Dự báo không nhân quả tạo dự báo cho ảnh hiện hμnh dựa trên ảnhtrong quá khứ vμ cả tương lai
Vòng lặp DPCM được sử dụng để tạo khung sai số dự báo Sauđó,công nghệ mã hoá chuyển đổi chuyển khung sai số nμy sang miền tần số
để nén các hệ số nhờ lượng tử hoá vμ mã hoá Huffman trước khi truyền tảihay lưu trữ
2.3.1.1 Các thμi chạy RLC (run length coding) nh phần ảnh cơ bản trong chuẩn nén MPEG
Trang 30Các tiêu chuẩn MPEG cấu trúc dữ liệu dạng lớp Bao gồm các thμnhphần cơ bản sau đây:
Khối (Block): Lμ đơn vị cơ bản cho chuyển đổi DCT Bao gồm 8x8
điểm ảnh tín hiệu chói hoặc tín hiệu mμu
Macro Block: Lμ nhóm các khối DCT tương ứng với thông tin của một
cửa sổ 16x16 điểm ảnh gốc Có nhiều dạng Macro Block khác nhau phụthuộc vμo cấu trúc lấy mẫu được sử dụng
Phần đầu đề (header) của Macroblock chứa thông tin phân loại (Y hay
Cb, CR) vμ vector bù chuyển động tương ứng
Lát (slice): Được cấu thμnh từ một hay một số MB liên tiếp nhau.
Phần header của slice chứa thông tin về vị trí của nó trong ảnh vμ tham
số quét lượng tử (quantized scaling factor) Kích cỡ của slice quyết định bởimức bảo vệ lỗĩ cần có trong ứng dụng vì bộ giải mã sẽ bỏ qua slice bị lỗi Hệ
số một chiều DC được định vị tại điểm bắt đầu mỗi slice
Ảnh: Lớp ảnh cho bên thu biết về loại mã hoá khung I,P,B) Phần
header mang thứ tự truyền tải của khung để bên thu hiển thị khung theođúng thứ tự, ngoμi ra còn có một số thông tin bổ sung như thông tinđồng bộ, độ phân giải vμ vecto chuyển động
Hình 2.4: Cấu trúc Macroblock của các dạng lấy mẫu
Trang 31 Nhóm ảnh (group of picture): Gồm cấu trúc các ảnh I,B vμ P Mỗi
nhóm bắt đầu bằng ảnh I cung cấp điểm vμo ra vμ tìm kiếm Phầnheader chứa 25 bit thời gian vμ chế độ điều khiển cho VTR vμ thông tinthời gian Trong MPEG có các cấu trúc nhóm ảnh điển hình như sau:
Chuỗi Video (Video Sequence): lớp chuỗi bao gồm phần header, một
hoặc một số nhóm ảnh (Picture Group) vμ phần kết thúc chuỗi Sequenceend Code)
Thông tin quan trọng nhất của phần header lμ kích thước (dọc, ngang)của mỗi ảnh, tốc độ bit, tốc độ ảnh vμ dung lượng đòi hỏi bộ đệm dữ liệubên thu Thông tin chuỗi ảnh vμ phần header của chuỗi lμ dòng bit đã mãhoá, còn gọi lμ dòng video cơ bản
F2
F 2
F3
F 3
F
4
F 4
F5
F 5
F
6
F 6
F7
F 7
F
8
F 8
F
9
F 9
F10
F 10
Trang 32Hình 2.6: Cấu trúc dòng dữ liệu video MPEG
2.3.1.2 Sự phân loại ảnh MPEG
Tiêu chuẩn nén video MPEG định nghĩa 3 loại ảnh: ảnh I, ảnh B vμ ảnh P.
a Ảnh I: (Intra - Coded Picture)
Các ảnh I được mã hoá theo mode Intra để có thể giải mã mμ khôngcần sử dụng dữ liệu từ bất cứ một ảnh nμo khác Đặc điểm của phương pháp
mã hoá nμy như sau:
Chỉ loại bỏ được sự dư thừa không gian
Dùng các điểm trong cùng một khung để tạo dự báo
b Ảnh P (Predictive Code Picture)
Ảnh P được mã hoá liên ảnh một chiều (Interframe một chiều):
Dự báo Inter một chiều
ảnh dự báo được tạo ảnh tham chiếu trước đó (dự báo nhân quả) Ảnhtham chiếu nμy có thể lμ ảnh I hoặc ảnh P gần nhất
Trang 33 Có sử dụng bù chuyển động Thông tin ước lượng chuyển động của
các khối nằm trong vecto chuyển động (motion vecto) Vecto nμy xác
định Macroblock nμo được sử dụng từ ảnh trước
Do vậy ảnh P bao gồm cả những MB mã hoá Inter (I - MB) lμ những
macroblock chứa thông tin lấy từ ảnh tham chiếu vμ những MB mã hoá Intra
lμ những MB chưá thông tin không thể mượn từ ảnh trước Ảnh P có thể
được sử dụng lμm ảnh tham chiếu tạo dự báo cho ảnh sau
c Ảnh B (Bidirectionally Predicted Pictures)
Ảnh B lμ ảnh mã hoá liên ảnh hai chiều.Tức lμ :
Có sử dụng bù chuyển động
Dự báo không nhân quả, ảnh dự báo gồm các macroblock của cả
khung hình trước đó vμ sau đó
Việc sử dụng thông tin lấy từ ảnh trong tương lai hoμn toμn có thể
thực hiện được vì tại thời điểm mã hoá thì bộ mã hoá đã sẵn sμng truy cập
tới ảnh phía sau Ảnh B không được sử dụng lμm ảnh tham chiếu tạo dự báo
cho các ảnh sau [3]
33
Khung dự báo (B) = khung trước
- khung sau + vecto chuyển động hai chiều
Đường di chuyển của vật thể
Vị trí nội suy
Vùng không bao phủ Khung kề
trước (n)
Khung hiện hành (n+1)
Khung kề sau (n+1)
Dự báo bù chuyển động ảnh B
Trang 34d Thứ tự truyền dẫn vμi chạy RLC (run length coding) thứ tự hiển thị ảnh.
Chuỗi ảnh MPEG thường có cấu trúc IBBPBBPBBI nhưng thứ tựtruyền dẫn vμ thứ tự hiển thị ảnh lμ khác nhau do khi tạo ảnh B cần thông tin
từ cả khung quá khứ vμ tương lai.Như vậy có nghĩa, ảnh trong tương lai cầnphải được truyền dẫn
trước Trong khi đó, lúc hiển thị phải theo đúng thứ tự nguồn Để thực hiện điều nμy, lớp ảnh (Picture layer) của dòng dữ liệu MPEG có thông tin về số thứ tự ảnh trợ giúp hiển thị
F1
F 1
F2
F 2
F
3
F 3
F4
F 4
F
5
F 5
F6
F 6
F
7
F 7
F8
F 8
F9
F 9
F10
F 10
Trang 352.3.1.3 Tiờu chuẩn MPEG-1
MPEG-1 cú phạm vi ứng dụng rộng rói cho dạng thức CSIF (CommonSource Intermediate Format) CSIF lμ một định dạng nguồn dữ liệu đầu vμocủa cỏc bộ nộn vμ giải nộn (codec) do CCITT qui định phự hợp với hai dạngquột TV 525/60 vμ 625/50 Dạng thức nμy gắn với cấu trỳc lấy mẫu 4:2:0đ−ợc qui định như sau: [3]
CCIR – 601 525
CSIF- 525 4:2:0
CCIR - 601 625
CCIR - 601 625
Số điểm/dũng tớch cực
+ Chúi Y
+ Mμu C b , C R )
720 360
352 176
720 360
352 176 Tần số lấy mẫu (MHz)
+ Chúi Y Chúi Y
+ Mμu (C b , C R )
13,5 6,75
6,75 3,38
13,5 6,75
6,75 3,38
Số dũng tớch cực
+ Chúi Y
+ Mμu (C b ,C R )
480 480
240 120
576 576
288 144
Nh vậy đối với MPEG-1, dòng dữ liệu truyền hình chuẩn theo CCIR-− vậy đối với MPEG-1, dòng dữ liệu truyền hình chuẩn theo
CCIR-601 phải đ ợc biến đổi sang dạng CSIF bằng một bộ chuyển đổi (converter).− vậy đối với MPEG-1, dòng dữ liệu truyền hình chuẩn theo
CCIR-Điều n y đ ợc thực hiện bằng cách sử dụng bộ lọc dòng (horizontalμy đ−ợc thực hiện bằng cách sử dụng bộ lọc dòng (horizontal − vậy đối với MPEG-1, dòng dữ liệu truyền hình chuẩn theo decimation filter) cho tín hiêụ chói m nh lẻ v bộ lọc dòng v m nh cho tínμy đ−ợc thực hiện bằng cách sử dụng bộ lọc dòng (horizontal μy đ−ợc thực hiện bằng cách sử dụng bộ lọc dòng (horizontal μy đ−ợc thực hiện bằng cách sử dụng bộ lọc dòng (horizontal μy đ−ợc thực hiện bằng cách sử dụng bộ lọc dòng (horizontalhiệu CR, CB m nh lẻ Quá trình giải mã tại bộ thu phải dự báo m nh chẵn từμy đ−ợc thực hiện bằng cách sử dụng bộ lọc dòng (horizontal μy đ−ợc thực hiện bằng cách sử dụng bộ lọc dòng (horizontal
CCIR-m nh lẻ nội suy Để giảCCIR-m CCIR-mức độ phức tạp v giá th nh bộ giải CCIR-mã, trongμy đ−ợc thực hiện bằng cách sử dụng bộ lọc dòng (horizontal μy đ−ợc thực hiện bằng cách sử dụng bộ lọc dòng (horizontal μy đ−ợc thực hiện bằng cách sử dụng bộ lọc dòng (horizontalMPEG 1 một số tham số đ ợc mặc định th nh hằng số nh sau:− vậy đối với MPEG-1, dòng dữ liệu truyền hình chuẩn theo CCIR- μy đ−ợc thực hiện bằng cách sử dụng bộ lọc dòng (horizontal − vậy đối với MPEG-1, dòng dữ liệu truyền hình chuẩn theo CCIR-
± 64 điểm 327.680 bit 1,8 Mbps
Trang 36Bảng 2: Các tham số mặc định trong chuẩn MPEG-1MPEG-1 có một số tiêu chuẩn cơ bản như sau:
Chỉ có một cấu trúc lấy mẫu 4:2:0
Kích cỡ ảnh tối đa 720 pixel với 576 dòng sử dụng các tham số mặcđịnh
Độ chính xác mẫu đầu vμo 8 bit
Độ chính xác lượng tử hoá vμ DCT: 9 bit
Sử dụng lượng tử hoá DPCM tuyến tính cho hệ số DC
Lượng tử thích nghi cho lớp macroblock (16x16 điểm)
Độ chính xác cực đại của hệ số DC lμ 8 bit
Ma trận lượng tử chỉ có thể thay đổi ở lớp chuỗi
Sử dụng khung P vμ B
Độ chính xác dự báo chuyển động lμ nửa điểm
Tốc độ bit tối đa lμ 1,85 Mbps khi dùng tham số mặc định cho ảnh720x576 vμ 100 Mbps khi dùng tham số đầy đủ cho ảnh 4095 x 4095.MPEG-1 cho phép có sự truy cập ngẫu nhiên các khung video, tìmkiếm nhanh thuận ngược theo dòng bit đã nén, phát lại ngược dòng video vμkhả năng dời bỏ dòng bit nén
♦ Nếu ảnh I (mã hóa Intra): sử dụng dự báo Intra, lấy MB lân cận trước
đó lμm dự báo cho MB hiện hμnh MB lân cận nμy được phục hồi nhờ bộ giảilượng tử vμ biến đổi DCT ngược (IDCT)
Trang 37♦ Nếu ảnh B, P (mã hóa Inter): sử dụng bộ tạo dự báo Inter có bù chuyển
động
Bộ tạo dự báo nμy hoạt động như sau: [1]
• Chuyển động của các MB được tính toán nhờ bộ ước lượng chuyển
động theo các thuật toán Blocking Matching Kết quả cho vecto chuyển động
• Vecto chuyển động nμy được đưa đến khối dự báo có bù chuyển
động để tạo giá trị dự báo có bù chuyển động
• Do quá trình ước lượng chuyển động cần so sánh giữa khung hiện
hμnh với khung quá khứ (ảnh P) hoặc với cả khung quá khứ lẫn tương lai
(ảnh
B) nên cần có hai bộ lưu trữ ảnh
♦ Sai số giữa MB dự báo vμ hiện hμnh được biến đổi DCT, lượng tử
hóa, mã hóa VLC rồi đưa tới bộ nhớ đệm Đầu ra bộ nhớ đệm lμ dòng bit đã
ảnh so sánh
ảnh dự đoán
Xác định vector chuyển động
Bảng lượng tử Điều khiển tốc độ bit
Trang 38♦ Tham số lượng tử, thông tin phân loại Inter/Intra vμ Vecto chuyểnđộng sẽ được ghép kênh với thông tin ảnh đưa tới bên thu phục vụ cho quátrình tạo dự báo vμ giải mã khôi phục ảnh.
Hình 2.10: Sơ đồ bộ giải mã MPEG-1Trong dòng bit truyền đi từ bên phát sẽ có thông tin ảnh gốc cũng nhưcác tham số quy định bước lượng tử vμ vecto chuyển động Vecto chuyểnđộng nμy được bên thu sử dụng để tạo dự báo có bù chuyển động tương tựnhư phía phát
Giá trị sai số dự báo từ bên thu sau khi giải lượng tử vμ biến đổi DCTngược được cộng với giá trị dự báo Kết quả thu được ảnh cần hồi phục
2.3.2 Nén tín hiệu video theo MPEG-2
2.3.2.1 Tiêu chuẩn nén video MPEG-2
Tiêu chuẩn MPEG-2 còn được gọi lμ ISO/IEC 13818 lμ sự phát triểntiếp theo của MPEG-1 ứng dụng cho độ phân giải tiêu chuẩn của truyền hình
Dự báo ảnh
Số liệu điều khiển
Video
Trang 39 Phần 2: Video (ISO/IEC 13828-2): xác định những thμnh phần mãhóa đại diện cho dữ liệu video vμ phân loại xử lý giải mã để khôi phụclại khung hình ảnh.
Phần 3: Audio (ISO/IEC 13818-3): mã hóa vμ giải mã dữ liệu âmthanh
Phần 4: Biểu diễn (ISO/IEC 13818-3): định nghĩa quá trình kiểm tracác yêu cầu của MPEG-2
So với MPEG-1, MPEG-2 có nhiều cải thiện, ví dụ về kích thước ảnh
vμ độ phân giải ảnh, tốc độ bit tối đa, tính phục hồi lỗi, khả năng co giãndòng bit Khả năng co giãn dòng bit của MPEG-2 cho phép khả năng giải mãmột phần dòng bit mã hóa để nhận được ảnh khôi phục có chất lượng tuỳthuộc mức độ yêu cầu
Sau đây lμ một số đặc điểm chủ yếu của tiêu chuẩn nμy :
♦ Hỗ trợ nhiều dạng thức video, đặc biệt lμ các dạng thức video độphân giải không gian cao, dạng thức video xen kẽ của truyền hình
♦ Cú pháp dòng bit MPEG-2 lμ sự mở rộng của dòng bit MPEG-1
♦ Nén video MPEG-2 tương hợp với nén video MPEG-1 Được thểhiện qua 4 hình thức tương hợp
∗ Tương hợp thuận: bộ giải mã MPEG-2 có khả năng giải mã dòngbit (hoặc một phần dòng bit MPEG-1)
∗ Tương hợp ngược: bộ giải mã MPEG-1 có khả năng giải mã đượcmột phần dòng bit MPEG-2
∗ Tương hợp lên: bộ giải mã độ phân giải cao có khả năng giải mãđược dòng bit của bộ mã hoá có độ phân giải thấp
∗ Tương hợp xuống: bộ giải mã độ phân giải thấp có thể giải mãđược một phần dòng bit của bộ mã hóa độ phân giải cao
♦ MPEG-2 hỗ trợ khả năng co giãn (scalability): co giãn không gian,
co giãn SNR (Signal to Noise Ratio), co giãn phân chia số liệu
♦ Ngoμi ra còn có nhiều cải tiến khác trong MPEG-2 bao gồm: