Mỗi phương tiện đều có các qúa trình riêng biệt, nhưng hiện nay các lĩnh vực phát thanh và truyền hình đang dần hoà nhập, các ứng dụng mới đang được giới thiệu, các dịch vụ tổng hợp đang
Trang 1Nginh: Côigỉ nghệ Điện tử - Viễn Ihông.
Chiyên ngimh: Kỹ thuật Điện tử
M Số: 60 522 70
L,UẬN VẢN THẠC s ĩ
NGƯỜI HUỚNG DẪN KHOA HỌC
ĐAI H C QUÓCGìiiM H.', NỘI ; TRUNG TM ÍHÒNQ Tr.'M
,— - — TS T rịn h Anh Vũ
H à Nội - 2008
Trang 2Danh mục các chữ viết tắt
Danh mục các hình minh họa
Danh mục các bảng biểu
Mở đầu
Chương 1: TỔNG QUAN HỆ THỐNG TRUYỂN HÌNH SỐ MẶT ĐẤT DVB-T 1
1.1 XU HƯỚNG PHÁT TRIỂN TRUYỀN h ìn h s ố 1
1.2 CÁC TIÊU CHUẨN VỀ TRUYỀN h ìn h s ố MẶT ĐẤT 2
1.3 ĐẶC ĐIỂM C ơ BẢN CỦA TIÊU CHUAN DVB-T 4
1.4 Sơ ĐỒ KHỐI HỆ THỐNG TRUYỀN h ìn h s ố MẶT ĐẤT DVB-T 5
Chương 2: CÁC KỸ THUẬT c ơ BẢN TRONG TRƯYỂN h ìn h s ố m ặ t đ ấ t 9
2.1 KỶ THUẬT SỐ HÓA TÍN HIỆU TRUYỀN h ìn h .9
2.1.1 Lấy mâu tín hiệu Video 9
2.1.2 Lượng tử hóa và mã h ó a 12
2.2 KỸ THUẬT NÉN MPEG-2 13
2.2.1 Các khái niệm cơ bản của quá trình mã hóa Video MPEG-2 .13
2.2.2 Nén video số theo tiêu chuẩn MPEG-2 14
2.2.2.1 Nén ảnh 1 14
2.22.2 Nén ảnh loại p (nén liên ảnh) 18
2.2.23 Nén ảnh B 20
2.2.3 Các đặc tính và mức (Profiles and levels) 21
2.2.4 Nén Audio 22
2.2.5 Cấu trúc của dòng dữ liệu MPEG-2 24
2.2.5.1 Cấu trúc phân lớp .24
2.2.5.2 Dòng cơ sở và dòng cơ sở đóng gói 26
2.2.5.3 Dòng chương trình (PS) và dòng truyền tả i 27
2.3 GHÉP KÊNH DÒNG TRUYỀN t ả i n h iề u c h ư ơ n g t r ìn h 29
2.4 KỸ THUẬT MÃ HÓA ĐƯỜNG TRƯ YEN 31
Trang 32.6 CHẤT LƯỢNG ĐƯỜNG TRUYỀN t h e o t iê u CHưẨN DVB-T 53
Chương 3: MỘT s ố GIẢI PHÁP NÂNG CAO CHẤT LƯỢNG HỆ THỐNG TRUYỂN HÌNH S ố MẬT ĐẤT THEO CHUẨN DVB-T 56
3.1 CẢI THIỆN CHẤT LƯỢNG TÍN HIỆU TRUYỀN h ìn h s ố MẶT ĐẤT TỪ PHÍA PHÁT 56
3.1.1 Tăng khả nảng sửa lỗi của mã ngoài .57
3.1.2 Tăng độ sâu bộ tráo ngoài 57
3.1.3 Thay đổi kích thước nhớ bộ mã hóa trong 58
3.1.4 Thay đổi độ sâu bộ tráo trong 59
3.1.5 Sử dụng điều chế có phân cấp 60
3.1.6 Lựa chọn FFT và khoảng bảo vệ 63
3.2 CẢI THIỆN CHẤT LUỢNG TÍN HIỆU TRUYỀN HÌNH s ố MẶT ĐẤT Ở PHÍA THU 66
3.2.1 Thu phân tập 66
3.2.2 Sử dụng thuật toán CD3-OFDM 66
Chương 4: NGHIÊN c ứ u ẢNH HƯỞNG CỦA CÁC THAM s ố VÀ TẬP CÁC THAM SỐ ĐẾN CHẤT LƯỢNG HỆ THỐNG BANG THỬ NGHIỆM THựC T Ế 70
4.1 THIẾT BỊ SỬ DỤNG ĐỂ THỬNGHIỆM 70
4.2 KẾT QUẢ THỬNGHIỆM 71
4.2.1 BER và MER (tỷ lệ lỗi điéu chế) 72
4.2.2 BER và FFT 73
4.2.3 Phân tích I, Q với một số bộ tham số khác nhau 73
a Kết quả phân tích I, Q với bộ tham số 64-QAM, FEC = 3/4, Tg = 1/4 73
b Kết quả phân tích I, Q với bộ tham số 16-QAM, FEC = 3/4, Tg = 1/32 75
4.2.4 Lựa chọn bộ tham sô' tối ưu giữa các bộ tham số có dung lượng bit (hiệu xuất sử dụng phổ) tương đương 76
4.3 KẾT LUẬN VÀ MỘT s ố ĐỀ XUẤT 85
T À I L IỆ U T H A M K H Ả O
Trang 4T ừ viết tắt Tiếng Anh Tiếng Việt
ATSC Advanced Television Standards
Committee
Hội đồng các tiêu chuẩn truyền hình tiên tiến
B frame Bi-directionally predicted frame Ảnh dự báo 2 chiều
CAT Conditional Access Table Bảng truy cập có điểu kiện
COFDM Codec Orthgonal Frequency
Division Multiplex
Mã hóa ghép kênh theo tần số trực giao
DAB Digital Audio Broacasting Phát thanh số
DBS Direct Broacasting Satellite Truyền hình trực tiếp từ vệ tinhDCT Discrete Cosin Transform Biến đổi Cosin rời rạc
DiBEG Digital Broadcasting Expert's Group Nhóm chuyên gia truyền hình
số (Nhật)DPCM Differential Pulse Code Modulation Điều xung mã vi sai
DSP Digital Signal Processor Bộ xử lý tín hiệu số
đến các hộ gia đình
DVB Digital Video Broadcasting Truyền hình số (chuẩn châu Âu)
EBU European Broacast Union Hiệp hội p.thanh - T.hình châu Âu
Trang 5ES Elementary Stream Dòng cơ bản
ETSI European Technical Standard
FEC Forward Error Correction Sửa lỗi tiến
FFT Fast Fourie Tranformation Biến đổi Fouire nhanh
HDTV High Definition Television Truyền hình độ phân giải cao
IFFT Inverse Fast Fourier Transform Biến đổi nhanh Fourie ngượcISO International Standard Organization Tổ chức tiêu chuẩn quốc tế
ITU International Telecommunication
LSB Least Significant Bit Bit ít quan trọng nhất
MPEG Motion Picture Expert Group Nhóm chuyên gia nghiên cứu
ảnh động
OFDM Ortholognal Frequency Division
Trang 6PAT Program Association Table Bảng truy xuất chương trình
PCR Program Clock Reference Đổng hồ tham chiếu chương
trìnhPES Paket Elementary Stream Dòng cơ bản đóng gói
p frame Predicted frame Ảnh dự báo ảnh trước nó (trong
chuẩn MPEG)
PRBS Pseudo-Random Binary Sequence Chuỗi nhị phân giả ngẫu nhiên
QAM Quadrature Amplitude Modulation Điều biên vuông góc
QPSK Quaternary Phase Shift Keying Khoá dịch pha 4 mức
SCPC Single Channel Per Carrier Đơn kênh trên một sóng mang
TPH Transport Packet Header Tiêu đề gói truyền tải
TPS Transmission Parameter Signalling Tham số báo hiệu truyền dẫn
VLC Variable Length Coding Mã hoá với độ dài từ mã thay
đổi
Trang 7Thứ tự Tên hình vẽ Trang
Hình 2.2 Quá trình giảm dữ liệu thực hiện với ảnh I 15
Hình 2.6 ước lượng chuyển động và bù chuyển động dự đoán ảnh p 20
Hình 2.15 Ghép kênh dòng TS (a), dòng TS nhiều chương trình (b) 30
Hình 2.17 Khối Outer Interleaver và khối Outer Deinterleaver 34Hình 2.18 Sơ đổ khối khối xáo trộn trong hệ thống có phân cấp 38Hình 2.19 Sơ đồ khối khối xáo trộn trong hệ thống không phân cấp 39Hình 2.20 Sơ đổ tạo địa chỉ xáo trộn symbol chế độ 2K 41Hình 2.21 Sơ đồ tạo địa chỉ xáo trộn symbol chế độ 8K 41Hình 2.22 Biểu đồ chòm sao tín hiệu cơ bản của DVB-T không phân cấp 42Hình 2.23 Biểu đồ chòm sao tín hiệu cơ bản của DVB-T phân cấp 43
Trang 8Hình 2.26 OFDM trên miền tần số và thời gian 45Hình 3.1 Sơ đồ khối máy phát truyền hình số mặt đất 56
Hình 3.4 Quan hệ tỷ lệ lỗi bit BER và tỷ lệ mã trên trục tọa độ năng
Hình 3.5 Đồ thị chòm sao của điều chế QPSK, không phân cấp 60Hình 3.6 Đổ thị chòm sao của điều chế 16QAM, không phân cấp 60Hình 3.7 Đồ thị chòm sao của điều chế 64QAM, không phân cấp 61Hình 3.8 Đồ thị chòm sao của điều chế 64QAM, phân cấp a = 2 61Hình 3.9 Quan hệ tỷ lệ lỗi bit BER và Eb/N0 đối với các mật độ điều
69
Hình 4.2 Phân tích I,Q với bộ tham số 64-QAM, FEC 3/4, Tg 1/4. 73Hình 4.3 Phân tích I,Q với bộ tham số 16-QAM, FEC 3/4, Te 1/32 75
Trang 9THỨTự TÊN BẢNG, BIỂU TrangBảng 2.1 Ma trận lượng tử mặc định áp dụng cho ảnh I,P,B 17
Bảng 2.3 Đặc tính kỹ thuật của audio MPEG-1 và MPEG-2 23Bảng 2.4 Thuật toán rút bỏ các bits mã tạo mã con có tỷ lệ mã
Bảng 2.9 Thứ tự sóng mang trong dòng truyền tải TPS 49
Bảng 2.13 Bảng biểu thị tỷ lệ mã xoắn cho dòng HP và dòng LP 52Bảng 2.14 Tốc độ dữ liệu và tỷ số C/N của hệ thống DVB-T với
kênh 8 Mhz của hệ thống không phân cấp 53
Bảng 4.1 BER tương ứng C/N đối với FFT khác nhau
(phương pháp điều chế 64QAM, FEC = 2/3) 73Bảng 4.2 Tổng hợp kết quả phân tích I, Q với một số bộ tham
Bảng 4.3
Kết quả đo Kiểu điều chế 16QAM, tỉ lệ mã 3/4, khoảng bảo vệ 1/4 và kiểu điều chế 64QAM, tỉ lệ mã 1/2, khoảng bằo vệ 1/4
76
Bảng 4.4
Kết quả đo Kiểu điều chế 16QAM, tỉ lệ mã 3/4, khoảng bảo vệ 1/8 & Kiểu điều chế 16QAM, tỉ lệ mã 5/6, khoảng bảo vệ 1/4 & Kiểu điều chế 64QAM, tỉ
lệ mã 1/2, Khoảng bảo vệ 1/8
78
Trang 10Bảng 4.7 Các thông sô' phát phù hợp với dung lượng chương
Trang 11Gần một thế kỷ qua, ngành truyền hình trên toàn thế giới đã mang thông tin, tin tức và các chương trình giải trí đến một lượng lớn khán giả trên toàn thế giới Trong khoảng 60 năm đầu, sự phát triển công nghệ truyền hình hoàn toàn dựa vào công nghệ tương tự (Analog), nhưng trong vòng mười năm trở lại đây, ngành Truyền hình
đã dần dần chuyển sang công nghệ số (Digital) Việc chuyển dịch lên Truyền hình số
là một sự tiến hóa hơn là một cuộc cách mạng Đối với người tiêu dùng, kỷ nguyên mới về sô' sẽ nâng cao chất lượng hình ảnh truyền hình ngang với chất lượng chiếu phim, âm thanh ngang với chất lượng CD Cùng với nhiều loại hình dịch vụ mới, truyền hình sô' còn cho thuê bao xem được nhiều chương trình truyền hình với chất lượng cao nhất
Ở Việt Nam, kỹ thuật Truyền hình số cũng đã được quan tâm chú ý Năm 1999, Tiểu ban Qui hoạch của Trung tâm Truyền dẫn Phát sóng đã đưa ra định hướng
“ Công nghệ số hóa truyền đẫn phát sóng năm 2000 đến 2010” Các +trung tâm BRAC, VTC và Trung tâm QLKHTH đã tiến hành thử nghiệm ghép nối bộ điều chế
số, hệ DVB-T vào máy phát tương tự, tiến hành phát sóng và đo đạc Các công trình này đã đạt nhiều kết quả khả quan và vẫn đang tiếp tục đẩy mạnh hơn nữa
Nhằm góp phần tìm hiểu về kỹ thuật Truyền hình số mặt đất và việc nâng cao chất lượng Hệ thống truyền hình sô' mặt đất theo tiêu chuẩn DVB-T, tác giả luận văn
đã chọn đề tài: Hệ thống truyền hình số mật đất DVB-T và một số giải pháp nâng cao chất lượng hệ thống
Nội dung luận văn gồm 4 chương:
Chương 1 : Tổng quan hệ thống Truyển hình sô' mặt đất DVB-T
Chương 2: Các kỹ thuật cơ bản trong truyền hình sô' mặt đất
Chương 3: Một số giải pháp nâng cao chất lượng hệ thống Truyền hình số mặt đất
cô và đồng nghiệp đã giúp đỡ tôi hoàn thành luận văn này
Hà Nội, tháng 10 - 2008
Học viên
Phạm Minh Hòa
Trang 12Tên tôi là: Phạm Minh Hoà, học viên lớp cao học Điện tử viễn thông K12D1, trường Đại học Công nghệ - Đại học Quốc gia Hà Nội xin cam đoan: Bản luận văn “ Hệ thống truyền hình số mặt đất (DVB-T) và một số giải pháp nâng cao chất lượng hệ thống ” là do chính tôi viết với sự hướng dẫn khoa học của thầy TS Trịnh Anh Vũ Nội dung của luận vãn không sao chép từ bất kỳ tài liệu nào đã được công bố Các số liệu đo đạc trong bản luận văn là kết quả nghiên cứu, thực nghiệm thực tế.
Hà Nội, tháng 10 năm 2008
HỌC VIÊN
Phạm Minh Hoà
Trang 13CHƯƠNG 1: TỔNG QUAN HỆ THỐNG TRUYỂN h ì n h s ố
MẶT ĐẤT DVB-T
1.1 X U HƯ Ớ NG P H Á T TRIỂN T R U Y Ề N HỈNH s ố
Xu hướng hoà nhập của công nghệ truyền hình
Thế giới đã bước vào một kỷ nguyên mới của thời đại công nghệ thông tin bằng
sự hội tụ của các phương tiện truyền thông Trước đây các phương tiện để truyền tải thông tin chính được tách biệt rành mạch như: điện thoại dùng cho các cuộc hội đàm,
in ấn dùng trong văn bản, truyền hình cho giải trí thị giác và phát thanh cho các dịch vụ tin tức, âm nhạc Mỗi phương tiện đều có các qúa trình riêng biệt, nhưng hiện nay các lĩnh vực phát thanh và truyền hình đang dần hoà nhập, các ứng dụng mới đang được giới thiệu, các dịch vụ tổng hợp đang đần được hình thành, các hàng rào ngăn cách giữa các dịch vụ dần được xoá bỏ để các dịch vụ này hoà nhập với nhau thành một thể thống nhất
Để theo kịp xu hướng phát triển của ngành công nghiệp truyén thông, kỹ thuật truyền hình cũng cần có sự cải tiến về công nghệ trong toàn bộ hệ thống như ghi, dựng, truyền dẫn và phát sóng Các tổ chức quốc tế đã thống nhất những tiêu chuẩn trong truyền hình số để tạo đà phát triển hệ thống mới này, các chỉ tiêu thống nhất bao gồm các chỉ tiêu về chất lượng hình ảnh, chỉ tiêu về định dạng thiết bị, chỉ tiêu về chuyển đổi các hệ thống
Hệ thống các mạng truyền thông tương lai
Chúng ta có thể hình dung được một tương lai của thế giới thông tin với những dịch vụ có thể đáp ứng được yêu cầu của con người một cách nhanh chóng nhất Thế giới đa phương tiện chính là sự hội nhập của công nghệ máy tính với công nghệ phát thanh và truyền hình Chất lượng và sự hội nhập là mục đích của hệ thống đa phương tiện nhằm đạt hiệu quả trong các mục đích ứng dụng như: dịch vụ thư điện tử, truyền dẫn dữ liệu và hổ sơ, truy cập thông tin tương tác
Các dịch vụ tương tác hai chiều là yếu tố khẳng định sự phát triển trong truyển hình - viễn thông Ở đây mạng máy tính là thiết bị xử lý thông tin trong thời gian không thực và truyẻn hình là thiết bị trong thời gian thực Mạng máy tính có hiệu quả trong truyền thông tin điểm - điểm, trong khi truyền hình là dịch vụ thông tin điểm - đa điểm Sự kết hợp máy tính và truyền hình tạo nên một hệ thống mang nhiều lợi điểm trong mạng tổng hợp Một mô hình kết hợp giữa máy tính cá nhân và máy thu hình đã
ra đời trên thị trường thương mại thế giới trong vài năm trở lại đây, và mô hình này chắc chắn sẽ được phát triển trong tương lai
Truyền hình trong môi trường truyền thông đa phương tiện
Phát thanh và truyền hình đã và đang đáp ứng nhu cầu của toàn thể nhân loại trong việc cập nhật thông tin, thời sự, thể thao, thời tiết và phần lớn các dịch vụ âm thanh và hình ảnh Tuy nhiên trong thời gian qua, hệ thống truyền hình quảng bá tương
Trang 14tự gần như là một phương tiện duy nhất trong việc phân phối các chương trình đến các
hộ gia đình
Phát thanh và truyền hình trong tương lai sẽ không còn là thông tin một chiều mà
là thông tin hai chiều, dịch vụ tương tác, là thông tin giao dịch giữa điểm và điểm Do
sự phát triển của công nghệ phát thanh truyền hình số, sự đa dạng của dịch vụ tương tác ngày càng mở rộng
Trong môi trường truyền thông đa phương tiện các thiết bị cá nhân, là sự kết hợp máy thu hình và hệ thống máy tính đóng vai trò của một phương tiện ứng dụng thông tin, cũng như một nguồn thông tin trực tiếp Truyền hình từ một phương tiện thông tin đại chúng sẽ thành phương tiện cá nhân
Môi trường phát thanh truyền hình đa kênh sẽ được điều khiển bằng việc phân phối chương trình trực tiếp đến tận hộ gia đình và cung cấp sự lựa chọn rộng rãi cho người xem Những người xem truyền hình tự quyết định chương trình được cung cấp, lúc đó ta có thể coi truyền hình như một thư viện ngay trong nhà Mặt khác truyền hình còn được sử dụng như một phương tiện để nhận các thông tin dạng khác như số liệu, văn bản và các dịch vụ thương mại như mua và bán Truyền hình trong tương lai thực
sự là một phương tiện cực kỳ hữu ích cho đời sống con người trong giải trí và trong công việc Với sự phát triển của khoa học công nghệ, truyền hình công nghệ cao sẽ trở thành sự thật trong một tương lai không xa
Truyền hình tương tác ÌTV
Ngày nay nhờ sự phát triển mạnh mẽ của viễn thông và các dịch vụ truyền dữ liệu trên toàn thế giới cho phép truyền dữ liệu với tốc độ cao như các dịch vụ trong đó có Video, truyền hình trả tiền, Video theo yêu cầu, dịch vụ mua sắm tại nhà, giáo dục từ
xa, chò trơi tương tác làm cho truyền hình bước sang một kỷ nguyên mới, đó là kỷ nguyên truyền hình tương tác và đa phương tiện
Truyền hình tương tác là truyền hình do người xem điều khiển, kể cả khả năng thực hiện các quyết định trong và ngoài chương trình Tương tác trong chương trình có thể được hiểu như là sự lựa chọn các chương trình Video theo yêu cầu (VOD), ví dụ có thể chọn một bộ phim mới với thời gian chờ đợi ít nhất Trong tương lai hình thức này
sẽ được phát triển rất nhanh - Đây là một xu thế lớn của công nghệ truyền hình số.1.2 C Á C TIÊU C H U Ẩ N V Ề T R U Y Ề N HÌNH s ố M Ặ T Đ Ấ T
Với kỹ thuật ANALOG có ba tiêu chuẩn truyền hình tương ứng với ba hệ : NTSC, PAL, SECAM Mỗi tiêu chuẩn đã quy định rõ về tín hiệu như :
Trang 15+ Độ rộng băng tần.
Truyền hình số cũng có ba tiêu chuẩn
+ Tiêu chuẩn ATSC: Advanced Television System Committee (Mỹ)
+ Tiêu chuẩn DiBEG : Digital Broadcasting Expert Group (Nhật)
+ Tiêu chuẩn DVB-T : Digital Video Broadcasting- Terrestrial
Mỗi tiêu chuẩn trên được xây dựng theo một tiêu chí nhất định với nhiều điểm khác biệt song đều hướng tới mục tiêu chung là cung cấp được nhiều tiện ích nhất cho người xem
* Tiêu chuẩn phát sóng mặt đất ATSC
Phương thức điều chế: 8-VSB.
Tốc độ bit: 19,39 Mbit/s
Trên một kênh 6 MHz có thể truyền: 1 chương trình HDTV hoặc 4 chương trình
SDTV
Nước sử dụng: Mỹ, Canada, Hàn Quốc, Mêhicô
*Tiêu chuẩn phát sóng mặt đất DiBEG
Sử dụng kỹ thuật BST-OFDM (Band Segmented OFDM)
Sử đụng phương pháp điều chế số khác nhau với từng đoạn băng tần: QPSK, 16 QAM, 64QAM
Tín hiệu truyền đi gồm 13 khối OFDM, mỗi khối có dải phổ: 432 KHz
+ Chuẩn DVB-T phù hợp với các vùng thành phố và địa hình đồi núi phức tạp.Khi phát triển truyền hình kỹ thuật số, mỗi quốc gia trên thế giới đều phải chọn cho mình một tiêu chuẩn trong 3 tiêu chuẩn trên Việt Nam chọn tiêu chuẩn DVB của châu Âu Trong họ DVB tồn tại nhiều nhóm khác nhau mà thông dụng là DVB-T (DVB-Terrestrial), DVB-S (DVB-Satellite) và DVB-C (DVB-Cable)
Trang 161 3 Đ Ặ C ĐIỂM C ơ B Ả N C Ủ A TIẾU C H U A N D VB-T
Tiêu chuẩn DVB -T khác với tiêu chuẩn 8-VSB (hệ Mỹ) vì có 2 chế độ khác nhau
đó là mode 2k hoặc 8k - OFDM Trong mode 2k có 1705 sóng mang và trong 8k mode
có 6817 sóng mang ghép kênh theo tần sô' trực giao
Trong mỗi mode có thể truyền tải được tối đa 2 cấp độ khác nhau trong khâu truyền dẫn dòng truyền tải MPEG-2 Đối với chế độ không phân cấp, các chương trình không có sự ưu tiên trong khâu truyền dẫn tín hiệu, do vậy chỉ có các vùng có cường
độ trường đạt giá trị lớn hơn mức ngưỡng mới có thể thu được và chỉ có một giá trị Đối với các máy phát hoạt động ở chế độ có phân cấp, khi đó có các mức ngưỡng khác nhau Mức ngưỡng 1 cho phép thu được toàn bộ chương trình cả chương trình ưu tiên
và không ưu tiên Mức ngưỡng 2 chỉ cho phép thu được chương trình có ưu tiên trong khâu truyền dẫn Việc ưu tiên trong khâu truyền dẫn bao gồm 2 phần, ưu tiên về phần
mã hoá đường truyền và ưu tiên trong khâu điều chế tín hiệu Chế độ phân cấp tại điều chế chỉ thực hiện được khi điều chế 16 QAM hay 64 QAM
Điều chế không phân cấp : (a = 1)
Điều chế phân cấp : a = l ; a = 2 ; a = 4
Điều chế sóng mang : QPSK, 16QAM, 64QAM
Ưu điểm của tiêu chuẩn DVB-T:
- Tương thích với các loại hình dịch vụ theo chuẩn DVB-C, DVB-S
- Có thể hoạt động được ở các kênh RF : 6, 7, 8 MHz, do vậy có thể sử dụng với
băng tần 8 MHz mà truyền hình mặt đất ở Việt Nam hiện nay đang sử dụng.
- Có thể phát được nhiều tốc độ bit từ 4,98+3l,67Mb/s tuỳ theo việc lựa chọn mã đường truyền, khoảng bảo vệ và phương pháp điều chế cho mỗi sóng mang
- Sử dụng điẻu chế phần cấp trong khâu phát sóng, cho phép đổng thời cùng lúc
có thể truyền được chương trình với 2 cấp chất lượng khác nhau.
- Có thể phát được 4-7-5 chương trình SDTV hoặc một chương trình HDTV cùng
các dữ liệu phụ
- Có thể sử dụng âm thanh MPEG-2 Layer II hoặc Dolby
- Có thể sử dụng âm thanh MPEG-2 Layer II hoặc Dolby AC3
- Khả năng chống can nhiều cùng kênh và kênh lân cận tốt
Trang 17- Có khả năng thiết lập máy phát để thu di động.
Hệ thống còn nhiểu khả năng mở rộng cho các dự án trong tương lai như Đa phương tiện di động “Mobile multimedia”
Nhược điểm tiêu chuẩn DVB-T:
- Ngưỡng thu cao hơn so với tiêu chuẩn ATSC Tỷ sô' C/N phải đạt 19,ldB tại tốc
độ bit là 19,35Mb/s, cao hơn so với tiêu chuẩn ATSC (15dB) là 4dB Do đó hiệu suất phủ sóng của tiêu chuẩn DVB-T nhỏ hơn ATSC là 4dB
- Các sóng mang có công suất thấp nên dễ bị ảnh hưởng của pha đinh lựa chọn tần số Để khắc phục hiện tượng này, máy thu DVB-T phải sử dụng thêm kỹ thuật cân bằng thích nghi, tính toán kênh và sửa lỗi Giá thành máy thu cũng tăng lên
- Tỷ số công suất đỉnh trên công suất trung bình cỡ lOdB, cao hơn ATSC Phụ thuộc vào kiểu điều chế và sác xuất thời gian, hệ số đỉnh của tín hiệu COFDM nằm trong dải từ 9 -ỉ-15dB Đây cũng chính là độ thụt lùi công suất đầu ra của máy phát COFDM
- Cấu hình toàn bộ hệ thống phức tạp và đắt tiền
1.4 S ơ ĐỔ KHỐI HỆ THỐNG TRUYỀN HÌNH s ố MẶT ĐẤT DVB-T ( HÌNH 1.1)
Chức nâng từng khôi phía phát:
Đầu vào máy phát DVB-T là dòng truyền tải MPEG-2 đa chương trình có tốc độbit từ 4,98Mb/s -ỉ- 31,67Mb/s Khi hoạt động ở chế độ có phân cấp dòng truyền tải được phân chia thành 2 dòng truyền tải, dòng có ưu tiên cao (tốc độ thấp) và ưu tiên
thấp (tốc độ cao) để cấp vào máy phát
- Bộ ghép kênh phân tán nâng ỉượng: Bộ ngẫu nhiên hóa dữ liệu hay trải phổ năng lượng của tín hiệu Dòng sô' liệu đầu vào (TS) được đưa tới bộ ngẫu nhiên hóa dữ liệu, tại đây dữ liệu được hợp với chuỗi nhị phân giả ngẫu nhiên (PRBS) bởi mạch XOR tạo
ra dòng số liệu đã được ngẫu nhiên hóa
- Bộ mã hóa ngoài: sử dụng mã rút ngắn Reed Salomon Dòng sô' liệu đã được ngẫu nhiên hóa được đưa tới bộ mã ngoài (outer coding), bộ mã hóa ngoài sẽ thực hiện với cấu trúc gói dữ liệu đầu vào, ở đây thực hiện mã hóa rút ngắn Reed Salomon với dữ liệu gốc là 188 bytes, đầu ra bộ mã sẽ là dòng số liệu 204 bytes, với bộ giải mã tương ứng ở đầu thu sẽ cho phép sửa tới 8 bytes lỗi Công đoạn này là FEC ỉ
- Bộ tráo ngoài: Trong khâu này dữ liệu được tráo theo byte, dữ liệu sau tráo được sắp xếp theo các gói chống lỗi và được giới hạn bởi các byte đổng bộ và đồng bộ đảo, bảo toàn tính tuần hoàn 204 byte
Bộ tráo có thể được sắp xếp theo các nhánh với 1=12, được kết nối tuần hoàn với dòng dữ liệu các byte đầu vào bằng các chuyển mạch đầu vào Mỗi nhánh j sẽ là một thanh ghi đệm FIFO, với độ sâu j X M cell, tại đó M = 17 = N /1, N = 204 Các cell theo quy luật FIFO sẽ chứa một byte, và các chuyển mạch đầu vào - ra sẽ được đổng bộ
Trang 18Phía phát
Phía thu
Hình 1.1 : Sơ đổ khối hệ thống truyền hình sô' DVB-T
- Bộ mã trong: sử dụng phương pháp mã xoắn thủng (Convolutional Coding & Puncturing) Với việc bổ sung vào mã gốc của tỉ lệ 1/2, hệ thống sẽ cho phép các tỉ lệ
mã sửa sai khác nhau 2/ 3; 3/ 4; 5/ 6 và 7/ 8 Ngoài ra, bộ mã còn cho phép chọn lựa
mức độ sửa lỗi thích hợp nhất cho một dịch vụ hay tốc độ dữ liệu trong chế độ truyền phân cấp cũng như không phân cấp Nếu truyền phân cấp ta có thể lựa chọn 2 mức độ
mã hóa khác nhau cho 2 dòng số liệu, một tỷ lệ mã thấp để mã hóa cho dòng số liệu
HP (dòng có mức ưu tiên cao), ví dụ như tỷ lệ mã 1/ 2 cứ mỗi bit dữ liệu được đưa vào thì ta sử dụng 2 bit số liệu để mã hóa, ngoài ra đối với dòng dữ liệu có độ ưu tiên thấp
Trang 19hơn ta có thể sử dụng tỷ lệ mã hóa lớn hơn nhằm đạt hiệu quả cao đối với dữ liệu hữu ích được truyền đi.
- Bộ tráo trong thực hiện 2 công đoạn: Tráo theo bit và tráo theo Symbol Đầu ra của bộ mã trong có thể được chia thành 2 dòng bit (trong chế độ phân cấp), mỗi dòng
bit được phân thành V dòng phụ Mỗi dòng phụ được đưa qua một bộ tráo riêng biệt.
- Bộ định vị và điều chế: Điều chế từng biểu trưng của tín hiệu
- Bộ đáp ứng khung: Tương thích khung và cài tín hiệu tham chiếu; ở đây các tínhiệu chuẩn (tham chiếu) bao gồm đổng bộ khung, tần số, thời gian, định lượng kênh, tách độ nhiễu pha, xác định chế độ điều chế, truyền dẫn, nhận dạng khối, tỷ lệ mã, khoảng bảo vệ v.v Các tín hiệu chuẩn này được điều chế khóa dịch pha nhị phân(BPSK), phương thức điều chế này đảm bảo độ an toàn cho dữ liệu, khó bị nhầm lẫntrong quá trình giải điều chế Tại bộ tương thích khung, các sóng mang mang tín hiệu tham chiếu được sắp xếp, phối hợp với các sóng mang mang thông tin hữu ích theo những phương thức nhất định tạo thành các Symbol OFDM (1705 và 6817 sóng mang trong chế độ 2K và 8K), 68 symbol OFDM sẽ tạo thành 1 khung OFDM.
- OFDM: Khâu biến đổi OFDM, biến đổi IFFT Thực chất ở đây, các chòm sao V
bit đã được điều chế QPSK, M-QAM được thể hiện dưới dạng số phức được thực hiện biến đổi IFFT, sau đó tín hiệu được điều chế I/Q để chuyển đổi tín hiệu phục vụ phát sóng, nhờ vậy phổ của các kênh con OFDM trở nên trực giao Ngoài ra, công đoạn này
sẽ làm giảm số lượng các phép tính toán khi thu nhận dữ liệu ở phía thu
- Guard Interval Insertion: Khâu chèn khoảng bảo vệ
- D/A: Bộ biến đổi tín hiệu sô' thành tín hiệu tương tự
- Up Converter: Bộ chuyển đổi thành tín hiệu có tần số phát, và khuếch đại caotần
Trong sơ đồ khối, tín hiệu vào là dòng truyền tải MPEG -2 được đưa tói khối thích ứng ghép kênh dòng truyền tải MPEG-2 và phân tán năng lượng (Mux Adaptation Energy Dispersal), sau đó đi qua khối mã ngoài (Outer coder) đến khối xáo trộn ngoài (Outer Interleaver), khối mã trong (Inner Coder), khối xáo trộn trong (Inner Interleaver), rồi đến khối điều chế OFDM
Phần điều chế OFDM bao gồm khối điều chế tín hiệu (Mapper), khối thích ứng khung OFDM (Frame Adaptation), khối biến đổi IFFT và điều chế số I/Q, khối chèn khoảng bảo vệ (Guard interval insertion), khối biến đổi D/A
Sau đó tín hiệu điều chế OFDM được đưa đến bộ đổi tần BB/IF, bộ đổi tần IF/RF rồi đến tầng khuyếch đại công suất, lọc hài ra hệ thống phiđơ - anten
Chức năng từng khối phía thu:
Quá trình xử lý của hệ thống thu ngược lại với quá trình xử lý của hệ thống phát
Tín hiệu truyền hình kỹ thuật sô' thu được từ Anten Yagi là tín hiệu OFDM Sau khi biến đổi xuống (downeonverter), ta có tín hiệu trung tần IF 36 Mhz Tín hiệu này được
Trang 20lọc bàng các mạch lọc Saw khác nhau ( phụ thuộc vào độ rộng băng tần kênh) và cộng nhiễu Gauss bên trong Tiếp theo, tín hiệu IF được biến đổi thành băng tần cơ bản bằng cách sử dụng bộ tạo dao động điều khiển số Phép biến đổi FFT ( 2K/8K) biến đổi tín hiệu từ miền thời gian vào miển tần số Sau đó xấp xỉ kênh được dùng để sửa biên độ / pha / độ trễ của tín hiệu làm cho hầu hết các xung bị suy giảm trong khi truyền đẫn
RF Tiếp theo, các gói dữ liệu được dùng cho bộ giải mã chập Viterbi, bộ giải chèn dữ liệu, bộ giải mã Reed-Solomon và bộ giải ngẫu nhiên hóa dữ liệu ( phân tán năng lượng) Cuối cùng, giao diện Mpeg-2 đưa dòng truyền Mpeg-2 đã giải điều chế đến đầu
kế máy thu có độ phức tạp cao hay thấp phụ thuộc vào yêu cầu các thông số kỹ thuật của máy thu và nó là yếu tố quyết định giá thành của máy thu, cũng như chất lượng tín hiệu tại đầu ra máy thu Vì vậy khi thiết kế cấc máy thu, nhà thiết kế đặc biệt chú trọng đến các vấn đề kỹ thuật và giá thành thương phẩm, hài hoà và tối ưu các yêu cầu thông
số kỹ thuật của máy thu để đáp ứng được nhu cầu của thị trường
Máy thu hình số DVB-T EFA (của hãng Rohde & Schwarz, Đức) có thể thu,giải điều chế, giải mã và phân tích tín hiệu OFDM Máy thu EFA có các khả năng sauđây: - Độ rộng băng tần kênh: 6/7/8 MHz
Trang 21CHƯƠNG 2 CÁC KỸ THUẬT c ơ BẢN TRONG TRUYỂN h ì n h
SỐ MẶT ĐẤT
2 1 K Ỹ T H U Ậ T S Ố H O Á TÍN HIỆU T R U Y Ề N HÌNH
2.1.1 Lấy mẫu tín hiệu Video:
Tín hiệu video tương tự được chia thành 2 loại chính:
- Tín hiệu video thành phần (component video)
- Tín hiệu video tổng hợp (composite video)
Có 2 dạng thức lấy mẫu:
- Lấy mẫu tín hiệu video tổng hợp ( PAL, NTSC )
- Lấy mẫu tín hiệu video thành phần :Y, R-Y và B-Y
• Lấy mẫu tín hiệu video tổng hợp( video composite):
Theo định lý lấy mẫu Nyquist - Shannon thì tần số lấy mẫu phải > 2 lần tần sốlớn nhất của tín hiệu Với dải thông video là 6 MHz thì tần số lấy mẫu tối thiểu cho tín
hiệu video phải lớn hơn hoặc bằng 12 MHz Tuy nhiên nếu chọn tần số lấy mẫu ( fsa ) không có quan hệ với tần sô' sóng mang màu (fsc) thì có hiện tượng xuyên điều chế giữa fsa và fsc * gây ra méo tín hiệu sau khi khôi phục
Có thể chọn tần số lấy mẫu fsa = 3fsc, tuy nhiên chất lượng không đáp ứng được cho studio
Tiêu chuẩn tần số lấy mẫu được áp dụng cho video số composite là: fsa = 41* Như vậy tần số lấy mẫu đối với tín hiệu tổng hợp hệ PAL :
4,433 MHz X 4 = 17,7344 MHz
Sử dụng cấu trúc lấy mẫu trực giao Mỗi mẫu được lượng tử hoá 8 bit hoặc 10
bit sẽ tạo ra dòng bit nối tiếp có tốc độ 141,76 Mbps hoặc 177,2 Mbps Tín hiệu video tổng hợp dưới dạng số có chất lượng hạn chế do không thể giải quyết các vấn đề pha tải màu, can nhiễu giữa tín hiệu chói và màu nên không còn được sử dụng rộng rãi trong những nãm gần đây
• Lấy mẫu tín hiệu video thành phần ( video component):
Lấy mẫu và mã hoá tín hiệu video thành phần có ưu điểm là loại bỏ được sự phức tạp về tải tần màu và các méo khác mà lấy mẫu tín hiệu video tổng hợp không thể đạt được Khuyến nghị 601 của ITU ( ITƯ-R.BT601/656) đã định nghĩa chuẩn lấy mẫu Video số cho studio truyền hình của cả hai hệ thống 625 dòng và 525 dòng dựa trên việc số hoá các thành phần Y, CR CB trong đó CR ,CB là các tín hiệu biểu diên tín hiệu hiệu màu R-Y và B-Y đã qua quá trình chuyển đổi A/D, được biểu diễn chung cho cả PAL và NTSC với CR= 0,71(R-Y) và CB = 0,564( B-Y ) Tần số lấy mẫu tín hiệu chói được chọn chung, bằng bội số nguyên của tần số dòng cho cả hai hệ 625 dòng và 525 dòng Tần số lấy mẫu của thành phần tín hiệu chói Y :
Trang 22Mẫu tín hiệu chỉ được lấy đối với các phần tử tích cực của tín hiệu Video Với
hệ PAL, màn hình được chia làm 625 X 720 điểm (pixel).
^Đ iểm lấy mẫu tín hiệu chói Y
Điểm lấy mẫu màu đỏ CR Điểm lấy mẫu màu lam CB
Tiêu chuẩn 4: 4: 4.
Các tín hiệu chói (Y), tín hiệu hiệu màu (CR, CB) được lấy mẫu tại tất cả cácđiểm lấy mẫu trên dòng tích cực của tín hiệu Video Cấu trúc lấy mẫu là cấu trúc trựcgiao, ví trị lấy mẫu như trình bày trong hình vẽ trên đây
Tiêu chuẩn 4:4:4 có khả nãng khôi phục chất lượng hình ảnh tốt, thuận tiện cho việc xử lý tín hiệu Tiêu chuẩn này có thể dùng trong trường hợp xử lý tín hiệu chói và tín hiệu màu RGB Nó có thể được dùng trong studio nhằm rời rạc hoá tín hiệu Tuy nhiên tiêu chuẩn này sẽ đòi hỏi tốc độ bit rất cao Các tổ chức tiêu chuẩn quốc tế đãthống nhất về chỉ tiêu tần số lấy mẫu cho truyền hình số theo tiêu chuẩn này với tên gọi
là CCIR-601
Với chuẩn 4:4:4 tốc độ dòng dữ liệu (ví dụ cho hệ PAL) được tính như sau:
*Khi lấy mẫu 8 bit: (720 + 720 + 720) X 576 X 8 X 25 = 249 Mbit/s
*Khi lấy mẫu 10 bit: (720 + 720 + 720) X 576 X 10 X 25 =311 M bit/s.
b Chuẩn 4: 2: 2.
I ■
■ Điểm lấy mẫu tín hiệu chói Y
# Điểm lấy mẫu màu đỏ CR Điểm lấy mẫu màu lam CB
Trang 23Điểm đầu lấy mẫu toàn bộ ba tín hiệu: chói (Y) và hiệu màu (CR, CB).
Điểm kế tiếp chi lấy mẫu tín hiệu chói Y, còn hai tín hiệu hiệu màu không lấy mẫu Khi giải mã màu suy ra từ màu của điểm ảnh trước
Điểm sau nữa là lấy mẫu đủ ba tín hiệu Y, CR, CB
Tuần tự như thế, cứ 4 lần lấy mẫu tín hiệu chói Y, thì hai lần lấy mẫu CR, hai lần lấy mẫu CB tạo nên cơ cấu 4:2:2
Đối với hệ PAL tốc độ dòng dữ liệu theo chuẩn này được tính như sau:
*Khi lấy mẫu 8 bit: (720 + 360 + 360) X 576 X 8 X 25 = 166 Mbit/s
*Khi lấy mẫu 10 bit: (720 + 360 + 360) X 576 X 10 X 25 = 207 Mbit/s.
Tiêu chuẩn 4:2:2 là tiêu chuẩn cơ bản của truyền hình số Chất lượng hình ảnh của tiêu chuẩn này thấp hơn tiêu chuẩn 4:4:4 và cao hơn tiêu chuẩn 4:2:0
c Chuẩn 4:2:0.
Theo chuẩn này, tín hiệu Y được lấy mẫu tại tất cả các điểm ảnh của dòng, còn tín hiệu hiệu màu thì cứ cách một điểm sẽ lấy mẫu cho một tín hiệu màu Tín hiệu hiệu màu được lấy xen kẽ, nếu hàng chẵn lấy mẫu cho tín hiệu hiệu màu CR thì hàng lẻ
sẽ lấy mẫu cho tín hiệu hiệu màu CB
■ Điểm lấy mẫu tín hiệu chói Y
m Điểm lấy mẫu màu đỏ CR
Điểm lấy mẫu màu lam CB
Tiêu chuẩn 4 : 2 : 0 Đối với hệ PAL tốc độ dòng dữ liệu theo chuẩn này được tính như sau:
* Khi lấy mảu 8 bit: (720 + 360) X 576 X 8 X 25 = 124,4 Mbit/s
* Khi lấy mẫu 10 bit: (720 + 360) X 576 X 10 X 25 = 155,5 Mbit/s
lấy mẫu Y, không lấy mẫu CR, CB Khi giải mã màu của ba điểm ảnh sau phải suy ra từ điểm ảnh đầu Tuần tự như thế, cứ bốn lần lấy mẫu Y, có một lần lấy mẫu CB ,một lần lấy mẫu CB đằy là cơ cấu 4:1:1
Tiêu chuẩn 4: 1: 1
■ Điểm lấy mẫu tín hiệu chói Y
# Điểm lấy mẫu màu đỏ CR
Điểm lấy mẩu màu lam CB
Trang 24Đối với hệ PAL, tốc độ dòng dữ liệu theo chuẩn này được tính như sau:
*Khi lấy mẫu 8 bit: (720 + 180 + 180) X 576 X 8 X 25 = 124,4 Mbit/s
*Khi lấy mẫu 10 bit: (720 + 180 + 180) X 576 X 10 X 25 = 155,5 Mbiự
số 4 ở đầu mỗi chuẩn biểu thị tần số tín hiệu chói (fsa = 13,5 MHz), tuy không còn bằng 4 lần tần số sóng mang như trước Các con số khác biểu thị tỷ lệ giữa tần số lấy mẫu tín hiệu hiệu mầu so với tín hiệu chói
2.1.2 Lượng tử hoá & mã hoáLượng tử hoá là quá trình biến đổi biên độ tín hiệu tương tự thành một tập hợp các mức rời rạc hữu hạn Khoảng cách giữa hai mức kề nhau được gọi là bước lượng tử
Sô' các mức lượng tử được xác định theo biểu thức: N = 2 n Trong đó: n là số bitbiểu diễn 1 mẫu.
Có 2 phương thức lượng tử :
- Lượng tử hoá tuyến tính: các bước lượng tử đều bằng nhau
- Lượng tử hoá phi tuyến: các bước lượng tử khác nhau
Quá trình lượng tử tín hiệu tương tự là quá trình gây ra sai số, gọi là sai số lượng
tử (e ) Đó là sự khác nhau giữa tín hiệu đầu ra đã lượng tử Q(x) so với đầu vào (x) :
Trang 25Với nguồn tín hiệu video có phân bô' ngẫu nhiên thì sai sô' lượng tử phụ thuộc vào
số bit biểu diễn mẫu, khoảng cách giữa các bước lượng tử, tính thống kê của nguồn tín hiệu
Sai số lượng tử (e4) là một nguồn nhiễu (nhiễu lượng tử) không thể tránh khỏi trong hệ thống số Với các ứng dụng trong truyền hình người ta sử dụng lượng tử hoá 8
bit, 10 bit hoặc 12bit Háu hết các thiết bị có chất lượng cao đều sử dụng lượng tử hoá
10 bit/mẫu ( 210 = 1024 mức lượng tử ) từ 0 đến 1023 (từ 000 đến 3FF trong hệ HEX)
Các mức 000,001,002,003 và 3FC,3FD,3FE,3FF được dùng làm khoảng dự phòng mức dưới và trên của tín hiệu video, các mức còn lại để lượng tử tín hiệu video tích cực.Sau quá trình lượng tử hoá là quá trình mã hoá các mẫu đé tạo thành chuỗi dữ liệu nhị phân gồm các b it 0 và 1.
2 2 K Ỹ T H U Ậ T N ÉN M PEG -2
Kỹ thuật nén MPEG là kỹ thuật mã nguồn, nhằm làm giảm lượng thồng tin nguồn video và audio MPEG là một trong sô' các kỹ thuật nén âm thanh và video số phổ biến nhất vì nó không phải chỉ là một tiêu chuẩn đơn mà đó là một phạm trù rộng những tiêu chuẩn thích hợp cho những ứng dụng khác nhau
MPEG là từ viết tắt cho Nhóm những chuyên gia nghiên cứu về hình ảnh chuyển động MPEG (Moving Picture Expert Group) được thành lập vào năm 1988 bởi các tổ chức ISO, IEC có nhiệm vụ nghiên cứu soạn thảo các tiêu chuẩn nén audio, video số.Tiêu chuẩn MPEG-2 (công bố năm 1994 là phiên bản hợp nhất 2 chuẩn MPEG-2
cũ và MPEG-3) MPEG-2 là phương pháp nén và mã hóa video cho truyền hình có độ phân giải tiêu chuẩn (SDTV), hỗ trợ cả truyền hình độ phân giải cao
Tiêu chuẩn MPEG-2 cho phép truyền tín hiệu trên nhiều lớp (mỗi lớp có độ phân giải khác nhau) Hình ảnh có thể khôi phục với các mức chất lượng khác nhau tuỳ thuộc vào lớp được sử dụng
Ngoài ra, MPEG - 2 có tính linh hoạt cao, với tốc độ bit truyền có thể được điều chỉnh để thỏa mãn yêu cầu ứng dụng Chuẩn MPEG-2 4: 2: 0 MP @ ML được chọn là chuẩn tín hiệu đầu vào của hệ thống truyền dăn DVB
2.2.1 Các khái niệm cơ bản của quá trình mã hóa video MPEG-2
Các bước chính trong quá trình mã hóa video MPEG-2:
- Chia các điểm ảnh thành các macroblock & block 8x8 điểm ảnh.
- Xác định lượng dư thừa theo thời gian và biểu diễn bằng quá trình bù chuyển
động (motion compensation).
- Tim lượng dư thừa theo không gian bằng quá trình DCT (Biến đổi côsin rời rạc)
Quá trình DCT là không rút gọn được lượng thông tin video vì quá trình này là quá trình thuận nghịch
Trang 26- Rút gọn thông tin video bằng quá trình lượng tử hóa Quá trình này loại bỏ các chi tiết trên hình ảnh, các chi tiết này thường ở các tần số cao Tại các vùng không gian tần số cao (hình vẽ bằng bút chì, nét chữ trong một quyển sách hoặc các vùng có độ tương phản cao), các chi tiết dư thừa xuất hiện ở cả tần sô' cao và thấp, các chi tiết ở vùng tần sô' thấp sẽ được giảm xuống Điều này dựa trên khả nãng nhận biết giới hạn của hệ thần kinh thị giác, không có khả năng nhận biết các thông tin này Quá trình lượng tử hóa sẽ loại bỏ một số thông tin trong hình ảnh và người sử dụng có thể sẽ không nhận thấy sự suy giảm chất lượng khi đã loại bỏ những thông tin này
- Quá trình mã hóa độ dài thay đổi là quá trình làm giảm lượng dư thừa về mặt toán học Sản phẩm của quá trình mã hóa độ dài thay đổi là nội dung cơ bản của tín hiệu video trong dòng truyền tải
- Trong tiêu chuẩn MPEG-2, hình ảnh được tổ chức thành từng nhóm ảnh GOP
(Group o f Picture) Các nhóm xác định cấu trúc cho cả chuỗi và chứa đựng một số xác
định các ảnh Chuẩn nén MPEG phân các ảnh được xử lý thành 3 loại ảnh đó là ảnh I,
B, p
Chuẩn nén MPEG-2 sử dụng các kỹ thuật kết hợp nén từng khung hình (nén trong ảnh) và nén giữa các khung hình (nén liên ảnh) sử dụng kỹ thuật “dự đoán bù chuyển động” do đó có thể đạt tỉ lệ nén cao Đây là kỹ thuật được xây dựng trên cơ sở các thuật toán khai thác các mối liên hệ chặt chẽ có tính logic giữa các ảnh liên tiếp nhau, nhằm giảm số lượng thông tin cần truyền các ảnh này Với kỹ thuật này, hầu hết các ảnh trong một đoạn video sẽ được suy diễn từ những ảnh đến trước và sau nó với một lượng thông tin tối thiểu bổ sung để thể hiện sự khác biệt giữa các ảnh này Phần chủ yếu của kỹ thuật này là bộ phận đánh giá chuyển động với các chức năng phức tạp nhất, quyết định khả nâng của bộ mã hoá
Hình 2.1: Quá trình mã hoá Video MPEG-2
2.2.2 Nén video số theo tiêu chuẩn MPEG-2
2.2.2./ Nén ảnh I (Nétĩ trong ảnh)
Ảnh I (Intra-Picture): là ảnh được mã hoá riêng, sử dụng kỹ thuật nén trong ảnh,
nhằm giảm bớt thông tin dư thừa trong miền không gian Nén trong ảnh sử dụng cả hai quá trình có tổn hao và không có tổn hao để giảm bớt dữ liệu trong ảnh Quá trình này không sử dụng thông tin của ảnh trước và sau ảnh đang xét Quá trình thực hiện nén
Trang 27ảnh I là loại bỏ các thông tin dư thừa trong ảnh Chủng chứa tất cả các thông tin cần thiết để tái tạo lại ảnh sau giải mã Vì mang đầy đủ các thông tin cho quá trình tái tạo lại ảnh nên tỉ lệ nén đạt được rất thấp.
Hình 2.2: Quá trình giảm dữ liệu thực hiện với ảnh I
• Tạo block và macro block
ở khối đầu, cả ảnh được chia thành các tổ hợp khối riêng biệt (macroblock) Macroblock bao gồm 4 khối (block) các mẫu (samples) Mỗi block có kích thước 8x 8
= 64 mẫu Cấu trúc của macroblock phụ thuộc vào phương thức quét ảnh Nếu quét liên tục thì các block bao gồm các mẫu từ các dòng liên tục Ngược lại trong trường hợp quét xen kẽ, trong một block chỉ có các mẫu của một nửa ảnh
• Biến đổi cosin rời rạc DCT
Giai đoạn 2 là quá trình biến đổi độc lập từng block bằng thuật toán DCT Quá trình DCT xử ỉý giá trị các khối dữ liệu các pixel thành các khối hệ số trong miền tần
số Quá trình biến đổi DCT thuận cho quá trình mã hoá được xác định như sau:
F (u ,v )= C(u)1C(v) ỷ ỷ f(j,k )C o s(2i ; ' >UK.C os(2k; ' )v,t »•«)
Trang 28F(u,v) - các hệ số của khối DCT 8x8
0 < u < 7 ,0 < V < 7
nếu u, V = 0
C(u), C(v) :
1 nếu u, V = 1, 2, 3 ,7 Đối với hệ số thứ nhất u, V = 0 và được gọi là hệ số một chiều DC:
F ( 0 , 0 ) = ± x £ f ( j , k )
j=0 k =0
(2.8)
Hệ số DC có giá trị lổn, biểu diễn giá trị trung bình của khối 8x8 pixel, trong khi
các hệ số AC có giá trị rất nhỏ thể hiện năng lượng tập trung ít ở các thành phần tần số cao theo chiều ngang và đứng Hình 2.3 biểu diễn 3 chiều khối pixel gốc và các khối
hệ sô' DCT
Quá trình DCT không làm giảm tốc độ dữ liệu, từ 64 mẫu ta nhận được 64 hệ số
Trong khối các mẫu f(j,k), giá trị các mẫu riêng được biểu diễn bằng các phân bố giống nhau về xác suất, có nghĩa là trong phạm vi một block về mặt thống kê các mẫu có giá trị gần giống nhau Ngược lại trong khối các hệ số, phân bố xác suất các hệ số là khác nhau Tín hiệu video biểu diễn bởi các mẫu f(j,k) được biểu diễn về mặt phổ tần tín hiệu theo các hệ số F(u,v)
H ình 2.3 : Các khối mẩu và các hê SỐDCT
• Lượng tử hoá ị Quantizer )
Bước tiếp theo trong quá trình mã hoá ảnh loại I là lượng tử hoá các hệ số F(u,v) Các hệ số tương ứng với tần số thấp có các giá trị lớn hơn, và như vậy nó chứa phần năng lượng chính của tín hiệu, do đó phải lượng tử hoá với độ chính xác cao Ngược lại, đối với các hệ số tương ứng với tần số cao và có các giá trị nhỏ, thì có thể biểu diễn lại bằng tập giá trị nhỏ hơn hẳn các giá trị cho phép hay !à lượng tử hoá ít mức hơn (thô hơn)
Trang 29Lượng tử hoá được thực hiện bằng việc chia hệ số F(u,v) cho a(u,v) trong đó a(u,v) là bảng lượng tử hóa Các hệ số có tần sô' thấp được chia cho các số nhỏ, ngược lại các hệ số tần số cao được chia cho các số lớn Kết quả ta nhận được bảng F’(u,v) mới, trong đó phần lớn các hệ số có tần số cao sẽ bằng 0.
Trong quá trình này có xảy ra mất thông tin (không khôi phục lại được) Sau khi nhân các hệ số lượng tử hoá F’(u, v) với a(u, v) và biến đổi DCT ngược sẽ không nhận được block sơ cấp các mẫu f(j, k) Tuy nhiên nếu chọn được các giá trị a(u,v) thích hợp thì mắt người không phân biệt được giữa ảnh gốc và ảnh đã được mã hoá
Quá trình lượng tử hoá các hệ số DCT là khâu nhạy cảm nhất trong hệ thống nén,
nó tác động trực tiếp đến chất lượng hình ảnh khôi phục Do độ nhạy của mắt người, quá trình lượng tử hoá thích nghi được áp dụng để giảm thiểu thông tin cần mã hoá, thực hiện bằng cách dùng bảng trọng số lượng tử xác định theo 3 thông số: tần số, thông số nhớ đệm, thông số về độ nhạy cảm của mắt nguời
Quá trình thiết kế lựa chọn hệ số phụ thuộc vào môi trường ứng dụng như: độ trễ inã hoá thấp, mức độ phức tạp và giá thành thiết bị Tiêu chuẩn MPEG đưa ra bảng trọng số lượng tử a(u,v) mặc định áp dụng cho ảnh I, p, B ( bảng 2.1)
Các hệ số DCT được lượng tử hóa, sau đó thực hiện quét zigzag hoặc quét lần lượt
thay đổi Cách quét lần lượt thay đổi (alternate) biến đổi mức pixel đến pixel theo
chiều đứng của các ảnh gốc, cho kết quả giải tương quan tốt hơn Hình 2.4 là hai cách quét các hệ số DCT
Trong tiêu chuẩn nén MPEG-2: quét Zigzag được áp dụng cho hình ảnh quét liên tục ( ảnh frame) Kiểu quét lần lượt thay đổi ịalternate) được áp dụng cho các Block
của hình ảnh quét xen kẽ ( ảnh Field)
ĐAI H Ọ C Q u ố c G ia ri, TRUNG TÁM THÔNG TIN THI' Vit
V - L o / 4 H A
Trang 30(a) Quét zigzag (b) Quét lần lượt thay đổi
Hình 2.4: Hai cách quét các hệ sốDCT
• Mã hoá độ dài chạy RLC và mã hóa độ dài thay đổi VLC
Giai đoạn cuối cùng mã hoá ảnh loại I là mã hoá entropy các hệ số đã được lượng tử hoá F’(u, v) Các hệ số DCT đã lượng tử hóa được mã hoá RLC và VLC Trong quá trình mã hoá entropy, thực hiện việc nén sô' liệu qua các hệ số lượng tử
Số mức lượng tử các hệ số F(u,v) quyết định mức nén Sử dụng số mức càng ít, thì hệ số 0 càng nhiều và mức nén các entropi càng cao.
Bằng cách này ta nhận được ảnh có khác hơn so với ảnh gốc Sự khác nhau này không làm ảnh hưởng nhiều đến chất lượng hình ảnh do khả năng nhận biết hạn chế của mắt Quá trình giảm mức lượng tử sẽ đẫn đến hạn chế lượng thông tin ảnh được truyền, nhưng nếu giảm mức này quá lớn sẽ gây ra méo, có thể thấy được cấu trúc các block mà biểu hiện là ảnh bị phân chia thành nhiều ô
Quá trình giải mã ảnh loại I dựa trên cơ sở thực hiện thuật toán ngược vói quá trình đã nói ở trên, sử dụng phép biến đổi DCT ngược
• Bộ đệm (Buffer)
Từ mã VLC được tạo với tốc độ thay đổi, phụ thuộc vào mức độ phức tạp của ảnh, và được ghi vào bộ nhớ đệm Dòng dữ liệu được đọc ra từ bộ nhớ đệm với tốc độ không đổi Cơ chế điều khiển bộ nhớ đệm là đảm bảo bộ nhớ không dưới ngưỡng
(underflow) hoặc không tràn (overflow) bằng cách thay đổi hệ số thang độ (scanning factor) dùng cho bảng trọng số Nếu bộ nhớ sắp đầy, thì sẽ lượng tử hóa thô hơn để tạo
ít bit hơn bằng cách tăng hệ số thang độ của bộ lượng tử, do vậy điều hoà được dòng bit đi vào bộ đệm
2.2.2.2 Nén ảnh loại p (nén liên ảnh)
Các ảnh loại P(Predicted-Pỉcture)' Là các ảnh dự đoán được mã hoá từ ảnh I hoặc ảnh p trước đó nhờ sử dụng các thuật toán dự đoán bù chuyển động (nén liên ảnh ).
Phương pháp dự đoán và bù chuyển động được sử dụng chính thông tin đang có để
dự đoán trạng thái của thông tin tiếp theo của hình ảnh Kết quả thu được lỗi dự đoán
Trang 31hoặc phần thông tin khác biệt giữa thông tin hiện thời và thông tin dự đoán, và truyền
sự khác biệt này Như vậy chỉ cần truyền lượng thông tin nhỏ hơn (lỗi dự đoán) vì hình ảnh đã được truyền trước đó Thiết bị giải mã chỉ cần xử lý cộng phần khác biệt đó và phần đã có để xử lý giải mã hình ảnh
Nén ảnh p cho hệ sô nén cao hơn ảnh I và có thể sử dụng làm một ảnh so sánh cho việc bù chuyển động cho các ảnh p và B khác Hình 2.5 mô tả nguyên lý đánh giá chuyển động và bù chuyển động cho ảnh loại p
Hình 2.5: Đánh giá chuyển động
Quá trình dự đoán là tối ưu nếu kết quả sai sô' dự đoán là 0 Nhưng trong thực tế hình ảnh động là khó dự đoán trước, nhất là các hình ảnh động có độ phức tạp lớn, quá trình dự đoán lại bị hạn chế thời gian do đó không dự đoán được toàn bộ phần thông tin khác biệt Khi đó, thiết bị nén sử dụng kỹ thuật bù chuyển động Nếu tách được các chi tiết chuyển dịch giữa 2 hình (frame) kề nhau và dùng một vector chuyển động chỉ
thị toạ độ các khối đã nén trong frame trước sẽ lặp lại trong frame đang xét tại tọa độ mới Thông tin vectơ chuyển động và độ chênh lệch các hệ số DCT được truyền đồng thời đến bộ giải mã Vị trí block được biểu diễn bằng vector biểu diễn sự dịch block này so với vị trí macroblock trong ảnh loại p Vector này được gọi là vector chuyén động Thuật toán trên lặp lại đối với tất cả các macroblock trong ảnh loại p Kết quả ta nhận được các vector chuyển động cho mỗi macroblock, trên cơ sở đó có thể nhận được dự báo của ảnh đang xét, và như vậy thiết bị giải mã có thể giải mã như áp dụng
ở quá trình dự đoán
Để dự đoán chính xác thì cần so sánh từng pixel (phần tử nhỏ nhất của ảnh) của 2 ảnh liên tiếp Nhưng nếu thực hiện như vậy thì ta lại phải truyền một số lượng đồ sộ các vector chuyén động Nếu so từng vùng lớn thì chất lượng hình ảnh thấp MPEG đã chọn vùng dự đoán bù chuyển động là 16x16 pixel (1 Macroblock)
Trang 32Hình 2.6: ước lượng chuvển động và bù chuyển động dự đoán ảnh p
Mã hoá ảnh loại p dựa trên việc truyền các vector chuyển động và các mẫu ảnh chênh lệch Trong hầu hết các trường hợp, phương pháp này cho phép nén số liệu với tỷ
lệ nén lớn hơn phương pháp mã hoá ảnh loại I
2.2.2.3 Nén ảnh B
Các ảnh B là ảnh dự đoán hai chiều (Bi-directionaì predicted picture) được mã
hoá sử dụng phép nội suy giữa các ảnh I và ảnh p ở trước và sau đó (nén liên ảnh) Ảnh
B không được sử dụng để mã hoá các ảnh tiếp theo Các ảnh B cho tỉ lệ nén cao nhất.Phương pháp mã hoá ảnh loại B cũng giống như phương pháp mã hoá ảnh p Tuy nhiên điểm khác nhau là ở chỗ đối với mỗi macroblock ảnh loại B sẽ tìm các macroblock giống nhau của các pixel trong 2 ảnh trước và sau Mỗi macroblock ta nhận được 2 vector chuyển động Trong trường hợp này, ta sẽ có dự báo ảnh tốt hơn, và
do đó mức độ nén sô' liệu sẽ cao hơn so với trường hợp các ảnh loại p
Để tạo được ảnh loại B, bộ giải mã phải xác định nội đung của hai ảnh xác định chuẩn của nó (nội dung ảnh trước và ảnh sau) nên sẽ làm thay đổi thứ tự truyền các ảnh Bộ mã hoá đầu tiên phải truyền cả hai ảnh chuẩn, sau đó mới truyền đến ảnh loại
B Vì thế bộ giải mã phải dùng bộ nhớ (để lưu trữ các ảnh chuẩn), ảnh B được mã hoá với số lượng bit ít hơn so với ảnh p, giải quyết tốt hơn cho quá trình dự đoán, cho ảnh
khôi phục có SNR ( signal to noise ratio) tốt hơn Tuy nhiên mã hoá và giải mã ảnh B
phức tạp hơn, cần nhiều bộ nhớ và thời gian cho mã hoá, giải mã hơn cho ảnh p
Đối với các macroblock (MB) nén liên ảnh, sai sô' dự đoán sẽ được biến đổi DCT, lượng tử hoá bằng cách chia cho ma trận lượng tử với hệ số thang độ lượng tử thích hợp Sau đó các hệ số được quét để mã hoá RLC và VLC Véc tơ chuyển động sẽ được
mã hoá dự đoán DPCM, so với vectơ chuyển động của MB trước đó, rồi được truyền như một thông tin thứ cấp
Trang 33Điều khiển tốc độ bit
Hình 2.7: Sơ đổ khối quá trình mã hoá MPEG
2.2.3 Các đặc tính và mức (Profiles & Levels)
Chuẩn nén MPEG-2 có 4 level và 5 Profile
Khái niệm Level trong chuẩn nén MPEG-2 cho ta biết độ phân giải của ảnh, Profile là khái niệm cho biết cấp chất lượng bộ công cụ nén (thể hiên tỷ lệ lấy mẫu các tín hiệu video thành phần và tốc độ bit dữ liệu ) Trong thực tế ứng dụng, các nhà chế tạo đã chọn sẵn một số thoả hiệp giữa các mức Level và các Profile cho người sử dụng Điểm khác nhau chính của các Level và các Profile trong chuẩn MPEG-2 với các thông
số cấu trúc lấy mẫu, độ phân giải, tốc độ bit cực đại và các ảnh mã hoá được mô tả trong bảng 2.2.
Giữa các Profile có sự tương thích cao dần, nghĩa là các bộ giải mã của các Profile cấp cao hơn có khả năng giải mã tất cả các Profile ở cấp đó và các cấp thấp hơn Kết hợp giữa các Profile và các Level ta có các tốc độ bit với độ phân giải khác nhau,
và một sự kết hợp quan trọng nhất giữa Profile và Level đó là Main Profile và Main Level MPEG-2MP@ML đã được sử dụng trong các ứng dụng phát sóng truyền hình
số với chuẩn lấy mẫu 4:2:0 và độ phân giải 720x480@30Hz hay 720x576@25Hz , ảnh
mã hoá là các ảnh I, B và p
Trang 34Bảng 2.2: Các Profile và Level MPEG-2
HIGH
4:2:0 1920x1152
80 Mb/s I.P.B HIGH- 1440
4 : 2 : 0 1440x1152
60 Mb/s I.P.B
PR O FIL E
4:2:0,4:2:2 1920x1152
100 Mb/s
I,P,B
4 : 2 : 0 1440x1152
60 Mb/s
1,P,B
4:2:0,4:2:2 1440x1152
2.2.4 Nén Audio
Tiêu chuẩn nén audio MPEG-1 (ISO/IEC 11172-3) thường được biết dưới tên MUSICAM gồm 3 lớp mã hóa I, II, III tương ứng với hiệu quả nén và độ phức tạp tăng dần, được ứng đụng trong nhiều lĩnh vực khác nhau, đặc biệt là trong Phát thanh- Truyền hình Tiêu chuẩn nén audio MPEG-2 (ISO/IEC 13818-3) là bước phát triển mở rộng dựa trên cơ sở MPEG-1 Phương thức nén Dolby AC3 ứng đụng trong HDTV số cũng là biến thể từ Audio MPEG-2 Đối với lĩnh vực truyền hình tiêu chuẩn MPEG-2
có ưu điểm nổi bật là đảm bảo khả năng đồng bộ giữa audio và video sau khi phân kênh và giải nén Đặc tính kỹ thuật của audio MPEG-1 và MPEG-2 được tóm tắt trong bảng 2.3
Trang 35Bảng 2.3 : Đặc tính kỹ thuật của audio MPEG-ỉ và MPEG-2
Số lượng kênh Lên đến 2 kênh với các
mode: mono, stereo, dual
Lên đến 6 kênh: Left, Right, Center,
L Surround, R Surround và LEF
mã độc lập
Nguyên lý nén audio MPEG chủ yếu dựa vào khả năng bị hạn chế
Hình 2.8 Bộ mã hoá cảm thụ audio cơ bản
- Mô hình cảm thụ thính giác (Psychoacoustic Model): Khối này mô phỏng hiệu
ứng che lấp, làm cơ sở cho việc cấp phát bit cho các mẫu một cách hợp lý, tăng hiệu quả nén audio Có hai dạng che lấp :
+ Che lấp về phổ : Khi tổn tại cùng một lúc hai âm thanh có tần số khác nhau, âm ihanh có mức lớn hơn có thể che lấp âm thanh có mức nhỏ hom Do đó, đường cong
■‘ngưỡng nghe thấy” sẽ luôn luôn thay đổi tuỳ thuộc vào phổ của các mẫu âm thanh Jang xét Chỉ có các đoạn vạch phổ nằm trên đường cong này mới thực sự được mã
- Các bộ lọc dãy 32 băng con (Filter bank 32 Subband) : khối này biến đổi sô' liệu
audio trong miền thời gian thành số liệu của 32 băng con trong miền tần số Dựa theo hiệu ứng che lấp, độ dư thừa trong các số liệu này sẽ được loại bỏ Phổ tín hiệu được
Trang 36chia thành các băng tần con có độ rộng bằng nhau (32 băng trong MPEG-Layer I vàII) Mỗi tín hiệu băng con sau đó được lượng tử hóa đều
- Cấp phát bit, lượng tử và mã hoá (Bit/Noise Allocation Quantizing and Coding)
Lựa chọn dải xấp xỉ ngưỡng nghe và cấp phát bit trên cơ sở năng lượng phổ tín hiệu audio và mô hình tâm sinh lý nghe Lượng tử hoá các phần cần thiết trong số liệu của
32 băng con với số bit thích hợp và sử dạng mã hóa số liệu PCM
- Định dạng dòng bit (Bit stream formatting) : có nhiệm vụ định dạng lại dòng
bit theo tiêu chuẩn của MPEG
- Bộ ghép kênh dữ liệu audio: nhận dữ liệu lượng tử hóa và cộng các thông tin vị trí bit và hệ số thanh độ cho quá trình giải mã hiệu quả
2.2.5 Cấu trúc của dòng dữ liệu video MPEG-2:
2.2.5.I Cấu trúc phân lớp
Cấu trúc dòng bit video MPEG-2 có dạng phân lớp, gồm 6 lớp (tương hợp với
MPEG-1) bao gồm:
Lớp Block: là đơn vị cơ sở gồm 8x8 phần tử ảnh (pixel) Các ảnh I mang thông
tin của ảnh gốc cần truyền được mã hoá bằng các hệ số DCT để truyền Với các ảnh p
và B thì chỉ truyền các thông tin khác nhau giữa các ảnh
Lớp macroblock (tổ hợp khối): xác định lượng thông tin sử dụng cho lớp slice và thông tin về các véc tơ bù chuyển động Macroblock của tín hiệu chói Y gồm 4 block, cho các tín hiệu hiệu màu CR và CB là 2 block với chuẩn lấy mẫu 4:2:2 và là 1 block CR hoặc CB với chuẩn 4:2: 0
Lớp Slice: Các MB được tập hợp tạo thành các Slice Slice có thể bắt đầu từ bất cứ đâu, kích thước tuỳ ý, và chịu trách nhiệm cho quá trình đồng bộ ảnh Nó bao gồm các nhận dạng đầu gói của các ảnh đã truyền Mỗi Slice gồm 16 đoạn chứa ít nhất lổpixel Slice là đơn vị cơ bản để đồng bộ hoá cho quá trình mã có độ dài động và mã vi sai Những vectơ đầu tiên trong slice được gửi đầy đủ, sau đó là những vectơ được truyền vi sai
Trong ảnh I, những hệ số DC đầu tiên trong slice được gửi đầy đủ còn những hệ
số DC còn lại được truyền vi sai (chỉ truyền sự khác nhau giữa các hệ số hay sự chênh lệch giữa các hệ số )
Trong trường hợp có lỗi bit ở dòng cơ sở, quá trình giải nối tiếp của các symbol
độ dài thay đổi sẽ bị ngắt quãng hoặc các hệ số đã được mã hoá vi sai hay những vectơ
sẽ bị sai lỗi Cấu trúc slice làm cho có thể khôi phục bằng cách chỉ cho điểm tái đồng
bộ dòng bit
Lớp ảnh: một số slice được gộp lại tạo nên một ảnh, là một mành hoặc 1 khung hình Dữ liệu bắt đầu của ảnh (Picture header) xác định ảnh đó là I, p hoặc B được mã, bao gồm cả tham chiếu thời gian, như vậy hình ảnh sẽ được thể hiện ở đúng thời gian
Trang 37Lớp nhóm ảnh : Nhiều ảnh có thể được kết hợp thành nhóm ảnh (GOP) và phải bắt đầu bằng ảnh I Giữa 2 ảnh I là một số ảnh p hoặc B GOP có thê mở hoặc đóng GOP đóng: những ảnh B cuối cùng không cần tới ảnh I trong GOP kế tiếp để giải mã
và dòng bit có thể bị cắt khi GOP kết thúc
Để phía giải mã có thể bắt đầu hoạt động hoặc sau khi có lỗi truyền, dẫy ảnh I được truyền chuẩn hoá sau mối 0,5ms (sau 12 ảnh), ảnh p và B được truyền giữa các ảnh I
GOP là đơn vị cơ bản của mã hoá theo miền thời gian, mô tả nhóm các ảnh tổ hợp từ các kiểu ảnh I, p, B Trong tiêu chuẩn MPEG-2( ISO/IEC-138182) độ dài GOP mặc định là 12 ảnh có cấu trúc: I-B-B-P-B-B-P-B-B-P-B-B, khoảng thời gian 1 GOP là 480ms
Với tốc độ bit 4~6Mbit/s ảnh I có dung lượng khoảng ~ 1000Kbit
ảnh p ~ 300Kbit, và ảnh B ~ 100Kbit
Lớp Sequence (chuỗi hình ảnh): gồm nhiều GOP kết hợp ỉại, là lớp biểu thị cao nhất khi chuỗi dữ liệu video thay đổi chủ yếu đo khi chèn các chương trình Nó bao gồm các thông tin như: tỷ sô' nén, số lượng điểm ảnh theo chiều ngang, dọc, số ảnh /giây, kích thước cần thiết cho bộ nhớ đệm ở giải mã, tốc độ bit
Chuỗi video bắt đầu chuồi với mã khởi động (start code) tiếp theo là các header
{đầu gói ) và kết thúc chuỗi với mã kết thúc (End Code).
Thông thường chuỗi header được đặt khắp suốt cả chuỗi - đảm bảo cho phép giải
mã từ phần đầu chuỗi đến cuối giống như phát lại băng hay đĩa video số
Chuỗi header chỉ rõ : kích thước hình ảnh theo chiều ngang và dọc, tỷ lệ khung hình, định dạng lấy mẫu tín hiệu màu, tốc độ ảnh, quét liên tục hay quét xen kẽ, Profile, Level, tốc độ bit, ma trận lượng tử sử dụng trong nén liên ảnh, trong ảnh
< -S eq u en ce ->
< - GOP - »
Trang 382.2.52 Dòng cơ sở & dòng cơ sở đóng gói
a Dòng cơ sở
Dòng cơ sở vể cơ bản là dòng đầu ra thô của bộ mã hoá, chỉ chứa những thông tin cần thiết giúp bộ giải mã tái tạo lại hình ảnh hoặc âm thanh ban đầu
Một chương trình truyền hình có thể có vài dòng cơ sở, bao gồm: dòng video cơ
sở (Video ES ), dòng audio cơ sở (Audio ES) và dòng cơ sở dữ liệu (Data ES)
Dòng cơ sở là dòng rất gần với thời gian thực của tín hiệu
MA TRẬN
Hình 2.10: Cấu trúc dòng cơ sở Video
b Dòng cơ sở đóng gói
Để thuận tiện cho quá trình truyền dẫn, dòng cơ sở được đóng gói thành các khối
dữ liệu Những khối dữ liệu này cần những thông tin xác định điểm bắt đầu của gói và bao gồm cả thông tin thời gian nhịp lên các gói bởi vì quá trình đóng gói đã làm cho không thể nhận diện gói theo trục thời gian Các thông tin nhận dạng này nằm trong Header của gói
Các dòng cơ sỏ của video, audio, và dữ liệu số được chuyển đổi thành các dòng cơ
sở đóng gói PES (Packet Element Stream) qua quá trình đóng gói Gói dữ liệu video
(PES) mang các thông tin của ảnh đã được nén có kích thước phù hợp theo các ứng dụng Độ dài lớn nhất = 216 - 1= 65.535byte Mỗi PES được bắt đầu bằng các bit đầu
gói ( header) có độ dài qui ước là 6 byte, 3 byte đầu tiên dùng cho mã khởi đầu gói dữ
liệu, 1 byte tiếp theo để nhận diện xem dòng đó là audio hay video, và 2 byte tiếp theo
để chỉ thị độ dài gói Hai tham số đầu là rất quan trọng để không nhầm lẫn gói trong cùng 1 PES với rất nhiều gói nhỏ hơn được sử dụng trong dòng truyền tải
Trong hệ thống truyền hình số, dòng MPEG được truyền dưới dạng dòng truyền tải, các gói PES được đưa qua bộ ghép kênh dòng truyền tải Trong trường hợp này các PES được đưa vào trong payload của dòng truyền tải Cấu trúc PES và nội dung của các Header thể hiện trên hình 2.11
Trang 39p a c k e t
start
c o d e
s tre a m id
data alignment copyright
original
or copy 7 flags
P E S header data length
options» M
fie-Ws
stuffing bytes
pack header field
program packet seq cntr
P-STO buffer
P E S extension field length
P E S extension field data
Hình 2.11 CứM trúc PES và nội dung của các Header
2.2.5.3 Dòng chương trình (PS) và dòng truyền tải
a Dòng chương trình
Dòng chương trình PS (Program Stream) được hình thành bằng cách gộp các dòng dữ liệu audio và video đã đóng gói cùng các gói dữ liệu khác, chi tiết chương trình, xung chuẩn đồng hồ chương trình PCR (program clock reference) hay đổng hổ thời gian thực Các gói dữ liệu PES được ghép lại tạo thành dòng chương trình PS ( Program Stream ) gồm sự nối tiếp các gói có độ dài thay đổi
Mỗi gói bắt đầu bằng một header Một lỗi xảy ra trong phẩn header có thể làm mất thông tin của toàn gói Việc mất thông tin của một gói có thể làm mất hoặc gián đoạn cả một khung ảnh
Độ dài gói không cố định khiến cho bộ giải mã không dự đoán được khi nào gói chấm đứt và một gói mới bắt đầu Bộ giải mã phải đọc và dịch lại thông tin về độ dài gói trong Header Nếu thông tin về độ dài gói bị lỗi, bộ giải mã sẽ mất đồng bộ và do
đó mất thông tin ít nhất là một gói
Dòng Chương trình có độ dài lớn hơn dòng cơ sở do cần có các bit đánh dấu đầu mỗi gói
b Dòng truyền tải TS (Transport Stream)
Dòng truyền tải được thiết kế cho truyền dữ liệu ở môi trường có can nhiễu Dòng truyền tải khác với dòng chương trình ở chỗ các gói PES được chia nhỏ với kích thước ngắn cố định( 188byte) trong đó các chương trình được ghép lại với các xung nhịp khác nhau Điều này có thể thực hiện được VI dòng truyền tải được gắn xung nhịp
Trang 40chương trình (PCR - program clock reference) và xung nhịp gốc (OPCR) được thông
báo cho phía giải để tái tạo gốc thời gian ở phía mã hoá Do vậy, dòng truyền tải sử dụng chuẩn đồng hồ chương chình (PCR) còn dòng chương trình thì không có nhu cầu
về chuẩn đồng hồ chương trình
Sử dụng các gói ngắn có độ dài không đổi, làm cho dòng truyền tải có khả năng chống lỗi cao hơn nhiều so với dòng PS
Mỗi dòng truyền tải đơn chương trình (SPTS) sẽ có 1 đồng hồ chương trình giúp
bộ giải mã tái tạo cả Audio và Video
188 bytes transport
packet ttẺadât' payload héa déi payload , header payload
sync transport payload transport
I transport
Byte error unit start priority PID scrambling
adaptation discontinuity random
field indicator access
transport private data length
elementary stream priority indicator
óptiủna fields
3 flags
<#eùn*lị:.;;ỵị
Hình 2.12: Cấu trúc dòng truyền tải
Dòng truyền tải của nhiều chương trình khác nhau có thể được tổng hợp qua bộ ghép kênh dòng truyền tải, cho phép cùng một lúc truyền được nhiều chương trình Trong dòng truyền tải, các chương trình khác nhau bắt đầu từ các nguồn khác nhau, nhưng bắt buộc phải được đồng bộ hoá Như vậy dòng truyền tải phải cung cấp tín hiệu đồng bộ riêng biệt cho mỗi chương trình (PCR| PCRn) Hơn nữa dòng truyền tải cần phải chứa thêm các dữ liệu để tái tạo đổng hồ ổn định giông như ở nguồn phát
Đổ tăng khả năng chịu đựng khi truyền dẫn trong môi trường can nhiễu có thể gây ra sai lỗi, dòng truyền tải được đóng gói cố định là 188byte Gói dòng TS bắt đầu
với tối thiểu là 4 byte đầu gói (TS Header) và 184 byte thông tin cần truyền Nội dung
của mỗi gói và bản chất của dữ liệu tải được nhận dạng bằng các header Cấu trúc Header được biểu diễn bằng một lớp điều khiển có độ đài cố định và 1 vùng thích nghi
có độ dài thay đổi
Cấu trúc gói truyển tải MPEG-2 được trình bày ở hình 2.13