MỞ ĐẦU Cuối thập kỷ trước, sự phát triển của các dịch vụ truyền hình vệ tinh, sự tăng trưởng của dịch vụ truyền hình cáp số, và đặc biệt là sự ra đời của HDTV đã để lại dấu ấn đối với lĩnh vực truyền hình. Hiện nay xuất hiện một phương thức cung cấp dịch vụ mới còn mạnh hơn với đe dọa sẽ làm lung lay mọi thứ đã có. Internet Protocol Television (IPTV) đã ra đời, dựa trên sự hậu thuẫn của ngành viễn thông, IPTV dễ dàng cung cấp nhiều hoạt động tương tác hơn, cung cấp sự cạnh tranh mạnh mẽ hơn cho các doanh nghiệp kinh doanh dịch vụ truyền hình. IPTV có cơ hội lớn để phát triển nhanh chóng khi mà mạng băng rộng đã có mặt ở khắp mọi nơi và hiện tại đã có trên 100 triệu hộ gia đình sử dụng dịch vụ băng rộng trên toàn cầu. Rất nhiều nhà cung cấp dịch vụ viễn thông lớn trên thế giới đang triển khai thăm dò IPTV và xem đây như một cơ hội mới để thu lợi nhuận từ thị trường hiện có của họ và coi đó như một giải pháp tự bảo vệ trước sự lấn sân của các dịch vụ truyền hình cáp. Nhằm mục đích nghiên cứu công nghệ IPTV, đồ án được xây dựng với bố cục theo các chương như sau: • Chương 1: Tổng quan công nghệ IPTV, giới thiệu sơ lược về công nghệ IPTV. • Chương 2: Những giải pháp kỹ thuật cơ bản trong IPTV, trình bày về công nghệ IPTV, các chuẩn nén, các giao thức và kiến trúc mạng truyền tải hệ thống IPTV. • Chương 3: Khả năng triển khai IPTV trên mạng viễn thông Việt Nam, trình bày tình hình phát triển công nghệ IPTV tại Việt Nam, khả năng ứng dụng công nghệ IPTV vào mạng băng rộng của Việt Nam. Với lượng thời gian có hạn, em đã nỗ lực thu thập tài liệu và xử lý thông tin liên quan đến công nghệ IPTV. Tuy nhiên, do công nghệ IPTV còn rất mới mẻ nên một số nội dung trong đồ án chưa được chi tiết và không thể tránh khỏi những thiếu xót. Em mong được sự góp ý của các thầy và các bạn để nắm rõ hơn về công nghệ và cũng để củng cố cho kiến thức khi ra trường. Em xin chân thành cảm ơn sự hướng dẫn, chỉ bảo tận tình của thầy giáo Nguyễn Khắc Hưng, là người đã trực tiếp giúp em hoàn thành đồ án này. Cuối cùng em xin cảm ơn các thầy cô, các bạn đã dành thời gian đọc và quan tâm tới đồ án này.
Trang 1MỞ ĐẦU
Cuối thập kỷ trước, sự phát triển của các dịch vụ truyền hình vệ tinh, sựtăng trưởng của dịch vụ truyền hình cáp số, và đặc biệt là sự ra đời củaHDTV đã để lại dấu ấn đối với lĩnh vực truyền hình Hiện nay xuất hiệnmột phương thức cung cấp dịch vụ mới còn mạnh hơn với đe dọa sẽ làmlung lay mọi thứ đã có Internet Protocol Television (IPTV) đã ra đời, dựatrên sự hậu thuẫn của ngành viễn thông, IPTV dễ dàng cung cấp nhiều hoạtđộng tương tác hơn, cung cấp sự cạnh tranh mạnh mẽ hơn cho các doanhnghiệp kinh doanh dịch vụ truyền hình
IPTV có cơ hội lớn để phát triển nhanh chóng khi mà mạng băng rộng đã
có mặt ở khắp mọi nơi và hiện tại đã có trên 100 triệu hộ gia đình sử dụngdịch vụ băng rộng trên toàn cầu Rất nhiều nhà cung cấp dịch vụ viễn thônglớn trên thế giới đang triển khai thăm dò IPTV và xem đây như một cơ hộimới để thu lợi nhuận từ thị trường hiện có của họ và coi đó như một giảipháp tự bảo vệ trước sự lấn sân của các dịch vụ truyền hình cáp
Nhằm mục đích nghiên cứu công nghệ IPTV, đồ án được xây dựng với
bố cục theo các chương như sau:
Chương 1: Tổng quan công nghệ IPTV, giới thiệu sơ lược
về công nghệ IPTV
Chương 2: Những giải pháp kỹ thuật cơ bản trong IPTV,
trình bày về công nghệ IPTV, các chuẩn nén, các giao thức vàkiến trúc mạng truyền tải hệ thống IPTV
Chương 3: Khả năng triển khai IPTV trên mạng viễn thông Việt Nam, trình bày tình hình phát triển công nghệ IPTV
Trang 2tại Việt Nam, khả năng ứng dụng công nghệ IPTV vào mạngbăng rộng của Việt Nam.
Với lượng thời gian có hạn, em đã nỗ lực thu thập tài liệu và xử lý thôngtin liên quan đến công nghệ IPTV Tuy nhiên, do công nghệ IPTV còn rấtmới mẻ nên một số nội dung trong đồ án chưa được chi tiết và không thểtránh khỏi những thiếu xót Em mong được sự góp ý của các thầy và cácbạn để nắm rõ hơn về công nghệ và cũng để củng cố cho kiến thức khi ratrường
Em xin chân thành cảm ơn sự hướng dẫn, chỉ bảo tận tình của thầy giáoNguyễn Khắc Hưng, là người đã trực tiếp giúp em hoàn thành đồ án này.Cuối cùng em xin cảm ơn các thầy cô, các bạn đã dành thời gian đọc vàquan tâm tới đồ án này
Trang 3IPTV là công nghệ truyền dẫn hình ảnh kỹ thuật số tới người sử dụngdựa trên giao thức Internet với kết nối băng rộng Dịch vụ này thường đượccung cấp cùng với điện thoại trên Internet (Voice over IP - VoIP), videotheo yêu cầu (Video on Demand - VoD) nên thường được gọi là công nghệtam giác (Triple play) về truyền tải dữ liệu, hình ảnh, âm thanh Một cáchđịnh nghĩa đơn giản hơn, đó là nội dung chương trình truyền hình đượctruyền tới người xem (user) dựa trên mạng băng rộng IP Các user có thểthông qua máy vi tính PC hoặc máy thu hình phổ thông cộng với hộp phốighép set topbox để sử dụng công nghệ IPTV
Trước đây, công nghệ này gần như không thể với tốc độ tải xuống chậmcủa dial-up hạn chế việc truyền đi các khuôn dạng video Tuy nhiên, hiệnnay IPTV được dự báo sẽ phát triển một cách nhanh chóng do số lượngngười sử dụng dịch vụ băng rộng rất lớn
Công nghệ IPTV có những ưu điểm vượt trội so với “Internet Video”.Internet Video cung cấp các dịch vụ xem video như phim truyện, web-camsvới chất lượng chưa cao Ngược lại, công nghệ IPTV tiến bộ hơn, tiện lợi
Trang 4với người sử dụng hơn, và kết hợp chặt chẽ với công nghệ truy nhập đườngdây thuê bao số (DSL) tốc độ cao như ADSL, ADSL2+, VDSL, PON, vôtuyến băng rộng,
IPTV có 2 đặc điểm cơ bản là: dựa trên nền công nghệ IP và phục vụtheo nhu cầu Tính tương tác là ưu điểm của IPTV so với hệ thống truyềnhình cáp CATV hiện nay, vì truyền hình CATV tương tự cũng như CATV
số đều theo phương thức phân chia tần số, định trước thời gian và quảng báđơn hướng (truyền từ một trung tâm đến các máy tivi thuê bao) MạngCATV hiện nay chủ yếu dùng cáp đồng trục hoặc lai ghép cáp đồng trụcvới cáp quang đều phải chiếm dụng tài nguyên băng tần rất rộng Hơn nữa
kỹ thuật ghép nối modem cáp hiện nay đều sản sinh ra tạp âm So với mạngtruyền hình số DTV thì IPTV có nhiều đổi mới về dạng tín hiệu cũng nhưphương thức truyền bá nội dung Trong khi truyền hình số thông qua cácmenu đã định trước (thậm chí đã định trước hàng tuần, hoặc hàng tháng) đểcác user lựa chọn, thì IPTV có thể đề cao chất lượng phục vụ có tính tươngtác và tính tức thời Người sử dụng (user hoặc viewer) có thể tự do lựachọn chương trình TV của mạng IP băng rộng Với ý nghĩa đúng củaphương tiện truyền thông (media) giữa server và user
So với VOD, IPTV có ưu thế là:
Sử dùng dễ dàng, hiển thị trên tivi hiệu quả cao hơn màn máy vi tính,thao tác trên hộp ghép nối + bàn phím đơn giản, thực hiện chuyểnđổi nhanh luồng cao tốc/chương trình
Dễ quản lý, dễ khống chế, sử dụng hộp kết nối làm đầu cuối nhàcung cấp dịch vụ để tiến hành định chế đối với hộp kết nối không
Trang 5cần đến nghiệp vụ an toàn và kiểm tra chất lượng Đây cũng là cơ sở
kỹ thuật để dễ thu phí
Với sự vượt trội về tính tương tác giữa người xem và dịch vụ gia tăng,IPTV hoàn toàn có thể làm thay đổi thói quen xem truyền hình truyềnthống bởi nó không chỉ cho phép khách hàng xem các chương trình, màcòn cho phép khán giả chủ động chọn những nội dung gì mình muốn xem.Với IPTV, khách hàng có thể tiếp cận những dịch vụ tiên tiến nhất trên nềnbăng thông rộng như xem TV trực tiếp qua Internet (Live TV), mua hàngqua TV, karaoke, game (trò chơi trực tuyến), tạp chí thông tin, điện thoạihình, đào tạo qua TV, TV Mail, TV Photo, bình chọn qua TV, dự đoán qua
TV, tin nhắn nhanh (IM), quảng cáo Hiện IPTV đang được đánh giá làmột dịch vụ tiềm năng
1.2 Kiến trúc tổng quan hệ thống IPTV
Hình 1.1 Kiến trúc tổng quan của một hệ thống IPTV
Kiến trúc IPTV gồm các khối chức năng sau:
Trang 6 Content Sources: Nguồn dữ liệu, có chức năng thu nhận các nội
dung dữ liệu như phim ảnh từ các nhà sản xuất và các nguồnkhác Sau đó, các nội dung này được mã hóa và lưu trữ trong cơ
sở dữ liệu để phục vụ cho dịch vụ video theo yêu cầu (VoD)
IPTV Service Nodes: Các node dịch vụ IPTV, có chức năng
nhận các luồng dữ liệu hình ảnh dưới các định dạng khác nhau.Các luồng dữ liệu này sẽ được định dạng và đóng gói lại đểtruyền đi với chất lượng dịch vụ (Quality of Service - QoS) đảmbảo
Wide-area Distribution Networks: Mạng phân bố vùng rộng
hình thành nên việc phân bổ khả năng, dung lượng và chất lượngcủa dịch vụ Mạng này cũng gồm các chức năng khác như truyền
đa hướng, việc này rất cần thiết cho việc phân bổ các luồng dữliệu IPTV từ các node dịch vụ đến khách hàng một cách tin cậy
và đúng thời gian Ngoài ra, mạng lõi và mạng truy nhập gồm cảmạng đường trục quang và bộ ghép kênh truy nhập đường dâythuê bao số (DSLAMs)
Customer Access Links: Kết nối truy nhập khách hàng, đòi hỏi
sử dụng các công nghệ DSL tốc độ cao như ADSL2+ và VDSL,thông tin được truyền đến khách hàng qua đường điện thoại
Customer Premises Equipment (CPE): Thiết bị đầu cuối khách
hàng cung cấp chức năng kết cuối mạng băng rộng (B-NT) Thiết
bị này có thể cung cấp các chức năng như cổng định hướng, top box, internet
set- IPTV Client: IPTV Client là khối chức năng có nhiệm vụ kết
cuối lưu lượng IPTV tại đầu cuối khách hàng Thiết bị này, ví dụnhư set-top box (STB), thực hiện chức năng xử lý như thiết lập
Trang 7kết nối và QoS đối với các node dịch vụ, giải mã các luồng tínhiệu hình ảnh, chuyển đổi kênh, hiển thị điều khiển và các kết nốiđến các ứng dụng người sử dụng như SDTV hoặc HDTVmonitor.
1.3 Kiến trúc mạng cung cấp dịch vụ Triple Play
Hiện nay, với việc sử dụng các công nghệ mạng truy nhập và chuyểnmạch gói dựa trên giao thức IP, các công ty viễn thông có thể giảm chi phíđầu tư đồng thời đưa ra được nhiều loại dịch vụ mới Các nhà cung cấpđường truyền đang nỗ lực để chuyển đổi từ “kênh sang gói” theo địnhhướng công nghệ chiến lược của họ để tăng khả năng tạo ra dịch vụ vàcung cấp với giá thành thấp và tạo ra được một cấu trúc mạng IP linh hoạt
Sự phát triển của các sản phẩm mới là chìa khóa cho sự chuyển đổi này, cụthể như các chuyển mạch mềm dùng cho các dịch vụ thoại, các hệ thốngHeadend số để cung cấp truyền hình IP, các hệ thống mạch vòng băng rộngcho phép hợp nhất thoại, số liệu và truyền hình trên một hạ tầng mạng truynhập duy nhất Với sự tác động của các công nghệ gói, các nhà cung cấpdịch vụ có thể duy trì khả năng cạnh tranh bằng cách cung cấp các dịch vụ
"Triple-Play" với thoại - số liệu - hình ảnh trên các đường truyền DSL
NxGE GE
COT
RT RT
RT
Router Class 5
PSTN
Internet
Central Office
Video Headend CO
CO
CO DSL
Access Network Back bone/Metro/Interoffice
Hình 1.2 Kiến trúc mạng cung cấp dịch vụ Triple Play
Trang 8Trong kiến trúc mạch vòng nội hạt cung cấp dịch vụ Triple Play, một hệthống mạch vòng mang các lưu lượng thoại, số liệu và truyền hình từ cácđầu cuối xa (Remote Terminal) sử dụng các đường dây điện thoại tiêuchuẩn với giao diện DSL Các đầu cuối xa được kết nối đến đầu cuối trungtâm (COT) thông qua mạng truy nhập Khách hàng được kết nối trực tiếptrên các đôi cáp đồng đến trung tâm có thể nhận được tất cả các dịch vụnhư nhau trực tiếp từ đầu cuối trung tâm Đầu cuối trung tâm cung cấp cáctruy nhập đến mạng PSTN thông qua hệ thống chuyển mạch truyền thốnghoặc chuyển mạch mềm (dùng cho VoIP), cung cấp truy nhập Internetthông qua thiết bị định tuyến và cung cấp truy nhập đến các dịch vụ truyềnhình thông qua kết nối đến Video Headend.
Giải pháp này sử dụng công nghệ IP tiêu chuẩn Về mặt kỹ thuật, cáchtiếp cận này loại bỏ sự phức tạp của mạng Về mặt kinh tế, giải pháp nàygiảm đáng kể chi phí xây dựng và vận hành mạng
Xét về khía cạnh lưu lượng, khách hàng kết nối vào mạng tại đầu cuối xahay trung tâm qua các giao tiếp truyền thống như các đường analog/POTS,E1 hay DSL Mọi lưu lượng không phải là IP sẽ được chuyển đổi thành cácgói tại RT, ví dụ thoại analog được chuyển thành VoIP Đầu cuối xa đượckết nối đến trung tâm qua các liên kết Ethernet hoặc POTS theo mọi cấuhình mạng như ring, string, star, v.v phù hợp với cấu hình mạng của nhàcung cấp Lưu lượng IP đi từ đầu cuối xa đến đầu cuối trung tâm tại trungtâm Đầu cuối trung tâm kết nối với các thiết bị chuyển mạch Lớp 5 và kếtnối đến thiết bị định tuyến truy nhập Internet, chuyển mạch mềm và đếncác Video Headends
Trang 9Hình 2.1 Mô hình kiến trúc hệ thống cung cấp dịch vụ IPTV
Hệ thống cung cấp nguồn dữ liệu: Thu, nhận và xử lý các dữ liệuchương trình từ các nguồn khác nhau như vệ tinh, truyền hìnhmặt đất và các nguồn khác để chuyển sang hệ thống Headen
Middleware
Hệ thống phân phối nội dung
Trang 10 Hệ thống Headend: Thu, điều chế và giải mã nội dung hình ảnh
và âm thanh từ các nguồn khác nhau và sử dụng các thiết bị mãhóa (encoder) để chuyển đổi nội dung này thành các luồng dữ liệu
IP ở khuôn dạng mã hóa mong muốn
Hệ thống Middleware: có vai trò gắn kết một số thành phần logícthành một hệ thống phần mềm IPTV/video hoàn chỉnh hơn Hệthống Middleware cung cấp giao diện người sử dụng cho cả dịch
vụ băng rộng và theo yêu cầu Hệ thống này cũng được sử dụngnhư phần mềm liên kết để tích hợp các sản phẩm từ các nhà cungcấp khác nhau thành một mức ứng dụng Middleware cung cấpkhả năng quản lý thuê bao, nội dung và báo cáo hoàn chỉnh cùngvới các chức năng quản lý EPG và STB, đồng thời vẫn duy trìtính mở cho việc tích hợp các dịch vụ trong tương lai
Hệ thống phân phối nội dung: Bao gồm các cụm máy chủ VoD vàcác hệ thống quản lý VoD tương ứng, cho phép lưu trữ các nộidung đã được mã hóa và thiết lập các chính sách phân phối nộidung một cách mềm dẻo Hệ thống này cũng cho phép nhà khaithác mở rộng một cách kinh tế, phù hợp với tải và yêu cầu dịch
vụ của các thuê bao
Hệ thống quản lý bản quyền (DRM): giúp nhà khai thác bảo vệnội dung của mình, như trộn các tín hiệu truyền hình hay mã hóanội dung VoD, khi truyền đi trên mạng Internet và tích hợp vớitính năng an ninh tại STB phía thuê bao
Mạng truy nhập: Hạ tầng mạng IP băng rộng để truyền dịch vụ từnhà cung cấp đến khách hàng
Trang 11 Set-top Box (STB): Thiết bị đầu cuối phía khách hàng cho phépthu, giải mã và hiển thị nội dung trên màn hình TV STB cũng cóthể hỗ trợ HDTV, có khả năng kết nối với các thiết bị lưu trữ bênngoài, video phone, truy nhập web
Hệ thống quản lý mạng và tính cước
2.2 Các chuẩn nén hình ảnh
Cùng với sự phát triển mạnh mẽ của máy tính và sự ra đời của internet,thì việc tìm ra một phương pháp nén ảnh nhằm giảm bớt không gian lưu trữthông tin và truyền thông trên mạng là yêu cầu cấp thiết Các kỹ thuật nénVideo đều cố gắng giảm lượng thông tin cần thiết cho một chuỗi các bứcảnh, mà không làm giảm chất lượng ảnh Mục đích của nén video là giảmbớt số bít khi lưu trữ và truyền bằng cách loại bỏ lượng thông tin dư thừatrong từng frame và dùng kỹ thuật mã hoá để tối thiểu hoá lượng thông tinquan trọng cần lưu giữ Với một thiết bị lưu hình kỹ thuật số thông thường,ảnh sau khi được số hoá sẽ được nén lại Quá trình nén sẽ xử lý các dữ liệutrong ảnh để đưa hình ảnh vào một không gian hẹp hơn như trong thiết bịnhớ kỹ thuật số hoặc qua đường dây điện thoại, Với thị trường lưu hình
kỹ thuật số hiện nay, các chuẩn nén phổ biến là Motion JPEG (MJPEG),Wavelet, H.261/ H.263/ H.263+/ H.263++ và MPGE-1/ MPGE-2/ MPGE-
4 Nhìn chung, có hai nhóm tiêu chuẩn chủ yếu: nhóm một gồm định dạngnén MJPEG và Wavelet; và nhóm hai gồm các định dạng chuẩn còn lại.Các thuật toán mã hóa của hai nhóm là tương tự nhau nhưng mục đích củachúng lại khác nhau H.26x series được phát triển cho điện thoại truyềnhình trong khi MPEG series được phát triển chính cho việc quảng bá hìnhảnh chất lượng cao
Trang 12Hình 2.2 Lịch sử và xu hướng phát triển của các chuẩn nén
2.2.1Chuẩn nén MJPEG và Wavelet
Tính chất chung của các ảnh số là tương quan giữa các pixel ở cạnh nhaulớn, điều này dẫn tới dư thừa thông tin để biểu diễn ảnh Việc dư thừathông tin dẫn tới việc mã hoá không tối ưu Do vậy, ta cần tìm phương ánbiểu diễn ảnh với tương quan nhỏ nhất, để giảm thiểu độ dư thừa thông tincủa ảnh Có 2 kiểu dư thừa thông tin như sau:
Dư thừa trong miền không gian: là tương quan giữa khônggian pixel của ảnh (các pixel lân cận của ảnh có giá trị gầngiống nhau, trừ những pixel ở giáp đường biên ảnh)
Dư thừa trong miền tần số: là tương quan giữa những dải màuhoặc các dải phổ khác nhau
Trọng tâm của các nghiên cứu về nén ảnh là giảm bớt một sốbit để biểu diễn ảnh bằng việc loại bỏ dư thừa trong miềnkhông gian và miền tần số càng nhiều càng tốt Các chuẩn nén
Trang 13MJPEG và Wavelet đều tuân theo nguyên tắc tìm ra các phần
tử dư thừa miền không gian (mỗi Frame nén tự động) Trongkhi đó, đặc trưng của các chuẩn nén thuộc nhóm 2 là loại bỏ
dư thừa ở cả miền không gian và miền tần số của ảnh
MJPEG là định dạng nén ảnh lâu đời nhất và đã được dùngphổ biến Khi dùng chuẩn nén MJPEG, ảnh được phân chiathành các khối vuông ảnh, mỗi khối vuông có kích thước 8 x 8pixel và biểu diễn mức xám của 64 điểm ảnh Mã hoá biến đổicosin rời rạc DCT (Discrete Cosin Tranform) trong chuẩn nénnày khai thác sự tương đồng giữa các pixel trong mỗi khối, đểlấy ra các biểu diễn ảnh với tương quan nhỏ Chuỗi biểu diễn
sẽ bị rút ngắn, tuỳ theo mức nén của hệ thống hiện hành vớiqui trình rút ngắn chuỗi biểu diễn Vì vậy, hình ảnh sau khigiải nén thường có nhiều sai lệch so với ảnh gốc
Ở chuẩn nén Wavelet, thay vì mã hoá theo từng khối 8 x 8, việc thựchiện trên toàn bộ bề mặt ảnh, một loạt các bộ phận lọc ở khâu chuyển đổi
sẽ phân tích các dữ kiện về từng điểm ảnh và cho ra một tập các hệ số Dochuẩn Wavelet có tác dụng với toàn bộ bề mặt ảnh, nên các sai lệch ở ảnhgiải nén sẽ khác với MJPEG Hiệu ứng ghép mảnh không xảy đến với ảnhđược quan sát, nhưng độ phân giải hình ảnh giảm cũng như một vài vết mờ
sẽ xuất hiện
Các định dạng Wavelet và MJPEG đều gây ra hiện tượng mất thông tin ởảnh giải nén Sự dư thừa khả năng lưu ảnh ở mắt người cảm thụ khi dùngchuẩn nén Wavelet ít hơn MJPEG 30%
2.2.2Chuẩn nén MPEG-x và H.26x
Trang 14MPEG là tên viết tắt của hội phim ảnh thế giới (The Moving PictureExperts Group) là một sản phẩm nhóm mang tính ISO/IEC được phát triểncho các thiết bị âm thanh và hình ảnh bằng cách nén dữ liệu chuẩn MPEGkhông phải là một công cụ nén đơn lẻ, ưu điểm của ảnh nén dùng MPEG là
ở chỗ MPEG có một tập hợp các công cụ mã hóa chuẩn, chúng có thể kếthợp với nhau một cách linh động để phục vụ cho một loạt các ứng dụngkhác nhau Nguyên lý chung của nén tín hiệu video là loại bỏ sự dư thừa vềkhông gian và sự dư thừa về thời gian, được thực hiện trước hết nhờ sửdụng tính chất giữa các ảnh liên tiếp Chúng ta dùng tính chất này để tạo racác bức ảnh mới nhờ vào thông tin từ những bức ảnh gửi trước đó Do vậy
ở phía bộ mã hóa ta chỉ cần giữ lại những ảnh có sự thay đổi so với ảnhtrước, sau đó ta dùng phương pháp nén về không gian trong những bức ảnhsai khác này Nói một cách cụ thể, nguyên lý chung của các chuẩn nén làphỏng đoán trước chuyển động của các frame ở bộ mã hóa Mỗi frame ở tạimột thời điểm nhất định sẽ có nhiều khả năng giống với các frame đứngngay trước và sau đó Các bộ mã hóa sẽ tiến hành quét lần lượt những phầnnhỏ trong mỗi frame (marco blocks) và phát hiện ra marco block nào khôngthay đổi từ frame này tới frame khác Phía bên thu, tức bộ giải mã đã lưutrữ sẵn những thông tin không thay đổi từ frame này tới frame khác, chúngđược dùng để điền thêm vào vị trí trống trong ảnh được khôi phục
Tuy nhiên, do sự tương đồng giữa các frame là rất lớn, nên sự phát hiện
ra các sai lệch là rất khó Do vậy ảnh khôi phục khó đạt được như ảnh gốc.Điều này đồng nghĩa với việc chất lượng ảnh cũng tương tự như khi dùngchuẩn Wavelet và MJPEG, nhưng dung lượng kênh truyền và không gianlưu trữ của các chuẩn nén H.26x và MPEG-x là nhỏ hơn (ví dụ như khônggian lưu trữ của chuẩn H.263 nhỏ hơn Motion JPEG từ 3 tới 5 lần) Sựkhác biệt giữa các chuẩn nén này (như ở H.26x và MPEG-x) chủ yếu nằm
Trang 15ở khâu tiên đoán các frame mới và cách thức tính toán sai lệch giữa cácframe hiện tại và frame phỏng đoán Chuẩn nén H.26x (gồm các thế hệH.261, H.262 và H.263, ), thường có tốc độ mã hoá tín hiệu thấp hơnMPEG-x (khoảng 1,5 Mbps với độ phân giải hình 352 x 288) do dùng chủyếu trong viễn thông Trong khi đó, chuẩn MPEG-2 dùng cho thị trườnggiải trí có độ phân giải hình cao hơn, và mang lại chất lượng hình ảnh tốt(cao hơn 1,5 Mbps với độ phân giải 352x288 hoặc 6 Mbps cho phân giảihoàn chỉnh).
2.2.3Chuẩn nén MPEG-2
MPEG-2, ra đời năm 1994, là tên của một nhóm các tiêu chuẩn mã hóacho tín hiệu âm thanh và hình ảnh số, được chấp thuận bởi MPEG (MovingPicture Expert Group) và được công bố trong tiêu chuẩn quốc tế ISO/IEC
13818 MPEG-2 thường được sử dụng để mã hóa âm thanh và hình ảnh chocác tín hiệu broadcast bao gồm truyền hình vệ tinh quảng bá trực tiếp vàtruyền hình cáp MPEG-2 với một số sửa đổi cũng là khuôn dạng được sửdụng bởi các phim DVD thương mại tiêu chuẩn
MPEG-2 bao gồm các phần chính sau:
Phần 1 của MPEG-2 tập trung vào cách một hoặc nhiều luồngvideo và audio cũng như kiểu dữ liệu khác có thể kết hợp lạithành 1 hoặc nhiều dòng dữ liệu phù hợp cho việc lưu trữ vàchuyển tải Mục đích chính của phần 1 là định nghĩa cú phápcho việc vận chuyển gói (packet) của các dòng dữ liệu audio
và video và cú pháp cho việc đồng bộ giữa chúng
Phần 2 của MPEG-2 xây dựng dựa vào khả năng nén videođịnh nghĩa bởi chuẩn MPEG-1 Phần này định nghĩa tiều đề và
Trang 16chuỗi bit, như các thuật toán để xử lý video Phần 2 cũng địnhnghĩa các loại profile dùng cho các chức năng khác nhau, từviệc mã hóa dữ liệu tộc độ cao tới việc mã hóa ảnh với các độphân giải màu khác nhau.
Phần 3 trình bày mở rộng đa kênh tương thích ngược củachuẩn audio Mpeg1
Phần 4 và 5 tương ứng với phần 4,5 của MPEG-1 Part 4 địnhnghĩa cấu tạo của hệ thống, hình ảnh và âm thanh và Part 5gồm ví dụ về bộ mã hóa phần mềm ngôn ngữ C và bộ giải mãhình ảnh và âm thanh
Phần 6: Lệnh và điều khiển phương tiện lưu trữ số (DSM-CC)đại diện một tập hợp các giao thức điểu khiển chuỗi bitMPEG-1 và MPEG-2 Một cú pháp cho việc điều khiển đĩatruy nhập ngẫu nhiên kiểu VCR được định nghĩa, bao gồm cáclệnh như dừng hình, tua nhanh, …
Phần 7: Đại diện một khuyến nghị cho thuật toán mã hóaaudio đa kênh không tương thích ngược với khuyến nghịMPEG-1 Do đó phần 7 loại bỏ sự bắt buộc việc tương thíchngược với MPEG-1
Phần 8 giới thiệu video 10-bit ứng dụng cơ bản cho các studioyêu cầu lấy mẫu 10bit Công việc phần 8 bị gián đoạn do thiếu
sự quan tâm công nghiệp
Phần 9 định nghĩa khuyển nghị cho giao diện thời gian thựccho việc chuyển chở tín hiệu điều khiển video theo yêu cầugiữa thiết bị set-top-box và server headend
Trang 17MPEG-2 được dùng để mã hóa hình ảnh động và âm thanh và để tạo ra
ba kiểu khung số liệu (intra frame, forward predictive frame vàbidirectional pridicted frame) có thể được sắp xếp theo một trật tự cụ thểgọi là cấu trúc nhóm các hình ảnh (group of picture, GOP)
Một luồng video MPEG-2 được tạo nên bởi một chuỗi các khung số liệu
mã hóa hình ảnh Có ba cách để mã hóa một hình ảnh là: intra-coded (Ipicture), forward predictive (P picture) và bidirectional predictive (Bpicture) Các hình ảnh của luồng video được phân ra thành một kênh chứathông tin về độ sáng (luminance, còn gọi là kênh Y) và hai kênh thành phầnmàu (chrominance, còn gọi là tín hiệu màu phân biệt Cb và Cr)
MPEG-2 sử dụng các chuẩn mã hóa âm thanh mới, đó là:
Mã hóa tốc độ bít thấp với tần số lấy mẫu giảm đi một nửa(MPEG-1 Layer 1/2/3 LSF)
Mã hóa đa kênh, lên đến 5.1 kênh
MPEG-2 xác định 4 mức rằng buộc thông số mã hóa, gồm độ phân giảikhung, tốc độ khung, tốc độ bit tối đa và kích thước bộ đệm được yêu cầucho mỗi mức Bảng liệt kê các giới hạn trên đối với mỗi mức
Bảng 2.1 Các rằng buộc thông số mã hóa giới hạn trên MPEG-2
Trang 182.2.4Chuẩn nén MPEG-4:
MPEG-4 là một chuẩn nén chính được sử dụng để nén dữ liệu về âmthanh và hình ảnh (audio and visual, AV) Được đưa ra vào năm 1998,MPEG-4 được lựa chọn cho nhóm các tiêu chuẩn hình ảnh và âm thanh.MPEG-4 được ứng dụng cho web, CD, videophone và truyền hình quảngbá
MPEG-4 tiếp thu các đặc điểm của MPEG-1 và MPEG-2 và các chuẩnkhác liên quan và bổ sung thêm các tính năng mới như hỗ trợ VRML cho3D, các file bao gồm các vật thể được định hướng (gồm audio, video vàVRML)
MPEG-4 thực sự là một dạng nén ảnh mang tính đột phá của công nghệnén hình đương đại, thể hiện rõ nét ở những tiêu chuẩn sau:
Áp dụng những tiêu chuẩn có tính mở cao với sự hỗ trợ đắclực từ ngành công nghiệp an ninh và công nghiệp máy tính
Khả năng truyền theo dòng và mạng lưới
Tối thiểu hóa dung lượng kênh truyền và không gian lưu trữtrong khi vẫn giữ được tính trung thực của ảnh
Trang 19Những chuẩn nén MPEG-4 có profile dạng đơn giản chiếm lĩnh đa phầnthị trường MPEG-4 đã được phát triển và hoàn thiện trở thành định dạngnén hình tiên tiến, hoàn hảo, với tiêu chí tập trung phát triển những nhân tốgiúp tăng cường chất lượng hình ảnh, cũng như phục vụ đắc lực cho cácthiết bị giám sát có các frame dạng chữ nhật Mỗi bit stream hiển thị trongđịnh dạng nén MPEG-4 cung cấp một mô tả mang tính phân tầng về hìnhảnh hiển thị Từng lớp dữ liệu được đưa vào luồng bit bởi những mật mãđặc biệt gọi là mật mã khởi nguồn.
2.2.4.1 Phân phối các luồng dữ liệu
Hình 2.3 Mô hình các lớp MPEG-4Việc phân phối một cách đồng bộ các luồng thông tin từ nguồn đến đíchđược xác định dưới dạng lớp đồng bộ (Sync Layer) và một lớp phân phối(Delivery Layer) gồm hai lớp được ghép lại là DMIF Layer và TransMuxLayer
DMIF Layer được điểu khiển bởi giao diện DMIF (Delivery MultimediaIntergration Framework), là giao diện giữa ứng dụng và truyền tải Một ứng
Trang 20dụng đơn lẻ có thể chạy trên các lớp truyền tải khác nhau khi được hỗ trợDMIF.
MPEG-4 DMIF hỗ trợ các chức năng sau:
Là một giao diện ứng dụng trong suốt
Điều khiển việc thiết lập các kênh FlexMux
Sử dụng các mạng đồng nhất giữa các peer tương tác với nhau:
IP, ATM, di động, PSTN, ISDN băng hẹp
Hỗ trợ mạng di động, được phát triển cùng với ITU-T
UserCommands với bản tin xác nhận
Quản lý thông tin MPEG-4 Sync Layer
Lớp “TransMux” cung cấp các dịch vụ truyền tải phù hợp với các yêucầu về QoS Chỉ giao diện đối với lớp này được xác định bởi MPEG-4trong khi các sắp xếp cụ thể của các gói dữ liệu và điều khiển báo hiệu cầnđược tiến hành cùng với các phần chính có tác dụng qua các giao thứctruyền tải tương ứng Bất kì giao thức truyền tải tồn tại thích hợp nào như(RTP)/UDP/IP, (AAL5)/ATM hoặc luồng truyền tải của MPEG-2 qua mộtlớp kết nối thích hợp nào có thể trở thành một ví dụ TransMux đặc trưng
Sử dụng công cụ ghép kênh FlexMux là lựa chọn, lớp này có thể bỏtrống nếu lớp TransMux ở dưới cung cấp toàn bộ các chức năng yêu cầu.Tuy nhiên, lớp đồng bộ (Sync Layer) thì luôn phải tồn tại Chức năng củalớp này như sau:
Nhận dạng các khối truy nhập, truyền tải timestamps và thông tintham chiếu nhịp và nhận dạng dữ liệu mất
Trang 21 Lựa chọn dữ liệu chèn vào từ các luồng sơ cấp khác thành luồngFlexMux
Truyền thông tin điều khiển
Chỉ rõ QoS yêu cầu đối với mỗi luồng sơ cấp và luồng FlexMux
Chuyển các yêu cầu QoS thành các tài nguyên mạng thực tế
Kết hợp các luồng sơ cấp với các đối tượng trung gian
Truyền đi các sắp xếp của các luồng sơ cấp tới kênh FlexMux vàTransMux
2.2.4.2 Hệ thống
MPEG-4 được xác định là công cụ của các thuật toán nén tiên tiến đối vớicác dữ liệu hình ảnh và âm thanh Các luồng dữ liệu (Elementary Streams,ES) là kết quả từ quá trình mã hóa được truyền đi và lưu trữ riêng biệt.Mối quan hệ giữa các thành phần hình ảnh và âm thanh được mô tả thànhhai mức chính:
BIFS (Binary Format for Scenes) mô tả sự sắp xếp về không gian
và thời gian của các đối tượng Người xem có thể có khả năngtương tác với các đối tượng, ví dụ sắp xếp lại chúng trên màn ảnhhoặc thay đổi quan điểm về cách xem trong môi trường 3D
Tại lớp thấp hơn, Object Descriptors (ODs) xác định quan hệ giữaElementary Streams thích hợp với từng đối tượng (ví dụ luồng âmthanh và hình ảnh của một người trong một cuộc hội nghị truyềnhình) ODs cũng cung cấp thêm các thông tin như nhu cầu URL
Trang 22để truy nhập Elementary Stream, các đặc tính của bộ giải mã, vật
sở hữu trí tuệ,
2.2.4.3 MPEG-4 Audio
MPEG-4 Audio tạo điều kiện thuận lợi cho một lượng lớn các ứng dụng
từ các bài diễn thuyết đơn giản đến các hình ảnh đa kênh chất lượng cao, và
từ các âm thanh tự nhiên đến các âm thanh tổng hợp Đặc biệt, MPEG-4 hỗtrợ các biểu diễn hiệu suất cao của các đối tượng hình ảnh bao gồm:
Các tín hiệu hình ảnh thông thường: Hỗ trợ cho việc mã hóa hìnhảnh thông thường từ chất lượng thấp đến cao được cung cấp bởi
kĩ thuật mã hóa biến đổi Với chức năng này, một dải rộng các bít
và băng tần được bao phủ Bắt đầu tại tốc độ bít 6 kbit/s và băngtần dưới 4kHz và mở rộng tới hình ảnh chất lượng quảng bá từđơn tới đa kênh Chất lượng cao có thể đạt được với độ trễ thấp
Mã hóa hình ảnh tham số (Parametric Audio Coding) cho phép
âm thanh với tốc độ thấp
Các tín hiệu thoại: Mã hóa thoại được tiến hành sử dụng tốc độ từ2kbit/s tới 24 kbit/s sử dụng công cụ mã hóa thoại Tốc độ bítthấp hơn, ví dụ 1,2 kbit/s, cũng có thể khi mã hóa tốc độ thay đổiđược cho phép Khi sử dụng công cụ HVXC, tốc độ và cường độ
có thể được thay đổi dưới sự điều khiển của người sử dụng trongkhi phát lại Nếu công cụ CELP được sử dụng, việc thay đổi tốc
độ phát lại có thể đạt được bằng cách sử dụng và thêm vào cáccông cụ để việc xử lí được hiệu quả
Trang 232.2.4.4 MPEG-4 Visual
MPEG-4 Visual tiêu chuẩn cho phép mã hóa lai ghép các hình ảnh tựnhiên (căn cứ vào pixel) và các cảnh nhân tạo (lấy ra từ máy tính) Dướiđây là tổng quan về các công cụ và thuật toán của chuẩn hình ảnh MPEG-4
Các định dạng được hỗ trợ bởi MPEG-4 Visual:
Tốc độ bít: từ 5kbit/s đến lớn hơn 1 Gbit/s
Các định dạng: phát triển không ngừng cũng như các hình ảnhkết hợp chặt chẽ với nhau
Giải pháp: điển hình từ sub-QCIF tới giải pháp ‘Studio’ (4k x4k pixels)
Hiệu quả nén
Đối với toàn bộ các tốc độ bít được đánh địa chỉ, thuật toánnày rất hiệu quả Thuật toán này bao gồm việc kết hợp mã hóavới chất lượng được điều chỉnh giữa “khả năng chấp nhận” đốivới tốc độ nén cao với “near lossless’
Nén hiệu quả đối với mạng lưới 2-D và 3-D
Truyền hình truy nhập ngẫu nhiên cho phép các chức năngnhư tạm dừng, chuyển đổi nhanh của các chương trình truyềnhình được lưu trữ
Các chức năng Content-Based
Mã hóa Content-based hình ảnh và video cho phép tách biệtviệc giải mã và tái thiết lại các đối tượng video được địnhdạng riêng
Trang 24 Truy nhập ngẫu nhiên nội dung các video cho phép các chứcnăng như tạm dừng, chyển đổi nhanh các chương trình truyềnhình được lưu trữ.
Nhân mở rộng nội dung các chương trình truyền hình chophép các chức năng như làm thay đổi các text nhân tạo hay tựnhiên, bố cục, hình ảnh và chương trình truyền hình bao phủnội dung truyền hình được thay đổi
Tính linh động cao về text, hình ảnh và video
Tính linh động và đa dạng của bộ mã hóa cho phép mã hóa cácluồng bít phức tạp khác nhau đối với một tex, hình ảnh hoặcvideo
Tính linh động và đa dạng của bộ giải mã các luồng bít text,hình ảnh hoặc video được giải mã bởi bộ giải mã tại các mức
độ phức tạp khác nhau Nhìn chung chất lượng khôi phục lạiliên quan đến độ phức tạp của bộ giải mã được sử dụng
Tính linh động về không gian cho phép bộ giải mã giải mãmột tập hợp của toàn bộ luồng bít được phát ra bởi bộ mã hóa
để khôi phục lại và hiển thị các tex, hình ảnh và video
Tính linh động về thời gian cho phép bộ giải mã giải mã mộttập hợp của toàn bộ luồng bít được phát ra bởi bộ mã hóa đểkhôi phục lại và hiển thị video
Tính linh động về chất lượng cho phép một luồng bít đượcphân tích thành một số các lớp luồng bít có tốc độ bít khácnhau ví dụ như sự kết hợp của một tập hợp các lớp vẫn có thể
Trang 25được giải mã thành một tín hiệu có nghĩa Việc phân tíchluồng bít có thể xảy ra trong quá trình truyền dẫn hoặc giải
mã Nhìn chung chất lượng khôi phục lại liên quan đến sốlượng lớp được sử dụng để giải mã và khôi phục
2.2.5 Chuẩn nén H.264/MPEG-4 Part 10/AVC
H.264 là tiêu chuẩn nén hình ảnh, được biết đến như MPEG-4 Part 10hoặc AVC (Advanced Video Coding) Phiên bản đầu tiên của H.264/AVCđược hoàn thiện vào tháng 5/2003 H.264/AVC tạo ra một tiêu chuẩn cókhả năng cung cấp chất lượng hình ảnh tốt tại tốc độ bít thấp hơn các tiêuchuẩn trước đó như MPEG-2, H.263, hoặc MPEG-4 mà không cần tăng độphức tạp về cấu trúc Hơn nữa tiêu chuẩn này được áp dụng cho các ứngdụng trên các hệ thống và mạng đa chủng loại, gồm tốc độ bít cao và thấp,lưu trữ DVD, quảng bá, hình ảnh với độ phân giải thấp và cao, các mạnggói RTP/IP, và các hệ thống điện thoại đa phương tiện ITU-T
H.264 được đặt tên theo dòng tiêu chuẩn H.26x của ITU-T, trong khiAVC theo phía ISO/IEC MPEG Mục đích của H.264 là tạo ra một chuẩn
có khả năng cung cấp chất lượng video cao ở tốc độ bit thấp hơn hẳn (bằngmột nửa hoặc thấp hơn nữa) so với yêu cầu của các chuẩn trước đó(MPEG-2, H.263 hay MPEG-2 Part 2) mà không làm tăng nhiều sự phứctạp trong thiết triển khai Một mục tiêu khác đó là cho phép tiêu chuẩnđược áp dụng cho nhiều kiểu ứng dụng (cho cả tốc độ bit thấp và cao, và cả
độ phân giải video thấp và cao) và có thể làm việc tốt trên nhiều kiểu mạng
và hệ thống (quảng bá, lưu trữ DVD, mạng gói RTP/IP, các hệ thống điệnthoại đa phương tiện của ITU-T)
JVT gần đây đã hoàn thiện việc phát triển một số mở rộng so với chuẩnban đầu, được biết đến với tên gọi Mở rộng phạm vi độ trung thực (Fidelity
Trang 26Range Extensions, FRExt) Các mở rộng này hỗ trợ mã hóa video trungthực cao bằng cách tăng độ chính xác lấy mẫu (bao gồm mã hóa 10 bit và
12 bit) và thông tin mầu sắc độ phân giải cao (bao gồm các cấu trúc lấymẫu YUV 4:2:2 và YUV 4:4:4) Nhiều đặc điểm khác cũng được thêm vàotrong các mở rộng FRExt như chuyển đổi thích ứng giữa các khối 4x4 và8x8, các ma trận trọng số lượng tử hóa dựa trên cảm biến của các bộ mãhóa cụ thể, hỗ trợ thêm nhiều không gian mầu sắc,
Một số tính năng mới của H.264/MPEG-4 Part 10 cho phép chuẩn nàynén các tín hiệu video hiệu quả hơn so với các chuẩn cũ và và linh hoạt hơncho các ứng dụng trong các môi trường mạng Một số các tính năng quantrọng đó là:
Bù chuyển động đa hình sử dụng các hình ảnh đã được mã hóatrước đó làm tham chiếu theo cách linh hoạt hơn các chuẩn cũ,cho phép lên tới 32 hình ảnh tham chiếu được sử dụng (cácchuẩn cũ chỉ sử dụng 1, hoặc 2 với trường hợp B picture).Tính năng đặc biệt này cho phép cải thiện tốc độ bit và chấtlượng trong hầu hết các trường hợp
Bù chuyển động block có kích thước biến đổi với kích thướcblock rộng đến 16x16 và nhỏ đến 4x4, cho phép phân mảnhchính xác các vùng chuyển động
Cấu trúc cặp macroblock, cho phép các macroblock kíchthước 16x16 (so với 16x8 ở MPEG-2)
Độ chính xác bù chuyển động lên đến 1/4 pixel, cho phép thểhiện chính xác các dịch chuyển của vùng chuyển động
Trang 27 Đánh số khung, cho phép tạo ra các chuỗi con (điều chỉnh vềthời gian bằng cách gộp một ảnh giữa các ảnh khác), phát hiện
và giấu các hình bị mất (xảy ra do mất gói trên mạng hoặc lỗikênh)
Đếm thứ tự hình, cho phép giữ các hình và các giá trị mẫutheo trật tự trong các hình được giải mã tách biệt với thông tinđịnh thời (cho phép thông tin định thời được chuyển đi và điềukhiển độc lập bởi hệ thống mà không ảnh hưởng đến nội dunghình ảnh được giải mã)
Các kỹ thuật này, cùng với nhiều kỹ thuật khác, làm cho H.264 hoạtđộng tốt hơn so với các tiêu chuẩn trước, trong nhiều trường hợp và môitrường ứng dụng khác nhau H.264 thường làm việc tốt hơn rất nhiều so vớiMPEG-2, cho chất lượng tốt hơn ở tốc độ bít chỉ bằng một nửa hoặc thấphơn so với yêu cầu của MPEG-2 H.264 cung cấp các profile sau:
Baseline profile (BP): Dùng cho các ứng dụng chi phí thấpđòi hỏi ít tài nguyên hơn, chủ yếu dùng cho các ứng dung hộinghị truyền hình và di động
Main Profile (MP): Dùng cho các ứng dụng quảng bá và lưutrữ
Extended profile (XP): Có khả năng nén khá cao, giảm thiểukhả năng mất dữ liệu
High Profile (HiP): Dùng cho các ứng dụng quảng bá và lưutrữ đĩa, đặc biệt cho các ứng dụng truyền hình yêu cầu độ nétcao (HD-DVD, Bluray disc)
Trang 28 High 10 Profile (Hi10P): Được xây dựng bên trên của HiP, hỗtrợ độ 10 bit trên một mẫu của độ chính xác của hình ảnh đượcgiải mã.
High 4:2:2 Profile (Hi422P): dùng cho các ứng dụng chuyênnghiệp sử dụng video quét xen kẽ, được xây dựng bên trên củaHi10P, hỗ trợ khuôn dạng lấy mẫu sắc độ 4:2:2 trong khi sửdụng 10 bit trên một mẫu của độ chính xác của hình ảnh đượcgiải mã
High 4:4:4 Profile (Hi444P): được xây dựng bên trên củaHi422P, hỗ trợ lấy mẫu sắc độ 4:4:4, lên đến 12 bit trên mộtmẫu
MPEG đã tích hợp đầy đủ các hỗ trợ của H.264/AVC vào các hệ thốngtiêu chuẩn của mình (MPEG-2 và MPEG-4) và các tập tin đa phương tiệntheo tiêu chuẩn ISO
ITU-T đã đưa H.264/AVC vào bộ tiêu chuẩn H.32x cho hệ thống điệnthoại đa phương tiện Dựa trên các tiêu chuẩn ITU-T, H.264/AVC được sửdụng rộng rãi cho ứng dụng hội nghị truyền hình, và đã được ứng dụngtrong các sản phẩm của các công ty chiếm ưu thế trên thị trường (nhưPolycom và Tendberg) Điều quan trọng hơn cả là tất cả các sản phẩm hộinghị truyền hình mới đều hỗ trợ H.264/AVC
H.264 cũng được sử dụng trong nhiều loại dịch vụ Video-on-Demandtrên Internet để cung cấp phim và các show diễn truyền hình trực tiếp đếnmáy tính và máy thu hình và có khả năng sẽ thay thế chuẩn mã hóa H.262/MPEG-2 hiện tại đang sử dụng trong các hệ thống truyền hình số quảng bámặt đất và vệ tinh
Trang 29Yêu cầu về băng thông của các chuẩn nén:
So sánh hoạt động của chuẩn nén khác nhau như trong đồ thịdưới đây:
Có thể thấy được từ đồ thị so sánh ở trên, kỹ thuật mã hóaH.264 rất hiệu quả ở dải băng thông thấp Chất lượng videocủa chuẩn H.264 tại băng thông 1,5 Mbps tốt hơn so với chuẩnMPEG-2 ở băng thông 3 Mbps Sử dụng chuẩn nén H.264 cóthể tiết kiệm được hơn một nửa băng thông
Các lợi ích của H.264/AVC:
Hiệu quả nén gấp đôi, tốc độ nén bằng một nửa so với chuẩnMPEG-2 yêu cầu đối với hình ảnh chất lượng cao và giảmđược được dung lượng lưu trữ cần thiết
Cho phép nhiều nội dung hơn được truyền đi trên hệ thống cósẵn với tốc độ bít thấp hơn
Chi phí truyền dẫn thấp hơn do thời gian truyền giảm một nửa
Chi phí triển khai thấp hơn với công nghệ H.264/AVC xâydựng trên nền tảng tiêu chuẩn, phần cứng xử lí không độcquyền
Kết hợp hợp với một lớp thích ứng mạng (Network AdaptationLayer) để cung cấp một cách linh hoạt khả năng truyền tải quamạng chuyển mạch gói và luồng bít, cho phép nâng cấp mộtcách dễ dàng các giải pháp phân phối dựa trên MPEG-2
Trang 30 Sử dụng một thiết lập chung về công nghệ giữa mobile vàIPTV: luồng TCP/UDP + H.264/AVC.
Bảng 2.2 Yêu cầu về băng thông đối với các chuẩn nén
Độ nét tiêu chuẩn Độ nét cao Ứng dụng
MPEG-1 Lên đến 1,5 Mbps - Video on Internet,MP3MPEG-2 4 - 5 Mbps 18 - 20 Mbps Digital TV, DVD MPEG-4 Part 10; H.264 2 - 4 Mbps 8 - 10 Mbps Multi video
Tempete CIF 30Hz
25 26 27 28 29 30 31 32 33 34 35 36 37 38
25 26 27 28 29 30 31 32 33 34 35 36 37 38
Hình 2.4 So sánh hoạt động của các chuẩn nén
Trang 31Hình 2.5 So sánh về yêu cầu băng thông, lưu trữ và thời gian tải của các
chuẩn nén
2.3 Giao thức mạng
Dịch vụ IPTV bao gồm cả truyền hình trực tiếp (live TV) và truyền hìnhđược lưu trữ sẵn (Video on Demand) Việc xem truyền hình qua IPTV cầnmột máy tính hoặc thiết bị “set-top-box” được kết nối tới TV Các nội dungtruyền hình được nén sử dụng chuẩn MPEG-2 hoặc MPEG-4 và được gửi
đi dưới dạng luồng truyền tải MPEG qua IP Multicast trong trường hợptruyền hình trực tiếp hoặc qua IP Unicast trong trường hợp truyền hình theoyêu cầu IP Multicast là phương pháp mà thông tin được truyền đến cácmáy tính trong cùng thời điểm
Hình 2.6 So sánh các phương thức truyền/phát dịch vụ IPTV tới khách
hàngMột hệ thống IPTV tiêu chuẩn thường sử dụng các giao thức cơ bản sau:
Truyền hình trực tiếp sử dụng giao thức IGMP version 2 đểkết nối tới một luồng multicast (TV channel) hoặc dùng đểchuyển các kênh truyền hình
VoD sử dụng Real Time Streaming Protocol (RTSP)
Trang 32 NPRV (Network-based Private Video Recorder)
Multicast, còn được gọi là multiplex broadcast, là cách truyền thông tintới một nhóm các đích đến một cách đồng thời sử dụng một phương pháphiệu quả để truyền các bản tin trên mỗi kết nối của mạng chỉ một lần và chỉtạo ra các bản sao khi các kết nối đến các đích đến rẽ nhánh
Thuật ngữ Multicast thường được sử dụng để ám chỉ đến IP Multicast,vốn là một giao thức được sử dụng để truyền một cách hiệu quả số liệu đếnnhiều người nhận cùng một lúc trên các mạng sử dụng giao thức TCP/IPbằng cách sử dụng một địa chỉ multicast IP Multicast thường có liên quanđến các giao thức audio/video như RTP
Có nhiều kỹ thuật Multicast được sử dụng trên Internet Trong khi IPMulticast sử dụng lớp địa chỉ multicast (Class D) thì Explicit multicast (còngọi là Xcast) lại sử dụng các địa chỉ unicast của tất cả các đích đến thay vìcác địa chỉ multicast được ấn định Do kích thước gói IP nhìn chung bị giớihạn, Explicit multicast không thể được sử dụng cho các nhóm với số lượnglớn các địa chỉ multicast
Mô hình IP Multicast đòi hỏi phải giải quyết nhiều trạng thái bên trongmạng hơn so với mô hình IP unicast Và cũng chưa có một cơ chế nàochứng tỏ được sẽ cho phép mô hình IP multicast có thể mở rộng với hàngtriệu người gửi và hàng triệu nhóm multicast, do đó không thể tạo ra cácứng dụng multicast hoàn toàn dụng thực tế thương mại trên Internet Kể từ
2003, những nỗ lực mở rộng multicast đến các mạng lớn đã tập trung vàomột trường hợp multicast một nguồn đơn giản hơn và dễ kiểm soát hơn
Ưu điểm của Multicast:
Trang 33 Sử dụng băng thông của mạng hiệu quả so với unicast - vớiunicast, tổng dung lượng băng thông tăng tuyến tính với sốthuê bao.
Yêu cầu sử dụng máy chủ là tối thiểu so với unicast - vớiunicast, kết nối của mỗi khách hàng yêu cầu một luồng riêng;với IP Multicast, chỉ có một luồng được gửi ra từ máy chủ
Yêu cầu sử dụng mạng là tối thiểu - đây là hiệu quả của việc
sử dụng IP Multicast
Nhược điểm của Multicast:
Phân phát gói thiếu độ tin cậy - do IP Multicast sử dụng UDPlàm giao thức truyền tải nên nó kế thừa sự thiếu tin cậy củaUDP
Khả năng lặp gói trên mạng - trong khi một giao thức địnhtuyến IP Multicast hội tụ, có khả năng nhiều bản sao của mộtgói multicast sẽ đến khách hàng
Không có khả năng tránh tắc nghẽn - do IP Multicast sử dụngUDP làm giao thức truyền tải nên nó không có các cơ chếquay lui (backoff) và cửa sổ (window) của TCP
So với unicast, multicast là phương thức truyền sử dụng ít băng thôngcủa mạng hơn Một ứng dụng unicast sẽ gửi một bản copy của mọi gói dữliệu đến mọi người nhận Ngược lại, multicast chỉ gửi một bản copy tớinhững người dùng muốn nhận Đây là phương thức thường được sử dụngnhất cho hội nghị video và Video-on-Demand hiện nay Đồ thị dưới đây so
Trang 34sánh lưu lượng sử dụng giữa multicast và unicast dùng cho audio streaming
và mọi người dùng đều nghe nhạc ở cùng tốc độ 8 Kbps
Một số cộng đồng trong mạng Internet công cộng vẫn thường sử dụng IPMulticast và IP Multicast được sử dụng cho nhiều ứng dụng đặc biệt bêntrong mạng IP dùng riêng (private IP network) Các giao thức IP Multicast:
Internet Group Management Protocol (IGMP)
Protocol Independent Multicast (PIM)
Distance Vector Multicast Routing Protocol (DVMRP)
Multicast OSPF (MOSPF)
Multicast BGP (MBGP)
Multicast Source Discovery Protocol (MSDP)
Multicast Listener Discovery (MLD)
GARP Multicast Registration Protocol (GMRP)
Hình 2.7 So sánh lưu lượng sử dụng giữa Unicast và Multicast
Trang 35IGMP (Internet Group Management Protocol) là giao thức truyền thông
để thông báo cho các bộ định tuyến hướng lên rằng một host muốn nhậnmột luồng multicast Một host trở thành một thành viên của một nhómmulticast (được định nghĩa bởi một địa chỉ IP Class D 224.0.0.0 đến239.255.255.255) cùng với các thiết bị thu khác Đây là một cơ chế kháccủa các cơ chế MPR (Multicast Routing Protocol) chỉ chạy trên các thiết bịđịnh tuyến Nói cách khác khi một host chỉ ra rằng nó muốn nhận mộtluồng multicast, tùy vào mạng các thiết bị định tuyến để quyết dịnh xử lýnhư thế nào và kết quả luôn là host sẽ nhận được một luồng
IGMP sử dụng hai bản tin cơ sở cho các hoạt động tiêu chuẩn: cácReport và Query, các host gửi các Report để gia nhập hoặc rời khỏi mộtnhóm Một host nhận Query từ một thiết bị định tuyến nếu thiết bị đómuốn, cho dù host có muốn là thành viên của một nhóm multicast haykhông
Các giao thức định tuyến Multicast: Có hai kiểu giao thức định tuyến IPMulticast cơ bản là Dense Mode, Spare Mode
Dense Mode: sử dụng phương thức ”flood and prune”, nghĩa
là khi một luồng multicast đi vào mạng, nó ngay lập tức đượcđẩy đến tất cả các điểm trên mạng cho đến khi các thiết bị địnhtuyến không có các mạng con, các thiết bị thu cắt bớt cácnhánh của cây phân phối Quá trình được lặp lại cứ sau mỗikhoảng thời gian 2 - 3 phút, dẫn đến sự không hiệu quả do cácmạng con không cần phải liên tục nhận luồng đó Mode nàychỉ tốt cho các triển khai trên phạm vi nhỏ, với số chặng tốithiểu để hạn chế sự không hiệu quả của giao thức
Trang 36 Spare Mode: sử dụng cơ chế kéo (pull), nghĩa là mỗi thiết bịđịnh tuyến mong muốn phải gia nhập một cây phân phốimulticast (ngược lại so với các giao thức Dense Mode) SpareMode cũng sử dụng cơ chế cây dùng chung, ở đó nhiều nguồnmulticast có thể sử dụng cùng một cây phân phối Điều nàyđược thực hiện bằng cách ấn định một thiết bị định tuyến nhưmột điểm gốc (RP) phục vụ ở đỉnh của cây phân phối Cácnguồn có thể gửi lưu lượng đến cây dùng chung, do đó tăngđược hiệu quả tổng thể và yêu cầu duy trì ít trạng thái hơn trênthiết bị định tuyến Mode này tốt cho việc triển khai nhiềunguồn vì nó sử dụng các cây dùng chung Mode này cũng tốtcho việc triển khai trên phạm vi rộng hơn với các cây có tớihai hay nhiều mức sâu hơn.
2.4 Kiến trúc mạng truyền tải hệ thống IPTV
Hình vẽ sau mô tả chi tiết các lớp truyền tải, tập trung và phân bổ củakiến trúc truyền tải hệ thống IPTV:
Trang 37Hình 2.8 Kiến trúc mạng truyền tải hệ thống IPTVKiến trúc mạng truyền tải hệ thống IPTV cung cấp các yêu cầu chứcnăng và các khuyến nghị về cấu hình đối với mỗi node chuyển mạch trênđường truyền từ các server VoD tới các Set Top Box.
2.4.1Video Sites
2.4.1.1 Super Headend
Super headend (SHE) là nơi đặt các đường truyền trực tiếp đối với dịch
vụ video băng rộng SHE gồm các bộ mã hóa thời gian thực được sử dụngcho dịch vụ video băng rộng, cùng với các hệ thống phân phối đối với cácdịch vụ theo yêu cầu Tại SHE cũng có thể bao gồm các hệ thống back-office như cơ sở dữ liệu thuê bao Hầu hết các hệ thống IPTV chỉ gồm một
hệ thống SHE, đây là nguồn dữ liệu của hầu hết các luồng truyền đa hướngđối với dịch vụ video băng rộng SHE thường nằm ở lõi của mạng truyềntải
2.4.1.2 Video Headend Office
Video Headend Office (VHO) là nơi đặt các server video phức tạp VHO
là nơi đặt phần lớn các video pumps được sử dụng cho các dịch vụ theo yêucầu Đây cũng là nơi đặt các bộ mã hóa thời gian thực cho các trạm truyềnhình nội vùng Một hệ thống VHO thông thường phục vụ cho một vùngdân cư từ 100.000 đến 1.000.000 hộ Việc truyền tải lưu lượng video giữaVHO và mạng lõi IP/MPLS được hỗ trợ bởi một bộ định tuyến biên phânphối (DER) DER liên kết mạng lõi và các nguồn video nội vùng tới mạngphân bố băng thông cao, mạng này truyền cả video băng rộng và video theoyêu cầu tới các VSO
Trang 382.4.1.3 Video Switching Office
Video Switching Office (VSO) gồm các thiết bị định tuyến tập trung đểtập trung các GE DSLAM nội vùng hoặc ở xa VSO thường được đặt tạitrạm chuyển mạch trung tâm Trạm chuyển mạch trung tâm này là điểm kếtcuối vật lý cho hầu hết các mạch vòng cáp đồng thuộc vùng quản lý của nó
Vì ADSl và ADSL 2+ dựa vào độ dài vòng ngắn để thu được tốc độtraining tối đa, các mạch vòng cáp đồng được sử dụng cho dịch vụ DSLthường được kết cuối tại nơi gần thuê bao hơn so với VSO Các thiết bịchuyển mạch tại VSO liên kết lại các mạng tập trung và phân phối Lưulượng tới và đi từ DSLAM được tập trung bởi bộ định tuyến tập trung(AR) AR được đặt tại giữa và cuối của VSO
Để tối thiếu hóa các yêu cầu về băng tần giữa VSO và VHO, một VSO
có thể bao gồm các video pump nội vùng được sử dụng để lưu trữ nội dungtheo yêu cầu
2.4.2Các yêu cầu về dịch vụ Video
2.4.2.1 Băng tần cao
Khối lượng băng thông mà một mạng có khả năng truyền tải để cung cấpcác dịch vụ video được yêu cầu cao hơn so với các dịch vụ thoại và truynhập Internet Một luồng video IP tiêu chuẩn được mang như một luồngMPEG-2 SPTS qua RTP dùng khoảng 3,75 Mbps của băng tần Một luồngvideo IP tốc độ cao dùng cùng chuẩn nén và truyền tải sử dụng từ 16 đến
18 Mbps của băng tần