Giới thiệu về truyền hình số theo giao thức IP
Trang 1Mở đầu
Sự phát triển của mạng Internet toàn cầu nói riêng và công nghệ thôngtin nói chung đã đem lại tiến bộ và phát triển vượt bậc của khoa học kĩ thuật.Internet không những đã rút ngắn khoảng cách về không gian, thời gian màcòn mạng lại cho mọi người, mọi quốc gia và cả thế giới những lợi ích to lớn.Tốc độ phát triển nhanh chóng của công nghệ thông tin là một trong những lợiích to lớn, có vai trò quan trọng và tầm ảnh hưởng rộng khắp
Với sự phát triển nhanh chóng của mạng Internet băng rộng còn làmthay đổi cả về nội dung và kĩ thuật truyền hình Hiện nay truyền hình có nhiềudạng khác nhau: truyền hình số, truyền hình vệ tinh, truyền hình cáp, truyềnhình Internet và IPTV IPTV đang là cấp độ cao nhất và là công nghệ truyềnhình của tương lai Sự vượt trội trong kĩ thuật truyền hình của IPTV là tínhnăng tương tác giữa hệ thồng với người xem, cho phép người xem chủ động
về thời gian và khả năng triển khai nhiều dịch vụ giá trị gia tăng tiện ích kháctrên hệ thồng nhằm đáp ứng nhu cầu của người sử dụng
Hiện nay trên thế giới đã có một số quốc gia triển khai thành công IPTV.Theo các chuyên gia dự báo thì tốc độ phát triển thuê bao IPTV sẽ tăng theocấp số nhân theo từng năm Ở Việt Nam hiện nay, một số nhà cung cấp đangthử nghiệm dịch vụ IPTV trên mạng băng rộng ADSL
Trang 2CHƯƠNG 1 TỔNG QUAN VỀ IPTV
1.1 Giới thiệu về truyền hình số theo giao thức IP:
IPTV là tên viết tắt của cụm từ Internet Protocol Television _ truyền hìnhqua giao thức Internet
ITPV theo định nghĩa chính thức như sau: IPTV được định nghĩa là cácdịch vụ đa phương tiện như truyền hình ảnh, tiến nói, văn bản, dữ liệu đượcphân phối qua các mạng dựa trên IP mà được quan lý để cung cấp các cấp
chất lượng dịch vụ, bảo mật, tính tương tác, tính tin cậy theo yêu cầu (theo ITU – T FG IPTV)
Như vậy IPTV đóng vai trò phân phối các dữ liệu, kể cả hình ảnh, âmthanh, văn bản qua mạng sử dụng giao thức Internet Điều này nhấn mạnhvào việc Internet không đóng vai trò chính trong việc truyền tải thông tin truyềnhình hay bất kì loại nội dung truyền hình nào khác Thay vào đó, IPTV sửdụng IP là cơ chế phân phối mà theo đó có thể sử dụng Internet, đại diện chomạng công cộng dựa trên IP, hay có thể sử dụng mạng riêng dựa trên IP
Có thể thấy, IPTV là một dịch vụ số mà có khả năng cung cấp nhữngtính năng vượt trội hơn khả năng của bất kì cơ chế phân phối truyền hình nàokhác Ví dụ, set – top box IPTV có thể thông qua phần mềm để cho phép xemđồng thời 4 chương trình truyền hình trên màn hiển thị, hay có thể nhận tinnhắn sms, e – mail…
Tiềm năng của IPTV là rất lớn Dự đoán rằng, năm 2008 sẽ có khoảng
20 triệu gia đình sử dụng dịch vụ IPTV Nếu chúng ta trả phí 50$ mỗi thángcho dịch vụ IPTV, để cả một set – top box, thì ngân sách sẽ thu về khoảng 12
tỉ $ một năm trong vài năm
1.2 Một số đặc tính IPTV:
- Hỗ trợ truyền hình tương tác: Khả năng hai chiều của hệ thốngIPTV cho phép nhà cung cấp dịch vụ phân phối toàn bộ các ứng dụng TVtương tác Các loại dịch vụ được truyền tải thông qua một dịch vụ IPTV có thểbao gồm TV trực tiếp chuẩn, TV chất lượng cao (HDTV), trò chơi tương tác,
và khả năng duyệt Internet tốc độ cao
Trang 3- Sự dịch thời gian: IPTV kết hợp với một máy ghi video kĩ thuật sốcho phép dịch thời gian nội dung chương trình – một cơ chế cho việc ghi vàlưu trữ nội dung IPTV để xem sau.
- Cá nhân hóa: Một thệ thống IPTV từ kết cuối đến kết cuối hỗ trợtruyền thông tin hai chiều và cho phép người dùng ở kết cuối cá nhân hóanhững thói quen xem TV của họ bằng cách cho phép họ quyết định những gì
họ muốn xem và khi nào họ muốn xem
- Yêu cầu về băng thông thấp: Thay vì phân phối trên mọi kênh đểtới mọi người dùng, công nghệ IPTV cho phép nhà cung cấp dịch vụ chỉtruyền trên một kênh mà người dùng yêu cầu Đặc điểm hấp dẫn này chophép nhà điều hành mạng có thể tiết kiệm băng thông của mạng
- Có thể truy xuất qua nhiều thiết bị: Việc xem nội dung IPTV bâygiờ không chỉ giới hạn ở việc sử dụng TV Người dùng có thể sử dụng máy
PC hay thiết bị di động để truy xuất vào các dịch vụ IPTV
1.3 Sự khác biệt giữa IPTV và truyền hình Internet:
Do đều được truyền trên mạng dựa trên giao thức IP, người ta đôi lúc haynhầm IPTV là truyền hình Internet Tuy nhiên, 2 dịch vụ này có nhiều điểm khácnhau:
Trang 4chuyển trong các mạng khác nhau tạo nên mạng Internet công cộng Do đó, nhà cung cấp các dịch vụ truyền nhình ảnh qua mạng Internet không đảm bảo chất lượng truyền hình như với truyền hình mặt đất, truyền hình cáp hay truyền hình
vệ tinh Thực tế là các nội dung video truyền qua mạng Internet khi hiển thị trên màn hình TV có thể bị giật và chất lượng hình ảnh thấp
Trong khi, IPTV chỉ được phân phối qua một hạ tầng mạng của nhà cung cấp dịch vụ Do đó người vận hành mạng có thể điều chỉnh để có thể cung cấp hình ảnh với chất lượng cao
Cơ chế truy cập
Một set-top box số thường được sử dụng để truy cập và giải mã nôi j dungviedeo được phân phát qua hệ thống IPTV , trong khi PC thương được sử dụng đểtruy cập các dịch vụ Internet Các loại phần mềm được sử dụng trong PC thườngphụ thuộc vào loại nội dung truyền hình Internet Ví dụ như, để download cácchương trình TV từ trên mạng Internet, đôi khi cần phải cài đặt các phần mềmmedia cần thiết để xem được nội dung đó Hay hệ thống quản lí bản quyền cũngcần để hỗ trợ cơ chế truy cập
1.4 Cơ sở hạ tầng một mạng IPTV
Trang 5Hình 1.1 Sơ đồ khối đơn giản của một hệ thống IPTV
Trung tâm dữ liệu IPTV:
Cũng được biết đến là “đầu cuối_headend” Trung tâm dữ liệu IPTVnhân nội dung từ nhiều nguồn khác nhau, bao gồm truyền hình địa phương,các nhà tập hợp nội dung, nhà sàn xuất, qua đường cáp, trạm số mặt đất hay
vệ tinh Ngay khi nhận được nội dung, một số các thành phần phần cứng khácnhau từ thiết bị mã hóa và các máy chủ video tới bộ định tuyến IP và thiết bịbảo mật giành riêng được sử dụng để chuẩn bị nội dung video cho việc phânphối qua mạng dựa trên IP Thêm vào đó, hệ thống quản lý thuê bao đượcyêu cầu để quản lý và hồ sơ và phí thuê bao của những người sử dụng Chú ýrằng, địa điểm thực của trung tâm dữ liệu IPTV được yêu cầu bởi hạ tầng cơ
sở mạng được sử dụng bởi nhà cung cấp dịch vụ
Mạng truyền dẫn băng thông rộng:
Việc truyền dẫn dịch vụ IPTV yêu cầu kết nối điểm – điểm Trongtrường hợp triển khai IPTV trên diện rộng, số lượng các kết nối điểm – điểmtăng đáng kể và yêu cầu độ rộng băng thông của cơ sở hạ tầng khá rộng Sựtiến bộ trong công nghệ mạng trong những năm qua cho phép những nhàcung cấp viễn thông thỏa mãn một lượng lớn yêu cầu độ rộng băng thôngmạng Hạ tầng truyền hình cáp dựa trên cáp đồng trục lai cáp quang và cácmạng viễn thông dựa trên cáp quang rất phù hợp để truyền tải nội dung IPTV
Thiết bị người dùng IPTV:
Thiết bị người dùng IPTV (IPTVCD) là thành phần quan trọng trong việccho phép mọi người có thể truy xuất vào các dịch vụ IPTV Thiết bị này kết nốivào mạng băng rộng và có nhiệm vụ giải mã và xử lý dữ liệu video dựa trên IPgửi đến Thiết bị người dùng hỗ trợ công nghệ tiên tiến để có thể tối thiểu hóahay loại bỏ hoàn toàn ảnh hưởng của lỗi, sự cố mạng khi đang xử lý nội dungIPTV
Mạng gia đình:
Mạng gia đình kết nối với một số thiết bị kĩ thuật số bên trong một diệntích nhỏ Nó cải tiến việc truyền thông và cho phép chia sẻ tài nguyên (cácthiết bị) kĩ thuật số đắt tiền giữa các thành viên trong gia đình Mục đích củamạng gia đình là để cung cấp việc truy cập thông tin, như là tiếng nói, âmthanh, dữ liệu, giải trí, giữa những thiết bị khác nhau trong nhà Với mạng giađình, người dùng có thể tiết kiệm tiền và thời gian bởi vì các thiết bị ngoại vi
Trang 6như là máy in và máy scan, cũng như kết nối Internet băng rộng, có thể đượcchia sẻ một cách dễ dàng
1.5 Ưu điểm của IP và sự lựa chọn IP cho IPTV:
Truyền hình số được định thời một cách chính xác, là dòng dữ liệu liêntục có tốc độ bit không đổi, thường hoạt động trên các mạng mà mỗi tín hiệuđược truyền đều phục vụ cho mục đích truyền hình Trái với truyền hình,mạng IP truyền những loại dữ liệu khác nhau từ rất nhiều nguồn trên một kênhchung, bao gồm thứ điện tử, trang web, tín nhắn trực tiếp, tiếng nói qua IP(VoIP) mà nhiều loại dữ liệu khác Để truyền đồng thời những dữ liệu này,Mạng Internet phân thông tin thành các gói Như vậy, rõ ràng là IP và truyềnhình không phải là một sự kết hợp hoàn hảo (lý tưởng) về công nghệ
Mặc dù không tương thích về căn bản, nhưng thị trường IPTV vẫn bùng
nổ Vậy lý do tại sao lại chọn các mạng dựa trên IP để truyền tín hiệu truyềnhình? Câu trả lời cho câu hỏi này có thể tóm tắt thành năm điểm sau:
- Mạng IP băng rộng đã vươn tới rất nhiều gia đình ở nhiều nước,các nhà cung cấp dịch vụ truyền hình có thể sử dụng những mạng này đểphát các dịch vụ truyền hình mà không cần xây dựng hệ thông mạng riêng củahọ
- IP có thể đơn giản công việc phát các dịch vụ truyền hình mới,như là chương trình tương tác, truyền hình theo yêu cầu…
- Giá thành của mạng IP tiếp tục giảm do số thiết bị được sản xuấtmỗi năm rất lớn và sự tồn tại của các chuẩn trên toàn thế giới
- Mạng IP có mặt trên toàn thế giới, và số người dùng mạngInternet tốc độ cao tiếp tục tăng rất nhanh
- IP là công nghệ hoàn hảo cho nhiều ứng dụng khác nhau, baogồm sự trao đổi dữ liệu, mạng cục bộ, chia sẻ tệp tin, lướt web và nhiều nhiềunữa…
IP cung cấp cơ chế để định hướng truyền gói giữa các thiết bị được liênkết trong mạng IP là một giao thức phổ biến được sử dụng khắp các mạngInternet và hàng triệu các mạng khác có sử dụng IP Không có IP, mọi việc sẽhỗn loạn bởi vì không có cách nào để một thiết bị gửi dữ liệu một cách riêngbiệt tới một thiết bị khác
Với việc sử dụng các mạng IP để truyền dẫn tín hiệu truyền hình, việcxem truyền hình hiện đại sẽ rất khác so với xem truyền hình trước đây Các
Trang 7tín hiệu truyền hình bây giờ không khác gì những dữ liệu khác Nhờ đó, ngoàicác kênh truyền hình quảng bá truyền thống, chúng ta sẽ có thêm những kênhtruyền hình riêng biệt, tương tác để thỏa mãn nhu cầu của từng người
1.6 Nhu cầu thực tế của IPTV
Theo nhóm nghiên cứu đa phương tiện (MRG ) trong “ Dự đoán IPTVtoàn cầu năm 2005-2009”: tốc độ phát triển IPTV rất cao: gần 1000% Thịtrường IPTV trên thế giới phát triển ở mức tăng kép hàng năm 78% lên tới36.9 triệu người sử dụng vào năm 2009 Doanh thu dịch vụ còn tăng nhanhhơn trong cùng thời kì, từ 880 triệu USD tới 9.9 tỷ USD
Theo Informa: tốc độ phát triển IPTV tăng nhanh vào 5 năm tới và đạt25.9 triệu thuê bao IPTV vào cuối năm 2010
Theo nguyên cứu TDG: Doanh thu IPTV toàn cấu sẽ đạt trên 17 tỷ USDvào năm 2010
Và trên thực tế, dịch vụ IPTV đã được triển khai và đạt dược thànhcông ở nhiều như Italy ( Fast Web), Hồng Kông (PCCW), Canada ( Manitoba)
và Japan (Yahoo BB)
Tại thị trường Trung Quốc, IPTV bắt đầu được triển khai từ năm 2004với 2 nhà cung cấp hàng đầu là CHINA Telecom và ZTE cùng với những nhàcung cấp khác
Số lượng thuê bao có thể tăng lến tới 3-6 triệu vào năm 2010
IPTV được triển khai với băng thông 2M với kĩ thuật nén MPEG-4 part
10 cho TV thường và 6M đối với HDTV
Các dịch vụ triển khai trên IPTV đến với người dùng:
+ LiveTV: truyền hình trực tuyến
+ VoD: truyền hình theo yêu cầu
+ RoD: Dịch vụ ghi hình theo yêu cầu
+ NVoD: Xem chương trình theo lịch phát sóng
Trang 8CHƯƠNG 2:CHUẨN NÉN SỬ DỤNG TRONG IPTV
Nén cho phép các nhà cung cấp dịch vụ truyền các kênh hình và tiếng vớichất lượng cao qua mạng IP băng rộng Do mắt người ko thể phân biệt đượctoàn bộ các phần của hình ảnh Do đó việc nén sẽ làm giảm độ lớn của tín hiệuban đầu bằng cách bỏ bớt các phần của hình ảnh
2.1 Nén MPEG:
MPEG là 1 chuẩn nén được sử dụng rộng rãi trong thông tin vệ tinh,truyền hình cáp và trong các hệ thống truyền hình mặt đất MPEG (movingpictures exert group) được thành lập nhằm phát triển các kĩ thuật nén cho phùhợp vói việc truyền hình ảnh Từ khi được thành lập, MPEG đã đưa ra các chuẩnnén như: MPEG-1, MPEG-2, MPEG4-( Part 2 và part 10), MPEG-7, và MPEG-21.Trong các chuẩn này, MPEG-2 và MPEG-4 Part 10 được sử dụng rộng rãi trong IPTV
2.2 Chuẩn MPEG-2:
MPEG 2 là 1 công nghệ đạt được thành công lớn và là 1 chuẩn nén có ưuthế vượt trội dành cho truyền hình số được truyền qua nhiều mạng truyền thôngbăng rộng Chuẩn nén MPEG-2 được chia thành 2 loại nén hình và nén tiếng
Nén hình: Video ở dạng cơ bản là 1 chuỗi các ảnh liên tục 1 frame đượcđịnh nghĩa với 1 chuỗi bit header Mắt người thường thấy thoải mái khi xem TVvới tốc độ 25 hình/s Sẽ không có lợi nếu phát với tốc độ nhanh hơn vì người xemkhông thể nhận ra sự khác biệt do đó có thể dung lượng của những hình ảnhbằng cách nén chúng lại Các bộ nén hình được sử dụng với mỗi frame mà vẫngiữ chất lượng hình ảnh cao
2.2.1 Quá trình nén MPEG:
Phần đầu tiên của nén bao gồm 1 quá trình tiền đồng bộ Quá trình này cơbản bao gồm việc làm giảm kích thước của các frame Làm giảm kích thước củacác frame chính là làm giảm số lượng bit , điều này cũng giúp giảm băng thôngcần thiết để truyền tín hiệu Tuy nhiên, quá trình này không phải ko có trở ngại Ví
Trang 9dụ, sự giảm kích thước của khung có thể thường xuyên gây ra những lỗi tỉ sốcạnh (giống như sai tỉ lệ 4/3 hay 16/9) khi được thể hiện trên màn hình TV có độphân giải thấp
Phần 2 của quá trình nén tin hiệu là chia 1 frame ảnh ra thành các block cókích thước 8 nhân 8 pixel –khối mã hóa nhỏ nhất trong giải thuật của MPEG Có
3 loại block; độ chói Y, thành phần màu đỏ Cr hoặc xanh Cb Các loại block thànhphần màu mang thông tin về những màu khác nhau của hình ảnhtrg khi độ chóimang thông tin về những phần màu đen hoặc trắng của hình ảnh
Khi hoàn thành 2 phần trên, MPEG sẽ thực hiện 1 hàm toán được gọi làbiến đổi cosin rời rạc đối với mỗi block riêng biệt Kết quả thu được là một ma trận
hệ số 8*8 DCT sẽ biến đổi sự khác nhau về không gian thành các tần số khácnhau, nhưng không làm thay đổi các thông tin trong block, các blcok ban đầu sẽđược tái tạo lại 1 cách chính xác sử dụng biến đổi ngược Nguyên tắc thực hiệnhàm này bao gồm việc chia các block thành các phần tùy theo mức độ quantrọng Những phần quan trọng sẽ đươc giữ nguyên cho tới bước tiếp theo trongkhi các phần còn lại sẽ bị giảm bớt Điều này sẽ đảm bảo rằng mắt người khôngchú ý tới việc những phần không quan trọng của block bị bỏ bớt khi tốc bít bị hạnchế
Bước tiếp theo trong MPEG là quá trình lượng tử hóa Quá trình lượng tửhóa dữ liệu số là quá trình làm giảm số lượng bít của các block Mức lượng tử đốivới mỗi tìn hiệu video là rất quan trọng
Khi tất cả các block trong frame đều đã đc nén lại, MPEG sẽ ngắt các framethành 1 dạng mới gồm nhiều block gọi l à macro block Mỗi macro block có kíchthướ c 16 nhân 16 chứa các block độ chói và block thành phần màu Nếu có sựkhác biệt giữa frame cuối cùng và frame hiện tại, các thiết bị nén MPEG sẽ chuyểnnhững block mới này tới 1 vị trí mới trên frame hiện tại Điều này giúp không phảigửi đi những hình ảnh mới hoàn toàn, do đó có thể tích kiệm băng thông Có 2cách để thực hiện điều đó:
Trang 10Nén theo không gian là làm giảm các bít trên từng frame riêng biệt điều này
có thể đạt được do các pixel luôn đứng cạnh nhau trong các frame thường có giátrị giống nhau Do đó thay về mã hóa từng pixel riêng biệt Kĩ thuật nén theokhông gian này mã hóa sự khác biệt giữa các pixel cạnh nhau Số lượng bít cầnthiết để mã hóa những khác biệt này ít hơn số lượng bít cần thiết để mã hóa từngpixel riêng biệt
Nén theo thời gian là làm giảm các bit giữa các frame liên tục Trong quá
trình sản xuất video có những thông tin được lặp lại giữa những frame liên tiếp.VD: nếu trên hình có 1 bức tường , bức tường vẫn xuất hiện liên tục trong 30 hìnhtiếp theo, mà không thay đổi ( bức tường đó không thay đổi trong vòng 1s) thay
vì mã hóa 30 lần liên tục trong 1s, nên thời gian chỉ gửi đi các thông tin dự đoánchuyển động giữa những frame hình, trong trương hợp của bức tường trong VDtrên, dự đoán chuyển động được đặt = 0
Có nhiều phuơng thức khác nhau để nén 1 frame hình VD như với 1 framehình có độ phức tạp cao thì cần phương pháp nén có yếu tố nén theo không gianthấp bởi vì chỉ có 1 phần rất nhỏ các pixel được lặp lại Nếu tốc đọ bit có sự thayđổi lớn thì khó có thể truyền đi trong mạng IP, vì thế nhiều bộ mã hóa bao gồm cảchức năng đệm để có thể điều khiển và quản lí tốc độ chung mà tại đó các bit đượctruyền đi tới tầng tiếp theo của hệ thống sản xuất video
Bước tiếp theo của quá trình nén MPEG là mã hóa các macroblock thànhcác slice Slice là 1 chuỗi ảnh đặt nằm ngang cạnh nhau từ trái sang phải Nhiềuslice kết hợp với nhau tạo thành 1 hình Mỗi slice được mã hóa độc lập với nhau
để hạn chế lỗi
2.2.2 Các ảnh trong chuẩn nén MPEG:
Chuẩn nén MPEG định nghĩa 3 loại ảnh:
Intra-frame (I-frame) frame được mã hóa riêng biệt không phụ thuộc cácframe trước đó hoặc tiếp theo.Mã hóa theo hệ thống đc sử dụng gần giống như
Trang 11nén JPEG Đây là frame độc lập và đc sử dụng để tạo ra các loại frame khác.
P-frame ( forward predicted frame) khung dự đoán ảnh tiếp theo làkhung dự đoán ảnh dựa trên các frame I trước đó MPEG không thực sự mã hóaảnh mà chứa các thông tin về chuyển động cho phép IPTVCD có thể tái tạo lạiframe P-frame yêu cầu ít băng thông hơn I-frame, điều này là yếu tố quan trọngđối với mạng dựa trên IPTV
frame (Bi-directional predicted frame ) frame dự đoán hướng: frame là frame đc tạo thành từ việc kết hợp các thông tin từ cả I-frame và P-frame Mã hóa B-frame thì tương tự với P-frame, ngoại trừ các vecto chuyểnđộng phụ thuộc vào các vùng trong các khung tham khảo sau đó B-framechiếm ít dung lượng hơn là I-frame va P-frame Vì thế dòng Mpeg video gồmnhiều B-frame thì chiếm dung lượng thấp hơn so với dòng chứa các frame I
B-va P Thậm chí, B-frame giúp làm tối thiểu băng thông cần thiết đối với cácdòng MPEG video Tuy nhiên, B-frame cũng có hạn chế đó là độ trễ DoIPTVCD phải kiểm tra 2 khung trước và sau trước khi tạo ra B-frame
3 loại ảnh trên kết hợp với nhau tạo thành 1 chuỗi các frame đc gọi là nhómảnh (GOP ) Mỗi nhóm ảnh bắt đầu bằng một frame I và có một số các frame B và
P, Mỗi nhóm ảnh MPEG có cấu trúc như sau:
[I B B B P B B B P B B B P B B B P]
Mỗi nhóm ảnh cần bắt đầu với một khung I, mặc dù kích thước của mỗinhóm ảnh là khác nhau, nhưng trung bình mỗi nhóm ảnh trong IPTV có khoảng
12 đến 15 frame Mỗi cấu trúc của một nhóm ảnh thông thường có thể được miêu
tả bởi 2 thông số: N, số ảnh trong một nhóm và M, khoảng cách giữa các frame.Các nhóm ảnh được chia thành 2 loại: nhóm đóng và nhóm mở Với nhóm đóng,khung B cuối cùng không yêu cầu khung I đầu tiên cho nhóm ảnh tiếp theo để giải
mã, trong khi với nhóm mở cần yêu cầu khung I cho nhóm ảnh tiếp theo Cácnhóm ảnh sau đó được kết hợp với nhau để tạo thành dòng video Mỗi dòngvideo bắt đầu biết một đoạn mã, theo sau đó là một header và kết thúc với một
mã duy nhất
Trang 12Thứ tự các khung được truyền đi trên mạng băng rộng thì khác với thứ tựcác khung trong chuối bit đầu vào của bộ mã hóa Bởi vì bộ giải mã trongIPTVCD cần xử lý các frame I và P trước khi tạo ra khung B Mối quan hệ tổngthể giữa các chuỗi ảnh, ảnh, các slice, các khối macro, các khối và các điểm ảnhđược minh họa ở hình sau:
Hình 2.1 Cấu trúc dòng MPEG video
Mặc dù MPEG-2 được sử dụng trong truyền hình cáp và vệ tinh, nhưngMPEG-2 có nhưng hạn chế đối với các mạng có băng thông giới hạn.Do đó mộtcông nghệ nén mới với nhiều tính năng đã được phát triển trong nhưng năm gầnđây vơi mục đích truyền video qua mạng băng thông giới hạn MPEG-4 part 10được sử dụng trong hạ tầng mạng IPTV
Trang 13• Phần3:Audio;
• Phần 4: Conformance xác định việc triển khai một MPEG-4 sẽ như thế nào;
• Phần 5: Các phần mềm tham chiếu, đưa ra một nhóm các phần mềm tham chiếu quan trọng, được sử dụng để triển khai MPEG-4 và phục vụ như một ví
dụ demo về các bước phải thực hiện khi triển khai;
• Phần 6: Khung chuẩn cung cấp truyền thông đa phương tiện tích hợp DMIF (Delivery Multimedia Integration Framework), xác định một giao diện giữa các ứng dụng và mạng/lưu trữ;
• Phần 7: Các đặc tính của một bộ mã hoá video tối ưu (bổ xung cho các phần mềm tham chiếu, nhưng không phải là các triển khai tối thiểu cần thiết)
• Các phần mới bổ xung tiếp cho chuẩn MPEG-4 sau này là:
• Phần 8: Giao vận (về nguyên tắc không được xác định trong chuẩn, nhưngphần 8 xác định cần ánh xạ như thế nào các dòng MPEG-4 vào giao vận IP);
• Phần 9: Mô tả phần cứng tham chiếu (Reference Hardware Description);
• Phần 10: MPEG-4 Advanced Video Coding /H.264 là thành tựu mới nhất
về nén video, trên cơ sở đồng bộ với khả năng tính toán và dung lượng bộ nhớ của các máy tính PC hiện nay, ứng dụng các phương pháp mã hoá phức tạp hơn nhiều các phương pháp trước đó và có thể thực hiện cả trong môi trường phần mềm và phần cứng, do nhóm chuyên gia MPEG hợp tác với nhóm IUT Study Group phát triển và có nhiều khả năng sẽ trở thành chuẩn mãhoá video qui mô toàn cầu, duy nhất của ITU và ISO;
• Phần 11: Mô tả khung hình (Scene Description - được tách ra từ phần 1);
• Phần 12: Định dạng file truyền thông ISO (ISO Media File Format);
• Phần 13: Quản lý bản quyền nội dung IPMP (Intellectual Property
Management and Protection Extensions);
• Phần 14: Định dạng fille MP4 (trên cơ sở phần 12);
• Phần 15: Định dạng file AVC (cũng trên cơ sở phần 12);
• Phần 16: AFX (Animation Framwork eXtensions) và MuW (Multi-user
Trên Hình 2.2 thể hiện một trường hợp điển hình của tổ hợp khuôn hìnhMPEG-4, cho thấy nhiều đối tượng (bàn, quả cầu, bảng đen, người hướng
Trang 14dẫn và audio) được đặt vào một hệ thống toạ độ không gian 3 chiều (3-D) đốivới vị trí người xem giả định Các thiết bị mã hoá và giải mã video đều ápdụng sơ đồ mã hoá như nhau cho mỗi đối tượng video VO (Video Object)riêng biệt (hình 2), nhờ vậy người sử dụng có thể thực hiện các hoạt độngtương tác riêng với từng đối tượng (thay đổi tỷ lệ, di chuyển, kết nối, loại bỏ,
bổ xung các đối tượng…) ngay tại vị trí giải mã hay mã hoá
Hình 2.2 Tổ hợp khung hình trong MPEG-4
Trang 15Hình 2.3 Cấu trúc bộ mã hóa và giải mã MPEG-4
Các bộ phận chức năng chính trong các thiết bị MPEG-4 bao gồm:
• Bộ mã hoá hình dạng ngoài Shape Coder dùng để nén đoạn thông tin, giúpxác định khu vực và đường viền bao quanh đối tượng trong khung hìnhscene
• Bộ dự đoán và tổng hợp động để giảm thông tin dư thừa theo thời gian
• Bộ mã kết cấu mặt ngoài Texture coder dùng để xử lý dữ liệu bên trong vàcác dữ liệu còn lại sau khi đã bù chuyển động
Hình 2.4 là một ví dụ về mã hoá và tổng hợp khung hình video sử dụngtrong MPEG-4 Nhiều đối tượng, như người, xe ô tô, nhà cửa, được tách rakhỏi video đầu vào Mỗi đối tượng video sau đó được mã hoá bởi bộ mã hoáđối tượng video VO (video object) và sau đó được truyền đi trên mạng Tại vịtrí thu, những đối tượng này được giải mã riêng rẽ nhờ bộ giải mã VO và gửiđến bộ tổ hợp compositor Người sử dụng có thể tương tác với thiết bị để cấutrúc lại khung hình gốc (a), hay để xử lý các đối tượng tạo ra một khung hìnhkhác (b) Ngoài ra, người sử dụng có thể download các đối tượng khác từ cácthư viện cơ sở dữ liệu (có sẵn trên thiết bị hay từ xa thông qua mạng LAN,WAN hay Internet) để chèn thêm vào hay thay thế các đối tượng có trong khuôn hình gốc (c)
Trang 16Hình2.4 Mã hóa và tổng hợp khung hình trong MPEG-4
Để có thể thực hiện việc tổ hợp khung hình, MPEG-4 sử dụng một ngônngữ mô tả khung hình riêng, được gọi là Định dạng nhị phân cho các khunghình BiFS (Binary Format for Scenes) BiFS không chỉ mô tả ở đâu và khi nàocác đối tượng xuất hiện trong khung hình, nó cũng mô tả cách thức hoạt độngcủa đối tượng (làm cho một đối tượng xoay tròn hay chồng mờ hai đối tượnglên nhau) và cả điều kiện hoạt động đối tượng và tạo cho MPEG-4 có khảnăng tương tác Trong MPEG-4, tất cả các đối tượng có thể được mã hoá với
sơ đồ mã hoá tối ưu riêng của nó – video được mã hoá theo kiểu video, textđược mã hoá theo kiểu text, các đồ hoạ được mã hoá theo kiểu đồ hoạ - thay
vì việc xử lý tất cả các phần tử ảnh pixels như là mã hoá video ảnh động Docác quá trình mã hoá đã được tối ưu hoá cho từng loại dữ liệu thích hợp, nênchuẩn MPEG-4 sẽ cho phép mã hoá với hiệu quả cao tín hiệu ảnh video,audio và cả các nội dung tổng hợp như các bộ mặt và cơ thể hoạt hình
2.4 Tổng quan về MPEG-4 Part 10
Đầu năm 1998, 2 tổ chức ITU-T và VCEG đã cùng đưa ra một chuẩn nénmới H.26L nhằm tăng gấp đôi hiệu suất nén Do đó chuẩn nén này sẽ mở ranhiều ứng dụng mới như truyền hình qua mạng Internet, truyền hình di động vàphát triển các ứng dụng hiện có
Cuối năm 2001, VCEG và MPEG đã thành lập JVT ( Joint Video Team) cónhiệm vụ hoàn thành chuẩn nén mới và chính thức được thông qua với tên gọi làMPEG-4 Part 10 hoặc H.264/AVC vào tháng 3 năm 2003
Trang 172.4.1 Cấu trúc phân lớp của H.264/AVC
Với sự gia tăng các ứng dụng và dịch vụ trên nhiều mạng thì câu hỏi đặt
ra là làm thế nào quản lí được các ứng dụng đó Do vậy, chuẩn H.264/AVCphải có độ linh hoạt cao và có thể ứng dụng trên nhiều mạng khác nhau Do
đó, chuẩn H.264/AVC được thiết kế theo phân lớp mã hóa video VCL ( VideoCoding Layer) và lơp NAL làm nhiệm vụ tương thích với môi trường mạngkhác nhau
Hình 2.5: Cấu trúc phân lớp của H.264
a) Lớp mạng NAL ( Network Abstration Layer)
NAL có khả năng ánh xạ từ lớp VCL đến lớp truyền tải:
+ RTP/IP cho dịch vụ thời gian thực qua mạng Internet (conversational
và streaming)
+ Định dạng file: ISO MP4 cho lưu trữ và truyêng tải MMS
+ H32x cho các dịch vụ đàm thoại có dây và không dây
+ Dòng truyền tải MPEG-2 cho các dịch vụ quảng bá
Gói NAL: dữ liệu video được mã hóa được tổ chức trong một đơn vịNAL( hay gói NAL) Mỗi gói có độ dài tính theo byte Byte đầu tiên của mỗi góiNAL là byte mào đầu, nó chỉ rõ loại dữ liệu được chứa trong NAL, các bytecòn lại chứa dữ liệu
Phần dữ liệu của NAL được ghép xen
Cấu trúc của đơn vị NAL có định dạng chung cho việc sử dụng truyền trong hệ thống hướng bit và hướng gói
b) Lớp mã hóa video:
Lớp mã hóa video của H.264/AVC thì tương tự với các tiêu chuẩn khác như MPEG-2 video Nó là sự kết hợp dự đoán theo thời gian và theo không
Trang 18gian,vàvới mã chuyển vị
Ảnh được tách thành các khối Ảnh đầu tiên của dãy hoặc điểm truynhập ngẫu nhiên thì được mã hóa “Intra”, có nghĩa là không dùng thông tinnào ngoài thông tin chứa trong bản thân ảnh Mỗi mẫu của một khối trong mộtframe Intra được dự đoán nhờ dùng các mẫu không gian bên cạnh của cáckhối đã mã hóa trước đó Đối với tất cả các ảnh còn lại của dãy hoặc giữa cácđiểm truy cập ngẫu nhiên, mã hóa “Inter” được sử dụng, dùng dự đoán bùchuyển động từ các ảnh được mã hóa trước
c) Khái niệm về ảnh, khung, bán ảnh, macroblock
Tín hiệu video được mã hóa trong H.264 bao gồm tập hợp các ảnhđược mã hóa có trật tự Một ảnh có thể biểu diễn bằng cả một khung hoặcmột bán ảnh Nhìn chung, một khung gồm có hai bán ảnh xen kẽ nhau: bánảnh trên và bán ảnh dưới Bán ảnh trên gồm các dòng chẵn 0, 2, 4, …, H/2 -1,với H là tổng số dòng trong một khung Bán ảnh dưới gồm các dòng lẻ và bắtđầu từ dòng thứ 2
Hình 2.6: Các bán ảnh trong một khung
Các macroblock: Mỗi ảnh video, frame hoặc field, được chia thành các
macroblock có kích thước cố định bao trùm một diện tích ảnh hình chữ nhậtgồm 16 x 16 mẫu thành phần luma và 8 x 8 mẫu cho mỗi một trong hai thànhphần chroma Tất cả các mẫu macroblock luma hoặc chroma được dự đoántheo không gian hoặc thời gian, và dự đoán tại chỗ hợp thành được truyền đinhờ dùng mã chuyển vị Do vậy mỗi thành phần màu dự đoán tại chỗ đượcchia nhỏ thành các khối Mỗi khối được biến đổi nhờ dùng biến đổi nguyên (aninteger transform), và các hệ số biến đổi được lượng tử hóa và được truyền đi
Trang 19bằngphương pháp mã hóa entropy.
Các macroblock được tổ chức thành các slice, biểu diễn các tập con củaảnh đã cho và có thể được giải mã độc lập Thứ tự truyền các macroblocktrong dòng bit phụ thuộc vào bản đồ phân phối Macroblock (MacroblockAllocation Map) và không nhất thiết phải theo thứ tự quét H.264 / AVC hỗ trợnăm dạng mã hóa slice khác nhau Đơn giản nhất là slice I (Intra), trong đó tất
cả macroblock được mã hóa không có tham chiếu tới các ảnh khác trong dãyvideo Tiếp theo là các slice P và B, ở đó việc mã hóa có tham chiếu tới cácảnh trước nó (slice P) hoặc cả ảnh trước lẫn ảnh sau (slice B) Hai dạng slicecòn lại là SP (switching P) và SI (switching I), được xác định cho chuyển mạchhiệu quả giữa các dòng bit được mã hóa ở các tốc độ bit khác nhau
2.4.1 H.264 CODEC
Giống như các tiêu chuẩn nén trước đây ( ví dụ như 1,
MPEG-2 và MPEG-4),H.MPEG-264 không được định nghĩa là bộ CODEC ( một cặpencoder và decoder) mà H.264 định nghĩa các cú pháp của luồng nén video.Trong thực tế, bộ mã hóa và giải mã bao gồm các thành phần cơ bản nhưtrong hình 2.8 và hình 2.9 So với các chuẩn nén trước bao gồm các thànhphần như bộ dự đoán, biến đổi, lượng tử, mã hóa entropy, H.264 CODECcòn bao gồm bộ lọc deblocking và có nhiều thay đổi quan trọng trong các chitiết về chức năng của các thiết bị
Bộ mã hóa (hình 2.8) bao gồm 2 dòng dữ liệu , dòng forward (từ tráisang phải) và dòng tái tạo (từ phải sang trái) Dòng dữ liệu trong bộ giải mãđược truyền từ phải sang trái trong hình 2.9
Trang 20Hình 2.7: Sơ đồ bộ mã hóa H.264.
Bộ mã hóa dòng forward
Một khung hoặc trường lối vào Fn được xử lí trong các khối của mộtmacroblock ( đáp ứng cho 16x16 pixel trong một hình bình thường) Mỗimacroblock được mã hóa ở chế độ trong ảnh hoặc liên ảnh, với từng blocktrong macroblock Một dự doán PRED (kí hiệu là P trong hình 2.8) được địnhdạng dựa trên các mẫu ảnh được tái tạo lại
Trong chế độ nén liên ảnh, PRED được hình thành từ slice hiện thời vừađược mã hóa, giải mã và tái tạo lại (uF′
n trong hình, chú ý rằng các mẫu khôngđược lọc được sủ dụng để tạo nên PRED)
Trong chế độ nén trong ảnh, PRED được hình thành bằng cách dự đoán
bù chuyển động từ một hoặc hai ảnh tham khảo được Trong hình 2.8, ảnh thamkhảo là ảnh F′
n −1 vừa được mã hóa Nhưng, dự đoán tham chiếu đối với mỗimacroblock có thể được chọn từ các hình ảnh trong quá khứ hoặc trong tươnglai vừa được mã hóa, tái tạo và lọc ( theo thứ tự hiển thị)
Dự đoán PRED trừ với block hiện tại đer tìm ra sự khác biệt , được biếnđổi và lượng tử hóa để thu được hệ số lưởng tử X sẽ được sắp xếp lại và mãhóa entropy Hệ số được mã hóa entropy cùng với thông tin về cạnh được mãhóa trong mỗi block trong macroblock (chế độ dự đoán, mức lượng tử, thông tin
về vector chuyển động, …) định dạng nên các dòng bit để truyền tơi lớp mạngtrừu tượng để truyền hoặc lưu trữ
Hình 2.8: Bộ mã hóa
Bộ mã hóa dòng tái tạo
Bên cạnh việc mã hóa và truyền tải các block trong macroblock, bộ mãhóa còn giải mã ( tái tạo) chúng để làm tham khảo cho các dự đoán trong tương
Trang 21lai Hệ số X được giải lượng tử (Q−1 ) và biến đổi ngược (T−1 ) để thu được sụkhác biệt block D′
n Block dự đoán PRED được cộng vào để tạo thành blocktái tạo uF′n Bộ lọc được ứng dụng để giảm ảnh hưởng của méo và các ảnhtham khảo dự đoán được tạo từ 1 chuỗi các block F′n.
Mục đích chính của bộ giải mã dòng tái tạo trong bộ mã hóa là để chắcchắn rằng cả bộ mã hóa và giải mã đều sử dụng các tham số khung đã xác định
để tạo ra dự đoán P Nếu không có các tham số này, dự báo P ở bộ mã hóa vàgiải mã sẽ không được xác định, dẫn đến lỗi giữa bộ mã hóa và giải mã
Hình 2.9 Bộ giải mã
Bộ giải mã
Bộ giải mã nhận được các dòng bit được nén từ NAL Các thành phần
dữ liệu được giải mã entropy để tìm ra hệ số lượng tử X Sử dụng giải lượng
tử và biến đổi ngược để thu được Dn Sử dụng các thông tin header đươc giải
mã từ các dòng bit, bộ mã hóa tạo ra block dự đoán, giống hệt với PRED đượctạo ra ở bộ mã hóa PRED được cộng với D′ n để tạo ra uF′n , sau đó đượclọc để tạo ra các block F′n.
2.4.3 Các đặc điểm chính của MPEG-4 Part 10:
a) Kích thước block ảnh có thể thay đổi được:
Thành phần độ chói của macroblock (16*16 mẫu) có thể được chia theo 4cách: một macro block 16 *16 phần macroblock, hai macroblock 16*8 phần, hai8* 16 phần hoặc bốn macroblock 8*8 phần Nếu kiểu 8*8 phần được chọn, mỗibốn 8*8 sub-macroblock trong một macro block có thể được chia theo 4 cách:một phần sub-macro block 8*8, hai phần sub-macroblock 4*8, hai phần sub-macroblock 8*4 hoặc bốn phần sub-macroblock 4*4 Các phần này và các sub-macroblock tạo ra nhiều cách kết hợp giữa trong mỗi macroblock
Trong thực tế, phần có kích thước lớn phù hợp với những vị trí không chitiết, và phần kích thước nhỏ phù hợp với các vị trí có độ chi tiết cao
Trang 22Hinh 2.10: Bù chuyển động
b) Độ chính xác của vector bù chuyển động cao:
Mỗi phần hay mỗi phần sub-macroblock trong một macro được mã hóatrong ảnh được dự đoán từ một vùng có cùng kích thước trong ảnh tham khảo.hầu hết các chuẩn nén trước đó chỉ đạt được độ chính xác ½ của vector bùchuyển động, nhưng với H.264 có thể đạt được tới ¼
c) Tham chiếu nhiều ảnh bù chuyển động:
Ảnh P trong MPEG-2 là ảnh dự đoán được tham chiếu từ một ảnh trước
đó, còn ảnh B là ảnh dự đoán 2 chiều được tham chiếu từ nhiều ảnh I hoặ Ptrước và sau nó
Trong chuẩn nén H.264, ảnh hiện tại có thể tham chiếu bởi nhiều ảnh,điều này cho phép tăng hiệu suất nén Một lượng lớn các ảnh được giải nén vàlưu trong bộ giải nén
Trong các chuẩn nén trước đó, thứ tự các ảnh dùng cho mục đích thamchiếu bù chuyển động và thứ tự các ảnh thể hiện có mối quan hệ chặt chẽ vớinhau Tuy nhiên, chuẩn nén H.264 đã khắc phục nhược điểm này bằng cáchcho phép bộ giải nén lựa chọn thứ tự các ảnh tham chiếu
Trang 23Hình 2.11: Tham chiếu đa ảnh
c mode dự đoán thành phần chói Y 4x4
Có 9 mode dự đoán thành phần chói Y kích thước 4x4, đó là:Mode 0: dự đoán theo chiều dọc
Mode 1: dự đoán theo chiều ngang
Mode CD: dự đoán dựa trên trung bình tất cả các mẫu xung quanh từ bêntrái và từ trên của khối dữ liệu hiện tại
Mode 3: dự đoán dự trên các mẫu có độ nghiêng 45 độ từ phải sang trái.Mode 4: dự đoán dự trên các mẫu có độ nghiêng 45 độ từ trái sang phải.Mode 5 : sử dụng phép ngoại suy với góc có độ nghiêng 26.6 độ so vớichiều dọc
Mode 6: sử dụng phép ngoại suy với góc có độ nghiêng 26.6 độ so vớichiều ngang
Trang 24Mode 7: sử dụng phép ngoại suy với góc có độ nghiêng 26.6 độ so vớichiều dọc bên phải
Mode 8: sử dụng phép ngoại suy với góc có độ nghiêng 26.6 độ từ so vớichiều ngang
Hình 2.12: Mode dự đoán thành phần chói Y kích thước 4x4
Hình 2.13: Mode dự đoán 16x16 liên ảnh
Các mode dự đoán thành phần chói Y 16x16
Như dã nói trình bày ở trên, một mode dự đoán được áp dụng cho toàn
bộ một macro thành phần chói kích thước 16x16 Có 4 mode dự đoán đó là dựđoán theo chiều dọc, dự đoán theo chiều ngang, dự đoán phẳng Đối với mode
dự đoán phẳng, một hàm tuyến tính được sử dụng giữa các mẫu từ bên trái và
từ trên xuống so với mẫu dự đoán hiện tại Mode này hoạt động hiệu quả giữacác vùng có độ chói liên tục thay đổi Các mode hoạt động giống như đối vớithành phần chói kích thước 4x4, chỉ khác là chúng hoạt động đối với toàn bộmacroblock thay vì với 16 phần kích thước 4x4
Các mode dự đoán các thành phần màu Cr và Cb:
Dự đoán trong ảnh đối với các thành phần màu của một macroblocktương tự như đối với thành phần chói Y có kích thước 16x16 Bởi vì tín hiệumàu có sự thay đổi liên tục trong hầu hết các trường hợp Nó luôn áp dụng chocác khối 8x8 sử dụng dự đoán ngang, dọc, DC và sự đoán phẳng
Trang 25Hình 2.14: Dự đoán ảnh I
e) loại bỏ dư thừa không gian:
Biến đổi Cosine rời rạc DCT hai chiều trong các chuẩn MPEG-1, MPEG-2nhằm mục đích loại bỏ phần dư thừa không gian DCT được áp dụng cho cáckhối 8x8 trong H.264/AVC, DCT được áp dụng với hệ số nguyên Kích thướckhối thay đổi, có thể là 16x16, 4x4, hoặc trong trường hợp đặc biệt có thể dùngkhối kích thước 2x2 Việc sử dụng khối có kích thước nhỏ hơn so với các chuẩnnén trước đó cho phép bộ mã hóa tương thích tốt hơn với biên của các đốitượng chuyển động
Trang 26Hình 2.15: Loại bỏ dư thừa không gian
Có 3 loại biến đổi khác nhau được sử dụng trong MPEG-4 Part 10, đó là;
Một biến đổi Hadamard áp dụng cho mảng 2 chiều kích thước 4x4các hệ số 1 chiều DC của thành phần chói Y trong mode 16x16
Một biến đổi Hadamard áp dụng cho mảng 2 chiều kích thước 2x2các hệ số 1 chiều DC của thành phần màu Cr, Cb
Một biến đổi dựa trên DCT áp dụng cho tất cả các block kích thước4x4
Dữ liệu trong 1 macroblock được truyền di theo thứ tự như trong hình sau:Nếu macroblock được mã hóa sử dụng mode Intra 16x16, thì block đó sẽđược dán nhãn là “-1”, và bao gồm các hệ số một chiều được biến đổi trong mỗiblock độ chói 4x4, và được truyền đi đầu tiên Sau đó, các block độ chói từ 0-15được truyền đi theo trật tự như trong hình vẽ(các hệ số một chiều trong mộtmacroblock được mã hóa sử dụng mode Intra 16x16 không được gửi đi) Block
16 và 17 được gửi đi,bao gồm 2 mảng kích thước 2x2 các hệ số một chiều cácthành phần màu Cr, Cb Cuối cùng là các block từ 18-25(không có các hệ số mộtchiều)
Trang 27Hình 2.16: Thứ tự truyền các block trong một macroblock
f) Mã hóa Entropy:
Hình 2.17: Mã hóa Entropy
Mã hoá số học nhị phân thích nghi với ngữ cảnh (Context-adaptivebinary arithmetic coding - CABAC)
Trang 28 Mã hoá có độ dài từ mã thay đổi thích nghi với ngữ cảnh adaptive variable-length coding - CAVLC)
(Context- Mã hoá có độ dài từ mã thay đổi (Common variablelength coding VLC)
-g) Bộ lọc deblocking:
Cấu trúc khối cơ bản của H.264 là 4x4 cho biến đổi và bù chuyển động
Do vậy, ảnh sẽ hình thành các đường biên giữa các khối Bộ lọc sẽ triệt tiêu cácbiên này để hình ảnh được tự nhiên hơn
Một bộ lọc được sử dụng cho mỗi macroblock được mã hóa nhằm làmgiảm méo Bộ lọc deblocking được sử dụng sau biến đổi ngược ở bộ mãhóa( trước khi tái tạo lại và lưu trữ ) và ngược lại đối với bộ giải mã Bộ lọc giúpcải thiện chất lượng hình ảnh Hình ảnh được lọc sẽ sử dụng để làm dự đoán bùchuyển động cho các hình ảnh trong tương lai và điều này có thể giúp cải thiệnchất lượng nén bởi vì những hình ảnh đã được lọc chân thực hơn so với các ảnhkhông được lọc
h) Thứ tự macroblock mềm dẻo:
Để cung cấp các phương pháp che giấu hiệu quả trong các kênh cókhuynh hướng bị lỗi với các ứng dụng độ trễ thấp, H.264 / AVC hỗ trợ một đặcđiểm gọi là thứ tự macroblock mềm dẻo (FMO – Flexible MacroblockOrdering) FMO định rõ một giản đồ (pattern) ấn định các macroblock trongảnh vào một hoặc vài nhóm slice Mỗi nhóm slice được truyền riêng biệt Nếumột nhóm slice bị mất, các mẫu trong các macroblock bên cạnh về mặt khônggian, thuộc về các nhóm slice được thu đúng, có thể được sử dụng cho chedấu hiệu quả lỗi
2.4.4 Ưu điểm của H.264/AVC:
Chất lượng hình ảnh tốt: H.264 là chuẩn nén sử dụng công nghệ âm
thanh, hình ảnh mới khả năng nén tôt hơn so với các chuẩn nén trước đó
Do đó, chuẩn nén cung cấp dịch vụ phân phát hình ảnh chất lượng cao
qua mạng băng thông giới hạn
Yêu cầu băng thông thấp: Chất lượng hình ảnh của H.264 gần giống
với MPEG-2 nhưng H.264 cần ít băng thông để truyền tải tín hiệu với cùng
chất lượng Đặ điểm này rất phù hợp để sử dụng trong hệ thống IPTV
Có khả năng kết hợp với các thiết bị xử lí video có sẵn như MPEG-2
và hạ tầng mạng dựa trên IP đã có sẵn
Hỗ trợ truyên hình độ phân giải cao: Khi sử dụng tối ưu chuẩn nén
thể làm có thể làm tăng khả năng truyền dữ liệu của mạng Do đó các nhà
Trang 29cung cấp dịch vụ truyền thông có thể sử dụng chuẩn nén này để cung cấp
chương trình video độ phân giải cao qua mạng sẵn có
Hỗ trợ nhiều ứng dụng:Chuẩn nén H.264 được sử dụng trong nhiều ứngdụng, với nền khác nhau thì có những yêu cầu riêng Ví dụ, ứng dụng truyền đađiểm trong IPTV yêu cầu phải hiện thị hình ảnh ở dạng chuẩn truyền hình, trongkhi, đối với các ứng dụng giải trí di động, hình ảnh phải hiển thị được trên cácthiết bị di động Để phù hợp với mọi ứng dụng, chuẩn nén H.264 có rất nhiềuprofile và level.Đặc điểm của profile và level là tốc độ bit và kích thước ảnh
Có thể truyền độc lập: Chuẩn nén H.264 có thể truyền qua nhiều giao
thức như ATM, RTP,UDP, TCP và các dong MPEG-2
Dễ dàng thích nghi với các mạng chất lượng kém nhờ cơ chế sửa lỗi
2.4.5 Các ứng dụng của H.264/AVC
Chuẩn nén này được thiết kế cho các ứng dụng sau:
+Truyền hình quảng bá qua qua vệ tinh, cáp, mặt đất…
+Truyền hình tương tác, video theo yếu cầu (VoD)
+Lưu trữ đĩa quang, băng từ, DVD
+Tích hợp dịch vụ qua ISDN, LAN, DSL, mạng không dây, mạng di động,modem
+Nhắn tin đa phương tiện MMS qua ISDN, DSL, LAN mạng di động
Còn nhiều ứng dụng khác được phát triển trên mạng hiện tại như videophone,… và mạng tương lai
Kết luận:
Từ những đặc điểm và ưu điểm của MPEG-4 AVC đánh dấu một bước ngoặttrong lĩnh vực nén video, áp dụng các kỹ thuật tiên tiến nhằm mục đích sửdụng băng thông hiệu quả hơn và đem lại chất lượng ảnh cao hơn Với các kỹthuật này, MPEG-4 AVC có thể giảm tốc độ bit xuống hơn 50% so với chuẩnMPEG-2 Do đó, MPEG-4 Part 10 được lựa chọn để ứng dụng trong IPTV
Trang 30CHƯƠNG 3: ĐÓNG GÓI NỘI DUNG VIDEO
Việc đóng gói các chương trình video bao gồm việc chèn và tổ chức các dữliệu video thành các gói riêng biệt
3.1 Tổng quan về mô hình truyền thông IPTV (IPTVCD)
Mô hình truyền thông trong IPTV có 7 lớp(và một lớp tùy chọn) được xếpchồng lên nhau
Các dữ liệu video ở phía thiết bị gửi được truyền từ lớp cao xuống lớp thấptrong mô hình IPTV, và được truyền đi trong mạng băng rộng bằng các giao thứccủa lớp vật lí Ở thiết bị nhận, dữ liệu nhận được chuyển từ lớp thấp nhất đến lớptrên cùng trong mô hình IPTV
Hình3.1: mô hình truyền thông IPTV
Do đó, nếu 1 bộ mã hóa gửi chương trình video đến 1 thiết bị IPTV củakhách hàng, thì phải chuyển qua các lớp trong mô hình IPTV ở cả phía thiết bịnhận và thiết bị gửi Mỗi lớp trong mô hình IPTV độc lập với nhau và có chứcnăng riêng Khi chức năng này được thực hiện , dữ liêu j video được chuyển đếnlớp tiếp theo trong mô hình IPTV Mỗi lớp sẽ thêm vào hoặc bỏ đi phần thông tinđiều khiển của các gói video trong quad trình xử lí Thông tin điều khiển chứa cácthông tin giúp thiết bị có thể sử dụng gói dữ liệu đúng chức năng của nó, vàthường được định dạng như các header hoặc trailer Bên cạnh việc truyền thônggiữa các lớp, còn có các liên kết ảo giữa các tầng cùng mức 7 lớp và 1 lớp bổsung trong mô hình IPTV có thể được chia làm 2 loại: các lớp cao và lớp thấp.các tầng cao hơn thì quan tâm nhiều hơn tới các ứng dụng của IPTV và các địnhdạng file, trong khi các tầng thấp hơn thì quan tâm tới việc truyền tải các nội dung
Trang 313.2 Mô hình IPTV và truyền tải các nội dung MPEG
Hình 3.2 cho ta cái nhìn rõ hơn về việc các nội dung video đã được nén quacác lớp như thế nào khi sử dụng hệ thống MPEG khi chuyển từ lớp trên xuống lớpdưới
Hình 3.2 Đóng gói các lớp trong mô hình IPTV
Loại khung và tốc độ
Vị trí của những block dữ liệu trên màn hình
Tỉ số cạnh
Các dòng cơ bản là nền tảng để tạo nên các dòng MPEG
Điều quan trọng phải chú ý là lớp này được chia thành 2 lớp phụ theo đặc tínhcủa chuẩn H.264/AVC: lớp mã hóa video(VCL) và lớp trừu tượng(NAL) Lớp phụVCL quan tâm tới việc nén các nội dung video TÍn hiệu đầu ra của lớp này là chuỗi
Trang 32các slice ảnh Dòng bit ở lớp NAL được tổ chức thành các gói rời rạc được gọi là cáckhối NAL Định dạng của các khối NAL được mô tả trong hình 3.3(=3.6)
Các khối trong hình 3.3 mô tả 1 khối NAL với phần payload nội dung video
Nó có thể chứa các loại payload khác trong phần này như thông tin điều khiển.Những khối như thế được xếp vào loại không phải khối VCL (non-VCL unit) Cáckhối NAL được kết hợp với nhau thành chuỗi, định dạng nên khối truy cập chú ýrằng khối NAL được tạo nên từ chuẩn H.264/AVC có thể hỗ trợ cho cả cấu trúcmạng dựa trên giao thức IP và các mạng không dựa trên giao thức IP
Hình 3.3 Cấu trúc của khối NAL
3.2.2 Lớp đóng gói Video:
Để truyền các dòng cơ bản âm thanh, dữ liệu và hình ảnh qua mạng số, mỗi dòng
cơ bản này phải được chuyển đổi sang một dòng được chèn của gói PES đã được đánhdấu thời gian (PES- parketized Element Stream ) Một dòng PES chỉ bao gồm 1 loại
dữ liệu từ 1 nguồn Một gói PES có thể có kích thước khối cố định hoặc thay đổi,
có thể lên tới 65536 byte/gói Bao gồm 6 byte header, và số byte còn lại chứa nộidung chương trình Định dạng của 1 PES header được minh họa trong hình 3.4 vàgiải thich trong bảng 3.4
Trang 33Hình 3.4 Định dạng gói MPEG PES
Bảng 3.1 Cấu trúc của một gói MPEG PES
số của các dòng MPEG
Độ dài gói PES Trường dài 2 byte để chỉ thị độ dài gói
Mã đồng bộ Trường được dùng để đồng bộ nội dung video
và audio
Cờ header PES Trường 14 bit chứa các bộ chỉ thị PES khác
nhau hay các cờ, cung cấp phần cứng hay phần mềm bộ giải mã của set - top box IP với thông tin thêm vào Các loại cờ gồm:
Điều khiển tranh chấp PES: Cờ này báo cho bộ giải mã gói có được bảo đảm hay không thông qua xử lý tranh chấp
Độ ưu tiên PES: Cờ này cung cấp cho bộ giải
mã thông tin về mức độ ưu tiên của gói PES
Bộ chỉ thị sắp xếp dữ liệu: Bộ chỉ thị này quyết định Payload của PES bắt đầu với bit video hayaudio