Cú pháp dịng cơ sở đóng gói PES

Một phần của tài liệu đề tài công nghệ IPTV (Trang 58)

Dịng cơ sở đóng gói bao gồm dữ liệu bắt đầu và dịng dữ liệu cơ sở có ích. Dữ liệu bắt đầu bao gồm bốn byte trong đó có ba bytes dùng cho mã khởi đầu gói dữ liệu PES và một byte nhận diện dòng cũng nhƣ chỉ thị loại dòng ba bytes (24 bit) mã khởi đầu gói PES gồm 23 bit mang giá trị 0, tiếp theo sau là 1 bit mang giá trị 1. Một byte (8 bit) nhận diện dịng có giá trị từ 0xBD đến 0xFE, ví dụ: từ 0xC0 đến 0xDF – dòng âm thanh; 0xE0 đến 0xEF – dịng hình ảnh. Dữ liệu tiêu đề có thể phân biệt đƣợc 16 chƣơng trình hình ảnh và 32 chƣơng trình âm thanh. Từng chƣơng trình trong số 48 chƣơng trình (hình ảnh và âm thanh) đều có thể kèm theo dữ liệu về ngƣời dùng.

PES - Chiều dài tiêu đề gói dữ liệu cho thơng tin về số bytes có trong dữ liệu tiêu đề tùy chọn trƣớc khi bắt đầu dịng dữ liệu có ích.

Các cờ chỉ rõ vùng tùy chọn tồn tại hay không tồn tại, thơng tin đƣợc mã hóa hay khơng mã hóa, yêu cầu về bản quyền, sự có mặt hay khơng có mặt của PTS và

SVTH: Võ Hồng BaRi Lớp: KTVT – K48

DTS. Hai thông tin sau cùng đƣợc sử dụng để đảm bảo sự đồng bộ ở mạch giải mã, DTS đảm bảo thứ tự ảnh khi giải mã còn PTS đảm bảo thứ tự khi hiển thị ảnh. Bảng 3.1 nói về đặc điểm các cờ của hai bít mang giá trị 1, 0 trong Hình 3.9.

Bảng 3.1: Các cờ của hai bit mang giá trị 1, 0

Số thứ tự Cờ Đặc điểm

1 PES kiểm soát sự xáo trộn

(2 bit) Giá trị 1 chỉ sự xáo trộn nếu có.

2 PES ƣu tiên (1 bit) Chỉ sự ƣu tiên của gói.

3 Chỉ số liên kết dữ liệu (1 bit)

Giá trị 1 chỉ thị một trƣờng tải trọng bắt đầu với một mã mở đầu hình ảnh hay từ đồng bộ âm thanh.

4 Sao chép phía phải (1 bit) Giá trị 1 chỉ thị trƣờng tải trọng gói PES đƣợc

bảo vệ bản quyền.

5 Bản gốc hoặc sao chép (1 bit) Giá trị 1 chỉ thị trƣờng tải trọng gói PES là nguyên gốc

6 Các cờ PTS-DTS (2bit)

Giá trị 10 và 11 chỉ thị có PTS hiện diện phía sau, ngay trong tiêu đề này, giá trị 11 chỉ thị có DTS hiện diện cịn giá trị 00 chỉ thị khơng có cả PTS và DTS.

7 Cờ ES CR (1 bit) Giá trị 1 chỉ thị chuẩn đồng hồ hiện diện trong

tiêu đề gói PES.

8 Cờ tỷ lệ ES (1 bit) Giá trị 1 chỉ thị tốc độ bit hiện diện trong tiêu

đề gói PES.

9 DSM Trick Mode Flag (1 bit) Giá trị 1 chỉ sự hiện diện của trƣờng chế độ kỹ xảo dài 8 bit phía sau.

10 Cờ sao chép bổ sung thông tin (1 bit)

Giá trị 1 chỉ thị sự hiện diện của thông tin bản quyền.

11 Cờ PES phát hiện lỗi CRC (Cyclic

SVTH: Võ Hoàng BaRi Lớp: KTVT – K48

3.3.7 Ghép kênh dịng chƣơng trình

Mơ hình hệ thống ghép kênh dịng chƣơng trình đƣợc chỉ ra trong Hình 3.10. Một dịng chƣơng trình nhƣ trên Hình 3.11 là kết quả ghép kênh một vài dòng cơ sở đóng gói PES sử dụng cùng một hệ thống xung nhịp thời gian. Dịng chƣơng trình có thể là một dịng hình ảnh có kèm âm thanh hoặc một chƣơng trình nhiều kênh âm thanh. Ghép kênh dịng chƣơng trình Dịng chƣơng trình Video PES Audio PES Hình 3.10: Ghép kênh dịng chƣơng trình

Dịng hình ảnh cơ sở đƣợc chia thành các đơn vị truy cập AU (Access Units). Mỗi AU chứa dữ liệu đã đƣợc nén của một ảnh. Các ảnh này phân biệt bởi ảnh I, P hoặc B. Mỗi hình ảnh AU là một gói chƣơng trình, các gói này thay đổi về kích thƣớc. Ví dụ, gói ảnh I lớn hơn nhiều so với gói ảnh B. Tuy nhiên, đối với các đơn vị truy cập âm thanh số DAA (Digital Audio Access) thƣờng có cùng kích thƣớc và vài DAA tạo thành một gói dịng chƣơng trình.

Hình 3.11: Dịng chƣơng trình

Tóm lại, dịng chƣơng trình đƣợc thiết kế để truyền trong mơi trƣờng khơng có tạp nhiễu và sai sót.

3.3.8 Ghép kênh dịng truyền tải

Mơ hình hệ thống ghép kênh dịng truyền tải TS chỉ ra trong Hình 3.12. Nếu chia các gói PES có độ dài khác nhau thành các gói TS có độ dài khơng đổi (mỗi

SVTH: Võ Hoàng BaRi Lớp: KTVT – K48

gói TS đƣợc bắt đầu bằng TS tiêu đề và thƣờng có chiều dài 188 bytes) và truyền các gói này đi sau khi đã cộng với dịng bit điều khiển dùng để mơ tả chƣơng trình (cũng đƣợc đóng gói thành các gói truyền tải), ta sẽ có dịng truyền tải TS nhƣ ở Hình 3.13.

Hình 3.12: Ghép kênh dòng truyền tải

Trong dịng truyền tải, các gói PES từ các dịng gói sơ cấp khác nhau đƣợc phân nhỏ và gán vào phần tải trọng của gói TS. Quy trình này phải thỏa mản hai điều kiện là byte đầu tiên của mỗi gói PES phải trở thành byte đầu tiên của phần tải trọng của gói TS, và bất kỳ gói TS nào cũng chỉ mang phần dữ liệu lấy từ cùng một gói PES.

Hình 3.13: Dịng truyền tải

Mỗi gói PES khơng thể phân chia dữ liệu của nó một cách chính xác vào một số ngun gói TS. Thƣờng gặp trƣờng hợp khơng đủ số liệu để lấp đầy vào tải trọng của gói TS cuối cùng. Để thỏa mãn hai điều kiện trên, ngƣời ta độn thêm phần thích ứng với độ dài thích hợp. Có thể giảm thiểu độ dài phần thích ứng này bằng cách lựa chọn chiều dài gói PES hợp lý. Gói PES cũng thƣờng đƣợc chọn đủ dài để đa số

SVTH: Võ Hoàng BaRi Lớp: KTVT – K48

các gói TS đƣợc lấp đầy bởi số liệu có ích lấy từ các gói PES. Hình 3.14 mơ tả việc chia các gói PES thành các gói TS.

Hình 3.14: Chia các gói PES thành các gói TS

Mặc dù, MPEG-2 đƣợc sử dụng trong truyền hình cáp và vệ tinh, nhƣng MPEG-2 có những hạn chế đối với các mạng có băng thơng giới hạn. Do đó, một cơng nghệ nén mới với nhiều tính năng đã đƣợc phát triển trong những năm gần đây với mục đích truyền hình ảnh qua mạng băng thơng giới hạn. MPEG-4 part 10 đƣợc sử dụng trong hạ tầng mạng IPTV.

3.4 Chuẩn MPEG-4

Chuẩn MPEG-4 là một chuẩn động dễ thay đổi với MPEG-4, các đối tƣợng khác nhau trong một khung hình có thể đƣợc mơ tả, mã hố và truyền đi một cách riêng biệt đến bộ giải mã trong các dòng cơ bản ES khác nhau. Cũng nhờ vào việc xác định, tách và xử lý riêng các đối tƣợng (nhƣ nhạc nền, âm thanh xa gần, đồ vật, đối tƣợng ảnh, hình ảnh nhƣ con ngƣời hay động vật, nền khung hình), nên ngƣời sử dụng có thể loại bỏ riêng từng đối tƣợng khỏi khn hình. Sự tổ hợp lại thành khung hình chỉ đƣợc thực hiện sau khi giải mã các đối tƣợng này.

Đặc điểm chính của MPEG-4 là mã hóa hình ảnh và âm thanh với tốc độ bit rất thấp. Thực tế tiêu chuẩn đƣa ra với ba dãy tốc độ bit là dƣới 64 Kbps, 64 Kbps đến 384 Kbps, và 384 Kbps đến 4Mbps.

Đặc điểm quan trọng của chuẩn MPEG-4 là cho phép khôi phục lỗi tại phía đầu thu. Vì vậy, chuẩn nén đặc biệt thích hợp với mơi trƣờng dễ xảy ra lỗi nhƣ truyền dữ liệu qua các thiết bị cầm tay. MPEG-4 là chuẩn quốc tế đầu tiên dành cho mã hóa

SVTH: Võ Hồng BaRi Lớp: KTVT – K48

các đối tƣợng hình ảnh. Với độ linh động và hiệu quả do mã hóa từng đối tƣợng hình ảnh, MPEG-4 đạt ứng dụng cho các dịch vụ nội dung hình ảnh có tính tƣơng tác và các dịch vụ truyền thơng hình ảnh trực tiếp hay lƣu trữ. Trong MPEG-4, khung cảnh của một đối tƣợng hình ảnh đƣợc mã hóa riêng lẽ. Sự cách ly các đối tƣợng hình ảnh nhƣ vậy mang đến độ mềm dẻo hơn cho việc thực hiện mã hóa thích nghi làm tăng hiệu quả nén tín hiệu. Mặc dù, tập trung vào những ứng dụng tốc độ bit thấp nhƣng MPEG-4 cũng bao gồm cả phòng thu âm chất lƣợng cao và HDTV.

Hình 3.15: Cấu trúc bộ mã hóa và giải mã MPEG-4

Các bộ phận chức năng chính trong các thiết bị MPEG-4 bao gồm bộ mã hố hình dạng ngồi dùng để nén đoạn thông tin, giúp xác định khu vực và đƣờng viền bao quanh đối tƣợng trong khung hình scene. Bộ dự đốn và tổng hợp động để giảm thông tin dƣ thừa theo thời gian. Bộ mã kết cấu mặt ngoài dùng để xử lý dữ liệu bên trong và các dữ liệu còn lại sau khi đã bù chuyển động.

Hình 3.16 là một ví dụ về mã hóa và tổng hợp khung hình hình ảnh sử dụng trong MPEG-4. Nhiều đối tƣợng, ngƣời, xe, nhà cửa, đƣợc tách ra khỏi hình ảnh đầu vào. Mỗi đối tƣợng hình ảnh sau đó đƣợc mã hóa bởi bộ mã hóa đối tƣợng hình ảnh VO (video object) và sau đó đƣợc truyền đi trên mạng. Tại đầu thu, những đối tƣợng này đƣợc giải mã riêng rẽ nhờ bộ giải mã VO và gửi đến bộ tổ hợp. Ngƣời sử dụng có thể tƣơng tác với thiết bị để cấu trúc lại khung hình gốc (a), hay để xử lý các đối tƣợng tạo ra một khung hình khác (b). Ngồi ra, ngƣời sử dụng có thể tải các đối tƣợng khác từ các thƣ viện cơ sở dữ liệu (có sẵn trên thiết bị hay từ xa thơng qua mạng LAN, WAN hay Internet) để chèn thêm vào hay thay thế các đối tƣợng

SVTH: Võ Hoàng BaRi Lớp: KTVT – K48

có trong khn hình gốc (c). Trƣờng hợp (a), (b), và (c) đƣợc đánh dấu nhƣ trong Hình 3.16.

Hình 3.16: Mã hóa và tổng hợp khung hình trong MPEG-4

Để có thể thực hiện việc tổ hợp khung hình, MPEG-4 sử dụng một ngơn ngữ mơ tả khung hình riêng, đƣợc gọi là định dạng nhị phân cho các khung hình BiFS (Binary Format for Scenes). BiFS không chỉ mô tả ở đâu và khi nào các đối tƣợng xuất hiện trong khung hình, mà nó cịn mơ tả cách thức hoạt động của đối tƣợng (làm cho một đối tƣợng xoay tròn hay chồng mờ hai đối tƣợng lên nhau) và cả điều kiện hoạt động đối tƣợng và tạo cho MPEG-4 có khả năng tƣơng tác. Trong MPEG- 4, tất cả các đối tƣợng có thể đƣợc mã hoá với sơ đồ mã hoá tối ƣu riêng của nó - hình ảnh đƣợc mã hố theo kiểu hình ảnh, văn bản đƣợc mã hố theo kiểu văn bản, các đồ họa đƣợc mã hóa theo kiểu đồ họa - thay vì việc xử lý tất cả các phần tử ảnh nhƣ là mã hố hình ảnh ảnh động. Do các q trình mã hố đã đƣợc tối ƣu hố cho từng loại dữ liệu thích hợp, nên chuẩn MPEG-4 sẽ cho phép mã hoá với hiệu quả cao tín hiệu ảnh hình ảnh, âm thanh và cả các nội dung tổng hợp nhƣ các bộ mặt và cơ thể hoạt hình.

SVTH: Võ Hồng BaRi Lớp: KTVT – K48

3.5 Chuẩn nén H.264/AVC

3.5.1 Giới thiệu chung

Kể từ khi mới xuất hiện, chuẩn nén hình ảnh MPEG-2 đã hồn tồn thống lĩnh thế giới truyền thông. Cũng trong thời gian này, chuẩn nén MPEG-2 đã đƣợc cải tiến về nhiều mặt. Bây giờ, nó có tốc độ bit thấp hơn và việc ứng dụng nó đƣợc mở rộng hơn nhờ có các kỹ thuật nhƣ đốn chuyển động, tiền xử lý, xử lý đối ngẫu và phân bổ tốc độ bit tùy theo tình huống thơng qua ghép kênh thống kê.

Tuy nhiên, chuẩn nén MPEG-2 cũng không thể đƣợc phát triển một cách vô hạn định. Thực tế hiện nay cho thấy chuẩn nén này đã đạt đến hết giới hạn ứng dụng của mình trong lĩnh vực truyền truyền hình từ sản xuất tiền kỳ đến hậu kỳ và lƣu trữ hình ảnh số. Bên cạnh đó, nhu cầu nén hình ảnh lại đang ngày một tăng cao kèm theo sự phát triển mạnh mẽ của mạng IP mà tiêu biểu là mạng Internet. Khối lƣợng nội dung mà các công ty truyền thông cũng nhƣ các nhà cung cấp dịch vụ thơng tin có thể mang lại ngày càng lớn. Ngồi ra, họ cịn có thể cung cấp nhiều dịch vụ theo yêu cầu thông qua hệ thống cáp, vệ tinh và các hạ tầng Viễn thông đặt biệt là mạng Internet.

Các tiêu chuẩn mã hố hình ảnh ra đời và phát triển với mục tiêu cung cấp các phƣơng tiện cần thiết để tạo ra sự thống nhất giữa các hệ thống đƣợc thiết kế bởi những nhà sản xuất khác nhau đối với mọi loại ứng dụng hình ảnh. Nhờ vậy, thị trƣờng hình ảnh có điều kiện tăng trƣởng mạnh. Chính vì lý do này nên những ngƣời sử dụng bộ giải mã cần có một chuẩn nén mới để đi tiếp chặng đƣờng mà MPEG-2 đã bỏ dở.

Hiệp hội Viễn thông quốc tế (ITU) và tổ chức tiêu chuẩn quốc tế, Uỷ ban kỹ thuật điện tử quốc tế (ISO/IEC) là hai tổ chức phát triển các tiêu chuẩn mã hố hình ảnh. Theo ITU-T, các tiêu chuẩn mã hố hình ảnh đƣợc coi là các khuyến nghị gọi tắt là chuẩn H.26x (H.261, H.262, H.263 và H.264). Với tiêu chuẩn ISO/IEC, chúng đƣợc gọi là MPEG-x (nhƣ MPEG-1, MPEG-2 và MPEG-4).

SVTH: Võ Hoàng BaRi Lớp: KTVT – K48

Những khuyến nghị của ITU đƣợc thiết kế dành cho các ứng dụng truyền thơng hình ảnh thời gian thực nhƣ hội thảo hình ảnh hay điện thoại truyền hình. Mặt khác, những tiêu chuẩn MPEG đƣợc thiết kế hƣớng tới mục tiêu lƣu trữ hình ảnh chẳng hạn nhƣ trên đĩa quang DVD, quảng bá hình ảnh số trên mạng cáp, đƣờng truyền số DSL, truyền hình vệ tinh hay những ứng dụng truyền dịng hình ảnh trên mạng Internet hoặc thơng qua mạng khơng dây.

Với đối tƣợng để truyền dẫn hình ảnh là mạng Internet thì ứng cử viên hàng đầu là chuẩn nén MPEG-4 AVC, còn đƣợc gọi là H.264, MPEG-4 part 10, H.26L hoặc JVT.

3.5.2 Tính kế thừa của chuẩn nén H.264

Mục tiêu chính của chuẩn nén H.264 đang phát triển nhằm cung cấp hình ảnh có chất lƣợng tốt hơn nhiều so với những chuẩn nén hình ảnh trƣớc đây. Điều này có thể đạt đƣợc nhờ sự kế thừa các lợi điểm của các chuẩn nén hình ảnh trƣớc đây. Khơng chỉ thế, chuẩn nén H.264 cịn kế thừa phần lớn lợi điểm của các tiêu chuẩn trƣớc đó là MPEG-4 bao gồm 4 đặc điểm chính nhƣ phân chia mỗi hình ảnh thành các khối (bao gồm nhiều điểm ảnh). Do vậy, q trình xử lý từng ảnh có thể đƣợc tiếp cận tới mức khối.Thứ hai là đặc điểm khai thác triệt để sự dƣ thừa về mặt không gian tồn tại giữa các hình ảnh liên tiếp bởi một vài mã của những khối gốc thơng qua dự đốn về không gian, phép biến đổi, quá trình lƣợng tử và mã hố Entropy (hay mã có độ dài thay đổi VLC).Tiếp theo là đặc điểm khai thác sự phụ thuộc tạm thời của các khối của các hình ảnh liên tiếp. Bởi vậy, chỉ cần mã hoá những chi tiết thay đổi giữa các ảnh liên tiếp. Việc này đƣợc thực hiện thơng qua dự đốn và bù chuyển động. Với bất kỳ khối nào cũng có thể đƣợc thực hiện từ một hoặc vài ảnh mã hố trƣớc đó hay ảnh đƣợc mã hố sau đó để quyết định véc tơ chuyển động, các véc tơ này đƣợc sử dụng trong bộ mã hoá và giải mã để dự đoán các loại Khối. Cuối cùng, đặc điềm về khai thác tất cả sự dƣ thừa về khơng gian cịn lại trong ảnh bằng việc mã các Khối dƣ thừa. Ví dụ, nhƣ sự khác biệt giữa khối gốc và khối dự đốn sẽ đƣợc mã hố thơng qua q trình biến đổi, lƣợng tử hố và mã hoá Entropy.

SVTH: Võ Hoàng BaRi Lớp: KTVT – K48

3.5.3 Mã hóa H.264

Hình 3.17: Sơ đồ mã hố hình ảnh của H264/MPEG Part 10

Hình 3.17 là sơ đồ về mã hóa hình ảnh của H264/MPEG Part 10. Lớp mã hố hình ảnh của H264/MPEG Part 10 là sự kết hợp của mã hoá khơng gian, mã hố thời gian và mã chuyển vị. Ảnh đƣợc tách thành các khối, ảnh đầu tiên của dãy hoặc điểm truy cập ngẫu nhiên thì đƣợc mã hố Intra-mã hố trong ảnh, có nghĩa là không dùng thông tin của các ảnh khác mà chỉ dùng thông tin chứa trong ảnh đó. Mỗi mẫu của một khối trong một khung mã hóa bên trong ảnh đƣợc dự đốn nhờ

Một phần của tài liệu đề tài công nghệ IPTV (Trang 58)

Tải bản đầy đủ (PDF)

(100 trang)