Chuẩn H.264 khụng quy định từng bộ mó hoỏ và giải mó cụ thể mà chỉ định nghĩa quy tắc của dũng bit được mó hoỏ và cỏch thức giải mó dũng bit đú. Tuy nhiờn, trong thực tế thỡ một bộ mó hoỏ và giải mó đều cú những khối chức năng chứa cỏc thành phần chung. Cỏc thành phần chức năng như bộ dự đoỏn, bộ biến đổi, bộ lượng tử hoỏ, bộ mó hoỏ entropy gần giống như trong cỏc chuẩn trước nhưng sự khỏc nhau chớnh là chi tiết cỏc thành phần bờn trong nú.[5]
Một bộ mó hoỏ bao gồm 2 dũng dữ liệu, một dũng đầu vào từ trỏi qua phải và một dũng xõy dựng lại đi từ phải qua trỏi. Khung Fn được xử lý bằng cỏch chia thành cỏc khối macroblock, mỗi khối macroblock được mó hoỏ trong ảnh hoặc mó hoỏ liờn ảnh. Khối macroblock P hỡnh thành dựa trờn khung xõy dựng lại. Ở chế độ mó hoỏ trong ảnh thỡ P được hỡnh thành bằng cỏch lấy mẫu khung hiện tại n đó được mó hoỏ, giải mó và xõy dựng lại (uF’n trờn hỡnh). Đối với nộn liờn ảnh thỡ P được hỡnh thành bằng cỏch sử dụng dự đoỏn bự chuyển động từ một hay nhiều khung tham chiếu. Theo
hỡnh vẽ 3.17, khung tham chiếu là khung F’n-1, việc dự đoỏn mỗi macroblock cú thế được tạo từ một hay hai khung trước hoặc sau khung hiện tại. Macroblock hiện tại trừ đi khối P tạo ra khối macroblock sai khỏc Dn. Khối này được biến đổi và lượng tử hoỏ cho X là tập hợp cỏc hệ số lượng tử. Những hệ số này được sắp xếp lại và được mó hoỏ entropy sau đú được truyền đến lớp trừu tượng mạng (NAL).
Hỡnh 3.17 Sơ đồ nguyờn lý của bộ mó hoỏ H.264
Khối macroblock hệ số X được giải mó theo thứ tự và được xõy dựng lại khung cho việc mó hoỏ cỏc khối khỏc. Cỏc hệ số X được co dón Q-1 và được biến đổi ngược (T-1) để tạo ra khối macroblock sai khỏc D’n, sau quỏ trỡnh lượng tử hoỏ thỡ D’n là Dn bị mộo dạng. Khối macroblock dự đoỏn được cộng D’n để tạo ra khối xõy dựng lại uF’n. Một bộ lọc được sử dụng để giảm cỏc ảnh hưởng của việc mộo dạng khối và mộo dạng khung tham chiếu từ chuỗi cỏc khối F’n.
Hỡnh 3.18 Sơ đồ nguyờn lý của bộ giải mó H.264
Fn (hiện tại) Mó hoỏ Entropy Xếp lại thứ tự Q T ME F’n-1 (tham chiếu) MC Chọn dự đoỏn trong ảnh Dự đoỏn trong ảnh F’n
(xõy dựng lại) Bộ lọc uF’n T-1 Q-1 D’n + + + - Liờn ảnh Trong ảnh P NAL F’n-1 (tham chiếu) MC Dự đoỏn trong ảnh F’n
(xõy dựng lại) Bộ lọc uF’n T-1 Q-1 D’n + + Liờn ảnh Trong ảnh P Giải hoỏ Entropy Xếp lại thứ tự NAL
Bộ giải mó nhận vào một luồng bit đó được nộn từ NAL. Cỏc phần tử dữ liệu được giải mó entropy và sắp xếp lại để tạo ra một tập hợp cỏc hệ số lượng tử X. Sau đú cỏc hệ số này được co dón và biến đổi ngược để tạo ra D’n. Bộ giải mó sử dụng cỏc thụng tin tiờu đề đó được giải mó từ dũng bit để tạo ra khối macroblock P. P được cộng thờm D’n để tạo ra uF’n và được lọc để tạo thành khối F’n.
3.3.3.2. Những đặc điểm nổi bật của chuẩn H.264
- Lớp mạng trừu tượng: Lớp mạng trừu tượng cung cấp khả năng ỏnh xạ dữ liệu lớp nộn video của chuẩn H.264 sang lớp giao vận trong mụ hỡnh tham chiếu OSI. Cỏc thành phần cơ bản NAL là cỏc đơn vị NAL, luồng bute và định dạng dữ liệu đơn vị NAL, tập hợp cỏc tham số và cỏc đơn vị truy nhập, than thiện với mạng. Làm đơn giản và tuỳ chọn hiệu quả việc sử dụng lớp nộn video.
- Cấu trỳc quy tắc đơn vị NAL. Mỗi cấu trỳc quy tắc trong H.264 được đặt trong một gúi dữ liệu logic gọi là đơn vị NAL. Đơn vị NAL cú cấu trỳc cho phộp tuỳ chọn phương phỏp mang nội dung video theo những cỏch thức thớch hợp tuỳ thuộc vào mạng xỏc định.
- Kớch thước của khối bự chuyển động nhỏ. Chuẩn H.264 hỗ trợ kớch thước của khối bự chuyển động nhỏ hơn kớch cớ trong cỏc chuẩn khỏc. Một khối thành phần chúi nhỏ nhất cú kớch cỡ là 4x4.
- Tăng tốc độ lấy mẫu bự chuyển động. Hầu hết cỏc chuẩn trước đõy cho phộp lấy chớnh xỏc mẫu 1/2. Chuẩn mới H.264 cho phộp được thiết kế nhằm tăng khả năng chớnh xỏc việc bự chuyển động bằng cỏch đặt chớnh xỏc việc lấy mẫu 1/4. Cỏch này giống như sử dụng trong chuẩn MPEG-4 visual (part 2) nhưng cú ưu điểm là giảm sự phức tạp của quỏ trỡnh xử lý nội suy so với cỏc chuẩn khỏc. - Vectơ chuyển động trờn biờn của ảnh. Trong khi cỏc vectơ chuyển động trong
MPEG-2 và cỏc tiờu chuẩn trước yờu cầu cỏc điểm chỉ được trong phạm vi của ảnh tham chiếu đó được giải mó trước đú thỡ đến chuẩn H.263 đó dựng kỹ thuật ngoại suy biờn và kỹ thuật này được ỏp dụng vào chuẩn H.264.
- Bự chuyển động sử dụng tham chiếu nhiều ảnh. Cỏc ảnh mó hoỏ được dự đoỏn trong MPEG-2 và cỏc chuẩn trước sử dụng một ảnh trước đú để dự đoỏn giỏ trị của ảnh tiếp theo. Việc thiết kế mới cho phộp tham chiếu từ nhiều ảnh trước đú được ỏp dụng vào trong chuẩn H.263++ cho phộp mó hoỏ hiệu quả
hơn. Kỹ thuật này cho phộp tăng khả năng chọn lựa của bộ mó hoỏ nhằm bự chuyển động được phộp đối với cả hai chiều, khắc phục được nhược điểm của MPEG-2 chỉ cho phộp sử dụng hai ảnh xỏc định ảnh I trước đú hoặc ảnh P theo thứ tự sắp xếp và ảnh I hay ảnh P tiếp theo.
- Khả năng quyết định chuyển động là được “bỏ qua” hay “trực tiếp”. Trong cỏc chuẩn trước đõy, vựng được bỏ qua của ảnh mó hoỏ khụng thể chuyển động trong nội dung của hoạt cảnh, điều này dẫn đến những ảnh hưởng xấu khi việc mó hoỏ viđeo chứa cỏc di chuyển toàn phần. Chuẩn H.264 được thiết kế thờm một chế độ bự chuyển động “trực tiếp” để tăng khả năng bự chuyển động. Kỹ thuật này được ỏp dụng trong H.263++ và MPEG-4 Visual.
- Nộn trong ảnh cú khả năng dự đoỏn khụng gian trực tiếp. Một kỹ thuật mới cho phộp ngoại suy biờn của những phần được giải mó trước đú của ảnh hiện tại được đưa vào vựng của mó hoỏ trong ảnh. Kỹ thuật cho phộp tăng khả năng tớn hiệu dự đoỏn, đồng thời cho phộp dự đoỏn từ cỏc vựng lõn cận khụng được mó hoỏ trong ảnh.
- Kớch thước khối chuyển động nhỏ. Tất cả cỏc chuẩn mó hoỏ video trước đõy thường sử dụng khối cú kớch cỡ 8x8, trong khi đú thỡ H.264 được thiết kế dựa trờn những khối chuyển đổi 4x4. Ưu điểm của khối nhỏ là cho phộp thớch nghi, việc dự đoỏn nội dung tốt hơn, cho phộp chỉnh sửa từng phần của ảnh và cú khả năng cung cấp cỏc vựng chuyển đổi bao quanh ảnh.
- Lọc giải mó khối. Cỏc phương phỏp mó hoỏ dựa trờn từng khối sử dụng cả khối dự đoỏn và khối hiện tại để giải mó. Ứng dụng cỏc bộ lọc tuyến tớnh để giải mó khối là phương phỏp làm tăng chất lượng video. H.264 thiết kế bộ lọc dự đoỏn chuyển động trong cỏc vũng lặp để tăng chất lượng khi dự đoỏn liờn ảnh.
- Chuyển đổi cỏc khối theo phõn cấp. Bờn cạnh lợi ớch của việc sử dụng những khối nhỏ 4x4 thỡ cú một vài tớn hiệu chứảnh cỏc tương quan đầy đủ yờu cầu phải xử lý những chức năng cơ bản. Chuẩn H.264 cho phộp xử lý phõn cấp để kế thừa kớch thước khối với thụng tin về cỏc thành phần màu cú tần số thấp sử dụng mảng 8x8 và cho phộp bộ mó hoỏ lựa chọn cỏch thức mó trong ảnh, mở rộng chiều dài biến đổi cho cỏc thụng tin về thành phần chúi 16x16.
- Chiều dài chuyển đổi ngắn. Cỏc chuẩn trước yờu cầu cỏc bộ mó hoỏ và giải mó sử dụng phộp tớnh toỏn dựa trờn 32 bit, trong khi đú chuẩn H.264 chỉ yờu cầu tớnh toỏn 16 bit.
- Khả năng chuyển đổi ngược chớnh xỏc. Trong cỏc chuẩn trước, việc chuyển đổi video cho phộp lỗi trong một khoảng xỏc định, do đú khi giải mó thỡ độ chớnh xỏc tuỳ thuộc vào cỏch bộ mó hoỏ hoạt động, ảnh hưởng đến chất lượng video. H.264 là tiờu chuẩn đầu tiờn cho phộp nhận lại chớnh xỏc chất lượng của nội dung video được giải mó từ tất cả cỏc bộ mó hoỏ.
- Thuật toỏn mó hoỏ Entropy. Chuẩn H.264 sử dụng thuật toỏn mó hoỏ entropy tiờn tiến hơn cỏc thuật toỏn của cỏc chuẩn trước đõy. Kỹ thuật H.264 ỏp dụng được gọi là thuật toỏn mó hoỏ nhị phõn thớch nghi theo nội dung (CABAC) và mó hoỏ chiều dài thớch nghi theo nội dung
- Cấu trỳc tập hợp tham số. Tõp cỏc tham số được thiết kế để tăng khả năng vận chuyển thụng tin tiờu đề một cỏch linh hoạt, mạnh mẽ. Cỏc thụng tin quan trọng mang tớnh quyết định được chia ra để dễ khụi phục và trỏnh khả năng mất hoàn toàn thụng tin.
- Thứ tự cỏc macroblock linh hoạt (FMO). Mỗi khung trượt trong nhúm trở thành một đơn vị độc lập, cú thể giải mó được. Cỏc macroblock được gỏn theo thứ tự để đảm bảo dữ liệu được quản lý về mặt khụng gian giữa cỏc vựng được mó hoỏ trong mỗi khung trượt.
- Thứ tự cỏc khung trượt tuỳ ý. Vỡ mỗi khung trượt của ảnh được mó hoỏ cú thể giải mó độc lập với cỏc khung trượt của ảnh nờn H.264 được thiết kế để cho phộp cỏc khung này cú thể gửi và nhận theo thứ tự bất kỳ. Đặc điểm này giỳp chuẩn H.264 cú thể được sử dụng khi truyền video trờn cỏc mạng khụng đảm bảo thứ tự truyền thống như mạng Internet. Ngoài ra, chuẩn H.264 cũn cho phộp kớch thước của cỏc khung trượt linh hoạt.
- Cỏc ảnh dư thừa. Để cho phộp tăng khả năng chống lỗi thỡ H.264 cho phộp bộ mó hoỏ gửi thụng tin dư thừa dự phũng, giảm khả năng mất dữ liệu quan trọng khi truyền dữ liệu.
- Phõn chia dữ liệu. Chuẩn H.264 cho phộp mỗi slice được chia thành 3 phần khỏc nhau để truyền, phụ thuộc vào quy tắc phõn loại cỏc thành phần.
- Cỏc ảnh đồng bộ/chuyển mạch SP và SI. Ngoài cỏc ảnh cơ bản như I, P, B thỡ H.264 cũn cú thờm hai ảnh mới là SP và SI cho phộp đồng bộ quỏ trỡnh giải mó của cỏc bộ mó hoỏ. Nú cho phộp chuyển mạch một bộ mó hoỏ giữa cỏc cỏch biểu diễn nội dung video khi tốc độ khỏc nhau, khụi phục dữ liệu bị mất hay bị lỗi, chuyển cỏc chế độ khỏc nhau.
Bảng 3.4 Cỏc mức nộn tuỳ chọn H.264 Số
Mức Loại khung Tốc độ khung
Max Tốc độ bit Max Khung hỡnh tham chiếu 1 QCIF 15 64 kbps 4 1b QCIF 15 128 kbps 4
1.1 CIF hoặc QCIF 7.5 (CIF)/30 (QCIF) 192 kbps 2(CIF)/(QCIF)
1.2 CIF 15 384kbps 6
1.3 CIF 30 768 kbps 6
2 CIF 30 2 Mbps 6
2.1 HHR(480i hoặc 576i) 30/25 4 Mbps 6
2.2 SD 15 4 Mbps 5
3 SD 30/25 10 Mbps 5
3.1 1280 x720p 30 14 Mbps 5
3.2 1280 x 720p 60 20 Mbps 4
4 HD (720p hoặc 1080i) 60p /30i 20 Mbps 4
4.1 1920 x 1080p 60p /30i 50 Mbps 4
4.2 2k x 1k 60p 50 Mbps 4
5 2k x1k hoặc 4k x 2k 72 135 Mbps 5
5.1 120/30 240 Mbps 5
Bảng 3.5 So sỏnh tiết kiệm tốc độ bit giữa H.264 và cỏc chuẩn nộn khỏc
Chuẩn nộn MPEG-4 ASP H.263 HLP MPEG-2
H.264 38,2% 48,8% 64,46%
MPEG-4 ASP 16,65% 42,95%
Hỡnh 3.19. So sỏnh tỷ lệ PSNR với cỏc chuẩn nộn khỏc 3.4. Kết luận
Kỹ thuật nộn ngày càng hoàn thiện và đối với mỗi một ứng dụng, chỳng ta cú thể chọn lựa những thuật toỏn nộn thớch hợp để đảm bảo chất lượng hỡnh ảnh và tốc độ bit. Trong ứng dụng hội nghị truyền hỡnh (HNTH) trờn mạng IP đũi hỏi khắt khe về tốc độ bit nhưng nú vẫn phải đảm bảo chất lượng hỡnh ảnh. Tuy nhiờn với tớnh chất khung hỡnh trong cuộc đàm thoại của HNTH thay đổi rất ớt, vỡ vậy với những thuật toỏn nộn như MPEG-4 part 2, MPEG-7, và đặc biệt là H.264 cú thể cho phộp tốc độ bit xuống đến 32Kbit/s.
CHƢƠNG 4: CHẤT LƢỢNG DỊCH VỤ HỘI NGHỊ TRUYỀN HèNH
Chất lượng dị ch vụ truyề n hỡnh trờn mạng IP sẽ bị ảnh hưởng và suy giảm do tỏc động của cỏc yếu tố mạng. Cỏc yếu tố mạng bao gồm tỷ lệ tổn thất gúi tin, trễ mạng và biến động trễ mạng là cỏc tham số chớnh tỏc động đến chất lượng dịch vụ của tớn hiệu tại đầu thu. Từ quan điểm dịch vụ đầu cuối - đến - đầu cuối, tỷ lệ tổn thất gúi tin tổng quỏt bao hàm tỷ lệ tổn thất mạng và tỷ lệ tổn thất do hủy gúi tại bộ đệm tỏi tạo. Độ trễ tổng quỏt bao gồm trễ mạng và trễ bộ đệm, gõy nờn do thời gian lưu gúi tin tại bộ đệm tỏi tạo. Ngoài tỷ lệ tổn thất gúi tin và độ trễ, chất lượng tớn hiệu thu nhận cũn phụ thuộc vào cỏc chuẩn CODEC, giải thuật bự tổn thất gúi tin và đặc biệt là phương thức điều khiển lịch trỡnh tỏi tạo gúi tin của bộ đệm tại tạo tại đầu thu.
4.1. Những tham số cơ bản về chất lƣợng dịch vụ Hội nghị truyền hỡnh.
4.1.1. Tổn thất gúi tin
Tổn thất gúi tin là một trong những nguyờn nhõn chớnh gõy ảnh hưởng đến chất lượng của dịch vụ trờn mạng IP. Tổn thất gúi tin cú thể xảy ra do hủy gúi tin trong mạng IP (tổn thất mạng) hoặc loại bỏ gúi tin do bộ giao tiếp mạng hoặc bộ đệm tỏi tạo tại đầu cuối thu nhận. Tổn thất mạng thường xảy ra do tắc nghẽn dẫn tới tràn bộ đệm trong bộ định tuyến, do sự định tuyến khụng ổn định hoặc do độ khụng tin cậy của đường truyền như trong trường hợp kờnh vụ tuyến, trong đú tắc nghẽn là nguyờn nhõn chủ yếu gõy nờn tổn thất.
Theo mụ hỡnh tổn thất Bernoulli [17],[18] tổn thất của mỗi gúi tin là độc lập với nhau (đặc tớnh khụng nhớ) cho dự gúi tin kề trước bị tổn thất hoặc khụng tổn thất. Trạng thỏi tổn thất của gúi tin được xem xột như một biến ngẫu nhiờn N
i i
L 1cú tớnh chất phõn bố xỏc định độc lập IID (Independent and Identical Distributed). Giỏ trị biến ngẫu nhiờn Li = 1 tương ứng với tỡnh trạng gúi tin thứ i bị tổn thất với xỏc xuất Pi là độc lập với gúi tin thứ j với j i . Giỏ trị xỏc xuất Pi = P với tất cả cỏc gúi tin. Do đú, trong mụ hỡnh Bernoulli chỉ tồn tại một trạng thỏi. Giỏ trị xỏc xuất P~ được ước đoỏn thụng qua việc đo đạc tham số cỏc gúi tin từ nhận được tại đầu thu:
N L N L P tot N i i
Theo (4.1) giỏ trị ước đoỏn xỏc xuất P~ tương ứng với tổng số gúi tin bị tổn (4.1)
thất chia cho tổng số gúi tin đó truyền tải. Trong phương phỏp tớnh toỏn, mụ hỡnh Bernoulli được sử dụng nhằm xỏc định trạng thỏi tổn thất của gúi tin. Khi cú yờu cầu xỏc định trạng thỏi của gúi tin, một biến ngẫu nhiờn r được phỏt sinh theo phõn bố đều trong khoảng giỏ trị [0,1] với xỏc xuất bằng p. Nếu r < p gúi tin sẽ bị hủy tương ứng với trạng thỏi bị tổn thất và ngược lại.
4.1.2. Trễ và biến động trễ
Trễ và biến động trễ (jitter) là hai trong số cỏc yếu tố của mạng ảnh hưởng chớnh đến chất lượng truyền tải dịch vụ thời gian thực núi chung và truyền tải dịch vụ hội nghị truyền hỡnh trờn mạng IP núi riờng. Trễ từ đầu cuối đến đầu cuối được xỏc định là khoảng thời gian giữa bờn phỏt và bờn thu bao gồm những thành phần chủ yếu sau đõy:
• Trễ đường truyền: Là khoảng thời gian đề truyền tải một bit từ phớa phỏt đến phớa thu. Trễ đường truyền phụ thuộc vào khoảng cỏch vật lý của tuyến