2.9.1. Tổng quỏt
Xử lý tớn hiệu audio số cú hiệu quả cao. Bộ biến đổi A/D khụng làm suy giảm chất lượng tớn hiệu, cú thể truyền dưới dạng cỏc định dạng phự hợp.
Biến đổi audio số gồm cỏc giai đoạn: lấy mẫu, lượng tử hoỏ, mó húa. Lấy mẫu tương ứng với mỗi quỏ trỡnh điều biờn với tớn hiệu điều chế là cỏc xung cú tần số bằng tần số lấy mẫu.
2.9.2 Biểu diễn tớn hiệu
Cỏc mẫu thu được biểu diễn bằng một mó nhị phõn. Trong hệ thống tuyến tớnh 4 bit cú 16 mẫu để mó hoỏ biờn độ cho mỗi mẫu.
Cỏc mẫu được làm trũn tới mức gần nhất tương ứng sai số giữa tớn hiệu ban đầu và cỏc mẫu sau khi lượng tử hoỏ.
Giỏ trị của õm thanh được biểu diễn bằng số bự hai. Số nhị phõn bờn trỏi (MSB) chỉ dấu của biờn độ tớn hiệu cỏc hệ thống biến đổi A/D cú thể sử dụng 16 hoặc 20 bit để biểu diễn mẫu nhằm mục đớch giảm sai số lượng tử.
Cỏc hệ thống mó hoỏ được sử dụng ra điều xung mó (PCM), điều chế độ rộng xung (PWM), điều xung mó vi sai (DPCM).
2.9.3 Mó hoỏ kờnh truyền
Để trỏnh cỏc sai số cú thể sảy ra, cú thể sử dụng cỏc bộ lọc cú tớnh năng cao tần số lấy mẫu cao và sử dụng cỏc mó đặc biệt nh mó NRZ và mó BPM trong kờnh truyền.
Cỏc thành phần cú một chiều và lần số thấp khụng được truyền đi.
Tốc độ truyền tớn hiệu nhỏ hơn giới hạn đường truyền của kờnh thụng tin sẽ làm giảm khả năng mất thụng tin.
Cỏc tiờu chuẩn AES/EBC xỏc định mụi trường truyền là dõy dẫn cho dung lượng đường truyền cao cho dung lượng nối tiếp.
Đặc điểm mó NRZ: cỏc giỏ trị 0 và 1 được truyền đi theo mức õm và dương, do đú sự truyền tớn hiệu chỉ xuất hiện khi bit số liệu thay đổi.
Đặc điểm mó BPM: sự thay đổi luụn xuất hiện khi truyền bit 1 và khi bắt đầu truyền bit mới, do đú sự thay đổi hoặc khụng thay đụi mức tớn hiệu khi truyền một bit xỏc định được truyền là bit 0 hay bit 1.
2.9.4. Ghộp dũng tớn hiệu audio số
a. Cấu trỳc dũng audio số
Cỏc khung số liệu được tạo thành từ hai khung con A và B, cỏc khung con phối hợp số liệu từ cỏc nguồn hay kờnh tớn hiệu Audio.
Cỏc khung con được nhúm thành cỏc khối, mỗi khối bao gồm 192 khung. Mỗi khối được bắt đầu bằng cờ bỏo hiệu (z). Với tần số lấy mẫu là 48 KHz, mỗi khung Audio cú thời gian là 20,8às.
Mỗi khối số liệu audio chiếm khoảng thời gian là: 20,83x 192 = 4000às.
Từ đồng bộ bao gồm 4 bit để xỏc định một mẫu mới là một khối mới. Cú 3 từ đồng bộ được sử dụng là:
• Từ đồng bộ Z: thứ tự bit này để chỉ sự bắt đầu của khung của một khối mới. Từ mó này tạo ra từ Z.
• Từ mó X: chỉ sự bắt đầu của tất cả cỏc khung cũn lại.
• Từ mó Y: chỉ vị trớ bắt đầu của tất cả cỏc khung con B, mỗi khung audio chứa hai khung con, mỗi khung con cú 32 bit, 4 bit dữ liệu phụ cũng được mó hoỏ biểu diễn mẫu.
Cỏc bit số liệu phụ cũng cú thể mang thụng tin của cỏc tương phụ trong thời gian 4 ms hay 192 khung cú 192 x 4 = 768 bit cú thể tạo ra 64 từ mó hoỏ audio với độ chớnh xỏc 12 bit/từ. Dũng số này tương đương với dũng số lấy mẫu.
Mỗi khung con mang 1 bit chức năng.
• Bit V (Validịty): được thiết lập mức 0 nếu số liệu từ mẫu audio là đỳng và phự hợp với bộ biến đổi A/D.
• Bit U (User): bit U trong mỗi khung con được truyền đến một mảng nhỏ gồm 28 hàng. Mảng này chứa 192 bit U từ cựng một nguồn hay loại khung con audio bao gồm trong một khối số liệu.
• Bit C (Channel): tương tự bit U, bit C cú mặt trong cỏc khung phụ, được đa đến mảng tạo bởi 28 hàng. Số liệu trong mảng này xỏc định nội dựng lừ mó audio.
• Bit P (Pan ty): xỏc định trạng thỏi chẵn lẻ cho phộp kiờm tra lỗi trong dũng bắt.
b. Đồng bộ tớn hiệu audio số trong tớn hiệu truyền hỡnh
Trong tớn hiệu truyền hỡnh, tớn hiệu audio số cần được đồng bộ với tớn hiệu chuẩn video số, để đảm bảo được cỏc tương quan giữa tớn hiệu audio và video cũng nh cho phộp sử dụng cỏc tớn hiệu này một cỏch riờng biệt.
Trong hệ thống 625/50, số cỏc mẫu tớn hiệu audio trong một khung video là xỏc định (với tần số lấy mẫu là 48 KHz) thỡ tần số lấy mẫu 1920 mẫu. Tớn hiệu audio cú thể được đồng bộ với tớn hiệu video bằng cỏch lấy ra tớn hiệu chuẩn video 625/50.
Bảng 2.4. Cỏc tần số Lấy mẫu và số mẫu trờn một khung hỡnh trong tiờu chuẩn. Tần số lấy mẫu KHz Chuẩn quột 2997 Khung hỡnh/giõy Chuẩn quột 25 Khung hỡnh/giõy Chuẩn quột 30 Khung hỡnh/giõy 48 44,1 32 8008/5 147147/100 16016/15 1920/1 1764/1 1280/1 1600 1470 3200/3
Trong hệ thống 525/60 cỏc số mẫu audio trờn một khung video khụng phải số nguyờn (bằng 8008/5) được tớnh nh sau:
6 , 1601 s 208333 s 67 , 33366 = à à mẫu
Trong đú: 33 366,67 às là thời gian của một khung của một khung video và 20,8333 às là thời gian của một khung hỡnh audio. Theo đú cứ 5 khung video lại thu được một số nguyờn cỏc mẫu audio. Thứ tự số cỏc mẫu
tương ứng trong 5 khung video liờn tiếp được biến đổi lần lượt giữa cỏc số 1602 và 1602 sao cho trong 5 khung video này số mẫu audio này đỳng bằng 8008.
Kết luận
Trong chương 2, đồ ỏn đó trỡnh bày cỏc cấu trỳc lấy mẫu video số, lượng tử húa, mó húa, cỏc mó sơ cấp như NRZ, RZ, BiPH. Chương này cũng đưa ra cỏc tiờu chuẩn lấy mẫu thành phần, tiờu chuẩn truyền hỡnh số cơ bản và tiờu chuẩn audio số.
CHƯƠNG 3
KỸ THUẬT NẫN VIDEO SỐ
Trong cỏc dạng tớn hiệu thỡ tớn hiệu truyền hỡnh chiếm dải tần lớn nhất cho một kờnh thụng tin. Tớn hiệu video số thành phần (8 bớt) cú tốc độ là 216 Mbit/s. Dải phổ cần thiết để truyền tớn hiệu này cú bề rộng khụng dưới
(3x4)x216=162MHz. Để truyền tớn hiệu video số qua vệ tinh hoặc qua hệ thống trờn mặt đất thỡ cụng đoạn nộn tớn hiệu video là khụng thể thiếu.
3.1. Khỏi niệm về nộn tốc độ dũng bớt
3.1.1. Tổng quỏt
Nộn tớn hiệu là giảm bớt những số liệu dư thừa trong tớn hiệu video. Do cỏc chuỗi ảnh truyền hỡnh cú nhiều thành phần ảnh giống nhau. Ta cú thể bỏ qua mà khụng làm mất thụng tin. Cỏc phần xúa dũng, xúa mành, vựng ảnh tĩnh hoặc chuyển động chậm. Do đú chỉ cần truyền thụng tin về chuyển động. Cỏc hệ thống nộn sử dụng đặc tớnh này của tớn hiệu video. Quỏ trỡnh sau nộn là dỏn ảnh để tạo lại ảnh xấp xỉ ảnh gốc. Cỏc định dạng nộn tớn hiệu video và audio phổ biến nhất là JPEG và MPEG
3.1.2. Mụ hỡnh nộn
Hỡnh 3.1. Mụ hỡnh hệ thống nộn video
Tớn hiệu video được trỡnh bày dưới dạng thuận tiện để nộn cú hiệu quả nhất. Sự biểu diễn chứa nhiều thụng tin để mụ tả tớn hiệu, chỉ phần nhỏ dữ liệu là cần thiết cho việc tỏi tạo lại tớn hiệu. Để truyền tớn hiệu qua kờnh số, những thụng tin biểu diễn được lượng tử húa thành một số hữu hạn cỏc mức. Sau đú là gỏn cỏc từ mó, dựng chuỗi cỏc bit để biểu diễn cỏc mức lượng tử húa. Quỏ trỡnh sẽ làm ngược lại trong bộ giải mó video.
Mọi giai đoạn đều loại bỏ những thụng tin dưa thừa, những thụng tin giống nhau hoặc cú liờn quan đến nhau sẽ khụng được truyền.
3.1.3. Thụng tin dư thừa trong tớn hiệu video
Số hiệu là phương tiện để truyền thụng tin. Dư thừa số liệu là vấn đề trung tõm của nộn ảnh số. Biểu diễn thuận lợi Lượng tử húa Gỏn từ mó Xử lý kờnh Giải lượng
tử húa Biểu diễn thuận lợi Giải
từ mó
Mó húa video Giải húa video
Nguồn
Video khụi phục
Tỷ lệ nộn: CN = N1/ N2
trong đú: N1, N2 là lượng số liệu trong hai tập hợp dựng để biểu diễn một lượng thụng tin.
Độ dưa thừa thụng tin RD được xỏc định: RB = 1 - 1/CN
Tỷ lệ nộn cao sẽ làm giảm chất lượng hỡnh ảnh. Trong nộn ảnh số, cú 3 loại dư thừa số liệu:
a. Dư thừa mó
Nếu cỏc mức của tớn hiệu video được mó húa bằng cỏc symbol nhiều hơn cần thiết (tuyệt đối) thỡ kết quả là cố độ dư thừa mó.
b. Dư thừa trong pixel (Interpoxel Ređunancy)
Giỏ trị của bất kỳ một pixel nào đú cũng cú thể được dự bỏo từ giỏ trị của cỏc pixel lõn cận, nờn thụng tin từ cỏc pixel riờng là tương đối nhỏ. Sự tham gia của một pixel riờng vào một ảnh là dư thừa. Để giảm độ dư thừa trong pixel của một ảnh, dóy pixel hai chiều dựng cho việc nhỡn và nội suy phải được biến đổi thành một dạng cú hiệu quả.
c. Dư thừa do cảm nhận của mắt người
Do cảm nhận của mắt người khụng phỏt hiện được lỗi ở một phần ỏnh sỏng nào đú. Nhờ vậy cú thể cắt bớt hoặc loại bỏ một số mẫu mà khụng làm giảm khả năng thu được ảnh trung thực của người xem.
3.2. Lý thuyết thụng tin - entropy
Thụng tin chứa trong một chi tiết ảnh tỷ lệ nghịch với khả năng xuất hiện của nú, sự kiện ớt xảy ra chứa đựng nhiều thụng tin hơn sự kiện cú nhiều khả năng xảy ra.
Entrropy đo giỏ trị thụng tin trung bỡnh chứa trong một bức ảnh, theo lý thuyết thụng tin, lượng thụng tin của phần tử ảnh được định nghĩa là logarit cơ số 2 của nghịch đảo xỏc xuất xuất hiện của phần tử ảnh đú:
I(x) = log2P( )x 1
trong đú: I(x) là lượng thụng tin của phần tử ảnh xi (tớnh bằng bit) Pxi) là xỏc xuất xuất hiện của phần tử ảnh.
Gọi lượng thụng tin trung bỡnh của hỡnh ảnh là H(x) (entropy của ảnh), ta cú: H(x) = ∑ ( ) ( ) ∑ ( ) ( ) = = − n 1 i i 2 i n 1 i i i X P log X P X I X P
Độ dài trung bỡnh của một từ mó là giỏ trị trung bỡnh thống kờ của tất cả cỏc từ mó trong một bộ mó nú khụng thể nhỏ hơn entropy của nguồn số liệu được mó húa.
Entropy của ảnh cú ý nghĩa quan trọng vỡ nú xỏc định số lượng bit trung bỡnh tối thiểu cần thiết để biểu diễn một phần tử ảnh.
Trong cụng nghệ nộn khụng tồn hao. Entropy giới hạn dưới của tỷ số bit/pixel. Nếu tớn hiệu video được nộn với tỷ số bit/ phần tử nhỏ hơn entropy, hỡnh ảnh sẽ bị mất thụng tin và quỏ trỡnh nộn sẽ cú tổn hao
3.3. Cỏc phương phỏp nộn video
Nộn số liệu nhằm giảm tốc độ bit của tớn hiệu số mà vẫn đảm bảo chất lượng hỡnh ảnh phự hợp với một ứng dụng nhất định. Cú kỹ thuật nộn mất thụng tin và nộn khụng mất thụng tin.
3.3.1. Nộn khụng mất thụng tin
Nộu khụng mất thụng tin cho phộp hồi phục đỳng tớn hiệu ban đầu sau khi giải nộn. Đõy là một quỏ trỡnh mó húa cú tớnh thuận nghịch. Hệ số nộn khụng mất thụng tin nhỏ hơn 2:1. Cỏc kỹ thuật nộn khụng mất thụng tin bao gồm:
a. Mó húa với độ dài từ mó thay đổi VLC
Đõy là phương phỏp mó húa Huffman và mó húa entropy dựa trờn khả năng xuất hiện của cỏc biờn độ trựng hợp trong một bức ảnh, thiết lập một từ mó ngắn cho cỏc giỏ trị cú tần suất xuất hiện cao nhất và từ mó dài cho cỏc giỏ trị cũn lại. Khi giải nộn sử dụng cỏc băng tỡm kiếm.
Phương phỏp này dựa trờn sự lặp đi lặp lại của từng giỏ trị mẫu để tạo ra cỏc mó đặc biệt biểu diễn sự bắt đầu và kết thỳc của giỏ trị được lặp lại. Chỉ cỏc mẫu cú giỏ trị khỏc khụng mới được mó húa. Cỏc mẫu cú giỏ trị bằng khụng được truyền đi theo cựng dũng quột. Cỏc chuỗi 0 được tạo ra bằng quỏ trỡnh giải tương quan như phương phỏp DCT hay DPCM.
c. Sử dụng khoảng xúa dũng và xúa mành
Thụng tin xúa dũng và mành khụng được ghi giữ và truyền đi. Chỳng được thay thế cỏc dữ liệu đồng bộ ngắn hơn theo tựy theo cỏc ứng dụng.
d. Biến đổi Cosin rời rạc DCT
Quỏ trỡnh DCT thuận nghịch được coi là khụng mất thụng tin nếu độ dài từ mó hệ số là 13 hoặc 14 băng tần số đối với dũng video số sử dụng 8 bớt biểu diễn mẫu. Nếu độ dài từ mó hệ số của phộp biến đổi DTC nhỏ hơn, quỏ trỡnh này sẽ bị mất thụng tin.
3.3.2. Nộn mất thụng tin
Sau khi nộn một số thụng tin sẽ bị mất chất lượng hỡnh ảnh giảm do quỏ trỡnh làm trũn và loại bỏ giỏ trị trong phạm vi khung hỡnh hay giữa cỏc khung hỡnh. Nếu nộn nằm trong giới hạn sự cảm nhận của mắt người thỡ chất lượng suy hao khụng nghiờm trọng. Với việc nộn cú tổn hao này, nộn tớn hiệu mới thật sự cú ý nghĩa đối với truyền hỡnh.
Nộn mất thụng tin đạt tới hệ số nộn 100/1. Tốc độ dũng số liệu đạt được trong hệ thống nộn phụ thuộc vào yờu cầu chất lượng ảnh cần cú. Cỏc kỹ thuật nộn khụng mất thụng tin bao gồm:
a. Lấy mẫu con (Sub Sampling)
Đõy là phương phỏp nộn cú hiệu quả cao, song độ phõn giải của ảnh sau khi giải nộn giảm so với ảnh ban đầu. Kỹ thuật lấy mẫu con khụng ỏp dụng cho tớn hiệu chúi. Cấu trỳc lấy mẫu 4:1:1 dựng trong ứng dụng ghi, cấu trỳc 4:2:0 dựng trong cỏc ứng dụng sản xuất và truyền dẫn chương trỡnh
b. Điều xung mó vi sai (DPCM)
Kỹ thuật này chỉ mó húa và truyền đi sự khỏc nhau giữa cỏc giỏ trị mẫu, giỏ trị sai lệch cao, cỏc giỏ trị sai lệch lớn giữa cỏc mẫu được lượng tử húa thụ, (lượng tử húa tuyến tớnh). Kết hợp lượng tử húa thụ với cỏc giỏ trị sai lệch và kỹ thuật mó húa VLC cho cỏc tớn hiệu thu được. Để trỏnh cỏc lỗi, một mẫu đầy đủ được gửi đi theo chu kỳ nhất định, cho phộp cập nhật cỏc giỏ trị chớnh xỏc.
Mó húa DPCM sử dụng cỏc kỹ thuật dự đoỏn và lượng tử húa thớch nghi để hoàn thiện thờm.
c. Lượng tử húa và mó húa VLC cỏc hệ số DCT
Phối hợp cỏc kỹ thuật này cho phộp biểu diễn một khối cỏc điểm ảnh bằng số ớt cỏc bit, do vậy hiệu quả nộn cao.
3.4. Cỏc mó dựng trong kỹ thuật nộn
3.4.1. Mó RLC
Phương phỏp RLC (Run Length Coding) được xõy dựng trờn cơ sở của sự lặp đi lặp lại cỏc điểm ảnh. RLC tỏch chuỗi cỏc giỏ trị giống nhau và biểu diễn như một tổng. Kỹ thuật này chỉ cú thể ỏp dụng cho cỏc chuỗi Symbol tuyến tớnh, hỡnh ảnh được tỏch thành một chuỗi cỏc dũng quột.
Cỏc cỏch mó húa RLC:
• Tạo ra những từ mó cho mỗi độ dài chạy và kết hợp với Symbol nguồn.
• Sử dụng một số độ dài chạy và một Symbol nguồn, nếu Symbol nguồn khụng phải là một số hay một ký tự đặc biệt để chỉ ra cho mỗi Symbol nguồn.
Kỹ thuật RLC được dựng cho cỏc hệ số lượng tử húa tốt hơn là dựng trực tiếp cho số liệu ảnh. Một loại cải biến của mó RLC là mó cú độ dài thay đổi VLC (Variable Length Code), dựng để biểu diễn cỏc giỏ trị symbols cũng như độ dài chạy. Đõy là sự kết hợp của RLC với mó húa thống kờ.
RLC khụng thớch hợp trực tiếp cho cỏc ảnh tự nhiờn cú tụng ảnh liờn tục được mó húa bằng quỏ trỡnh số húa tuyến tớnh. Lý do là RLC phải nộn tập số liệu cú cỏc bước chạy tương đối lớn giống nhau, ảnh cú tụng ảnh liờn tục chứa thụng tin cú tần số khụng gian thấp, việc thay đổi cỏc vựng rộng được làm đầy bằng cỏc giỏ trị pixel giống nhau là tương đối nhỏ.
RLC kết hợp với kỹ thuật nộn JPEG, MPEG cho kết quả tốt.
3.4.2 Mó húa Shannon - Fano
Tỷ lệ nộn tốt nhất cú thể đạt được là entropy nguồn. Dựa trờn xỏc xuất