V. Nén trong ảnh
1. Mô hình
Tầng đầu tiên của bộ mã hoá video, tín hiệu video đ−ợc trình bμy d−ới dạng thuận tiện để nén hiệu quả nhất. Điểm cốt yếu lμ phải xác định cái gì đ−ợc mã hoá. Sự biểu diễn có thể chứa nhiều mẫu thông tin để mô tả các tín hiệu hơn chính lμ bản thân tín hiêụ, nh−ng hầu hét các thông tin quan trọng chỉ tập trung trong một phần nhỏ của sự mô tả nμỵ Trong cách biểu diễn hiệu quả, chỉ có phần nhỏ dữ liệu lμ cần thiết để truyền cho việc tái tạo lại tín hiệu videọ
Video khôi phục
Nguồn
H18.Mô hình nén video
Hoạt động thứ hai của bộ mã hoá lμ l−ợng tử hoá, giúp rời rạc hoá thông tin đ−ợc biểu diễn. Để truyền tín hiệu Video qua một số kênh
Hoạt động thứ ba lμ gán từ mã. Các từ mã nμy lμ lμ một chuỗi các bít dùng để biểu diễn các mức l−ợng tử hoá. Các quá trình nμy sẽ ng−ợc lại trong bộ giải mã Videọ
Mỗi hoạt động cố gắng loại bỏ phần tử d− thừa trong tín hiệu Video vμ lợi dụng sự giới hạn của hệ thống nhìn của mắt ng−ời, nhờ bỏ đi phần d− thừa, các thông tin giống nhau hoặc có liên quan giống nhau sẽ không đ−ợc truyền đị Những thông tin bỏ đi mμ không ảnh h−ởng đến việc nhìn cũng sẽ không đ−ợc truyền đị
IỊ2. Độ d− thừa dữ liệụ
Nén số liệu lμ quá trình giảm l−ợng số liệu cần thiết để biểu diễn cùng một l−ợng thông tin cho tr−ớc. Cần phải phân biệt giữa số liệu vμ thông tin. Thực tế giữa số liệu vμ thông tin không đồng nhất với nhau số liệu (vμ do đó lμ tín hiệu) chỉ lμ ph−ơng tiện để truyền tải thông tin. Cùng một l−ợng thông tin cho tr−ớc có thể biểu diễn bằng các l−ợng số liệu khác nhau, nó bao gồm số liệu hoặc từ không cho thông tin thích hợp lẫn xác định đã biết.
Độ d− thừa số liệu lμ trung tâm trong nén của ảnh số.Độ d− thừa dữ liệu, không phải lμ một khái niệm trừu t−ợng mμ lμ một thực tế có thể định l−ợng đ−ợc bằng toán học.
Nếu r1vμ r2lμ l−ợng số liệu trong hai tập hợp số liệu cùng đ−ợc dùng để biểu diễn một l−ợng thông tin cho tr−ơcs thì độ d− thừa số liệu t−ơng đối của tập hợp số
liệu thứ nhất so với tập hợp số liệu thứ hai có thể đ−ợc định nghĩa nh− sau: Trong đó CNth−ờng đ−ợc gọi lμ tỷ số nén vμ CN=r1/r2 N D C R = 1 − 1 Mã hoá video B i ể u d i ể n t h u ậ n l ợ i l−ợ n g t ử h o a g á n t ừ m ã x ữ l ý k ê n h Giải mã video B i ể u d i ể n t h u ậ n l ợ i l−ợ n g t ử h o a g á n t ừ m ã
Trong tr−ờng hợp r1=r2thì CN=1vμ RD=0, có nghĩa lμ so với tập hợp số liệu thứ hai thì tập hợp số liệu thứ nhất không d− thừạ Khi r2<<r1thì CN tiến tới vô cùngvμ RDtiến tới 1, có nghĩa độ d− thừa số liệu t−ơng đối của tập hợp số liệu thứ nhất lμ khá lớn hay tập hợp số liêụ thứ hai đã đ−ợc nén quá nhỏ. ở đâycó sự kết hợp giữa tỷ lệ nén vμ chất l−ợng hình ảnh. Tỷ lệ nén cμng cao sẽ lμm giảm chất l−ợng hình ảnh vμ ng−ợc lạị Chất l−ợng vμ quá trình nén có thể thay đổi tuỳ theo đặc điểm của hình ảnh nguồn vμ nuôi dung ảnh. Dánh giá chất l−ợng ảnh, ng−ời ta tính số bit cho một điểm ảnh trong ảnh nén (Nb). Nó đ−ợc xác định lμ tổng số bít ở ảnh nén chia cho tổng số điểm:
nb=số bít nén/số điểm.
Trong nén ảnh số có ba loại d− thừa số liệu .
IỊ2.1 D− thừa mã (coding redun dancy).
Nén các mức của tín hiệu Video đ−ợc mã hoá bằng các Symbol nhiều hơn. Cần thiết thì kết quả có độ d− thừa mã. Để giảm độ d− thừa mã, trong nén ảnh th−ờng sử dụng các mã có độ dμi thay đổi (VLC) nh− mã Huffman, mã RLC...L−ợng thông tinvề hình ảnh có xác suất cao sẽ đ−ợc mã hoá bằng từ mã ít bit hơn so với l−ợng thông tin có xác suất thấp hơn.
IỊ2.2 D− thừa trong Pixel (interpixel Redundancy).
Vì giá trị của bất kỳ Pixel nμo đó, cũng có thể đ−ợc dự báo từ các pixel lân cận nó, nên thông tin từ các pixel lμ t−ơng đối nhỏ. Sự tham gia của một Pixel riêng vμo ảnh lμ d− thừạ
Nhiều tên ( bao gồm :d− thừa không gian, d− thừa hình học, d− thừa trong ảnh) đ−ợc đặt ra để phân biệt sự phụ thuộc nμy của Pixel. Ta dùng độ d− thừa Pixel để chỉ tất cả các tên trên.
Dể giảm độ d− thừa trong pixel của một ảnh, dãy Pixel hai chều dùng cho việc nhìn vμ nội suy phải đ−ợc biến đổi thμnh một dạng có hiệu quả hơn. Trong các ph−ơng pháp nén anh ng−ời ta th−ờng sử dụng ph−ơng phấp biến đổi Cosin rời rạc (DCT) để biến đổi Pixel từ miềm khônh gian sang miềm tần số, bằng cách nμy sẽ giảm đ−ợc độ d− thừa dữ liệu trong Pixel ở miền tần số caọ
IỊ2.3 D− thừa tâm sinh lý
Bằng trực quan cho thấy, sự thụ nhận c−ờng độ sáng của mắt ng−ời thay đổi chỉ giới hạn trong một phạp vi nhất định. Hiện t−ợng nμy suất phát từ sự thật lμ mắt
không đáp ứng với cùng độ nhạy của các thông tin nhìn thấỵ Thông tin đơn giản có tầm quan trọng ít hơn thông tin khác trong vùng nhìn thấỵ Thông tin nμy đ−ợc gọi lμ độ d− thừa tâm sinh lý nhìn. Nó có thể đ−ợc loại bỏ mμ không ảnh h−ởng đáng kể đến chất l−ợng ảnh.
Khác với độ d− thừa mã vμ độ d− thừa trong Pixel, độ d− thừa tâm sinh lý có liên quan đến định h−ớng, nó quan trọng tới việc l−ợng tử hoá. Điều đó có nghĩa lμ ánh xạ một khoảng cách rộng, các giá trị đầu vμo lên một số hữu hạn các giá trị đầu rạ Đó lμ toán tử không đảo ng−ợc (mất thông tin). Cho kết quả nén số liệu có tổn haọ
IIỊCác ph−ơng pháp nén
Các hệ thống nén lμ sự phối hợp rất nhiều các kỹ thuật sử lý nhằm giảm tốc độ bít của tín hiệu số mμ đảm bảo chất l−ợng ảnh. Có hai kỷ thuật nén lμ nén tổn hao vμ nén không tổn haọ
IIỊ1 Nén không tổn hao:
Nén không tổn hao lμ quá trình nén không mất thông tin, cho phép phục hồi lại đúng tín hiệu ban đầu sau khi giải nén.
Đây lμ qua trình mã hoá có tính thuận nghịch. Hệ số nén phụ thuộc vμo chi tiết ảnh đ−ợc nén.Hệ số nén của ph−ơng pháp nμy luôn nhỏ hơn 2:1
Các kỷ thuật nén không mất thông tin bao gồm :
IIỊ1.1 Mã hoá với độ dài từ mã thay đổi (VLC).
Ph−ơng pháp nμy còn đ−ợc gọi lμ mã hoá Huffman vμ mã hoá enfropy dựa trên tính thống kê của tín hiệu, khả năng suất hiện của các giá trị biên độ trùng hợp trong một bức ảnh vμ thiết lập một từ mã ngán cho các từ mã có tần suất hiệu suất cao nhất, vμ từ mã dμi cho các giá trị còn lạị Khi thực hiện giải nén các thiết lập mã trùng hợp sẽ đ−ợc sử dụng để tạo lại giá trị tín hiệu ban đầụ Mã hoá vμ giải mã Huffman có thể thực hiện một cách dễ dμng bằng cách sử dụng các bảng tìm kiếm.
IIỊ1.2 Mã hoá với độ dài của từ mã động (RLC).
Ph−ơng pháp nμy dựa trên sự lặp lại của cùng một giá trị mẫu để tạo ra các mã đặc biệt biểu diễn sự bắt đầu vμ kết thúc của giá trị đ−ợc lặp lạị Chỉ có các mẫu có giá trị khác không mới đ−ợc mã hoá. Số mẫu có giá trị bằng không sẽ đ−ợc truyền đi dọc theo cùng dòng quét. Cuối cùng, các chuổi không đ−ợc tạo ra bằng quá trình giải t−ơng quan nh− ph−ơng pháp DCT hay DPCM.
IIỊ1.3 Sử dụng khoảng xoá dòng và mành.
Vùng thông tin xoá đ−ợc loại bỏ khỏi dòng tín hiệu để truyền đi vùng thông tin tích cức của ảnh. Theo ph−ơng pháp nμy thông tin xoá dòng vμ mμnh sẽ không đ−ợc ghi giữ vμ truyền đị Chúng đ−ợc thay bằng các dữ liệu đồng bộ ngắn hơn tuỳ theo ứng dụng.
IIỊ2 Nén có tổn hao:
Nén có tổn hao chấp nhận mất mát một ít thông tin để gia tăng hiệu quả nén, nó rất thích hợp với nguồn thông tin lμ hình ảnh vμ âm thanh. Nó cho tỷ lệ nén ảnh cao để có thể truyền dẫn, phát sóng. Đồng thời cũng cho một tỷ lệ nén thích hợp cho xử lý vμ l−u trữ ảnh trong Studiọ
Nén tổn hao thực hiện theo ba b−ớc saụ
B−ớc1: Biến đổi tín hiệu từ miền thời gian sang miền tần số bằng cách sử dụng các thuật toán biến đổi Cosin rời rạc DCT. B−ớc nμy thực hiện việc giảm độ d− thừa của Pixeltrong ảnh, tuy nhiên quá trình nμy không gây tổn hao tín hiệụ
B−ớc 2: Thực hiện l−ợng tử hoá các hệ số DCT,lμm tròn các số liệu việc mất mát số liệu xẩy ra ở giai doạn lμm tròn nμỵ
B−ớc 3: Nén số liệu đã biến đổi vμ lμm tròn bằng cách mã hoá Entropy, ở đây dùng các mã không tổn hao nh− mã Huffman, RLC...
IV.Các loại mã dùng trong nén: IV.1 Mã RLC (Run-length coding)
RLC lμ loại mã xây dựng trên cơ sở sử dụng số lần lặp lại của các điểm ảnh. RLC tách chuổi các giá trị giống nhau vμ biều diễn nh− lμ một tổng. Khi dãn giá trị nμy tạo lại số lần biểu diễn tổng. Kỹ thuật nμy chỉ có thể áp dụng cho các chuổi Sympol tuyến tính.
Do đó, khi áp dụng cho số liệu ảnh hai chiều, hình ảnh đ−ợc tách thμnh một chuổi các dòng quét.
Một loại cải biên của mã RLC lμ mã VLC (mã có độ dμi thay đổi đ−ợc) mã nayd dùng để biểu diễn các giá trị Sympolcũng nh− độ dμi chạỵ Cách thực hiện lμ tích phân bố xác suất của các độ dμi chạy vμ các giá trị Symbol.
RLC không thích hợp trực tiếp cho các ảnh tự nhiên có tổng ảnh liên tục đ−ợc mã hoá bằng một quá trình số hoá tuyến tính, vì RLC phải nén tập số liệu có b−ớc chạy t−ơng đối lớn giống nhau, trong khi đó ảnh h−ởng có tổng liên tục có tần số không gian thấp, việc thay đổi các vùng rộng đ−ợc lμm đầy bằng các giá trị Pixel giống nhau lμ t−ơng đối nhỏ. RLC tự nó sẽ không cho các mức nén có ý nghĩạ
RLC đ−ợc dùng kết hợp với các kỹ thuật khác nh− các chuẩn nén IPEG, MPEG sẽ cho kết quả nén tốt. RLC đ−ợc dùng cho các hệ số l−ợng tử hoá tốt hơn lμ dùng trực tiếp cho số liệu ảnh.
IV.2 Mã Shannon – Fanọ
Mã nμy dựa trên xác suất xuất hiện của những Symbol nguồn bên trong một l−ợng thông tin. Ph−ơng pháp nμy sữ dụng những từ mã có độ dμi thay đổi để mã hoá các Symbol nguồn thông qua xác suất của chúng, với những Symbol có xác suất xuất hiện cμng lớn thì từ mã dùng đễ mã hoá chúng cμng ngắn.
IV.3 Mã Huffman.
Mã Hufman thuộc loại entropy hoặc mã thống kê. T− t−ởng chính lμ dùng mã VLC, sử dụng ít bít để mã hoá các giá trị hay xẩy ra, vμ nhiều bit để mã hoá các giá trị ít xẩy rạTừ dố tốc độ bít sẽ giảm đáng kể.
Nói chung, mã Huffman sẽ đạt hiệu xuất thấp nếu xác suất xuất hiện các phần tử gần nhaụ Ng−ợc lại hiệu suất cao nếu xác suất xuất hiện cách xa nhaụ
Trên thực tế mã huffmanđ−ợc phát triển trên một tập ảnh, nh−ng sau đó đ−ợc áp dụng trên các ảnh khác nhau, mổi ảnh có phân bố xác suất Symbol riêng của nó. Do đó, Huffman không cần tối −u cho ảnh đặc biệt nμọ
IV.4 Mã dự đoán (DPCM )
Ph−ơng pháp mã dự đoán hay còn gọi lμ điều xung mã vi sai (DPCM). ph−ơng pháp nμy không mã hoá biên độ thông tin ở mổi mẫu, mμ chỉ mã hoá các thông tin có biên độ chênh lệch giữa mẫu đó cho vμ mẫu dự báọ Do phân bố chênh lệch về biên độ điểm ảnh có đồ thị hình chuông xung quanh điểm không.
Nếu dựa trên các đặc tr−ng thống kê, thì sự khác nhau nμy lμ không lớn lắm, do vậy để mã hoá nó chỉ cần giảm một số ít bít lμ đủ.
Ph−ơng pháp mã hoá dự đoán còn sử dụng đặc điểm của mắt ng−ời vμ cho phép dùng đặc tr−ng phi tuyến về l−ợng tử hoá.
Sau đây lμ sơ đồ mã hoá vμ giải mã DPCM.
Nhằm tránh các lổi có thể xuất hiện trong khi truyền, một mẫu đầy đủ đ−ợc gửi
đi theo chu kỳ nhất định, cho phép cập nhập đ−ợc các giá trị chính xác. Mã hoá DPCM cũng sử dụng trên các kỹ thuật dự đoán vμ l−ợng tử hoá thích nghi để hoμn thiện thêm kỹ thuật nén nμỵ
IV.4.1 DPCM trong mành (intsaframe DPCM).
Tín hiệu dự báo đ−ợc tạo từ các mẫu nằm trong cùng một mμnh, các mẫu đ−ợc biến đổi đ−ợc nằm trên cùng một dòng quét ( mã giữa các Pixel) vμ cùng với các dòng quét lân cận (mã giữa các dòng).
Việc tạo tín hiệu dự báo của DPCN trong mμnh dựa trên mối liên kết giữa các điểm ảnh. Các công trình nghiên cứu cho thấy hệ số liên kết giảm nhanh khi đi xa điểm ảnh quan sát theo chiều ngang (các Pixel trên cùng một dòng ). Vμ theo chiều đứng (các Pixel của dòng kề nhau). Do đó khi tạo tín hiệu dự báo cần chú ý đến mẫu tín hiệu kề nhaụ
Tín hiệu dự báo có thể lμ hμm tuyến tính hoặc có thể lμ hμm phi tuyến đòi hỏi thiết kế mạch phức tạp hơn đo đó trong thực tế không dùng cho tín hiệu videọ
IV.4.2 DPCM giữa các mành.
tín hiệu dự báo đ−ợc dựa trên cơ sở các mẫu ở các mμnh kề nhau tr−ớc đó. Ph−ơng pháp DPCM giữa các mμnh tận dụng quan hệ chặt chẽ giữa các mμnh kề nhau của ảnh vμ đặc tr−ng của mắt (nhậy méo với ảnh tĩnh hơn ảnh động). Nghiên cứu thống kê về cấu trúc ảnh cho thấy rằng sự khác nhau giữa các ảnh kề nhau lμ không lớn lắm. Để tạo lại một ảnh trung thực chỉ cần truyền các điểm ảnh lμm biến
∑ B ộ l−ợ n g t ử m ã h o á e n t r o p y B ộ d ự đ o á n ∑ t í n h i ệ u v i d e o s ố H 1 9 : S ơ đ ồ b ộ m ã h o á g i ả i m ã e n t r o p y m ã h o á e n t r o p y ∑ t í n h i ệ u k ê n h Đμu r a g i ả i m ã + eq + + - e e v ’ v ’ p H 2 0 : S ơ đ ồ b ộ g i ả i m ã -
đổi khôi phục lại (tại phía thu).Tất cả các điểm ảnh còn lại từ mμnh tr−ớc hợc ảnh tr−ớc trong bộ nhớ.
Ph−ơng pháp DPCM giữa các mμnh thuận lợi cho truyền hình thoại .Vì tín hiệu truyền hình thoại có đặc điểm lμ ảnh chuyển động ít, tốc độ chuyển động chậm, do đó vùng ảnh rộng, ít thay đổi giữa các mμnh kề nhaụ
Ph−ơng pháp cơ bản của DPCM giữa các mμnh lμ mã hoá trực tiếp Visai giữa các mμnh kề nhaụ
Dặc tr−ng l−ợng tử lμ phi tuyến nên sự chênh lệch nhỏ giữa các mức sẽ đ−ợc khôi phục với độ chính xác hơn so với mức chênh lệch lớn. Điều đó khẳng định việc khôi phục một cách chính xác các vùng ảnh rộng, chuyển động chậm ( mμ trên đó tất cả các méo rất dể nhận biết ).
Ng−ợc lại, tại vùng ảnh có nhiều chuyển động, khi khôi phục lại sẽ kém chính xáchơn vì do đặc điểm của mắt ng−ời, đooj phân giải của ảnh có thể thấp hơn. Các loại DPCM th−ờng dùng:
IV.4.2.1 Intraframe DPCM.
Đây lμ ph−ơng pháp lấy mẫu từ phần ảnh chuyển động, chỉ truyền các phần ảnh chuyển động vμ khôi phục các điểm ảnh còn lại bằng trị trung bình các ảnh đ−ợc truyền.
IV.4.2.2 Ph−ơng pháp làm đầy có chọn lọc (Selective replenishment)
Ph−ơng pháp đan chéo các mμnh còn gọi lμ ph−ơng pháp lμm đầy có chọn khi ảnh truyền ít chuyển động vμ tốc độ thấp. Ph−ơng pháp nμy dựa trên nguyên tắc chỉ truyền phần điểm ảnh đ−ợc chọn ở mổi mμnh vμ ảnh có độ chiếu sáng lâụ
IV.4.2.3 Ph−ơng pháp chia thành những phần ảnh chuyển động và tỉnh.
Ph−ơng pháp nμy lμ sự kết hợp của ph−ơng pháp lμm đầy có chọn lọc vμ ph−ơng pháp lấy mẫu từng phần trong ảnh chuyển động cùng với DPCM giữa mμnh với dự báo một phần tử. Mổi ảnh đ−ợc chia thμnh phần tử chuyển động vμ phần tử tỉnh, đối với phần tử ảnh động thì sử dụng ph−ơng pháp lấy mẫu từng phần.
IV.5 Ph−ơng pháp mã chuyển vị (transform coding).
Đối với việc mã hoá riêng rẽ từng điểm một sẽ không đạt đ−ợc hiệu quả bởi vì không tận hết đ−ợc mối quan hệ giữa các khối điểm trong ảnh số. Ph−ơng pháp mã chuyển vị lμ một cách có hiệu quả trong việc mã hoá khối điểm thông qua biến đổi