NÉN DỮ LIỆU: 1 Giới thiệu:

1. Giới thiệu:

Chúng ta biết rằng số bit trung bình cần thiết để biểu diễn các quan hệ của biến ngẫu nhiên rời rạc độc lập X là Entropy của nĩ H(X). Nếu phân phối p(X) được biết, ta cĩ thể dùng mã Huffman hoặc các phương pháp mã hĩa số học để tối ưu.

Các biến ngẫu nhiên liên tục yêu cầu một số vơ hạn các bits để biểu diễn, vì vậy quá trình lượng tử là cần thiết cho các biểu diễn hữu hạn thực tế. Tuy nhiên điều này gây ra nhiễu lượng tử. Mục đích ở đây là phải cĩ tỷ lệ méo nhỏ nhất để dữ liệu khơng bị sai.

Vấn đề nén, mã hĩa dạng sĩng, mã hĩa băng con đã được nghiên cứu nhiều. Ở đây ta chỉ tập trung vào việc nén dữ liệu dùng Wavelet, hay tổng quát hơn là mã hĩa biến đổi. Vì vậy chỉ tập trung vào các dữ liệu tốc độ bit thấp.

2. Bộ mã hĩa biến đổi mẫu:

Cấu trúc ba tầng của bộ biến đổi mẫu được cho trong hình 4.2. Bước thứ nhất là biến đổi tín hiệu. Với một tín hiệu f(t) cĩ chiều dài N, ta khai triển nĩ thơng qua một tập hàm cơ sở trực giao:

Start

Chọn loại Wavelet, mức N,biến đổi Wavelet tín hiệu đầu vào

M =1

M ≤ N

Chọn ngưỡng

Loại bỏ những hệ số chi tiết bé hơn ngưỡng

Lấy biến đổi Wavelet ngược

End

Y N

( )n =∑N ci i( )nf f

ψ (4.11)

Trong đĩ ci = f( ) ( )n ,ψi n

Hình 4.2 – Bộ mã hĩa biến đổi mẫu.

Ở đây ta dùng bộ lượng tử vơ hướng chuẩn Q như hình 4.3, với độ rộng dùng cho nén dữ liệu dùng Wavelet là:

cˆi =Q( )ci (4.12)

Bước lượng tử được kí hiệu là T.

Sai số bình phương do quá trình lượng tử:

( ) ∑( ) ∑ ∑ ∉ = ∈ − + = − I i i i N i i I i i i c c c c c 2 1 2 2 ˆ ˆ (4.13) Với I ={i: ci <T}.

Hình 4.3 – Bộ lượng tử vơ hướng chuẩn. Khi dạng biến đổi là trực giao, nĩ giống như lỗi tái tạo.

Gọi M là số các hệ số cĩ biên độ lớn hơn T ( các hệ số cĩ nghĩa).

Giả sử rằng T đủ nhỏ, sao cho các hệ số cĩ nghĩa là phân bố chuẩn với mỗi lượng tử. Dạng thứ hai của biểu thức lỗi cĩ thể được viết:

( ) 12 ˆ 2 T2 M c c I i i i − = ∑ ∉ (4.14)

Với dạng thứ nhất, chúng ta cần cĩ định lí xấp xỉ tiêu chuẩn mà nĩ quan hệ với chuẩn lp của các hệ số:

Transform Quantize Entropy Code

T cj

N p i p i p c f 1 1       = ∑= (4.15) Định lí: cho = 1 >21 p λ thì: λ λ 1 2 2 2 1 2 − ∈ ≤ − ∑c f p M I i i (4.16)

Định lí cĩ thể được tổng quát hĩa cho khơng gian cĩ vơ hạn chiều 2 <∞

f .

Định lí này cho thấy dạng thứ nhất của biểu thức lỗi giảm nhanh khi các hệ số cĩ nghĩa tăng cao.

Tốc độ bit của các giải thuật nén mẫu cĩ thể được chia làm hai phần.

Phần thứ nhất, ta cần cho biết sự tồn tại của các hệ số cĩ nghĩa. Ví dụ, chúng ta cĩ thể dùng 1 cho hệ số cĩ nghĩa, và 0 cho chữ số khơng cĩ nghĩa. Ta cần tất cả N các Indicator này.

Phần thứ hai, ta cần biểu diễn giá trị của các hệ số cĩ nghĩa. Ta chỉ cần M giá trị. Bởi vì phân bố của các giá trị và các Indicators là khơng biết trước nên mã Entropy thích ứng được dùng ở đây.

Tập turng năng lượng là một tính chất quan trọng của mã biến đổi tốc độ bit thấp. Giả sử kích thứơc của bước lấy mẫu là T, chúng ta cĩ hai tập cơ sở để sinh ra các hệ số cĩ nghĩa. Phân bố các Indicator cĩ nghĩa là khơng bằng phẳng, vì vậy yêu cầu ít bits để mã hố. Wavelet cĩ tính chất tập trung năng lượng tốt hơn biến đổi Fourier với tín hiệu khơng liên tục. Vì vậy, sử dụng Wavelet cho nén dữ liệu là rất hiệu quả.

Giải thuật cho việc nén dữ liệu cũng cĩ ba bước như xử lí tín hiệu: (1) Phân tích.

(2) Lấy ngưỡng các hệ số chi tiết.

Với mỗi mức từ 1 ÷ N, một ngưỡng được chọn và ngưỡng cứng được áp dụng cho hệ số chi tiết.

(3) Tái tạo.

Điểm khác nhau giữa giải thuật nén tín hiệu với triệt nhiễu là ở bước hai. Cĩ hai khả năng nén cĩ thể đạt đưỡc. Đầu tiên bao gồm việc lấy khai triển Wavelet của tín hiệu và giữ các hệ số giá trị tuyệt đối lớn nhất. Trong trường hợp này, chúng ta cĩ thể thiết lập một ngưỡng cục bộ, thực hiện nén, hoặc một quá trình tái tạo chuẩn bình phương tương đối. Vì vậy chỉ các hệ số đơn được chọn. Khả năng thứ hai là việc áp dụng việc lấy ngưỡng phụ thuộc mức một cách trực quan.

3. Cải tiến giải thuật nén trên cơ sở Wavelet:

Giải thuật mẫu ở trên làm việc rất tốt, nhưng cĩ thể được cải tiến thêm. Những ý tưởng của việc cải tiến như sau:

•Các hệ số khơng cĩ nghĩa thường được nhĩm lại với nhau.

•Việc chọn lựa cơ sở là rất quan trọng. Các phương pháp đã được phát triển để chọn lựa thích ứng cơ sở cho tín hiệu.

• Mã run – length đặc biệt cĩ thể được dùng để sắp xếp ra các mã cĩ nghĩa và giá trị. Các phương pháp mã lượng tử tiên tiến (như lượng tử vector, lượng tử dự đốn) cĩ thể được dùng thay thế cho lượng tử vơ hướng đơn giản.

• Phương pháp dựa trên thống kê như phân lớp, mơ hình hĩa, xấp xỉ và dự đốn cũng đưa ra kết quả tốt.

• Thay cho việc dùng các bước lượng tử một cách cố định, ta cĩ thể định nghĩa lại quá trình lượng tử bằng cách dùng kích thước bước nhỏ hơn.

• Biến đổi Wavelet cĩ thể thay thế bằng một biến đổi Wavelet integer – to – integer, quá trình lượng tử là khơng cần thiết, và quá trình nén là khơng cĩ mất mác.

Fading chọn lọc tần số:

BIẾN ĐỔI FOURIER THỜI GIAN NGẮN: 1 Định nghĩa: