Mã hóa Move-To-Front

Một phần của tài liệu 27864 (Trang 53 - 56)

Kỹ thuật chuyển đổi move-to-front là mã hóa dữ liệu được thiết kế để cải tiến hiệu quả của kỹ thuật nén mã hóa entropy. MTF là một quá trình thường được sử dụng sau chuyển đổi Burrows -Wheeler để xếp hạng các biểu tượng theo tần số có liên quan của chúng. Giai đoạn sau chuyển đổi Burrows- Wheeler (BWT) có một chức năng quan trọng trong thuật toán nén Burrows - Wheeler vì nó chuyển đổi đầu ra BWT từ một ngữ cảnh cục bộ thành ngữ cảnh tổng thể. MTF dựa trên một bảng chữ cái động được giữ trong danh sách MTF mà ký tự hiện hành trong suốt quá trình quét luôn được đưa lên đầu của bảng chữ cái. Sau quá trình MTF, dãy được tạo ra dài bằng dãy ban đầu bởi vì nó không phải nén dãy ban đầu. Ý tưởng chính là để đạt được một hiệu suất nén tốt hơn cho mã hóa entropy.

Một ví dụ cụ thể cho bảng chữ cái : “eghinorstuy” và văn bản cần mã hóa là:―soootttthhnnnggi”. Ta có Bảng 2.1:

Bảng 2.1: Mã hóa Move-To-Front

Dãy Danh sách Các biểu tượng được mã hóa

Soootttthhnnnggi eghinorstuy 7

Soootttthhnnnggi seghinortuy 7,6

Soootttthhnnnggi oseghinrtuy 7,6,0

Soootttthhnnnggi oseghinrtuy 7,6,0,0

Soootttthhnnnggi toseghinruy 7,6,0,0,8

Soootttthhnnnggi toseghinruy 7,6,0,0,8,0

Soootttthhnnnggi toseghinruy 7,6,0,0,8,0,0

Soootttthhnnnggi toseghinruy 7,6,0,0,8,0,0,0

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

48

Soootttthhnnnggi htoseginruy 7,6,0,0,8,0,0,0,5,0

Soootttthhnnnggi htoseginruy 7,6,0,0,8,0,0,0,5,0,7

Soootttthhnnnggi nhtosegiruy 7,6,0,0,8,0,0,0,5,0,7,0

soootttthhnnnggi nhtosegiruy 7,6,0,0,8,0,0,0,5,0,7,0,0

soootttthhnnnggi nhtosegiruy 7,6,0,0,8,0,0,0,5,0,7,0,0,6

soootttthhnnnggi gnhtoseiruy 7,6,0,0,8,0,0,0,5,0,7,0,0,6,0

Soootttthhnnnggi gnhtoseiruy 7,6,0,0,8,0,0,0,5,0,7,0,0,6,0,7

Bằng cách làm này khi kết thúc dãy , đầu ra cuối cùng của xếp hạn g đạt được là:

MTF=[7,6,0,0,8,0,0,0,5,0,7,0,0,6,0,7]

Chú ý rằng với mã hóa MTF , Các ký tự thứ hai và liên tiếp trong bất kỳ run nào được chuyển đổi thành 0 ( "ooo" đã trở thành 6,0,0). Điều này hoạt động tốt với BWT, vì nó sinh ra các khối với nhiều run.

Giải mã Move-To-Front

Không giống như BWT đảo ngược, Giải mã Move-To-Front (MTF) là khá đơn giản , nó rất giống quá trình mã hóa . Lúc này vị trí biểu tượng trong danh sách của mọi biểu tượng trong bảng chữ cái được sử dụng để giải mã một biểu tượng . Cũng giống như quá trình mã hóa , danh sách này bắt đầu theo một thứ tự từ điển . Dữ liệu mã hóa được mã hóa cho biết vị trí của biểu tượng được giải mã. Sau khi giải mã biểu tượng , di chuyển nó lên trước danh sách.

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

49

Bảng 2.2: Giải mã Move-To-Front

Các biểu tượng được mã hóa Danh sách Dãy 7 eghinorstuy S 7,6 seghinortuy So 7,6,0 oseghinrtuy Soo 7,6,0,0 oseghinrtuy Sooo 7,6,0,0,8 toseghinruy Sooot 7,6,0,0,8,0 toseghinruy Sooott 7,6,0,0,8,0,0 toseghinruy Sooottt 7,6,0,0,8,0,0,0 toseghinruy Soootttt 7,6,0,0,8,0,0,0,5 toseghinruy Soootttth 7,6,0,0,8,0,0,0,5,0 htoseginruy Soootttthh 7,6,0,0,8,0,0,0,5,0,7 htoseginruy Soootttthhn 7,6,0,0,8,0,0,0,5,0,7,0 nhtosegiruy Soootttthhnn 7,6,0,0,8,0,0,0,5,0,7,0,0 nhtosegiruy soootttthhnnn 7,6,0,0,8,0,0,0,5,0,7,0,0,6 nhtosegiruy soootttthhnnng 7,6,0,0,8,0,0,0,5,0,7,0,0,6,0 gnhtoseiruy soootttthhnnngg 7,6,0,0,8,0,0,0,5,0,7,0,0,6,0,7 gnhtoseiruy Soootttthhnnnggi

Kết quả cho thấy, MTF có xu hướng làm tăng dần tần số của các biểu tượng giá trị thấp trong một khối . Điều này làm cho MTF trở nên hữu ích để cải thiện việc nén của các bộ mã entropy như: Mã Huffman hoặc mã số học.

Như vậy, chuyển đổi MTF có lợi thế để sắp xếp các biểu tượng theo tần số có liên quan để giảm entropy của văn bản mã hóa. Thật vậy, chữ cái

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

50

được sử dụng gần ở phía mặt trước của danh sách, nếu sử dụng các chữ cái biểu hiện tương quan của chúng, điều này sẽ dẫn đến một số lượng lớn của số lượng nhỏ như "0" và "1" ở đầu ra.

Tuy nhiên, không phải tất cả các dữ liệu đều biểu hiện hình thức tương quan này, và đối với một số chuỗi văn bản, các biến đổi MTF thực sự có thể làm tăng entropy.

Một phần của tài liệu 27864 (Trang 53 - 56)

Tải bản đầy đủ (PDF)

(77 trang)