So sánh các phương pháp nén MTF0, MTF1, MTF2

Một phần của tài liệu (LUẬN văn THẠC sĩ) các kỹ thuật kiểm thử đột biến và ứng dụng kiểm thử chương trình c (Trang 57 - 62)

Theo dõi bảng trên ta thấy, tỷ lệ phần trăm của hai phương pháp MTF1 và MTF2 có phần tốt hơn phương pháp MTF0. Tuy nhiên nếu xét kỹ cột kích thước thì ta thấy có những tệp tin nếu áp dụng phương pháp MTF2 sẽ cho hiệu quả cao hơn phương pháp MTF1, hoặc dùng phương pháp MTF0 sẽ cho hiệu quả hơn phương pháp MTF1.

Như vậy cả 3 phương pháp MTF0, MTF1, MTF2 có những cải tiến nhất định đem lại hiệu quả nén cao hơn.

3.3.1 Áp dụng MTF với thuật toán nén số học

Trong lần thực nghiệm này, tác giả áp dụng phương pháp MTF0 với thuật toán nén số học, theo lược đồ BWT-MTF-RLE-ARI (BMRA) và trường hợp khơng có MTF (BMA). Kết quả thực nghiệm như sau:

TT Tệp tin gốc Kích thước ban đầu BRA BMRA (MTF0) Kích thước tỉ lệ Kích thước tỉ lệ 1 bib 111261 46660 58% 32582 71% 2 book1 768771 402435 48% 298623 61% 3 book2 610856 283711 54% 202928 67% 4 geo 102400 64210 37% 63564 38% 5 news 377109 199921 47% 147285 61% 6 obj1 21504 12375 42% 10816 50% 7 obj2 246814 110306 55% 83597 66% 8 paper1 53161 24959 53% 17618 67% 9 paper2 82199 38087 54% 28180 66% 10 paper3 46256 22941 50% 16911 63%

11 paper4 13286 7309 45% 5479 59% 12 paper5 11954 6740 44% 5077 58% 13 paper6 38105 18802 51% 13040 66% 14 progc 39611 19046 52% 13234 67% 15 progl 71646 25166 65% 17342 76% 16 progp 49379 17558 64% 11524 77%

Ta nhận thấy rằng, nếu áp dụng MTF0 với thuật toán nén số học cho hiệu quả cao hơn.

3.4. Kết luận

Như vậy nếu áp dụng phương pháp MTF trong nén dữ liệu sẽ mang lại hiệu quả rất cao, khơng kém gì so với các phần mềm hiện có trên thị trường như Winzar hoặc Winzip.

Nếu áp dụng lược đồ nén trên với phương pháp nén số học sẽ cho kết quả cao hơn phương pháp Huffman.

Tuy nhiên lược đồ nén dữ liệu theo thuật toán BWCA sẽ rất mất thời gian trong phép biến đổi BWT, bởi vì thuật tốn này cần phải xét từng khối dữ liệu, sắp xếp các ký hiệu trong khối dữ liệu và hoán vị chỉ số.

Trong phạm vi luận văn này tác giả đã làm rõ tính hiệu quả của phương pháp MTF trong việc tạo dữ liệu đầu vào cho các thuật toán nén dữ liệu khác nhau. Trong phần phụ lục, tác giả đã thống kê được sau khi sử dụng phương pháp MTF thì số lần lặp của các ký hiệu đứng đầu bảng mã tăng lên rất nhiều. Điều này rất có lợi đối với các thuật toán mã nén Huffman.

Tuy nhiên sau khi sử dụng MTF thì số ký hiệu tăng lên. Trong Bảng 12 số ký hiệu là 95, nhưng trong Bảng 13 số ký hiệu tăng lên đến 142. Điều này cũng làm ảnh hưởng một phần tới chất lượng nén dữ liệu, nhưng không đáng kể.

TÀI LIỆU THAM KHẢO

1. Balkenhol, B, Kurtz, S, Shtarkov, Y M. Modifications of the Burrows and Wheeler Data Compression Algorithm. Proceedings of the IEEE Data Compression Conference 1999, Snowbird, Utah, J. Storer and M. Cohn, Eds. 188–197, 1999.

2. Balkenhol B, Shtarkov YM. One attempt of a compression algorithm using the BWT. Preprint 99-133,SFB343: Discrete Structures in Mathematics, Falculty of Mathematics, University of Bielefeld, 1999. http://www.mathematik.uni-bielefeld.de/sfb343/preprints/pr99133.ps.gz 3. Brenton Chapin, Higher compression from the Burrows-Wheeler transform

with new algorithms for the list update problem, University of North Texas,

2001.

4. C. E. Shannon, A Mathematical Theory of Communication, 1948.

5. Guy E. Blelloch, Introduction to Data Compression, September 25, 2010 6. Ida Mengyi Pu, 2006, Fundamental Data Compression

7. Juergen Abel, Improvements to the Burrows-Wheeler Compression Algorithm: After BWT Stages, University Duisburg-Essen.

8. Juergen Abel, Post BWT Stages of the Burrows-Wheeler Compression Algorithm, 41469 Neuss – Germany.

9. M. Burrows and D.J. Wheeler, A Block-sorting Lossless Data Compression Algorithm, Research Report 124, System Research Center, Digital System

Research Center, Palo Alto, CA, 1994.

10. Sebastian Deorowicz, Second step algorithms in the Burrows–Wheeler compression algorithm, November 22, 2001

11. Sebastian Deorowicz, Nov-2001, Second step algorithms in the Burrows– Wheeler compression algorithm

12. Travis Gagie, Giovanni Manzini, Move-to-Front, Distance Coding, and Inversion Frequencies Revisited

13. Vo Si Van, 2009, Image Compression Using Burrows-Wheeler Transform 14. http://sites.google.com/site/datacompressionguide

15. http://michael.dipperstein.com/bwt/index.html 16. http://www.binaryessence.com/dct/en000249.htm

PHỤ LỤC

Trong các tệp tin được thực nghiệm, tác giả thống kê thông tin về các ký hiệu và số lần xuất hiện các ký hiệu trong tệp tin paper1 áp dụng phương pháp MTF. Dưới đây là hai bảng thông tin cho biết các ký hiệu và số lần xuất hiện các ký hiệu trước khi áp dụng MTF và sau khi áp dụng MTF. Kết quả thể hiện theo thứ tự giảm dần của số lần xuất hiện các ký tự.

TT Ký hiệu Xuất hiện TT Ký hiệu Xuất hiện TT Ký hiệu Xuất hiện 1. 32 7301 1. 41 243 1. 60 42 2. 101 4698 2. 120 227 2. 83 42 3. 116 3048 3. 39 226 3. 77 39 4. 105 2879 4. 126 224 4. 124 38 5. 111 2568 5. 45 195 5. 122 32 6. 110 2503 6. 73 179 6. 123 30 7. 97 2441 7. 84 157 7. 96 28 8. 115 2374 8. 51 143 8. 125 28 9. 114 2058 9. 57 137 9. 88 27 10. 108 1593 10. 113 137 10. 72 24 11. 104 1485 11. 82 134 11. 79 24 12. 99 1476 12. 53 128 12. 80 22 13. 100 1431 13. 52 122 13. 86 22 14. 10 1250 14. 91 121 14. 87 22 15. 109 1154 15. 95 102 15. 106 22 16. 102 1118 16. 70 101 16. 85 21 17. 117 1069 17. 43 100 17. 42 19 18. 112 961 18. 56 96 18. 58 16 19. 92 891 19. 107 96 19. 33 15 20. 46 839 20. 54 95 20. 37 15 21. 103 778 21. 65 91 21. 38 14 22. 98 715 22. 93 84 22. 68 14 23. 48 666 23. 67 80 23. 71 9 24. 119 540 24. 55 75 24. 62 6

25. 121 503 25. 61 69 25. 74 4 26. 36 480 26. 34 66 26. 75 3 27. 44 431 27. 76 60 27. 63 2 28. 49 392 28. 69 56 28. 90 2 29. 118 353 29. 78 55 29. 94 2 30. 50 314 30. 66 49 30. 81 1 31. 9 301 31. 59 44 31. 89 1 32. 40 277 32. 47 43

Một phần của tài liệu (LUẬN văn THẠC sĩ) các kỹ thuật kiểm thử đột biến và ứng dụng kiểm thử chương trình c (Trang 57 - 62)

Tải bản đầy đủ (PDF)

(63 trang)