Báo cáo MẬT MÃ VÀ AN TOÀN DỮ LIỆU NÉN DỮ LIỆU

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang	10
Dung lượng	186,34 KB

Nội dung

Báo cáo MẬT MÃ VÀ AN TOÀN DỮ LIỆU NÉN DỮ LIỆU Nén dữ liệu nhằm làm giảm lượng thông tin “dư thừa” trong dữ liệu gốc và do vậy, lượng thông tin thu được sau khi nén thường nhỏ hơn dữ liệu gốc rất nhiều. Tỷ lệ nén là một trong các đặc trưng quan trọng nhất của mọi phương pháp nén.

MẬT MÃ VÀ AN TOÀN DỮ LIỆU Học viên: Trần Viết Hùng Giảng viên: Trịnh Nhật Tiến Chủ đề: Phân loại các Phương pháp Nén tin số (Nén dữ liệu: Data Compression) NÉN DỮ LIỆU • Nén dữ liệu nhằm làm giảm lượng thông tin “dư thừa” trong dữ liệu gốc và do vậy, lượng thông tin thu được sau khi nén thường nhỏ hơn dữ liệu gốc rất nhiều. • Tỷ lệ nén là một trong các đặc trưng quan trọng nhất của mọi phương pháp nén. CÁC LOẠI DƯ THỪA DỮ LIỆU Có 4 kiểu dư thừa chính • Sự phân bố ký tự • Sự lặp lại của các ký tự • Những mẫu sử dụng tần suất • Độ dư thừa vị trí PHÂN LOẠI PHƯƠNG PHÁP NÉN Có nhiều cách phân loại các phương pháp nén khác nhau. • Cách thứ nhất dựa vào nguyên lý nén. Cách này phân các phương pháp nén thành hai họ lớn: • Nén chính xác hay nén không mất thông tin • Nén có mất thông tin. PHÂN LOẠI PHƯƠNG PHÁP NÉN • Cách phân loại thứ hai dựa vào cách thức thực hiện nén. Theo cách này, người ta cũng phân thành hai họ: • Phương pháp không gian (Spatial Data Compression) • Phương pháp sử dụng biến đổi (Transform Coding) PHÂN LOẠI PHƯƠNG PHÁP NÉN • Có một cách phân loại khác nữa, cách phân loại thứ ba, dựa vào triết lý của sự mã hóa. Cách này cũng phân các phương pháp nén thành hai họ: • Các phương pháp nén thế hệ thứ nhất: – Mã hóa loạt dài RLC (Run Length Coding) – Mã hóa Huffman – Mã hóa LZW (Lempel Ziv-Wench) – Mã hóa khối (Block Coding) • Các phương pháp nén thế hệ thứ hai, có thể phân thành hai lớp nhỏ: – Lớp phương pháp sử dụng các phép toán cục bộ để tổ hợp đầu ra theo cách thức hợp lý và – Lớp phương pháp sử dụng biểu diễn ảnh Mã hóa Huffman • Phương pháp mã hóa Huffman là phương pháp dựa vào mô hình thông kê. Dựa vào dữ liệu gốc, người ta tính tần suất xuất hiện của các ký tự. • Việc tính tần suất được thực hiện bởi cách duyệt tuần tự tệp gốc từ đầu đến cuối. • Việc xử lý ở đây tính theo bit. • Trong phương pháp này người ta gán cho các ký tự có tần suất cao một từ mã ngắn, các ký tự có tần suất thấp từ mã dài. Mã hóa Huffman • Thuật toán: Thuật toán bao gồm 2 bước chính – Giai đoạn thứ nhất: tính tần suất của các ký tự trong dữ liệu gốc. – Giai đoạn thứ hai: mã hóa: duyệt bảng tần suất từ cuối lên đầu để thực hiện ghép 2 phần tử có tần suất xuất hiện thấp nhất thành một phần tử duy nhất. Phần tử này có tần suất bằng tổng 2 tần suất thành phần. Tiến hành cập nhật lại bảng và đương nhiên loại bỏ 2 phần tử đã xét. Quá trình được lặp lại cho đến khi bảng chỉ có một phần tử. Quá trình này gọi là quá trình tạo cây mã Huffman vì việc tập hợp được tiến hành nhờ một cây nhị phân 2 nhánh. Phần tử có tần suất thấp ở bên phải, phần tử kia ở bên trái. KẾT LUẬN • Mỗi phương pháp nén đều có những ưu điểm và nhược điểm. Tính hiệu quả của phương pháp không chỉ phụ thuộc vào tỉ số nén mà còn vào nhiều chỉ tiêu khác như: độ phức tạp tính toán, nhạy cảm với nhiễu, chất lượng, kiểu ảnh, v.v… • Nén là một vấn đề lớn được quan tâm nhiều và có liên quan đến nhiều lĩnh vực khác nhau. SO SÁNH CÁC PHƯƠNG PHÁP NÉN

Ngày đăng: 25/10/2014, 22:54

Xem thêm