BÁO CÁO MÔN HỌC MẬT MÃ AN TOÀN DỮ LIỆU NÉN DỮ LIỆU DẠNG VĂN BẢN SỐ Nén dữ liệu là quá trình mã hóa thông tin dùng ít bit hơn so với thông tin chưa được mã hóa bằng cách dùng một hoặc kết hợp của các phương pháp nào đó. Dựa theo nguyên tắc này giúp tránh các hiện tượng kênh truyền bị quá tải và việc truyền tin trở nên kinh tế hơn. Nén dữ liệu giúp tiết kiệm các tài nguyên như dung lượng bộ nhớ, băng thông, thời gian.
NÉN DỮ LIỆU DẠNG VĂN BẢN SỐ MÔN Học: Mật mã và an toàn dữ liệu GVHD: PGS.TS. Trịnh nhật tiến HVCH: Hoàng việt hải – K20mmt - MSV: 13025199 Tổng quan về nén dữ liệu và các chương trình nén dữ liệu Các phương pháp nén dữ liệu dạng văn bản số Một số phương pháp nén dữ liệu các dạng dữ liệu khác Demo chương trình nén dữ liệu Tổng quan 1 2 3 4 Tổng quan về nén dữ liệu • Nén dữ liệu là quá trình mã hóa thông tin dùng ít bit hơn so với thông tin chưa được mã hóa bằng cách dùng một hoặc kết hợp của các phương pháp nào đó. • Dựa theo nguyên tắc này giúp tránh các hiện tượng kênh truyền bị quá tải và việc truyền tin trở nên kinh tế hơn. • Nén dữ liệu giúp tiết kiệm các tài nguyên như dung lượng bộ nhớ, băng thông, thời gian. • Ngược lại, dữ liệu đã được nén cần phải được giải nén để đọc (thực thi, nghe, xem v.v…), quá trình này cũng đòi hỏi các tài nguyên nhất định. Một ví dụ điển hình là việc nén video đòi có thể đòi hỏi phần cứng đắt tiền để quá trình giải nén đủ nhanh để ta có thể xem được. Do đó việc thiết kế một chương trình nén dữ liệu phụ thuộc nhiều yếu tố như mức độ nén, độ méo (đối với nén có tổn hao), tài nguyên hệ thống dùng để thực hiện quá trình nén và giải nén dữ liệu. Tổng quan về nén dữ liệu và các chương trình nén dữ liệu Tổng quan về nén dữ liệu và các chương trình nén dữ liệu Tổng quan về nén dữ liệu và các chương trình nén dữ liệu CÁC PHƯƠNG PHÁP THƯỜNG DÙNG NÉN DỮ LIỆU DẠNG VĂN BẢN SỐ Thuật toán Shannon-Fano • Các bước thực hiện mã hoá theo thuật toán Shanon-Fano: • Bước 1: Sắp xếp các ký tự theo thứ tự giảm dần. • Bước 2: Tính xác suất • Bước 3: Đệ quy làm hai phần, mỗi phần có tổng xác suất gần bằng nhau. Mã hoá phần trên bằng bit 0 (hoặc bit 1), phần dưới bằng bit 1(hoặc bit 0). • Bước 4: Vẽ sơ đồ cây. • Bước 5: Tính Entropy, số bits mã hoá trung bình và số bit mã hoá thông thường. Thuật toán Shannon-Fano • Ví dụ mô tả thuật toán • Thống kê lượng tin: Ký hiệu A B C D E Số lần xuất hiện 15 7 6 5 6 Ký hiệu Đếm Pi Log2(1/pi) Mã Tổng bits A 15 15/39 1.38 0 0 30 B 7 7/39 2.48 0 1 14 C 6 6/39 2.7 1 0 12 E 6 6/39 2.7 1 1 0 18 D 5 5/39 2.96 1 1 1 15 • Mã hóa lượng tin • Số bits sử dụng trung bình: (tổng bits/ số lần xuất hiện). R = (30+14+12+18+15) / 39 = 2.29 bits Thuật toán Huffman • Thuật toán Huffman có ưu điểm là hệ số nén tương đối cao, phương pháp thực hiện tương đối đơn giản, đòi hỏi ít bộ nhớ, có thể xây dựng dựa trên các mảng bé hơn 64KB. Nhược điểm của nó là phải chứa cả bảng mã vào tập tin nén thì phía nhận mới có thể giải mã được do đó hiệu suất nén chỉ cao khi ta thực hiện nén các tập tin lớn. • Nguyên lý của phương pháp Huffman là mã hóa các bytes trong tệp dữ liệu nguồn bằng biến nhị phân. Nó tạo mã độ dài biến thiên là một tập hợp các bits. Đây là phương pháp nén kiểu thống kê, những ký tự xuất hiện nhiều hơn sẽ có mã ngắn hơn (gần giống Shannon-Fano). Thuật toán Huffman • Thuật toán nén: • Bước 1: Tìm hai ký tự có trọng số nhỏ nhất ghép lại thành một, trọng số của ký tự mới bằng tổng trọng số của hai ký tự đem ghép. • Bước 2: Trong khi số lượng ký tự trong danh sách còn lớn hơn một thì thực hiện bước một, nếu không thì thực hiện bước ba. • Bước 3: Tách ký tự cuối cùng và tạo cây nhị phân với quy ước bên trái mã 0, bên phải mã 1. [...]... là: mặt phẳng nghiêng, đòn bẩy, ròng rọc Dặn dò: Để chuẩn bị tốt cho tiết học sau, các em hãy: - Học thuộc phần ghi nhớ ở SGK - Làm các bài tập 13.1, 13.2, 13.3 trong sách Bài tập Tiết học đến đây là kết thúc Chúc quý thầy cô sức khoẻ Chúc các em học tốt Chọn từ thích hợp trong dấu ngoặc để điền vào chổ trống: ( dễ dàng , nhanh, pa lăng, máy cơ đơn giản a) Máy cơ đơn giản là những dụng cụ giúp thực . trình nén dữ liệu Các phương pháp nén dữ liệu dạng văn bản số Một số phương pháp nén dữ liệu các dạng dữ liệu khác Demo chương trình nén dữ liệu Tổng quan 1 2 3 4 Tổng quan về nén. và giải nén dữ liệu. Tổng quan về nén dữ liệu và các chương trình nén dữ liệu Tổng quan về nén dữ liệu và các chương trình nén dữ liệu Tổng quan về nén dữ liệu và. NÉN DỮ LIỆU DẠNG VĂN BẢN SỐ MÔN Học: Mật mã và an toàn dữ liệu GVHD: PGS.TS. Trịnh nhật tiến HVCH: Hoàng việt hải – K20mmt - MSV: 13025199 Tổng quan về nén dữ liệu