Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 12 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
12
Dung lượng
437,74 KB
Nội dung
TRƯỜNG ĐẠI HỌC MỞ HÀ NỘI KHOA CÔNG NGHỆ THÔNG TIN BÁO CÁO BÀI TẬP LỚN MÔN: CÔNG NGHỆ ĐA PHƯƠNG TIỆN Đề tài: Thiết kế nội thất phịng ngủ Khoa: Cơng nghệ thơng tin Chun ngành: Cơng nghệ Đa phương tiện Giảng viên hướng dẫn: Ths Trần Duy Hùng Sinh viên thực hiện: Đường Minh Giang Lớp: 1810A01 Mã sinh viên: 18A10010023 Hà Nội – năm 2022 MỤC LỤC PHẦN GIỚI THIỆU I TỔNG QUAN VỀ NÉN DỮ LIỆU II TỔNG QUAN CÁC LOẠI MÃ NÉN Các chương trình nén hoạt động ? Tốc độ tỷ lệ nén Các loại dư thừa liệu Sự phân bố ký tự .4 Sự lặp lại ký tự Những mẫu sử dụng tần suất Độ dư thừa vị trí .5 III THUẬT TOÁN SHANNON-FANO Ví dụ mơ tả thuật tốn IV TÀI LIỆU THAM KHẢO .7 PHẦN GIỚI THIỆU Công nghệ thông tin (CNTT-IT) mệnh danh ngành ngành Thực vậy, ta thấy hầu hết ngành, nghề nhiều có ứng dụng CNTT vào cơng việc Bảo mật thông tin, nén liệu công việc cần thiết ngành CNTT Từ thời xa xưa, người biết gìn giữ thơng tin qn sự, chiến tranh nhằm làm cho thơng tin an tồn, khơng lọt vào tay đối phương Muốn vậy, người có nhiều cách để làm cho thông tin truyền gọn nhẹ an tồn lưu thơng Để thơng tin đến tay người nhận cách bí mật, gọn gàng họ phải nén thơng tin lại hay dùng ký hiệu đặc biệt có qui ước trước Ngày với tiến khoa học kỹ thuật, CNTT nâng lên tầm cao Mọi ngành, nghề phải ứng dụng CNTT cách triệt để để phát triển cách tốt nhât Ngay cụm từ “Chính phủ điện tử” mà ta thường nghe cho ta thấy tầm quan trọng việc đưa CNTT vào sống Khơng nằm ngồi phát triển có tính qui luật chung xã hội, CNTT làm để phát triển ngày tốt hơn, nhanh hơn, nhẹ hơn, gọn CNTT Viễn thơng có mối liên hệ tương đối chặt chẽ với Một tiêu chí giúp ngành CNTT phát triển sử dụng công nghệ bảo mật, nén liệu, thông tin lưu trữ truyền thông Trong kỹ thuật truyền số liệu, bảo mật nén liệu (nguồn tin) truyền vấn đề quan trọng, nhiều sở lý thuyết mã hóa nguồn cho ta thấy tầm quan trọng việc mã hóa nén liệu Thuật tốn nén liệu Shannon-Fano đời từ lâu Shannon-Fano cho kinh điển công nghệ nén liệu Trong này, em trình bày đơi nét thuật toán nén liệu Shannon-Fano đưa ví dụ cụ thể I TỔNG QUAN VỀ NÉN DỮ LIỆU Trong khoa học máy tính lí thuyết thơng tin, nén đữ liệu q trình mã hóa thơng tin dùng bit so với thơng tin chưa mã hóa cách dùng kết hợp phương pháp Dựa theo nguyên tắc giúptránh tượng kênh truyền bị tải việc truyền tin trở nên kinh tế Nén liệu giúp tiết kiệm tài nguyên dung lượng nhớ, băng thông, thời gian Ngược lại, đữ liệu nén cần phải giải nén để đọc (thực thi, nghe, xem v.v ), trình đòi hỏi tài nguyên định Một ví dụ điển hình việc nén video địi địi hỏi phần cứng đắt tiền để q trình giải nén đủ nhanh để ta có thê xem Do việc thiết kế chương trình nén liệu phụ thuộc nhiều yếu tố mức độ nén, độ méo (đối với nén có tổn hao), tài nguyên hệ thống dùng đề thực trình nén giải nén liệu II TỔNG QUAN CÁC LOẠI MÃ NÉN Các chương trình nén hoạt động ? Ngun tắc chương trình nén nói chung gióng nhau: Tận dụng lặp lại đữ liệu, chuỗi liệu lặp lại thay trỏ chung có độ dài bé Kỹ thuật có hiệu liệu dạng text, bảng tính, file DBF (nén 70%), tính lặp lại liệu loại cao: File chương trình (.EXE COM) nén Tốc độ tỷ lệ nén Ngay tất chương trình nén file đùng chung thuật tốn hoạt động chúng khác Mỗi hãng triển khai thuật tốn kiểu dung hịa hai vấn đề: thời gian tỷ lệ nén Chương trình PKZIP thường trội chương trình nén khác mặt tốc mặt tỷ lệ nén, nhiều Tính ổn định chương trình nén điều cần quan tâm Các file nén nói chung bị hỏng Cũng cân lưu ý loại file nén khơng tương thích với nhau, tức gửi file nén cho người khác người cần phải có chương trình thích hợp giải nén Tuy nhiên đề giải vấn đề này, chương trình ARC + PLUS, LHA PKZIP cho phép tạo file nén tự bung - tức file nén dạng chương trình thực hiện, chạy tự đông bung ra, thị trường bắt đâu xuất chương trình chuyển đơi từ dạng file nén sang dạng file nén khác, ví dụ chương trình DCompress for Windows chun file PKZIP, ARC, LHA sang dạng ARJ Các chương trình nén giá khơng cao (PKZIP: 47USD, LHA cung cấp miễn phí) nên dùng rộng rãi Hạn chế chúng giao điện người dùng không thuận tiện, thường phải gõ lệnh với nhiều tham số đầu nhắc DOS để thực công việc Cải tiến theo hướng thực hiện: ARC +PLUS có giao điện kiểu menu, PKZIP có phân bỏ sung PKZIP menu Nhiều chương trình quản lý file DOS Windows bất đầu đùng kỹ: thuật nén Chương trình Magellan hãng Lofus đùng PKZIP từ năm 1990, chương trình Xtree Gold đưa PKZIP vào công cụ quản lý file năm 1991 Thư mục nén rời sau lại phải bung đề dùng chương trình nén file rườm rà, lý mà chương trình nén đĩa Stacker Super Store sử dụng tương đối rộng rãi Các chương trình nén đĩa hoạt động nguyên tắc giống nén file, khác chúng tự động nén bung mà người dùng quan tâm đến Thời gian tỷ lệ nén chương trình nén loại nàykhác Đề bung 3,5 Mb đữ liệu, chương trình hết 12 giây, chương trình khác 40 giây Tỷ số nén file văn khác: từ 2:1 đến 3:1 Tóm lại dung chương trình nén đĩa, người đùng yên tâm dung lượng trống ô cứng đường tăng khoảng lần Việc bung nén làm việc với đle làm cơng việc châm lại đôi chút Đối với file liệu lớn, điều thể rõ Khi làm việc, chương trình nén đĩa hoạt đơng đạng thường trú, thể mặt chiếm dụng nhớ RAM, mặt gây xung đột với chương trình thường trú khác Các chương trình nén file có cổ hỏng vài fle, cịn chương trình nén đĩa làm hỏng ổ đĩa Tuy điều xảy làm cho nhiễu người e ngại không dám dùng Để cài đặt chương trình nén đĩa cân phân chia lại cứng máy tính cần khởi động đĩa nén trước chương trình nén hoạt động Nếu dùng Windows phần khơng nén cân lớn (thơng thường cần dành 10 Mb cho vùng không nén, nén vùng đĩa cịn lại) Một điều làm người đùng đau đầu phải định tỷ lệ nén Với tỷ lệ nén 10:1 hạn, chương trình nén dành nhiều "con trỏ" đẻ trỏ đến liệu, trỏ chiếm byte, đễ xảy trường hợp khơng đủ trỏ, chương trình báo đĩa đầy mà Cuối cùng, việc loại bỏ chương trình nén đĩa cài đặt vấn đề phiền tối Nhiều chương trình - chẳng hạn Double Density có chức loại bỏ Đối với chương trình khác cần tóm file ấn chương trình nén xóa bỏ chúng Có phải format lại ổ cứng Tóm lại, đù số hạn chế, nén liệu cách thức kinh tế để mở rơng dung lượng cứng Ngồi tiết kiệm nhiễu thời gian kinh phí nén liệu trước truyền Tỷ lệ nén đặc trưng quan trọng phương pháp nén Tuy nhiên, cách đánh giá kết công bố tài liệu cẩn quan tâm xem xét Nhìn chung, người ta định nghĩa tỷ lệ nén sau : Tỷ lệ nén = L/ r x % Với r tỷ số nén định nghĩa : r = kích thước liệu gốc / kích thước liệu thu sau nén Như hiệu suất nén : ( - tỷ lệ nén) x % Trong trình bày sau nói đền kết nén, đùng tỷ số nén, thí dụ 10 có nghĩa liệu gốc 10 sau nén có phân Tuy nhiên, phải thấy số đo phương pháp nén có giá trị với nén đó, hiệu nén cịn phụ thuộc vào kiểu liệu định nén nhiều tỷ lệ nén cao chưa thể nói phương pháp hiệu phương pháp khác, cịn phí khác thời gian, khơng gian chí độ phức tạp tính tốn Thí dụ nén phục vị truyền đữ liệu : vấn đề đặt hiệu nén có tương hợp với đường truyền khơng Các loại dư thừa liệu Như nói, nén nhằm mục đích giảm kích thước liệu cách loại bỏ dư thừa liệu việc xác định chất kiểu dư thừa liệu có ích cho việc xây dựng phương pháp nén liệu khác Nói cách khác, phương pháp nén liệu khác sử dụng kiểu dư thừa liệu khác Có kiểu dư thừa trình bày mục sau Sự phân bố ký tự Trong dầy ký tự, có số ký tự có tần suất xuất nhiều mí khác Do vậy, ta có thê mã hố đữ liệu cách đọng Các ký tự có tần xuấtxuất cao thay từ mã nhị phân với số bít nhỏ; ngược lại có tần xuất xuất thấp mã hóa từ mã có nhiều bít Đây chất phương pháp mã hố Shannon-Fano Sự lặp lại ký tự Trong số tình ảnh, ký hiệu (bít "0" hay bít "1") lặp lặp lại số lần Kỳ thuật nén đùng trường hợp thay dây lặp dãy gồm thành phần: số lần lặp kí hiệu dùng đẻ mã hóa Phương pháp mã hố kiểu có tên mã hóa loạt đài RLC (Run Length Coding) Những mẫu sử dụng tần suất Có thể có dây ký hiệu xuất với tần suất tương đối cao Do vậy, mã hố bít Đây sở phương pháp mã hoá kiêu từ điên Lempel-Z4v đưa có cải tiến vào năm 1977, 1978 có tên gọi phương pháp nén LZ77, LZ7§ Năm 1984, Terry Welch cải tiến hiệu đặt tên LZW (Lempel-Ziv- Welch) Thuật toán nén liệu dựa vào mẫu sử dụng tần suất hiệu phải kể đến phương pháp nén liệu Shannon-Fano Độ dư thừa vị trí Do phụ thuộc lẫn liệu, biết ký hiệu (giá trị) xuất vị trí, đồng thời có thê đoán trước xuất giá trị vị trí khác cách phù hợp Chăng hạn, ảnh biểu diễn lưới hai chiều, số điểm hàng đọc khối đữ lệu lại xuất vị trí hàng khác Do vậy, thay lưu trữ liệu, ta cần lưu trữ vị trí hàng cột Phương pháp nén dựa dư thừa gọi phương pháp mã hoá dự đoán Cách đánh giá độ dư thừa hồn tồn mang tính trực quan nhằm biểu thị xuất nhiều lần Đối với liệu ảnh, đặc thù chung đó, cịn có đặc thù riêng Thí dụ có ứng dụng khơng cần tồn dừ liệu thô ảnh mà cần thông tin đặc trưng biêu diễn ảnh biên ảnh hay vùng đồng Do vậy, có phương pháp nén riêng cho ảnh dựa vào biến đổi ảnh hay đựa vào biểu diễn ảnh III THUẬT TOÁN SHANNON-FANO Các bước thực mã hoá theo thuật toán Shanon-Fano: Bước 1: Sắp xếp ký tự theo thứ tự giảm dân Bước 2: Tính xác suất Bước 3: Đệ quy làm hai phần, phần có tơng xác suất gần Mã hoá phần bit (hoặc bit 1), phần đưới bit 1(hoặc bit 0) Bước 4: Về sơ đồ Bước 5: Tính Entropy, số bits mã hố trung bình số bit mã hố thơng thường Ví dụ mơ tả thuật tốn Thống kê lượng tin: Ký hiệu A B C D E Số lần xuất 15 6 Pi Mã hóa lượng tin: Ký hiệu Đếm A 15 15/39 Log2(1/Pi ) 0 B 7/39 14 C 6/39 12 E 6/39 1 18 D 5/39 1 15 Số bits sử dụng trung bình : (tổng bits/ số lần xuất hiện) R=(30+14+12+18+15)/39+2.29 bits Mã Tổng bits 30 IV TÀI LIỆU THAM KHẢO https://bom.so/Cz0Gn9 10