Báo cáo nhập môn xử lý ảnh bằng phương pháp nén từ điển LZW

25 211 0
Báo cáo nhập môn xử lý ảnh bằng phương pháp nén từ điển LZW

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Nhập môn Xử lý ảnh Tìm hiểu và khảo sát, xây dựng ứng dụng thử nghiệm của phương pháp nén từ điển LZWNhập môn xử lý ảnh ứng dụng phương pháp nén từ điển LZWKhảo sát và ứng dụng thử nghiệm phương pháp nén từ điển LZW

Đề 12: Tìm hiểu khảo sát xây dựng ứng dụng thử nghiệm phương pháp nén từ điển LZW MỤC LỤC LỜI NĨI ĐẦU Cách mạng cơng nghệ 4.0 ngày phát triển kéo theo thay đổi vượt bậc sống người Đứng trước thời đại công nghệ số, người người nhà nhà có tay thiết bị cơng nghệ thơng minh phục vụ cho công việc thiết yếu thường nhật, việc gửi thông tin hay truyền tải liệu, hình ảnh mà khơng cần phải tốn cơng sức thời gian chờ đợi nút click Tuy nhiên, song song với việc đem lại thuận lợi rõ rệt sống ngày lĩnh vực cơng nghệ thơng tin đồng thời lại thách thức lớn trình phát triển Ngày nay, dễ dàng bắt gặp hình ảnh người chia sẻ với khơng thơng tin mà kèm theo hình ảnh sinh động lưu giữ lại ngày thông qua Internet mạng không dây Việc làm nhanh gọn chất lượng hình ảnh truyền đơi lại gặp nhiều rắc rối hình ảnh truyền có dung lượng lớn chất lượng hình ảnh giảm qua lần chia sẻ, đòi hỏi việc xử lý ảnh phải thật tốt để khơng gặp phải vấn đề Cũng mà phương pháp nén ảnh đời với kỹ thuật mã hóa ảnh số hóa nhằm giảm số lượng bit liệu cần thiết để biểu diễn ảnh, giúp giảm chi phí việc lưu trữ ảnh chi phí thời gian để truyền ảnh xa truyền thông đảm bảo chất lượng hình ảnh Một phương pháp bật phương pháp nén từ điển LZW Đây đề tài nhóm 12 chúng em nói đến báo cáo Do kiến thức hạn hẹp nên báo cáo chúng em nhiều thiếu xót, vậy, chúng em mong nhận góp ý thầy bạn để báo cáo nhóm hồn thiện Chúng em xin chân thành cảm ơn! Nhóm 12 Đề 12: Tìm hiểu khảo sát xây dựng ứng dụng thử nghiệm phương pháp nén từ điển LZW CHƯƠNG I: TỔNG QUAN VỀ XỬ LÝ ẢNH SỐ I XỬ LÝ ẢNH SỐ LÀ GÌ? Xử lý ảnh lĩnh vực mang tính khoa học công nghệ Tuy mẻ so với nhiều ngành khoa học khác tốc độ phát triển nhanh, kích thích trung tâm nghiên cứu, ứng dụng, đặc biệt máy tính chun dụng riêng cho Xử lý ảnh môn học liên quan đến nhiều lĩnh vực cần nhiều kiến thức sở khác Đầu tiên phải kể đến Xử lý tín hiệu số môn học cho xử lý tín hiệu chung, khái niệm tích chập, biến đổi Fourier, biến đổi Laplace, lọc hữu hạn… Thứ hai cơng cụ tốn Đại số tuyến tính, sác xuất, thống kê Bên cạnh số kiến thức cần thiết Trí tuệ nhân tạo, Mạng nơ ron nhân tạo đề cập q trình phân tích nhận dạng ảnh II CÁC ỨNG DỤNG CỦA XỬ LÝ ẢNH SỐ 1.2.1 Biến đổi ảnh (Image Transform) Trong xử lý ảnh, số điểm ảnh lớn tính tốn nhiều (độ phức tạp tính tốn cao) đòi hỏi dung lượng nhớ lớn, thời gian tính tốn lâu Người ta sử dụng phép toán tương đương biến đổi sang miền xử lý khác để dễ tính tốn Sau xử lý dễ dàng thực hiện, dùng biến đổi ngược để đưa miền xác định ban đầu Các biến đổi thường gặp xử lý ảnh bao gồm: - Biến đổi Fourier, Cosin, Sin Biến đổi (mơ tả) ảnh tích chập, tích Kronecker (theo xử lý số tín hiệu) Các biến đổi khác KL (Karhumen Love), Hadamard 1.2.2 Nén ảnh Ảnh dù dạng chiếm không gian nhớ lớn Khi mô tả ảnh, người ta đưa kỹ thuật nén ảnh vào Các giai đoạn chia hệ 1, hệ Hiện nay, chuẩn MPEG dùng với ảnh phát huy hiệu III CÁC BƯỚC CƠ BẢN TRONG XỬ LÝ ẢNH SỐ Các phương pháp xử lý ảnh ứng dụng chính: nâng cao chất lượng ảnh phân tích ảnh Nhóm 12 Đề 12: Tìm hiểu khảo sát xây dựng ứng dụng thử nghiệm phương pháp nén từ điển LZW Các bước xử lý ảnh 1.3.1 Thu nhận ảnh (Image Acquisition) Ảnh nhận qua camera màu đen trắng Thường ảnh nhận qua camera loại tương tự, có loại camera số hóa loại photodiot tạo cường độ sáng điểm ảnh Camera thường dùng loại quét dòng, ảnh tạo có dạng hai chiều Chất lượng ảnh thu nhận phụ thuộc vào thiết bị thu, vào môi trường (ánh sáng, phong cảnh) 1.3.2 Tiền xử lý (Image Processing) Sau thu nhận, ảnh nhiễu, độ tương phản thấp nên cần đưa vào tiền xử lý để nâng cao chất lượng Bộ tiền xử lý giúp lọc nhiễu ảnh, nâng độ tương phản để làm ảnh rõ hơn, nét 1.3.3 Phân đoạn (Segmentation) hay phân vùng ảnh Phân vùng ảnh tách ảnh đầu vào thành vùng thành phần để biểu diễn phân tích, nhận dạng ảnh Kết nhận dạng ảnh phụ thuộc nhiều vào công đoạn phần phức tạp xử lý ảnh, dễ gây lỗi làm độ xác ảnh 1.3.4 Biểu diễn ảnh (Image Representation) Đầu ảnh sau phân đoạn chứa điểm ảnh vùng ảnh (ảnh phân đoạn) cộng với mã liên kết vùng lân cận Việc biến đổi số liệu thành dạng thích hợp cần thiết cho xử lý máy tính Việc chọn tính chất để thể ảnh gọi trích chọn đặc trưng (Feature election) gắn với việc tách đặc tính ảnh dạng thông tin định lượng làm sở để phân biệt lớp đối tượng với đối tượng khác phạm vi ảnh nhận 1.3.5 Nhận dạng nội suy ảnh (Image Recognition and Interpretation) Nhóm 12 Đề 12: Tìm hiểu khảo sát xây dựng ứng dụng thử nghiệm phương pháp nén từ điển LZW Nhận dạng ảnh trình xác định ảnh Quá trình thường thu cách so sánh với mẫu chuẩn học (hoặc lưu) từ trước Nội suy phán đoán theo ý nghĩa sở nhận dạng Có nhiều cách phân loại ảnh khác Theo lý thuyết nhận dạng, mơ hình tốn học ảnh phân theo hai loại nhận dạng ảnh bản: • • Nhận dạng theo tham số Nhận dạng theo cấu trúc 1.3.6 Cơ sở tri thức (Knowledge Base) Ảnh đối tượng phức tạp đường nét, độ sáng tối, dung lượng điểm ảnh, môi trường để thu nhận ảnh phong phú kéo theo nhiễu Trong nhiều khâu xử lý phân tích ảnh ngồi việc đơn giản hóa phương pháp toán học đảm bảo tiện lợi cho xử lý, người ta mong muốn bắt chước quy trình tiếp nhận xử lý ảnh theo cách người Hiện nay, nhiều khâu xử lý theo phương pháp trí tuệ người, sở tri thức phát huy IV CÁC THÀNH PHẦN CỦA MỘT HỆ THỐNG XỬ LÝ ẢNH Các thành phần hệ thống xử lý ảnh Theo quan điểm hệ thống xử lý máy tính số, hệ thống xử lý ảnh bao gồm: đầu đo (thu nhận ảnh), số hóa, máy tính số, hiển thị nhớ Nhóm 12 Đề 12: Tìm hiểu khảo sát xây dựng ứng dụng thử nghiệm phương pháp nén từ điển LZW CHƯƠNG II: TỔNG QUAN VỀ PHƯƠNG PHÁP NÉN TỪ ĐIỂN LZW I NÉN DỮ LIỆU Nén liệu nhằm làm giảm lượng thông tin “dư thừa” liệu gốc vậy, lượng thông tin thu sau nén thường nhỏ liệu gốc nhiều Đối với liệu ảnh, kết thường 10:1 Một số phương pháp cho kết cao Do chất kỹ thuật nên nén liệu có số tên gọi khác như: giảm độ dư thừa hay mã hóa ảnh gốc Vì kỹ thuật nén phụ thuộc vào nhiều yếu tố chất liệu gốc nên chưa có phương pháp nén coi phương pháp vạn (Universal), dù có nhiều kỹ thuật nén công bố suốt hai thập kỷ phát triển Nói riêng nén ảnh, kỹ thuật mã hóa ảnh số hóa nhằm giảm số lượng bit liệu cần thiết để biểu diễn ảnh Nén ảnh đạt cách loại bỏ phần dư thừa ảnh số hóa Đó dư thừa thông tin không gian, dư thừa cấp xám hay dư thừa thời gian Ngày nay, nén ảnh áp dụng nhiều vào thực tế, điển việc truyền tải văn đồ họa hay hình ảnh thơng qua Internet mạng khơng dây, giúp giảm chi phí việc lưu trữ gửi hình ảnh, tiết kiệm thời gian truyền tải ảnh xa mà chất lượng hình ảnh đảm bảo Nén ảnh thực thực tế: thông tin ảnh khơng phải ngẫu nhiên mà có trật tự, tổ chức Do đó, bóc tách tính trật tự, cấu trúc biết phần thơng tin quan trọng ảnh để biểu diễn truyền với số lượng bit so với ảnh gốc mà đảm bảo tính đầy đủ thơng tin Ở bên nhận, q trình giải mã tổ chức, xếp lại ảnh xấp xỉ gần xác so với ảnh gốc thỏa mãn chất lượng yêu cầu II TỔNG QUAN VỀ NÉN TỪ ĐIỂN LZW LZW (Lempel – Ziv – Welch) phương pháp nén liệu đặt tên dựa theo nhà phát minh Abraham Lempel, Jacob Ziv Terry Welch Năm 1978, hai nhà khoa học Lempel Ziv lần đưa khái niệm nén từ điển, sau phát triển thành họ giải Nhóm 12 Đề 12: Tìm hiểu khảo sát xây dựng ứng dụng thử nghiệm phương pháp nén từ điển LZW thuật nén từ điển đặt tên LZ Năm 1984, Terry Welch cải tiến giải thuật trở nên hiệu đổi tên thành LZW LZW phương pháp nén không gây thông tin cho phép liệu gốc xây dựng lại hồn tồn từ liệu nén, nói cách khác, sau giải nén ta thu xác liệu gốc Nó hoạt động dựa ý tưởng đơn giản có tiềm thơng lượng cao việc triển khai phần cứng để người mã hóa người giải mã xây dựng bảng mã Bảng mã không cần lưu kèm với liệu trình nén, mà giải nén, người giải nén xây dựng lại Cụ thể, phương pháp LZW dựa việc xây dựng từ điển lưu chuỗi ký tự xuất văn với tần suất lặp lại cao, “chuỗi ký tự” xuất sau thay từ mã tương ứng gặp lại chúng Giải thuật LZW hay giải thuật nén khác kỹ thuật tổ chức từ điển cho phép nâng cao tỷ lệ nén Thuật toán ứng dụng rộng rãi nén tệp hệ điều hành Unix, dùng cho tất loại file nhị phân Nó thường dùng để nén loại văn bản, ảnh đen trắng, ảnh màu… chuẩn nén cho dạng ảnh GIF, TIFF… Mức độ hiệu LZW không phụ thuộc vào số bit màu ảnh Nhóm 12 Đề 12: Tìm hiểu khảo sát xây dựng ứng dụng thử nghiệm phương pháp nén từ điển LZW CHƯƠNG III: THUẬT TOÁN I PHƯƠNG PHÁP VÀ Ý TƯỞNG Phương pháp nén LZW hoạt động theo nguyên tắc tạo từ điển động theo liệu file ảnh, hay xây dựng từ điển lưu mẫu có tần suất xuất cao ảnh Từ điển tập hợp cặp từ vựng nghĩa Trong đó, từ vựng từ mã xếp theo thứ tự định Nghĩa chuỗi liệu ảnh Từ điển xây dựng đồng thời với trình đọc liệu Sự có mặt chuỗi từ điển khẳng định chuỗi xuất phần liệu đọc Do kích thước nhớ vô hạn để đảm bảo tốc độ tìm kiếm, từ điển giới hạn 4096 phần tử dùng để lưu lớn 4096 giá trị từ mã Như độ dài lớn từ mã 12 bit (4096 = 212) Ý tưởng thuật toán phát triển theo nguyên lý tạo dãy mã với cấu trúc có dạng sau: Khố 0 1 Ghi 255 255 256 256 (Clear Code) 257 257 (End Of Information) 258 Chuỗi 259 Chuỗi 4095 Nhóm 12 Ý nghĩa Chuỗi Đề 12: Tìm hiểu khảo sát xây dựng ứng dụng thử nghiệm phương pháp nén từ điển LZW • 256 từ mã theo thứ tự từ đến 255, chứa số nguyên từ đến 255 miêu tả dãy ký tự thay cho ký tự bit tương ứng 256 ký tự ký tự bảng mã ASCII • Mã từ 256 đến 4095 tạo bên từ điển cho trường hợp lặp chuỗi liệu Trong đó: - Từ mã thứ 256 chứa mã đặc biệt “mã xóa” (CC - Clear Code) Mục đích việc dùng mã xóa nhằm khắc phục tình trạng số mẫu lặp ảnh lớn 4096 Khi ảnh quan niệm nhiều mảnh ảnh, từ điển từ điển gồm nhiều từ điển Cứ hết mảnh ảnh người ta lại gửi mã xóa để báo hiệu kết thúc mảnh ảnh cũ, bắt đầu mảnh ảnh đồng thời khởi tạo lại từ điển cho mảnh ảnh Mã xóa có giá trị 256 - Từ mã thứ 257 chứa mã kết thúc thông tin (EOI - End Of Information) Mã có giá trị 257 Một file ảnh chứa nhiều ảnh (ví dụ ảnh GIF), ảnh mã hóa riêng mã EOI dùng để xác định điểm kết thúc thông tin ảnh Chương trình giải mã lặp lặp lại thao tác giải mã ảnh gặp mã kết thúc thơng tin dừng lại - Các từ mã lại (từ 258 đến 4095) chứa mẫu lặp lại ảnh Các mã sinh q trình mã hố 512 phần tử từ điển biểu diễn bit Các từ mã từ 512 đến 1023 biểu diễn 10 bit, từ 1024 đến 2047 biểu diễn 11 bit từ 2048 đến 4095 biểu diễn 12 bit • Mỗi bước nén, byte nhập vào tập hợp lại thành chuỗi ký tự tạo thành chuỗi chưa tồn từ điển, mã cho chuỗi tạo thêm vào từ điển, mã xuất file output II MÃ HĨA (ENCODING) Thuật tốn cấp cao mã hóa hiển thị sau: • Bước 1: Khởi tạo từ điển chứa tất chuỗi có ký tự • Bước 2: Tìm chuỗi W dài từ điển đối chiếu với liệu nhập • Bước 3: Xuất vị trí từ điển cho W file output xóa W khỏi liệu nhập • Bước 4: Thêm W ký tự liệu nhập vào từ điển Nhóm 12 Đề 12: Tìm hiểu khảo sát xây dựng ứng dụng thử nghiệm phương pháp nén từ điển LZW • Bước 5: Chuyển sang bước Một từ điển khởi tạo để chứa chuỗi ký tự đơn tương ứng với tất ký tự đầu vào khả thi (khơng có khác ngoại trừ mã rõ ràng dừng chúng sử dụng) Thuật toán hoạt động cách quét qua chuỗi đầu vào cho chuỗi liên tục dài tìm thấy chuỗi khơng có từ điển Khi tìm thấy chuỗi vậy, ghi vào chuỗi khơng có ký tự cuối Nói cách dễ hiểu, LZW bắt đầu từ điển 256 kí tự (trong trường hợp sử dụng bảng mã bits) sử dụng chúng tập kí tự chuẩn Sau đó, lần đọc đọc bits mã hóa thành số tương ứng với mục kí tự từ điển Mỗi LZW qua chuỗi thêm chuỗi vào từ điển Mỗi qua chuỗi mà thấy trước đó, đọc thêm kí tự cộng với chuỗi biết để tạo chuỗi Lần LZW bắt gặp chuỗi có, có việc sử dụng số mục tương ứng từ điển Thường người ta định sẵn số lượng lớn từ từ điển (giả sử 4096), thế, việc nén LZW khơng làm tiêu tốn hết tồn bộ nhớ Vì mã chuỗi ví dụ 12 bits (212 = 4096) Cần thiết phải lập mã dài số bits kí tự (12 bits), nhiều chuỗi lặp lại thay mã việc nén thực Bằng cách này, chuỗi liên tiếp dài ghi từ điển cung cấp cho lần mã hóa dạng giá trị đầu đơn Thuật toán hoạt động tốt liệu với mẫu lặp lại, đó, phần ban đầu thơng điệp thấy nén Tuy nhiên, thông báo tăng lên, tỷ lệ nén có xu hướng tiệm cận đến mức tối đa (tức là, hệ số nén tỷ lệ cải thiện đường cong tăng dần khơng tuyến tính, tiếp cận mức tối đa theo lý thuyết khoảng thời gian giới hạn) III GIẢI MÃ (DECODING) Quá trình giải mã LZW khơng có phức tạp Thêm vào lại có nhiều lợi khơng cần từ điển hay thơng tin tạp phí cần thiết cho trình giải nén Một từ điển đồng với từ điển gốc tạo nén tái tạo lại trình giải nén Q trình mã hóa giải mã cần phải sử dụng từ điển khởi đầu Nhóm 12 Đề 12: Tìm hiểu khảo sát xây dựng ứng dụng thử nghiệm phương pháp nén từ điển LZW Thuật toán giải mã hoạt động cách đọc giá trị từ liệu đầu vào (dữ liệu nhập) mã hóa xuất chuỗi tương ứng với từ điển khởi tạo Tại thời điểm, thu giá trị từ liệu nhập, ký tự chuỗi cộng thêm vào chuỗi làm việc Chuỗi tạo thêm vào từ điển (hồn tồn giống với q trình mã hóa) Chuỗi giải mã lại trở thành chuỗi làm việc, ký tự chuỗi nhận mã hóa ký tự q trình tiếp tục Sau đó, trình giải nén xử lý giá trị nhập tiếp theo, trình lặp liệu nhập khơng còn, thời điểm giá trị nhập cuối mã hóa khơng giá trị thêm vào từ điển Bằng cách này, giải mã xây dựng từ điển giống với từ điển mã hóa sử dụng sử dụng để giải mã giá trị đầu vào Vì vậy, từ điển đầy đủ không cần phải gửi với liệu mã hóa mà cần từ điển ban đầu chứa chuỗi ký tự đơn đủ (thường xác định trước mã hóa giải mã thay gửi cách rõ ràng với liệu mã hóa) IV BIẾN THIÊN ĐỘ RỘNG (VARIABLE-WIDTH CODES) Biến thiên độ rộng hay mã có chiều rộng thay đổi khoảng rộng dãy bit chứa mã mã hóa vùng nhớ máy tính Trong biến thiên độ rộng, sử dụng mã có độ rộng biến thiên, mã hóa giải mã phải cẩn thận để thay đổi chiều rộng điểm liệu mã hóa, chúng khơng chấp nhận nơi ranh giới mã riêng lẻ nằm luồng Trong chuẩn, trình nén mã tăng độ rộng p lên p+1 chuỗi ω+s không tồn từ điển (vì vậy, mã phải thêm vào), giá trị thêm bảng lại 2p (mã yêu cầu p+1 bit) Bộ mã hóa phát mã cho ω độ rộng p (vì mã khơng u cầu p + bit), sau tăng độ rộng mã để mã phát rộng p + bit Bộ giải mã ln mã phía sau mã hóa việc xây dựng bảng Vì vậy, nhận thấy mã cho ω, tạo mục nhập cho mã p - Vì điểm mà mã hóa tăng chiều rộng mã, giải mã phải tăng chiều rộng tốt nhất: thời điểm mà tạo mã lớn phù hợp với bit p Tuy nhiên, số thuật tốn mã hóa tăng độ rộng mã triển khai sớm sau phát ω chiều rộng thay vi chiều rộng cũ Điều gọi "thay đổi sớm", gây Nhóm 12 10 Đề 12: Tìm hiểu khảo sát xây dựng ứng dụng thử nghiệm phương pháp nén từ điển LZW nhiều nhầm lẫn Adobe – hãng phần mềm hàng đầu Mỹ cho phép hai phiên tệp PDF, bao gồm cờ rõ ràng phần tiêu đề luồng nén LZW cho biết liệu thay đổi ban đầu có sử dụng hay khơng Ngồi định dạng tệp đồ họa có khả sử dụng nén LZW, dạng TIFF sử dụng thay đổi sớm, dạng GIF dạng khác khơng Khi bảng mã xóa để đáp ứng với mã rõ ràng, mã hóa giải mã thay đổi độ rộng mã sau mã rõ ràng trở lại chiều rộng mã ban đầu, bắt đầu với mã sau mã rõ ràng V THỨ TỰ ĐÓNG GÓI (PACKING ORDER) Vì mã phát thường khơng nằm ranh giới byte, mã hóa giải mã phải đồng ý cách mã đóng gói thành byte Với hai phương thức phổ biến sau: • LBS-first (Least sagnificant bit first: bit quan trọng đầu tiên): - Trong máy tính, LBS vị trí bit số nguyên nhị phân cho giá trị đơn vị, nghĩa xác định xem số chẵn hay lẻ LBS gọi bit thứ tự thấp bit bên phải, quy ước ký hiệu vị trí viết chữ số quan trọng bên phải - Trong gói LBS-first, mã chỉnh cho bit quan trọng mã rơi vào bit quan trọng luồng byte đầu tiên, mã có nhiều bit thứ tự bit lại chỉnh với bit quan trọng byte Các mã tiếp tục đóng gói với LBS vào bit quan trọng chưa sử dụng luồng byte tại, tiến hành thêm byte cần thiết - Tệp GIF sử dụng thứ tự đóng gói LBS-first • MBS-first (Most sagnificant bit first: bit quan trọng đầu tiên): - Trong máy tính, MBS bit quan trọng gọi bit bậc cao, số bit số nhị phân có giá trị lớn MBS đơi gọi bit thứ tự cao bit bên trái quy ước ký hiệu vị trí viết chữ số quan trọng bên trái - Gói MBS-first chỉnh mã để bit quan trọng rơi vào MBS luồng byte đầu tiên, tràn liên kết với MBS Nhóm 12 11 Đề 12: Tìm hiểu khảo sát xây dựng ứng dụng thử nghiệm phương pháp nén từ điển LZW - Nhóm 12 byte Mã viết MBS vào bit quan trọng chưa sử dụng luồng byte Tệp TIFF PDF sử dụng thứ tự đóng gói MBS-first 12 Đề 12: Tìm hiểu khảo sát xây dựng ứng dụng thử nghiệm phương pháp nén từ điển LZW CHƯƠNG IV: VÍ DỤ Ví dụ sau minh họa thuật toán LZW hoạt động, hiển thị trạng thái đầu từ điển (từ điển coder: lớp thuật toán nén liệu khơng liệu hoạt động cách tìm kiếm kết khớp văn nén tập hợp chuỗi chứa cấu trúc liệu mã hóa) giai đoạn, mã hóa giải mã liệu Ví dụ xây dựng phép nén hợp lý đoạn thông điệp ngắn Trong liệu văn thực tế, lặp lại thường rõ rệt hơn, luồng đầu vào dài thường cần thiết trước nén Dãy ký tự lựa chọn để mã hóa là: TOBEORNOTTOBEORTOBEORNOT # Trong đó, # ký hiệu sử dụng để chứng minh kết thúc q trình Có 26 biểu tượng bảng chữ 26 ký tự từ A đến Z ký tự # để biểu thị mã dừng Gán giá trị từ đến 26 cho chữ gán cho “#” Một máy tính hiển thị chúng dạng chuỗi bit Cần có mã bit để kết hợp cung cấp đầy đủ bao gồm tập hợp 27 giá trị Từ điển khởi tạo với 27 giá trị Khi từ điển phát triển, mã cần phải tăng chiều rộng để chứa mục nhập bổ sung Mã bit cho = 32 bit kết hợp, từ điển thứ 33 tạo, thuật toán phải chuyển đổi điểm từ chuỗi bit thành chuỗi bit (cho tất giá trị mã, bao gồm sản phẩm trước có năm bit) Lưu ý mã 0000 khơng phải sử dụng gắn nhãn "0", mục nhập từ điển thứ 33 gắn nhãn 32 (Đầu tạo trước khơng bị ảnh hưởng thay đổi chiều rộng mã, giá trị bit tạo từ điển, mã phát ra, chiều rộng cho đầu chuyển sang bit để phù hợp với điều đó) Từ điển ban đầu, sau bao gồm mục sau: Kí hiệu # A B C D Nhóm 12 Nhị phân 00000 00001 00010 00011 00100 Thập phân 13 Đề 12: Tìm hiểu khảo sát xây dựng ứng dụng thử nghiệm phương pháp nén từ điển LZW E F G H I J K L M N O P Q R S T U V W X Y Z 00101 00110 00111 01000 01001 01010 01011 01100 01101 01110 01111 10000 10001 10010 10011 10100 10101 10110 10111 11000 11001 11010 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 I MÃ HÓA Ký tự đầu vào đệm chuỗi ω đến ω+ ký tự khơng có từ điển Phát mã ω thêm vào ω+ ký tự cho từ điển Bắt đầu lại đệm với ký tự chuỗi mã hóa ban đầu Trình tự Giá trị NULL T O B E O R N O Nhóm 12 Đầu Từ điển mở rộng Chú thích 27 = mã có sẵn sau từ - 26 Mã Bits T O B E O R N 20 15 15 18 10100 01111 00010 00101 01111 10010 27: TO 28: OB 29: BE 30: EO 31: OR 32: RN O T 14 15 001110 001111 33: NO 34: OT 14 32 yêu cầu tăng lên bit, cho đầu sử dụng bit Đề 12: Tìm hiểu khảo sát xây dựng ứng dụng thử nghiệm phương pháp nén từ điển LZW T T 20 TO BE OR TOB B O T E 27 29 31 36 EO RN R O 30 32 OT # 34 01010 011011 011101 011111 10010 011110 10000 10001 00000 35: TT 36: TOB 37: BEO 38: ORT 39: TOBE 40: EOR 41: RNO Dừng thuật toán Mã dừng Dung lượng chưa mã hóa = 25 ký tự* bits/ký tự = 125 bits Mã hóa: (6 mã *5 bits/mã) + (11 mã * bits/mã) = 96 bits Vậy, việc sử dụng từ điển LZW tiết kiệm 29 bits tổng số 125 bits, giảm 22% II GIẢI MÃ Để giải mã kho lưu trữ nén LZW, ta cần phải biết trước từ điển ban đầu sử dụng, mục bổ sung xây dựng lại chúng đơn kết nối mục trước Đầu vào Bits 10100 01111 00010 00101 01111 10010 001110 001111 010100 011011 Nhóm 12 Mã 20 15 15 18 14 15 20 27 Trình tự đầu Nhập từ điển T O B E O R N O T TO 27: TO 28: OB 29: BE 30: EO 31: OR 32: RN 33: NO 34: OT 35: TT 15 Chú thích Đề 12: Tìm hiểu khảo sát xây dựng ứng dụng thử nghiệm phương pháp nén từ điển LZW 011101 011111 100100 011110 100000 100010 000000 29 31 36 30 32 34 BE OR TOB EO RN OT # 36: TOB 37: BEO 38: ORT 39: TOBE 40: EOR 41: RNO Ở giai đoạn, giải mã nhận mã X; tìm X bảng xuất chuỗi χ với mã tương ứng, đốn chuỗi mã hóa vừa thêm vào mã hóa phát X cách xác, chuỗi phát khơng có bảng, mã hóa tiếp tục thêm Những kí tự thiếu chữ chuỗi mã hóa mã Z mà giải mã nhận Vì vậy, giải mã tra cứu Z, giải mã thành chuỗi ω lấy chữ z, gắn vào cuối χ làm mục nhập từ điển Điều có tác dụng, miễn mã nhận nằm từ điển trình giải mã, để chúng giải mã thành chuỗi Điều xảy giải mã nhận mã Z chưa có từ điển nó? Vì giải mã ln mã phía sau mã hóa, Z nằm từ điển mã hóa mã hóa vừa tạo nó, phát mã X trước cho χ Vì vậy, Z mã số ω chuỗi X Và giải mã xác định ký tự không xác định sau: Bộ giải mã thấy X Z, X mã dãy χ Z mã số chuỗi không xác định ω Bộ giải mã biết mã hóa thêm Z làm mã cho χ + số ký tự khơng xác định c, ω = χ + c Vì c ký tự luồng đầu vào sau χ ω chuỗi xuất sau χ, c phải ký tự chuỗi ω Vì χ chuỗi ω, c phải ký tự χ Vì vậy, mã Z khơng có bảng, giải mã suy chuỗi khơng xác định thêm χ + (ký tự χ) vào bảng dạng giá trị Z Tình trạng xảy mã hóa gặp đầu vào biểu mẫu cScSc, c ký tự đơn, S chuỗi cS có từ điển, khơng phải cSc Bộ mã hóa phát mã cho cS, đặt mã cho cSc vào từ điển Tiếp theo, thấy cSc đầu vào (bắt đầu từ c thứ hai cScSc) phát mã mà vừa chèn Nhóm 12 16 Đề 12: Tìm hiểu khảo sát xây dựng ứng dụng thử nghiệm phương pháp nén từ điển LZW vào Các đối số cho thấy giải mã nhận mã khơng có từ điển nó, tình hình phải giống Mặc dù đầu vào hình thức cScSc khó xảy ra, mẫu phổ biến luồng đầu vào đặc trưng lặp lại đáng kể Đặc biệt, chuỗi dài ký tự đơn (thường dùng loại hình ảnh LZW sử dụng để mã hóa) liên tục tạo mẫu loại Nhóm 12 17 Đề 12: Tìm hiểu khảo sát xây dựng ứng dụng thử nghiệm phương pháp nén từ điển LZW CHƯƠNG V: XÂY DỰNG ỨNG DỤNG I MÃ HĨA Bộ mã hóa hình ảnh LZW • Đầu vào : Hình ảnh N phần tử • Đầu ra: Hình ảnh mã hóa LZW • Định dạng từ điển mảng ô với phần tử Nhóm 12 18 Đề 12: Tìm hiểu khảo sát xây dựng ứng dụng thử nghiệm phương pháp nén từ điển LZW Nhóm 12 19 Đề 12: Tìm hiểu khảo sát xây dựng ứng dụng thử nghiệm phương pháp nén từ điển LZW Nhóm 12 20 Đề 12: Tìm hiểu khảo sát xây dựng ứng dụng thử nghiệm phương pháp nén từ điển LZW II GIẢI MÃ Bộ giải mã hình ảnh LZW • Đầu vào : vector hình ảnh mã hóa phần tử N • Đầu ra: vector hình ảnh giải mã phương pháp LZW • Định dạng từ điển mảng ô với phần tử Nhóm 12 21 Đề 12: Tìm hiểu khảo sát xây dựng ứng dụng thử nghiệm phương pháp nén từ điển LZW Nhóm 12 22 Đề 12: Tìm hiểu khảo sát xây dựng ứng dụng thử nghiệm phương pháp nén từ điển LZW III KIỂM TRA Bản kiểm tra yếu tố hình ảnh mã hóa LZW IV Nhóm 12 UPDATE 23 Đề 12: Tìm hiểu khảo sát xây dựng ứng dụng thử nghiệm phương pháp nén từ điển LZW KẾT LUẬN Thơng qua việc tìm hiểu sâu đề tài này, nhóm chúng em có nhìn khác cơng việc xử lý ảnh truyền tải liệu, hình ảnh – công việc mà chúng em thường xuyên tiếp xúc ngày Qua đó, chúng em rút kết luận từ điển nén LZW phương thức nén liệu phổ biến máy tính Khơng sử dụng phần mềm nén mã nguồn mở mà LZW trở nên phổ biến sử dụng file GIF, TIFF hay PDF Thậm chí, file text English nén thơng qua LZW để giảm ½ dung lượng gốc Nhóm 12 24 Đề 12: Tìm hiểu khảo sát xây dựng ứng dụng thử nghiệm phương pháp nén từ điển LZW TÀI LIỆU THAM KHẢO Tài liệu Wikipedia: Lempel – Ziv – Welch Nhập môn Xử lý ảnh số (NXB Khoa học Kỹ thuật chương – ĐH Bách khoa Hà Nội, Lương Mạnh Bá – Nguyễn Thanh Thủy) Nhóm 12 25 ... niệm nhiều mảnh ảnh, từ điển từ điển gồm nhiều từ điển Cứ hết mảnh ảnh người ta lại gửi mã xóa để báo hiệu kết thúc mảnh ảnh cũ, bắt đầu mảnh ảnh đồng thời khởi tạo lại từ điển cho mảnh ảnh Mã xóa... 12: Tìm hiểu khảo sát xây dựng ứng dụng thử nghiệm phương pháp nén từ điển LZW CHƯƠNG I: TỔNG QUAN VỀ XỬ LÝ ẢNH SỐ I XỬ LÝ ẢNH SỐ LÀ GÌ? Xử lý ảnh lĩnh vực mang tính khoa học cơng nghệ Tuy mẻ so... điển LZW CHƯƠNG III: THUẬT TOÁN I PHƯƠNG PHÁP VÀ Ý TƯỞNG Phương pháp nén LZW hoạt động theo nguyên tắc tạo từ điển động theo liệu file ảnh, hay xây dựng từ điển lưu mẫu có tần suất xuất cao ảnh Từ

Ngày đăng: 14/05/2020, 16:57

Mục lục

    CHƯƠNG I: TỔNG QUAN VỀ XỬ LÝ ẢNH SỐ

    I. XỬ LÝ ẢNH SỐ LÀ GÌ?

    II. CÁC ỨNG DỤNG CỦA XỬ LÝ ẢNH SỐ

    III. CÁC BƯỚC CƠ BẢN TRONG XỬ LÝ ẢNH SỐ

    IV. CÁC THÀNH PHẦN CỦA MỘT HỆ THỐNG XỬ LÝ ẢNH

    CHƯƠNG II: TỔNG QUAN VỀ PHƯƠNG PHÁP NÉN TỪ ĐIỂN LZW

    II. TỔNG QUAN VỀ NÉN TỪ ĐIỂN LZW

    CHƯƠNG III: THUẬT TOÁN

    IV. BIẾN THIÊN ĐỘ RỘNG (VARIABLE-WIDTH CODES)

    V. THỨ TỰ ĐÓNG GÓI (PACKING ORDER)