Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 35 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
35
Dung lượng
891,15 KB
Nội dung
ĐẠI HỌC THÁI NGUYÊN KHOA CÔNG NGHỆ THÔNG TIN ĐẠI HỌC THÁI NGUYÊN KHOA CÔNG NGHỆ THÔNG TIN NGUYỄN THỊ HẠNH NGUYỄN THỊ HẠNH THỦY VÂN CƠ SỞ DỮ LIỆU QUAN HỆ DỰA TRÊN KỸ THUẬT TỐI ƢU HOÁ ÁP DỤNG THUẬT TOÁN TÌM KIẾM THEO MẪU THỦY VÂN CƠ SỞ DỮ LIỆU QUAN HỆ DỰA TRÊN KỸ THUẬT TỐI ƢU HOÁ ÁP DỤNG THUẬT TOÁN TÌM KIẾM THEO MẪU Chuyên ngành: Khoa học máy tính LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH Mã số: 604801 LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH NGƯỜI HƯỚNG DẪN KHOA HỌC: TS BÙI THẾ HỒNG Thái Nguyên – 2009 Thái Nguyên - 2009 Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn ĐẠI HỌC THÁI NGUYÊN KHOA CÔNG NGHỆ THÔNG TIN Công trình hoàn thành tại: NGUYỄN THỊ HẠNH Người hướng dẫn khoa học: (Ghi rõ họ tên, chức danh khoa học, học vị) THỦY VÂN CƠ SỞ DỮ LIỆU QUAN HỆ DỰA TRÊN KỸ THUẬT TỐI ƢU HOÁ ÁP DỤNG THUẬT TOÁN TÌM KIẾM THEO MẪU Chuyên ngành: Khoa học máy tính Phản 1: biện Phản 2: biện Mã số: 604801 TÓM TẮT LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH NGƯỜI HƯỚNG DẪN KHOA HỌC TS BÙI THẾ HỒNG Luận văn bảo vệ trước Hội đồng chấm luận văn họp tại: Vào hồi ngày tháng năm 20 Có thể tìm hiểu luận văn trung tâm học liệu Đại học Thái Nguyên Và thư viện Trường/Khoa:…………………………… (Ghi tên thư viện đơn vị) Thái Nguyên – 2009 Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn TÀI LIỆU THAM KHẢO [1] “Nghiên cứu Phát triển Kỹ thuật Thuỷ vân Cơ sở Dữ liệu Quan hệ”, Báo cáo kết nghiên cứu đề tài sở 2008, 12/2008, Phòng CSDL & LT [2] Bùi Thế Hồng, Nguyễn Thị Thu Hằng, Lƣu Thị Bích Hƣơng, “Thủy vân sở liệu quan hệ”, Tạp chí Khoa học & Công nghệ, ĐH Thái Nguyên, 2009 [3] Vũ Ba Đình, “Giấu thông tin sở liệu không gian”, Tạp chí nghiên cứu khoa học kỹ thuật công nghệ Quân sự, số 4, 30-37 [4] R Agrawal, J Kiernan, “Watermarking Relational Databases” in Proceedings of the 28th VLDB Conference, Hong Kong, China, 2002 [5] R Agrawal, P J Haas, and J Kiernan “Watermarking relational data: framework, algorithms and analysis*” The VLDB Journal (2003) [6] R Sion, M Atallah, S Prabhakar.“Watermarking Relational Databases” CERIAS TR 2002-28* Center for Education and Research in Information Assurance, Computer Sciences, Purdue University, 2002 [7] R Sion, M Atallah, and S Prabhakar “Rights Protection for Relational Data” IEEE Transactions on Knowledge and Data Engineering, 16(6), June 2004 [8] R Sion, “Proving ownership over categorical data” ICDE 2004 [9] M Shehab, E Bertino, A Ghafoor “Watermarking Relational Databases using Optimization Based Techniques” CERIAS Tech Report 2006-41 [10] www.watermarkingworld.org [11] W Bender, D Gruhl, N Morimoto, A Lu, “Techniques for data Hiding” IBM SYSTEMS JOURNAL, VOL 35, NOS 3&4, 1996 [12] Stefan Katzenbeisser and Fabien A.P.Petitcolas, “Information Hiding Techniques for Steganography and Digital Watermarking”.Artech House Boston London [13] Michael Arnold, Martin Schmucker and Stephen D Wolthusen, “Techniques and Applications of Digital Watermarking and Content Protection” Artech House Boston London Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 1 2 LỜI CAM ĐOAN MỤC LỤC Tôi xin cam đoan : Luận văn “Nghiên cứu phát triển kỹ thuật thủy BẢNG CÁC TỪ VIẾT TẮT vân sở liệu quan hệ dựa kỹ thuật tối ưu hóa áp dụng thuật toán DANH MỤC CÁC HÌNH VẼ tìm kiếm theo mẫu” công trình nghiên cứu riêng LỜI MỞ ĐẦU Các số liệu luận văn sử dụng trung thực Kết nghiên Chƣơng 1-TỔNG QUAN VỀ KỸ THUẬT GIẤU TIN VÀ THUỶ VÂN 11 cứu trình bày luận văn chưa công bố 1.1 Kỹ thuật giấu tin vấn đề kỹ thuật giấu tin 12 1.1.1 Khái niệm giấu tin 12 công trình khác Tôi xin chân thành cám ơn Thầy Viện Công nghệ thông tin 1.1.2 Phân loại kỹ thuật giấu tin 14 Việt Nam truyền đạt cho kiến thức suốt năm học trường 1.1.3 Mục đích giấu tin 15 Tôi xin chân thành cảm ơn TS Bùi Thế Hồng tận tình hướng dẫn hoàn 1.1.4 Môi trường giấu tin 17 1.2 Cơ sở lý thuyết thuỷ vân 21 thành tốt luận văn Thái Nguyên, ngày 10 tháng 11 năm 1.2.1 Khái niệm thuỷ vân nhúng thuỷ vân 21 1.2.2 Lịch sử phát triển thuỷ vân 21 2009 1.2.3 Mô hình hệ thống tổng quát trình nhúng thuỷ vân 22 Tác giả luận văn 1.2.4 Một số ứng dụng thuỷ vân 24 Chƣơng 2-THUỶ VÂN CƠ SỞ DỮ LIỆU QUAN HỆ DỰA TRÊN KỸ THUẬT TỐI ƢU ÁP DỤNG THUẬT TOÁN TÌM KIẾM THEO MẪU 25 2.1 Giới thiệu thuỷ vân sở liệu 25 Nguyễn Thị Hạnh 2.2 Mô hình chi tiết hệ thống thuỷ vân sở liệu 27 2.3 Phân hoạch liệu 29 2.4 Nhúng thuỷ vân 32 2.4.1 Mã hoá bít đơn 32 2.4.2 Thuật toán tìm kiếm theo mẫu 37 2.4.3 Thuật toán nhúng thuỷ vân 39 Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 3 4 2.5 Đánh giá ngƣỡng giải mã 40 BẢNG CÁC TỪ VIẾT TẮT 2.6 Phát thuỷ vân 43 2.7 Kiểu công 45 Chƣơng – CÀI ĐẶT LƢỢC ĐỒ THUỶ VÂN CƠ SỞ DỮ LIỆU Kí hiệu QUAN HỆ BẰNG KỸ THUẬT TỐI ƢU THUẬT TOÁN TÌM KIẾM HVS Human Vision System Hệ thống thị giác người HAS Human Auditory System Hệ thống thính giác người PS Pattern Search Tìm kiếm theo mẫu 3.2.1 Cơ sở ứng dụng 48 GA Genetic Algorithm Thuật toán di truyền 3.2.2 Giả thiết 48 MAC Message Authetication Code Mã xác thực thông tin MD5 Message Digest algorithm Hàm băm THEO MẪU 47 3.1 Giới thiệu kỹ thuật tìm kiếm theo mẫu 47 3.2 Mô tả ứng dụng 48 3.2.3 Một số kết thực nghiệm đạt 49 Từ Tiếng Anh Giải thích PHỤ LỤC … 58 KẾT LUẬN 59 TÀI LIỆU THAM KHẢO ……………………………………………… 60 Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 5 6 LỜI MỞ ĐẦU DANH MỤC CÁC HÌNH VẼ Trang Trong thực tế việc chứng minh quyền sở hữu sở liệu Hình 1.1 Sơ đồ biểu diễn trình giấu tin ……21 quan hệ sau phân phối chuyển giao vấn đề quan trọng Hình 1.2 Sơ đồ biểu diễn trình giải mã tin ……21 môi trường ứng dụng dựa Internet nhiều ứng dụng Hình 1.3 Sơ đồ phân loại kỹ thuật giấu tin ……21 phân phối sản phẩm Hình 1.4 Sơ đồ nhúng thuỷ vân ……21 Trong năm gần đây, công nghệ thông tin phát triển với tốc độ Hình 1.5 Sơ đồ khôi phục thuỷ vân 21 chóng mặt phần cứng phần mềm, đặc biệt tốc độ phát triển Hình 2.1 Các thời kỳ mã hoá giải mã thuỷ vân 26 Internet công nghệ có liên quan đưa đến tiểm chưa Hình 2.2 Bảng biểu diễn ký hiệu sử dụng thuật toán …………31 có việc truy nhập phân phối lại sản phẩm kỹ thuật số Sự phát triển công nghệ đa phương tiện với khả chép mô mở Hình 2.3: Phân phối tập S i i trục số………………………….36 nhiều hướng cho phát triển kỹ thuật thuỷ vân, đặt biệt lĩnh vực bảo Hình 2.4 Biểu diễn Sigmoid(α,τ ) τ = α = {1, 2, 8}…………… 39 mật sở liệu Thuỷ vân sở liệu không nằm quy luật phát triển Hình 2.5 Lược đồ ngưỡng giải mã……………………………………… 42 Ban đầu, thuỷ vân sử dụng để nhúng vào sản phẩm đa phương Hình 3.1 Bảng thống kê kết thực nghiệm …………………………… tiện âm thanh, hình ảnh …Nhưng nay, thuỷ vân ứng dụng vào lĩnh vực mẻ có liên quan đến quyền sở hữu trí tuệ Đó lĩnh vực thuỷ vân sở liệu quan hệ, lĩnh vực quan trọng có ứng dụng nhiều sống Thuỷ vân sử dụng với mong muốn cho phép chứng minh tác giả nguồn gốc sở liệu để từ chứng minh liệu chuẩn xác Xuất phát từ thực tế đó, luận văn lựa chọn đề tài: “Nghiên cứu phát triển kỹ thuật thủy vân sở liệu quan hệ dựa kỹ thuật tối ưu hóa áp dụng thuật toán tìm kiếm theo mẫu” Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 7 8 Tính cấp thiết đề tài Mục tiêu nghiên cứu - Ngày nay, Internet phát triển với tốc độ nhanh, với Mục tiêu chung phát triển công nghệ ứng dụng phân tán Internet Nghiên cứu kỹ thuật thuỷ vân sở liệu dựa kỹ thuật tối ưu hóa nhiều Chính vậy, việc chứng minh quyền sở hữu sở để mã hoá giải mã thuỷ vân Trong tập trung nghiên cứu kỹ thuật phân liệu quan hệ sau phân phối chuyển giao vấn đề hoạch liệu không phụ thuộc vào đánh dấu để định vị phân quan trọng môi trường ứng dụng dựa internet nhiều hoạch, nghiên cứu kỹ thuật phát thủy vân dựa vào ngưỡng tối ưu ứng dụng phân phối sản phẩm Mục tiêu cụ thể - Trong bối cảnh vậy, việc thực thi quyền sở hữu liệu yêu cầu quan trọng đòi hỏi giải pháp đồng bộ, bao gồm khía cạnh kỹ thuật, tổ chức, luật pháp Mặc dù chưa có giải pháp toàn diện năm gần đây, kỹ thuật Nghiên cứu kỹ thuật thuỷ vân sở liệu quan hệ có áp dụng kỹ thuật tối ưu hoá toán tối ưu hoá có ràng buộc Đồng thời trình bày kỹ thuật hữu hiệu để giải toán tối ưu thuật toán tìm kiếm theo mẫu xử lý ràng buộc chúng thuỷ vân đóng vai trò định nhằm giải vấn đề quyền sở Ý nghĩa khoa học ý nghĩa thực tiễn đề tài hữu Ý nghĩa khoa học đề tài - Cho đến nay, có vài cách tiếp cận toán thuỷ vân liệu quan hệ Tuy nhiên, kỹ thuật không bền vững - Đưa sở khoa học việc lựa chọn kỹ thuật tối ưu để mã hoá giải mã thuỷ vân sử dụng kỹ thuật tìm kiếm theo mẫu để giải toán công thuỷ vân Ý nghĩa thực tiễn - Kết đề tài có ý nghĩa lớn Ngành công nghệ thông tin việc chứng minh quyền sở hữu sở liệu quan hệ sau phân phối chuyển giao vấn đề quan trọng môi trường ứng dụng dựa internet nhiều ứng dụng phân phối sản phẩm Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 9 10 Nhiệm vụ nghiên cứu Chương 2: Thuỷ vân sở liệu quan hệ dựa kỹ thuật tối ưu áp - Nghiên cứu, hiểu rõ trình bày kỹ thuật tối ưu để mã hoá giải mã thuỷ vân dụng thuật toán tìm kiếm theo mẫu Chương trình bày trình mã hoá, giải mã thuỷ vân sở liệu - Nghiên cứu sử dụng công cụ để mô tả kỹ thuật tìm kiếm theo mẫu quan hệ kỹ thuật tối ưu áp dụng thuật toán tìm kiếm theo mẫu Chương 3: Phát triển ứng dụng thuỷ vân sở liệu quan hệ dựa Phƣơng pháp nghiên cứu kỹ thuật tối ưu áp dụng thuật toán tìm kiếm theo mẫu - Nghiên cứu lý thuyết sở thuỷ vân sở liệu Chương trình bày ứng dụng kỹ thuật tối ưu, kỹ thuật tìm kiếm - Nghiên cứu ứng dụng mô tả chi tiết kỹ thuật tìm kiếm theo mẫu theo mẫu trình nhúng thuỷ vân Cùng với số kết cài đặt ứng dụng Phạm vi nghiên cứu - Phạm vi nghiên cứu kỹ thuật thuỷ vân sở liệu quan hệ mô tả kỹ thuật tối ưu áp dụng kỹ thuật tìm kiếm theo mẫu Các kết nghiên cứu dự kiến cần đạt đƣợc Kết học thuật: Nghiên cứu kỹ thuật thuỷ vân sở liệu Kết phát triển ứng dụng: Áp dụng kỹ thuật tìm kiếm theo mẫu để mô tả phát triển ứng dụng thực tế Kết cấu luận văn Bố cục luận văn bao gồm phần mở đầu, phần kết luận ba chương Nội dung chương tổ chức sau: Chương 1: Tổng quan kỹ thuật giấu tin thuỷ vân Chương trình bày số khái niệm kỹ thuật giấu tin, vấn đề kỹ thuật giấu tin Đồng thời trình bày khái niệm thuỷ vân, đặc biệt đưa sơ đồ chi tiết thuỷ vân Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 11 12 Chƣơng 1- 1.1 Kỹ thuật giấu tin vấn đề kỹ thuật giấu tin TỔNG QUAN VỀ KỸ THUẬT GIẤU TIN 1.1.1 Khái niệm giấu tin VÀ THUỶ VÂN Từ trước đến nay, nhiều phương pháp bảo vệ thông tin đưa ra, giải pháp dùng mật mã ứng dụng rộng rãi Thông tin ban Cuộc cách mạng thông tin kỹ thuật số đem lại thay đổi sâu đầu mã hoá, sau giải mã nhờ khoá hệ mã Đã có nhiều hệ sắc xã hội sống Những thuận lợi thông tin kỹ thuật số mã phức tạp sử dụng DES, RSA, NAPSACK , hiệu phổ mang lại đề thách thức hội cho trình đổi Sự biến đời phần mềm có tính mạnh, thiết bị máy ảnh kỹ Một phương pháp khác nghiên cứu ứng dụng thuật số, máy quét chất lượng cao, máy in, máy ghi âm kỹ thuật số, v.v…, mạnh mẽ nhiều nước giới, phương pháp giấu tin Giấu thông với tới giới tiêu dùng rộng lớn để sáng tạo, xử lý thưởng thức tin kỹ thuật nhúng lượng thông tin số vào đối tượng liệu đa phương tiện Mạng Internet toàn cầu biến thành xã hội ảo nơi liệu số khác Một yêu cầu giấu tin đảm bảo tính diễn trình trao đổi thông tin lĩnh vực trị, quân sự, quốc chất ẩn thông tin giấu đồng thời không làm ảnh hưởng đến chất phòng, kinh tế, thương mại… Và môi trường mở tiện nghi lượng liệu gốc xuất vấn nạn, tiêu cực cần đến giải pháp hữu hiệu cho vấn đề an toàn thông tin nạn ăn cắp quyền, nạn xuyên tạc thông tin, truy nhập thông tin trái phép v.v Đi tìm giải pháp cho vấn đề không giúp ta hiểu thêm công nghệ phức tạp phát triển nhanh Sự khác biệt chủ yếu mã hoá thông tin giấu thông tin mã hoá làm cho thông tin thể có mã hoá hay không, với giấu thông tin người ta khó biết có thông tin giấu bên mà đưa hội kinh tế cần khám phá Một giải pháp nhiều triển vọng giấu tin, nghiên cứu phát triển khoảng 10 năm gần Để hiểu rõ nguồn gốc thuỷ vân, trước tiên tìm hiểu phương pháp giấu thông tin, thuỷ vân thành phần phương pháp giấu tin Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 13 14 Thông tin giấu 1.1.2 Phân loại kỹ thuật giấu tin Do kỹ thuật giấu thông tin số hình thành thời gian gần Phương tiện chứa (audio, ảnh, video ) Bộ nhúng thông tin Phương tiện chứa giấu tin Phân phối nên xu hướng phát triển chưa ổn định Nhiều phương pháp mới, theo nhiều khía cạnh khác chắn đề xuất, định nghĩa xác, đánh giá phân loại rõ ràng chưa thể có Sơ đồ phân loại sau Fabien A P Petitcolas đề xuất năm 1999 Khoá Giấu thông tin (Information hiding) Hình 1.1 Sơ đồ biểu diễn trình giấu tin Khoá Phương tiện chứa giấu tin Phương tiện chứa (audio, ảnh, video ) Bộ giải mã tin Giấu tin bí mật (steganography) Nhúng thuỷ vân (Watermarking) Thuỷ vân bền vững (Robust Copyright marking) Thuỷ vân “dễ vỡ” (Fragile Watermarking) Kiểm định Thông tin giấu Thuỷ vân ẩn (Imperceptible watermarking) Hình 1.2 Sơ đồ biểu diễn trình giải mã Thuỷ vân (Visible watermarking) Hai sơ đồ hình 1.1 1.2 biểu diễn trình giấu tin trình giải tin Hình 1.3 Phân loại kỹ thuật giấu tin Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 35 36 Hàm giấu c định nghĩa số đầu vào tail chuẩn hoá độ min ij max ij ij Kiểu ràng buộc khác yêu cầu liệu thuỷ vân trì dài S i , tail count chuẩn hoá Hàm tính sau: thống kê Ví dụ, trung bình liệu sinh trung bình c (S i i ) liệu gốc, ràng buộc có dạng: n j 1 : 0 ij Một vài ràng buộc khác tạo phụ thuộc vào yêu cầu n 1{s ref } n j 1 ij ij n độ dài S i 1{} hàm định nghĩa sau: ứng dụng Các ràng buộc xử lý thuật toán mã hoá bít dùng kỹ thuật tối ưu hoá có ràng buộc Hàm giấu sử dụng phụ thuộc vào thống kê liệu Các W giá trị trung bình phương sai liệu S i S i i tương ứng ( S ) (2S ) ; gọi tắt i i i i Chú ý tham chiếu ref phụ thuộc vào , có nghĩa không cố định thay đổi theo thống kê S i i Tail count c ( S i i ) chuẩn hoá phụ thuộc vào phân phối S i i tham chiếu động Hình 2.3: Phân phối tập S i i trục số đầu vào tail khoanh tròn Điểm tham chiếu : Hàm mục tiêu c ( S i i ) hàm phi tuyến không khả vi, toán tối ưu hoá trở nên gần với toán tối ưu hoá có ràng buộc phi tuyến Các phương pháp tiếp cận truyền thống dựa vào độ dốc (gradient) ref c , c (0,1) số thực bí áp dụng cho toán Có hai kỹ thuật để giải toán tối ưu hóa thuật toán di truyền kỹ thuật tìm kiếm theo mẫu Luận mật, phần tập văn sử dụng kỹ thuật tìm kiếm theo mẫu Việc giải toán tối ưu hoá Các điểm liệu S i i ref đầu vào “tail” mô tả hình 2.3 Số hóa Trung tâm Học liệu – Đại học Thái Nguyên không thiết phải tìm lời giải toàn cục việc tìm lời giải đòi hỏi lượng tính toán lớn Mục đích http://www.lrc-tnu.edu.vn Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 37 38 tìm lời giải gần tối ưu đảm bảo giá trị cực tiểu hoá hàm c ( S i i ) n ˆ c ( S i i ) Sigmoid( f ,ref ) ( sij ij ) n j 1 cực đại hoá hàm c ( S i i ) cách xa Thuật toán di truyền dùng định rõ tổng thể lời giải tối ưu Sigmoid( , ) ( x) hàm sigmoid (xích ma) với tham số ( , ) thời điểm xử lý, tìm kiếm theo mẫu dùng để cung cấp lời Sigmoid( , ) ( x) = giải tối ưu cục không theo thời gian xử lý 2.4.2 Thuật toán tìm kiếm theo mẫu Thuật toán di truyền không tìm tối ưu cục bộ, nhiên thuật Với , {1,2,8} , hàm 1 e ( x ) Sigmoid( , ) ( x) có dạng sau: toán di truyền yêu cầu số lượng lớn hàm đánh giá tập trung thành tối ưu toàn cục Do vậy, giải thuật di truyền sử dụng thời gian xử lý không yêu cầu xác thuỷ vân thực độc lập Kỹ thuật tìm kiếm theo mẫu cho phép thực nhanh Các phương pháp tìm kiếm theo mẫu lớp phương pháp tìm kiếm trực tiếp cho trình tối ưu hoá phi tuyến Các phương pháp tìm kiếm theo mẫu sử dụng rộng rãi tính đơn giản tính thực tế chúng Tìm kiếm theo mẫu bắt đầu điểm ban đầu thử hàm mục tiêu mẫu điểm định trước xoay quanh điểm với mục tiêu tạo tốt Sự di chuyển tương tự việc di chuyển thăm dò Nếu thử thành công (tức tạo tốt hơn), trình lặp lại với mẫu xoay quanh điểm tốt Trái lại, kích cỡ mẫu thử giảm hàm mục tiêu thử lại với điểm Hình 2.4 Biểu diễn Sigmoid(α,τ ) τ = α = {1, 2, 8} Các ràng buộc xử lý nhờ kỹ thuật trước Tuy nhiên, Để cải thiện việc thực việc tìm kiếm theo mẫu, hàm mục tiêu c ( S i i ) xấp xỉ hàm sigmoid trơn sau: việc tìm kiếm theo mẫu xử lý ràng buộc cách hạn chế việc di chuyển thăm dò theo hướng không gian khả thi; đảm bảo giải pháp sinh khả thi Hoạt động có hệ thống việc tìm kiếm theo Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 39 40 mẫu kích cỡ mẫu dễ thích nghi dẫn đến hội tụ đến giải pháp tối ưu khả thi nhanh Tuy nhiên, việc tìm kiếm theo mẫu không đảm bảo tìm tối ưu toàn Vấn đề khắc phục cách bắt đầu thuật i k mod l Skw encode_single_bit (bi, Sk, c, Xmax, Xmin) toán từ điểm khả thi khác Chèn Skw vào Dw 2.4.3 Thuật toán nhúng thuỷ vân T* get_optimal_thershold(Xmax, Xmin) Thuỷ vân l bít W=bl-1, , b0 nhúng vào phần liệu S , , S m 1 Để việc nhúng thuỷ vân nhiều lần liệu, độ dài thuỷ vân l chọn cho: l m return Dw, T* Thuật toán nhúng thuỷ vân sinh phần S , , S m 1 cách gọi hàm get _ partitions, sau với phần S k bít thuỷ vân bi mã hoá cách sử dụng thuật toán mã hoá bít đơn (encode_single_bit) Phần thay Thuật toán nhúng thuỷ vân nhúng bít bi vào phần S k cho m k mod l i Kỹ thuật đảm bảo bít thuỷ vân nhúng lần l đổi sinh S kW chèn vào liệu nhúng thuỷ vân Các thống kê ( X max , X ) thu sau bít nhúng sử dụng thuật toán get_optimal_threshold để tính toán ngưỡng giải mã tối ưu liệu D Thuật toán nhúng thuỷ vân mô tả sau: 2.5 Đánh giá ngƣỡng giải mã Trong phần trước, ta tìm hiểu kỹ thuật mã hoá bít Nhúng bit thuỷ Thuật toán: embed_watermark Đầu vào: Tập liệu D, Khóa bí mật K, Số phân vùng m, Thủy vân W={b0, …bi-1} vân bi Si sinh S iW Trong phần này, ta tìm hiểu kỹ thuật giải mã bít – kỹ thuật dùng để lấy bít thuỷ vân nhúng bi từ phần S iW Kỹ thuật giải mã bít dựa ngưỡng tối ưu T* để làm cực tiểu hoá xác Đầu ra: Tập liệu nhúng thủy vân DW, Ngưỡng giải mã tối ưu T* Dw, Xmax, Xmin {} Với phần liệu S iW , kỹ thuật giải mã bít tính toán hàm giấu ( S iW ) S0, …,Sm-1 get_partitions(D, Ks, m) so sánh với ngưỡng giải mã tối ưu T* để giải mã bít nhúng bi for each Phân vùng Sk Số hóa Trung tâm Học liệu – Đại học Thái Nguyên suất lỗi giải mã Nếu ( S iW ) >T* bít giải mã 1, ngược lại bít giải mã http://www.lrc-tnu.edu.vn Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 41 42 Ví dụ: sử dụng hàm giấu mô tả phần trước, kỹ thuật giải mã tính toán tail count chuẩn hoá S ref đếm số đầu vào S W i W i = P(bd | be 1) P1 P(bd | be 0) P0 cách tính giá trị tham chiếu = P( x T | be 1) P1 P( x T | be 0) P0 lớn ref Sau đó, tail count chuẩn hoá so sánh với T* thể hình 2.5 Giá trị ngưỡng T* nên T T = P1 f ( x | be 1)dx P0 f ( x | be 0)dx tính toán cẩn thận để làm cực tiểu hoá xác suất lỗi giải mã bít Để cực tiểu hoá xác suất lỗi giải mã ( Perr ) ngưỡng T, ta lấy đạo hàm cấp Perr T để xác định ngưỡng tối ưu T*, sau: Hình 2.5 Lược đồ ngưỡng giải mã Xác suất lỗi giải mã bít định nghĩa xác suất bit nhúng giải Perr P1 T T giấu tail count; giá trị hàm giấu tối ưu hoá tính giai đoạn mã hoá để tính ngưỡng tối ưu T* Các giá trị hàm giấu cực đại hoá tương ứng với bi =1 lưu tập X max Tương tự, giá trị hàm giấu T f ( x | be 1)dx P0 T T f ( x | be 0)dx P1 f (T | be 1) P0 f (T | be 0) mã sai Ngưỡng giải mã tối ưu T* chọn để làm cực tiểu hoá xác suất lỗi giải mã Giai đoạn nhúng bít dựa việc cực tiểu hoá cực đại hoá hàm Các hàm f ( x | be 0) f ( x | be 1) đánh giá từ thống kê X X max tương ứng Qua thực nghiệm X X max , ta thấy phân phối f ( x | be 0) f ( x | be 1) đánh phân phối Gaussian N ( , ) N (1 , ) Tuy nhiên, phân tích sau tiếp tục cực tiểu hoá lưu trữ X sử dụng với kiểu phân phối khác Gọi Perr , P0 P1 tương ứng xác suất lỗi giải mã, xác suất bit mã hóa P0 đánh giá xác suất bit mã hóa Cho be , bd , f (x) tương ứng bit mã hoá, bit giải mã, hàm mật độ | X | , | X max | | X | P1 P0 xác suất Thay biểu thức Gaussian cho f ( x | be 0) f ( x | be 1) , đạo Khi đó, Perr tính sau: hàm cấp Perr có dạng: Perr = P(bd 0, be 1) P(bd 1, be 0) Số hóa Trung tâm Học liệu – Đại học Thái Nguyên Perr P0 (T ) P1 (T 1 ) exp( ) exp( ) T 2 2 02 2 2 http://www.lrc-tnu.edu.vn Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 43 44 Cho đạo hàm cấp Perr 0, ta phương trình bậc 2, có lỗi giải mã trình bày mục 2.5 Nếu kích thước phân vùng liệu thể tính giá trị ngưỡng tối ưu T* làm cực tiểu hoá Perr Đạo hàm cấp Perr nhỏ bít giải mã không thực hiện, ngược lại giải mã đánh giá T* để đảm bảo điều kiện ( Perr (T *) ) thoả mãn T 2 P 2 2 02 12 2 2 T *2 2 T * ln 20 2 2 01 2 P1 Từ phân tích trên, việc chọn ngưỡng tối ưu T* dựa thống kê thu thuật toán nhúng thuỷ vân Ngưỡng tối ưu T* làm cực tiểu hoá xác suất lỗi giải mã nâng cao độ bền thuỷ vân nhúng nhờ lược đồ giải mã ngưỡng Vì thuỷ vân W bl 1 , , b0 nhúng nhiều lần liệu, bít thuỷ vân lấy nhiều lần nơi bít bi lấy từ phần S k với k mod l i Các bít lấy giải mã nhờ kỹ thuật chọn theo đa số Mỗi bít bi lấy m lần l Thuật toán phát thuỷ vân sau: khả giải mã thành công tăng Thuật toán: detect_watermark Xác suất lỗi giải mã phụ thuộc vào ràng buộc Nếu ràng buộc chặt lượng thay đổi cho liệu D không đủ việc nhúng thuỷ vân Tất xác suất lỗi giải mã thuỷ vân làm giảm cách nhúng thuỷ vân nhiều lần liệu đó, lặp lại Đầu vào: Tập liệu nhúng thủy vân DW , m, c, , KS ,T , * Độ dài thủy vân l Đầu ra: Thủy vân thu WD mã sửa sai Đặt ones[0, …, l-1] 2.6 Phát thuỷ vân Thuật toán phát thuỷ vân lấy thuỷ vân nhúng nhờ tham số bí mật gồm có: KS, m, , c, T Đặt zeros[0, …, l-1] S0, …, Sm-1 get_partitions(Dw, Ks, m) Thuật toán bắt đầu việc sinh phần liệu S , , S m 1 dựa vào liệu thuỷ vân DW , khoá bí mật K S , số phần liệu phân hoạch m đầu vào thuật toán phân hoạch liệu (get_partitions) Mỗi phần mã hoá bít thuỷ vân đơn Để lấy bít nhúng, ta sử dụng lược for j=0, …, m-1 if S j i j mod l đồ giải mã ngưỡng dựa vào ngưỡng tối ưu T làm cực tiểu hoá xác suất xảy Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 45 46 value Si ,0, c khả tạo phân vùng liệu chọn lọc công bit thuỷ vân cụ thể Một số kiểu công điển hình: if value T * - Xoá ngẫu nhiên vài ghi từ sở liệu cũ, tạo sở ones[i] ones[i] + liệu để công bố 10 else - Sửa đổi vài ghi bên sở liệu để gây lỗi bit thuỷ vân nhúng, dẫn đến trình giải mã sai 11 zeros[i] zeros[i] + 12 for j=0 , …, l-1 - Chèn vài ghi vào sở liệu gây sai lệch liệu nhằm phá hủy bit thuỷ vân nhúng 13 if ones[j] > zeros[j] Để mô số kiểu công, chương trình sử dụng tập liệu 14 WD|j| thuỷ vân “an toàn” Một tập liệu thuỷ vân “an toàn” khôi 15 else if ones[j] < zeros[j] phục bit thuỷ vân sau trình giải mã, sử dụng chung khoá bí mật với 16 WD|j| trình mã hóa Với tập liệu này, tiến hành thao tác liệu để phù hợp với mô hình công 17 else 18 WD|j| x 19 return WD Trường hợp quan hệ đa thuộc tính bền vững thuỷ vân tăng lên nhúng thuỷ vân nhiều thuộc tính 2.7 Kiểu công Ở giả thiết kẻ công tìm tập liệu gốc thông tin bí mật sử dụng trình nhúng thuỷ vân Thông tin bí mật bao gồm khoá mật Ks, số lượng phân hoạch m, số c, tham số tối ưu ngưỡng T* Vì kẻ công Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 47 48 3.2 Mô tả ứng dụng Chƣơng - 3.2.1 Cơ sở ứng dụng CÀI ĐẶT LƢỢC ĐỒ Quá trình xây dựng ứng dụng tiến hành dựa kiện THUỶ VÂN CƠ SỞ DỮ LIỆU QUAN HỆ BẰNG KỸ THUẬT TỐI ƢU TÌM KIẾM THEO MẪU sau: Một người dùng có ý định công bố kết nghiên cứu chắn có quyền tác giả việc công bố liệu đó, nhúng thuỷ vân vào liệu trước công bố chúng Đôi khi, người dùng 3.1 Giới thiệu kỹ thuật tìm kiếm theo mẫu Tìm kiếm theo mẫu (hay gọi tìm kiếm trực tiếp) phương pháp giải toán tối ưu, không yêu cầu nhiều thông tin độ dốc hàm mục tiêu Trái ngược với phương pháp tối ưu truyền thống sử dụng thông tin độ dốc phát sinh lớn để tìm điểm tối ưu Thuật toán tìm kiếm theo mẫu xác định tập điểm xung quanh điểm tại, tìm điểm giá trị hàm mục tiêu thấp giá trị của điểm Phương pháp tìm kiếm trực tiếp sử dụng để nghi ngờ liệu bị thay đổi công bố kết người khác Để chứng minh quyền sở hữu liệu, cố gắng khôi phục thuỷ vân nhúng vào tập liệu cách áp dụng kỹ thuật giải mã Trong trình xây dựng ứng dụng, luận văn giải thích tất bước từ phân hoạch liệu đến nhúng thuỷ vân giải mã chúng Luận văn giải thích kiểu công khám phá liệu để chứng minh quyền sở hữu liệu tìm hiểu kỹ lưỡng giải toán với hàm mục tiêu không khả vi hàm liên tục Một thuật toán tìm kiếm theo mẫu xác định chuỗi điểm để tìm mật độ dày với điểm gốc Tại bước, thuật toán tìm kiếm tập điểm gọi mắt lưới, xung quanh điểm - điểm tính bước trước thuật toán Thuật toán tạo mắt lưới cách thêm điểm vào bội số vô hướng tập vector cố định gọi mẫu Nếu thuật toán tìm điểm mắt lưới để tận dụng hàm mục tiêu điểm tại, điểm trở thành điểm tại bước tiếp thuật toán 3.2.2 Giả thiết Xây dựng ứng dụng dựa giả định sau: + Kẻ công không am hiểu tập liệu thủy vân Thậm chí kẻ công nhận liệu nhúng thuỷ vân kỹ thuật sử dụng + Kẻ công khoá tập liệu + Kỹ thuật thuỷ vân có khả kiểm soát ghi với nhiều thuộc tính Tuy nhiên trình kiểm thử, liệu chứa chứa ghi với thuộc tính số đơn Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 49 50 3.2.3 Một số kết thực nghiệm đạt đƣợc b Kết thực nghiệm Sau nhiều lần chạy thử nghiệm tác giả nhận thấy, tốc độ giải mã thuỷ a Tham số đầu vào áp dụng thực nghiệm Bộ liệu thực nghiệm luận văn liệu tự tạo giả định số liệu điện sinh hoạt vùng đó, liệu bao gồm 8000 Để cho đơn giản trình cài đặt, giả sử liệu bao gồm trường, trường khoá quan hệ, trường trường vân nhanh gấp nhiều lần tốc độ nhúng thuỷ vân Thử nghiệm với công kết sau: Thực công kiểu công 20 lần, lần tác động số lượng ghi khác nhau, kết thống kê đây: chọn để nhúng thuỷ vân Các thông số dùng cho trình thí nghiệm bao gồm: + Hàm băm: MD5 + Khoá bí mật: KS = 89 + Số phân vùng: m = 20 + Tham số bí mật c = 0.75 + Chuỗi bit đem nhúng (watermark): 10111 + Kích cỡ nhỏ phân vùng: =10 liệu thiết kế chứa file định dạng Excel với tên Data.xls Tác giả dùng Matlab 7.04 làm môi trường cài đặt ứng dụng Thí nghiệm chạy hệ thống có cấu hình Intel Pentium IV Ghz, 512 MB Ram Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 52 Nhận xét: Căn vào bảng thống kê công sau trình thực nghiệm tác giả có nhận xét sau: + Tỉ lệ thành công kiểu công thay đổi liệu cao Khi thay đổi thông số đầu vào khoảng cho phép liệu thay đổi 0.05, 51 Kiểu công Xoá Số ghi bị tác động 1500 2000 2500 3000 4000 5000 90% tổng số bị thay đổi tỉ lệ thành công giải mã thuỷ vân 6000 7000 750 0 0 + Tỉ lệ thành công kiểu công chèn thay đổi liệu cao 60% (khoảng 63%) Thành công (lần) 20 20 18 20 18 14 14 13 Thất bại (lần) 0 2 6 12 16 17 19 20 20 20 Khi thay đổi thông số đầu vào khoảng cho phép liệu thay đổi 20 20 20 17 10 0 0 0 0 0 0.05, số lượng bị thay đổi 7500 (trên tổng số 8000 bộ) tương đương với Thất bại (lần) 0 10 20 20 20 20 20 20 20 20 20 20 Thành công (lần) 20 20 20 18 19 17 19 18 18 18 16 12 11 11 12 Thất bại (lần) 0 2 9 Thành công Chèn (lần) Sửa 100 200 300 500 600 1000 số lượng bị thay đổi 7500 (trên tổng số 8000 bộ) tương đương với trên 90% tổng số bị thay đổi tỉ lệ thành công giải mã thuỷ vân 60% (khoảng 63%) + Tỉ lệ giải mã thuỷ vân thành công kiểu công xoá so với kiểu công thay đổi liệu Hình 3.1 Bảng thống kê kết thử nghiệm Số hóa Trung tâm Học liệu – Đại học Thái Nguyên i) Với số lượng cho phép xoá 50% tổng số tỉ lệ giải mã thành công 100% http://www.lrc-tnu.edu.vn ii) Với 90% tổng số bị xoá tỉ lệ giải mã thành công 15% + Tỉ lệ giải mã thuỷ vân thành công kiểu công chèn thêm vào sở liệu thấp i) Nếu chèn thêm trung bình khoảng 7.5% đến 8% tổng số vào sở liệu tỉ lệ giải mã thành công 50% Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 53 ii) 54 Nếu chèn thêm 10% (khoảng 12%) số lượng vào sở liệu tỉ lệ giải mã thành công 0% Các thông số bị thay đổi thay đổi thông số đầu vào như: Tăng giảm khoảng thay đổi cho phép liệu nhúng KẾT LUẬN Thuỷ vân sở liệu kỹ thuật quan trọng để chứng minh quyền sở hữu sở liệu sau phân tán Internet Đầu tiên, hình thành chế thuỷ vân sở liệu quan hệ giống toán tối thuỷ vân; độ ngẫu nhiên việc công (phá hoại); số lượng phân vùng ưu có ràng buộc, kỹ thuật khắc phục điểm yếu kèm với độ lớn liệu (tổng số bộ) kỹ thuật thuỷ vân đề xuất trước Với nội dung này, luận văn tìm hiểu số vấn đề: Tổng quan kỹ thuật giấu tin thuỷ vân, phương pháp thuỷ vân sở liệu quan hệ dựa vào kỹ thuật tìm kiếm theo mẫu ứng dụng chúng Cụ thể luận văn đạt kết sau: - Trình bày tổng quan kỹ thuật giấu tin thuỷ vân - Trình bày sở lý thuyết thuỷ vân sở liệu quan hệ dựa kỹ thuật tối ưu áp dụng thuật toán tìm kiếm theo mẫu - Mô tả ứng dụng kỹ thuật tìm kiếm theo mẫu trình nhúng thuỷ vân Hướng phát triển đề tài Tiếp tục nghiên cứu số kỹ thuật khác áp dụng thuỷ vân sở liệu quan hệ Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 55 56 PHỤ LỤC trình truyền trước với thẻ MAC sinh thứ hai Nếu thấy giống nhau, người nhận cho an toàn, tính toàn vẹn thông Mã xác thực thông tin (MAC) điệp không bị xâm phạm thông điệp không bị thay đổi trình Trong phân hoạch liệu, mã xác thực thông tin (MAC) sử truyền nhận dụng để xác định nguồn gốc thông tin Xác thực MAC Người nhận Người gửi Nơi gửi thông tin Thông điệp Thông điệp Nơi nhận thông tin M M || | C K Khoá K Thuật toán MAC K Thông điệp Khoá K Thuật toán MAC So sánh Mã xác thực (MAC) C MAC Trong đó: MAC MAC =? MAC M: Thông tin gốc K: Khoá bí mật dùng chung bên gửi bên nhận ||: Nối mã xác thực vào thông tin gốc Cách giải quyết: giống tin cậy toàn vẹn ngược lại sai C: Hàm tạo mã xác thực Hình 3.2 Mô tả trình xác thực thông tin MAC Hình 3.1 Sơ đồ hoạt động MAC Người gửi thông điệp thực thông qua thuật toán MAC để sinh thẻ liệu MAC Sau đó, thông điệp thẻ MAC gửi tới người nhận Người nhận tiến hành chia thông điệp để truyền thông qua thuật toán tương tự MAC sử dụng khoá tương tự, kết thẻ liệu MAC thứ hai Khi đó, người nhận so sánh thẻ MAC nhận Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 57 58 - Tính nhất: xác suất để có đụng độ (hash collision), tức hai Hàm băm thông điệp khác có kết băm, nhỏ Khái niệm hàm băm Ứng dụng Hàm băm (hash function) giải thuật nhằm sinh giá trị băm tương ứng với khối liệu (có thể chuỗi kí tự, đối tượng lập trình hướng đối tượng, v.v ) Giá trị băm đóng vai trò gần khóa để phân biệt khối liệu, nhiên, người ta chấp nhận tượng trùng khóa hay gọi đụng độ cố gắng cải thiện giải thuật để giảm thiểu đụng độ Hàm băm thường dùng bảng băm nhằm giảm chi phí tính toán tìm khối liệu tập hợp (nhờ việc so sánh giá trị băm nhanh việc so sánh khối liệu có kích thước lớn) Vì tính thông dụng bảng băm, ngày nay, đa số ngôn ngữ lập trình cung cấp thư viện ứng dụng bảng băm, có vấn đề như: tập hợp (collection), danh sách (list), bảng(table), ánh xạ (mapping), từ điển (dictionary)) Thông thường, lập trình viên cần viết hàm băm cho đối tượng nhằm tích hợp với thư viện bảng băm xây dựng sẵn Các hàm băm ứng dụng nhiều lĩnh vực, chúng thường thiết kế phù hợp với ứng dụng Ví dụ, hàm băm mật mã học giả thiết tồn đối phương - người cố tình tìm liệu vào với giá trị băm Một hàm băm tốt phép biến đổi "một chiều", nghĩa phương pháp cụ thể để tính toán liệu vào tương ứng với giá trị băm mong muốn, việc giả mạo khó khăn Bảng băm, ứng dụng quan trọng hàm băm, cho phép tra cứu nhanh ghi liệu cho trước khóa ghi (Lưu ý: khóa thường không bí mật mật mã học, hai dùng để "mở khóa" để truy nhập thông tin.) Ví dụ, khóa từ điển điện tử Anh-Anh từ tiếng Anh, ghi tương ứng với chúng chứa định nghĩa Trong trường hợp này, hàm băm phải ánh xạ Một hàm băm tốt phải thỏa mãn điều kiện sau: xâu chữ tới mục mảng nội bảng băm * Tính toán nhanh * Các khoá phân bố bảng Các hàm băm dành cho việc phát sửa lỗi tập trung phân biệt * Ít xảy đụng độ trường hợp mà liệu bị làm nhiễu trình ngẫu nhiên Khi * Xử lý loại khóa có kiểu liệu khác hàm băm dùng cho giá trị tổng kiểm, giá trị băm tương đối nhỏ dùng để kiểm chứng file liệu có kích thước tùy ý chưa Tính chất hàm băm bị sửa đổi Hàm băm dùng để phát lỗi truyền liệu Tại nơi gửi, Hai tính chất quan trọng hàm băm là: hàm băm tính cho liệu gửi, giá trị băm gửi - Tính chiều: suy liệu ban đầu từ kết Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn liệu Tại đầu nhận, hàm băm lại tính lần nữa, giá trị băm không Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 59 60 trùng lỗi xảy trình truyền Việc gọi kiểm tra dư thừa (redundancy check) SHA-1 MD5 hai thuật toán băm thông dụng sử dụng nhiều hệ thống bảo mật Các hàm băm ứng dụng việc nhận dạng âm thanh, chẳng hạn xác định xem file MP3 có khớp với file danh sách MD5 (Message-Digest algorithm 5) hàm băm để mã hóa với giá trị băm 128bit Từng xem chuẩn Internet, MD5 sử loạt file khác hay không dụng rộng rãi chương trình an ninh mạng, thường Do hàm băm dùng để phát chống xâm nhập; bảo vệ tính dùng để kiểm tra tính nguyên vẹn tập tin toàn vẹn thông điệp gửi qua mạng; tạo khóa từ mật khẩu, tạo chữ kí điện tử MD5 Ronald Rivest thiết kế vào năm 1991 để thay cho hàm băm trước đó, MD4 (cũng ông thiết kế, trước MD2) MD5 có hai ứng dụng quan trọng: Hàm băm chiều: - Biến đổi thông tin gốc có độ dài thành khối thông tin có độ dài cố định gọi mã băm - Chỉ dùng hàm băm để tạo mã băm từ thông tin gốc mà không làm ngược lại gọi hàm băm chiều - MD5 sử dụng rộng rãi giới phần mềm để đảm bảo tập tin tải không bị hỏng Người sử dụng so sánh thông số kiểm tra phần mềm MD5 công bố với thông số kiểm tra phần mềm tải MD5 Hệ điều hành Unix sử dụng MD5 để kiểm tra gói mà phân phối, hệ điều hành Windows sử dụng Hoạt động hàm băm phần mềm hãng thứ ba - MD5 dùng để mã hóa mật Mục đích việc mã hóa biến đổi chuổi mật thành đoạn mã khác, cho từ đoạn mã lần trở lại mật Có nghĩa việc giải mã phải khoãng thời gian vô tận (đủ để làm nản lòng hacker) Thuật giải MD5 biến đổi thông điệp có chiều dài thành khối có kích thước cố định 128 bits Thông điệp đưa vào cắt thành khối 512 bits Thông điệp đưa vào đệm để chiều dài sẻ chia hết cho Hình 3.3 Biểu diễn hàm băm Số hóa Trung tâm Học liệu – Đại học Thái Nguyên 512 Bộ đệm hoạt động sau: http://www.lrc-tnu.edu.vn Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 61 62 - Trước tiên chèn bit vào cuối thông điệp TÀI LIỆU THAM KHẢO - Tiếp hàng loạt bit Zero chiều dài nhỏ bội số 512 khoảng 64 bit - Phần lại sẻ lấp đầy số nguyên 64 bit biểu diển chiều [1] “Nghiên cứu Phát triển Kỹ thuật Thuỷ vân Cơ sở Dữ liệu Quan hệ”, Báo cáo kết nghiên cứu đề tài sở 2008, 12/2008, Phòng CSDL dài ban đầu thông điệp & LT [2] Bùi Thế Hồng, Nguyễn Thị Thu Hằng, Lƣu Thị Bích Hƣơng, “Thủy vân sở liệu quan hệ”, Tạp chí Khoa học & Công nghệ, ĐH Thái Nguyên, 2009 [3] Vũ Ba Đình, “Giấu thông tin sở liệu không gian”, Tạp chí nghiên cứu khoa học kỹ thuật công nghệ Quân sự, số 4, 30-37 [4] R Agrawal, J Kiernan, “Watermarking Relational Databases” in Proceedings of the 28th VLDB Conference, Hong Kong, China, 2002 [5] R Agrawal, P J Haas, and J Kiernan “Watermarking relational data: framework, algorithms and analysis*” The VLDB Journal (2003) [6] R Sion, M Atallah, S Prabhakar.“Watermarking Relational Databases” CERIAS TR 2002-28* Center for Education and Research in Information Assurance, Computer Sciences, Purdue University, 2002 [7] R Sion, M Atallah, and S Prabhakar “Rights Protection for Relational Data” IEEE Transactions on Knowledge and Data Engineering, 16(6), June 2004 [8] R Sion, “Proving ownership over categorical data” ICDE 2004 [9] M Shehab, E Bertino, A Ghafoor “Watermarking Relational Databases using Optimization Based Techniques” CERIAS Tech Report 2006-41 [10] Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn www.watermarkingworld.org Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 63 [11] W Bender, D Gruhl, N Morimoto, A Lu, “Techniques for data Hiding” IBM SYSTEMS JOURNAL, VOL 35, NOS 3&4, 1996 [12] Stefan Katzenbeisser and Fabien A.P.Petitcolas, “Information Hiding Techniques for Steganography and Digital Watermarking”.Artech House Boston London [13] Michael Arnold, Martin Schmucker and Stephen D Wolthusen, “Techniques and Applications of Digital Watermarking and Content Protection” Artech House Boston London Số hóa Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn