Thủy vân cơ sở dữ liệu quan hệ dựa trên kỹ thuật tối ưu hoá áp dụng thuật toán tìm kiếm theo mẫu

69 1.4K 2
Tài liệu đã được kiểm tra trùng lặp
Thủy vân cơ sở dữ liệu quan hệ dựa trên kỹ thuật tối ưu hoá áp dụng thuật toán tìm kiếm theo mẫu

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Thủy vân cơ sở dữ liệu quan hệ dựa trên kỹ thuật tối ưu hoá áp dụng thuật toán tìm kiếm theo mẫu

Trang 1

ĐẠI HỌC THÁI NGUYÊN

KHOA CÔNG NGHỆ THÔNG TIN

NGUYỄN THỊ HẠNH

THỦY VÂN CƠ SỞ DỮ LIỆU QUAN HỆ DỰA TRÊN KỸ THUẬT TỐI ƢU HOÁ

ÁP DỤNG THUẬT TOÁN TÌM KIẾM THEO MẪU

LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH

Thái Nguyên – 2009

Trang 2

ĐẠI HỌC THÁI NGUYÊN KHOA CÔNG NGHỆ THÔNG TIN

NGUYỄN THỊ HẠNH

THỦY VÂN CƠ SỞ DỮ LIỆU QUAN HỆ DỰA TRÊN KỸ THUẬT TỐI ƢU HOÁ

ÁP DỤNG THUẬT TOÁN TÌM KIẾM THEO MẪU

Chuyên ngành: Khoa học máy tính Mã số: 604801

LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH

NGƯỜI HƯỚNG DẪN KHOA HỌC:

TS BÙI THẾ HỒNG

Thái Nguyên - 2009

Trang 3

ĐẠI HỌC THÁI NGUYÊN

KHOA CÔNG NGHỆ THÔNG TIN

TÓM TẮT LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH

NGƯỜI HƯỚNG DẪN KHOA HỌC

TS BÙI THẾ HỒNG

Thái Nguyên – 2009

Trang 4

Người hướng dẫn khoa học:

Và thư viện Trường/Khoa:………

(Ghi tên thư viện đơn vị)

Trang 6

[1] “Nghiên cứu và Phát triển Kỹ thuật Thuỷ vân Cơ sở Dữ liệu Quan hệ”, Báo cáo kết quả

nghiên cứu của đề tài cơ sở 2008, 12/2008, Phòng CSDL & LT

[2] Bùi Thế Hồng, Nguyễn Thị Thu Hằng, Lưu Thị Bích Hương, “Thủy vân cơ sở dữ liệu

quan hệ”, Tạp chí Khoa học & Công nghệ, ĐH Thái Nguyên, 2009

[3] Vũ Ba Đình, “Giấu thông tin trong cơ sở dữ liệu không gian”, Tạp chí nghiên cứu khoa học

kỹ thuật và công nghệ Quân sự, số 4, 30-37

[4] R Agrawal, J Kiernan, “Watermarking Relational Databases” in Proceedings of the 28th

VLDB Conference, Hong Kong, China, 2002

[5] R Agrawal, P J Haas, and J Kiernan “Watermarking relational data: framework,

algorithms and analysis*” The VLDB Journal (2003)

[6] R Sion, M Atallah, S Prabhakar.“Watermarking Relational Databases” CERIAS TR

2002-28* Center for Education and Research in Information Assurance, Computer Sciences, Purdue University, 2002

[7] R Sion, M Atallah, and S Prabhakar “Rights Protection for Relational Data” IEEE

Transactions on Knowledge and Data Engineering, 16(6), June 2004

[8] R Sion, “Proving ownership over categorical data” ICDE 2004

[9] M Shehab, E Bertino, A Ghafoor “Watermarking Relational Databases using

Optimization Based Techniques” CERIAS Tech Report 2006-41

[10] www.watermarkingworld.org

[11] W Bender, D Gruhl, N Morimoto, A Lu, “Techniques for data Hiding” IBM

SYSTEMS JOURNAL, VOL 35, NOS 3&4, 1996

[12] Stefan Katzenbeisser and Fabien A.P.Petitcolas, “Information Hiding Techniques for

Steganography and Digital Watermarking”.Artech House Boston London

[13] Michael Arnold, Martin Schmucker and Stephen D Wolthusen, “Techniques and

Applications of Digital Watermarking and Content Protection” Artech House

Boston London

Trang 7

LỜI CAM ĐOAN

Tôi xin cam đoan : Luận văn “Nghiên cứu và phát triển kỹ thuật thủy vân cơ sở dữ liệu quan hệ dựa trên kỹ thuật tối ưu hóa áp dụng thuật toán tìm kiếm theo mẫu” là công trình nghiên cứu riêng của tôi

Các số liệu trong luận văn được sử dụng trung thực Kết quả nghiên cứu được trình bày trong luận văn này chưa từng được công bố tại bất kỳ công trình nào khác

Tôi xin chân thành cám ơn các Thầy trong Viện Công nghệ thông tin

Việt Nam đã truyền đạt cho tôi kiến thức trong suốt những năm học ở trường

Tôi xin chân thành cảm ơn TS Bùi Thế Hồng đã tận tình hướng dẫn tôi hoàn

thành tốt luận văn này

Thái Nguyên, ngày 10 tháng 11 năm 2009

Tác giả luận văn

Nguyễn Thị Hạnh

Trang 8

MỤC LỤC

BẢNG CÁC TỪ VIẾT TẮT 4

DANH MỤC CÁC HÌNH VẼ 5

LỜI MỞ ĐẦU Chương 1-TỔNG QUAN VỀ KỸ THUẬT GIẤU TIN VÀ THUỶ VÂN 11 1.1 Kỹ thuật giấu tin và những vấn đề cơ bản về kỹ thuật giấu tin 12

1.1.1 Khái niệm giấu tin 12

1.1.2 Phân loại các kỹ thuật giấu tin 14

1.1.3 Mục đích của giấu tin 15

1.1.4 Môi trường giấu tin 17

1.2 Cơ sở lý thuyết về thuỷ vân 21

1.2.1 Khái niệm thuỷ vân và nhúng thuỷ vân 21

1.2.2 Lịch sử phát triển của thuỷ vân 21

1.2.3 Mô hình hệ thống tổng quát quá trình nhúng và thuỷ vân 22

1.2.4 Một số ứng dụng của thuỷ vân 24

Chương 2-THUỶ VÂN CƠ SỞ DỮ LIỆU QUAN HỆ DỰA TRÊN KỸ THUẬT TỐI ƯU ÁP DỤNG THUẬT TOÁN TÌM KIẾM THEO MẪU 25 2.1 Giới thiệu về thuỷ vân cơ sở dữ liệu 25

2.2 Mô hình chi tiết hệ thống thuỷ vân cơ sở dữ liệu 27

2.3 Phân hoạch dữ liệu 29

2.4 Nhúng thuỷ vân 32

2.4.1 Mã hoá bít đơn 32

2.4.2 Thuật toán tìm kiếm theo mẫu 37

2.4.3 Thuật toán nhúng thuỷ vân 39

Trang 9

3.1 Giới thiệu về kỹ thuật tìm kiếm theo mẫu 47

Trang 10

BẢNG CÁC TỪ VIẾT TẮT

HVS Human Vision System Hệ thống thị giác của con người HAS Human Auditory System Hệ thống thính giác của con người

GA Genetic Algorithm Thuật toán di truyền MAC Message Authetication Code Mã xác thực thông tin MD5 Message Digest algorithm 5 Hàm băm

Trang 11

DANH MỤC CÁC HÌNH VẼ

Trang

Hình 1.1 Sơ đồ biểu diễn quá trình giấu tin ……21

Hình 1.2 Sơ đồ biểu diễn quá trình giải mã tin ……21

Hình 1.3 Sơ đồ phân loại kỹ thuật giấu tin ……21

Hình 1.4 Sơ đồ nhúng thuỷ vân ……21

Hình 1.5 Sơ đồ khôi phục thuỷ vân 21

Hình 2.1 Các thời kỳ mã hoá và giải mã thuỷ vân 26

Hình 2.2 Bảng biểu diễn các ký hiệu sử dụng trong thuật toán …………31

Hình 2.3: Phân phối của tập Si i trên trục số……….36

Hình 2.4 Biểu diễn Sigmoid(α,τ ) tại τ = 0 và α = {1, 2, 8}……… 39

Hình 2.5 Lược đồ ngưỡng giải mã……… 42

Hình 3.1 Bảng thống kê kết quả thực nghiệm ………

Trang 12

LỜI MỞ ĐẦU

Trong thực tế việc chứng minh quyền sở hữu đối với các cơ sở dữ liệu quan hệ sau khi đã phân phối hoặc chuyển giao đang là một vấn đề quan trọng trong các môi trường ứng dụng dựa trên Internet và trong nhiều ứng dụng phân phối sản phẩm

Trong những năm gần đây, công nghệ thông tin phát triển với tốc độ chóng mặt về cả phần cứng và phần mềm, đặc biệt là tốc độ phát triển của Internet và các công nghệ có liên quan đã đưa đến một tiểm năng chưa từng có đối với việc truy nhập và phân phối lại các sản phẩm kỹ thuật số Sự phát triển của công nghệ đa phương tiện với khả năng sao chép mô phỏng đã mở ra nhiều hướng mới cho sự phát triển kỹ thuật thuỷ vân, đặt biệt là lĩnh vực bảo mật cơ sở dữ liệu Thuỷ vân cơ sở dữ liệu cũng không nằm ngoài quy luật phát triển đó

Ban đầu, thuỷ vân được sử dụng để nhúng vào các sản phẩm đa phương tiện như âm thanh, hình ảnh …Nhưng hiện nay, thuỷ vân đã được ứng dụng vào một lĩnh vực hết sức mới mẻ có liên quan đến quyền sở hữu trí tuệ Đó là lĩnh vực thuỷ vân cơ sở dữ liệu quan hệ, đây là một trong những lĩnh vực quan trọng và có ứng dụng nhiều trong cuộc sống

Thuỷ vân đã được sử dụng với mong muốn có thể cho phép chứng minh được tác giả và nguồn gốc của cơ sở dữ liệu để từ đó chứng minh dữ liệu là chuẩn xác

Xuất phát từ thực tế đó, luận văn lựa chọn đề tài: “Nghiên cứu và phát

triển kỹ thuật thủy vân cơ sở dữ liệu quan hệ dựa trên kỹ thuật tối ưu hóa áp dụng thuật toán tìm kiếm theo mẫu”.

Trang 13

Tính cấp thiết của đề tài

- Ngày nay, Internet đã và đang phát triển với tốc độ nhanh, cùng với sự phát triển đó thì các công nghệ và các ứng dụng được phân tán trên Internet rất nhiều Chính vì vậy, việc chứng minh quyền sở hữu đối với các cơ sở dữ liệu quan hệ sau khi đã phân phối hoặc chuyển giao đang là một vấn đề rất quan trọng trong các môi trường ứng dụng dựa trên internet và trong nhiều ứng dụng phân phối sản phẩm

- Trong một bối cảnh như vậy, việc thực thi quyền sở hữu dữ liệu là một yêu cầu quan trọng đòi hỏi các giải pháp đồng bộ, bao gồm các khía cạnh về kỹ thuật, về tổ chức, và cả luật pháp Mặc dù chúng ta vẫn chưa có được những giải pháp toàn diện như vậy nhưng trong các năm gần đây, các kỹ thuật thuỷ vân đã đóng một vai trò quyết định nhằm giải quyết vấn đề về quyền sở hữu này

- Cho đến nay, mới chỉ có một vài cách tiếp cận đối với bài toán thuỷ vân dữ liệu quan hệ Tuy nhiên, những kỹ thuật này không bền vững đối với các tấn công thuỷ vân

Trang 14

Mục tiêu nghiên cứu

Mục tiêu chung

Nghiên cứu kỹ thuật thuỷ vân cơ sở dữ liệu dựa trên kỹ thuật tối ưu hóa để mã hoá và giải mã thuỷ vân Trong đó tập trung nghiên cứu kỹ thuật phân hoạch dữ liệu không phụ thuộc vào các bộ được đánh dấu để định vị các phân hoạch, và nghiên cứu kỹ thuật phát hiện thủy vân dựa vào một ngưỡng tối ưu

Mục tiêu cụ thể

Nghiên cứu kỹ thuật thuỷ vân cơ sở dữ liệu quan hệ có áp dụng kỹ thuật tối ưu hoá như một bài toán tối ưu hoá có ràng buộc Đồng thời trình bày kỹ thuật hữu hiệu để giải bài toán tối ưu này bằng thuật toán tìm kiếm theo mẫu và xử lý các ràng buộc của chúng

Ý nghĩa khoa học và ý nghĩa thực tiễn của đề tài

Ý nghĩa khoa học của đề tài

- Đưa ra cơ sở khoa học của việc lựa chọn kỹ thuật tối ưu để mã hoá và giải mã thuỷ vân trong đó sử dụng kỹ thuật tìm kiếm theo mẫu để giải quyết bài toán

Ý nghĩa thực tiễn

- Kết quả của đề tài có ý nghĩa rất lớn đối với Ngành công nghệ thông tin trong việc chứng minh quyền sở hữu đối với các cơ sở dữ liệu quan hệ sau khi đã phân phối hoặc chuyển giao đang là một vấn đề rất quan trọng trong các môi trường ứng dụng dựa trên internet và trong nhiều ứng dụng phân phối

sản phẩm

Trang 15

Nhiệm vụ nghiên cứu

- Nghiên cứu, hiểu rõ và trình bày về kỹ thuật tối ưu để mã hoá và giải mã thuỷ vân

- Nghiên cứu và sử dụng công cụ để mô tả kỹ thuật tìm kiếm theo mẫu

Phương pháp nghiên cứu

- Nghiên cứu lý thuyết cơ sở về thuỷ vân cơ sở dữ liệu

- Nghiên cứu ứng dụng và mô tả chi tiết về kỹ thuật tìm kiếm theo mẫu

Phạm vi nghiên cứu

- Phạm vi nghiên cứu kỹ thuật thuỷ vân cơ sở dữ liệu quan hệ và mô tả kỹ thuật tối ưu trong đó áp dụng kỹ thuật tìm kiếm theo mẫu

Các kết quả nghiên cứu dự kiến cần đạt được

Kết quả về học thuật: Nghiên cứu kỹ thuật thuỷ vân cơ sở dữ liệu

Kết quả về phát triển ứng dụng: Áp dụng kỹ thuật tìm kiếm theo mẫu

để mô tả và phát triển ứng dụng trong thực tế

Kết cấu của luận văn

Bố cục của luận văn bao gồm phần mở đầu, phần kết luận và ba chương Nội dung các chương được tổ chức như sau:

Chương 1: Tổng quan về kỹ thuật giấu tin và thuỷ vân

Chương này trình bày một số khái niệm về kỹ thuật giấu tin, các vấn đề cơ bản của kỹ thuật giấu tin Đồng thời cũng trình bày khái niệm cơ bản về thuỷ vân, và đặc biệt đưa ra sơ đồ chi tiết về thuỷ vân

Trang 16

Chương 2: Thuỷ vân cơ sở dữ liệu quan hệ dựa trên kỹ thuật tối ưu áp dụng thuật toán tìm kiếm theo mẫu

Chương này trình bày quá trình mã hoá, giải mã thuỷ vân cơ sở dữ liệu quan hệ bằng kỹ thuật tối ưu áp dụng thuật toán tìm kiếm theo mẫu

Chương 3: Phát triển ứng dụng thuỷ vân cơ sở dữ liệu quan hệ dựa trên kỹ thuật tối ưu áp dụng thuật toán tìm kiếm theo mẫu

Chương này trình bày ứng dụng của kỹ thuật tối ưu, kỹ thuật tìm kiếm theo mẫu trong quá trình nhúng thuỷ vân Cùng với một số kết quả cài đặt của ứng dụng

Trang 18

1.1 Kỹ thuật giấu tin và những vấn đề cơ bản về kỹ thuật giấu tin

1.1.1 Khái niệm về giấu tin

Từ trước đến nay, nhiều phương pháp bảo vệ thông tin đã được đưa ra, trong đó giải pháp dùng mật mã được ứng dụng rộng rãi nhất Thông tin ban đầu được mã hoá, sau đó sẽ được giải mã nhờ khoá của hệ mã Đã có nhiều hệ mã phức tạp được sử dụng như DES, RSA, NAPSACK , rất hiệu quả và phổ biến

Một phương pháp mới khác đã và đang được nghiên cứu và ứng dụng mạnh mẽ ở nhiều nước trên thế giới, đó là phương pháp giấu tin Giấu thông tin là kỹ thuật nhúng một lượng thông tin số nào đó vào trong một đối tượng dữ liệu số khác Một trong những yêu cầu cơ bản của giấu tin là đảm bảo tính chất ẩn của thông tin được giấu đồng thời không làm ảnh hưởng đến chất lượng của dữ liệu gốc

Sự khác biệt chủ yếu giữa mã hoá thông tin và giấu thông tin là mã hoá làm cho các thông tin thể hiện là có được mã hoá hay không, còn với giấu thông tin thì người ta sẽ khó biết được là có thông tin giấu bên trong

Trang 19

Hình 1.1 Sơ đồ biểu diễn quá trình giấu tin

Hình 1.2 Sơ đồ biểu diễn quá trình giải mã

Hai sơ đồ trên hình 1.1 và 1.2 biểu diễn quá trình giấu tin và quá trình giải tin Phân phối

Thông tin giấu

Bộ nhúng thông tin

Phương tiện chứa đã được

giấu tin Phương tiện

chứa (audio, ảnh, video )

Khoá

Thông tin giấu Bộ giải

mã tin Phương tiện

chứa đã được giấu tin

Phương tiện chứa (audio, ảnh, video ) Khoá

Kiểm định

Trang 20

1.1.2 Phân loại các kỹ thuật giấu tin

Do kỹ thuật giấu thông tin số mới được hình thành trong thời gian gần đây nên xu hướng phát triển chưa ổn định Nhiều phương pháp mới, theo nhiều khía cạnh khác nhau đang và chắc chắn sẽ được đề xuất, bởi vậy một định nghĩa chính xác, một sự đánh giá phân loại rõ ràng chưa thể có được Sơ đồ phân loại sau đây được Fabien A P Petitcolas đề xuất năm 1999

Hình 1.3 Phân loại kỹ thuật giấu tin Giấu thông tin (Information hiding)

Giấu tin bí mật (steganography)

Nhúng thuỷ vân (Watermarking)

Thuỷ vân bền vững (Robust Copyright marking)

Thuỷ vân “dễ vỡ” (Fragile Watermarking)

Thuỷ vân ẩn

(Imperceptible watermarking)

Thuỷ vân hiện (Visible watermarking)

Trang 21

Dựa trên việc thống kê sắp xếp khoảng 100 công trình đã công bố trên một số tạp chí, cùng với thông tin về tên và tóm tắt nội dung của khoảng 200 công trình đã công bố trên Internet, có thể chia lĩnh vực giấu tin ra làm hai hướng lớn, đó là thuỷ vân và giấu tin bí mật Nếu như thủy vân liên quan đến ứng dụng giấu các mẩu tin ngắn nhưng đòi hỏi độ bền vững lớn của thông tin cần giấu (trước các biến đổi thông thường của tệp dữ liệu môi trường) thì giấu tin bí mật lại liên quan tới ứng dụng che giấu các bản tin đòi hỏi độ bí mật và dung lượng càng lớn càng tốt Đối với từng hướng lớn này, quá trình phân loại theo các tiêu chí khác có thể tiếp tục được thực hiện, ví dụ dựa theo ảnh hưởng các tác động từ bên ngoài có thể chia thuỷ vân thành hai loại, một loại bền vững với các tác động sao chép trái phép, loại thứ hai lại cần tính chất hoàn toàn đối lập: dễ bị phá huỷ trước các tác động nói trên Cũng có thể chia thuỷ vân theo đặc tính, một loại cần được che giấu để chỉ có một số người tiếp xúc với nó có thể thấy được thông tin, loại thứ hai đối lập, cần được mọi người nhìn thấy.Các thành tựu đạt được trong lĩnh vực nghiên cứu này đã bắt đầu được áp dụng hiệu quả cho mục đích bảo vệ bản quyền, chống sao chép, phân tán trái phép các sản phẩm trong môi trường số hoá và nhiều mục đích khác Nhiều phương pháp giấu thông tin khác nhau đã được đề xuất, mỗi phương pháp có những ưu điểm, nhược điểm riêng và thích hợp cho một nhóm ứng dụng nào đó [3],[11],[12]

1.1.3 Mục đích của giấu tin

Bảo mật thông tin bằng giấu tin có hai khía cạnh Một là bảo mật cho dữ liệu được giấu, ví dụ giấu tin mật: thông tin mật được giấu kỹ trong một đối tượng khác sao cho người khác không phát hiện được Hai là bảo mật chính đối tượng được dùng để giấu dữ liệu vào, chẳng hạn ứng dụng bảo vệ

Trang 22

bản quyền, phát hiện xuyên tạc thông tin Một số ứng dụng đang được triển khai:

- Bảo vệ bản quyền tác giả (copyright protection): Đây là ứng dụng cơ bản nhất của kỹ thuật thuỷ vân Một thông tin nào đó mang ý nghĩa quyền sở hữu tác giả (người ta gọi nó là thuỷ vân - watermark) sẽ được nhúng vào trong các sản phẩm, thuỷ vân đó chỉ người chủ sở hữu hợp pháp các sản phẩm đó có và được dùng làm minh chứng cho bản quyền sản phẩm Giả sử có một thành phẩm dữ liệu dạng đa phương tiện như ảnh, âm thanh, video cần được lưu thông trên mạng Để bảo vệ các sản phẩm chống lại hành vi lấy cắp hoặc làm nhái cần phải có một kỹ thuật để “dán tem bản quyền” vào sản phẩm này Việc dán tem hay chính là việc nhúng thuỷ vân cần phải đảm bảo không để lại một ảnh hưởng lớn nào đến việc cảm nhận sản phẩm Yêu cầu kỹ thuật đối với ứng dụng này là thuỷ vân phải tồn tại bền vững cùng với sản phẩm, muốn bỏ thuỷ vân này mà không được phép của người chủ sở hữu thì chỉ còn cách là phá huỷ sản phẩm

- Xác thực thông tin và phát hiện xuyên tạc thông tin (authentication and tamper detection): Một tập thông tin sẽ được giấu trong phương tiện chứa, sau đó được sử dụng để nhận biết dữ liệu trên phương tiện gốc có bị thay đổi hay không Các thuỷ vân nên được ẩn để tránh sự tò mò của đối phương, hơn nữa việc làm giả các thuỷ vân hợp lệ hay xuyên tạc thông tin nguồn cũng cần xem xét.Trong các ứng dụng thực tế, người ta mong muốn tìm được vị trí bị xuyên tạc cũng như phân biệt được các thay đổi (ví dụ như phân biệt một đối tượng đa phương tiện chứa thông tin giấu đã bị thay đổi, xuyên tạc nội dung hay chỉ bị nén mất dữ liệu).Yêu cầu chung đối với ứng dụng này là khả năng giấu thông tin cao và thuỷ vân không cần bền vững

Trang 23

- Dấu vân tay hay dán nhãn (fingerprinting and labeling): Thuỷ vân trong những ứng dụng này được sử dụng để nhận diện người gửi hay người nhận một thông tin nào đó Ví dụ các vân khác nhau sẽ được nhúng vào các bản copy khác nhau của thông tin gốc trước khi chuyển cho nhiều người Với những ứng dụng này, yêu cầu là đảm bảo độ an toàn cao cho các thuỷ vân, tránh khả năng xoá dấu vết trong khi phân phối

- Điều khiển truy cập (copy control): Các thiết bị phát hiện thuỷ vân (ở đây sử dụng phương pháp phát hiện thuỷ vân đã giấu mà không cần thông tin gốc) được gắn sẵn vào trong các hệ thống đọc ghi, tùy thuộc vào việc có thủy vân hay không để điều khiển (cho phép/cấm) truy cập Ví dụ hệ thống quản lí sao chép DVD đã được ứng dụng ở Nhật

- Giấu tin bí mật (steganography): Các thông tin giấu được trong những trường hợp này càng nhiều càng tốt Việc giải mã để nhận được thông tin cũng không cần phương tiện chứa gốc.[3],[11],[12]

1.1.4 Môi trường giấu tin

Kỹ thuật giấu tin đã được nghiên cứu và áp dụng trong nhiều môi trường dữ liệu khác nhau như trong dữ liệu đa phương tiện (văn bản, hình ảnh, âm thanh, phim ), trong sản phẩm phần mềm và gần đây là những nghiên cứu trên lĩnh vực cơ sở dữ liệu quan hệ Trong các dữ liệu đó, dữ liệu đa phương tiện là môi trường chiếm tỉ lệ chủ yếu trong các kỹ thuật giấu tin.

a Giấu tin trong ảnh (image)

Giấu thông tin trong ảnh, hiện nay, là một bộ phận chiếm tỉ lệ lớn nhất trong các chương trình ứng dụng, các phần mềm, hệ thống giấu tin trong đa phương tiện do lượng thông tin được trao đổi bằng ảnh là rất lớn và hơn nữa

Trang 24

giấu thông tin trong ảnh cũng đóng vai trò quan trọng trong hầu hết các ứng dụng bảo vệ an toàn thông tin như: xác thực thông tin, xác định xuyên tạc thông tin, bảo vệ bản quyền tác giả, điều khiển truy cập, giấu tin bí mật Do đó vấn đề này đã nhận được sự quan tâm lớn của các cá nhân, tổ chức, trường đại học, và viện nghiên cứu trên thế giới

Thông tin sẽ được giấu cùng với dữ liệu ảnh nhưng chất lượng ảnh ít thay đổi và không ai biết được đằng sau ảnh đó mang những thông tin có ý nghĩa Ngày nay, khi ảnh số đã được sử dụng phổ biến, giấu thông tin trong ảnh đã đem lại nhiều những ứng dụng quan trọng trên nhiều lĩnh vực trong đời sống xã hội Ví dụ đối với các nước phát triển, chữ kí tay đã được số hoá và lưu trữ sử dụng như hồ sơ cá nhân của các dịch vụ ngân hàng và tài chính, nó được dùng để xác thực trong các thẻ tín dụng của người tiêu dùng Phần mềm WinWord của MicroSoft cũng cho phép người dùng lưu trữ chữ kí trong ảnh nhị phân rồi gắn vào vị trí nào đó trong file văn bản để đảm bảo tính an toàn của thông tin Tài liệu sau đó được truyền trực tiếp qua máy fax hoặc lưu truyền trên mạng Theo đó, việc xác thực chữ kí, xác thực thông tin đã trở thành một vấn đề quan trọng khi việc ăn cắp thông tin hay xuyên tạc thông tin bởi các tin tặc đang trở thành một vấn nạn đối với bất kì quốc gia nào, tổ chức nào Hơn nữa có nhiều loại thông tin quan trọng cần được bảo mật như những thông tin về an ninh, thông tin về bảo hiểm hay các thông tin về tài chính, các thông tin này được số hoá và lưu trữ trong hệ thống máy tính hay trên mạng Chúng dễ bị lấy cắp và bị thay đổi bởi các phần mềm chuyên dụng Việc xác thực cũng như phát hiện thông tin xuyên tạc đã trở nên vô cùng quan trọng, cấp thiết Một đặc điểm của giấu thông tin trong ảnh là thông tin được giấu trong ảnh một cách vô hình, tương tự cách truyền thông

Trang 25

tin mật cho nhau mà người khác không thể biết được bởi sau khi giấu thông tin chất lượng ảnh gần như không thay đổi đặc biệt đối với ảnh mầu hay ảnh xám Ví dụ về vụ việc ngày 11-9 gây chấn động nước Mĩ và toàn thế giới, chính tên trùm khủng bố quốc tế Osma BinLaDen đã dùng cách thức giấu thông tin trong ảnh để liên lạc với đồng bọn, và hắn đã qua mặt được cục tình báo trung ương Mĩ CIA và các cơ quan an ninh quốc tế Chắc chắn sau vụ việc này, việc nghiên cứu các vấn đề liên quan đến giấu thông tin trong ảnh sẽ rất được quan tâm

b Giấu tin trong âm thanh(audio)

Giấu thông tin trong âm thanh mang những đặc điểm riêng khác với giấu thông tin trong các đối tượng đa phương tiện khác Một trong những yêu cầu cơ bản của giấu tin là đảm bảo tính chất ẩn của thông tin được giấu đồng thời không làm ảnh hưởng đến chất lượng của dữ liệu gốc Để đảm bảo yêu cầu này, kỹ thuật giấu thông tin trong ảnh phụ thuộc vào hệ thống thị giác của con người - HVS còn kỹ thuật giấu thông tin trong âm thanh lại phụ thuộc vào hệ thống thính giác - HAS Một vấn đề khó khăn là hệ thống thính giác của con người nghe được các tín hiệu ở các dải tần rộng và công suất lớn nên đã gây khó khăn đối với các phương pháp giấu tin trong âm thanh Nhưng hệ thống thính giác của con người lại kém trong việc phát hiện sự khác biệt các dải tần và công suất, điều này có nghĩa là các âm thanh to, cao tần có thể che giấu được các âm thanh nhỏ thấp một cách dễ dàng Các mô hình phân tích tâm lí đã chỉ ra điểm yếu trên và thông tin này sẽ giúp ích cho việc chọn các âm thanh thích hợp cho việc giấu tin Vấn đề khó khăn thứ hai đối với giấu thông tin trong âm thanh là kênh truyền tin Kênh truyền hay băng thông chậm sẽ ảnh hưởng đến chất lượng thông tin sau khi giấu Ví dụ để nhúng

Trang 26

một đoạn java applet vào một đoạn âm thanh (16 bit, 44.100 Hz) có chiều dài bình thường thì các phương pháp nói chung cũng cần ít nhất là 20 bit/s Giấu thông tin trong âm thanh đòi hỏi yêu cầu cao về tính đồng bộ và tính an toàn của thông tin Các phương pháp giấu thông tin trong âm thanh đều lợi dụng điểm yếu trong hệ thống thính giác của con người

c Giấu tin trong phim (video)

Cũng giống như giấu thông tin trong ảnh hay trong âm thanh, giấu tin trong phim cũng được quan tâm và được phát triển mạnh mẽ cho nhiều ứng dụng như điều khiển truy cập thông tin, xác thực thông tin và bảo vệ bản quyền tác giả Ví dụ các hệ thống chương trình trả tiền xem theo đoạn với các đoạn phim (pay per view application) Các kỹ thuật giấu tin trong phim cũng được phát triển mạnh mẽ và cũng theo hai khuynh hướng là thuỷ vân số và giấu thông tin Nhưng phần này chỉ quan tâm tới các kỹ thuật giấu tin trong phim Một phương pháp giấu tin trong phim được Cox đưa ra là phương pháp phân bố đều Ý tưởng cơ bản của phương pháp là phân phối thông tin giấu dàn trải theo tần số của dữ liệu gốc Nhiều nhà nghiên cứu đã dùng những hàm cosin riêng và các hệ số truyền sóng riêng để giấu tin Trong các thuật toán đầu tiên thường các kỹ thuật cho phép giấu các ảnh vào trong phim nhưng thời gian gần đây các kỹ thuật cho phép giấu cả âm thanh và hình ảnh vào phim Ví dụ Swanson đã sử dụng phương pháp giấu theo khối, phương pháp này đã giấu được hai bít vào khối 8*8 Hay gần đây nhất là phương pháp của Mukherjee là kỹ thuật giấu âm thanh vào phim sử dụng cấu trúc lưới đa chiều

Giấu tin là một công nghệ mới phức tạp, đang được các nhà khoa học tập trung nghiên cứu ở nhiều nước trên thế giới như Đức, Mỹ, ý, Canada,

Trang 27

Nhật Bản…Tuy nhiên, những kết quả thực nghiệm cho thấy để có thể ứng dụng thực tế thì lĩnh vực này cần phải có thêm thời gian để nghiên cứu thẩm định nhưng các nhà khoa học cũng khẳng định rằng đây là một công nghệ mới đầy hứa hẹn cho vấn đề an toàn và bảo mật thông tin Công việc hiện nay của các nhà khoa học là đang tập trung xây dựng một hệ thống lí thuyết chính xác cho vấn đề giấu tin, đây là một mảnh đất mới cho các nhà khoa học khám phá Một trong những kỹ thuật quan trọng của giấu tin đang được rất nhiều các nhà khoa học quan tâm và phát triển nhất, đó là kỹ thuật thuỷ vân (watermark) [3], [11], [12]

1.2 Cơ sở lý thuyết về thuỷ vân

1.2.1 Khái niệm thuỷ vân và nhúng thuỷ vân

- Thuỷ vân là một tín hiệu bảo mật và không nhận biết, được nhúng vào dữ liệu gốc để truyền dữ liệu đã nhúng đi.[9]

- Nhúng thủy vân (watermarking) là một trong những kỹ thuật giấu dữ liệu hiện đại, là quá trình chèn thông tin vào dữ liệu đa phương tiện nhưng bảo đảm không nhận biết được, nghĩa là chỉ làm thay đổi nhỏ dữ liệu gốc Thông thường người ta chỉ đề cập đến nhúng thủy vân số Một tập các dữ liệu số thứ cấp - gọi là mã đánh dấu bản quyền hay thủy vân (watermark), được nhúng vào dữ liệu số sơ cấp - gọi là dữ liệu bao phủ (ví dụ như văn bản, hình ảnh, âm thanh và phim số, .) Dữ liệu sau quá trình nhúng được gọi là dữ liệu nhúng.[10], [12], [13]

1.2.2 Lịch sử phát triển của thuỷ vân

Tanaka (1990), Caronni và Tirkel (1993) lần lượt đưa ra những ấn bản đầu tiên về nhúng thủy vân nhưng chưa nhận được sự quan tâm đúng mức

Trang 28

Đến năm 1995, chủ đề này mới bắt đầu được quan tâm và từ đó, nhúng thủy vân số đã phát triển tốc độ nhanh với nhiều hướng nghiên cứu và phương pháp thực hiện khác nhau Nhúng thủy vân được ứng dụng trong nhiều lĩnh vực như bảo vệ quyền sở hữu, điều khiển việc sao chép, xác nhận giấy tờ, hay truyền đạt thông tin khác, …trong đó ứng dụng phổ biến là cung cấp bằng chứng về bản quyền tác giả của các dữ liệu số bằng cách nhúng các thông tin bản quyền.

1.2.3 Mô hình hệ thống tổng quát quá trình nhúng và khôi phục thuỷ vân

Hình 1.4 Sơ đồ nhúng thuỷ vân

Thuỷ vân

Dữ liệu nhúng Dữ liệu

bao phủ Mã cá nhân /

công cộng

Quyết định thuỷ vân Dữ liệu

nhúng

Thuỷ vân

Mã cá nhân / công cộng

Trang 29

Hình 1.5 Sơ đồ khôi phục thuỷ vân

Tất cả các phương pháp nhúng thủy vân đều có chung các khối sau: một hệ thống nhúng thủy vân và một hệ thống khôi phục thủy vân [9], [10], [12], [13]

Hình 1.4 trình bày quá trình nhúng thủy vân tổng quát Đầu vào là thủy vân, dữ liệu cần nhúng và mã cá nhân hay công cộng Thủy vân có thể ở bất kì dạng nào như chữ số, văn bản hay hình ảnh Khoá có thể được dùng để tăng cường tính bảo mật, nghĩa là ngăn chặn những người không có bản quyền khôi phục hay phá hủy thủy vân Các hệ thống thực tế dùng ít nhất là một khoá, thậm chí kết hợp nhiều khoá Đầu ra là dữ liệu đã được nhúng thủy vân

Quá trình khôi phục thủy vân tổng quát được cho ở hình 1.5 Đầu vào là dữ liệu đã nhúng thủy vân, khoá và dữ liệu gốc (có thể có hoặc không tuỳ thuộc vào phương pháp) Đầu ra hoặc là thủy vân khôi phục được hoặc đại lượng nào đó chỉ ra mối tương quan giữa nó và thủy vân cho trước ở đầu vào

Phụ thuộc vào mục đích và ứng dụng mà các yêu cầu của hệ thống nhúng thủy vân được đặt ra Với các hệ thống thực tế, chúng đòi hỏi các yêu cầu sau:

− Tính không nhận biết: các điều chỉnh gây ra do nhúng thủy vân phải thấp hơn ngưỡng cảm thụ, nghĩa là các mẫu dùng trong nhúng thủy vân chỉ được phép thay đổi nhỏ

− Tính bền vững: đây là một yêu cầu nòng cốt của nhúng thủy vân − Khôi phục thủy vân cần hoặc không cần dữ liệu gốc

− Trích thủy vân hay kiểm chứng sự tồn tại của thủy vân

Trang 30

− Các khoá và bảo mật thủy vân

1.2.4 Một số ứng dụng của thuỷ vân

Một ứng dụng phổ biến của kỹ thuật thuỷ vân là đưa ra một bằng chứng về quyền sở hữu đối với dữ liệu số bằng cách nhúng dấu hiệu mang tính bản quyền vào phim hoặc các sản phẩm ảnh số

Ngoài ra, còn có những ứng dụng khác :

- Tự động điều khiển và tự hiệu chỉnh sao chép tài liệu trên Web Ví dụ một robot tìm web để đánh dấu vào tài liệu và từ đó nhận dạng sản phẩm bất hợp pháp

- Tự động kiểm tra việc truyền nhận sóng vô tuyến Ví dụ một robot có thể “nghe” một trạm thu phát sóng radio và tìm kiếm những dấu hiệu để biểu thị một phần cụ thể của bản nhạc hoặc lời quảng cáo vừa được phát ra

- Việc mở rộng dữ liệu- để thêm thông tin mang lại lợi ích một cách công khai

- Ứng dụng trong lấy dấu vân tay (cho phép nhận dạng dữ liệu đã phân tán)

Trang 31

Chương 2-

THUỶ VÂN CƠ SỞ DỮ LIỆU QUAN HỆ DỰA TRÊN KỸ THUẬT TỐI ƯU HOÁ

ÁP DỤNG THUẬT TOÁN TÌM KIẾM THEO MẪU

2.1 Giới thiệu về thuỷ vân cơ sở dữ liệu (database watermarking)

Tốc độ phát triển nhanh của Internet và các công nghệ có liên quan đã đưa đến một tiềm năng chưa từng có đối với việc truy cập và phân phối lại các sản phẩm kỹ thuật số Trong bối cảnh như vậy, việc thực thi quyền sở hữu dữ liệu là một yêu cầu quan trọng đòi hỏi các giải pháp đồng bộ, bao gồm các khía cạnh về kỹ thuật, về tổ chức, và cả luật pháp Mặc dù vẫn chưa có được những giải pháp toàn diện như vậy nhưng trong các năm gần đây, các kỹ thuật thuỷ vân đã đóng vai trò quyết định nhằm giải quyết vấn đề về quyền sở hữu này Những kỹ thuật như vậy cho phép người chủ dữ liệu có thể nhúng một thuỷ vân ẩn vào dữ liệu Một thuỷ vân thường mô tả những thông tin có thể được dùng để chứng minh quyền sở hữu dữ liệu, chẳng hạn như tên chủ sở hữu, nguồn gốc, hoặc người tiếp nhận nội dung này Việc nhúng thông tin an toàn đòi hỏi thuỷ vân được nhúng trong dữ liệu không thể bị làm giả mạo hoặc bị tẩy xoá một cách dễ dàng Nhúng ẩn có nghĩa là thuỷ vân không thể nhìn thấy được trong dữ liệu Hơn nữa, việc phát hiện thuỷ vân được thực hiện theo phương pháp mù, tức là không đòi hỏi dữ liệu gốc cũng như thuỷ vân gốc Đã có một số kỹ thuật thuỷ vân được phát triển để nhúng thủy vân phim, âm thanh, ảnh và dữ liệu văn bản

Trang 32

Trái lại, vấn đề thuỷ vân dữ liệu quan hệ đã không nhận được sự chú ý thích đáng Tuy nhiên, có nhiều ngữ cảnh ứng dụng trong đó dữ liệu trở nên một tài sản quan trọng, vì vậy vấn đề về quyền sở hữu phải được thực thi một cách cẩn thận Ví dụ dữ liệu về thời tiết, dữ liệu về thị trường chứng khoán, dữ liệu về hành vi của khách hàng, dữ liệu y học và khoa học Việc nhúng thuỷ vân vào dữ liệu quan hệ có thể thực hiện được bởi trong thực tế, các dữ liệu thật có thể chấp nhận một dung sai nhỏ mà vẫn không ảnh hưởng đáng kể đến giá trị sử dụng của chúng

Cho đến nay, mới có một vài cách tiếp cận đối với bài toán thuỷ vân dữ liệu quan hệ được đề xuất Tuy nhiên, những kỹ thuật này không bền vững đối với các tấn công thủy vân Đề tài này trình bày một kỹ thuật thuỷ vân cơ sở dữ liệu quan hệ có độ bền vững cao so với các kỹ thuật khác Kỹ thuật này bền vững đối với các tấn công xoá, sửa và chèn các bản ghi [1], [2], [8],[9]

Trang 33

2.2 Mô hình chi tiết hệ thống thuỷ vân cơ sở dữ liệu

Kỹ thuật tối ưu gồm hai quá trình, quá trình mã hoá và giải mã thuỷ vân Sơ đồ khối tóm tắt các thành phần chính của mô hình hệ thống thuỷ vân như sau:

Hình 2.1: Các thời kỳ mã hoá và giải mã thuỷ vân

Một bộ dữ liệu D được biến đổi thành bộ dữ liệu đã thuỷ vân DW bằng cách dùng hàm mã hoá thuỷ vân, đầu vào khoá bí mật KS chỉ được người chủ sở hữu biết, và một thuỷ vân W Thuỷ vân làm thay đổi dữ liệu Tuy nhiên, những thay đổi này được kiểm soát bằng cách sử dụng tập các ràng buộc thích hợp tham chiếu đến tập G Các ràng buộc này giới hạn lượng thay đổi để có thể thực hiện trên dữ liệu

Quá trình mã hoá thuỷ vân gồm ba bước chính sau: T*

W’ D

W

G

DwD’w S'o, ,S'm1So, ,Sm1

Phân hoạch dữ

liệu

Phân hoạch dữ

liệu Nhúng

thuỷ vân

Đánh giá ngƣỡng tối

ƣu

Kênh truyền

Giải mã ngƣỡng

Bầu chọn theo đa

số

Trang 34

Bước 1: Phân hoạch dữ liệu: dùng khoá bí mật KS , bộ dữ liệu D được chia thành m phần {So , , Sm-1 } không giao nhau

Bước 2: Nhúng thuỷ vân: Một bít thuỷ vân được nhúng vào mỗi phần bằng cách thay đổi các thống kê phân hoạch trong khi vẫn thỏa mãn các ràng buộc sử dụng trong bộ G Sự thay đổi này được thực hiện bằng cách giải bài toán tối ưu hoá có ràng buộc

Bước 3: Đánh giá ngưỡng tối ưu: các thống kê bit nhúng được sử dụng để tính toán ngưỡng tối ưu T* - ngưỡng làm cực tiểu hoá khả năng ( xác suất ) xảy ra lỗi giải mã

Bộ dữ liệu đã nhúng thuỷ vân DW được chuyển đi qua các kênh truyền và do đó có thể chịu những tấn công có chủ đích hoặc không có chủ đích nhằm phá huỷ thông tin thuỷ vân Chú ý rằng những tấn công có chủ đích có thể được thực hiện mà không cần bất cứ sự hiểu biết gì về khoá bí mật KShoặc bộ dữ liệu D

Giải mã thuỷ vân là quá trình lấy ra thuỷ vân đã nhúng từ bộ dữ liệu đã nhúng thuỷ vân DW, sử dụng khoá bí mật KS và ngưỡng tối ưu T* Thuật toán giải mã này không rõ ràng bởi bộ dữ liệu gốc D không yêu cầu giải mã thành công thuỷ vân đã nhúng

Quá trình giải mã thuỷ vân được chia thành ba bước chính sau:

Bước 1: Phân hoạch bộ dữ liệu: sử dụng thuật toán phân hoạch dữ liệu đã dùng trong phần mã hoá trên, sinh ra các phân vùng dữ liệu

Bước 2: Giải mã ngưỡng: Các thống kê của mỗi phân vùng được đánh giá và bit đã nhúng được giải mã bằng cách dùng lược đồ giải mã ngưỡng dựa trên ngưỡng tối ưu T*

Ngày đăng: 07/11/2012, 09:16

Hình ảnh liên quan

BẢNG CÁC TỪ VIẾT TẮT - Thủy vân cơ sở dữ liệu quan hệ dựa trên kỹ thuật tối ưu hoá áp dụng thuật toán tìm kiếm theo mẫu
BẢNG CÁC TỪ VIẾT TẮT Xem tại trang 10 của tài liệu.
Hình 1.1. Sơ đồ biểu diễn quá trình giấu tin - Thủy vân cơ sở dữ liệu quan hệ dựa trên kỹ thuật tối ưu hoá áp dụng thuật toán tìm kiếm theo mẫu

Hình 1.1..

Sơ đồ biểu diễn quá trình giấu tin Xem tại trang 19 của tài liệu.
Do kỹ thuật giấu thông tin số mới được hình thành trong thời gian gần đây  nên  xu  hướng  phát  triển  chưa  ổn định - Thủy vân cơ sở dữ liệu quan hệ dựa trên kỹ thuật tối ưu hoá áp dụng thuật toán tìm kiếm theo mẫu

o.

kỹ thuật giấu thông tin số mới được hình thành trong thời gian gần đây nên xu hướng phát triển chưa ổn định Xem tại trang 20 của tài liệu.
1.2.3. Mô hình hệ thống tổng quát quá trình nhúng và khôi phục thuỷ vân   - Thủy vân cơ sở dữ liệu quan hệ dựa trên kỹ thuật tối ưu hoá áp dụng thuật toán tìm kiếm theo mẫu

1.2.3..

Mô hình hệ thống tổng quát quá trình nhúng và khôi phục thuỷ vân Xem tại trang 28 của tài liệu.
Hình 1.4. Sơ đồ nhúng thuỷ vân - Thủy vân cơ sở dữ liệu quan hệ dựa trên kỹ thuật tối ưu hoá áp dụng thuật toán tìm kiếm theo mẫu

Hình 1.4..

Sơ đồ nhúng thuỷ vân Xem tại trang 28 của tài liệu.
2.2. Mô hình chi tiết hệ thống thuỷ vân cơ sở dữ liệu - Thủy vân cơ sở dữ liệu quan hệ dựa trên kỹ thuật tối ưu hoá áp dụng thuật toán tìm kiếm theo mẫu

2.2..

Mô hình chi tiết hệ thống thuỷ vân cơ sở dữ liệu Xem tại trang 33 của tài liệu.
Hình 2.2. Bảng biểu diễn các ký hiệu sử dụng trong thuật toán - Thủy vân cơ sở dữ liệu quan hệ dựa trên kỹ thuật tối ưu hoá áp dụng thuật toán tìm kiếm theo mẫu

Hình 2.2..

Bảng biểu diễn các ký hiệu sử dụng trong thuật toán Xem tại trang 37 của tài liệu.
Hình 2.4. Biểu diễn Sigmoid(α,τ ) tại τ =0 và α= {1,2, 8}. - Thủy vân cơ sở dữ liệu quan hệ dựa trên kỹ thuật tối ưu hoá áp dụng thuật toán tìm kiếm theo mẫu

Hình 2.4..

Biểu diễn Sigmoid(α,τ ) tại τ =0 và α= {1,2, 8} Xem tại trang 44 của tài liệu.
Hình 3.1 Bảng thống kê kết quả thử nghiệm - Thủy vân cơ sở dữ liệu quan hệ dựa trên kỹ thuật tối ưu hoá áp dụng thuật toán tìm kiếm theo mẫu

Hình 3.1.

Bảng thống kê kết quả thử nghiệm Xem tại trang 57 của tài liệu.
Hình 3.1. Sơ đồ hoạt động của MAC - Thủy vân cơ sở dữ liệu quan hệ dựa trên kỹ thuật tối ưu hoá áp dụng thuật toán tìm kiếm theo mẫu

Hình 3.1..

Sơ đồ hoạt động của MAC Xem tại trang 61 của tài liệu.
Hình 3.2. Mô tả quá trình xác thực thông tin bằng MAC - Thủy vân cơ sở dữ liệu quan hệ dựa trên kỹ thuật tối ưu hoá áp dụng thuật toán tìm kiếm theo mẫu

Hình 3.2..

Mô tả quá trình xác thực thông tin bằng MAC Xem tại trang 62 của tài liệu.
Hình 3.3. Biểu diễn hàm băm - Thủy vân cơ sở dữ liệu quan hệ dựa trên kỹ thuật tối ưu hoá áp dụng thuật toán tìm kiếm theo mẫu

Hình 3.3..

Biểu diễn hàm băm Xem tại trang 65 của tài liệu.