3.1. Kỹ thuật Watermarking trên dữ liệu đa phƣơng tiện trên thế giới và ở Việt Nam và ở Việt Nam
Hiện nay ngoài mật mã học, kỹ thuật giấu tin và phát hiện thông tin là một lĩnh vực mới đƣợc tập trung nghiên cứu trong những năm gần đây. Trên thế giới cho đến nay đã có nhiều cơng trình nghiên cứu vấn đề này và đang trở thành một hƣớng đi mới trong lĩnh vực An tồn thơng tin, chống giả mạo. Ở Việt Nam có nhiều các
trung tâm nghiên cứu nhƣ Viện Công nghệ thông tin – Viện Khoa Học và Công Nghệ Việt Nam, trƣờng Đại học Công nghệ - Đại Học Quốc Gia, Trƣờng Đại học Bách Khoa thành phố Hồ Chí Minh, Trƣờng Đại Học Khoa học Tự nhiên - Đại Học Quốc Gia - thành phố Hồ Chí Minh, . .
Các thành tựu đạt đƣợc trong lĩnh vực nghiên cứu này đã bắt đầu áp dụng hiệu quả nhằm mục đích bảo vệ bản quyền tác giả, chống sao chép, phân tán trái phép
các sản phẩm trong mơi trƣờng số hố và nhiều mục đích khác. Có rất nhiều ứng dụng về giấu tin nhƣ: giấu tin trong dữ liệu đa phƣơng tiện, giấu tin trong ảnh, giấu tin trong văn bản, giấu tin trong cơ sở dữ liệu quan hệ, giấu tin trong thẻ nhƣ HTML, XML, XHTML, . . .
Gần đây, một phƣơng pháp mới đƣợc nhiều nhà khoa học quan tâm nghiên cứu đó là, nhúng các thơng tin mật vào các đối tƣợng dữ liệu khác (phƣơng tiện chứa) nhƣ ảnh, video, audio, ... rồi sử dụng chính các phƣơng tiện chứa đó để làm
thơng tin mật để trao đổi thông tin với nhau.
3.2. Kỹ thuật Watermarking trên dữ liệu trên văn bản trên thế giới và ở Việt Nam Việt Nam
Giấu tin trong ảnh là một bộ phận chiếm tỷ lệ lớn nhất trong các chƣơng trình ứng dụng, các phần mềm, hệ thống giấu tin trong dữ liệu đa phƣơng tiện bởi lƣợng thông tin đƣợc trao đổi bằng ảnh là rất lớn. Hơn nữa, giấu thông tin trong ảnh cũng đóng vai trị hết sức quan trọng trong hầu hết các ứng dụng bảo vệ an tồn thơng tin nhƣ: xác định xuyên tạc thông tin, bảo vệ bản quyền tác giả, điều khiển truy nhập,
giấu thông tin mật… Thông tin sẽ đƣợc giấu cùng với dữ liệu ảnh,chất lƣợng ảnh ít thay đổi và chẳng ai biết đƣợc đằng sau ảnh đó mang những thơng tin có ý nghĩa.
Năm 2000, Yu –Yuan Chen , Hsiang – Kuang Pan và Yu–Chee Tseng ở khoa Khoa học máy tính trƣờng Đại học Trung tâm quốc gia Đài Loan (Yu-Yuan Chen, Hsiang-Kuang Pan, and Yu-Chee Tseng, “A Secure Data Hiding Scheme for Two-
Color Images”, in IEEE Symp. on Computers and Communications, 2000) đã đƣa
ra hai phƣơng pháp nhúng dữ liệu bằng cách thay thế các bit trong dữ liệu ảnh, đó là: Phƣơng pháp nhúng dữ liệu vào các khối, mỗi khối chứa tối đa một bit dữ liệu và Phƣơng pháp nhúng dữ liệu vào các khối, mỗi khối chứa tối đa hai bit dữ liệu, cả hai phƣơng pháp đều sử dụng ảnh nhị phân làm đối tƣợng nhúng.
Năm 2007, Nguyễn Văn Tảo (Khoa Công nghệ thông tin - ĐH Thái Nguyên), đã đƣa ra “Một thuật toán giấu tin và áp dụng giấu tin mật trong ảnh” (đăng trên Tạp chí khoa học và cơng nghệ, số 4 (44) Tập 2/ năm 2007), Bài báo đã đề xuất một thuật tốn giấu tin mật cho phép giấu một lƣợng thơng tin khá lớn mà phải thay đổi rất ít giá trị dữ liệu gốc.
Tháng 10/2008, Đào Thanh Tĩnh, Tống Minh Đức, đã đăng trên tạp chí Các
cơng trình nghiên cứu khoa học, nghiên cứu triển khai CNTT-TT, Số 20, “Một cải
tiến thuật toán giấu tin trong ảnh nhị phân”, nghiên cứu trên cơ sở phát triển ý
tƣởng của nhóm M.Y. WU và J.H. LEE, các tác giả Y.Y. Chen, H. Pan, Y. Tseng (CPT) đề xuất một phƣơng pháp giấu thông tin trong ảnh nhị phân, theo đó, ảnh đƣợc phân hoạch thành nhiều khối có cùng kích thƣớc m×n. Với mỗi khối dữ liệu ảnh có thể giấu đƣợc tối đa r bit thơng tin.
Tháng 4 – 2009, Trần Quang Sơn, Nguyễn Văn Tảo (Khoa Công nghệ thông tin - ĐH Thái Nguyên), đã đƣa ra “Một thuật toán giấu tin trong ảnh có bảng màu
và áp dụng giấu tin mật trong ảnh GIF” (đăng trên Tạp chí khoa học và cơng nghệ,
số 52(4): 52 - 55 / tháng 4-2009), Bài báo đề xuất một thuật toán giấu tin mật trong ảnh có bảng màu với một sự thay đổi cảm nhận về ảnh là ít nhất.
Năm 2010, Hồ Thị Hƣơng Thơm (Khoa công nghệ thông tin, Trƣờng Đại học dân lập Hải Phòng), Hồ Văn Canh (Cục kỹ thuật nghiệp vụ I - Bộ Công An, Hà Nội), Trịnh Nhật Tiến (Trƣờng Đại học Công nghệ, Đại học Quốc gia Hà Nội, Hà
Nội), đã đăng trên Tạp chí Khoa học ĐHQGHN, Khoa học Tự nhiên và Cơng nghệ 26 (2010) 261-267, cơng trình nghiên cứu “Phát hiện ảnh giấu tin sử dụng kỹ thuật
giấu thuận nghịch dựa trên dịch chuyển Histogram”, dựa trên đề xuất kỹ thuật giấu
thuận nghịch (HKC) của Wen-Chung Kuo, Yan-Hung Lin, “On the Security of Reversible Data Hiding Based-on Histogram Shift”, ICICIC 2008, ISSN/ISBN 9780-769531618 (2008) pp. 174-177. Cải tiến phƣơng pháp giấu của Ni (NSAS) dựa trên dịch chuyển histogram của ảnh.
3.2.1. Kỹ thuật Watermarking trên dữ liệu trên văn bản trên thế giới thế giới
3.2.1.1. Watermarking trực tiếp trên văn bản
Năm 1996 W. Bender, D. Gruhl, N. Morimoto, A. Lu, đã đƣa ra kỹ thuật Watermarking trên dữ liệu trên văn bản (W. Bender, D. Gruhl, N. Morimoto, A. Lu. “Techniques for data hiding”. ISSN:0018-8670, IBM Systems Journal, 1996)
Kỹ thuật watermarking liệu trực tiếp trên văn bản chƣa định dạng (ở dạng plain text) thực hiện bằng cách sử dụng một số phƣơng pháp giấu tin trong văn bản, phƣơng pháp watermarking trực tiếp trên văn bản bao gồm 3 nhóm phƣơng pháp:
a. Phương pháp khoảng trắng mở (open space methods): nhúng thông tin
bản quyền thông qua việc thao tác trên các khoảng trống giữa các từ trong câu.
Trong phƣơng pháp khoảng trắng mở lại có ba phƣơng pháp nhỏ:
- Phương pháp nhúng thông tin bản quyền vào các khoảng trống giữa các câu: mã hóa một chuỗi nhị phân vào văn bản bằng cách đặt một
hay hai khoảng trắng sau mỗi ký tự kết thúc câu.
- Phương pháp nhúng thông tin bản quyền vào các khoảng trống sau mỗi dịng: dữ liệu mã hóa cho phép xác định số khoảng trắng sau mỗi
dòng.
- Phương pháp nhúng thông tin bản quyền vào các khoảng trống giữa các từ trong câu: phƣơng pháp này cho kết quả vài bit trên một dòng.
b. Phương pháp cú pháp (syntactic methods) - nhúng thông tin dựa vào các dấu câu: Trong nhiều tình huống sau khi mã hoá, văn bản có số lƣợng
dấu câu nhiều hay có dấu câu sai, nhƣng lại khơng ảnh hƣởng lớn đến ngữ nghĩa trong văn bản. Phƣơng pháp này rất khó bị phá hủy nhƣng việc hiện thực khó khăn do phải làm thủ cơng bằng sức ngƣời là chính. c. Phương pháp ngữ nghĩa (semantic methods) - nhúng thông tin dựa trên
việc thao tác trên chính các từ trong văn bản: Phƣơng pháp này cũng
tƣơng tự nhƣ phƣơng pháp cú pháp. Phƣơng pháp ngữ nghĩa dùng giá trị chính hay phụ đồng nghĩa.
3.2.1.2. Watermarking trên văn bản đã định dạng
Năm 2003 M. Arnold, M. Schmucker, S. D. Wolthusen đã đƣa ra kỹ thuật Watermarking trên dữ liệu trên văn bản (M. Arnold, M. Schmucker, S. D. Wolthusen. “Techniques and Applicaitons of Digital Watermaking and
Content Protection”. ISBN 1-50853-111-3, Artech House, 2003)
Dữ liệu ở một định dạng nhất định nhƣ: PDF, PostScript, RTF, …. Thông thƣờng thông tin bản quyền đƣợc nhúng dựa trên đặc điểm vị trí hiển thị các ký tự trong văn bản. Có thể thực hiện nhúng thơng tin bằng cách dịch chuyển hàng, dịch chuyển từ hoặc dịch chuyển từng ký tự trong văn bản. - Phương pháp dịch chuyển hàng: dịch chuyển một số hàng trong văn bản
lên trên hoặc xuống dƣới một khoảng cách rất nhỏ, ngƣời đọc không thể phát hiện đƣợc. Thông tin đánh dấu bản quyền đƣợc giấu vào khoảng trống dịch chuyển.
- Phương pháp dịch chuyển từ: dịch chuyển một số từ trong văn bản sang
trái hoặc sang phái một khoảng cách rất nhỏ. Thông tin đánh dấu bản bản quyền đƣợc giấu vào khoảng trống dịch chuyển.
- Phương pháp dịch chuyển từng ký tự trong văn bản: dịch chuyển một số
ký tự trong các từ những khoảng cách rất nhỏ. Thông tin đánh dấu bản bản quyền đƣợc giấu vào khoảng trống dịch chuyển.
3.2.1.3. Watermarking trên tập tin hình ảnh quét từ văn bản
Năm 2006 R. Villán, S. Voloshynovskiy, O. Koval, J.E. Vila-Forcén, E. Topak, F. Deguillaume, Y. Rytsar, T. Pun đã đƣa ra kỹ thuật Watermarking trên tập tin hình ảnh quét từ văn bản (R. Villán, S. Voloshynovskiy, O. Koval, J.E. Vila-Forcén, E. Topak, F. Deguillaume, Y. Rytsar, T. Pun. “Text Data-Hiding for Digital and Printed Documents:
Theoretical and Practical Considerations”, Proceedings of SPIE-IS&T
Electronic Imaging, 2006)
Trƣớc tiên văn bản đƣợc quét (scan) thành các tập tin hình ảnh. Sau đó sẽ thực hiện nhúng thơng tin, phƣơng pháp này có thể sử dụng các phƣơng pháp đối với watermaking trên dữ liệu ở một định dạng nhất định. Ngồi ra, nhóm phƣơng pháp này cịn có thể thực hiện đƣợc các đặc điểm khác trên ký tự nhƣ: đặc điểm hiển thị đặc trƣng của từng ký tự, màu sắc ký tự.
- Phƣơng pháp thay đặc điểm đặc trƣng của ký tự đánh dấu bản quyền thơng qua việc thay đổi hình dạng một số ký tự trong văn bản.
- Phƣơng pháp thay đổi màu sắc ký tự thay đổi màu sắc một lƣợng nhỏ không đáng kể. Thông tin sẽ đƣợc nhúng dựa vào sự thay đổi này.
3.2.2. Watermarking trên dữ liệu trên văn bản ở Việt Nam
Năm 2007, Nguyễn Văn Đồn, ĐHQG Tp. Hồ Chí Minh - Đại học Bách Khoa, đã đƣa ra kỹ thuật ứng dụng Watermarking để bảo vệ bảo vệ bản quyền cho luận án tốt nghiệp của sinh viên khoa Công nghệ thông tin (Van Doan Nguyen, Tran Khanh Dang, Son Nguyen Thanh: “A Novel
Approach to Digital Watermarking for Vietnamese Documents”, Special
Issue of Science & Technology Journal, Vietnam National University-Ho Chi Minh City, ISSN 1859-0128, Vol. 10, No. 13, pp. 31-41, 2007). Dựa trên đặc điểm của tiếng việt, Nguyễn Văn Đoàn đã đƣa ra phƣơng pháp dịch chuyển dấu tiếng việt để nhúng thông tin bản quyển để bảo vệ các luận văn cho sinh viên khoa Công nghệ thông tin tại trƣờng.