Chương 2: MỘT SỐ KỸ THUẬT BẢO VỆ BẢN QUYỀN BẢN ĐỒ VỚI THỦY VÂN SỐ
2.1. Cơ sở thủy vân dữ liệu bản đồ vectơ
2.1.1. Đặc điểm riêng của bản đồ vectơ
Để đánh d u thủy vân cho bản đồ vectơ số, một số các đặc điểm riêng của bản đồ vectơ nên đƣợc quan tâm [8]. Trên cơ sở đó xây dựng đƣợc c u trúc dữ liệu đặc biệt và môi trường ứng dụng của bản đồ vectơ số. Kết quả là có sự khác biệt r n t giữa thủy vân đa phương tiện nói chung và thủy vân bản đồ vectơ số nói riêng ở r t nhiều phương thức gi u và tách dữ liệu, tiêu chuẩn của việc ước lượng ch t lượng dữ liệu, phương thức có thể gi u tin …
Dữ liệu bản đồ vectơ
Như đã mô tả trong ở trên, dữ liệu ảnh vectơ là sự biên soạn thông thường của không gian dữ liệu, tập hợp dữ liệu và thêm vào một vài dữ liệu đƣợc sử dụng nhƣ chỉ số, sự mô tả. Mô tả không gian dữ liệu, các vùng địa lý của bản đồ đối tƣợng mô tả đối tƣợng địa lý trong thế giới thực, bao gồm 3 đối tƣợng địa lý cơ bản là điểm,
đường và đa giác. T t cả các đối tượng bản đồ này đều được định dạng bởi các đỉnh có thứ tự. Không gian dữ liệu là một chuỗi thực sự các tọa độ của những đỉnh cơ sở này trong một hệ thống địa lý.
Tập hợp dữ liệu mô tả thuộc tính của đối tƣợng bản đồ nhƣ tên, loại, và một vài thông tin khác. Những thông tin đƣợc ghi lại bởi tập hợp dữ liệu r t quan trọng và không thể thay đổi tùy tiện, tương tự cho những dữ liệu được thêm vào đã kể ra ở trên. Với t t cả các thuật toán thủy vân bản đồ v ctơ đã đƣợc đề xu t, không gian để đóng d u thủy vân đƣợc quy định bởi không gian dữ liệu nhƣ tọa độ của các đỉnh.
Một bản đồ vectơ b t k đều có một dung sai r ràng, chúng đƣa ra độ rộng tối đa cho sự làm m o tọa độ cho ph p để đảm bảo không làm suy giảm ch t lƣợng của bản đồ.
Dung sai r của dữ liệu bản đồ vectơ dịch chuyển nhƣ là “Mô hình che phủ trực quan” bên trong ảnh thủy vân số đƣa ra một chút dƣ thừa cho việc gi u thông tin thường lệ.
Độ chính xác của bản đồ véc tơ
Nguồn gốc chung của thủy vân số là sự xắp xếp có hệ thống, là sự đƣa vào những mẩu tin ẩn có thể không làm ảnh hưởng đến ch t lượng của dữ liệu. Trong không gian thủy vân, độ chính xác giới hạn thường được sử dụng để đo ch t lượng của dữ liệu. Tuy nhiên, tùy theo các kiểu dữ liệu khác nhau và cách sử dụng riêng của chúng, độ chính xác giới hạn có thể có những ý nghĩa khác. Đối với ảnh số (ảnh bitmap), các đoạn phim, âm thanh, và các tập hợp dữ liệu đa phương tiện khác, người sử dụng hướng vào dữ liệu là các cảm nhận thông qua những bộ phận giác quan của con người. Trong giác quan này, mắt người có thể được dùng để đo độ chính xác của ảnh. Nếu như mắt người không thể phân biệt được sự khác biệt của hai ảnh, hai ảnh đó có thể đƣợc coi nhƣ có giá trị sử dụng nhƣ nhau, cụ thể là có độ chính xác cao. Nói chung, một vài thông số chính xác nhƣ PSNR hoặc MSE … đƣợc dùng để đo sự khác biệt của 2 tập hợp dữ liệu.
Tuy nhiên để đánh giá ch t lượng của dữ liệu ảnh vectơ, con người không thể cảm nhận được và PSNR cũng không thể là đơn vị đo thích hợp. Đầu tiên, người sử dụng hướng vào ảnh vectơ không phải là các bộ phận giác quan của con người mà
là máy tính. Trong một t lệ đặc trƣng, thậm chí hai bản đồ số khá giống nhau khi nhìn bằng mắt thì vẫn tồn tại những tọa độ khác nhau giữa hai bản đồ đó có thể vƣợt quá dung sai cho phép. Thứ hai, giới hạn PSNR chủ yếu là phản hồi lại năng lƣợng của các lỗi. Nó sẽ thích hợp hơn để đánh giá ảnh, nhƣng ngƣợc lại đối với ảnh vectơ bởi vì thậm chí cả với một PSNR cao của bản đồ vectơ không thể đảm bảo chính xác những đỉnh lỗi thì có giá trị nhỏ trong dung sai của bản đồ.
Thêm vào đó, khi chúng ta đánh giá độ chính xác của bản đồ vectơ, một vài nhân tố có thể đƣợc l y ra nhƣ độ n t và hình dạng của các đối tƣợng bản đồ, để đánh d u thủy vân cho bản đồ số thực sự là một công việc hết sức v t vả. PSNR không thể khôi phục lại sự bóp m o chi tiết về độ n t của hai bản đồ vectơ đó.
Trong một lĩnh vực khác, một bản đồ với độ chính xác th p cũng có thể có PSNR cao. Hiện tại, vẫn chƣa có đơn vị đo phù hợp cho độ chính xác của bản đồ vectơ sau khi thủy vân.
2.1.2. Các kiểu tấn công trên bản đồ vectơ
Một t n công thành công nghĩa là d u thủy vân có thể đƣợc gỡ bỏ khỏi dữ liệu phủ trong khi giá trị của dữ liệu phủ đƣợc bảo toàn. Dữ liệu không gian của các bản đồ vectơ thực tế là một chuỗi dữ liệu d u ch m động với một độ chính xác nào đó.
Do vậy, các kiểu và các đặc tính của các t n công với thủy vân bản đồ vectơ cũng có một số khác biệt so với thủy vân dữ liệu đa phương tiện nói chung. Chúng ta xem x t ở đây một số kiểu t n công điển hình.
Các tấn công hình học
Một số ph p biến đổi hình học nhƣ là sự dịch (translation), quay (rotation), và t lệ (hay co giãn, scaling) là các dạng chính của các t n công hình học. Đối với thủy vân ảnh số, các t n công hình học là r t khó chống đỡ bởi vì các biến đổi này luôn làm cho việc nội suy của các giá trị pixel là một quá trình không thuận nghịch và luôn gây ra sự m t mát thông tin. Tuy nhiên, đối với các bản đồ vectơ, các t n công kể trên thực tế là các biến đổi tọa độ mà trong đó hầu nhƣ không có thông tin bị m t mát. Vì thế các t n công hình học có thể đƣợc phòng chống dễ dàng trong các lƣợc đồ thủy vân bản đồ vectơ.
Tấn công đỉnh
T n công đỉnh nghĩa là các t n công vào c p độ đỉnh, bao gồm các thao tác sau:
- Thêm vào bản đồ các đỉnh mới (nhƣ ph p nội suy), hoặc
- Gỡ bỏ các đỉnh khỏi bản đồ (lƣợc bỏ - đơn giản hóa hoặc cắt x n).
Các t n công như vậy, đặc biệt là ph p lược bỏ và cắt x n luôn ảnh hưởng trầm trọng tới bản đồ vectơ đƣợc nhúng thủy vân. Mặt khác, lƣợc giản bản đồ cũng là một thao tác thường gặp trong các ứng dụng để làm tăng cường tốc độ hiển thị dữ liệu bản đồ. Do vậy, khả năng chống đƣợc sự lƣợc giản bản đồ là r t quan trọng đối với một lƣợc đồ thủy vân bền vững.
Sắp xếp lại đối tƣợng
Đây là một kiểu t n công vào mức độ đối tƣợng. Dữ liệu không gian của một bản đồ vectơ đƣợc soạn gồm nhiều tọa độ đƣợc sắp xếp của các đỉnh để biểu diễn được các đối tượng bản đồ. T t cả các đối tượng được lưu trữ trong file bản đồ theo một thứ tự nào đó. Khi sắp xếp lại các đối tƣợng trong bản đồ hoặc sắp xếp lại các đỉnh bên trong một đối tƣợng thì có thể sinh ra một file bản đồ mới mà không làm giảm giá trị của độ chính xác dữ liệu. Đối với một số lƣợc đồ thủy vân mà phụ thuộc vào vị trí của các đối tƣợng thì thao tác này sẽ có tác động r t lớn đến dữ liệu đƣợc nhúng thủy vân.
Nhiễu bóp méo
Có hai nguồn gốc chính có thể sinh ra các nhiễu cho các bản đồ vectơ số. Thứ nhất là một số loại các thao tác hàng ngày. Ví dụ, trong thế giới GIS có một vài kiểu định dạng file dữ liệu phổ biến. Sự biến đổi giữa những định dạng đó có thể làm dữ liệu bị bóp m o (xuyên tạc – distortion) một chút. Thứ hai là một t n công có chủ ý.
Kẻ t n công cố gắng phá hủy thủy vân bằng cách thêm nhiễu vào các tập dữ liệu.
Nhiễu bóp m o là một kiểu t n công nghiêm trọng nhưng nó thường không là một lựa chọn tốt của kẻ muốn t n công bởi vì khi bị tác động bởi nhiễu thì có thể độ chính xác của bản đồ sẽ bị suy giảm đi, tức là giá trị bản đồ cũng không đƣợc đảm bảo.
2.1.3. Các hướng tiếp cận thủy vân bản đồ vectơ số
Đã có nhiều kết quả đã đƣợc nghiên cứu về thủy vân bản đồ vectơ [2][3][6][8][10][11]. Theo các vị trí mà thủy vân được nhúng, các phương pháp hiện tại có đƣợc cho thủy vân bản đồ vectơ có thể đƣợc phân thành các loại sau: các thuật toán trong miền không gian, các thuật toán trong miền biến đổi nhƣ biến đổi Fourier rời rạc DFT, biến đổi cosine rời rạc DCT, và một số phương pháp thủy vân áp dụng cho các mô hình 3D. Không giống như các kiểu dữ liệu đa phương tiện nói chung, thủy vân bản đồ vectơ có một số đặc trƣng khác biệt do c u trúc dữ liệu đặc biệt và các môi trường ứng dụng của dữ liệu bản đồ.
2.1.3.1. Thủ vân trong miền không gian
Thủy vân một bản đồ số trong miền không gian nghĩa là nhúng thủy vân bằng cách thay đổi trực tiếp các giá trị tọa độ của các điểm [9]. Một số đặc trƣng không gian của các đỉnh có thể đƣợc dùng để nhúng dữ liệu, ví dụ nhƣ quan hệ lân cận của các đỉnh, các đặc trƣng thống kê của các tọa độ, v.v.
M. Sakamoto đã đề xu t một lƣợc đồ thủy vân dựa trên sự thay đổi quan hệ lân cận của các đỉnh. Thuật toán này dễ vỡ với sự t n công làm nhiễu. Một thuật toán cải tiến được đề xu t bởi Hwan Kang vào năm 2001. Trước tiên, bản đồ gốc đƣợc phân vùng thành các khối. Trong mỗi khối có một mặt nạ với kích cỡ định sẵn, việc chọn cỡ mặt nạ là tùy ý. Trong mỗi mặt nạ, tọa độ của đỉnh tây nam đƣợc xem nhƣ là gốc và các tọa độ của các đỉnh khác trong mặt nạ có thể đƣợc chuyển đổi thành các giá trị mới theo gốc đó. Tiếp theo, mặt nạ đƣợc chia thành nửa tam giác trên và nửa tam giác dưới bởi đường ch o nối giữa đỉnh đông nam và đỉnh tây bắc. Để nhúng một bit "1", ta dịch t t cả các đỉnh trong nửa tam giác dưới tới vị trí đối xứng của chúng trong nửa tam giác trên với đường ch o, và tương tự với chiều ngƣợc lại khi nhúng một bit "0".
Một thông số "PSNR" đƣợc tác giả dùng nhƣ là độ đo của ch t lƣợng bản đồ sau khi bị t n công làm nhiễu:
( )
(2. 1)
√∑( )
(2. 2)
trong đó là các tọa độ gốc và là các tọa độ bị nhiễu. Định nghĩa này tương tự nhƣ PSNR trên các ảnh và nó về bản ch t cũng phản ánh năng lƣợng của nhiễu.
Nói chung, độ đo này không đủ để tính toán độ chính xác của bản đồ vectơ bởi vì nó không thể cung c p một số thông tin quan trọng nhƣ là các lỗi cực đại, và hình dáng của biến dạng, v.v.
Ohbuchi trình bày một số thuật toán cho thủy vân số bản đồ vectơ 2 chiều.
Trong miền không gian, ông đề xu t lược đồ thủy vân dựa trên sự phát hiện tương quan. Một chuỗi số giả ngẫu nhiên (PRNS) đƣợc dùng để làm tăng tính bảo mật và phát hiện độ tin cậy trong lƣợc đồ. Nhƣợc điểm chính của thuật toán là là cần có bản đồ gốc trong quá trình phát hiện thủy vân và tính bền vững của thuật toán đối với một phạm vi lớn phụ thuộc vào tính hợp lệ của bản đồ gốc.
Các tác giả Micheal Voigt và Christoph Busch đã đề xu t một thuật toán có thể nhúng nhiều bit dữ liệu dựa trên chuỗi lan truyền trực tiếp và phát hiện tương quan cải tiến [8]. Một phát biểu quan trọng đƣợc xem x t trong thuật toán này là việc phát hiện tương quan tuyến tính chắc chắn yêu cầu độ dài của chuỗi số giả ngẫu nhiên phải lớn hơn bình phương của giá trị lớn nh t của dữ liệu phủ. Kết quả là dữ liệu nhúng và tách bị giới hạn tới các vị trí số thập phân xác định theo sức chịu của dữ liệu bản đồ. Micheal Voigt và Christoph Busch cũng đề xu t lƣợc đồ khác dựa trên phát hiện thống kê. Đó là một thuật toán bắt nguồn từ các nghiên cứu của họ trước đó về thủy vân lưới 3D. Đặc tính thống kê của dữ liệu bản đồ được dùng trong lƣợc đồ. Một nhƣợc điểm chính của lƣợc đồ là sự thay đổi vị trí các đỉnh không xem x t tới hình dạng của các đối tƣợng bản đồ. Do đó, lƣợc đồ không thích hợp với các bản đồ thủy vân với đối tƣợng có hình dạng trơn bởi vì ph p toán nhúng có thể phá hủy hình dạng trơn của các đối tƣợng bản đồ. Thêm vào đó, dung lƣợng nhúng của lƣợc đồ cũng bị giới hạn.
Gerrit Schulz và Michael Voigt đề xu t một lƣợc đồ có tính bền vững cao cho thủy vân số bản đồ vectơ. Trong lƣợc đồ của họ bản đồ gốc đƣợc chia thành nhiều
dải ngang hoặc dọc với một bề rộng nào đó tùy thuộc vào sai số cho ph p. Trong một dải, các đỉnh thuộc nó đƣợc trƣợt tới các vị trí đặc biệt để biểu diễn bit "1" hoặc bit "0", tức là một bit trên mỗi dải.
Tác giả López đã đề cập v n đề về bảo vệ bản quyền bản đồ vectơ theo cả hai hướng chính sách và công nghệ. Một phần mềm thương mại "MapSN" được phát triển để cung c p dịch vụ bảo vệ bản quyền cho các hãng bản đồ vectơ. Toàn bộ lƣợc đồ của họ đƣợc đăng ký sáng chế và cái ta có thể biết là thuật toán thủy vân được chọn trong lược đồ là dựa trên nội suy bản đồ, nó tương tự như là thuật toán đề xu t bởi Bill Huber. Cũng có các lược đồ tương tự khác, ví dụ như thuật toán được đề xu t bởi Kyi Tae Park dựa trên nội suy đường g p khúc và thuật toán được đề xu t bởi H. Sonnetcho thủy vân các ảnhvectơ. Ý tưởng chung của những lược đồ này là biểu diễn lại các bit thủy vân bằng cách thêm vào các đỉnh mới vào phủ của bản đồ gốc.
2.1.3.2. Thủ vân trong miền biến đổi
Tương tự như đối với các lược đồ thủy vân dữ liệu đa phương tiện số, ở đây dữ liệu đƣợc nhúng vào các tọa độ đã qua biến đổi của các tọa độ các đỉnh, thay vì nhúng trực tiếp vào dữ liệu không gian bằng cách thay đổi tọa độ gốc của các đỉnh đó.
Miền DCT
Trong một kết quả đề xu t vào năm 2004, Michael Voigt và Bian Yang thiết kế một lƣợc đồ thủy vân thuận nghịch nhúng các bit thủy vân trong miền biến đổi Cosin Rời rạc (DCT) số nguyên. Ý tưởng chính của lược đồ là dùng một đặc trưng quan trọng của dữ liệu bản đồ, đó là sự tương quan cao của các tọa độ các đỉnh. Nói chung, nhờ vào sự liên tục và dáng trơn của các đối tƣợng bản đồ, các tọa độ của các đỉnh trong một đối tượng đơn là luôn có tương quan cao với nhau. Hơn nữa, một kết quả quen thuộc rằng DCT có tính ch t n n năng lƣợng cho các dữ liệu có tương quan cao. Sau ph p DCT, năng lượng của dữ liệu biến đổi sẽ được tập trung trên DC và các hệ số tần số th p AC. Dựa trên lợi điểm của tính ch t đó, thuật toán đề xu t tổ hợp mỗi tám đỉnh vào một đơn vị và với mỗi đơn vị sẽ đƣợc nhúng một bit thủy vân đơn vào tám hệ số DCT của các điểm. Phương pháp nhúng được chọn
là thuận nghịch theo nghĩa dữ liệu bản đồ gốc có thể khôi phục không m t thông tin sau thủ tục tách thủy vân. Lƣợc đồ này có tính ch t đa bit và là có tính ẩn. Hơn nữa, nó là thuật toán đầu tiên mà lƣợc đồ thuận nghịch đƣợc giới thiệu trong thủy vân các bản đồ vectơ số. Một nhƣợc điểm của lƣợc đồ là sự làm m o cảm sinh bởi thủy vân là quá lớn, mặc dù các tác giả đã có một vài kỹ thuật bù. Hơn nữa, thuật toán cũng không chịu đƣợc các ph p đơn giản và nội suy bản đồ.
Miền DWT
Một số kết quả đã đƣợc thu đƣợc trong việc thủy vân số một bản đồ vectơ trong miền Biến đổi Wavelet Rời rạc (DWT). I. Kitamura đã áp dụng một thuật toán DWT mà trước đó được thiết kế cho thủy vân ảnh số cho việc thủy vân các bản đồ vectơ số. Li Yuanyuan đề xu t một lƣợc đồ ẩn mới nhúng nhiều bit vào một bản đồ vectơ trong miền DWT.
Trong lƣợc đồ này, biên độ của các hệ số DWT của các tọa độ đƣợc điều chỉnh để thỏa mãn một chế độ xác định để biểu diễn lại các bit thủy vân. Đó là một lƣợc đồ ẩn. Dựa trên các kết quả thực nghiệm, các tác giả chứng minh đƣợc rằng lƣợc đồ là bền vững đối với một số ph p biến đổi hình học. Khi tính toán ch t lƣợng của bản đồ được thủy vân, khả năng cảm nhận của con người và "PSNR" được chọn làm các số đo, là không đủ để tính toán cho các bản đồ vectơ. Thêm vào đó, lƣợc đồ là không bền vững đối với các t n công vào đỉnh nhƣ là đơn giản bản đồ hoặc nội suy bản đồ.
Miền DFT
Thuật toán thủy vân bản đồ vectơ trong miền DFT đƣợc đề xu t bởi I. Pitas vào năm 2000. Có ba bài báo đƣợc xu t bản tập trung vào luận án này. Một thuật toán nhúng một bit đơn vào một đường g p khúc được đề xu t trước tiên. Sau đó một lược đồ bền vững hơn nhúng một bit vào nhiều đường g p khúc được đề xu t ở đó công nghệ liên hiệp (fusion technology) đƣợc sử dụng. I. Kitamura đã có một số thay đổi để cải tiếng lƣợc đồ của Pitas.
Các tác giả N. Nikolaidis, I.Pitas, và V. Solachidis đề xu t một lƣợc đồ thủy vân ẩn vào năm 2000 để nhúng một bit đơn vào một polyline bằng cách thay đổi các