TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI VIỆN ĐÀO TẠO SAU ĐẠI HỌC TIỂU LUẬN KỸTHUẬTTRẢIPHỔ VÀ ỨNG DỤNG Đ ề t à i: THUẬTTOÁNẨNDỮLIỆUKHÔNGGIANSỬDỤNGKỸTHUẬTTRẢIPHỔ Giảng viên hướng dẫn : PGS.TS NGUYỄN HỮU TRUNG Học viên : VŨ PHI TÙNG MSHV : CB110941 Lớp : KTTT1 Hà Nội, tháng 02/2012 THUẬTTOÁNẨNDỮLIỆUKHÔNGGIANSỬDỤNG KĨ THUẬTTRẢIPHỔ A ROBUST WATERMARKING ALGORITHM FOR SPACE DATA USING SPREAD SPECTRUM TECHNIC TÓM TẮT Bài báo này trình bày về thuậttoánẩn nội dung số đối với dữliệukhônggiansửdụng phương pháp trải phổ. Một bít ẩn được nhúng bào bằng cách thay đổi mã chẵn lẻ của một vector nhiễu giả ngẫu nhiên. Thuậttoán được đưa ra để làm giảm đáng kể nhiễu ngẫu nhiên thêm vào, biến đổi tương đương, và có thể mở rộng, cắt. Một vài kết quả thí nghiệm đã được tiến hành để mô phỏng cho phương pháp này. ABSTRACT This paper proposes a digital watermarking algorithm for space data using spread spectrum technic. A watermark bit is embedded by changing a parity of the pseudo-random noise vector. The algorithm is established for robust resistance against additive random noise, similarity transformation, and vertex insertion/removal, and, to some extent, cropping. Same experimental results are expounded in order to illustrate practicability of the method. I. ĐẶT VẤN ĐỀ Nhiều phương pháp giấu thông tin đang được nghiên cứu, mỗi phương pháp có những ưu điểm, nhược điểm và ứng dụng khác nhau. Phương pháp sửdụng các bít trọng số nhỏ [4,6] đơn giản tuy nhiên thông tin giấu không bền vững trước nhiều hình thức tấn công. Phương pháp sửdụng các hệ số biến đổi (chẳng hạn biến đổi từ miền khônggian sang miền tần số như DCT [3], wavelet [2], DFT [5] .) nói chung có tính bền vững cao, tuy nhiên khá phức tạp trong cài đặt và khó kiểm soát chất lượng dữliệusửdụng làm môi trường giấu thông tin. Phương pháp gán và sửdụng thuộc tính chẵn lẻ [9] có một số ưu điểm như đơn giản trong cài đặt, dễ kiểm soát chất lượng môi trường giấu tin, có độ bền vững cao trước nhiều hình thức tấn công. Phương pháp này có hiệu quả cao khi áp dụng cho môi trường giấu tin không chịu nén tổn hao, có cho phép sai số, là môi trường đang được áp dụng rất rộng rãi hiện nay (các ảnh bitmap, các thiết kế kỹ thuật, bản đồ số 2 chiều, 3 chiều .) Trong bài này chúng tôi trình bày một phương pháp mới, có sửdụngkỹthuậttrảiphổ để giấu thông tin trong cơ sở dữliệukhônggian với mục đích tăng cường độ bền vững và độ mật của tin giấu. Mục II giới thiệu khái niệm về thông tin trải phổ, ứng dụngkỹthuậttrảiphổ trong giấu thông tin. Mục III trình bày khái niệm dữliệukhông gian, thuộc tính chẵn lẻ và khả năng mang tin giấu của dữliệukhông gian. Mục IV trình bày phương pháp giấu thông tin trảiphổ trong mô hình dữliệukhông gian. Mục V minh họa một số kết quả thử nghiệm trên môi trường bản đồ số 2D. II. KỸTHUẬT THÔNG TIN TRẢIPHỔTrảiphổ được biết đến trong kỹthuật thông tin liên lạc như một phương thức truyền tin. Đặc điểm của hệ thống truyền thông trảiphổ là độ rộng phổ của tín hiệu bị "trải" ra, lớn hơn nhiều lần so với tốc độ bit của thông tin cần truyền. Độ dư thừa của băng thông được sửdụng như một tiềm năng cho các phương pháp lập mã tự sửa sai, dẫn đến khả năng chống nhiễu cao của hệ thống thông tin trảiphổ so với các phương pháp truyền tin khác. Một thành phần quan trọng trong kỹthuật truyền tin trảiphổ chính là chuỗi giả ngẫu nhiên. Vì chuỗi này mang đặc trưng của nhiễu nên tín hiệu trảiphổ có ưu thế về độ bảo mật. Các ưu điểm trên được khai thác trong các hệ thống truyền tin trong môi trường có nhiễu và đòi hỏi tính bảo mật cao của thông tin, đặc biệt trong các hệ thống đa truy nhập như điện thoại di động, mạng truyền dữliệukhông dây. Ưu thế này đã được một số tác giả khai thác trong kỹthuật giấu thông tin trong môi trường dữliệu multimedia [1]. Vấn đề cơ bản cần giải quyết trong kỹthuật truyền thông trảiphổ là tính đồng bộ. Quá trình giải điều chế tương quan sẽ không còn ý nghĩa nếu tín hiệu thu được và chuỗi giả nhiễu không đồng bộ với nhau. Mô hình dữliệukhônggian và phương pháp giấu tin đơn giảnsửdụng thuộc tính chẵn lẻ đã được đề xuất trong [9] và được tóm tắt trong mục III. III. MÔ HÌNH DỮLIỆUKHÔNGGIAN . 1. Khái niệm về dữliệukhônggian Quy ước sửdụng các ký tự có gạch ngang trên và hai ký hiệu ζ i và ξ i (không có dấu gạch ngang trên) là các vectơ. Chỉ số dưới ký hiệu thứ tự các phần tử của một tập hợp, chỉ số trên (nếu có) là ký hiệu các thành phần của vectơ. Ta quy ước gọi cơ sở dữliệu (CSDL) mà trong đó mỗi bản ghi là một vectơ ξ thuộc khônggian n chiều R (n) (ξ Є R (n) ) là cơ sở dữliệukhông gian. Về mặt hình học, mỗi vectơ này được biểu diễn thông qua một "điểm" thuộc khônggian R (n) . Với ξ∈R (n) , ξ∈R (n) , và δ∈R, δ≥0, ta xây dựng một δ- quan hệ ( ¿ δ ¿ ) như sau: { ξ 1 δ ⇔ ξ 2 } ⇔ { ∀i=1 n; ∣ ξ 1 i ξ 2 i ∣ ≤ δ } Khi đó δ mang ý nghĩa của sai số cho phép. Ký hiệu ⟨ r ⟩ ≡⟨ ξ m ,ξ M ⟩ ≡⟨ ξ m ,ξ M =ξ m +r ⟩ là một “khối hộp” n-chiều được giới hạn bởi điểm “dưới trái” x m 1 , x m 2 ,… , x m n ξ m ¿ ) và điểm “trên phải” x M 1 , x M 2 ,…, x M n ξ M ¿ ) trong đó x M j =x m j +r j . Ta nói đỉnh ξ i ∈⟨ ξ m ,ξ M ⟩ nếu ∀j ∈{1 n}, x m j ≤ x i j ≤ x M j . Giả thiết trong khối hộp này có chứa D đỉnh (hay “node”) - là các bản ghi thuộc cơ sở dữliệukhông gian. Mục đích của chúng ta là xây dựng phương pháp giấu một bit thông tin vào khối hộp ⟨ ξ m , ξ M ⟩ nói trên, với giả thiết r j ≥ δ với mọi j ∈ {1 n}. Chia khônggian thành các “khối hộp đơn vị” như sau: Chọn giá trị σ R∈ , σ = f(K), (f là một hàm có biến phụ thuộc khoá K), σ ≤ δ. Với mọi ξ i ∈ R (n) xây dựng vector ζ i = ( ⌊ x i j σ ⌋ ) với mọi j∈{1 n} tức là ξ i ∈ Z (n) hay ξ i thuộc khônggian vectơ với các tọa độ nguyên, nói cách khác, ζ i là ảnh của ξ i khi ánh xạ ξ i vào khônggian vectơ tọa độ nguyên. Để tránh sửdụng quá nhiều ký hiệu, ta cũng quy ước dùng các cụm từ "vectơ ζ " hay "ζ " để chỉ một vectơ tọa độ nguyên và "không gian ζ " để chỉ khônggian tọa độ nguyên n-chiều. Tạo một phân hoạch của khônggian ζ : ζ= U { ζ c ,ζ l } , trong đó: - ζ ∈ { ζ c } nếu ∑ j=1 n ( ⌊ x j σ ⌋ ) là số chẵn; −ζ ∈ { ζ l } nếu ∑ j=1 n ( ⌊ x j σ ⌋ ) là số lẻ. Nhận xét: Tính chẵn lẻ của ζ thay đổi khi có một tọa độ nào đó thay đổi một đơn vị - hay một bước σ. Trường hợp tổng quát, tính chẵn lẻ của ζ thay đổi khi ζ thay đổi từ ζ 1 sang ζ 2 nếu tổng số bước thay đổi của mọi tọa độ của ζ là: Π = ∑ j=1 n ( ⌊ ∣ x 2 j − x 1 j ∣ σ ⌋ ) là một số lẻ (1) Khônggian ζ được chia thành các khối n- chiều chẵn lẻ xen kẽ nhau (theo mọi chiều của không gian). Ta gọi mỗi khối này là một khối chẵn lẻ đơn vị, hay khối hộp đơn vị, ký hiệu là ⟨ σ ⟩ . Ta quy định viết ξ i {∈ ζ l } (tương ứng ξ i {∈ ζ c } và hiểu rằng ξ i thuộc tập { ζ l } (tương ứng ξ i thuộc tập { ζ c }, với bước σ. Bằng cách này, ta đã gán cho ξ i một thuộc tính chẵn lẻ ứng với một đơn vị (hay một bước) σ. 2. Thủ tục thay đổi tính chẵn vectơ với các tọa độ nguyên ζ Ta có nhận xét sau: x k σ x k σ = min x j σ x j σ Thủ tục Parity_Change ( ξ i ,⟨ v ⟩ ) If ( ⌊ x i k ⌋ =⌊ x M k ⌋ ) then x i k ( x i k −σ ) Else: x i k ( x i k +σ ) Thủ tục này thay đổi tính chẵn lẻ của ξ i trong khi vẫn giữ cho ξ i ∈ <v> và được sửdụng trong thuậttoánẩndữliệu trình bày dưới đây. IV. KỸTHUẬT GIẤU THÔNG TIN TRẢIPHỔ TRONG CƠ SỞ DỮLIỆUKHÔNGGIAN 1.Ẩn dữliệu 1) Ký hiệu thông tin cần giấu là b, b ∈ {0,1} ; Không sợ nhầm lẫn, sửdụngký hiệu D = {i|i = 1 D} là tập các chỉ số của { ξ } ; V{ ξ i ∨ξ i ∈⟨ ξ m , ξ M ⟩ } (V là tập không có thứ tự các vectơ ξ thuộc khối r , được sửdụng làm môi trường chứa tin giấu). Giả thiết ξ i ∈ V có phân phối chuẩn, độc lập thống kê. Chọn giá trị θ ∈R thoả điều kiện: θ = l.σ; l∈ +¿ N ¿ ; θ≥2σ (2) Chọn các cạnh của khối ⟨ ξ m , ξ M ⟩ sao cho mỗi cạnh có chứa số nguyên lần các đoạn θ : ∀j = 1 n| k j = r j θ ∈ N + (3) Khi đó ta có thể chia siêu khối hộp ⟨ ξ m ,ξ M ⟩ thành K = ∏ j=1 n k j siêu khối vuông có kích thước θ. Ký hiệu siêu khối vuông này là ⟨ θ ⟩ và tập { ⟨ θ ⟩ }, i = 1 n, j = 1 k j là tập có thứ tự các siêu khối ⟨ θ ⟩ thuộc ⟨ r ⟩ . Điều kiện của l trong (2) đảm bảo cho mỗi siêu khối ⟨ θ ⟩ có chứa l n siêu khối chẵn lẻ đơn vị ⟨ σ ⟩ . Như vậy trong mỗi siêu khối ⟨ r ⟩ có chứa K khối vuông ⟨ θ ⟩ và h = K.l n khối đơn vị ⟨ σ ⟩ . 2) Dùng khoá giấu tin làm mầm (seed) để sinh một vectơ giả ngẫu nhiên w r ∈ { ¿ +¿−¿ 1 } (K) , K θ ∈ N + , K sẽ được sửdụng với vai trò của hệ số trảiphổ ở bước 3. 3) Thông tin cần giấu b được "trải phổ" thông qua phép biến đổi w m b * w r : w m = w r nếu b=1 (4) w m = - w m nếu b=0 (5) Dễ thấy w m ∈ { ¿ +¿−¿ 1 } (K) , mỗi bit thông tin đã được "trải" thành κ bit. 4) Xây dựng vector có quan hệ 1/1 với w m như sau: ∀k {1 K},∈ i∀ {1 n}, ∈ j∀ ∈ {1 k j }, θ k ≡ θ ij = w m k Bằng cách này ta đã gán cho mỗi thành phần θ k một giá trị của w m k . 5) Với ∀ ⟨ θ ⟩ ∈ ⟨ r ⟩ , tạo phân hoạch { ⟨ θ ⟩ ¿ = +¿ ⟨ θ ⟩ ¿ ¿ ⋃ −¿ ⟨ θ ⟩ ¿ ¿ . Trong đó ⟨ θ ⟩ ∈ +¿ ⟨ θ ⟩ ¿ ¿ nếu θ i = 1 và ⟨ θ ⟩ ∈ { ⟨ θ ⟩ – } nếu θ i = -1. 6) Với ∀ ⟨ θ j ⟩ ∈ ⟨ r ⟩ , ∀ ξ i ∈ ⟨ θ j ⟩ , biến đổi vector ξ i V như∈ sau: If ⟨ θ j ⟩ ∈ +¿ ⟨ θ ⟩ ¿ ¿ ∧ ξ i ∈{ ζ l ¿∨⟨ θ j ⟩ ∈ { ⟨ θ ⟩ – } ∧ ξ i ∈{ ζ c ¿: Pariy_Change( ξ i ,⟨ θ j ⟩ ) (6) Tín hiệu watermark được thành lập qua các bước 1, 2 và 3. Bước 5, 6 thực hiện giấu 1 bit thông tin vào khối ⟨ ξ m ,ξ M ⟩ . 2. Khôi phục thông tin Tại thời điểm khôi phục thông tin, ta đã có ⟨ ξ m , ξ M ⟩ , khoá K, các tham số r, θ,K. 1) Thực hiện như bước 2 của thuậttoán giấu tin ta nhận được w r ∈ { ¿ +¿−¿ 1 } (K) . 2) Gọi J = {j|j= 1 K} là tập chỉ số cho các thành phần của w r . 3) Thực hiện như bước 5 của thuậttoán giấu tin, ta nhận được phân hoạch: { ⟨ θ ⟩ ¿ = +¿ ⟨ θ ⟩ ¿ ¿ ⋃ { ⟨ θ ⟩ – } với các giá trị θ i = 1 và θ i = -1. 4) Xây dựng vector như sau: ∀ j J: θ∈ j = 1 nếu: ∃ i| ξ i ∈ +¿ ⟨ θ ⟩ ¿ ¿ ∧ ξ i ∈{ ζ c ¿∨ ξ i ∈ { ⟨ θ ⟩ – } ∧ ξ i ∈{ ζ l ¿ ; θ j = 1 nếu: ∃ i| ξ i ∈ +¿ ⟨ θ ⟩ ¿ ¿ ∧ ξ i ∈{ ζ l ¿∨ ξ i ∈ { ⟨ θ ⟩ – } ∧ ξ i ∈{ ζ c ¿ . V. KẾT QUẢ CÀI ĐẶT VÀ THỬ NGHIỆM Thuậttoán giấu thông tin trong cơ sở dữliệukhônggiansửdụng thuộc tính chẵn lẻ theo phương pháp kiểm soát độ chênh lệch số lượng các bít chẵn lẻ đã được trình bày trong [9]. Trong bài này thuậttoán giấu tin vào dữliệukhônggian có sửdụngkỹthuậttrảiphổ được đề cập với mục tiêu tăng cường độ mật của bản tin giấu đồng thời vẫn giữ được tính bền vững trước các tấn công. Thuậttoán được cài đặt và thử nghiệm trên CSDL bản đồ số tỷ lệ 1:50.000 (2D) với giả thiết các tọa độ kinh và vĩ độ được phép sai số độ dài ∆=0.025km, sai số tọa độ cho phép ∆λ, ∆ϕ được tính theo công thức (1) và (2) đã trình bày trong [9]. Lấy Δ = α.min{∆ λ ,∆ φ }với α là hệ số quyết định khả năng che giấu (undetectability) của thông tin. Thực nghiệm được tiến hành trên 10.000 mẫu giấu bit 0; 10.000 mẫu giấu bit 1 và 10.000 mẫu không giấu thông tin. Điều kiện tấn công: α=0.1; δ=1.59*10 -5 . Hình 1: Kết quả thử nghiệm trên mẫu bản đồ số tỷ lệ 1:50.000 kích thước (0.01x0.01) 0 Bước 2 trong thuậttoán giấu tin nhằm đảm bảo tính bảo mật, bước 3 đảm bảo khả năng tự sửa sai khi môi trường giấu tin bị tấn công, các bước 4 và 5 cho phép đồng bộ quá trình giấu và hồi phục thông tin - một trong những vấn đề khó khăn và quan trọng cần giải quyết trong kỹthuật truyền tin trải phổ. Khi kích thước khối tăng lên (số đỉnh khoảng 1000) lỗi bit sẽ giảm đáng kể. Hình 1 trình bày kết quả thử nghiệm với khối khônggian kích thước (0.01x0.01) độ (khoảng 1km2 trên bản đồ phẳng tỷ lệ 1:50.000), có chứa 909 đỉnh, số mẫu thử nghiệm là 10.000. Kết quả cho thấy lỗi bít trung bình không quá ba phần vạn. (0.027%) cho cả 3 trường hợp (không giấu, giấu bit 0 và giấu bit 1). VI. KẾT LUẬN Phương pháp và các kết quả thử nghiệm đã được trình bày trong bài này cho thấy giấu thông tin bền vững sửdụngkỹthuật thông tin trảiphổ trong dữliệukhônggian là phương pháp khả thi. Kết quả bài báo có thể tiếp tục được phát triển cho các ứng dụng giấu thông tin trong môi trường dữliệukhônggian nói riêng cũng như các ứng dụng giấu tin trong môi trường dữliệu số nói chung. TÀI LIỆU THAM KHẢO [1] I.J.COX ET. AL., Secure Spread Spectrum Watermarking of Images, Audio and Video, Proc IEEE International Conf on Image Processing, ICIP-96, Vol.3, pp 243-246. [2] D. KUNDUR, D. HATZINAKOS, A Robust Digital Image Watermarking Method using Wavelet-Based Fusion, Toronto, Ontario, Canada M5S 3G4. [3] DICKINSON B., TAO B., Adaptive Watermarking in DCT Domain, Proc. of IEEE International Conf. on Acoustics Speech and Signal Processing, ICASSP-97, Vol.4, pp.1985-2988, 1997. [4] MARTIN KUTTER, FREDRIC JORDAN, FRANK BOSSEN, Digital Signature of Color Images using Amplitude Modulation, 1015 Lausanne Switzerland, năm 2000. [5] M. RAMKUMAR, ALI N. AKANSU, A Robust Data Hiding Scheme for Images Using DFT, New Jersey Institute of Technology, Newark, NJ 07102. [6] R. Z. WANG, C. F. LIN, AND J. C. LIN. Image Hiding by LSB Substitution and Genetic Algorithm, Proceedings of International Symposium on Multimedia Information Processing, Chung-Li, Taiwan, R.O.C, December 1998, 671-683. . ĐÀO TẠO SAU ĐẠI HỌC TIỂU LUẬN KỸ THUẬT TRẢI PHỔ VÀ ỨNG DỤNG Đ ề t à i: THUẬT TOÁN ẨN DỮ LIỆU KHÔNG GIAN SỬ DỤNG KỸ THUẬT TRẢI PHỔ Giảng viên hướng dẫn : PGS.TS. <v> và được sử dụng trong thuật toán ẩn dữ liệu trình bày dưới đây. IV. KỸ THUẬT GIẤU THÔNG TIN TRẢI PHỔ TRONG CƠ SỞ DỮ LIỆU KHÔNG GIAN 1 .Ẩn dữ liệu 1) Ký