Ẩn dữ liệu trên âm thanh số
Trang 1TRNG I H C KHOA H C T NHIÊN TP H CHÍ MINHKHOA CÔNG NGH THÔNG TIN
KHÓA LU N T T NGHI P
N D LI U TRÊNÂM THANH S
Giáo viên hng d n: Ti n s Lê Hoài B c
Sinh viên th c hi n: L u Khoa MSSV: 0112099Lê Th Hoàng Ngân MSSV: 0112060
Thành ph H Chí Minh 7/2005
Trang 23.1.3 Mô hình t ng quát c a bài toán 23
3.1.4 Các yêu c u trong m t bài toán n d li u 25
Trang 3c l c
3.6.7 nh h ng c a nhi u tr ng trong truy n thông 102
3.6.8 nh h ng c a nhi u Jammer trong truy n thông 103
Trang 4Danh sách hình v
DANH SÁCH HÌNH V
Hình 1 Mô hình ân d li u trên nh 21
Hình 2 Mô hình t ng quan quá trình nhúng 24
Hình 3 Mô hình t ng quan quá trình trích .24
Hình 4 M i t ng quan gi a ba tiêu chí 26
Hình 5 Phân lo i n d li u theo Chen.LongJi 28
Hình 6 Phân lo i n d li u theo De Vlccschouwer 29
Hình 7 Phân lo i n d li u theo B.Pflizmann 29
Hình 8 Bài toán ng i tù 32
Hình 9 Phân lo i Steganography theo B.Pflizmann 34
Hình 10 n d li u theo Linguistic Steganography 35
Hình 11 Phân lo i theo Neil F.Johnson và Stefan C.Katzenbeisser 35
Hình 19 Mô hình rút trích Nonblind Watermarking 48
Hình 20 Mô hình rút trích Semiblind Watermarking 49
Hình 21 Mô hình rút trích Semiblind Watermarking 49
Hình 22 Phân lo i trên s c n thi t c a khóa .49
Hình 23 Phân lo i Watermarking trên Audio 52
Hình 24 Ý t ng c a ph ng pháp tr i ph truy n th ng .55
Hình 25 Ti n x lý tín hi u âm thanh Watermark .56
Hình 26 n d li u theo ph ng pháp echo .62
Trang 5Danh sách hình v
Hình 27 u ch nh t l th i gian trong Watermarking .64
Hình 28 Hình v minh ho cho sóng c a m t tín hi u .65
Hình 29 Nhi u phân b u 66
Hình 30 Nhi u phân b Guassian .66
Trang 6Hình 61 th ng truy n thông tr i ph cô b n 103
Hình 62 t Jammer toàn ph n b ng thông 105
Hình 77 Liên h gi a t n s và Bark hai d ng: tuy n tính (a) và logarithm (b) 124
Hình 78 ng cong ng ng ng y trang theo n v Barks 125
Hình 79 Công su t ph và n ng l ng critical band 126
Hình 80 Các ng tr i ph c a tín hi u nhi u trong b ng thông h p 126
Hình 81 Hàm tr i 127
Hình 82 ng l ng trên m i critical band 127
Trang 7Danh sách hình v
Hình 83 Ng ng ng y trang thô Traw 129
Hình 84 Ng ng ng y trang ã chu n hóa và ng ng nghe 129
Hình 85 ng h p thu t toán t o và nhúng Watermark 132
Hình 86 ng h p quá trình t o ng ng chu n hoá 132
Hình 96 ng l ng trên m i critical band Spz(z) 140
Hình 97 ng l ng trên m i critical band 141
Hình 98 Hàm tr i B(z) 141
Hình 99 ng l ng tr i trên m i critical band Smz(z) 141
Hình 100 Ng ng ng y trang thô Traw(z) 143
Hình 101 Ng ng ng y trang ã c chu n hoá Tnorm(z) 143
Hình 102 Tín hi u Xwnew(j ) tr c khi c t 144
Hình 103 Tín hi u Xwnew(j ) tr c sau c t v i A = 0.4 145
Hình 104 Công su t ph tín hi u Swnew(j ) v i ng ng ng y trang cu i 145
Hình 105 Công su t ph tín hi u Xfinal(j ) v i ng ng ng y trang cu i 146
Hình 106 Công su t ph tín hi u OUT(j )) v i ng ng ng y trang cu i 146
Hình 107 Sóng c a det(t) 149
Hình 108 Gi i tr i tín hi u Watermark 150
Hình 109 Mô hình bài toán 151
Hình 110 ng t hóa x v i giá tr l ng t có b c l ng t /2 153
Trang 8Danh sách hình v
Hình 111 Hai hàm chung b nh danh m 154
Hình 112 ng t hóa ch m c QIM ng v i N = 2 và R = ½ 155
Hình 113 Mô hình không gian nhúng c a LBM 157
Hình 114 Nhúng m t bit b ng hàm nhúng m t chi u theo LBM 157
Hình 115 Nhúng m t bit b ng hàm nhúng m t chi u theo LBM 157
Hình 116 Gi i thu t nhúng Watermark theo ph ng pháp u ch dither 160
Trang 9ng 4 Th ng kê k t qu rút trích Watermark khi ch a b t n công 168
ng 5 Th ng kê k t qu rút trích Watermark khi ã b t n công 168
Trang 10BPSK Binary Phase Shift Keying: u ch khoá chuy n pha c s hai.CDMA Code Divesion Multiple Access: a thâm nh p phân chia theo mã.DS Direct Sequence: Chu i tr c ti p.
DS/SS Direct Sequence/ Spread Spectrum: Tr i ph chu i tr c ti p.PDF Probability Density Function: Hàm m t xác su t.
PSD Probability Spectral Density: M t công su t.PN Pseudo Noise: Gi t p âm.
QPSK Quandrature Phase Shift Keying: u ch khóa chuy n pha vuông góc.SNR Signal to Noise Ratio: T s tín hi u trên t p âm.
SS Spread Spectrum: Tr i Ph Robust Tính b n v ng.
Trang 11Tóm t t lu n v n
TÓM T T LU N V Nn nghiên c u
Nghiên c u các khía c nh có trong l nh v c n d li u i sâu vào phân tích,ánh giá các k thu t thu c hai h ng phát tri n chính là Steganography vàWatermarking Trên c s ó, xây d ng hai ph ng pháp ang c ánh giá cao hi nnay trong l nh v c Watermarking trên âm thanh s
ng ti p c n
Tìm hi u nh ng khái ni m c b n v n d li u.Các mô hình phân lo i cho bài toán n d li u.Xác nh các yêu c u c a bài toán n d li u.Phân tích các khía c nh có trong Steganography.Phân tích các khía c nh có trong Watermarking.
Các c m có trong Watermarking trên âm thanh s Nghiên c u ki n th c x lý tín hi u s
Nghiên c u k thu t tr i ph trong công ngh truy n thông CMDA.Xây d ng ng d ng Watermarking trên âm thanh s v i hai thu t toán:
• Thu t toán 1: S d ng mô hình thính giác k t h p k thu t công ngh tr iph ng d ng này c hoàn t t thông qua ba giai n chính:
o Giai n 1: Xây d ng mô hình thính giác.ü li u nh p: Tín hi u ch a.
ü li u xu t: Ng ng nghe t ng ng.
ü lý: Chia tín hi u thành nhi u n, xác nh giá tr n ng l ng
critical band trên t ng n, ng ng ng y trang c t o ra b ng cácht h p các giá tr trên và hàm tr i.
o Giai n 2: T o Watermark thông qua k t h p ng ng nghe.ü li u nh p: Thông tin m t.
ü li u xu t: Watermark.
Trang 12Tóm t t lu n v n
ü lý: Thao tác chu n hoá Watermark c ti n hành thông ma tr nInterleaver và b u bi n BPSK K t h p tín hi u t o ra t quá trình tr iph v i v i ng ng nghe t o Watermark
Trang 13Ch ng 1 - M U
Trang 14Ch ng 1 - M U
1.1 Nhu c u n d li u hi n nay
phát tri n m nh m c a Internet cùng v i cu c cách m ng thông tin s ãem l i nh ng b c phát tri n v t b c trong xã h i, vai trò c a nó ã v t ra kh iph m vi kinh t và d n i vào cu c s ng nh m t nhu c u thi t y u Truy n thông b ngn r ng cùng v i các nh d ng d li u s phong phú hi n nay ã m ra nhi u c h ivà không ít thách th c Các thi t b s (camera s , CD, MP3, DVD, ) ngày càng hi ni và giá thành ngày m t r , u này cho phép ng i dùng có th d dàng t o, ch nha hay trao i d li u a truy n thông.
Bên c nh nh ng tác d ng tích c c, ta c ng không th ph nh n nh ng v n n ny sinh trong th c t : gi m o, n c p tác ph m, s d ng các tác ph m không b nquy n, Các thao tác này c th c hi n r t d dàng trên d ng d li u a truy nthông s thông qua Internet hay các thi t b s Theo s li u th ng kê c a hi p h i b nquy n th gi i - International Intellectual Property Alliance (IIPA) [1], vào n m 1998,i M , ngành công nghi p nh ng ã b th t thu 1.3 t ô la và ngành công nghi pnh c và thu âm ã b m t 1.7 t ô la và con s này m i n m m t gia t ng.
ng 1 Tình hình th t thu các nc ông Nam Á [1]
Trang 15Ch ng 1 - M U
Tr c tình tr ng này, r t nhi u gi i pháp khác nhau c a ra N u ch sng các k thu t b o v n gi n nh nhúng thông tin b n quy n vào vùng khônggian còn tr ng c a ph n header thì hoàn toàn không kh quan, do thông tin này r t d
thay i hay xoá b i v i các ph ng pháp mã hoá b ng khoá m t, thì có th antoàn h n Tuy nhiên trong tình hình hi n nay thì hi u qu c a chúng em l i không caoi l khoá có th b , nh t là trong nh ng n m g n ây trình khoá a cáchacker ngày càng phá tri n, v n ch là th i gian [2] N u không xét kh n ng c a cáchacker thì mã hoá c ng không ph i là gi i pháp t t B i vì m t khách hàng ch c n trphí b n quy n m t l n cho tác gi , sau ó h có th gi mã, ti n hành sao chép, t o ranhi u b n sao, và phân ph i m t cách tho mái [3] B o v quy n s h u trí tu i v icác s n ph m a truy n thông hi n nay ang là bài toán khó mà c th gi i ang ph i
i m t, và ang trên ng tìm l i gi i.
Trong tình hình ó, n d li u s ra i nh m t c u cánh C ch ho t nga ph ng pháp này là nhúng m t d u hi u s mang thông tin v quy n s h u vàotrong tín hi u g c này, sao cho không th c m nh n c thay i trên tín hi u g c ó.Thông tin n có th là m t n v n b n, m t nh nh , m t logo, ho c m t tín hi u âmthanh, Hi n nay, có r t nhi u h ng phát tri n khác nhau, và ng v i m i h ng
ng có r t nhi u ph ng pháp khác nhau, tu thu c vào m c ích s d ng.
1.2.c tiêu c a tài
So v i các lo i truy n thông s d ng tín hi u t ng t tr c ây nh b ngcatset, b ng video, nh, thì l i ích c a truy n thông s ngày nay mang l i l n h nt nhi u: dung l ng l n, mang chuy n d dàng, thao tác x lý n gi n Tuy nhiênây c ng chính là m h n n vi ph m b n quy n t n công Trong các ph ng ti ngi i trí s ang t n t i n c ta hi n nay nh game, hình nh, phim, thì có l âmthanh c xem là m t hình th c gi i trí thông d ng và g n g i nh t.
Do ó chúng em ã m nh d n t p trung th c hi n tài n d li u trên âmthanh s nh m nghiên c u, tìm hi u, ánh giá và phân lo i các k thu t hi n có trong
Trang 16Ch ng 1 - M U
th gi i n d li u y ti m n ng và thách th c này Trên c s nh ng ki n th c ã có,chúng em ti n hành xây d ng ng d ng Watermarking trên âm thanh s T l i khuyêna nh ng chuyên gia u ngành trong l nh v c này, chúng em ti n hành nghiên c u,xây d ng m t vài ng d ng có th ph c v th c t v i hi u qu cao.
1.3 Yêu c u
m rõ các khía c nh có trong n d li u, c bi t i sâu vào nghiên c u haing phát tri n chính là Steganography và Watermarking.
Phân tích u khuy t m c a các ph ng pháp hi n có.Nghiên c u các ki n th c v x lý tín hi u s
Nghiên c u k thu t Tr i Ph trong công ngh truy n thông CDMA.Nghiên c u cách th c xây d ng mô hình thính giác.
Ch ng 2: T NG QUÁT Phân tích, ánh giá các h ng nghiên c u ã có ara nh ng thành t u ã t c và nh ng khuy t m còn t n t i Trên c s ó ra
t h ng ti p c n m i, và nh ng v n t p trung gi i quy t.Ch ng 3: C S LÝ THUY T N i dung bao g m:
• NG QUAN N D LI U: Cung c p các ki n th c n n t ng giúp ng ic có c cái nhìn khái quát v v n nghiên c u.
• NG QUAN V STEGANOGRAPHY: Nghiên c u v các khía c nh cótrong Steganography.
Trang 17• WATERMARKING TRÊN AUDIO B NG PH NG PHÁP L NG THÓA CH M C: S d ng ph ng pháp l ng t hóa ch m c n d li u.Ch ng 5: SO SÁNH, ÁNH GIÁ K T QU : So sánh, ánh giá k t qu th chi n c v i các ph n m m hi n có.
Ch ng 6: H NG PHÁT TRI N: ánh giá v h ng phát tri n c a v n ang nghiên c u này.
Trang 18Ch ng 2 - T NG QUAN
Trang 19Ch ng 2 - T NG QUAN
Theo các ghi chép tìm c hi n nay cho th y, n d li u không ph i là m t l nhc nghiên c u m i m Tuy nhiên vai trò c a nó ch m i c bi t n r ng rãi trongnh ng n m g n ây Cho t i th i m hi n t i, n d li u nói chung và Watermarkingnói riêng v n ang trên ng phát tri n và t ng b c hoàn thi n V i ch ng ngphát tri n không dài nh ng nó ã c s quan tâm c a khá nhi u t ch c cùng nhi unhà nghiên c u Bên c nh nh ng thành công áng c ghi nh n, chúng ta c ng khôngth ph nh n nh ng khuy t m mà l nh v c khoa h c non tr này m c ph i.
Nói t i thành công, u tiên chúng ta ph i k n s tham gia ngày m t ôngo c a các nhà nghiên c u và các t ch c khoa h c u này c th hi n qua s
ng các t ch c, các nhà nghiên c u khoa h c, các bài báo, t p chí và s n ph m angcó trong th tr ng [Xem tham kh o ph n ph l c trang 170], ti p n là các ngng trong th c t và nh ng l i ích không nh mà nó em l i c bi t trong ngànhcông nghi p gi i trí.
Do ang trên con ng hoàn thi n, nên l nh v c nghiên c u này còn t n t it s thi u sót:
• Khuy t m c a h u h t các công trình nghiên c u hi n nay là ch a có m tcông trình nghiên c u nào t c s hoàn thi n, ngh a là ch a có m tthu t toán nào c coi là t i u có th áp ng c t t c các yêu c ut ra, c ng nh ch a có m t thu t toán nào m nh ch ng l i t t c cácn công c a tác nhân th ba.
• c dù hi n nay, các h ng nghiên c u ang chuy n d n sang l nh v c âmthanh, nh ng s l ng công trình nghiên c u (tính t i th i m hi n t i)Watermarking trên âm thanh còn quá ít so v i Watermarking trên nh.
Trang 20Ch ng 3 - C S LÝ THUY T
Trang 21• Nhúng d li u (hay còn g i là mã hoá).
• Rút trích d li u (hay còn g i là gi i mã).Ví d
Và thông p c n chuy n tài là Pershing sails for NY June 1
Trang 22Là thông tin nhúng vào i t ng ch a, và là thông tin c n c b o v Tutheo t ng ph ng pháp c th , thông tin này s c b o v v i các m c khác nhau.
c m
o nh d ng: Không gi i h n v ki u nh d ng.
o Kích th c: ây là m t trong các y u t chính c n ph i c xem xéttr c khi quy t nh s d ng ph ng pháp nào Tu thu c vào yêu c u b o m tvà l nh v c ng d ng mà kích th c c a nó s khác nhau.
3.1.2.2.i tng ch ac m
Là i t ng dùng ch a thông p m t i t ng này còn c g i làCover <data type>, tu thu c vào lo i d li u mà nó s có các tên khác nhau Ví d :Cover Image, Cover Audio, Cover Text,
c m
o nh d ng: Các ph ng pháp n thông tin ngày nay h u h t u h trnh d ng d li u s , nên i t ng ch a th ng có chung c m là
o Kích th c: Tu m c yêu c u nh ng h u h t các ph ng pháp u òii kích th c i t ng ch a l n h n nhi u l n kích th c thông tin m t.
Trang 23Ch ng 3 - C S LÝ THUY T
3.1.2.3.i tng ã nhúngnh ngh a
Là i t ng ch a sau khi nhúng thông tin m t, còn c g i Stego <datatype>, v i data type t ng ng v i ki u d li u c a i t ng ch a Ví d , n u ing ch a là nh (Cover Image) thì i t ng ã nhúng là Stego Image M t s tàili u còn g i i t ng ã nhúng là i t ng ã ánh d u.
c m
o Kích th c: Thông th ng kích th c c a i t ng này b ng kích th ca i t ng ch a.
o Ch t l ng: B thay i so v i i t ng g c Tuy nhiên m c thay itu thu c vào yêu c u và m c ích và ph ng pháp ti n hành.
3.1.2.4.Khoá m tnh ngh a
Là khóa tham gia vào quá trình quá trình nhúng, tu theo t ng thu t toán màkhoá này có tham gia hay không i t ng này còn có tên g i khác là Stego Key.
c m
o Kích th c: Chi u dài c a khoá tu thu c vào các thu t toán t o khoá.o c yêu c u: Tu thu c vào thu t toán n thông tin mà khoá này cóth ch dùng trong m t giai n mã hoá, hay có th dùng trong c hai giai nmã hoá và gi i mã.
3.1.3.Mô hình t ng quát c a bài toán
Mô hình chung cho bài toán n d li u bao g m hai quá trình: quá trình nhúngvà quá trình rút trích.Tùy theo quan ni m và k thu t ti n hành (Steganography hayWatermarking) mà ký hi u có th khác, nhìn chung m t mô hình t ng quát có th mô
nh sau:
Trang 24Ch ng 3 - C S LÝ THUY T
3.1.3.1.Quá trình nhúngMô hình
Hình 2 Mô hình t ng quan quá trình nhúng.
Di n gi i
Công th c cho mô hình nhúng: I+M+K I
th ng s d ng m t ho c nhi u khóa K, tu vào m c ng d ng.
Trang 25Công th c chung: I’ + K N i dung W.
3.1.4.Các yêu c u trong m t bài toán n d li u3.1.4.1.Tính b n v ng (tính m nh m )
Th hi n kh n ng ít thay i tr c các t n công bên ngoài nh : thay i tínhch t (thay i t n s l y m u, s bit l y m u, thay i l n biên ) i v i tínhi u âm thanh, các phép bi n i affine (d ch, quay, t l ), thay i ch t l ng nh(thay i h màu) i v i tín hi u nh, chuy n i nh d ng d li u (JPG BMP,GIF PCX,WAV PM3, MPG AVI ) Hi n nay ch a có ph ng pháp nào cóth m b o c tính ch t này m t cách tuy t i.
i t ng ng d ng c th , m c yêu c u c a tính ch t này th hi n khác nhau.Ví d :
Trong watermaking d v ch c n thay i nh trên i t ng ch a c ng có thlàm cho i t ng thông tin m t b hu Thông th ng thì m c yêu c u tính ch tnày trong các ng d ng Watermarking cao h n các ng d ng n d li u khác.
3.1.4.2.Kh n ng không b phát hi n
Tính ch t này th hi n kh n ng khó b phát hi n, ngh a là khó xác nh m ti t ng có ch a thông tin m t hay không nâng cao kh n ng này, h u h t cácph ng pháp n d li u d a trên c m c a hai h tri giác ng i: h th giác (HVS)và h thính giác (HAS) ây là hai c quan ch y u c dùng ánh giá ch t l ng
a m t tín hi u.
Kh n ng khó b phát hi n tín hi u m t ph thu c vào hai y u t sau:
• thu t nhúng: D li u c nhúng ph i phù h p v i i t ng ch a và
Trang 26Ch ng 3 - C S LÝ THUY T
trong l nh v c n d li u, ng i th c hi n ph i có ki n th c v các lo i nhng t p tin Vì có th v i cùng m t thông tin m t nh ng nó s r t khó bphát trên i t ng A, nh ng l i quá d th y khi nhúng vào i t ng B.
• Kinh nghi m c a k t n công: n u nh k t n công có nhi u kinh nghi m thìkh n ng phát hi n ra m t i t ng ch a có ch a thông tin m t là khôngquá khó.
3.1.4.3.Kh n ng l u tr
Kh n ng này th hi n l ng thông tin c a thông p m t có th nhúng trongi t ng ch a Do tính b o m t nên kh n ng l u tr luôn b h n ch Do ó trongtr ng h p mu n n m t thông tin có kích th c t ng i l n, ta th ng chia nh rathành nhi u ph n và th c hi n nhúng t ng ph n.
Trong th c t , khi quy t nh ch n ph ng pháp nhúng nào, ta th ng l y batiêu chí trên làm c s Tu thu c vào t ng ng d ng mà ng i ta s u tiên cho tiêuchu n nào h n Có th minh h a tiêu chí trên nh sau:
Hình 4 M i tng quan gi a ba tiêu chí.
Ngoài ra, nâng cao hi u qu , ng i ta còn xem xét m t s yêu c u khác.
3.1.4.4.Kh n ng vô hình
Tu theo m c ích s d ng, m c yêu c u v tính ch t này khác nhau.
• ng d ng Steganography: thông tin m t c d u ph i tuy t i bí m t, khió tiêu chí này c chú ý nhi u.
Trang 27Ch ng 3 - C S LÝ THUY T
• ng d ng Watermarking: trong m t s ng d ng, ng i dùng có th c(th y) thông tin Watermark nh ng không ch nh s a c, ho c có nh ng
ng d ng thông tin Watermark c gi bí m t.
3.1.4.5.Tính ch c ch n
Tính ch t này khá quan tr ng trong khi ch ng nh n b n quy n, xác th c, Trong th c t tiêu chí này c t n ng trong các k thu t gán nhãn th i gian.
3.1.4.6.Tính b o m t
Có nhi u c p b o m t khác nhau, nh ng nhìn chung có hai c p chính:
• Ng i dùng hoàn toàn không bi t s t n t i c a thông tin m t.
• Ng i dùng bi t có thông tin m t, nh ng ph i có khoá khi truy c p.
Trang 28Ch ng 3 - C S LÝ THUY T
n d li u g c
Không c n d li u g c
ChcYêu c u d li u
Ch xác nh n có/khôngm nh n thông
tin m t
Thu t toánNhúng/Trích
Riêng t (Private)Bán riêng t (Semi-Private)Bán công khai (Semi-Public)
Công khai (Public)
n v ng (Robust) v (Fragile)Bán d v (Semi-Fragile)Thu t toán
n d li u
Hình 5 Phân lo i n d li u theo Chen.LongJi.
3.1.5.2.Phân lo i theo De VlccschouwerMô hình
Mô hình này do De Vlccschouwer xu t, và c xem là mô hình phân lo iph bi n [7].
Trang 29Ch ng 3 - C S LÝ THUY T
Hình 6 Phân lo i n d li u theo De Vlccschouwer.
3.1.5.3.Phân lo i theo B.PflizmannMô hình
ây là m t trong nh ng mô hình phân lo i ra i s m nh t do B.Pflizmann xu t, và c nhi u tác gi s d ng [6, 8].
Hình 7 Phân lo i n d li u theo B.Pflizmann.
Trang 30n ch các ch ng trình này.
• Anonymity
Là ph ng pháp dùng gi u n i dung meta c a thông p nh thông tin vng i g i và ng i nh n thông p Chaum a ra khái ni m nhà phân ph i b uph m n c danh hay khái ni m m gi l trình (onion routing) do Goldschlag,Reed và Syverson xu t Ý t ng nh sau: ng i c a m t thông p có th blàm m b ng m t t p các nhà phân ph i b u ph m hay m t t p các b nh tuy n óngvai trò là các tr m trung gian, và v i u ki n các tr m trung gian này không thôngng, c u k t v i nhau Tuy nhiên k t qu c a quá trình m hoá này ph thu c r tnhi u vào v n bên nào s b m hoá (bên g i, bên nh n, hay c hai bên) Ngàynay i v i các ng d ng Web thì quá trình m hóa t p trung bên nh n, trong khing i s d ng email l i quan tâm t i s m hoá bên g i.
• Steganegraphy
ây là m t nhánh quan tr ng trong l nh v c n thông tin N u cryptography t ptrung vào v n b o v n i dung thông p thì Steganography l i nghiên c u khíanh làm th nào có th che d u c s t n t i c a các thông p này Quan ni m nàyxu t phát t tác ph m steganographia (Trithemius 1462-1516) c a Hy L p có ngh ach vi t c che d (covered writing), và th ng c hi u là m t ph ng phápu thông tin này trong m t thông tin khác M t vài các ng d ng khác ã c sng tr c ây nh là vi c d u thông tin m t vào trong các bài báo thông qua hìnhth c s d ng m c in vô hình g i cho các p viên ho c là s d ng k thu t t oti ng vang (echo) a thông tin vào trong các m u audio.
Trang 31Ch ng 3 - C S LÝ THUY T
• Watermarking
i th c nh tranh v i Steganography trong l nh v c n thông tin làWatermarking Trong h th ng Watermarking, thông tin Watermark không nh t thi t làph i n, u này còn tu thu c vào lo i ng d ng và m c ích s d ng Watermark s
u hình (nhìn th y c) c b t ngu n t Watermark trên gi y xu t hi n t th kth 13 Các ng d ng c a Watermark h u hình th ng xu t hi n trong các logo c acông ty hay d i d ng các ch ký.
• Robust Copyright Marking
Trái ng c v i Fragile Watermarking, trong Robust Copyright Watermarking,thông tin m t r t khó b phá hu u này có ngh a là n u k t n công oán bi t ctrong d li u có thông tin m t thì vi c phá hu thông tin này c ng r t khó và m t khiphá c nó thì toàn b d li u ch a còn l i c ng s không còn giá tr ng d ng d ngnày th ng r i vào các tr ng h p b o v b n quy n h p pháp.
• FingerPrinting
FingerPrinting ngh a là Watermarking vào i t ng ch a các thông tin xu t x ,thông tin xác nh n khách hàng ng d ng này dùng dò v t khách hành và các b nsao Fingerprinting th ng c dùng xây d ng các ng d ng xác nh tính h ppháp c a các b n sao d li u c phân ph i riêng l Ph ng pháp này r t h u íchkhi c n truy tìm hay theo dõi ng c các b n sao d li u c pháp hành, t ng t nh
serial c a các ph n m m Ngoài ra nó còn giúp ch ng l i các d ng t n công d ing thông ng gi a nh ng ng i dùng v i nhau, các Watermark c thi t k nh mch ng l i thông ng, c u k t.
• Visible Watermarking
tên g i ta có th bi t c ây là nh ng m u quan sát gi ng nh kí hi u logoc chèn vào nh, t ng t các Watermark c dùng trên gi y Các Watermark nhìnth y c áp d ng ch y u trong nh và video, ví d nh ánh d u ký hi u hình nhtrong c s d li u hình, hay dùng trong Web ch ng l i vi c th ng m i hóa hình nh.
Trang 32Ch ng 3 - C S LÝ THUY T
3.2.NG QUAN V STEGANOGRAPHY
3.2.1.Mô hình bài toán
Mô hình kinh n s d ng giao ti p n c Simmons gi i thi u u tiên b ngbài toán mang tên bài toán ng i tù [9] Hai nhân v t Alice và Bob do ph m t i nênã b b t, và b giam trong hai phòng khác nhau H lên k ho ch v t ng c, nh ngkhông may, m i s liên l c gi a h u do m t nhân v t cai ng c mang tên Wendyki m soát N u bà ta có nghi ng nào trong vi c liên l c gi a h , thì ngay l p t c bà ta giam h vào phòng bi t giam, m i thông tin liên l c gi a h s b c t, và k ho cha h s b phá s n Do ó, h ph i tìm cách trao i thông tin ng m bà qu n ng ckhó tính không nghi ng H thi t l p m t kênh truy n ng m Gi i pháp c a h a ralà n n i dung thông tin c n trao i vào m t thông tin bình th ng khác Ví d , Bob m t b c tranh m t con bò xanh ang n m trên cánh ng c và g i b c tranh ó choAlice, và dùng màu s c c a b c tranh th hi n n i dung trao i Nh ng Wendy skhông nghi ng gì v b c tranh và màu s c c a nó.
Trong bài vi t này ta gi s trong phòng giam c a Alice và Bob u có máytính, và có th trao i thông p cho nhau b ng nhi u nh d ng khác nhau (v n b n,
nh s , âm thanh s , ).
Hình 8 Bài toán ngi tù.
ho ch v t ng c g p m t s khó kh n: n u Wendy thay i thông p màBod g i cho Alice Ví d , bà ta thay i màu c a con bò thành màu , khi ó n i dungthông p mu n truy n t i s b sai, d n n hành ng sai N u hi m c h n, bà tacó th gi m o thông p và g i nó b ng kênh truy n ng m.
Trang 33i dung mu n trao i C ng i g i l n ng i nh n ph i óng vai trò c a ng i chng, b ng l n k t n công.
Các ghi chép u tiên v Steganography ã c ghi m t nhà s h c Hy L p làHerodotus ghi chép l i M t trong nh ng câu chuy n k n i ti ng khi nói t i l nh v cnày là câu chuy n k v tên b o chúa Histiaeus Trong su t th k th 5 tr c công
nguyên (486-425 B.C), tên này b vua Darius giam c m t i nhà tù Susa Trong th i
gian này ông ta ã c g ng liên l c v i con r c a mình là Aristagoras th c hi nc âm m u này thì Histiaeus ã c o u m t tên nô l và x m lên ó n i thông pn chuy n và khi tóc m c lên thì anh này c a t i Aristagoras Ph ng pháp nàyn c các p viên c s d ng vào u th k 20 [13].
Gi i pháp nhúng thông tin m t vào các b c nh c khám phá và phát tri nu tiên vào nh ng n m 1860, do m t nhi p nh gia ng i Pháp tên Dragon th c hi n.Trong th i k di n ra cu c chi n Pháp-Ph (1870-1871), n c Pháp b bao vây, traoi thông tin v i bên ngoài ng i ta ã d u thông tin m t vào trong các n phim nh(microfilm ) r i nh b câu a tin Các phim siêu hi n vi (microscopic) c dùng nhúng thông tin và d u vào trong các b ph n nh : tai, m i hay móng tay, móng chân
ng c s d ng trong su t th i k chi n tranh Nga-Nh t (1905) Trong th i kchi n tranh th gi i th I, tài li u c trao i gi a các p viên c d u d i cácsiêu d u ch m (microdot).
Trang 34Theo B.Pflizmann, các h ng phát tri n trong Steganography c phân chia:
Hình 9 Phân lo i Steganography theo B.Pflizmann.
Phân tích
• Techinical Steganography.
Techinical Steganography liên quan t i vi c s d ng các ph ng pháp v t lýhay hoá h c che gi u thông tin m t Ví d : ph ng pháp s d ng m c không màu,ph ng pháp microdot [18, 19] Các ph ng pháp này ã c s d ng r t lâu và hi nnay h u nh không còn c s d ng.
• Linguistic Steganography
Các ph ng pháp thu c lo i visual semagrams th ng s d ng các th c th v tlý, n i dung thông p m t th ng c th hi n qua ý ngh a c a các i t ng này.
Trang 35Ch ng 3 - C S LÝ THUY T
Ví d : s d ng v trí c a các quân c trên bàn c ho c v m t con ng i trong các tth khác nhau và m i t th ng v i m t ý nh a riêng nh hình v [20].
Hình 10 n d li u theo Linguistic Steganography
Trong khi ó, các ph ng pháp trong nhóm text semagrams n i dung thông tin
t c n ch a thông qua các hi n th c a v n b n M t s k thu t thu c lo i nàycó th áp d ng cho c v n b n vi t tay và v n b n in Ví d thay i kho ng cách gi acác ký t [21].
Ngoài ra, các ph ng pháp thu c phân nhóm jargon code th ng nhúng n idung thông p vào trong nh ng tín hi u có công su t l n, và nh th thông tin n skhông b phát hi n [22].
3.2.3.2.Phân lo i theo Neil F.Johnson và Stefan C.KatzenbeisserMô hình
Phân lo i d a trên s thay i c a i t ng ch a sau khi nhúng thông tin m t.
Hình 11 Phân lo i theo Neil F.Johnson và Stefan C.Katzenbeisser
Trang 36Ch ng 3 - C S LÝ THUY T
thông p n vào trong các thành ph n ít quan tr ng nh t c a i t ng ch a Ng inh n ch l y c n i dung thông khi bi t c v trí các bit ã nhúng S khác nhaua các ph ng pháp c xây d ng trong h th ng này c ng nh s khác bi t v tínhrobust c a các ph ng pháp chính là s khác nhau trong cách th c ch n v trí nhúng.Sau ây là ph n li t kê m t vài ph ng pháp khác nhau.
o Thay th bit ít quan tr ng nh t (LSB)
Cài t thu t toánNhúng:
Trang 372 ( )
l m l mp
Ph ng pháp này ch áp d ng cho nh, do Kurak xu t vào 1992 [26].
Image downloading là m t tr ng h p c bi t c a h th ng thay th , trong ónh óng vai trò v a là i t ng ch a v a là thông p m t.
i m t nh ch a (cover imge) và m t nh m t (secret image) cùng chi u ara, bên phía g i s thay th b n bit ít quan tr ng nh t c a i t ng ch a b ng b n bitquan tr ng nh t c a secret image Sau ó, bên nh n l y ti p b n bit ít quan tr ng nh t
secret image và nh th là bên nh n có c t t c các bit c a secret image.Ph ng pháp này c ng d ng trong các h thông b o m t a t ng Trong ócác ch th là các ti n trình và ng i dùng, còn các khách th là các t p tin, CSDL, ,
và chúng c k t h p v i m t m c b o m t nào ó.o Nhúng vào các vùng ch a
l c
Trang 38Ch ng 3 - C S LÝ THUY T
o ng t hoá (quantization) và dithering
ng l ng c a m i pixel c d oán theo n ng l ng c a các pixel lân c n
và có th là hàm tuy n tính hay không tuy n tính khác bi t gi a các pixel c thhi n thông qua công th c:∆ =iQ x( i −xi−1).
nhúng bit th i c a thông p m t vào trong tín hi u ch a, ta s tính i N u
nó không phù h p v i ng tính toán bí m , thì i s thay thj g n nh t mà t i v
trí này bit k t h p b ng v i bit thông p m t ng tính toán bí m c t o theo
khoá k nh m ch nh cách k t h p gi a các bit trong thông p v i i t ng ch a.
ng 2 B ng tính toán m t.
(Xem thêm ph n 3.8)
o n d ng ph n không gian d th a trong h th ng máy tính.
Ph ng pháp này t n d ng vùng không gian không s d ng trong máy l uthông tin Ví d nh d i HDH Windows 95, các a c nh d ng theo FAT 16không nén, và kích th c c a các cluster là 32 KB có ngh a là n u nh m t t p tin ph iu ít nh t 32 KB N u nh t p tin ch có 1KB thì nó c ng ph i thêm vào 31 KB tr ng có th ch a trong vùng 32 KB và nh th thì chúng ta hoàn toàn có th l u thông tinvào các vùng tr ng này Ngoài ra các kho ng tr ng khác c ng không c dùng nhheader file c a nh hay âm thanh c ng có th c t n d ng l u thông tin.
Trang 39Ch ng 3 - C S LÝ THUY T
Các ph ng pháp bi n i trên mi n c ti n hành b ng cách d u thông tint vào trong các vùng quan tr ng c a i t ng ch a nh vùng nén, vùng xén, Vi c này s làm t ng tính b n v ng c a thông p n tr c các thao tác x lý, ngth i không gây nghi ng vì ít nh y c m v i h th ng giác quan c a ng i Các ph ngpháp c s d ng trong các phép bi n i trên mi n bao g m: phép bi n i Cosin r i
c (DCT), bi n i Fourier r i r c (DFT), bi n i Wavelet r i r c (DWT), o n d li u trên mi n bi n i
i các ph ng pháp d ng LSB nh trên, ta có th nhúng thông tin d dàng,nh ng chúng r t d b phá v khi có nh ng thay i nh
Có m t m c l u ý t r t s m khi phát tri n các h th ng Steganography làthông tin nhúng trong các tín hi u trên mi n t n s s b n v ng h n thông tin cnhúng trên mi n th i gian H u h t các h th ng Steganography b n v ng ngày nay
u th c hi n trên m t mi n bi n i nào ó.
Các ph ng pháp bi n i theo mi n d u thông p vào trong các vùng có ýngh a, sao cho các vùng ó có th b n v ng h n so v i LSB tr c các t n công nh :nén, xén, và m t vài phép x lý khác Tuy nhiên, song song v i tính b n v ng ó,ph ng pháp này c ng ph i m b o tính vô hình Có r t nhi u ph ng pháp bi n imi n, trong ó có m t s ph ng pháp s d ng phép bi n i Cosine r i r c (DCT)[27-29] nhúng thông tin vào i t ng ch a, m t s khác thì s d ng các phép bi ni Wavelet Các phép bi n i này có th áp d ng trên toàn b i t ng ch a[27],
hay t ng block nh riêng l Tuy nhiên, ph i có s cân b ng gi a s l ng thông tinc nhúng vào nh và b n v ng c a nó.
Tr c khi tìm hi u m t s ph ng pháp, ta cùng xem l i các phép bi n iCosine và Fourier, ph ng pháp này có th dùng ánh x m t tính hi u sang mi n t n Phép bi n i Fourier r i r c (DFT) c a m t dãy s có chi u dài N c nh ngh a:
2( ){ }( ) exp()
trong ó i= −1 là n v o Phép bi n i Fourier ng c nh sau:
Trang 40Ch ng 3 - C S LÝ THUY T
2( ){ }( ) exp()
c khai thác trong các h th ng nén âm thanh s
Trong mã hoá pha, m i d li u c coi là m t d ch pha (phase shift) trong ph
pha c a tín hi u sóng mang Xét tín hi u sóng mang c, cc chia thành N ph n nh ,i ph n ci(n) có chi u dài là l(m).Áp d ng phép bi n i Fourier.
l n tín hi u c khai tri n d i d ng Fourier:
Re[ { }( )]
ii