Ph-ơng pháp sử dụng bản sao

Một phần của tài liệu Nghiên cứu phương pháp che giấu thông tin trong tín hiệu âm thanh (Trang 44)

ý t-ởng của nhóm ph-ơng pháp này là sử dụng chính nội dung của tín hiệu gốc để biểu diễn cho thông tin đem giấu. Do vậy, chúng chống lại đ-ợc các kiểu tấn công đồng bộ hoá.

a/ Ph-ơng pháp thay thế bit ít quan trọng nhất LSB

Thuật toán sử dụng ph-ơng pháp thay thế bít ít quan trọng LSB [6] là một lựa chọn tự nhiên khi yêu cầu nhúng tin với dung l-ợng lớn, nh-ng lại kém bền vững đối với các thao tác xử lý tín hiệu. Đây là ph-ơng pháp ra đời sớm nhất và đơn giản nhất trong các kỹ thuật giấu tin hiện có. Trong LSB, bộ mã hoá sử dụng khoá mật để chọn một tập con các mẫu tín hiệu âm thanh gốc sẵn có. Thao tác thay thế các bit ít quan trọng của mẫu bằng bit tin đ-ợc thực hiện trên tập con này. Quá trình chiết rút tin mật chỉ đơn giản là đọc giá trị của các bit rồi ra quyết định. Do vậy, bộ giải mã phải cần tất cả các mẫu tín hiệu đã đánh dấu để so sánh và lựa chọn bit thích hợp. Dung l-ợng tin đem giấu trong ph-ơng pháp LSB rất cao: bit LSB của tín hiệu gốc lấy mẫu ở 44.1kHz sẽ t-ơng ứng dung l-ợng tin khoảng 44.1 kbps. Dĩ nhiên, tính bền vững của ph-ơng pháp này khá kém do khi ta chọn ngẫu nhiên bit LSB, khiến cho một phần thông tin đã mã bị mất. Bù lại, ph-ơng pháp này không phức tạp trong tính toán nên đáp ứng đ-ợc yêu cầu thời gian thực.

Để tăng dung l-ợng tin giấu có thể sử dụng nhiều bit/ mẫu để mã tin. Tuy nhiên, khi tăng dung l-ợng bit sẽ sinh thêm tạp âm Gauss. Bởi vì HAS rất nhạy cảm với các thành phần tạp âm này, do đó số l-ợng bit LSB sử dụng bị giới hạn và phải đ-ợc tính toán tr-ớc.

Trong mã LSB, ph-ơng pháp nhúng tin chia ra làm hai loại: kích th-ớc cố định và kích th-ớc thay đổi. Ph-ơng pháp đầu nhúng cùng một số l-ợng bít tin vào mỗi mẫu tín hiệu gốc, còn ph-ơng pháp thứ hai thì số l-ợng bit tin đem nhúng/ mẫu sẽ phụ thuộc vào đặc tính của tín hiệu gốc. Và đây là một h-ớng nghiên cứu vẫn còn để mở: làm thế nào để điều chỉnh đặc tính của tín hiệu gốc sao cho dung l-ợng tin giấu lớn nhất? Trong [6], Cvejic đề xuất ph-ơng pháp LSB cải tiến nhằm tăng tính bền vững của mô hình giấu tin. Tuy nhiên, ph-ơng pháp này chỉ mang tính lý thuyết.

Ph-ơng pháp mã LSB cải tiến

Trong ph-ơng pháp này sẽ dùng ba hoặc bốn bit LSB để giấu tin. Mô hình của ph-ơng pháp đ-ợc trình bày theo hình d-ới đây:

Nhỳng LSB cơ bản Thay thế MER Khuếch tỏn lỗi Tớn hiệu gốc Tin mật Tớn hiệu đỏnh dấu

Hình 2.9: Ph-ơng pháp mã LSB cải tiến

Tại b-ớc đầu tiên, nhúng bit tin vào bốn LSB của tín hiệu gốc bằng ph-ơng pháp LSB cơ bản (thay thế bốn bit LSB bằng bốn bit tin). B-ớc thứ hai thực hiện phép thay thế lỗi cực tiểu MER. ý t-ởng nh- sau: giả sử, gọi a(n) là tín hiệu gốc, s(n) là tín hiệu thu đ-ợc khi nhúng k bit LSB, s’(n) cũng tín hiệu thu đ-ợc khi chọn ngẫu nhiên giá trị của (k +1) bit LSB. Do đó, mức lỗi nhỏ nhất có thể là s(n) hoặc s’(n). Gọi e(n) là sai lệch giữa a(n) và s(n); e’(n) là sai lệch giữa a(n) và s’(n). Nếu e(n) < e’(n) thì chọn s(n) thay thế cho a(n), ng-ợc lại, chọn s’(n). Nếu sử dụng MER sẽ cho phép ta giảm lỗi nhúng tin từ 2k 1xuống còn 2k1. B-ớc thứ ba là khuếch tán lỗi nhằm làm giảm tính cảm thụ đ-ợc của tin mật đem giấu.

Nh- vậy, với ph-ơng pháp LSB cải tiến, dung l-ợng tin mật đem giấu sẽ tăng lên khoảng 1/3 trong khi vẫn không làm ảnh h-ởng đến chất l-ợng

cảm thụ tín hiệu âm thanh gốc. Ngoài ra, ta có thể đo entropy của tín hiệu và áp dụng lý thuyết truyền tin để nâng cao dung l-ợng tin đem giấu.

b/ Ph-ơng pháp tạo tiếng vang

Trong ph-ơng pháp này [13] dữ liệu đ-ợc nhúng vào tín hiệu âm thanh gốc bằng cách thêm các echo (tiếng vang) trên miền thời gian của tín hiệu gốc: ( ) ( ) ( ) x ns n s n (2.9) Tớn hiệu gốc Bit 1 Bit 0 Biờn độ echo Decay rate 1  0 1

Hình 2.10: Giấu tin theo ph-ơng pháp tạo tiếng vang

Trong mô hình đơn giản sẽ chỉ có một echo đ-ợc thêm vào nh- công thức (2.9). Tuy nhiên, với các ph-ơng pháp echo cải tiến, ta có thể thêm nhiều echo. Chuỗi thông điệp nhị phân đ-ợc nhúng vào bằng cách tạo echo tín hiệu gốc trễ một hoặc vài nhịp, 0 hay 1 mẫu. Việc chiết rút thông điệp đã giấu khi đó đ-ợc quy về việc dò tìm ra độ trễ  . Khái niệm Cepstrum sẽ đ-ợc dùng để dò tìm độ trễ  . Cepstrum thực chất là lấy Logarit của phép biến đổi Fourier rời rạc tín hiệu âm thanh. Do biên độ biểu diễn các echo t-ơng đối nhỏ so với tín hiệu gốc, nên gây rất nhiều khó khăn cho quá trình chiết rút. Để giải quyết khó khăn này, ta sử dụng ph-ơng pháp tự t-ơng đồng Cepstrum và tạo Echo hai lần nh- sau:

( ) ( ) ( ) ( )

Điều này sẽ làm giảm độ biến dạng, đồng thời làm tăng thêm độ bền vững. Giá trị  th-ờng dùng sẽ ít hơn ba hay bốn xung mẫu. Giấu thông tin bằng ph-ơng pháp echo đảm bảo tính trong suốt rất cao, và đôi khi nó còn làm cho âm thanh nghe tốt hơn.

Khuyết điểm của ph-ơng pháp này là quá trình dò tìm thông tin nhúng rất phức tạp, nhất là khi tính toán hệ số Cepstrum. Mặt khác, bất kỳ ng-ời nào, trên lý thuyết, cũng có thể dò tìm ra các echo mà không cần biết tr-ớc một thông tin nào khác. Ngoài ra, ph-ơng pháp này rất dễ bị tấn công và rất dễ bị phá vỡ.

Nhằm giảm xác suất bị tấn công, một số tác giả đã đề xuất ph-ơng pháp echo trải trên miền thời gian và ph-ơng pháp tự t-ơng quan [10]. Tuy nhiên, các ý t-ởng trên khá phức tạp và đòi hỏi kỹ thuật rất công phu khi thực hiện.

c/ Ph-ơng pháp điều chế bản sao

Điều chế bản sao là ph-ơng pháp giấu tin mới [15], bao gồm ba ph-ơng pháp chính: dịch tần số, dịch pha, và dịch biên độ.

Ph-ơng pháp dịch tần số gồm một số b-ớc chính nh- sau: biến đổi chuỗi tín hiệu biểu diễn trên miền thời gian s n( )về miền tần số, sao chép một phần nhỏ các thành phần có tần số thấp trong một khoảng xác định nào đó (ví dụ, từ 1 kHz đến 4 kHz), điều chế chúng (ví dụ, dịch đi với hệ số tỉ lệ bằng 20 Hz), thêm các giá trị đó ng-ợc trở lại vào tín hiệu gốc, và biến đổi ng-ợc về miền thời gian để tạo ra tín hiệu đánh dấu w n( ). Do các tín hiệu đ-ợc dịch chuyển và cộng trừ ngay trên miền tần số, ta gọi ph-ơng pháp này là điều chế bản sao trên miền tần số. T-ơng tự, ph-ơng pháp điều chế bản sao trên miền thời gian cũng sẽ thực hiện các thao tác này, nh-ng tiến hành trên miền thời gian. Tín hiệu sau khi đã điều chế w n( )đ-ợc gọi là một

bản sao. Bản sao này có thể đ-ợc dùng làm đối t-ợng chứa. Do đó, tín hiệu đánh dấu có dạng:

( ) ( ) ( )

x ns n  n (2.11) Do các thành phần là bất biến đối với các phép biến đổi nên bản sao trên miền tần số có thể đ-ợc tạo từ tín hiệu đánh dấu. Nghĩa là, tín hiệu

( )

w n lấy lại từ tín hiệu âm thanh chứa x n( )bằng cách căn cứ vào quá trình nhúng. Khi đó, độ t-ơng đồng giữa x n( ) và w n( ) đ-ợc tính nh- sau :

1 1 1 1 ( ) ( ) ( ) ( ) N N i i c s i w i w i w i N N        (2.12) L-u ý rằng dịch tần số chỉ là một trong nhiều cách để tạo ra bản sao. Nếu ta kết hợp cả ba ph-ơng pháp trên với nhau, vừa dịch tần số, vừa dịch thời gian, vừa dịch pha sẽ làm cho bản sao tạo đ-ợc khó bị tấn công hơn, tạo ra các giá trị t-ơng đồng giữa s n( ) và w n( ) thậm chí nhỏ hơn.

2.3.4 Lớp ph-ơng pháp điều chế l-ợng tử hoá chỉ mục QIM

Mô hình bài toán [13]:

s(x,m) Bộ giải mó chiết rỳt Tớn hiệu gốc x Thụng điệp mật m Nhiễu n s y Thụng điệp chiết rỳt m^ +

Hình 2.11: Mô hình bài toán điều chế QIM

Trong đó: x là tín hiệu gốc

s (x,m): thông điệp sau khi nhúng y: tín hiệu tổng hợp

Giả sử ta có véctơ tín hiệu gốc x RN, và ta muốn nhúng thông điệp mật m vào đó. Tín hiệu gốc có thể là các hệ số của phép biến đổi Cosin rời rạc, hay là hệ số của phép biến đổi Fourier,Wavelet... Ta muốn nhúng với tỉ lệ Rm bit trên mỗi chiều (số bit/ mẫu). Vì vậy, có thể xem thông điệp mật m

nh- là một số nguyên chọn từ tập 1, 2,..., 2NRm

. Một hàm nhúng ánh xạ x và m thành tín hiệu tổng hợp s Rn với một đại l-ợng ràng buộc. Ví dụ, ràng buộc có thể là độ méo dạng bình ph-ơng:

  1 2

, max,

D s x s x D m N

    (2.13) Tín hiệu tổng hợp sau đó đ-ợc đ-a lên kênh truyền, và phải chịu một số tác động của các thao tác nh-: nén, nhiễu, lấy mẫu lại,... Một cách tổng quát, ta xem các kiểu tấn công đó là nhiễu n RN, nó có thể là ngẫu nhiên hay không ngẫu nhiên, tín hiệu độc lập hay không độc lập. Tuy nhiên, giả sử tín hiệu y phải có chất l-ợng t-ơng đối tốt so với tín hiệu gốc x. Nghĩa là véctơ tín hiệu nhiễu phải thoả mãn ràng buộc:

2 2

n

nN (2.14) Quá trình giải mã đồng nghĩa với việc -ớc l-ợng m dựa trên tín hiệu y. Ta có thể xác định độ bền vững của hệ thống bằng cách tăng giá trị kỳ vọng n2 lên cực đại, sao cho vẫn đảm bảo m m. Nếu xem n là giá trị ngẫu nhiên, thì có thể đánh giá độ bền vững của hệ thống bằng xác suất lỗi

 

Pr m m . Vấn đề khó khăn là phải thiết kế hàm nhúng s(x,m) sao cho đạt đ-ợc độ t-ơng quan hợp lý giữa ba thông số: độ bền vững, tỉ lệ nhúng, độ biến dạng.

a/ Ph-ơng pháp điều chế bít thấp tổng quát LBM

Swanson, Zhu, và Tewfik [8] đã giới thiệu một ph-ơng pháp không cần đến tín hiệu gốc khi chiết rút, đó là ph-ơng pháp “điều chế bít thấp tổng quát” LBM. Ph-ơng pháp này gồm hai b-ớc chính:

◦ B-ớc 1: Xác định hình chiếu của tín hiệu gốc x lên một véctơ giả ngẫu nhiên v

T

◦ B-ớc 2: L-ợng tử và thay đổi: thông tin đ-ợc nhúng vào x bằng cách l-ợng tử hoá nó với các giá trị l-ợng tử đồng bộ, vô h-ớng, có b-ớc l-ợng tử :

   

s q x d m (2.16) Trong đó: q  là hàm l-ợng tử vô h-ớng, đồng bộ có b-ớc l-ợng tử  d m  biểu diễn cho giá trị thay đổi.

Khi đó, thành phần véctơ tổng hợp:

 

s x  s x v (2.17)

 

q x đ-ợc biểu diễn bằng   , độ thay đổi d m  / 4, s hoặc là điểm 

(nếu nhúng bít 0), hoặc (nếu nhúng bít 1) trong ô l-ợng tử đó.

Cũng có thể nhúng hơn một bít trong véctơ N chiều bằng cách chọn thêm véctơ hình chiếu v; hay nếu chỉ dùng một véctơ hình chiếu v, nh-ng có nhiều giá trị thay đổi    1 , 2 ,...,  2NRm

d d d . Tất cả các giá trị tín hiệu gốcx ánh xạ lên một điểm  khi nhúng bít 0 cũng sẽ ánh xạ lên cùng điểm khi nhúng bít 1. Cụ thể, quá trình l-ợng tử và thay đổi đ-ợc tiến hành nh- sau:

• L-ợng tử hoá x với giá trị l-ợng tử có b-ớc l-ợng tử / 2 (Xem hình 2.12)

Hình 2.12: Điều chế bít thấp tổng quát LBM

• Điều chế (thay thế) bít ít quan trọng trong bít đã đ-ợc l-ợng tử hoá ở b-ớc trên bằng bít tin để tạo bít tín hiệu tổng hợp. Gán giá trị hình chiếu

tín hiệu tổng hợp s bằng các giá trị thay thế ( hoặc ) ứng với bít đánh dấu 0 hay 1.

b/ Ph-ơng pháp điều chế Dither:

Trong âm thanh số, méo dạng do l-ợng tử hoá các tín hiệu ở mức thấp đ-ợc gọi là nhiễu hạt, chúng gây ra các âm thanh khác th-ờng, rất khó nghe. Những âm thanh này có thể bị triệt tiêu gần hết bằng cách cộng thêm nhiễu mức thấp vào tín hiệu tr-ớc khi l-ợng thử hoá. Kỹ thuật này đ-ợc gọi là điều chế Dither [8] trong xử lý tín hiệu số.

-u điểm của việc dùng Dither là làm cho nhiễu phân bố đều khắp tín hiệu giống nh- tín hiệu nhiễu trắng, dễ quan sát và chất l-ợng tín hiệu tốt hơn trong tr-ờng hợp không dùng Dither. Khuyết điểm của ph-ơng pháp này là làm giảm tỉ lệ tín hiệu – nhiễu khoảng từ 3 đến 6 dB, tuỳ theo loại Dither sử dụng.

Giấu tin bằng ph-ơng pháp điều chế Dither

Trong ph-ơng pháp này, các ô l-ợng tử và các điểm đ-ợc tạo bởi bất kỳ giá trị l-ợng tử hoá nào đều là các bản chuyển đổi của các ô l-ợng tử và các điểm nằm trong bộ l-ợng tử. Trong xử lý tín hiệu, thì các bản chuyển đổi này t-ơng ứng với các véctơ giả ngẫu nhiên, gọi là véctơ Dither. Còn trong bài toán giấu tin, để nhúng thông tin, véctơ Dither đ-ợc điều chế chính bằng tín hiệu thông tin mật. Ví dụ, mỗi tín hiệu nhúng ánh xạ duy nhất lên mỗi véctơ Dither d(m) khác nhau. Tín hiệu gốc đ-ợc l-ợng tử hoá với giá trị l-ợng tử Dither đã có để tạo thành tín hiệu tổng hợp. Cụ thể, ta bắt đầu với vài giá trị l-ợng tử hoá cơ bản q( ) và khi đó hàm nhúng có dạng:

( , ) ( ( )) ( )

s x mq x d m d m (2.18) Ta gọi thao tác nhúng thông tin này là điều chế Dither.

* Điều chế Dither mã nhị phân với các giá trị l-ợng tử hoá đồng bộ, vô h-ớng Giả sử ta có 1 1 m R

N   , với Rm là tỉ lệ nhúng tin. Các véctơ Dither trong hệ thống điều chế Dither mã nhị phân đ-ợc xây dựng theo cách sau: º NRm bit thông tin  1, ,...,2 

m

NR

b b b biểu diễn thông điệp mật cần nhúng m, sử dụng mã tỉ lệ k ku/ c để tạo chuỗi bit z z1, ,...,2 zN L/ , trong đó:

1 ( / )u c m L k k R

(Trong tr-ờng hợp không mã hoá, zibik ku/ c = 1)

Ta chia tín hiệu gốc thành N/L block không giao nhau, có kích th-ớc L, và nhúng bít thứ i có mã zi vào block thứ i.

º Hai chuỗi Dither kích th-ớc L là d k , 0 và d k ,1 , và một chuỗi các giá trị l-ợng tử hoá đồng bộ, vô h-ớng, có các b-ớc l-ợng tử là

1, 2,... L

   đ-ợc xây dựng sao cho thoả điều kiện:

    ,0 / 2  ,0 0 ,0 / 2 ,0 0 ,1 k k d k d k d k d k d k     (2.19) Với k = 1,…,L

Ràng buộc này đảm bảo các giá trị l-ợng tử hoá đều là cực đại, nếu có thể ta chọn d k , 0 ngẫu nghiên với độ phân phối k / 2,k/ 2. Hai chuỗi Dither cũng không cần phải giống nhau trên mỗi block có chiều dài L. º Block thứ i của x sẽ đ-ợc l-ợng tử hoá với giá trị l-ợng tử Dither sử dụng chuỗi l-ợng tử d k z , i.

Quá trình nhúng của thuật toán Dither đ-ợc mô tả trực quan trong hình (2.13):

q(.) Chọn Dither FEC + + d [k,Z ] x [k] i Zi bi

Một phần của tài liệu Nghiên cứu phương pháp che giấu thông tin trong tín hiệu âm thanh (Trang 44)