Ngụytrang về thời gian

Một phần của tài liệu Nghiên cứu phương pháp che giấu thông tin trong tín hiệu âm thanh (Trang 39)

Đây là một trong hai đặc tính quan trọng của HAS và đ-ợc khai thác nhiều trong các thuật toán nén âm thanh. Hiện t-ợng này xảy ra khi tín hiệu

masker và tín hiệu kiểm tra không xuất hiện đồng thời nh-ng đủ gần nhau

về mặt thời gian. Nh- vậy, có thể xuất hiện hai tr-ờng hợp khác nhau :

• Pre-masking : tạm dịch là tiền che lấp, xảy ra khi tín hiệu kiểm tra xuất hiện tr-ớc tín hiệu masker.

• Post-masking : tạm dịch là che lấp ng-ợc, xảy ra trong tr-ờng hợp bật tín hiệu kiểm tra sau khi tín hiệu masker xuất hiện và không còn tồn tại. Không mất tính tổng quát, ta giả thiết tín hiệu kiểm tra là phiên bản bị dịch đi l-ợng t của tín hiệu masker. Nh- vậy, hiện t-ợng tiền che lấp xảy ra tr-ớc khi tín hiệu masker đ-ợc bật và kéo dài khoảng 20 ms. Nghĩa là ng-ỡng ngụy trang sẽ giữ nguyên không đổi cho đến khi t đạt đến giá

trị âm 20 ms nh- hình (2.5). Sau khi t  -20 ms, ng-ỡng này sẽ tăng dần và đạt đến mức giá trị ng-ỡng hiệu ứng che lấp đồng thời ngay tr-ớc khi tín hiệu masker bật lên. Hiệu ứng pre-masking giống nh- khi ta đã nghe thoáng qua, nh-ng không cảm thụ. Bởi vì thính gác cần một khoảng thời gian để xử lý thông tin chứ không làm việc ngay lập tức. Thời gian yêu cầu này phụ thuộc vào độ lớn của âm. Do vậy, các âm càng lớn sẽ có thời gian thiết lập ngắn hơn các âm yếu và những âm lớn này đ-ợc cảm thụ tr-ớc tiên.

Mức nộn õm thanh SPL [dB] Thời gian [ms] 60 40 20 0 100 200 100 200 40 50 60 70 80 90

Ngụy trang đồng thời

Pre - masking

Post - masking

Hình 2.5: Ngụy trang thời gian trong HAS

Khoảng thứ hai trên hình vẽ là hiệu ứng ngụy trang (đồng thời) tần số đã giới thiệu ở phần tr-ớc.

Khoảng thứ ba mô tả hiện t-ợng post-masking t-ơng ứng với sự suy giảm của hiệu ứng ngụy trang tần số sau khi tắt tín hiệu masker. Cứ sau độ trễ khoảng 5 ms thì giá trị ng-ỡng này lại suy giảm, và sau khoảng 200 ms thì nó xấp xỉ bằng giá trị ng-ỡng im lặng. Post-masking phụ thuộc nhiều vào khoảng thời gian tồn tại tín hiệu masker. Độ suy giảm của nó càng tăng đối với các tín hiệu masker tồn tại càng ngắn.

2.2.3. áp dụng HAS trong thiết kế , kiểm tra thuật toán giấu tin: Hình (2.6) miêu tả quá trình kiểm tra có sử dụng các đặc tính của HAS để thiết kế một mô hình nhúng tin thích nghi: giấu những loại thông

tin khác nhau vào các tín hiệu âm thanh khác nhau. Phõn đoạn õm thanh Rỳt trớch cỏc đặc trưng Nhúm đặc trưng HAS Thiết kế bộ nhỳng Dữ liệu kiểm tra Lớp cỏc tham số Mụ hỡnh nhỳng tin

Hình 2.6: Mô hình kiểm tra thuật toán giấu tin bằng HAS

Đầu tiên, lần l-ợt tiến hành kiểm tra cho từng khung (frame) âm thanh, phân tích các đặc tr-ng của nó để tìm ra cách tối -u để phân loại các

frame âm thanh thành các lớp rồi chọn ra một mô hình nhúng phù hợp cho

nó. HAS đóng vai trò rất quan trọng trong b-ớc phân tích các frame này nhằm đảm bảo tính trong suốt và tính bền vững khi giấu tin. Thông qua hai tính chất quan trọng của HAS là: ngụy trang (đồng thời) về tần số và ngụy trang thời gian sẽ lựa chọn đ-ợc các frame âm thanh có đặc tr-ng phù hợp với hai tính chất trên. Và nhóm các đặc tr-ng này thành các lớp tham số sử dụng cho quá trình thiết kế và xây dựng mô hình giấu tin.

2.3. Các ph-ơng pháp giấu tin trong tín hiệu âm thanh

Hiện nay, do lĩnh vực giấu tin trong tín hiệu âm thanh mới đ-ợc nghiên cứu nên sự phân loại ch-a rõ ràng. Tuy nhiên, ta có thể chia thành hai nhóm chính nh- sơ đồ d-ới đây:

Phương phỏp giấu tin trong audio

Giao thoa tớn hiệu gốc Khụng giao thoa tớn hiệu gốc

Mó hoỏ pha Điều biến pha Phương phỏp sử dụng bản sao Phương phỏp lượng tử hoỏ chỉ mục Phương phỏp tự đỏnh dấu Phương phỏp tập đụi Phương phỏp trải phổ

Nhóm ph-ơng pháp giao thoa tín hiệu gốc:

Trong ph-ơng pháp này, tại quá trình chiết rút thông tin nhất thiết phải có mặt tín hiệu gốc, những tham số đặc tr-ng của nó đ-ợc dùng để giải mã và khôi phục lại tin mật đem giấu [6].

Bộ mó hoỏ Bộ giải mó Bộ nhỳng Bộ chiết rỳt Khoỏ mật K Khoỏ mật K Nhiễu tạp n wa cw cwn c0 mn c0 Đối tượng chứa Đối tượng chứa Thụng tin mật cần giấu m Thụng tin mật + + +

Hình 2.8: Mô hình giấu tin giao thoa tín hiệu gốc cơ bản

Tuy nhiên, trong các ứng dụng thực tế, nhóm các ph-ơng pháp này lại tỏ ra không hiệu quả vì phải cần gấp đôi bộ nhớ để l-u trữ cùng một thông tin, cần đến gấp đôi l-ợng băng thông cho quá trình chiết rút thông tin. Và đôi khi ta không thể có đ-ợc tín hiệu gốc sử dụng trong quá trình chiết rút thông tin. Dĩ nhiên, trong một số tr-ờng hợp đặc biệt (chứng thực bản quyền, xác nhận thông tin) thì nhóm ph-ơng pháp này lại tỏ ra rất hiệu quả, thậm chí là rất cần thiết. Từ những lý do trên, nhóm ph-ơng pháp này ít đ-ợc nghiên cứu và phát triển, nên số l-ợng không nhiều. Hai ph-ơng pháp đại diện cho nhóm này là: mã hoá pha và điều biến pha.

Nhóm các ph-ơng pháp không giao thoa tín hiệu gốc:

Nhóm ph-ơng pháp này còn gọi là nhóm các ph-ơng pháp không cần đến tín hiệu gốc trong quá trình chiết rút tin, hay bất kỳ thông tin không phải âm thanh nào khác (trừ khoá mật) mà vẫn có thể chiết rút thông tin chính xác. Nhóm các ph-ơng pháp này chỉ cần đến một nửa bộ nhớ l-u trữ, một nửa băng thông để chiết rút tin so với nhóm ph-ơng pháp giao thoa tín hiệu gốc nên đ-ợc ứng dụng rất rộng rãi trong thực tế, và đ-ợc nhiều tác giả nghiên cứu. Nhóm này bao gồm các ph-ơng pháp: sử dụng bản sao, tự đánh

dấu, điều chế l-ợng tử hoá chỉ mục, ph-ơng pháp tập đôi và cuối cùng là ph-ơng pháp trải phổ.

2.3.1 Ph-ơng pháp mã hoá pha:

ý t-ởng cơ bản của ph-ơng pháp này là chia chuỗi âm thanh gốc thành các block (khối) và nhúng toàn bộ dữ liệu vào phổ pha của block đầu tiên. Tuy nhiên, nó có nh-ợc điểm là thời gian nạp âm thanh t-ơng đối lâu, trong khi chỉ có block đầu tiên đ-ợc nhúng thông tin, dữ liệu giấu không đ-ợc phân bố đều trên toàn bộ tín hiệu âm thanh, sử dụng tài nguyên không hiệu quả. Nh-ng bù lại, ph-ơng pháp này tránh đ-ợc việc mất mát thông tin do các thao tác cắt xén, và xử lý tín hiệu. Các b-ớc nhúng và chiết rút tin đ-ợc trình bày cụ thể trong [8] và [10].

2.3.2 Ph-ơng pháp điều biến pha:

Dữ liệu đ-ợc nhúng vào tín hiệu âm thanh bằng cách điều biến pha trên nhiều băng tần độc lập nhau. Để đảm bảo thông tin không bị phát hiện, ta thêm điều kiện rằng buộc khi điều chế pha:

0

( ) /z z 30

   (2.8) Trong đó, ( )z là pha của tín hiệu, z là tỉ lệ Bark, đại diện cho một

critical band. Mỗi giá trị Bark sẽ mang thông tin của một bit dữ liệu giấu.

Để tăng tính bền vững, ta có thể dùng nhiều Bark để mang thông tin của cùng một bit dữ liệu.

Dung l-ợng thông tin nhúng theo ph-ơng pháp này phụ thuộc vào ba thông số: l-ợng thông tin d- thừa, số l-ợng tần số, năng l-ợng phân phối của tín hiệu gốc. Nếu năng l-ợng Bark chọn quá thấp, thì không nên dùng Bark đó để nhúng tin. Đối với tín hiệu audio lấy mẫu ở tần số 44.1 kHz thì dải tần 0 – 15 kHz (0-24 tỉ lệ Bark) đ-ợc chứng minh là khá nhạy cảm cho

việc nhúng tin. Ví dụ, nếu hai Bark mang cùng một bit dữ liệu thì tốc độ dữ liệu đ-ợc nhúng là: (24/2)(44100/ 214) = 32 bps.

2.3.3 Ph-ơng pháp sử dụng bản sao:

ý t-ởng của nhóm ph-ơng pháp này là sử dụng chính nội dung của tín hiệu gốc để biểu diễn cho thông tin đem giấu. Do vậy, chúng chống lại đ-ợc các kiểu tấn công đồng bộ hoá.

a/ Ph-ơng pháp thay thế bit ít quan trọng nhất LSB

Thuật toán sử dụng ph-ơng pháp thay thế bít ít quan trọng LSB [6] là một lựa chọn tự nhiên khi yêu cầu nhúng tin với dung l-ợng lớn, nh-ng lại kém bền vững đối với các thao tác xử lý tín hiệu. Đây là ph-ơng pháp ra đời sớm nhất và đơn giản nhất trong các kỹ thuật giấu tin hiện có. Trong LSB, bộ mã hoá sử dụng khoá mật để chọn một tập con các mẫu tín hiệu âm thanh gốc sẵn có. Thao tác thay thế các bit ít quan trọng của mẫu bằng bit tin đ-ợc thực hiện trên tập con này. Quá trình chiết rút tin mật chỉ đơn giản là đọc giá trị của các bit rồi ra quyết định. Do vậy, bộ giải mã phải cần tất cả các mẫu tín hiệu đã đánh dấu để so sánh và lựa chọn bit thích hợp. Dung l-ợng tin đem giấu trong ph-ơng pháp LSB rất cao: bit LSB của tín hiệu gốc lấy mẫu ở 44.1kHz sẽ t-ơng ứng dung l-ợng tin khoảng 44.1 kbps. Dĩ nhiên, tính bền vững của ph-ơng pháp này khá kém do khi ta chọn ngẫu nhiên bit LSB, khiến cho một phần thông tin đã mã bị mất. Bù lại, ph-ơng pháp này không phức tạp trong tính toán nên đáp ứng đ-ợc yêu cầu thời gian thực.

Để tăng dung l-ợng tin giấu có thể sử dụng nhiều bit/ mẫu để mã tin. Tuy nhiên, khi tăng dung l-ợng bit sẽ sinh thêm tạp âm Gauss. Bởi vì HAS rất nhạy cảm với các thành phần tạp âm này, do đó số l-ợng bit LSB sử dụng bị giới hạn và phải đ-ợc tính toán tr-ớc.

Trong mã LSB, ph-ơng pháp nhúng tin chia ra làm hai loại: kích th-ớc cố định và kích th-ớc thay đổi. Ph-ơng pháp đầu nhúng cùng một số l-ợng bít tin vào mỗi mẫu tín hiệu gốc, còn ph-ơng pháp thứ hai thì số l-ợng bit tin đem nhúng/ mẫu sẽ phụ thuộc vào đặc tính của tín hiệu gốc. Và đây là một h-ớng nghiên cứu vẫn còn để mở: làm thế nào để điều chỉnh đặc tính của tín hiệu gốc sao cho dung l-ợng tin giấu lớn nhất? Trong [6], Cvejic đề xuất ph-ơng pháp LSB cải tiến nhằm tăng tính bền vững của mô hình giấu tin. Tuy nhiên, ph-ơng pháp này chỉ mang tính lý thuyết.

Ph-ơng pháp mã LSB cải tiến

Trong ph-ơng pháp này sẽ dùng ba hoặc bốn bit LSB để giấu tin. Mô hình của ph-ơng pháp đ-ợc trình bày theo hình d-ới đây:

Nhỳng LSB cơ bản Thay thế MER Khuếch tỏn lỗi Tớn hiệu gốc Tin mật Tớn hiệu đỏnh dấu

Hình 2.9: Ph-ơng pháp mã LSB cải tiến

Tại b-ớc đầu tiên, nhúng bit tin vào bốn LSB của tín hiệu gốc bằng ph-ơng pháp LSB cơ bản (thay thế bốn bit LSB bằng bốn bit tin). B-ớc thứ hai thực hiện phép thay thế lỗi cực tiểu MER. ý t-ởng nh- sau: giả sử, gọi a(n) là tín hiệu gốc, s(n) là tín hiệu thu đ-ợc khi nhúng k bit LSB, s’(n) cũng tín hiệu thu đ-ợc khi chọn ngẫu nhiên giá trị của (k +1) bit LSB. Do đó, mức lỗi nhỏ nhất có thể là s(n) hoặc s’(n). Gọi e(n) là sai lệch giữa a(n) và s(n); e’(n) là sai lệch giữa a(n) và s’(n). Nếu e(n) < e’(n) thì chọn s(n) thay thế cho a(n), ng-ợc lại, chọn s’(n). Nếu sử dụng MER sẽ cho phép ta giảm lỗi nhúng tin từ 2k 1xuống còn 2k1. B-ớc thứ ba là khuếch tán lỗi nhằm làm giảm tính cảm thụ đ-ợc của tin mật đem giấu.

Nh- vậy, với ph-ơng pháp LSB cải tiến, dung l-ợng tin mật đem giấu sẽ tăng lên khoảng 1/3 trong khi vẫn không làm ảnh h-ởng đến chất l-ợng

cảm thụ tín hiệu âm thanh gốc. Ngoài ra, ta có thể đo entropy của tín hiệu và áp dụng lý thuyết truyền tin để nâng cao dung l-ợng tin đem giấu.

b/ Ph-ơng pháp tạo tiếng vang

Trong ph-ơng pháp này [13] dữ liệu đ-ợc nhúng vào tín hiệu âm thanh gốc bằng cách thêm các echo (tiếng vang) trên miền thời gian của tín hiệu gốc: ( ) ( ) ( ) x ns n s n (2.9) Tớn hiệu gốc Bit 1 Bit 0 Biờn độ echo Decay rate 1  0 1

Hình 2.10: Giấu tin theo ph-ơng pháp tạo tiếng vang

Trong mô hình đơn giản sẽ chỉ có một echo đ-ợc thêm vào nh- công thức (2.9). Tuy nhiên, với các ph-ơng pháp echo cải tiến, ta có thể thêm nhiều echo. Chuỗi thông điệp nhị phân đ-ợc nhúng vào bằng cách tạo echo tín hiệu gốc trễ một hoặc vài nhịp, 0 hay 1 mẫu. Việc chiết rút thông điệp đã giấu khi đó đ-ợc quy về việc dò tìm ra độ trễ  . Khái niệm Cepstrum sẽ đ-ợc dùng để dò tìm độ trễ  . Cepstrum thực chất là lấy Logarit của phép biến đổi Fourier rời rạc tín hiệu âm thanh. Do biên độ biểu diễn các echo t-ơng đối nhỏ so với tín hiệu gốc, nên gây rất nhiều khó khăn cho quá trình chiết rút. Để giải quyết khó khăn này, ta sử dụng ph-ơng pháp tự t-ơng đồng Cepstrum và tạo Echo hai lần nh- sau:

( ) ( ) ( ) ( )

Điều này sẽ làm giảm độ biến dạng, đồng thời làm tăng thêm độ bền vững. Giá trị  th-ờng dùng sẽ ít hơn ba hay bốn xung mẫu. Giấu thông tin bằng ph-ơng pháp echo đảm bảo tính trong suốt rất cao, và đôi khi nó còn làm cho âm thanh nghe tốt hơn.

Khuyết điểm của ph-ơng pháp này là quá trình dò tìm thông tin nhúng rất phức tạp, nhất là khi tính toán hệ số Cepstrum. Mặt khác, bất kỳ ng-ời nào, trên lý thuyết, cũng có thể dò tìm ra các echo mà không cần biết tr-ớc một thông tin nào khác. Ngoài ra, ph-ơng pháp này rất dễ bị tấn công và rất dễ bị phá vỡ.

Nhằm giảm xác suất bị tấn công, một số tác giả đã đề xuất ph-ơng pháp echo trải trên miền thời gian và ph-ơng pháp tự t-ơng quan [10]. Tuy nhiên, các ý t-ởng trên khá phức tạp và đòi hỏi kỹ thuật rất công phu khi thực hiện.

c/ Ph-ơng pháp điều chế bản sao

Điều chế bản sao là ph-ơng pháp giấu tin mới [15], bao gồm ba ph-ơng pháp chính: dịch tần số, dịch pha, và dịch biên độ.

Ph-ơng pháp dịch tần số gồm một số b-ớc chính nh- sau: biến đổi chuỗi tín hiệu biểu diễn trên miền thời gian s n( )về miền tần số, sao chép một phần nhỏ các thành phần có tần số thấp trong một khoảng xác định nào đó (ví dụ, từ 1 kHz đến 4 kHz), điều chế chúng (ví dụ, dịch đi với hệ số tỉ lệ bằng 20 Hz), thêm các giá trị đó ng-ợc trở lại vào tín hiệu gốc, và biến đổi ng-ợc về miền thời gian để tạo ra tín hiệu đánh dấu w n( ). Do các tín hiệu đ-ợc dịch chuyển và cộng trừ ngay trên miền tần số, ta gọi ph-ơng pháp này là điều chế bản sao trên miền tần số. T-ơng tự, ph-ơng pháp điều chế bản sao trên miền thời gian cũng sẽ thực hiện các thao tác này, nh-ng tiến hành trên miền thời gian. Tín hiệu sau khi đã điều chế w n( )đ-ợc gọi là một

bản sao. Bản sao này có thể đ-ợc dùng làm đối t-ợng chứa. Do đó, tín hiệu đánh dấu có dạng:

( ) ( ) ( )

x ns n  n (2.11) Do các thành phần là bất biến đối với các phép biến đổi nên bản sao trên miền tần số có thể đ-ợc tạo từ tín hiệu đánh dấu. Nghĩa là, tín hiệu

Một phần của tài liệu Nghiên cứu phương pháp che giấu thông tin trong tín hiệu âm thanh (Trang 39)

Tải bản đầy đủ (PDF)

(118 trang)