Tính trong suốt

Một phần của tài liệu Nghiên cứu phương pháp che giấu thông tin trong tín hiệu âm thanh (Trang 29)

Thông tin mật đem giấu không đ-ợc gây ảnh h-ởng đến chất l-ợng cảm thụ của đối t-ợng chứa. Tức là đoạn âm thanh sau khi đ-ợc nhúng tin phải nghe hoàn toàn giống đoạn âm thanh gốc. Nếu vi phạm tính chất này thì bài toán giấu tin không còn ý nghĩa.

1.5. Các ứng dụng của kỹ thuật giấu tin 1.5.1 Bảo vệ bản quyền, sở hữu trí tuệ

Đây là ứng dụng cơ bản nhất của kỹ thuật thủy vân số. Một thông tin nào đó mang ý nghĩa quyền sở hữu tác giả sẽ đ-ợc nhúng vào trong các sản phẩm, thông tin này chỉ một mình ng-ời chủ sở hữu hợp pháp các sản phẩm đó có và đ-ợc dùng làm minh chứng cho bản quyền sản phẩm, đồng thời chống lại các hành vi ăn cắp hoặc cố ý giả mạo. Nh- vậy, cần phải có một kỹ thuật để “dán tem bản quyền” vào các sản phẩm này. Việc dán tem hay thực chất chính là việc nhúng thông tin phải đảm bảo không để lại bất kỳ ảnh h-ởng nào đến chất l-ợng sản phẩm. Yêu cầu đối với ứng dụng này là thông tin nhúng phải tồn tại bền vững cùng với sản phẩm, nếu không đ-ợc phép của ng-ời chủ sở hữu thì chỉ còn cách phá huỷ sản phẩm.

1.5.2 Nhận thực thông tin và chống giả mạo thông tin

Thông tin mật sẽ đ-ợc giấu vào đối t-ợng chứa và sau đó dùng để nhận biết xem dữ liệu trên đối t-ợng chứa có bị thay đổi hay không. Yêu cầu chung đối với ứng dụng này là khả năng giấu thông tin nhiều và không cần bền vững tr-ớc các phép xử lý trên đối t-ợng chứa.

Đặc biệt, hiện nay lĩnh vực giấu tin còn đ-ợc dùng cho điều khiển không l-u và xác định chủ quyền của quốc gia qua kênh VHF: Mỗi máy bay sẽ đ-ợc gán một số xác thực riêng, thông tin này cho biết về máy bay

thuộc hãng hàng không của quốc gia nào, h-ớng bay, cảng hàng không đi và đến,…Trong quá trình liên lạc giữa máy bay và trạm điều khiển không l-u mặt đất, các thông tin này sẽ đ-ợc giấu vào một đoạn tag (thẻ). Sau khi giải mã, màn hình sẽ hiển thị những thông tin lấy từ tag phục vụ cho quá trình điều khiển.

Hình 1.9: Xác thực thông tin trong điều khiển không l-u

1.5.3 Điều khiển sao chép

Điều mong muốn đối với các hệ thống phân phối dữ liệu đa ph-ơng tiện là tồn tại một kỹ thuật chống sao chép trái phép dữ liệu. Có thể dùng tin mật để chỉ trạng thái sao chép của dữ liệu. Ví dụ : “copy never” - không đ-ợc sao chép hay “copy one” - chỉ đ-ợc sao chép một lần. Sau khi sao chép xong, bộ đọc/ghi sẽ ghi giá trị chỉ trạng thái mới lên đối t-ợng chứa. Các ứng dụng này yêu cầu tin nhúng phải đ-ợc bảo đảm an toàn và khi lấy lại thông tin đã giấu không cần đến tính hiệu gốc.

1.5.4 Giấu vân tay và dán nhãn

Thông tin mật đem giấu đ-ợc sử dụng để nhận diện ng-ời gửi hay ng-ời nhận trong phân phối sản phẩm. Thông tin mật này cũng t-ơng tự nh- số serial của sản phẩm. Ví dụ, các tin mật khác nhau sẽ đ-ợc nhúng vào các bản sao chép khác nhau của đối t-ợng gốc tr-ớc khi l-u chuyển. Yêu cầu trong ứng dụng này là đảm bảo độ an toàn cao cho các tin mật tránh sự xoá dấu vết trong khi phân phối.

1.5.5 Quản lý phát sóng

Trong thực tế, việc phát sóng các đoạn phim hay âm thanh qua các ph-ơng tiện thông tin đại chúng có những nhu cầu nh-:

• Các nhà quảng cáo muốn chắc chắn rằng đoạn ch-ơng trình quảng cáo của họ đ-ợc phát đủ thời gian mà họ đã mua từ các nhà phát sóng.

• Ng-ời chủ sở hữu một đoạn nhạc, phim không muốn tác phẩm của mình bị xâm phạm tác quyền qua việc thu và phát sóng lại.

Một cách giải quyết điều này là sử dụng hệ thống theo dõi tự động (thụ động và chủ động): chứa một máy tính chuyên theo dõi nội dung phát sóng và so sánh tín hiệu nhận đ-ợc với cơ sở dữ liệu các tác phẩm biết tr-ớc. Thực hiện giấu tin vào bên trong nội dung tín hiệu phát sóng chứ không phải chỉ trong một đoạn đặc biệt của tín hiệu và vì thế hoàn toàn t-ơng thích với nền tảng thiết bị phát sóng. Nh- vậy, bằng cách nhận dạng những tin mật đ-ợc nhúng trong nội dung số, có thể chỉ ra khi nào và ở đâu nội dung đó đ-ợc phát sóng.

1.5.6 Giấu tin mật

Các thông tin giấu đ-ợc trong tr-ờng hợp này càng nhiều càng tốt, việc giải mã để nhận đ-ợc thông tin cũng không cần đối t-ợng chứa ban đầu. Những yêu cầu bền vững với tấn công của kẻ thù không cần thiết lắm, thay vào đó thông tin cần giấu phải đ-ợc bảo mật.

Kết luận

Trên đây là tổng quan về lĩnh vực giấu thông tin hiện nay. Đồ án đã đề cập đến một mô hình giấu tin cơ bản, phân tích các b-ớc nhúng, chiết rút thông tin, đ-a ra các yêu cầu cần thiết đối với mỗi thuật toán giấu tin. Từ đó làm cơ sở cho việc nghiên cứu các ph-ơng pháp giấu thông tin trong tín hiệu âm thanh sẽ đ-ợc trình bày trong ch-ơng 2.

Ch-ơng 2

Các ph-ơng pháp giấu tin trong tín hiệu âm thanh

Giấu thông tin trong tín hiệu âm thanh mang những đặc điểm riêng khác so với giấu tin trong ảnh số và video. Yêu cầu cơ bản là vừa phải đảm bảo tính chất ẩn của thông tin giấu đồng thời không gây ảnh h-ởng đến chất l-ợng của dữ liệu gốc. Để thỏa mãn yêu cầu này, các kỹ thuật giấu tin trong audio phụ thuộc nhiều vào hệ thống thính giác (HAS) của con ng-ời. Do HAS nghe đ-ợc tín hiệu ở các dải tần rộng và công suất lớn nên rất khó khăn cho việc giấu tin. Tuy nhiên, các mô hình phân tích tâm lý đã chứng minh rằng tai ng-ời khá kém trong việc phát hiện ra sự khác biệt giữa các dải tần và công suất, nghĩa là các âm thanh to, cao tần có thể che giấu đ-ợc các âm thanh nhỏ, thấp một cách dễ dàng. Thông tin này rất có ích cho việc chọn các đoạn audio thích hợp để giấu tin. Vấn đề khó khăn thứ hai là kênh truyền tin. Kênh truyền với băng thông chậm sẽ ảnh h-ởng đến chất l-ợng thông tin sau khi giấu. Ngoài ra, giấu tin trong audio còn đòi hỏi yêu cầu rất cao về tính đồng bộ và tính an toàn của thông tin sau khi giấu.

Từ những nhận xét trên, tr-ớc khi tập trung nghiên cứu vào các ph-ơng pháp giấu thông tin, đồ án sẽ trình bày những tính chất cơ bản của tín hiệu âm thanh và các đặc tính cụ thể của HAS, làm cơ sở, căn cứ để đề xuất ra những ph-ơng pháp che giấu thông tin. Sau đó đi sâu phân tích một số ph-ơng pháp đang đ-ợc sử dụng phổ biến hiện nay.

2.1. Đặc điểm của tín hiệu âm thanh

2.1.1 Âm thanh và đặc điểm của tín hiệu âm thanh.

Âm thanh là những sóng cơ học lan truyền trong không gian. Ví dụ, khi ta nói, các dây thanh quản rung động ở những tần số khác nhau và tổng

hợp các rung động này tạo ra âm thanh cuối cùng. Một âm thanh bất kỳ đ-ợc đặc tr-ng bởi ba đại l-ợng cơ bản là: cao độ, c-ờng độ, và âm sắc. • Cao độ âm thanh chia làm hai loại:

Cao độ tuyệt đối đ-ợc biểu thị bằng giá trị của tần số f. Âm thanh càng cao thì tần số càng lớn.

Cao độ t-ơng đối là tỷ số giữa âm thanh cần xác định cao độ và âm thanh gốc. Những tần số cao hơn âm thanh gốc đ-ợc gọi là bội âm. (adsbygoogle = window.adsbygoogle || []).push({});

C-ờng độ âm thanh đ-ợc biểu diễn bằng năng l-ợng âm thanh sinh ra ở một khoảng cách L nào đó so với nguồn âm, trong một đơn vị thời gian (giây), trên một đơn vị diện tích (m2) của mặt phẳng đặt vuông góc với chiều truyền âm. C-ờng độ âm thanh phụ thuộc vào biên độ, tần số và môi tr-ờng truyền âm.

Âm sắc biểu diễn sự phong phú về tần số do nguồn âm phát ra. Trong thực tế không có nguồn đơn âm mà tồn tại những nguồn âm phức tạp. Chúng đ-ợc biểu diễn theo công thức sau:

     1 ) sin( ) ( k k k k t P t P  (2.1) Trong mỗi nguồn âm đều tồn tại một thành phần tần số cơ bản:

) sin(

)

(t coban P1 t k

P    (2.2) Biên độ của âm cơ bản là lớn nhất. Các thành phần còn lại là các hài, hài càng cao thì năng l-ợng càng nhỏ. Năng l-ợng của âm thanh tập trung chủ yếu ở âm cơ bản và lân cận của nó. Khi đó, nguồn âm có thể biểu diễn gần đúng bằng ph-ơng trình:      N k k k k t P t P 1 ) sin( ) (  (2.3) Tiếng nói là một dạng đặc biệt của âm thanh. Con ng-ời dùng tiếng nói để trao đổi thông tin với nhau. Cũng nh- âm thanh nói chung, tiếng nói cũng có âm sắc. Nhờ âm sắc, ta có thể phân biệt đ-ợc giọng nói của ng-ời đối thoại. Tai ng-ời nhận âm thanh ở dải tần số từ 16 Hz đến 20000 Hz.

Nh-ng để hiểu nội dung của lời nói, ta chỉ cần dải tần từ 300 Hz đến 2400 Hz. Tiếng nói có một số đặc tr-ng cơ bản sau:

• Hàm xác suất phân bố biên độ của tiếng nói không đồng đều. Âm có biên độ nhỏ xuất hiện nhiều, biên độ lớn xuất hiện ít.

• Mật độ phổ công suất của tiếng nói không bằng phẳng. • Tồn tại âm hữu thanh, âm vô thanh trong tiếng nói. • T-ơng quan giữa các mẫu tiếng nói liên tiếp khác 0. • Phổ tần tiếng nói là hữu hạn

• Âm hữu thanh có tính chất giả tuần hoàn.

Hình d-ới đây mô tả một dạng sóng âm thanh phức tạp:

1 chu kỳ f = 10 kHz

Âm lượng

Thời gian

Hình 2.1: Biểu diễn dạng sóng âm thanh tần số 10 kHz

2.1.2. Biểu diễn tín hiệu âm thanh d-ới dạng số:

Trong nhiều tr-ờng hợp, việc định dạng và mã hoá nguồn đối với các bản tin liên tục (tiếng nói, âm nhạc, video,...) của các hệ thống thông tin số đ-ợc thực hiện cùng một quá trình: biến đổi tín hiệu liên tục thành chuỗi tín hiệu số (chuỗi bit) hiệu quả về mặt tốc độ và truyền dẫn. Cơ sở của ph-ơng pháp số hoá tín hiệu liên tục là định lý lấy mẫu của Shannon [4].

Nội dung của định lý nh- sau:

Một tín hiệu s t , với biến đổi Fourier của nó là S f , đ-ợc gọi là có băng tần hạn chế nếu S f 0 với fW , trong đó W là tần số lớn nhất chứa trong s t . Theo định lý lấy mẫu, tín hiệu có băng tần hạn chế nh- thế

đ-ợc biểu diễn duy nhất bởi các giá trị mẫu của s t  lấy với tốc độ fs 2W

mẫu trong một giây. Tốc độ lấy mẫu tối thiểu fs 2W mẫu/ giây đ-ợc gọi là tốc độ Nyquist. Việc lấy mẫu với tốc độ thấp hơn tốc độ Nyquist dẫn đến méo gập phổ.

Tín hiệu s t  nh- trên biểu diễn đ-ợc theo:

  sin 2 2 2 2 2 n n W t n W s t s n W W t W                           (2.4) Trong đó  2 n s W    

  là các giá trị mẫu của tại thời điểm lấy mẫu t n W / 2 .

Lấy mẫu Lượng tử Mó hoỏ

Tớn hiệu vào Tớn hiệu ra

Xung PAM Xung PCM

Thời gian: liờn tục

Biờn độ: liờn tục Thời gian: rời rạcBiờn độ: liờn tục Thời gian: rời rạcBiờn độ: rời rạc (adsbygoogle = window.adsbygoogle || []).push({});

Luồng bit số

Hình 2.2: Các b-ớc số hóa tín hiệu t-ơng tự

Việc khôi phục lại tín hiệu s t  tại đầu thu từ chuỗi các giá trị mẫu

2 n s W      

  chỉ đơn thuần là thực hiện biểu thức (2.4) trên, vế phải của nó có thể nhận đ-ợc bằng cách cho chuỗi các giá trị mẫu nhận đ-ợc qua một

mạch lọc có phản ứng xung   sin 2 2 2 2 n W t W h t n W t W                  với tần số cắt bằng W.

2.1.3. Cấu trúc tệp âm thanh định dạng Wav

Trong hầu hết các ứng dụng hiện nay, tín hiệu âm thanh đều đ-ợc l-u trữ d-ới định dạng Wav, Mp3, Mid,... Đây là các dạng nén âm thanh theo chuẩn MPEG [7]. Một cách đơn giản là có thể dùng Microphone hoặc bộ ghi hay máy Cassette đ-ợc nối với Card âm thanh trong máy tính cá nhân (PC) để nén âm thanh. Nhìn chung, cấu trúc một tệp âm thanh dạng Wav là

một dãy các byte ghi ở dạng hệ 16. Ví dụ: 7E 7D 80 E8 74 81 7D...Trong đó, tệp audio .Wav đ-ợc đặc tr-ng bởi ba tham số sau:

• Tần số ghi của tín hiệu âm thanh • Độ phân giải của quá trình ghi • Thời gian ghi.

Cấu trúc cụ thể của một tệp .Wav đ-ợc trình bày ở phần phụ lục 2.1.3

2.2. Các đặc tính của hệ thống thính giác HAS

Để phân tích khả năng cảm thụ của HAS, chúng ta đề xuất khái niệm

Critical band (tạm dịch là băng chủ chốt) [5] dựa trên cơ chế biến đổi tần

số – không gian của màng nhĩ bên trong tai. Trong thực tế, HAS cảm thụ âm thanh bằng cách chia dải phổ công suất tín hiệu nhận đ-ợc thành các

Critical band. Mỗi Critical band là một khối các bộ lọc thông dải mà băng

thông của chúng chồng lấn một phần lên nhau. Nếu chọn tần số nghe giới hạn cao nhất khoảng 24 kHz thì ta sử dụng 25 Critical band để mô tả HAS. Băng thông của một Critical band đ-ợc tính xấp xỉ theo công thức:

100 500 0.2 500 CB Hz f Hz BW fHz f Hz       (2.5) Nh- vậy, dải thông bộ lọc khoảng 100 Hz đối với các băng có tần số nằm d-ới 500 Hz, và lên đến 5000 Hz cho các băng nằm ở vùng tần số cao. T-ơng tự, ta có khái niệm thang chia tỉ lệ Z của Critical band giống nh- thang chia tần số thông th-ờng. Công thức chuyển đổi giữa tỉ lệ Z [Bark] và tần số f [Hz] cho d-ới đây:

13arctan 0.76 3.5arctan 2  1000 7.5*1000 f f z     Bark         (2.6)

HAS có hai đặc tính quan trọng đ-ợc khai thác phổ biến trong lĩnh vực mã hoá âm thanh, đó là tính ngụy trang (đồng thời) về tần số và ngụy trang về thời gian. Có thể xem đây là những “yếu điểm” trong khả năng cảm thụ của HAS. Cho nên, các thuật toán nén âm thanh đều lợi dụng điểm

yếu này nhằm giảm số l-ợng bit yêu cầu mã hoá tín hiệu. Còn trong các thuật toán giấu tin, đặc tính ngụy trang đ-ợc dùng với mục đích che giấu bit thông tin đem nhúng vào chuỗi bit tín hiệu có sẵn mà không gây bất kỳ trở ngại nào cho việc cảm thụ chất l-ợng âm thanh.

2.2.1 Ngụy trang tần số :

Đây là hiện t-ợng xảy ra trên miền tần số trong tr-ờng hợp một tín hiệu mức thấp không thể cảm thụ đ-ợc khi xuất hiện đồng thời các tín hiệu mức cao. Ví dụ: nhạc cụ phát âm lớn hơn sẽ át mất các âm yếu hơn. Ta gọi tín hiệu che là masker, còn tín hiệu bị che là maskee. Hiệu ứng ngụy trang chỉ xảy ra khi tín hiệu maskeemasker nằm khá gần nhau trên miền tần số. T-ơng ứng tính chất ngụy trang, ta có khái niệm ng-ỡng ngụy trang, để

Một phần của tài liệu Nghiên cứu phương pháp che giấu thông tin trong tín hiệu âm thanh (Trang 29)