Tấn công bản mã khi đã có từ giả định

Một phần của tài liệu Nghiên cứu kỹ thuật mã hóa tiếng nói và phương pháp thám (Trang 68 - 72)

Chương 2: TỔNG QUAN CÁC PHƯƠNG PHÁP MÃ HÓA VÀ THÁM MÃ TIẾNG NÓI

2.9. Tổng quát phương pháp thám

2.9.1. Tấn công bản mã khi đã có từ giả định

Ta xét trường hợp khi nhà phân tích mật mã có trong tay từ giả đị nh( ở đây là tiếng nói gốc) và đoạn mã tương ứng (tiếng nói đã được mã hoá của đoạn tiếng nói gốc ấy). Điều có lý là: có thể xác đị nh vị trí mới của một thành phần biến đổi bản rõ(tiếng nói gốc) với độ lớn nhất sẽ tương ứng với độ lớn nhất của các thành phần bản mã tương ứng. Hai thành phần lớn nhất này tạo thành một cặp có thể phù hợp nhau. Thử cách này, cứ mỗi thành phần biến đổi bản rõ (tiếng nói) thành bản mã tương ứng.

Người ta đã làm thí nghiệm nhiều người (30 người) gồm giọng nói nam và cả giọng nói nữ.

Kết quả đƣợc lập bảng sau đây:

Trong trường hợp đã biết trước đoạn tiếng nói giả đị nh (Từ giả đị nh - ND):

Việc tấn công vào bản mã (có từ giả đị nh) đƣợc mô tả trên đây có thể khôi phục lại toàn bộ phép hoán vị nếu có mẫu đọ dài 32-ms của tiếng nói gốc.

Số mẫu tiếng nói đƣợc dung

Tỷ lệ % của các thành phần đúng

Khoảng cách Ceptral (đơn vị dB)

Phổ của SSNR (đơn vị dB)

1 8,05 1,18 3,38

10 50,77 1,11 14,38

20 60,92 1,11 14,01

30 78,16 0,11 16,71

40 79,11 0,10 16,89

50 90,80 -0,93 20,53

Trước lúc T/công 000 1,71 2,17

Bảng 2.3. Việc tấn công vào bản mã (có từ giả định)

2.9.2. Tấn công bản mã khi không có đoạn tiếng nói gốc cho trước (không có từ giả đị nh) đối với hệ thống phép hoán vị cố đị nh.

Nói chung các nhà phân tích mật mã tiếng nói thường chưa có trong tay mẫu tiếng nói gốc (tức từ giả đị nh) nhƣ đã mô tả trong mục 2.7.1.

Trong trường hợp này, chúng ta giả thiết rằng các bản mã thu được đều có hệ thống phép hoán vị như nhau (cố đị nh). Trường hợp biết trước mẫu tiếng nói gốc là điều rất thuận lợi cho vệc tấn công vào bản mã.

Trường hợp không có từ giả đị nh (mẫu tiếng nói gốc) nhưng với giả thiết phụ thêm, một mô hình của vùng phổ thời gian ngắn cảu tiếng nói đã được tìm ra trong trường hợp giả thiết đã cho ở đây mục 2.7.3

Trong trường hợp này, ánh xạ cho độ lệch cựa tiểu trong sai số bình phương trung bình là ước lượng tốt nhất cảu phép hoán vị đối với bản mã nhận đƣợc.

Nếu phép hoán vị (chung cho các bản mã) đƣợc dùng để mã hoá mỗi mẫu tiếng nói thì thông tin đƣợc thu thập từ các nhà phân tích mật mã

có thể có đƣợc từ việc tích luỹ thông tin của các bản mã có chung khoá hoán vị đó.

Ví dụ: Một bảng tần số ứng với nó có một thành phần nào đó của bản rõ tương ứng cho ta thuật toán để nhận được một lời giải Optiman.

Việc mô tả chi tiết phương pháp này được mô tả trong [8] gồm có L véc tơ độ lớn phổ M thành phần biến đổi trên một mẫu và τ mẫu của các bản mã tương ứng thành phần biến đổi thứ I, véc tơ D1 trong [8] thứ 1 sẽ được kí hiệu là D1i trong đó i=1,2,..,M

Thủ tục sau đây tập trung vào việc phân tích bản mã dạng DFT.(giả thiết nhƣ vậy).

Thủ tục này có thể dễ dàng ứng dụng cho bản mã dạng DCT hoặc lƣợc đồ biến đổi khác (trong số biến nêu trên - ND).

Nội dung thủ tục là nhƣ sau:

a. Đƣa vào véc tơ bản mã Y và thực hiện phép biến đổi DFT để nhận đƣợc véc tơ độ lớn phổ chuẩn V, ở đây các thành phần Vi của véc tơ V là thành phần phổ thứ i với i = 1,2,..,M.

b. Giả sử rằng: D là phổ tiếng nói ban đầu (tiếng nói gốc) từ đó nhận đƣợc véc tơ bản mã V.

c. Tìm Vj = max { Vj : 1<= j<=M}

Tìm D1j = { max D1i <= i <= L} và kí hiệu vị trí của nó là j.

d. Dựa vào giả thiết rằng: thành phần lớn nhât trong véc tơ D1j của [8] sẽ ánh xạ vào thành phần lớn nhất trong thành phần Vi của V, hãy ghi lại thành cặp (i,j) và đƣợc gán cho phép biến đổi ngƣợc.

e. Lập lại bước (c) và (d) đối với các thành phần lớn nhất tiếp theo và vv… cho đến tất cả M thành phần cảu V đã đƣợc gán cho một trong M thành phần của D.

f. Dùng ƣớc lƣợng phép hoán vị ngƣợc (khôi phục lại bản rõ)(i,j) để biến đổi véc tơ V cảu bản mã về véc tơ U (véc tơ khôi phục lại bản rõ (ƣớc lƣợng))

U = (u1, u2,…,uM)

g. Xác đị nh sai số bình phương G1 giữa véc tơ 1 với [8] là véc tơ biểu diễn tiếng nói gốc với véc tơ đã đƣợc khôi phục U bằng hệ thức sau:

Gt = 2

1

)

(

M

i

Dt Ui

h. Hãy lặp lại các bước từ (b) đến (g) cho r bản mã khác nhau (có cùng phép hoán vị ).

Sự dụng thuật toán hungarian[6] có thể tìm lại đƣợc phép hoán vị từ ma trận (các phép gán)  Gọi là ma trận gán.

Phép hoán vị đến 88 hệ số với mẫu V = 256 đã đƣợc phân tích nhờ thuật toán đã nêu trên. Cơ sở dữ liệu tiếng nói dùng trong thí nghiệm này gồm 10 câu nói bằng nhau. Số các thí nghiệm này dùng cho cả giọng đàn ông và cả giọng dàn bà.

Kết quả thí nghiệm này đƣợc biểu diễn trong bảng sau cho ta tỷ lệ phần trăm của các thành phần mà chúng đƣợc thay thế trong 2 vị trí của vùng đúng đối với véc tơ biến đổi với phép biến đổi DCT và DFT. Rõ ràng là tỷ lệ phần trăm này tăng tương ứng với độ rõ của tiếng nói được khôi phục qua phép biến đổi DCT và DFT tương ứng.

Tỷ lệ % của các thành phần DCT DFT

Bản gốc/ đã được mã hoá 2,5 3,7

Bản gốc/ đã được khôi phục

(bằng cách thay đổi phép hoán vị) 4,8 8,9

Bản gốc/ đã được khôi phục

(với phép hoán vị cố định) 10,7 23,0

Bảng 2.4. Tỷ lệ % của các thành phần qua 2 phép biến đổi DCT và DFT

ng:

.

thay n trong mục 2.7.3 - thể

. Bảng trên

c

c ghi trong ng 2.4

ch s DCT.

ng).

SNR (dB) DFT DCT

13,7 3,7

20 13,3 3,7

10 12,5 3,6

5 7,9 2,7

0 6,7 2,8

Bảng 2.5.

Các phép biến đổi LPC Cepstral Segmental F.V.S.C

DCT 0,36248 -2,5702 20,2871 26,0171

DFT 0,36661 -2,3076 19,8753 25,8959

Bảng 2.6. Đo khoảng cánh thể hiện(c/minh) chất lượng tiếng nói

Một phần của tài liệu Nghiên cứu kỹ thuật mã hóa tiếng nói và phương pháp thám (Trang 68 - 72)

Tải bản đầy đủ (PDF)

(89 trang)