1. Trang chủ
  2. » Luận Văn - Báo Cáo

Nghiên cứu kỹ thuật mã hóa tiếng nói và phương pháp thám

89 14 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 89
Dung lượng 5,28 MB

Nội dung

ĐẠI HỌC THÁI NGUYÊN TRƢỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG LÊ MỸ LỆ NGHIÊN CỨU KỸ THUẬT MÃ HÓA TIẾNG NÓI VÀ PHƢƠNG PHÁP THÁM LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH THÁI NGUYÊN, NĂM 2015 Số hóa Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ ĐẠI HỌC THÁI NGUYÊN TRƢỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG LÊ MỸ LỆ NGHIÊN CỨU KỸ THUẬT MÃ HÓA TIẾNG NÓI VÀ PHƢƠNG PHÁP THÁM Chuyên ngành : Khoa học máy tính Mã số : 60 48 01 01 LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH HƢỚNG DẪN KHOA HỌC: TIẾN SỸ HỒ VĂN CANH THÁI NGUYÊN, NĂM 2015 Số hóa Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ i LỜI CAM ĐOAN Tôi xin cam đoan, nội dung liên quan tới đề tài trình bày luận văn thân tự nghiên cứu, tổng hợp hướng dẫn khoa học TS Hồ Văn Canh Các nhận xét, kết luận trích dẫn đầy đủ theo gốc Tôi xin chịu trách nhiệm trước pháp luật lời cam đoan Thái Nguyên, ngày tháng 10 năm 2015 Học viên viên thực Lê Mỹ Lệ Số hóa Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ ii LỜI CẢM ƠN Trên thực tế khơng có thành công mà không gắ n liề n với nỗ lực củ a bả n thân hỗ trợ, giúp đỡ dù hay nhiề u, dù trực tiế p hay gián tiế p củ a ngƣời khác Trong suố t thời gian từ bắ t đầ u họ c tậ p Đạ i họ c Thái Nguyên -Trường Đạ i họ c CNTT & TT đế n em nhậ n đƣợc rấ t nhiề u quan tâm, giúp đỡ củ a quý thầ y cơ, gia đình, bạ n bè Với lịng biế t ơn sâu sắ c nhấ t, em xin gửi tới quý Thầ y/cô thuộ c Việ n Công nghệ Thông tin-Việ n Hàn lâm Khoa họ c Công nghệ Việ t Nam Thầ y/cô thuộ c ĐH Thái Nguyên - Trƣờng Đạ i họ c Công nghệ Thông tin Truyề n thông với tri thức tâm huyế t củ a để truyề n đạ t vố n kiế n thức quý báu cho chúng em suố t thời gian họ c tậ p tạ i trƣờng Em xin chân thành m ơn Ts Hồ Văn Canh hƣớng dẫ n em trình làm luậ n văn Quá trình thực hiệ n hồn thành luậ n văn kiế n thức củ a em hạ n chế nhiề u bỡ ngỡ Do vậ y, không tránh khỏ i thiế u sót điề u chắ c chắ n, em rấ t mong nhậ n đƣợc ý kiế n đóng góp quý báu củ a quý Thầ y Cô bạ n họ c lớp để kiế n thức củ a em lĩnh vực đƣợc hoàn thiệ n Sau cùng, em xin kính chúc q Thầ y Cơ đặ c biệ t Ts Hồ Văn Canh thậ t dồ i sức khoẻ , niề m tin để tiế p tụ c thực hiệ n sứ mệ nh cao đẹ p củ a truyề n đạ t kiế n thức cho hệ mai sau Trân trọ ng! Thái Nguyên, ngày tháng 10 năm 2015 Học viên viên thực Số hóa Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ iii Lê Mỹ Lệ MỤC LỤC LỜI CAM ĐOAN i LỜI CẢM ƠN ii MỤC LỤC iii DANH MỤC TỪ VIẾT TẮT vi DANH MỤC BẢNG BIỂU, ĐỒ THỊ vii MỞ ĐẦU Chƣơng 1: TỔNG QUAN VỀ TIẾNG NÓI VÀ XỬ LÝ TIẾNG NÓI 1.1 Mở đầu 1.2 Tổng quan máy phát âm 1.2.1 Bộ máy phát âm 1.2.2 Cơ chế phát âm 1.3 Biểu diễn tín hiệu tiếng nói 1.3.1 Xác định tần số lấy mẫu 1.3.2 Nén tín hiệu tiếng nói 10 1.4 Đặc tính tiếng nói 11 1.4.1 Âm hữu 11 1.4.2 Âm vô 11 1.4.3 Âm vị 11 1.4.4 Nguyên âm 12 1.4.5 Phụ âm 12 1.4.6 Các đặc tính khác 12 1.5 Mơ hình tạo tiếng nói 14 1.6 Kỹ thuật xử lý tiếng nói 17 Số hóa Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ iv 1.6.1 Tổng hợp tiếng nói 18 1.6.2 Nhận dạng tiếng nói 19 1.6.3 Phương pháp ghép nối 22 1.7 Mã hố tham số tín hiệu 25 1.8 Kết luận chƣơng 25 Chƣơng 2: TỔNG QUAN CÁC PHƢƠNG PHÁP MÃ HÓA VÀ THÁM MÃ TIẾNG NÓI 27 2.1 Mã hoá vùng thời gian 27 2.1.1 Công nghệ PCM 27 2.2 Mã hoá vùng tần số (Frequence Domain Coding of speech) 32 2.3 Mã hoá dải nhỏ(Sbc) 32 2.4 Mã hoá biến đổi thích nghi (ATC) 35 2.5 Mã hoá tham số nguồn (resourd parameters method) 37 2.5.1 Bộ mã hoá nguồn theo kênh 38 2.5.2 Phương pháp dự đốn tuyến tính LPC 39 2.6 Mã hoá theo hệ mật mã khoá đối xứng AES 40 2.6.1 Giới thiệu khái quát 42 2.7 Các phƣơng pháp mã hoá khác 50 2.7.1 Phương pháp mã hoá DPCM ( Điều xung mã vi sai) 51 2.7.2 Phương pháp DM ( điều chế delta) 52 2.7.3 Phương pháp mã hoá ADPCM 53 2.8 Phép biến đổi Fourier 53 2.8.1 Sự hội tụ phép biến đổi Fourier 54 2.8.2 Phép biến đổi Fourier rời rạc (Discriete Fourier Transform - DFT) 54 2.8.3 Phép biến đổi fourier nhanh (FFT) 55 2.8.4 Quan hệ biến đổi Z biến đổi Fourier 56 2.8.5 Phép biến đổi Fourier ngược 57 2.8.6 Các tính chất phép biến đổi Fourier 57 2.9 Tổng quát phƣơng pháp thám 58 2.9.1 Tấn công mã có từ giả định 58 Số hóa Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ v 2.9.2 Tấn công mã khơng có đoạn tiếng nói gốc cho trước (khơng có từ giả định) hệ thống phép hoán vị cố định 59 2.9.3 Tấn công vào mã thay đổi hệ thống phép hoán vị 62 2.10 Kết luận chƣơng 66 Chƣơng 3: ỨNG DỤNG HỆ MẬT MÃ AES TRONG MÃ HỐ TIẾNG NĨI 69 3.1 Các khái niệm quy ƣớc 69 3.2 Sơ đồ luồng thực 70 3.2.1 Chi tiết bước thực q trình mã hóa 71 3.2.2 Cấu trúc lớp chương trình 71 3.3 Phƣơng pháp thám 71 3.3.1 Bước 1: Phân loại mã 73 3.3.2 Bước : Xác định mã pháp 74 3.4 Đề mơ chƣơng trình 77 KẾT LUẬN 78 DANH MỤC TÀI LIỆU THAM KHẢO 79 Số hóa Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ vi DANH MỤC TỪ VIẾT TẮT ADC Analog Digital Converter ADM Adaptive Delta Modulation ADPCM Adaptive Differential Pulse Code Modulation AES Advanced Encryption Standard ARK AddRoundKey CSR Continuous Speech Recognition DCT Discrete cosine transform DFT Discrete furier transform DHT Discrete wash – Had transform DPCM Differential PCM FFT Fast FT FIR Finite Impulse Response FT Fourier Transform IDFT Inverse Discrete FT IDTFT Inverse DTFT IFT Inverse FT IMC InvMixColumns ISB InvSubBytes ISR InvShiftRows MC MixColumns PST Prolate spheroidal transform Số hóa Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ vii SB SubBytes SR ShiftRows DANH MỤC BẢNG BIỂU, HÌNH VẼ Danh mục bảng biểu: Bảng 1.1 Giá trị tần số người 13 Bảng 2.1 Chia dải tần tiếng nói phương pháp Sbc 33 Bảng 2.2 Bảng S-BOX AES 47 Bảng 2.3 Việc công vào mã (có từ giả định) .59 Bảng 2.4 Tỷ lệ % thành phần qua phép biến đổi DCT DFT .61 Bả 62 Bảng 2.6 Đo khoảng cánh thể hiện(c/minh) chất lượng tiếng nói 62 Danh mục hình: Hình 1 Bộ máy phát âm người Hình 1.2 Biểu diễn tín hiệu tiếng nói Hình 1.3 Thơng lượng cho phương pháp biểu diễn tiếng nói Hình 1.4 Mơ hình hố nguồn âm âm hữu .14 Hình 1.5 Chuỗi đoạn ống âm học lý tưởng 15 Hình 1.6 Các biểu diễn lý học tốn học 16 Hình 1.7 Mơ hình số hệ thống phát âm 17 Hình 1.8 Một vài ứng dụng xử lý tiếng nói 18 Hình 1.9 Cấu trúc tổng hợp Formant nối tiếp 21 Hình 1.10 Cấu trúc tổng hợp Formant song song 22 Hình 1.11 Sự phân tầng mã hố tiếng nói 24 Hình 2.1 Cấu hình phương pháp thơng tin PCM 28 Hình 2.2 Quá trình lấy mẫu 29 Hình 2.3 Tạp âm lượng tử theo biên độ tín hiệu đầu vào 30 Số hóa Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ viii Hình 2.4 Đặc tính nén giãn 31 Hình 2.5 Sơ đồ mã hóa giải mã dải nhỏ 35 Hình 2.6 Mơ tả State thuật tốn mã hóa AES biểu diễn dạng ma trận 4x4 43 .44 Hình 2.8 Lưu đồ thực SB ISB .45 Hình 2.9 Biến đổi SubBytes () mảng trạng thái 46 Hình 2.10 Lưu đồ thực SR .48 Hình 2.11 Quá trình xử lý MixColumns 48 Hình 2.12 Mơ tả bước Key scheduling 50 Hình 2.13 Sơ đồ mã hóa giải mã DPCM .51 Hình 2.14 Sơ đồ mã hóa giải mã AD 53 Hình 3.1 Lưu đồ cấu trúc lặp thuật tốn mã hóa AES .69 Hình 3.2 Sơ đồ mã hố tiếng nói AES - áp dụng FFT 70 Hình 3.3 Quy trình giải mã AES 72 Số hóa Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ 65 t c ng 2.7 ng Độ c tr n n đƣa o) ng iđ n i ta lấ o c 2.8.1 v ch mụ c a [8] thể nh n n công y 66 c p D n o b 2.10 Kế t luậ n chương Trong chƣơng đề tài nghiên cứu phƣơng pháp mã hố ng sóng Phƣơng thức đơn giả n lƣợng tử riêng mẫ u (có thể mẫ u nguyên rờ i rạ c hay mẫ u sai số , mẫ u chia khoả ng) Dựa vào phép biế t đổ i FFT Trong PCM ADPCM 32kbps phƣơng thức đƣợc ƣa chuộ ng nhấ t đạ t đƣợc chấ t lƣợ ng tiế ng nói mã hố theo yêu cầ u, nhiên chúng lạ i có điể m yế u băng tầ n truyề n dẫ n chiế m nhiề u, để áp dụ ng cho mạ ng viễ n thông vớ i hệ thố ng đa dị ch vụ tích hợp nhiề u kênh dị ch vụ , điề u kiệ n cạ nh tranh ngặ t nghèo hãng giới buộ c phả i có phƣơng thức mã hoá mang lạ i hiệ u cao kinh tế , đả m bả o chấ t lƣợng theo từ “cạ nh tranh củ a kinh tế tƣ bả n”, khơng cịn nề n tả ng để xây dựng lý thuyế t viễ n thông Phƣơng thức nghiên cứu tham số nguồ n củ a tín hiệ u tiế ng nói cho ta tố c độ lậ p mã thấ p vẫ n đả m bả o đƣợc chấ t lƣợng đặ t Nhìn chung phƣơng pháp mã hoá hiệ n 67 phƣơng pháp “đƣa ra”, chúng cịn cầ n có nhiề u i tiế n nữa, chƣa đƣợ c ITU khuyế n nghị nhƣ thiế t bị phầ n cứng cho mạ ng viễ n thơng chƣa có Trong điề u kiệ n Việ t Nam tiêu chuẩ n cho đánh giá chấ t lƣợng mã hoá thoạ i chƣa có tiêu chuẩ n nghành, ta đề u chấ p nhậ n sả n phẩ m đƣa củ a hãng chiế m thị phầ n lớn sả m phẩ m cung cấ p cho mạ ng viễ n thông Việ t nam, thể hiệ n mặ t nổ i thiế t bị đầ u cuố i di độ ng, VoiceIP, dị ch vụ viễ n thông qua vệ tinh Chính phân tích mà đƣa cách chung thực hiệ n việ c đánh giá chấ t lƣợng mã hố Quy trình đánh giá mộ t hệ thố ng mơ tả theo giả i thuậ t trang sau, Nhìn chung rấ t khó đƣa mộ t tiêu chuẩ n đánh giá mộ t cách xãc chấ t lƣợng củ a tín hiệ u tiế ng nói đƣợc mã hố theo phƣơng thức hay hệ thố ng bằ ng mộ t số cụ thể , tức muố n nói khả biể u diễ n nhƣ mộ t đạ i lƣợng giố ng nhƣ đạ i lƣợng nhƣ kg,m, pa đặ c tính sinh họ c củ a thính giác khác củ a ngƣời, tức mộ t câu nói nhƣng ta nhậ n đƣợc đánh giá khác ngƣờ i khác nhau, giớ i tính độ tuổ i khác khác nhau, củ a đố i tƣợng khoả ng khơng gian thờ i gian khác khác Chính vậ y, phạ m vi đề tài em mạ nh n đề xuấ t sử dụ ng hệ mậ t mã đố i xứng để mã hố nhằ m tăng cƣờng bả o mậ t thơng tin truyề n gói liệ u qua lạ i (giữa ngƣời gửi ngƣờ i nhậ n) mạ ng viễ n thông 68 69 Chƣơng ỨNG DỤNG HỆ MẬT MÃ AES TRONG MÃ HOÁ TIẾNG NÓI 3.1 Các khái niệ m quy ước Từ kế t nghiên cứu phầ n chƣơng 2, đề tài đề xuấ t triể n khai p, thuậ 128 bits n nh 3.1 Hình 3.1 Lưu đồ cấu trúc lặp thuật tốn mã hóa AES 70 3.2 Sơ đồ luồ ng thực hiệ n Tệp âm gốc Đọc tệp âm Tín hiệu âm (Miền Quá thời gian – liên tục) Áp dụng FFT rời trình rạc tín hiệu mã hóa Tín hiệu âm (Miền tần số – rời rạc) Mã hóa giải mã AES Tệp âm mã hóa Hình 3.2 Sơ đồ mã hố tiếng nói AES - áp dụng FFT Như vậy, liệu đầu vào tệp âm sau biển đổi FFT chuyển vị từ dạng liên tục sang dạng số, chương trình sử dụng thuật toán AES (dùng độ dài khoá 128) để mã hoá Đầu dự liệu âm mã hố dạng tín hiệu số 71 3.2.1 Chi tiế t bước thực hiệ n q trình mã hóa Bƣớc 1: Đọ c tệ p âm gố c (hiệ n tạ i hỗ trợ tậ p tin wav), âm đƣợc đọ c vào thành ng tín hiệ u số liên tụ c Bƣớc 2: Áp dụ ng thuậ t tốn FFT để rời rạ c hóa tín hiệ u số liên tụ c thành tín hiệ u rời rạ c Bƣớc 3: Sử dụ ng thuậ t toán mã hóa AES để mã hóa tín hiệ u lƣu lạ i kế t Quá trình giả i mã đƣợc thực hiệ n ngƣợc lạ i 3.2.2 Cấ u trúc lớp chương trình 3.2.2.1 Lớ p Encryption Lớp thực hiệ n mã hóa giả i mã sử dụ ng thuậ t toán AES 3.2.2.2 Lớ p FFT Thực hiệ n phép biế n đổ i FFT 3.3 Phƣơng pháp thám Với thuật tốn AES, q trình giải mã phép biến đổi ngược với phép biến đổi q trình mã hóa gọ 72 Riêng AddRoundKey phép biến đổi thực phép toán XOR theo bit nên biến đổi ngược phép biến đổi sử dụng q trình mã hóa phép biến đổi AddRoundKey giống cho hai q trình mã hóa giải mã Hình 3.3 Quy trình giải mã AES Nhưng với thuật tốn AES việc thám mã thường khó thực hiện, thuật tốn có kích thước khố dài; theo nghiên cứu trước tính bảo mật hệ mã hóa đối xứng phụ thuộc chủ yếu vào hai yếu tố: Độ phức tạp thuật toán độ dài khóa Có nghĩa khơng có phương pháp để phá vỡ hệ thống mật mã cố gắng thử khóa có thể, cịn gọi phương pháp vét cạn Nếu khóa có độ dài bit có 28= 256 khóa Như muốn tìm khóa nhiều 256 lần thử khóa Chẳng hạn, thuật tốn DES sử dụng khóa có độ dài 56 bit nên có 256 khóa, số lớn việc tìm kiếm khóa khó khăn Giả sử có máy tính thử triệu khóa giây, cần 2000 năm để thử hết khóa Các thành tựu gần thời gian cần thiết để giải trang mã DES mà khơng biết khố là: Sau vài tháng Internet năm 1997; vài ngày thiết bị phần cứng tăng cường năm 73 1998; sau 22 kết hợp biện pháp năm 1999 Như đốn rõ sau khoảng thời định, có nguồn lực máy tính mạnh Như vậy, thấy thám mã chủ yếu dựa vào công vét cạn để thám Với AES khác, "Thiết kế” độ dài khố thuật tốn AES (128, 192 256 bít) đủ an tồn để bảo vệ thơng tin phối hợp tốt với cơng nghệ cứng việc bảo đảm an tồn thơng tin nâng lên nhiều lần; vậy, với độ dài khố 2128 việc cơng gặp nhiều khó khăn với thám mã hệ mã hoá khối chủ yếu sử dụng phương pháp chủ yếu sử dụng phương pháp: - Phương pháp công vét cạn; - Phương pháp thám mã vi sai; - Phương pháp thám mã tuyến tính Về thực qua bước sau: 3.3.1 Bƣớc 1: Phân loại mã Giả sử, State’ sau nhận mã, ta phân tích mật mã phân loại State’ xem mã có loại mã pháp, có loại khoá mã Mặc dù chưa biết mã pháp (phương pháp mã hố) điện đó, chúng phân loại (phân lớp) Đây bước quan trọng định thành công hay thất bại mã thám nên nhiều thời gian Nếu việc phân loại xác thuận lợi cho bước tiến hành Ngược lại, phân loại thiếu xác gây khó khăn cho bước sau đó, chí thất bại Người ta có nhiều phương pháp thực thi giai đoạn này, số áp dụng kỹ thuật phân lớp đối tượng Ý tưởng toán phân lớp sau: Giả sử ta nhận m mã M1, M2, , Mm với m $ Mỗi mã ta gọi đối tượng Tập hợp m mã (các đối tượng) ta ký hiệu G Vậy G = {M1, M2, , Mm} Ứng với đối tượng ta cần tìm đặc trưng tham số Giả sử đối tượng Mi có pi đặc trưng Ở đây, đơn giản, ta giả thiết p1 = p2 = = pm= p Vấn đề đặt phân tập hợp G thành k lớp không giao mà ta ký hiệu G1, G2, , Gk, k > cho: (i) Gi khác i = 1,k (ii) Gi Gj i khác j (iii) G1c G2c c YGk = G cho sai sót phân lớp bé Để thực việc 74 phân lớp đối tượng ta cần đưa độ đo “khoảng cách” đối tượng Các đối tượng “gần gũi” gán cho lớp 3.3.2 Bƣớc : Xác định mã pháp Sau hoàn thành việc phân lớp (phân loại mã pháp) bước 1, tiến hành xác định phương pháp mã dịch ứng với lớp cụ thể (cần ý rằng, thường tiến hành xác định mã pháp mã có nhiều đặc điểm theo quan điểm nhà thám mã) Đây khâu quan trọng công tác thám mã truyền thống Tuy nhiên số hệ mật đối xứng đại mã DES, 3DES, AES, IDEA, PGP bước coi bỏ qua từ đầu mã, người ta mã thuộc loại mã pháp Ở trình bày cách thức xác định mã pháp luật mã truyền thống (bước bỏ qua hệ mật mà thuật toán mã hoá - phương pháp mã - cơng khai hồn tồn) Bước bao gồm cơng việc sau đây: 3.3.2.1 Tính tần số Mục đích việc tính tần số để phát tính quy luật khơng ngẫu nhiên tồn mã Có nhiều loại tần số khác cần tính, mà mã pháp tồn tính khơng ngẫu nhiên (có quy luật) đặc thù riêng cho Theo kinh nghiệm phân tích mà người ta tiến hành tính tần số loại phù hợp thơng qua bộc lộ rõ tính quy luật (khơng ngẫu nhiên) mã Việc tính tần số thường gồm: - Tần số đơn: Tần số đơn tần số kí tự mã Sau có kết tính tần số đơn, ta tiến hành xếp lại thứ tự ký tự theo tần số từ cao đến thấp Cũng lập bảng tần xuất cách chia tần số ký tự cho độ dài mã cần tính để xem tần số tương đối chúng - Tần số đơi móc xích (concatenate frequency of pairs) Tần số đơi móc xích tần số đôi cặp kề đè lên ký tự Mục đích việc tính tần số đơi móc xích để xem quan hệ phụ thuộc ký tự sau với ký tự kề trước nào, (ta thường gọi quan hệ xích Makov cấp 1) Từ ước lượng xác suất xuất ký tự biết trước ký tự đứng trước 75 - Tần số đôi thường: Tần số đơi thường tần số đơi rời nhau, ví dụ: cho đoạn văn : Việt Nam tần số đôi thường gồm: Vi: xuất lần e e: xuất lần t j: xuất lần n a: xuất lần Ký tự cuối bỏ qua (chỉ gồm có đơi) Trong đó, tần số đơi móc xích thể là: Vi, ie, ee, et, tj, jn, na, am gồm đôi Lưu ý: - Số tất đơi móc xích văn độ dài n n – - Còn số tất “bộ đơi thường” là: [n)2], ký hiệu [x] số nguyên lớn bé x - Tần số 3, 4, Tuỳ theo trường hợp cụ thể phải tính tần số 3, 4, 3.3.2.2 Tính trùng mã Tính trùng mã tức tính tần số trùng lặp dãy ký tự liền mã Thường tính trùng lặp ký tự (bộ 3), ký tự (bộ 4), ký tự (bộ 5) xuất mã vị trí chúng mã Khi tính trùng mã (các bộ) ta phải quan tâm tham số sau đây: Tần số trùng mã (trùng lặp) Độ dài trùng lặp Vị trí trùng lặp Khoảng cách trùng lặp Trùng mã mã mã khác Những tham số có ích việc xác định mã pháp 3.3.2.3 Tần số định kỳ: Ngồi việc tính tần số đơn, đơi móc xích, đơi thường v.v trùng mã (sự trùng lặp) mã mã, nhiều trường hợp người ta phải tính tần số định kỳ Giả sử ta có mã M độ dài n Thường n lớn lớn tốt Bây ta lập bảng k cột (k $ thường k $ 3) n/k hàng Sau đó, ta viết mã trái qua phải viết từ xuống hết dừng Bây ta tiến hành tính tần số đơn theo cột từ cột đến cột k Như ta 76 thường phải tính tốn tần số “định kỳ” khác k = 3, 4, , 10 Tần số gọi tần số định kỳ Trong nhiều trường hợp tần số đơn, đôi, mã tương đối san (tức không vi phạm tiêu chuẩn 3s c2) tần số định kỳ lại có quy luật rõ 3.3.2.4 Tần số đôi dọc đôi dọc đồng tự Nếu ta viết mã mã mã Ví dụ mã M1=m11,m12 m1n1 M2=m21m22 m2n2 Ta có: M1=m11m12m13 m1n1 M2=m21m22m23 m2n1 m2n2 Ta cắt phần thừa m2n1+1, m2n2 (giả sử n1 < n2), ta ký hiệu độ dài hai mã lại n Ta tiến hành tính tần số cặp (m1k m2k), với k = 1, 2, n Ta có tần số đôi bảng gọi bảng tần số đôi dọc Các phần tử đường chéo ma trận tần số đơi tạo từ M1, M2 tần số đơi dọc đồng tự 3.3.2.5 Phân tích kết tính tần số trùng mã Bước dựa vào kết tính loại tần số, trùng mã để kết luận mã (các mã) thuộc loại mã pháp Để đánh giá độ chênh lệch tần số tính độc lập ký tự mã, người ta thường dùng tiêu chuẩn thống kê toán học, chẳng hạn tiêu chuẩn 3s, tiêu chuẩn c2 tiêu chuẩn MLR (Most Likelihood Ratio- tỷ số hợp lý cực đại) Nói chung việc xác định mã pháp công việc phức tạp, phụ thuộc phần vào trình độ kinh nghiệm mã thám viên Có nhiều trường hợp thống nhìn mã người ta dự đốn phương pháp mã có nhiều trường hợp phải nghiên cứu công phu mà độ rủi ro khơng phải khơng có 3.3.2.5 Xác định ngơn ngữ dùng: Đây bước giúp cho việc thám mã đột phá thành công 77 3.4 Đề mơ chương trình 78 KẾT LUẬN Trong đề tài luậ n văn củ a mình, em tậ p trung giả i quyế t vấ n đề bả n mã hố tiế ng nói là: Tìm hiể u tiế ng nói xử lý tiế ng nói Tìm hiể u cách tiế p cậ n mã hoá tiế ng nói Tậ p trung phân tích phƣơng pháp thám mã tiêng nói:  Tấn cơng vào mã tiếng nói cho trước từ giả định  Tấn cơng mã khơng có đoạn tiếng nói gốc cho trước  Tấn công mã công hoán vị bị thay đổi  Phép biến đổi FFT Trong phầ n luậ n văn đề tài, em mạ nh n đề xuấ t sử dụ ng hệ mậ t mã đố i xứng AES để mã hố tiế ng nói Hạn chế luận văn em việc sử dụng thuật tốn mã hố nâng cao AES, tăng tính bảo mật q trình mã hố làm chế đề tài việc tiến hành thám mã Cuối cùng, lần cho phép em cảm ơn Thầy Tiến sỹ Hồ Văn Canh tận tình bảo em kiến thức tạo điều kiện thuận lợi để em hoàn thành đề tài tốt nghiệp 79 DANH MỤC TÀI LIỆU THAM KHẢO Tiếng Việt: [1] Nguyễn Viết Thế, Hồ Văn Canh: Nhập môn Phân tích thơng tin có bảo mật NXB Thơng tin Truyền thơng, năm 2010 [2] Chun khảo tiếng nói - Vụ nghiên cứu khoa học - Ban yếu phủ, năm 2003 [3] Đặng Ngọc Đức, Nguyễn Tiến Dũng, Lương Chi Mai (2011), Mơ hình phiên âm tiếng Việt mức âm vị Tiếng Anh: [4] Filer, T Fridrich, J Goljan, M : “Using Senser Pattern Noise for Camara Model Identification” In: Proc ICIP 2008, San Diego, pp 1286 - 1299 (2008) [5] Kratzen, C Oermanm, Am Dittmanm, J Larg, A : “Digital Audio Forensics” In: 9th Wordshop on Multimedia & Security, pp 63 - 74 ACM New York (2007) [6] Rabiner : “Digital Processing (2008).” [7] Robert Bucholz, Christian Kraetxer, and Jana Dittman: “Microphone Classification Using Fourier Coeffciant” PO Box 4120, 39016 Magdeburg, Germany, 2009 [8] Simon singh: “The Code Book (2008)” Internet: [9] https://www.univie.ac.at/nuhag-php/janssen/data/p019.pdf [10] https://en.wikipedia.org/wiki/Fast_Fourier_transform [11] http://hdl.handle.net/123456789/654 ... vi nghiên cứu, ý nghĩa khoa học thực tiễn đề tài nghiên cứu, phương pháp nghiên cứu Chương TỔNG QUAN VỀ TIẾNG NÓI VÀ XỬ LÝ TIẾNG NÓI Chương TỔNG QUAN CÁC PHƢƠNG PHÁP MÃ HÓA VÀ THÁM MÃ TIẾNG NÓI... tiế ng nói 18 Hình 1.8 Một vài ứng dụng xử lý tiếng nói 1.6.1 Tổ ng hợp tiế ng nói Tổng hợp tiếng nói phát sinh tiếng nói từ sóng tiếng nói Trong vài thập niên gần đây, tổng hợp tiếng nói có... NGUYÊN TRƢỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG LÊ MỸ LỆ NGHIÊN CỨU KỸ THUẬT MÃ HÓA TIẾNG NÓI VÀ PHƢƠNG PHÁP THÁM Chuyên ngành : Khoa học máy tính Mã số : 60 48 01 01 LUẬN VĂN THẠC SĨ KHOA

Ngày đăng: 24/02/2021, 21:49

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w