Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 151 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
151
Dung lượng
9,77 MB
Nội dung
TS HỔ VÁN CANH, TS NGUYỄN VIẾT THÊ Nhập n Ũ N TÍCH THÔNG TỊN CÓBẰOHÌT I NHÀ XUẤT BẢN THÔNG TIN VÀ TRUYỂN THÔMG LỜI N tl OẨU Như biết vai trò quan trọng an toàn thông tin (ATTT) thời đại bùng nổ thông tin Người ta chia vi phạm ATTT mạng truyền dẫn nói chung, mạng máy tỉnh nói riêng thành loại thụ động loại chù động Lx)ại vi phạtn thụ động chì nhằm mục đích nắm bắt thông tin, chì tìm người gửi, người nhận, mật độ thông tin trao đổi, thời gian gửi Vi phạm thụ động thường không làm sai lệch hủy nội dung trao đổi Loại vi phạm chủ động làm thay đổi nội dung, xỏa bỏ, tàm trễ thông tin truyền, làm biến dạng chúng, chèn thông tin giả vào thông tin thật mạng chí tìm cách phá sập Website Trong số phương pháp đảm bảo ATTT phưcnig pháp mật mã hóa (Cryptography) sử dụng rộng rãi dảm bảo an toàn Tuy nhiên phương pháp mật mã hóa có yếu điểm quan trọng phương pháp mật mã hóa không tốt (mặc dù việc quản lý khóa mã giả thiết an toàn) nguy hiểm Vậy làm để đánh giá chất lượng hệ mật mã tốt? Có nhiều phương pháp đánh giá chất iượng cùa hệ mật phương pháp Entropy Shannon, phương pháp tổt trực quan nhất, đố phương pháp phân tích trực tiếp mã khóa mã tay mà người ta thường gọi thám mS (Cryptanalysis) Đây môn đ i ^ công khai hóa thời gian gần đầy Đê bước đầu làm quen với môn "nghệ thuật" này, NXB Thông tin Truyền thông xuất sách ^Nhộp môn phân tích thông tin cỏ bio mật** giới thiệu đến bạn dọc Đây phương pháp đảm bảo ATTT lâu đời nhất, quan trọng nghiên cứu phát triểr ngày rộng rãi N ó trở thành m ột ngành khoa học gọi lỉ khoa học phân tích mật mâ (Cryptanalysis) Cuốn sách TS Hồ Văn Canh TS Nguyễn Viết Thể tổng hợp biên soạn từ nhiều kết nghiên cứu khoa học côti| bổ với kinh nghiệm tích iuỹ sau 30 năm tỉm tòi, nghiên cún trực tiếp giảng dạy tác giả Cuốn sách gồm chương; Chương / ; Khái niệm mã thám Chương 2: Một sổ kiến thức bồ trợ Chương 3: Các bước bàn để tiến hành thám mã Chương 4: Thực hành phán tích số luật mõ thuộc hệ mội truyền thống Chương 5: Một số phương pháp thám mõ liệu DES Chương 6: Mật mõ công khai phương pháp thám mõ Chương 7: Phương pháp tẩn công RSA không cần phán tích nhân tử Hy vọng sách thực hừu ích kỳ sư, kỹ thuật viên, cán giảng dạy sinh viên ngành Công nghệ Thcng tin, Điện tử Viễn thông, Ngành Mật mã thực đề tài, đồ án, dự án, tix>ng giảng dạy, học tập Ngoài ra, cuổn sách ià tái liệu tham khảo bể ích cho bạn đọc quan tâm tới lĩnh vực Nhà xuẩt xin giới thiệu bạn đọc tnong nhận dược ý kiến đỏng gỏp quý vị Mọi ỷ kiến dỏng gốp xin gửi Nhà xuất nông tín Trụyền thông • 18 Nguyễn Du, Hà Nội Trán trọng cảm ơn./ NXB THÔNG TIN VÀ TRUYỀN THÔNG Chương KHẤi NIỆM VỂ MA THÀM 1.1 MỞ ĐẦU Trong phần trình b ày này, ch ú n g ta tạm phân m ã đổi xứng làm h phần, m ật m ă cổ điển mật m ă "hiện đại", ch ú n g ta phân biệt k h niệm "hiện đại" hệ th ống mật m ã đối xứng dừ ng cuốh sách với kh n iệm "hiện đại" hệ m ật mã bất đối xứng Trong phạm v i sách này, ta hiểu m ật m ã "hiện đại" hệ mật khoá đổi xứng ph át triển mức cao, đặc b iệt ỉà tự động hoá việc mã dịch M ật m ã n y h iện n a y đan g p h t triển m ạnh mật m ã với kh oá thuật toán D ES; 3DES; IDEÂ; FEAL; AES,.„ C hính vậy, ch ú n g ta gọi mật m ã mật m ã đại Còn m ật m ã cổ điển ỉà mật m ã m ã/dịch thù công, mật m ã ỉoạỉ n ày đòi sớm nhất, sử dụng, p h át triển lâu đòi đến n a y chi tồn m ột số nước p h t triển v m ột phạm vỉ hẹp, nh ũn g nời khó k h ăn tron g ứ ng d ụ n g công n g h ệ đỉện /đỉện từ (ví dụ ỉực lượng q u ân hoạt động p h ân tán, vùn g nông thôn, rừng n ú i đcfn vị tìn h báo.«) T uy n h iên , ch ín h mật m ă ỉoại lại ỉà tảng cho p h át triển mật m ã đại (th eo n gh ĩa sách này) Nhập môn Phân tỉch thông tin có hào mật C hính vậy, việc n gh iên cứu thám mở điện m ã c ủ a m ật m ã cổ đ iển có ý n gh ĩa quan trọng phục vụ việc nghiên cứu th ám mỏ hệ th ông m ật mă đại Trên sỏ góp phần tăn g cưòng độ an toàn cho hệ m ật m ã đại, nhằm góp phần bảo vệ an ninh thông tin tình hình V ề m ật m â cổ đ iển th ì có nhiều loại N goài có n h iều loại biến th ể chúng nhằm ỉàm tă n g độ an toàn cho m ật mã D o đó, ch ú n g không đề cập h ết tấ t loại m ật m ã cổ điển cù n g biến th ể chún g m trình bày m ột s ố loại điển h ìn h n h ấ t d ù ng mà có n h ữ ng ỉoại v ẫ n dùng hôm 1.2 CÁC THUẬT NGỮ cd BẢN VỀ MẬT MẲ VÀ M THÁM t.2 Mật mã (Cryptography) M ật m ã tập hợp m ọi phưdng pháp (hoặc quy tác) biến đổi nhằm ch u yển thông báo (m essages) dạng n h ận thức đưỢc nội d u ng (như chữ viết, tiến g nói, hinh vẽ, h ỉn h ả n h ,_ ) th n h dạn g bí m ật mà n h ũ n g người không h iểu nội d u n g họ phưdng pháp (hoặc quy tắc) biến đổi Cồn m ật mã học (CrỊrptology) ià m ột môn khoa học ch u yên n gh iên cứu v ề m ột m ã mã thám 1.2.2 Bẳn rõ (Plain text) Ta h iểu bẳn rõ túc m ột th ông báo có m ang nội d u n g th ôn g tin m ngưòỉ đọc có th ể h iểu nói Chương ỉ: Khái niệm mã thảm hoiặc có ý n gh ĩa rõ ràng B ản rõ (bản th ôn g báo) có th ể tồ n dạng chữ v iết, tiến g nói, h ìn h vẽ, biểu b ản g., tưtíng ứ n g ta có k h i n iệm m ã ký tự, m ã thoại, m ă fax, m ã d ữ liệu B ản rõ thưòng b iểu diễn (viết) dạn g m ột dây c c chữ theo quy tắc cú pháp ký h iệu thuộc b ả n g chữ c i»í / h ữ u h n xác định trước Đ ể dễ trình hìế\x»yíí k h ô n g g ia n rõ (m essage space) V í dụ: •/(( có th ể gồm dãy nhị phân, ván tiến g b y , ta ký V iệt, mã chương trìn h m áy tính™ Bản m ã (C ip h e r te x t) B ản m ã thưòng cũ n g biểu diễn d ạn g m ột dăy c c ký h iệu có th ể cũ n g th u ộc ♦*/ ng không th eo m ột quy tắ c cú pháp Người ta nói ỉà dăy n gẫu n h iên T a ký h iệu tập tấ t m â ứ ng vối rõ m ^ C hú ý ràng ký h iệu củ a c € ^ c ó th ể không thuộc 1.2.4 Phép biến d â mã/dịch (Encrytion/decryption Transíormations) T rong việc tạo b ản m ã từ rõ, ngưòi ta cần đến h y ế u tô' là: th am sô' m ột quy tắc m ã/dịch T ham số ngư òi ta gọi ỉà khoá m ã/dịch (key seed) Tập tấ t khoá (m ầm khoá) tạo th n h m ột k h ông gian khoá v k ỷ h iệu •'/{ Còn m ột quy tắc m ã m ột án h xạ từ không gian •4( vào không gian ^ p h ụ thuộc vào m ột khoá cho trước T a k ý h iệu Egt >41 ^ với e Á nh xạ n y p h ải Nhập môn Phân tích thông tin có hào mật son g án h (ánh xạ lên - 1) ánh xạ ngược ánh xạ Eg gọi quy tắc dịch (T ranslation) tức quy tắc biến đổi m ã c € ^ th n h rõ tưdng ứng m Dj, d d e -yií ký h iệu Các khoá m ã e khoá dịch d tạo th n h m ột cặp khoá m ã/dịch v iết (e, d) Chú ý e d có th ể trù n g - Q uá trình áp d ụ ng phép biến đổi rõ m € > th àn h b ản m ã tưdng ứ ng c € ^ gọi mã hoá - Q uá trìn h áp d ụ n g phép biến đổi vào mã tạo rõ m tương ứ ng gọi giải mã để (decryption decipherin^ (enryption scbeme) gồm tập hỢp tấ t h àm m ã hoá Eg ứ n g vói e € tấ t hàm giải mã - Lược đồ m ã hoá ứng với d H àm Ee phải thoả m ãn hệ thức; Dj= Ee * với V (e.d) >ír X Tức m = Dd (c) = Ee (E (m)) N h v ậ y để người n h ận (tích thực dịch đưđc m ã từ ngưòi gửi tới th ì đường nh iên người n h ận p h ẳi cố khoá dịch d v quy tắc dịch Dj V iệc có th ể thực h iện trao đổi khoá giữ a bên, ta ký h iệu bên  B T rong m ật m ã cổ đ iển tru yền thống, việc trao đổi phải đảm bảo b í m ậ t không m ột đối tác c (đôi tác th ứ 3) biết V ì khoá mã q u yết đ ịn h đến độ an toàn mẠt m ã T rong ỉú c th u ậ t toán m ã/dịch thường đơn giản quy ưóc trưốc giữ a h a i bên A B, _ ^ Chương 1: Khái niệm vê mã thảm Mẳ thám Quá trình khôi phục lại rõ kh oá có m ã tương ứ n g cho trưốc gọi th ám m ã N gưòi làm công tá c thám m ã gọi ngưòi m ã th ám (Cryptanalysist) h ay gọi mã thám viên Đđn vị tổ chức làm công tác thám m ã gọi đơn v ị m ã thám Mã th ám m ột phận k h ôn g th ể th iếu ngàn h tìn h báo đ iện tử H ầu h ết nưóc có phận tìn h báo điện tử này, n h n g p h át triển h iệu lại phụ thuộc vào trìn h độ khoa học công ngh ệ nước Nước có trìn h độ kh oa học công n gh ệ cà n g cao th ì khả n ăn g công tác th ám m ã nói riêng, tìn h báo điện tử nói ch u n g càn g m ạnh 1.2 Nhóm báo khoá (Label) Trong hệ m ật m ã tru yền thống, k h i m ã chuyển từ nơi gửi đến ndi n h ậ n th ì đương n h iên nơi n h ận p hải có khoá m ã đ ể dịch Các khoá m ã khoá dịch m ã chuyển cho trước lúc b ắ t đầu th ốh g n h ấ t vổi (giữa nơi gử: A ndi n h ậ n đích thực B) v ề việc liê n lạc N hư ng sô" lượng khoá m ă/dịch th òng n h iều , để bên A B th ổh g n h ấ t với n h au họ phải th ôn g báo cho n h au b iết búc điện mă cụ th ể m ã từ khoá nào, th ôn g báo khoá sử dụng, ngưòi ta th òn g ghi tê n k h oá s ế h iệu củ a khoá mă th n h từ n g nhóm n gay m ã gửi đến nơi n h ận đích thực T ên khoá 8ấ h iệu củ a khoá gọi nhóm báo khoá C ăn vào nhóm báo khoá, m ật m ã v iên Nhập môn Phăn tich thông tin có báo mật 10 xác định kh oá m ã - khoá dịch tưđng ứng Đ ể đôl phó vối quan m ã th ám có th ể phát h iện nhóm báo khoá từ dự đoán ỉu ậ t m ă nhữ ng m ã trùng khoá, nhóm báo khoá trưóc lúc cho vào m ã mã hoá th eo quy tắc bên A B thoả th uận trước 1.3 ĐẶC TRƯNG C0 BẢN CỦA BẢN Rỗ Đ ể n gh iên cứu th ám mỗ mã truyền thổhg, người m ã th m p h ải n g h iên cứu đặc trưng rõ Đó quy lu ậ t tầ n số, quy lu ậ t trùng lặp, quy lu ật vàn phong, N ói m ột cách khác m ọi ngôn ngữ tự nhiên có nhữ ng đặc trư ng b ấ t biến m m ã thám viên cần nắm vữ ng đ ể phục vụ việc p h ân tích mã Đệ tiện, vịệẹ thẹo, dõi, ngh iện cứụ y ề sạu m không m ất tín h tổn g quát, ch ú n g ta d ù ng tiến g Anh làm đối tượng n gh iên cứu to n cuôn sách 1.3.1 Tần số (Prequency) N gưòi ta đ ịn h n g h ĩa tần s ố x u ấ t h iện m ột ký tự, nhóm ký tự, m ột từ h a y m ột vần m ột ván sô' lầ n x u ấ t h iện củ a k ý tự, nhóm ký tự, từ, vần vàn cho N gưòi ta có th ể tín h tầ n s ố từ m ột n h iều văn (th ông báo) củ a m ột ỉoại ngôn ngữ để rút quy ỉu ậ t riên g củ a n gôn ngữ Có n h iều ỉoại tần s ố như: T ần s ố từ n g ký tự (tầ n sô' đđn), tầ n s ố từ n g cặp ký tự (tần Chương I : Khái niệm mã thảm 11 s ố đôi) N gay tầ n sô' đôi cũ n g có n h iều cách tín h khác n h a u như: - T ần s ố đôi th ôn g thưòng; - T ần sô' đôi móc xích (concatenate) - T ần sô k ký tự (k = 1, , 3, ) - N goài có: tẨn sô' từ, tẨn số vần chữ (ví dụ - tion, tiến g A nh), tầ n s ố nhóm n g u y ên âm , tầ n s ố ký tự đứng đầu từ, tầ n sô' ký tự đứng CUÔI từ M ột điểm cần lư u ý: m ỗi loại ngôn ngữ tự n h ỉên khác nh au có tầ n sô' k h ôn g g iến g n h au N gay m ột ngôn ngữ loại v ă n có tín h ch ấ t văn học có tầ n s ố không hoàn toàn g iến g N h ữ n g tín h ch ất ngưòi ta gọi đặc trư ng ngôn ngữ Ta lư u ý rằng, ván khác n h au thường có độ dài (sô' lượng ký tự văn đó) khác Do k h số đ ịn h ngh ĩa có n h iều trưòng hỢp khó thực h àn h Vì người ta đưa k h niệm tầ n số niệm tầ n tương đối (tần su ấ t - relative frequency) T ần su ấ t m ột ký tự X v ă n s ố lầ n x u ấ t h iện ký tự chia cho độ dài văn Còn tầ n su ấ t đôi móc xích xy m ột v ă n s ố lầ n x u ấ t h iện đôi có văn chia cho độ dài v ă n trừ V í dụ, giả sử v ă n có độ dài n, k h i s ố lượng đôi móc xích n - 1, sô' lầ n x u ấ t h iện cặp “nh” m lầ n th ì tần su ấ t củ a cặp “nh” m „h/(n-l) Sau k ết tín h toán tần 138 _ Nhập môn Phân tích thông tin có bào mật Bổ đề 3: Trong block kích cõ tạo thành từ bảng (thành lập từ mật điện chuyển vỊ) block cho ta đầy đủ có mặt nguyên âm hàng block (với xác suất 1) Các bổ đề không chứng minh ỏ cuôn sách Tuy nhiên độc giả kiểm tra lại đắn bổ đề Các bước tiến hành 3.1 Xây dựng tần sô'bộ đôi móc xích: Chúng ta xây dựng bảng tần số đôi móc xích gồm khoảng 10.000 ký tự lấy từ văn chuyên dụng tiếng Anh đốì tưỢng nghiên cúu 3.2 Dự đoán chiều dài khóa chuyển vị Việc dự đoán xác tiết kiệm nhiều thòi gian Để dự đoán xác ta phân tích chiều dài điện thành tích sô' nguyên tô', vào thực tế mà dự đoán kích thưóc bảng cho có cân đôi hài hòa hàng cột h iểu b iết tiê n nghiệm (kinh nghiệm) đôi tượng bổ ích Ví dụ điện gồm 60 ký tự Ta có: 60 = 2x2x5x3 đốì phường lại lập bảng chuyển vị cõ 2x30 30x2, Nói chung độ dài khóa thưòng nằm khoảng đó, chẳng hạn d ỉà chiều dài khóa chuyển vị thi d thưòng nằm khoảng 10 < d < 30 Điều phụ thuộc vào thói quen đôi tượng Chương 4: Thực hành phân tích số luật mã 139 Ta chia trường hỢp bảng đủ (tức bảng lấp đầy ô độ dài véctơ cột độ dài điện chia hết cho độ dài khóa) bảng thiếu (bảng không lấp đầy ô có số véctó cột ngắn cột khác ký tự) 3.3 Thuật toán thám trường hỢp bảng đả Giả sử ta nhận đưỢc mật điện sau gồm 60 ký tự đưỢc ghi thành nhóm ký tự: SIPSV ORINI LDLWN MSOOE PIMUN OTEIM FRENN lEODA NILPL PWNXS GOESM INLOR a Qua xác định mã pháp ta nhận định loại mã pháp chuyển vị đơn Phần tích ưỏc số chiều dài điện ta có: 60 = 5x3x2x2 b Giả sử theo kinh nghiệm đôi tượng ta biết đối tưỢng dùng bảng đủ (độ d i điện chia h ết cho độ d ài khóa) trê n sỏ p h ân tíc h vối k in h nghiệm ta bảng chuyển vị 10x6 6x10 (tức bảng gồm 10 hàng cột h àn g 10 cột) Ta lập đồng thòi hai bảng với kích cõ 10x6 6x10 A= 10 s p s V R N L D L w N F R E N N E D A N L p L M s 0 E p M u N T E M p w N X s G E s M N L R T insổ nguyẻn âm 4 Nhập môn Phân tích thông tin cỏ hào mật 140 Và bảng: Tần sổ nguyên âirn M G o D B= o D w N o o M M w N N N M N u N N N R Tính tần sô' đơn cùa điện: A D E F G i L M N p R 1 4 s T u V w X 1 - Tần sô' nguyên âm hàng xem Ta thấy đôi vdi bảng A tích tần số nguyên âm cùa hàng là: 3x4x4x4x5x2 =1920 Trong đôì vói bảng B tích (chú ý thay bỡi ỏ hàng cuối cùng): 2x3x4x2x2x2x2x2x2 = 1536 < 1920 Vậy theo bổ đề ta dự đoán độ dài khóa ỉà 10 bảng A hợp lý bảng B - Ghép cột: Lấy cặp cột tùy ý (có 90 cách ghép cột) Ví dụ; Chương 4: Thực hành phân lích số luật mã R Tần sổ nguy6n im N 1 (2) (1) s p s V L D (1) s p s V (3) L w N F R E Tần sổ nguyén âm 0 (1) s p s V (6) M s 0 E p Tẩn sổ nguyén Am 1 1 (1) s (7) M Tần sổ nguyẻn âm p u N s V 0 T 1 1 141 142 Nhập môn Phân tích thông tin có bào mật - Từ bổ đề (3) ta loại block đầu Ta xét block lai - Từ bảng tần sô' đôi móc xích, ta có: block (1),(6) block (1), (7) M(SM) = 16 M(SI) = 53 M(IS) = 61 M(IM) = 21 M(PO) = 30 M(PƯ) = M(SO) = 17 M(SN) = M(VE) = 44 M(VO) = M(OP) = 22 M(OT) = 30 Tổng 190 Tổng 116 Trong M( ) tầíi sô' đôi móc xích lấy từ PL 1.5 cho ỏ phần phụ lục Ta kết luận cột ghép (1) (6) hđp lý cột ghép (1) (7) ta loại block (1); (7) chấp nhận bỉock (1);(6) Thực đôi vói cặp cột tùy ý ta thấy block (1),(6) hỢp lý Bây giò sau có block (1), (6) ta tìm block cấp cách ghép bên trái bên phải cột tùy ý vào bỉock (1), (6) thử nghiệm cách tường tự Trong lần thành phần tổng ta lại nhân vối tần sô' tương ứng chữ đầu theo hàng bỉock cần xét: ví dụ ta ghép thêm cột vào bỉock (1), (6) Chương 4: Thực hành phân tích số luật mã s (6) M (3) L s w p N s 0 V E F R p E TS nguyẻn Am 1 1 (1) s p s V (6) M s 0 E p (2) R N ị L D TS nguy6n ầm 2 1 (3) L F (1) s p s (6) M s 0 R V E E p TS nguyin ảm 1 1 (2) R N L (1) s p s (6) M s 0 V E D p (1) c= D E= w N F= TS nguyên 2 1 143 Nhập môn Phân tich thông tin có báo mật 144 Vì block c D có tần số, nguyên âm, hàng nên ta sỏ để kết luận block đúng? Do ta làm sau: Vì tần sô" cùa văn là: A D E F G L M N p R s T u V w X 1 4 5 1 ta gọi tần số đđn chữ X M(X) Khi làm phép nhân, bảng không xuất đôi móc xích cặp ta thay đổi bỏi Block C: M(SMD) = M(S).M(SM).M(ML) M(SML) = 5x16x1 M(ISW) = 8x61x7 M[...]... khoảng 1. 300.000 ký tự) Tin số TỈn suất TT A 11 9205 0.0 917 B c 11 51 5886 0.0009 0.0045 D 38427 0.0296 E F 48425 4 913 9 0.0372 0.0378 Ghi chú 14 Nhập môn Phân tích thông Un có bào mật 5 218 9 0.04 01 87047 0.0670 77204 0.0594 246 0.0002 11 426 0.0088 15 987 0. 012 3 M 22670 0. 017 4 N 12 4204 0.0956 11 5059 0.0885 19 537 0. 015 0 76 81 0.0059 49870 0.0382 710 25 0.0546 70674 0.0544 w ?4?2Ọ 0,05 71 V 23 011 0. 017 7 w 612 55... 22670 0. 017 4 Ghi chú 13 Chương 1: Khái niệm về mã thám N 12 4204 0.0955 0 86968 0.0669 p 19 537 0. 015 0 Q 76 81 0.0059 R 18 585 0. 014 3 s 14 065 0. 010 8 T 74674 0.0574 u 74220 0.05 71 V 23 011 0. 017 7 w 476 0.0004 X 3336 0.0026 Y 16 766 0. 012 9 2 15 2 0.00 01 294 214 0.2263 space Có th ể th ấ y độ dài tru n g bình cùa từ tiến g v iệt không dấu là 4 ,4 1 8 5 (kể cả giãn cách) Bảng 1. 2: Bảng tẩn sô'đơn tiếng Việt có dấu... phụ lục 1) V iệc th ốn g kê các tầ n s ố của tiến g V iệt không dấu và có dấu đă được ghi lạ i ồ b ản g 1. 1 và bảng 1. 2 Bảng 1. 1: Bảng tần sô'đơn tiếng Việt không dấu (Tính trên khoảng 1. 300.000 ký tự) TT Tin sổ Tầnsuát A 12 3887 0.0953 B 13 925 0. 010 7 c 67432 0.0 519 D 38427 0.0296 E 4 716 2 0.0363 F 13 24 0.0 010 G 5 218 9 0.04 01 H 87047 0.0670 1 77204 0.0594 J 246 0.0002 K 11 426 0.0088 L 15 987 0. 012 3 M 22670... 0. 017 7 w 612 55 0.04 71 170 71 0. 013 1 16 767 0. 012 9 15 2 0.00 01 H K T ổng sô' ký tự k h oản g 1. 300.000 không kể dấu giãn cách 1. 3.2 Sự trừng lặp T rùng lặp là m ột qu y lu ậ t của bất cứ ngôn ngữ tự nhiên nào Đó là đặc trư ng th ứ 2 của ngôn ngữ được th ể hiện trên các văn bản thông báo (sa u đây gọi là bản rõ) N goài quy luật tầ n sô' th ì quy lu ậ t trù n g lặp rất cần th iết và có th ể nói chúng không... g | - ỉ l o g i =1, 9222 =H , H B ( X ) = - | l o g i - i l o g i = l o g 2 = l = Hj H c ( X ) = - ^ lo g ị- T lo g ^ 2 5 — log— =1, 3 61 U H , 10 ^10 ^ Chương 2: Một sổ kiển thức bổ trợ 25 B ây giờ ta đặt: H =X vớ i Pi = P(A), P2 = p(B), P3 = p(C) i=l T a có: H = — x l,9 22 2+ — x l + — xl,36Il 27 27 27 = — (9x1,9222 + 1 6 + 2 x 1 , 3 6 1 1) =1, 33 41 Rõ ràng là: I i í \ r \ _ ^ 27 I ^ 1 H ( X ) = - ^ lo... log227 = 4,755 B ây giò để áp d ụ n g ỉý th u y ết th ôn g tin vào công tác phân tích m ật m ã, ta x é t m ột v í dụ đđn g iả n sau đây Ta x ét E ntropy có đ iều k iệ n tro n g định ngh ĩa 3 Trưỏc h ế t ta x ét b ản g tầ n sô" bộ đôi móc xích T iến g A nh (bảng phụ lục PL 1. 5) Nhập môn Phần tích thông tin có bảo mật 26 26 Ta có: H ( X ) = - ^ p Ị x j / Y = a Ị l o g P ( x j / Y = a] i=i Trong đó: X... Aj* n ếu dj > dg (2 .14 ) T iếp th eo ta ký hiệu: h = ịc |V - V ,- Ị t * iV - V 2 + l n i (2 .15 ) vậy với ký h iệu này, b ấ t đ ẳn g th ứ c (2 .14 ) tư ơng đương với: (n ;-n ^ )v -'x > h (2 16 ) V ậy trong trưòng hỢp K = 2 và Vi = V 2 = V v à n ếu b ấ t đ ẳn g thức (2 .16 ) x ả y ra th ì X e A / T rái lạ i th ì X € Aa* Nhập môn Phân tich thông tin có bảo mật 36 Ví dụ 2: # Trong đó j = 1, 2, ,K và X = ( X... tích m ậ t m ã (m ă th á m -c r 3rptanalysis) tru y ền thống 2.2 MỘT só KHÁI NIỆM 2.2 .1 Độ bất dịnh (Entropy) Các định nghĩa Định nghĩa 1: G iả sử X ỉà m ột đ ại ỉư ợng n g ẫ u n h iê n lứ iận các g iá trị trên m ột tậ p hữ u h ạ n tư ơ ng ứng: p(X= Xị) = Pj; i = l , n { X |, X s ,^ , với các xác s u ấ t Nhập môn Phân tích thông tin có hào mật 22 ở đ â y 0 < Pị < 1 v à p , + P2 + + p„ = ị p i = 1. .. bản thông báo độ dài N, i € {a, b, c, ,z} Khi đó xác suất xuất hiện dây ký tự đưỢc ước lượng là: (2.3) Nhập môn Phân tích thông tin có bào mật 28 Lấy logarỉt cả h ai v ế của đẳng thức (2.3), ta có: 26 log p = N 2 ] Pị log Pị = - NH ( X ) = - NH i=l log Từ đó: H = 1 N - Do đó, H xấp xỉ ỉogarit nghịch đảo xác su ấ t đồng thòi của dãy các ký tự độ dài N chia cho N, ta có các định lý sau đây: Định lý 1: ... 27 27 16 2,2 27 =1, 2539 ... L 15 987 0. 012 3 M 22670 0. 017 4 Ghi 13 Chương 1: Khái niệm mã thám N 12 4204 0.0955 86968 0.0669 p 19 537 0. 015 0 Q 76 81 0.0059 R 18 585 0. 014 3 s 14 065 0. 010 8 T 74674 0.0574 u 74220 0.05 71 V 23 011 ... Việt có dấu kiểu telex (Tính khoảng 1. 300.000 ký tự) Tin số TỈn suất TT A 11 9205 0.0 917 B c 11 51 5886 0.0009 0.0045 D 38427 0.0296 E F 48425 4 913 9 0.0372 0.0378 Ghi 14 Nhập môn Phân tích thông. .. tích thông Un có bào mật 5 218 9 0.04 01 87047 0.0670 77204 0.0594 246 0.0002 11 426 0.0088 15 987 0. 012 3 M 22670 0. 017 4 N 12 4204 0.0956 11 5059 0.0885 19 537 0. 015 0 76 81 0.0059 49870 0.0382 710 25 0.0546