Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 79 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
79
Dung lượng
1,21 MB
Nội dung
ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ Trần Bá Ánh NHẬN DẠNG MỘT SỐ NGÔN NGỮ TỰ NHIÊN Ngành: Công nghệ Thông tin Mã số : 1.01.10 LUẬN VĂN THẠC SĨ NGƯỜI HƯỚNG DẪN KHOA HỌC TS Hồ Văn Canh Hà Nội – 2007 TIEU LUAN MOI download : skknchat@gmail.com MỤC LỤC Trang LỜI CAM ĐOAN LỜI CẢM ƠN MỤC LỤC MỞ ĐẦU CHƢƠNG 1: TỔNG QUAN VỀ NHẬN DẠNG 1.1 Tổng quan nhận dạng 1.1.1 Không gian biểu diễn đối tượng, không gian diễn dịch 1.1.2 Mơ hình chất q trình nhận dạng 10 1.1.2.1 Mơ hình 10 1.1.2.2 Bản chất trình nhận dạng 12 1.2 Nhận dạng dựa phân hoạch không gian 13 1.2.1 Phân hoạch không gian 13 1.2.2 Hàm phân lớp hay hàm định 13 1.2.3 Nhận dạng thống kê 15 1.2.4 Một số thuật toán nhận dạng tiêu biểu tự học 16 1.2.4.1 Thuật toán dựa vào khoảng cách lớn 16 1.2.4.2 Thuật toán K trung bình (giả sử có K lớp) 17 1.2.4.3 Thuật toán ISODATA 18 1.3 Nhận dạng theo cấu trúc 19 1.3.1 Biểu diễn định tính 19 1.3.2 Phương pháp định dựa vào cấu trúc 19 1.3.2.1 Một số khái niệm 19 1.3.2.2 Phương pháp nhận dạng 20 1.4 Mạng nơron nhân tạo nhận dạng theo mạng nơron 21 1.4.1 Bộ não Nơron sinh học 21 1.4.2 Mơ hình mạng nơron 24 1.4.2.1 Mơ hình nơron nhân tạo 24 1.4.2.2 Mạng nơron 25 1.5 Kết luận 26 CHƢƠNG VAI TRÒ CỦA PHƢƠNG PHÁP THỐNG KÊ TỐN ĐỐI VỚI NHẬN DẠNG NGƠN NGỮ TỰ NHIÊN HỌC 27 2.1 Bài toán 27 TIEU LUAN MOI download : skknchat@gmail.com 2.2 Nhận dạng có thày 28 2.3 Nhận dạng khơng có thày 33 2.3.1 Đặt toán 33 2.3.2 Giải toán trường hợp cho trước số k 34 2.3.3 Trường hợp số k chưa cho biết trước 37 2.4 Mơ hình xích Markov 38 CHƢƠNG KỸ THUẬT NHẬN DẠNG MỘT SỐ NGÔN NGỮ TỰ NHIÊN ANH, PHÁP, ĐỨC 42 3.1 Bài toán 42 3.2 Thuật toán 42 3.2.1 Phần off-line 42 3.2.2 Phần on-line 46 3.2.3 Một số ví dụ 48 3.3 Thuật toán 50 3.3.1 Phần off-line 50 3.3.2 Phần on-line 61 3.3.3 Một số ví dụ 63 CHƢƠNG KẾT QUẢ ĐẠT ĐƢỢC 75 4.1 Kết đạt đƣợc 75 4.1.1 Kết nhận dạng theo thuật toán 75 4.1.2 Kết nhận dạng theo thuật toán 75 4.2 So sánh thuật toán 75 4.3 Mã nguồn chƣơng trình 76 KẾT LUẬN 79 TÀI LIỆU THAM KHẢO 80 TIEU LUAN MOI download : skknchat@gmail.com MỞ ĐẦU Nhận dạng (pattern of Recognition) lý thuyết toán học có nhiều ứng dụng thực tiễn, nhƣ nhận dạng tiếng nói, nhận dạng hình ảnh, nhận dạng chữ ký, nhận dạng ngôn ngữ v.v Em đƣợc biết kỹ thuật nhận dạng ngôn ngữ tự nhiên công cụ xác suất thống kê đƣợc nhiều tác giả giới nghiên cứu họ có phiên nhận dạng số ngôn ngữ tự nhiên đƣợc giới thiệu bán, mạng Internet với giá 99,9 USD Tuy nhiên mua dùng nhƣ hộp đen Trong đó, nƣớc ta, em thấy chƣa có nhiều cơng trình nghiên cứu có kết tốt Chẳng hạn [3], phân biệt đƣợc ngôn ngữ Tiếng Anh với dãy giả ngẫu nhiên (tức văn không đọc đƣợc) mà độ dài mẫu phải 100 ký tự Ngày lý thuyết phát triển mạnh Đối với an ninh Quốc gia việc ứng dụng lý thuyết nhận dạng vào giải nhiều tốn quan trọng nhƣ nhận dạng ngơn ngữ, nhận dạng tiếng nói, nhận dạng chữ ký v.v Trong khuôn khổ luận văn, tập trung nghiên cứu, giải tốn nhận dạng ngơn ngữ (Recognition of language) tự nhiên dựa vào phân hoạch không gian (hay nhận dạng theo thống kê tốn học), lớp ngơn ngữ tiêu biểu đƣợc nghiên cứu Tiếng Anh, Tiếng Pháp Tiếng Đức Việc chọn ngơn ngữ làm mục tiêu nghiên cứu lý sau đây: Ngôn ngữ Anh, Pháp, Đức loại ngôn ngữ tiếng nay, đƣợc sử dụng rộng rãi Qua gần 10 năm kiểm soát thƣ điện tử hệ thống cung cấp dịch vụ: VDC, FPT, NetNam, Saigonpostel, cho thấy Tiếng Anh đƣợc sử dụng đến 75%, Tiếng Pháp Đức sử dụng đến 8% Nhƣ thứ tiếng chiếm tỷ lệ cao so với tất ngôn ngữ đƣợc sử dụng hệ thống nêu TIEU LUAN MOI download : skknchat@gmail.com Ba thứ tiếng dễ tìm kiếm, đƣợc nhiều ngƣời Việt Nam quen biết nên dễ tiếp cận với chúng Mặc dù vậy, hoàn chỉnh việc nghiên cứu ngơn ngữ này, dễ dàng mở rộng sang ngôn ngữ khác kể ngôn ngữ Phi La Tinh Hơn nữa, nhận dạng ngôn ngữ tự nhiên vấn đề thiếu việc phân tích mật mã đại Ngồi ra, cịn góp phần giảm thiểu nhân lực chi phí việc kiểm sốt thơng tin mạng Internet quan chức Đó ý nghĩa thực tiễn đề tài Nội dung luận văn vấn đề cần giải Nghiên cứu trình Markov hữu hạn trạng thái Nghiên cứu xây dựng mơ hình Markov ứng với ngôn ngữ tự nhiên nhƣ: Tiếng Anh, Tiếng Pháp Tiếng Đức Giải toán phân lớp đối tƣợng cho trƣờng hợp số lớp biết trƣớc số lớp chƣa biết Nghiên cứu xây dựng ƣớc lƣợng tham số xích Markov ứng với ngôn ngữ tự nhiên nêu Ứng dụng toán kiểm định giả thiết thống kê (testing of statistic hypothesis) để giải tốn nhận dạng ngơn ngữ Lập trình thử nghiệm Phƣơng pháp nghiên cứu + Nghiên cứu tài liệu (Tài liệu kỹ thuật thống kê tốn học q trình Markov); + Các quy luật ngơn ngữ nhƣ q trình ngẫu nhiên dừng, không hậu quả; Cấu trúc luận văn đƣợc chia thành chƣơng: TIEU LUAN MOI download : skknchat@gmail.com (LUAN.van.THAC.si).nhan.dang.mot.so.ngon.ngu.tu.nhien.luan.van.ths.cong.nghe.thong.tin.1.01.10(LUAN.van.THAC.si).nhan.dang.mot.so.ngon.ngu.tu.nhien.luan.van.ths.cong.nghe.thong.tin.1.01.10(LUAN.van.THAC.si).nhan.dang.mot.so.ngon.ngu.tu.nhien.luan.van.ths.cong.nghe.thong.tin.1.01.10(LUAN.van.THAC.si).nhan.dang.mot.so.ngon.ngu.tu.nhien.luan.van.ths.cong.nghe.thong.tin.1.01.10 Chƣơng 1: "Tổng quan nhận dạng", trình bày tổng quan hƣớng nghiên cứu nhận dạng Chƣơng 2: "Vai trò phƣơng pháp thống kê tốn học nhận dạng ngơn ngữ tự nhiên", trình bày ứng dụng kỹ thuật thống kê Tốn học để nhận dạng ngơn ngữ tự nhiên Chƣơng 3: "Kỹ thuật nhận dạng số ngôn ngữ tự nhiên Anh, Pháp, Đức", trình bày thuật tốn nhận dạng ngôn ngữ Anh, Pháp Đức Chƣơng 4: "Kết đạt đƣợc", đƣa kết nhận dạng với mẫu ngôn ngữ Anh, Pháp Đức (LUAN.van.THAC.si).nhan.dang.mot.so.ngon.ngu.tu.nhien.luan.van.ths.cong.nghe.thong.tin.1.01.10(LUAN.van.THAC.si).nhan.dang.mot.so.ngon.ngu.tu.nhien.luan.van.ths.cong.nghe.thong.tin.1.01.10(LUAN.van.THAC.si).nhan.dang.mot.so.ngon.ngu.tu.nhien.luan.van.ths.cong.nghe.thong.tin.1.01.10(LUAN.van.THAC.si).nhan.dang.mot.so.ngon.ngu.tu.nhien.luan.van.ths.cong.nghe.thong.tin.1.01.10 TIEU LUAN MOI download : skknchat@gmail.com (LUAN.van.THAC.si).nhan.dang.mot.so.ngon.ngu.tu.nhien.luan.van.ths.cong.nghe.thong.tin.1.01.10(LUAN.van.THAC.si).nhan.dang.mot.so.ngon.ngu.tu.nhien.luan.van.ths.cong.nghe.thong.tin.1.01.10(LUAN.van.THAC.si).nhan.dang.mot.so.ngon.ngu.tu.nhien.luan.van.ths.cong.nghe.thong.tin.1.01.10(LUAN.van.THAC.si).nhan.dang.mot.so.ngon.ngu.tu.nhien.luan.van.ths.cong.nghe.thong.tin.1.01.10 CHƢƠNG 1: TỔNG QUAN VỀ NHẬN DẠNG 1.1 Tổng quan nhận dạng Nhận dạng trình phân loại đối tƣợng đƣợc biểu diễn theo mơ hình gán cho chúng vào lớp (gán cho đối tƣợng tên gọi) dựa theo quy luật mẫu chuẩn Quá trình nhận dạng dựa vào mẫu học biết trƣớc gọi nhận dạng có thày hay học có thày (supervised learning); trƣờng hợp ngƣợc lại học khơng có thày (non supervised learning) 1.1.1 Không gian biểu diễn đối tượng, không gian diễn dịch Không gian biểu diễn đối tượng Các đối tƣợng quan sát hay thu thập đƣợc, thƣờng đƣợc biểu diễn tập đặc trƣng hay đặc tính Nhƣ trƣờng hợp xử lý ảnh, ảnh sau đƣợc tăng cƣờng để nâng cao chất lƣợng, phân vùng trích chọn đặc tính đƣợc biểu diễn đặc trƣng nhƣ biên, miền đồng nhất,v.v Ngƣời ta thƣờng phân đặc trƣng theo loại nhƣ: đặc trƣng tơpơ, đặc trƣng hình học đặc trƣng chức Việc biểu diễn ảnh theo đặc trƣng phụ thuộc vào ứng dụng Ở ta đƣa cách hình thức việc biểu diễn đối tƣợng Giả sử đối tƣợng X (ảnh, chữ viết, dấu vân tay,v.v.); đƣợc biểu diễn n thành phần (n đặc trƣng): X={x1,x2, ,xn}; xi biểu diễn đặc tính Không gian biểu diễn đối tƣợng thƣờng gọi tắt không gian đối tƣợng X đƣợc ký hiệu là: X ={X1,X2, ,Xn} Xi biểu diễn đối tƣợng Khơng gian vơ hạn Để tiện xem xét xét tập X hữu hạn Không gian diễn dịch Không gian diễn dịch tập tên gọi đối tƣợng Kết thúc trình nhận dạng ta xác định đƣợc tên gọi cho đối tƣợng tập không gian đối tƣợng hay nói nhận dạng đƣợc đối tƣợng Một cách hình thức gọi tập tên đối tƣợng: ={w1,w2, ,wk} với wi, i =1,2, ,k tên đối tƣợng: (LUAN.van.THAC.si).nhan.dang.mot.so.ngon.ngu.tu.nhien.luan.van.ths.cong.nghe.thong.tin.1.01.10(LUAN.van.THAC.si).nhan.dang.mot.so.ngon.ngu.tu.nhien.luan.van.ths.cong.nghe.thong.tin.1.01.10(LUAN.van.THAC.si).nhan.dang.mot.so.ngon.ngu.tu.nhien.luan.van.ths.cong.nghe.thong.tin.1.01.10(LUAN.van.THAC.si).nhan.dang.mot.so.ngon.ngu.tu.nhien.luan.van.ths.cong.nghe.thong.tin.1.01.10 TIEU LUAN MOI download : skknchat@gmail.com (LUAN.van.THAC.si).nhan.dang.mot.so.ngon.ngu.tu.nhien.luan.van.ths.cong.nghe.thong.tin.1.01.10(LUAN.van.THAC.si).nhan.dang.mot.so.ngon.ngu.tu.nhien.luan.van.ths.cong.nghe.thong.tin.1.01.10(LUAN.van.THAC.si).nhan.dang.mot.so.ngon.ngu.tu.nhien.luan.van.ths.cong.nghe.thong.tin.1.01.10(LUAN.van.THAC.si).nhan.dang.mot.so.ngon.ngu.tu.nhien.luan.van.ths.cong.nghe.thong.tin.1.01.10 Quá trình nhận dạng đối tƣợng ánh xạ f: X với f tập quy luật để định phần tử X ứng với phần tử Nếu tập quy luật tập tên đối tƣợng biết trƣớc nhƣ nhận dạng chữ viết (có 26 lớp từ A đến Z), ngƣời ta gọi nhận dạng có thày Trƣờng hợp thứ hai nhận dạng khơng có thày Đƣơng nhiên trƣờng hợp việc nhận dạng có khó khăn 1.1.2 Mơ hình chất q trình nhận dạng 1.1.2.1 Mơ hình Việc chọn lựa q trình nhận dạng có liên quan mật thiết đến kiểu mô tả mà ngƣời ta sử dụng để đặc tả đối tƣợng Trong nhận dạng, ngƣời ta phân chia làm hai họ lớn: [1] - Họ mô tả theo tham số; - Họ mô tả theo cấu trúc Cách mô tả đƣợc lựa chọn xác định mơ hình đối tƣợng Nhƣ vậy, có hai loại mơ hình: mơ hình theo tham số mơ hình cấu trúc Mơ hình tham số sử dụng vectơ để đặc tả đối tƣợng, phần tử vectơ mơ tả đặc tính đối tƣợng Thí dụ nhƣ đặc trƣng chức năng, ngƣời ta sử dụng hàm sở trực giao để biểu diễn Và nhƣ ảnh đƣợc biểu diễn chuỗi hàm trực giao Giả sử C đƣờng bao ảnh C(i,j) điểm thứ i đƣờng bao, i = 1, 2, , N (đƣờng bao gồm N điểm) Giả sử tiếp: x0 N xi N i 1 y0 N yi N i 1 tọa độ tâm điểm Nhƣ vậy, momen trung tâm bậc p, q đƣờng bao pq N (x i x ) p ( y i y ) q N i 1 (1.1) (LUAN.van.THAC.si).nhan.dang.mot.so.ngon.ngu.tu.nhien.luan.van.ths.cong.nghe.thong.tin.1.01.10(LUAN.van.THAC.si).nhan.dang.mot.so.ngon.ngu.tu.nhien.luan.van.ths.cong.nghe.thong.tin.1.01.10(LUAN.van.THAC.si).nhan.dang.mot.so.ngon.ngu.tu.nhien.luan.van.ths.cong.nghe.thong.tin.1.01.10(LUAN.van.THAC.si).nhan.dang.mot.so.ngon.ngu.tu.nhien.luan.van.ths.cong.nghe.thong.tin.1.01.10 10 TIEU LUAN MOI download : skknchat@gmail.com (LUAN.van.THAC.si).nhan.dang.mot.so.ngon.ngu.tu.nhien.luan.van.ths.cong.nghe.thong.tin.1.01.10(LUAN.van.THAC.si).nhan.dang.mot.so.ngon.ngu.tu.nhien.luan.van.ths.cong.nghe.thong.tin.1.01.10(LUAN.van.THAC.si).nhan.dang.mot.so.ngon.ngu.tu.nhien.luan.van.ths.cong.nghe.thong.tin.1.01.10(LUAN.van.THAC.si).nhan.dang.mot.so.ngon.ngu.tu.nhien.luan.van.ths.cong.nghe.thong.tin.1.01.10 Vectơ tham số trƣờng hợp momen ij với i=1,2, ,p j=1,2, ,q Còn đặc trƣng hình học ngƣời ta hay sử dụng chu tuyến, đƣờng bao, diện tích tỉ lệ T = S/p2, với S diện tích, p chu tuyến Việc lựa chọn phƣơng pháp biểu diễn làm đơn giản cách xây dựng Tuy nhiên, việc lựa chọn đặc trƣng hoàn toàn phụ thuộc vào ứng dụng Thí dụ, nhận dạng chữ, tham số dấu hiệu: - Số điểm chạc ba, chạc tƣ, - Số điểm chu trình, - Số điểm ngoặt, - Số điểm kết thúc, Chẳng hạn với chữ t có điểm kết thúc, điểm chạc tƣ, Mơ hình cấu trúc: Cách tiếp cận mơ hình dựa vào việc mơ tả đối tƣợng nhờ số khái niệm biểu thị đối tƣợng sở ngôn ngữ tự nhiên Để mô tả đối tƣợng, ngƣời ta dùng số dạng nguyên thủy nhƣ đoạn thẳng, cung,.v.v Chẳng hạn, hình chữ nhật đƣợc định nghĩa gồm đoạn thẳng vng góc với đơi Trong mơ hình ngƣời ta sử dụng kí hiệu kết thúc Vt, kí hiệu khơng kết thúc gọi Vn Ngồi ra, có dùng tập luật sản xuất để mô tả cách xây dựng đối tƣợng phù hợp dựa đối tƣợng đơn giản đối tƣợng nguyên thủy (tập Vt) Trong cách tiếp cận này, ta chấp nhận khẳng định là: Cấu trúc dạng kết việc áp dụng luật sản xuất theo nguyên tắc xác định từ dạng gốc bắt đầu Một cách hình thức, ta coi mơ hình tƣơng đƣơng văn phạm G = (Vt, Vn, P, S) với: - Vt kí hiệu kết thúc, - Vn kí hiệu không kết thúc, - P luật sản xuất, - S dạng (kí hiệu bắt đầu) (LUAN.van.THAC.si).nhan.dang.mot.so.ngon.ngu.tu.nhien.luan.van.ths.cong.nghe.thong.tin.1.01.10(LUAN.van.THAC.si).nhan.dang.mot.so.ngon.ngu.tu.nhien.luan.van.ths.cong.nghe.thong.tin.1.01.10(LUAN.van.THAC.si).nhan.dang.mot.so.ngon.ngu.tu.nhien.luan.van.ths.cong.nghe.thong.tin.1.01.10(LUAN.van.THAC.si).nhan.dang.mot.so.ngon.ngu.tu.nhien.luan.van.ths.cong.nghe.thong.tin.1.01.10 11 TIEU LUAN MOI download : skknchat@gmail.com (LUAN.van.THAC.si).nhan.dang.mot.so.ngon.ngu.tu.nhien.luan.van.ths.cong.nghe.thong.tin.1.01.10(LUAN.van.THAC.si).nhan.dang.mot.so.ngon.ngu.tu.nhien.luan.van.ths.cong.nghe.thong.tin.1.01.10(LUAN.van.THAC.si).nhan.dang.mot.so.ngon.ngu.tu.nhien.luan.van.ths.cong.nghe.thong.tin.1.01.10(LUAN.van.THAC.si).nhan.dang.mot.so.ngon.ngu.tu.nhien.luan.van.ths.cong.nghe.thong.tin.1.01.10 1.1.2.2 Bản chất trình nhận dạng Quá trình nhận dạng gồm giai đoạn [1]: - Lựa chọn mơ hình biểu diễn đối tƣợng, - Lựa chọn luật định (phƣơng pháp nhận dạng) suy diễn trình học - Học nhận dạng Khi mơ hình biểu diễn đƣợc xác định, định lƣợng (mơ hình tham số) hay định tính (mơ hình cấu trúc), trình nhận dạng chuyển sang giai đoạn học Học giai đoạn quan trọng Thao tác học nhằm cải thiện, điều chỉnh việc phân hoạch tập đối tƣợng thành lớp Việc nhận dạng tìm quy luật thuật tốn để gán đối tƣợng vào lớp hay nói cách khác gán cho đối tƣợng tên Học có thày (supervised learning) Kỹ thuật phân loại nhờ kiến thức biết trƣớc gọi học có thày Đặc điểm kỹ thuật ngƣời ta có thƣ viện mẫu chuẩn Mẫu cần nhận dạng đƣợc đem đối sánh với mẫu chuẩn để xem thuộc loại Thí dụ nhƣ ảnh viễn thám, ngƣời ta muốn phân biệt cánh đồng lúa, cánh rừng hay vùng đất hoang mà có miêu tả đối tƣợng Vấn đề chủ yếu thiết kế hệ thống để đối sánh đối tƣợng ảnh với mẫu chuẩn định gán cho chúng vào lớp Việc đối sánh nhờ vào thủ tục định dựa công cụ gọi hàm phân lớp hay hàm định Hàm đƣợc đề cập phần sau Học khơng có thày (unsupervised learning) Kỹ thuật học tự định lớp khác xác định tham số đặc trƣng cho lớp Học khơng có thày đƣơng nhiên khó khăn Một mặt, số lớp không đƣợc biết trƣớc, mặt khác đặc trƣng lớp trƣớc Kỹ thuật nhằm tiến hành cách gộp nhóm chọn lựa cách tốt Bắt đầu từ tập liệu, nhiều thủ tục xử lý khác nhằm phân lớp nâng cấp dần để đƣợc phƣơng án phân loại (LUAN.van.THAC.si).nhan.dang.mot.so.ngon.ngu.tu.nhien.luan.van.ths.cong.nghe.thong.tin.1.01.10(LUAN.van.THAC.si).nhan.dang.mot.so.ngon.ngu.tu.nhien.luan.van.ths.cong.nghe.thong.tin.1.01.10(LUAN.van.THAC.si).nhan.dang.mot.so.ngon.ngu.tu.nhien.luan.van.ths.cong.nghe.thong.tin.1.01.10(LUAN.van.THAC.si).nhan.dang.mot.so.ngon.ngu.tu.nhien.luan.van.ths.cong.nghe.thong.tin.1.01.10 12 TIEU LUAN MOI download : skknchat@gmail.com (LUAN.van.THAC.si).nhan.dang.mot.so.ngon.ngu.tu.nhien.luan.van.ths.cong.nghe.thong.tin.1.01.10(LUAN.van.THAC.si).nhan.dang.mot.so.ngon.ngu.tu.nhien.luan.van.ths.cong.nghe.thong.tin.1.01.10(LUAN.van.THAC.si).nhan.dang.mot.so.ngon.ngu.tu.nhien.luan.van.ths.cong.nghe.thong.tin.1.01.10(LUAN.van.THAC.si).nhan.dang.mot.so.ngon.ngu.tu.nhien.luan.van.ths.cong.nghe.thong.tin.1.01.10 z z Ta tiếp tục tính lần thứ 2: Sử dụng bảng B2 tính C f jk b (jk2 ) ja k a Dịng Các phép tính tƣơng ứng dịng bảng B2 F A 1.3 + 1.(-1) + 1.11 + B 1.6 + C 1.(-10) + 1.5 + 1.(-10) + D 1.(-1) + E 1.5 + 2.8 + 1.3 + 2.1 + 4.2 + 2.(-2) + G 1.11 + 2.4 + H 1.11 + 1.4 + 1.11 + I 2.4 + 1.2 + 2.(-2) + K 1.11 + L 1.(-10) + M 1.(-4) + N 1.1 + 1.3 + 1.5 + R 2.(-2) + 1.9 + 1.11 + 1.2 + 1.(-1) + S 2.(-1) + 1.2 + T 1.(-2) + 1.11 + U 1.(-1) + 1.2 + 1.(-4) + 1.(-3) + V 1.(-4) + W 1.11 + Z 2.11 = 139 S = 139 > Vậy mẫu X thuộc lớp X1 tức văn tiếng Đức (LUAN.van.THAC.si).nhan.dang.mot.so.ngon.ngu.tu.nhien.luan.van.ths.cong.nghe.thong.tin.1.01.10(LUAN.van.THAC.si).nhan.dang.mot.so.ngon.ngu.tu.nhien.luan.van.ths.cong.nghe.thong.tin.1.01.10(LUAN.van.THAC.si).nhan.dang.mot.so.ngon.ngu.tu.nhien.luan.van.ths.cong.nghe.thong.tin.1.01.10(LUAN.van.THAC.si).nhan.dang.mot.so.ngon.ngu.tu.nhien.luan.van.ths.cong.nghe.thong.tin.1.01.10 67 TIEU LUAN MOI download : skknchat@gmail.com (LUAN.van.THAC.si).nhan.dang.mot.so.ngon.ngu.tu.nhien.luan.van.ths.cong.nghe.thong.tin.1.01.10(LUAN.van.THAC.si).nhan.dang.mot.so.ngon.ngu.tu.nhien.luan.van.ths.cong.nghe.thong.tin.1.01.10(LUAN.van.THAC.si).nhan.dang.mot.so.ngon.ngu.tu.nhien.luan.van.ths.cong.nghe.thong.tin.1.01.10(LUAN.van.THAC.si).nhan.dang.mot.so.ngon.ngu.tu.nhien.luan.van.ths.cong.nghe.thong.tin.1.01.10 Ví dụ 3.7: Cho văn X= Vous pouvez également être conduits, l'occasion de l'utilisation du Service, Tính tần số đơi móc xích, đƣợc bảng sau (Ký hiệu bảng F) A B C D E F G H I A J K L M N O P Q R S T U V W X Y Z 1 B C 1 D 1 E 1 1 1 1 F G H I 1 J K L M N 1 O 1 P Q R S 1 1 T U V 1 1 1 1 W X Y Z (LUAN.van.THAC.si).nhan.dang.mot.so.ngon.ngu.tu.nhien.luan.van.ths.cong.nghe.thong.tin.1.01.10(LUAN.van.THAC.si).nhan.dang.mot.so.ngon.ngu.tu.nhien.luan.van.ths.cong.nghe.thong.tin.1.01.10(LUAN.van.THAC.si).nhan.dang.mot.so.ngon.ngu.tu.nhien.luan.van.ths.cong.nghe.thong.tin.1.01.10(LUAN.van.THAC.si).nhan.dang.mot.so.ngon.ngu.tu.nhien.luan.van.ths.cong.nghe.thong.tin.1.01.10 68 TIEU LUAN MOI download : skknchat@gmail.com (LUAN.van.THAC.si).nhan.dang.mot.so.ngon.ngu.tu.nhien.luan.van.ths.cong.nghe.thong.tin.1.01.10(LUAN.van.THAC.si).nhan.dang.mot.so.ngon.ngu.tu.nhien.luan.van.ths.cong.nghe.thong.tin.1.01.10(LUAN.van.THAC.si).nhan.dang.mot.so.ngon.ngu.tu.nhien.luan.van.ths.cong.nghe.thong.tin.1.01.10(LUAN.van.THAC.si).nhan.dang.mot.so.ngon.ngu.tu.nhien.luan.van.ths.cong.nghe.thong.tin.1.01.10 z z Lần thứ 1: Sử dụng bảng B1 tính C f jk b (jk1) ja k a Các phép tính tƣơng ứng dòng bảng B1 F Dòng A 1.(-5) + 1.(-4) + 1.(-4) + C 1.11 + 1.11 + 1.11 + 1.11 + 1.11 + D 1.(-9) + 2.(-1) + E 1.(-1) + 1.(-5) + 1.(-4) + 1.(-11) + 1.(-10) + G 1.(-2) + I 1.(-6) + 1.(-3) + 2.3 + 1.(-5) + 1.(-5) + L 1.(-5) + 1.(-5) + 1.1 + M 1.(-3) + N 3.(-9) + 1.(-4) + O 3.(-3) + 2.11 + P 1.8 + R 1.(-7) + 1.3 + S 1.(-2) + 1.(-7) + 1.(-5) + 1.2 + T 2.(-4) + 1.(-3) + 1.(-4) + 1.(-2) + U 1.6 + 2.(-3) + 1.(-2) + 1.3 + V 1.(-3) + 1.1 + 1.(-3) + Z 1.11 = -63 Vậy C = -63 < Suy X văn đọc đƣợc nhƣng chƣa biết thuộc ngôn ngữ z z Ta tiếp tục tính lần 2: Sử dụng bảng B2 tính C f jk b (jk2 ) ja k a Các phép tính tƣơng ứng dòng bảng B2 F Dòng A 1.(-1) + 1.(-2) + C 1.(-10) + 1.(-10) + 1.(-10) + 1.(-10) + 1.(-10) + D 1.(-1) + 2.(-3) + E 1.(-5) + 1.(-3) + 1.3 + 1.1 + 1.2 + 1.2 + G 1.1 + I 1.4 + 1.(-3) + 2.(-7) + 1.(-2) + 1.(-2) + L 1.(-4) + 1.1 + 1.(-5) + 1.(-4) + M 1.(-4) + N 3.2 + 1.(-5) + O 1.1 + 3.(-5) + 2.(-10) + (LUAN.van.THAC.si).nhan.dang.mot.so.ngon.ngu.tu.nhien.luan.van.ths.cong.nghe.thong.tin.1.01.10(LUAN.van.THAC.si).nhan.dang.mot.so.ngon.ngu.tu.nhien.luan.van.ths.cong.nghe.thong.tin.1.01.10(LUAN.van.THAC.si).nhan.dang.mot.so.ngon.ngu.tu.nhien.luan.van.ths.cong.nghe.thong.tin.1.01.10(LUAN.van.THAC.si).nhan.dang.mot.so.ngon.ngu.tu.nhien.luan.van.ths.cong.nghe.thong.tin.1.01.10 69 TIEU LUAN MOI download : skknchat@gmail.com (LUAN.van.THAC.si).nhan.dang.mot.so.ngon.ngu.tu.nhien.luan.van.ths.cong.nghe.thong.tin.1.01.10(LUAN.van.THAC.si).nhan.dang.mot.so.ngon.ngu.tu.nhien.luan.van.ths.cong.nghe.thong.tin.1.01.10(LUAN.van.THAC.si).nhan.dang.mot.so.ngon.ngu.tu.nhien.luan.van.ths.cong.nghe.thong.tin.1.01.10(LUAN.van.THAC.si).nhan.dang.mot.so.ngon.ngu.tu.nhien.luan.van.ths.cong.nghe.thong.tin.1.01.10 Các phép tính tƣơng ứng dịng bảng B2 F Dòng P 1.(-12) + R 1.(-2) + 1.(-1) + S 1.(-4) + 1.(-1) + 1.(-7) + 1.(-4) + T 2.(-3) + 1.(-4) + 1.(-1) + U 1.(-11) + 2.(-3) + 1.(-3) + 1.(-5) + V 1.(-1) + 1.(-4) + 1.1 = -196 Vậy C = -196 < Suy X văn đọc đƣợc nhƣng chƣa biết thuộc ngôn ngữ z z Ta tiếp tục tính lần 3: Sử dụng bảng B3 tính C f jk b (jk3) ja k a Các phép tính tƣơng ứng dịng bảng B3 F Dòng A 1.(-1) + 1.(-2) + 1.(-3) + C 1.(-2) + 1.1 + 1.1 + 1.(-4) + D 1.4 + 2.1 + E 1.1 + 1.2 + 1.(-5) + 1.1 + 1.(-1) + 1.11 + G 1.(-2) + I 1.(-3) + 1.1 + 2.(-1) + 1.(-1) + L 1.4 + 1.1 + 1.4 + M 1.1 + N 3.(-2) + 1.1 + O 1.(-3) + 2.2 + P 1.1 + R 1.(-2) + S 1.2 + 1.(-1) + 1.5 + 1.5 + T 2.(-1) + 1.1 + 1.(-1) + 1.(-2) + U 1.6 + 2.2 + 1.1 + 1.5 + V 1.(-3) + 1.(-1) + 1.4 = 26 C = 26 > Vậy mẫu X thuộc lớp X2 tức văn tiếng Pháp (LUAN.van.THAC.si).nhan.dang.mot.so.ngon.ngu.tu.nhien.luan.van.ths.cong.nghe.thong.tin.1.01.10(LUAN.van.THAC.si).nhan.dang.mot.so.ngon.ngu.tu.nhien.luan.van.ths.cong.nghe.thong.tin.1.01.10(LUAN.van.THAC.si).nhan.dang.mot.so.ngon.ngu.tu.nhien.luan.van.ths.cong.nghe.thong.tin.1.01.10(LUAN.van.THAC.si).nhan.dang.mot.so.ngon.ngu.tu.nhien.luan.van.ths.cong.nghe.thong.tin.1.01.10 70 TIEU LUAN MOI download : skknchat@gmail.com (LUAN.van.THAC.si).nhan.dang.mot.so.ngon.ngu.tu.nhien.luan.van.ths.cong.nghe.thong.tin.1.01.10(LUAN.van.THAC.si).nhan.dang.mot.so.ngon.ngu.tu.nhien.luan.van.ths.cong.nghe.thong.tin.1.01.10(LUAN.van.THAC.si).nhan.dang.mot.so.ngon.ngu.tu.nhien.luan.van.ths.cong.nghe.thong.tin.1.01.10(LUAN.van.THAC.si).nhan.dang.mot.so.ngon.ngu.tu.nhien.luan.van.ths.cong.nghe.thong.tin.1.01.10 Ví dụ 3.8: Cho văn X=Edit windows are where you type in and edit your Turbo Pascal code You can also the following in an Edit window: Tính tần số đơi móc xích, đƣợc bảng sau (Ký hiệu bảng F) A B C D E F G H I A J K L M N O P Q R S T U V W X Y Z B C 1 D E 3 1 F G H I J K L 1 1 M N 3 O P 1 1 1 3 Q R S 1 T U 1 1 2 V W X Y (LUAN.van.THAC.si).nhan.dang.mot.so.ngon.ngu.tu.nhien.luan.van.ths.cong.nghe.thong.tin.1.01.10(LUAN.van.THAC.si).nhan.dang.mot.so.ngon.ngu.tu.nhien.luan.van.ths.cong.nghe.thong.tin.1.01.10(LUAN.van.THAC.si).nhan.dang.mot.so.ngon.ngu.tu.nhien.luan.van.ths.cong.nghe.thong.tin.1.01.10(LUAN.van.THAC.si).nhan.dang.mot.so.ngon.ngu.tu.nhien.luan.van.ths.cong.nghe.thong.tin.1.01.10 71 TIEU LUAN MOI download : skknchat@gmail.com (LUAN.van.THAC.si).nhan.dang.mot.so.ngon.ngu.tu.nhien.luan.van.ths.cong.nghe.thong.tin.1.01.10(LUAN.van.THAC.si).nhan.dang.mot.so.ngon.ngu.tu.nhien.luan.van.ths.cong.nghe.thong.tin.1.01.10(LUAN.van.THAC.si).nhan.dang.mot.so.ngon.ngu.tu.nhien.luan.van.ths.cong.nghe.thong.tin.1.01.10(LUAN.van.THAC.si).nhan.dang.mot.so.ngon.ngu.tu.nhien.luan.van.ths.cong.nghe.thong.tin.1.01.10 z z Lần thứ 1: Sử dụng bảng B1 tính C f jk b (jk1) ja k a Các phép tính tƣơng ứng dòng bảng B1 F Dòng A 2.(-5) + 3.(-6) + 1.(-4) + 1.(-4) + B 1.3 + C 2.11 + 1.11 + D 2.(-9) + 3.(-6) + E 3.(-5) + 1.(-3) + 1.(-9) + 1.(-10) + 1.(-2) + 2.11 + F 1.2 + G 1.(-1) + H 2.(-7) + I 5.(-8) + 3.(-5) + L 1.11 + 1.(-3) + 1.1 + 1.(-2) + N 3.(-5) + 3.(-9) + 1.(-7) + 1.(-6) + O 2.1 + 1.(-2) + 1.3 + 1.(-1) + 3.11 + 3.8 + P 1.3 + 1.3 + R 1.3 + 2.(-7) + 1.(-4) + S 1.(-2) + 1.(-6) + 1.(-4) + T 1.(-1) + 1.(-3) + 2.(-1) + 2.11 + U 1.1 + 2.(-3) + 1.(-2) + V 1.11 + W 1.11 + 3.(-4) + 1.11 + Y 3.11 + 1.11 = -57 S= -57 < Suy X văn đọc đƣợc, nhƣng chƣa biết thuộc ngôn ngữ z z Ta tiếp tục tính lần thứ 2: Sử dụng bảng B2 tính C f jk b (jk2 ) ja k a Các phép tính tƣơng ứng dòng bảng B2 F Dòng A 3.(-2) + 1.(-3) + 1.(-1) + B 1.(-2) + C 2.(-10) + 1.(-10) + D 2.(-1) + 3.2 + 3.(-2) + E 3.(-2) + 1.8 + 1.2 + 1.11 + 2.(-10) + F 1.(-3) + H 2.4 + I 5.2 + 3.(-2) + L 1.(-10) + 1.(-2) + 1.(-5) + 1.2 + (LUAN.van.THAC.si).nhan.dang.mot.so.ngon.ngu.tu.nhien.luan.van.ths.cong.nghe.thong.tin.1.01.10(LUAN.van.THAC.si).nhan.dang.mot.so.ngon.ngu.tu.nhien.luan.van.ths.cong.nghe.thong.tin.1.01.10(LUAN.van.THAC.si).nhan.dang.mot.so.ngon.ngu.tu.nhien.luan.van.ths.cong.nghe.thong.tin.1.01.10(LUAN.van.THAC.si).nhan.dang.mot.so.ngon.ngu.tu.nhien.luan.van.ths.cong.nghe.thong.tin.1.01.10 72 TIEU LUAN MOI download : skknchat@gmail.com (LUAN.van.THAC.si).nhan.dang.mot.so.ngon.ngu.tu.nhien.luan.van.ths.cong.nghe.thong.tin.1.01.10(LUAN.van.THAC.si).nhan.dang.mot.so.ngon.ngu.tu.nhien.luan.van.ths.cong.nghe.thong.tin.1.01.10(LUAN.van.THAC.si).nhan.dang.mot.so.ngon.ngu.tu.nhien.luan.van.ths.cong.nghe.thong.tin.1.01.10(LUAN.van.THAC.si).nhan.dang.mot.so.ngon.ngu.tu.nhien.luan.van.ths.cong.nghe.thong.tin.1.01.10 Các phép tính tƣơng ứng dịng bảng B2 F Dòng N 3.1 + 3.2 + 1.3 + O 2.4 + 1.(-1) + 1.(-4) + 1.1 + 3.(-10) + 3.11 + P 1.(-10) + 1.(-8) + R 1.4 + 2.(-2) + S 1.(-4) + 1.3 + 1.(-1) + T 1.4 + 1.1 + 2.11 + U 1.(-2) + 2.(-4) + 1.(-3) + W 3.11 = -9 C = -9 < Suy X văn đọc đƣợc nhƣng chƣa biết X thuộc ngôn ngữ z z Ta tiếp tục tính lần thứ Sử dụng bảng B3 tính C f jk b (jk3) ja k a Dịng Các phép tính tƣơng ứng dịng bảng B3 F A 2.(-1) + 3.(-1) + 1.(-2) + B 1.(-2) + C 2.(-2) + 1.1 + D 2.4 + 3.(-2) + E 3.(-1) + 1.(-1) + 1.(-4) + 1.(-1) + 1.(-10) + 2.(-5) + F 1.(-4) + G 1.(-1) + H 2.(-7) + I 5.(-3) + 3.(-1) + L 1.(-5) + 1.1 + 1.(-2) + N 3.(-1) + 3.(-2) + 1.2 + 1.(-4) + O 2.(-7) + 1.1 + 1.5 + 1.(-5) + 3.2 + 3.(-10) + P 1.4 + R 1.(-7) + 1.(-1) + S 1.2 + T 1.(-14) + 1.(-1) + 2.(-10) + 2.(-10) + U 1.1 + 2.1 + 1.1 + W 1.(-10) + 3.(-10) + 1.(-10) + Y 3.(-10) + 1.(-10) = -273 C = -273 < Suy X văn đọc đƣợc nhƣng chƣa biết X thuộc ngôn ngữ (LUAN.van.THAC.si).nhan.dang.mot.so.ngon.ngu.tu.nhien.luan.van.ths.cong.nghe.thong.tin.1.01.10(LUAN.van.THAC.si).nhan.dang.mot.so.ngon.ngu.tu.nhien.luan.van.ths.cong.nghe.thong.tin.1.01.10(LUAN.van.THAC.si).nhan.dang.mot.so.ngon.ngu.tu.nhien.luan.van.ths.cong.nghe.thong.tin.1.01.10(LUAN.van.THAC.si).nhan.dang.mot.so.ngon.ngu.tu.nhien.luan.van.ths.cong.nghe.thong.tin.1.01.10 73 TIEU LUAN MOI download : skknchat@gmail.com (LUAN.van.THAC.si).nhan.dang.mot.so.ngon.ngu.tu.nhien.luan.van.ths.cong.nghe.thong.tin.1.01.10(LUAN.van.THAC.si).nhan.dang.mot.so.ngon.ngu.tu.nhien.luan.van.ths.cong.nghe.thong.tin.1.01.10(LUAN.van.THAC.si).nhan.dang.mot.so.ngon.ngu.tu.nhien.luan.van.ths.cong.nghe.thong.tin.1.01.10(LUAN.van.THAC.si).nhan.dang.mot.so.ngon.ngu.tu.nhien.luan.van.ths.cong.nghe.thong.tin.1.01.10 z z Ta tiếp tục tính lần thứ Sử dụng bảng B4: tính C f jk b (jk4 ) ja k a Các phép tính tƣơng ứng dòng bảng B4 F Dòng A 3.2 + 1.2 + 1.1 + B 1.3 + C 2.11 + 1.11 + D 2.(-4) + 3.(-2) + 3.1 + E 3.1 + 1.(-5) + 1.(-3) + 2.11 + F 1.6 + H 2.2 + I 3.1 + L 1.11 + 1.1 + 1.3 + 1.(-2) + N 3.(-1) + 3.(-2) + 1.(-3) + O 2.2 + 1.(-1) + 1.(-2) + 1.2 + 3.11 + 3.10 + P 1.4 + 1.6 + R 1.1 + 2.1 + S 1.3 + 1.(-6) + T 1.9 + 1.(-2) + 2.1 + 2.11 + U 2.1 + 1.1 + W 1.11 + 3.(-1) + 1.11 + Y 3.11 + 1.11 = 238 C = 238 > Vậy mẫu X thuộc lớp X3 tức văn tiếng Anh (LUAN.van.THAC.si).nhan.dang.mot.so.ngon.ngu.tu.nhien.luan.van.ths.cong.nghe.thong.tin.1.01.10(LUAN.van.THAC.si).nhan.dang.mot.so.ngon.ngu.tu.nhien.luan.van.ths.cong.nghe.thong.tin.1.01.10(LUAN.van.THAC.si).nhan.dang.mot.so.ngon.ngu.tu.nhien.luan.van.ths.cong.nghe.thong.tin.1.01.10(LUAN.van.THAC.si).nhan.dang.mot.so.ngon.ngu.tu.nhien.luan.van.ths.cong.nghe.thong.tin.1.01.10 74 TIEU LUAN MOI download : skknchat@gmail.com (LUAN.van.THAC.si).nhan.dang.mot.so.ngon.ngu.tu.nhien.luan.van.ths.cong.nghe.thong.tin.1.01.10(LUAN.van.THAC.si).nhan.dang.mot.so.ngon.ngu.tu.nhien.luan.van.ths.cong.nghe.thong.tin.1.01.10(LUAN.van.THAC.si).nhan.dang.mot.so.ngon.ngu.tu.nhien.luan.van.ths.cong.nghe.thong.tin.1.01.10(LUAN.van.THAC.si).nhan.dang.mot.so.ngon.ngu.tu.nhien.luan.van.ths.cong.nghe.thong.tin.1.01.10 CHƢƠNG KẾT QUẢ ĐẠT ĐƢỢC 4.1 Kết đạt đƣợc Một chƣơng trình phần mềm ngơn ngữ C++ đƣợc xây dựng nhằm thử nghiệm phép kiểm định nêu theo qui trình nhận dạng đề xuất Các mẫu thử đƣợc lựa chọn tài liệu tiếng Anh, Pháp, Đức lĩnh vực: Chính trị, kinh tế, văn học, tin học, địa lý, quân sự, thể thao, ngoại giao, lịch sử, y tế, giáo dục, pháp luật Mỗi ngơn ngữ kiểm tra 280 tệp, tệp có 60 ký tự, nội dung chọn theo đoạn văn 4.1.1 Kết nhận dạng theo thuật toán Ngôn ngữ Anh Pháp Đức Số lƣợng tệp tin Tiếng Anh Số lƣợng % 280 220 280 280 Kết nhận dạng Bản Tiếng Tiếng Đức Pháp mã Ngôn ngữ khác Số lƣợng % Số lƣợng % Số lƣợng % Số lƣợng % 78,6 53 18,9 0 0,4 2,1 1,1 274 97,9 0 0 1,1 1,4 86 30,7 181 64,6 1,1 2,1 4.1.2 Kết nhận dạng theo thuật toán Ngôn ngữ Anh Pháp Đức Số lƣợng tệp tin Tiếng Anh Kết nhận dạng Bản Tiếng Tiếng Đức Pháp mã Ngôn ngữ khác Số lƣợng % Số lƣợng % Số lƣợng % Số lƣợng % Số lƣợng % 280 250 89,3 0 30 10,7 0 0 280 18 6,4 262 93,6 0 0 0 280 2,9 0 272 97,1 0 0 4.2 So sánh thuật toán Thuật tốn đơn tính tần số đơn (đếm số lần xuất ký tự (chữ cái) văn cần nhận dạng) làm số phép toán số học đơn giản (LUAN.van.THAC.si).nhan.dang.mot.so.ngon.ngu.tu.nhien.luan.van.ths.cong.nghe.thong.tin.1.01.10(LUAN.van.THAC.si).nhan.dang.mot.so.ngon.ngu.tu.nhien.luan.van.ths.cong.nghe.thong.tin.1.01.10(LUAN.van.THAC.si).nhan.dang.mot.so.ngon.ngu.tu.nhien.luan.van.ths.cong.nghe.thong.tin.1.01.10(LUAN.van.THAC.si).nhan.dang.mot.so.ngon.ngu.tu.nhien.luan.van.ths.cong.nghe.thong.tin.1.01.10 75 TIEU LUAN MOI download : skknchat@gmail.com (LUAN.van.THAC.si).nhan.dang.mot.so.ngon.ngu.tu.nhien.luan.van.ths.cong.nghe.thong.tin.1.01.10(LUAN.van.THAC.si).nhan.dang.mot.so.ngon.ngu.tu.nhien.luan.van.ths.cong.nghe.thong.tin.1.01.10(LUAN.van.THAC.si).nhan.dang.mot.so.ngon.ngu.tu.nhien.luan.van.ths.cong.nghe.thong.tin.1.01.10(LUAN.van.THAC.si).nhan.dang.mot.so.ngon.ngu.tu.nhien.luan.van.ths.cong.nghe.thong.tin.1.01.10 kết nhận dạng nhanh Điều quan trọng cơng tác thám mã tự động để tìm khóa Tuy nhiên thuật tốn khơng hiệu số trƣờng hợp đặc biệt; chẳng hạn mã đƣợc kiểm tra mã chuyển vị thuật tốn khơng phân biệt mã hay rõ đọc đƣợc có nghĩa Thuật tốn dựa xích Markov cấp hữu hạn trạng thái Xây dựng ƣớc lƣợng ma trận xác suất chuyển trạng thái mơ hình Markov ứng với ngơn ngữ tự nhiên tiếng Đức, Pháp Anh Tính tần số đơi móc xích dãy ký tự khắc phục đƣợc nhƣợc điểm thuật toán 4.3 Mã nguồn chƣơng trình 4.3.1 Thủ tục tính tần số đơi void TinhTanSoBoDoi( MocXich { FILE char &AA, char FName[]) *F; i,j; printf("\n %s",FName); for (i= 0;i< 26; i++) for(j= 0; j< 26; j++) AA[i][j]=0; F=fopen(FName,"rt"); while (!feof(F)) { i=fgetc(F); if (('a'