(Luận án tiến sĩ) một số vấn đề lý thuyết và ứng dụng của các mô hình otomat nâng cao

ĐẠI HỌC QUỐC GIA HÀ NỘI TRƢỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN - Đặng Quyết Thắng MỘT SỐ VẤN ĐỀ LÝ THUYẾT VÀ ỨNG DỤNG CỦA CÁC MƠ HÌNH OTOMAT NÂNG CAO LUẬN ÁN TIẾN SĨ TOÁN HỌC Hà Nội – 2013 ĐẠI HỌC QUỐC GIA HÀ NỘI TRƢỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN - Đặng Quyết Thắng MỘT SỐ VẤN ĐỀ LÝ THUYẾT VÀ ỨNG DỤNG CỦA CÁC MÔ HÌNH OTOMAT NÂNG CAO Chun ngành: Bảo đảm tốn học cho máy tính hệ thống tính tốn Mã số: 62 46 35 01 LUẬN ÁN TIẾN SĨ TOÁN HỌC NGƢỜI HƢỚNG DẪN KHOA HỌC: PGS TS Phan Trung Huy GS TS Đặng Huy Ruận Hà Nội – 2013 LỜI CAM ĐOAN Tôi xin cam đoan cơng trình nghiên cứu khoa học riêng tơi chƣa đƣợc công bố công trình khác Các kết viết chung với tác giả khác đƣợc đồng ý đồng tác giả trƣớc đƣa vào luận án Tác giả Đặng Quyết Thắng LỜI CẢM ƠN Tôi xin bày tỏ lòng biết ơn sâu sắc tới PGS TS Phan Trung Huy GS TS Đặng Huy Ruận - ngƣời thầy tận tình hƣớng dẫn, cho tơi hƣớng nghiên cứu lý thú động viên khích lệ tơi hồn thành luận án Tơi xin chân thành cảm ơn Ban Giám đốc, Khoa Sau đại học, Ban đào tạo, Đại học Quốc gia Hà Nội; Ban Giám hiệu, Phịng Sau đại học, Khoa Tốn - Cơ Tin học, Bộ môn Tin học, Trƣờng Đại học Khoa học Tự nhiên tạo điều kiện thuận lợi cho tơi q trình học tập nghiên cứu Tơi xin cảm ơn nhà khoa học, đồng nghiệp xêmina Bộ môn Tin học thuộc Khoa Toán - Cơ - Tin học, Trƣờng Đại học Khoa học Tự nhiên; Bộ mơn Tin học thuộc Viện Tốn ứng dụng Tin học, Trƣờng Đại học Bách khoa Hà Nội; phịng Cơ sở Tốn học Tin học thuộc Viện Toán học, Viện Hàn lâm Khoa học Công nghệ Việt Nam tạo điều kiện cho trình bày phần nội dung luận án góp ý giúp tơi hồn thiện luận án Tôi xin chân thành cảm ơn Ban giám hiệu - Trƣờng Đại học Sƣ phạm Kỹ thuật Nam Định tạo điều kiện thuận lợi cho công tác, học tập nghiên cứu Những lời biết ơn sâu nặng xin đƣợc dành cho ngƣời thân, đặc biệt mẹ vợ con, bạn đồng nghiệp thơng cảm, khích lệ sẻ chia khó khăn thời gian tơi thực luận án Tác giả Đặng Quyết Thắng MỤC LỤC LỜI CAM ĐOAN .3 LỜI CẢM ƠN .4 MỤC LỤC DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT DANH MỤC CÁC BẢNG VÀ HÌNH VẼ MỞ ĐẦU 10 Chƣơng CÁC KIẾN THỨC CƠ SỞ 19 1.1 Một số khái niệm 19 1.1.1 Cấu trúc đại số ngôn ngữ 19 1.1.1.1 Vị nhóm 19 1.1.1.2 Nửa vành .20 1.1.1.3 Ngôn ngữ 20 1.1.1.4 Khoảng cách soạn thảo 22 1.1.1.5 Xâu chung dài 25 1.1.2 Một số loại mã .25 1.1.2.1 Mã 25 1.1.2.2 ω - mã 26 1.1.2.3 Z - mã 27 1.1.2.4 Độ trễ giải mã .29 1.2 Máy biến đổi otomat .29 1.2.1 Khái niệm 29 1.2.2 Hợp thành hai máy biến đổi 32 1.3 Đồ thị hữu hạn 35 1.3.1 Khái niệm 35 1.3.2 Biểu diễn đồ thị máy tính .36 1.3.2.1 Phƣơng pháp ma trận kề .36 1.3.2.2 Phƣơng pháp danh sách kề 36 1.3.3 Tìm kiếm theo chiều sâu 37 1.3.4 Tìm đƣờng ngắn nguồn đơn 38 1.4 Chuỗi hình thức 39 1.4.1 Khái niệm 39 1.4.2 Định lý Schützenberger 40 1.5 Kết luận chƣơng 42 Chƣơng KHOẢNG CÁCH SOẠN THẢO CỦA HAI NGÔN NGỮ 43 2.1 Xâu chung dài hai ngôn ngữ 43 2.1.1 Bài toán 43 2.1.2 Hình thức hóa khái niệm LCS .43 2.1.3 Thuật tốn tìm đƣờng dài nguồn đơn 45 2.1.4 Xác định LCS hai ngôn ngữ theo otomat .47 2.1.4.1 Chi phí dãy sánh LCS .47 2.1.4.2 Thuật toán .48 2.2 Khoảng cách DL hạn chế hai ngôn ngữ 50 2.2.1 Hình thức hóa khái niệm khoảng cách DL hạn chế 51 2.2.2 Mở rộng kiểu otomat 54 2.2.3 Xác định khoảng cách DL hạn chế hai ngơn ngữ theo otomat .55 2.2.3.1 Chi phí dãy sánh DL hạn chế 55 2.2.3.2 Thuật toán .56 2.3 Kết luận chƣơng 58 Chƣơng KIỂM ĐỊNH -MÃ VÀ Z-MÃ 59 3.1 Phép toán otomat 59 3.1.1 Lƣỡng cực hóa, mở rộng kiểu kiểu otomat 59 3.1.2 Tích otomat 60 3.1.3 Tích hợp otomat 62 3.2 Sự tồn đƣờng kiểu kiểu 64 3.3 Kiểm định ω-mã theo otomat .68 3.4 Kiểm định Z-mã theo otomat .71 3.5 Kết luận chƣơng 77 Chƣơng XÁC ĐỊNH ĐỘ KHÔNG NHẬP NHẰNG VÀ ĐỘ TRỄ GIẢI MÃ 78 4.1 Độ không nhập nhằng ngôn ngữ 78 4.2 Mở rộng kiểu kiểu otomat 79 4.3 Giá đƣờng kiểu tồn đƣờng kiểu 80 4.4 Xác định độ không nhập nhằng ngôn ngữ theo otomat 86 4.5 Xác định độ trễ giải mã theo otomat 91 4.6 Kết luận chƣơng 98 KẾT LUẬN .99 DANH MỤC CÁC CÔNG TRÌNH KHOA HỌC CỦA TÁC GIẢ LIÊN QUAN ĐẾN LUẬN ÁN 101 TÀI LIỆU THAM KHẢO .103 DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT Các ký hiệu ε Từ (xâu) rỗng |A| Lực lƣợng tập A w(i) Khúc đầu có độ dài i xâu w w[i] Ký tự thứ i xâu w wg[e] Trọng số cung e otomat máy biến đổi wg[π] Trọng số đƣờng π wg[(u, v)] Trọng số cạnh (u, v) đồ thị  Bảng chữ * Tập hợp tất từ bảng chữ  L Ngôn ngữ bảng chữ  L+ Lặp cắt ngôn ngữ L L Tập từ đảo ngƣợc từ thuộc ngôn ngữ L Lω ω - ngôn ngữ Các chữ viết tắt DL Damerau–Levenshtein LCS Xâu chung dài (Longest Common Subsequence) DANH MỤC CÁC BẢNG VÀ HÌNH VẼ Bảng 1.1 Độ dài LCS khúc đầu x y……………………………… 24 Hình 1.1 Hợp thành otomat hữu hạn với máy biến đổi nửa vành Tropical………………………………………………………………………… 33 Hình 1.2 Đồ thị có hƣớng…………………………………………………… 35 Hình 1.3 Mảng danh sách kề đồ thị G………………………………… 36 Hình 1.4 Otomat có trọng số đốn nhận chuỗi hình thức ……………… 41 Hình 2.1 Máy biến đổi  thực Ψ* bảng chữ Ω ……………… 47 Hình 2.2 Mở rộng kiểu otomat hữu hạn……………………………… 54 Hình 2.3 Máy biến đổi  thực Ψ* bảng chữ Γ ……………… 56 Hình 3.1 Tích hai otomat…………………………………………………… 60 Hình 3.2 Nhãn đƣờng hai trạng thái dạng……… 61 Hình 3.3 Tích hợp hai otomat……………………………………………… 62 Hình 3.4 Hai kiểu hai ω -phân tích phải khác từ w……………… 69 Hình 3.5 Bốn kiểu hai Z-phân tích khác từ w…………………… 71 Hình 4.1 Tính độ trễ giải mã L………………………………………… 91 MỞ ĐẦU Lý thuyết otomat nghiên cứu lớp thuật toán  đối tƣợng quan trọng toán học khoa học máy tính Năm 1936, A.M Turing đề xuất vấn đề thuật tốn giải phƣơng tiện máy mà sau gọi máy Turing [66] Năm 1943, W.S McCulloch W.H Pitts đề xuất mơ hình tốn học tế bào thần kinh [47] Sau đó, S.C Kleene phát triển báo cáo RAND ơng năm 1951, mơ hình W S McCulloch W.H Pitts đƣợc đƣa dạng toán học chi tiết [36] Các đề xuất đƣợc xem tảng lý thuyết otomat Otomat ngôn ngữ đƣợc ứng dụng nhiều lĩnh vực nhƣ thiết kế mạch [54], thiết kế chƣơng trình dịch [12], biểu diễn biểu thức quy [27], tìm kiếm mẫu [21], xử lý ngôn ngữ tự nhiên [57], mã hóa thơng tin [42], tạo chuỗi số [29], mơ tả thuật tốn lý thuyết nhóm [63], phát triển lý thuyết đại số ngôn ngữ đốn nhận phạm vi lý thuyết nửa nhóm hữu hạn [55], D.B.A Epstein cho thấy otomat công cụ quan trọng lý thuyết nhóm tổ hợp hình học [26]… Ngơn ngữ đƣợc biểu diễn tập xâu, biểu thức quy, văn phạm, cây, otomat hay đồng cấu vị nhóm… Nhƣng ngơn ngữ biểu diễn otomat đƣợc sử dụng rộng rãi tính đơn giản cài đặt Ứng dụng khả biểu diễn ngôn ngữ otomat, sử dụng kỹ thuật otomat để thiết kế thuật tốn hiệu  có độ phức tạp thời gian đa thức bậc thấp, nhằm giải toán trọng tâm xử lý thơng tin nhƣ: tốn so mẫu xấp xỉ, toán kiểm định mã, nghiên cứu đặc tính mã, hay ngơn ngữ hình thức mối quan hệ với mã Tăng tốc độ tính tốn cho thuật tốn giải tốn này, mơi trƣờng bùng nổ thơng tin vấn đề nghiên cứu mở, có tính thời thu hút quan tâm cộng đồng nghiên cứu 1< i < k, vi  U, vk = vj, ≤ j ≤ i, hay π có dạng: (p1, q1), , (pj, qj), , (fG, qi), , (pk, qk), với v1 = (p1, q1) = (s1, s2), vj = (pj, qj), vi = (fG, qi), vk = (pk, qk) i) Khi π đƣờng kiểu khơng chứa đỉnh ghép tích (fG, f2) không qua đỉnh khởi đầu (s1, s2), thật vậy: + Giả sử π qua đỉnh khởi đầu vl = v1 với 1 l  j, ta xét π đƣờng kiểu đỉnh khởi đầu vl + Giả sử π chứa đỉnh ghép tích vl = (fG, f2) với 1 l  j, sở xây dựng otomat hữu hạn 1, 2 phép tích otomat, đỉnh đến từ đỉnh ghép tích (fG, f2) G, đỉnh (f1, s2) đỉnh khởi đầu (s1, s2) Đỉnh (f1, s2) đỉnh đỉnh ghép tích (fG, f2), π có đỉnh khóa (fG, qi), mà từ đỉnh (f1, s2) khơng thể đến đƣợc đỉnh khóa (fG, qi) Vậy, đỉnh ghép tích (fG, f2) đỉnh (s1, s2), ta xét π đƣờng kiểu đỉnh (s1, s2) + Giả sử π chứa đỉnh ghép tích vl = (fG, f2) với j ≤ l ≤ k, ta có đƣờng là: x1  (f , q )  x2  (p , q )  x3  (f , f ) (fG, f2)  G i k k G x2  (f , q )  x3  (f , f )) (hoặc (fG, f2) x1 (pk, qk)  G i G  (fG, qi) đỉnh khóa nên qi ≠ f2, s2 Từ Nhận xét 4.2 x1, x2x3  L+ (hoặc x1x2, x3 L+), suy xâu x1x2x3 có hai phân tích khác L Khi L khơng mã, điều trái với giả thiết L mã + Giả sử π qua đỉnh khởi đầu vl = (s1, s2) với j  l ≤ k, đỉnh vl có cung đến nó, sở xây dựng 1, 2 tích otomat đỉnh kế trƣớc vl chu trình π đỉnh (fG, f2), nhƣ phân tích trên, điều mâu thuẫn ii) Chu trình π có đỉnh đến đƣợc đỉnh kết thúc (f1, f2) G Thật vậy, π có đỉnh vl = (fG, qi) với j ≤ l ≤ k, qi ≠ f2, s2, sở xây dựng 1, 2 tích otomat, ta có từ đỉnh (fG, qi) đến đƣợc đỉnh (f1,qi) cung với nhãn ε Do 2 = EAT4(TRIM(BA())), nên từ trạng thái qi 2 đến đƣợc trạng thái f2, từ f1 1 có cung đến với nhãn ký tự thuộc  {ε} Vậy theo tích otomat G phải có đƣờng từ (fG, qi) đến (f1, f2)  Định lý 4.2 Cho ngôn ngữ quy L  +, L mã đƣợc đốn nhận otomat hữu hạn  Cho 1 = EAT5(2) có trạng thái ghép fG với2 = EAT4(TRIM(BA())) PROD(1, 2) xác định đồ thị G nhƣ (mục 4.5) Khi ta có: i) L có độ trễ giải mã vô hạn G có đƣờng kiểu ii) L có độ trễ giải mã d ≥ G có đƣờng từ đỉnh khởi đầu đến đỉnh kết thúc với trọng số lớn d Chứng minh i) () Giả sử L có độ trễ giải mã vơ hạn, xét với số ngun khơng âm d, ta có:  x, x’  L, x ≠ x’,  y = y1y2 yd  Ld, yi  L,  u = u1u2 ul  *, ui   cho xyu  x’L* Với từ xyu, 1 có đƣờng π nhãn xyu: x f e s  y1 e yd e u1  f f ul  f s1  G  fG  s1 s1  fG  f1  1 với xyu = x’y’1y’2 y’n  x’L*, y’i  L 2 có đƣờng θ nhãn xyu: x' f e s y'1 f e s s y'n f s2  2 2 2    Khi đó, G có đƣờng ρ đƣợc tạo nên từ π θ, khởi đầu từ (s1, s2) kết thúc (f1, f2) nhƣ sau: (s1, s2), , (fG, qi), , (pj, f2) , (f1, f2) L mã nên qi ≠ f2, s2 pj ≠ fG, s1 Ta chọn d tùy ý đủ lớn (d lớn số trạng thái 1), mà số trạng thái 1 hữu hạn nên đƣờng ρ phải tồn hai đỉnh (fG, qi) trùng Hay G có đƣờng kiểu () Giả sử G có π đƣờng kiểu gồm dãy đỉnh v1, ,vj, ,vi, ,vk với < i < k, vi  U, vk = vj, ≤ j ≤ i, hay π đƣờng có nhãn nhƣ sau: x1  (p , q )  x2  (f , q )  x3  (p , q ) (p1, q1)  j j G i k k với v1 = (p1, q1) = (s1, s2), vj = (pj, qj), vi = (fG, qi)  U, vk = (pk, qk) Theo Bổ đề 4.3 ta có π khơng chứa đỉnh ghép tích (fG, f2), khơng qua đỉnh khởi đầu (s1,s2) tồn đỉnh (fG, qi) đến đƣợc đỉnh kết thúc (f1,f2) G Khi G có đƣờng ρ đƣợc gán nhãn sau đây: x1  (p , q )  x2  (f , q )  x3  (p , q )  x2  (f , q )  x3  (s1, s2)  j j G i j j G i x2  (f , q )  x3  (p , q )  x2  (f , q ) e (f , q ) u (f , f )  G i j j G i i     ta có ρ khơng chứa đỉnh (fG, f2), không qua đỉnh (s1, s2) Không làm tính tổng quát, ta giả sử (fG, qi) đỉnh khóa ρ Theo Nhận xét 4.2 ta có x3x2  L+ Vậy, với d lớn tùy ý,  x = x1x2, x ≠ x’  L,  y = (x3x2)d  L+,  u  * cho xyu  x’L* Hay L có độ trễ giải mã vơ hạn ii) () Giả sử L có độ trễ giải mã d: + Ta xét với d =  x, x’  L,  u  *, xu  x’L*  x = x’, Trên sở xây dựng otomat hữu hạn 1, 2 phép tích otomat Nếu d = đƣờng từ đỉnh khởi đầu đến đỉnh kết thúc G khơng có đỉnh khóa Khi cung đƣờng có trọng số Vậy đƣờng từ đỉnh khởi đầu đến đỉnh kết thúc có trọng số lớn d = + Ta xét với d   x, x’  L,  y  Ld,  u  *, xyu  x’L*  x = x’, hay d lớn nhất,  x, x’  L, x ≠ x’,  y = y1y2 yd-1  Ld-1, yi  L,  u = u1u2 ul  *, uj   cho xyu  x’L* (ta có xyu = x’y’ với y’= y’1y’2 y’n  L*, y’i  L) với xâu xyu, 1 tồn đƣờng π nhƣ sau: x f e s  y1 e yd 1 e u1  f f ul  f s1  G  fG  s1 s1  fG  f1  1 tƣơng tự với xâu x’y’, 2 tồn đƣờng θ: x' f e s  y '1  f e s s y'n f s2  2 2 2  Khi đó, theo tích otomat, đồ thị G có đƣờng ρ đƣợc tạo nên từ π θ, khởi đầu từ đỉnh (s1, s2) đến đỉnh kết thúc (f1, f2) nhƣ sau: x (f , q ) e (s , q )  y1  (f , q ) e (s , q ) (s , q )  yd1 (s1, s2)  G 1 G 2 d-1 (f ,q ) e (f , p ) u1  (f , p ) (f , p ) ul  (f , f ) G d 1 l x ≠ x’ L mã nên qi ≠ f2, s2, với i = 1,…, d Vì d lớn nên đƣờng ρ G từ đỉnh khởi đầu (s1, s2) đến đỉnh kết thúc (f1, f2) có trọng số lớn d () Giả sử G có đƣờng điρ từ đỉnh khởi đầu đến đỉnh kết thúc có trọng số lớn d + Trƣờng hợp d =0: đó, đƣờng từ đỉnh khởi đầu đến đỉnh kết thúc G khơng có đỉnh khóa Ta có:  x, x’  L,  u  *, xu  x’L*  x = x’ Hay độ trễ giải mã L + Trƣờng hợp d  0: đƣờng ρ có dạng: x (f , q )  y1  (f , q )  y2  (f , q )…(f , q ) yd 1 (f , q ) e (s1, s2)  G G G G d-1 G d    (f1, p1) u (f1, f2) qi ≠ f2, s2, với i = 1,…, d x, y1, , yd-1  L, u  * Tƣơng ứng với đƣờng ρ G 1 tồn đƣờng π với nhãn xyu= xy1 yd-1u: x f s1  G y 1   u fG y2  fG fG yd1 fG e f1  f1 2 tồn đƣờng θ với nhãn x’y’, x’  L, y’  L* cho xyu = x’y’: x' f s2  y' f   Vậy d lớn nhất,  x, x’  L, x ≠ x’  y  Ld-1,  u  * cho xyu  x’L* Hay d nhỏ cho:  x, x’  L,  y  Ld,  u  *, xyu  x’L*  x = x’,  suy L có độ trễ giải mã d Từ Định lý 4.2, cho phép ta xây dựng Thuật tốn 4.5 xác định độ trễ giải mã ngơn ngữ quy L = ()  * Thuật tốn 4.5 DECIPHERINGDELAY() Input:  = (Q, , E, I, F) không chứa cung rỗng L = ()  * Output: Độ trễ giải mã L (nếu có) if not CODEALGO() then Return (“L không mã”); 2 ← (Q2, , E2, s2, f2) ← EAT4(TRIM(BA())); 1 ← (Q1, , E1, s1, f1)← EAT5(2); 3 G ← PROD(1, 2); //cỡ |Q|2 trạng thái |E|2 cung G’ ← XCOPY2(G); // cỡ 2|Q|2 đỉnh 3|E|2 cung if EPATH3(G’, ((s1, s2), 1)) then Return (“Độ trễ giải mã vơ hạn”); Tìm đƣờng từ đỉnh (s1, s2) đến (f1, f2) với trọng số lớn d G; Return d; Nhận xét 4.6 Đánh giá độ phức tạp thời gian Thuật toán 4.5: - Theo đánh giá độ phức tạp thời gian thuật toán mục 1.2.1, 3.1.1, 3.1.2, 4.2, 4.3 4.5 Ta có độ phức tạp thời gian bƣớc ((|Q|+|E|)2); bƣớc với hàm BA() (|Q|+|E|), hàm TRIM (|Q|+|E|), hàm EAT4 EAT5 (1); bƣớc ((|Q|+|E|)2); bƣớc (|Q|2+|E|2) bƣớc ((|Q|2+|E|2)|Q|) - Ở bƣớc 6, G xác định đồ thị có chu trình, cung đến đỉnh khóa có trọng số 1, cung cịn lại có trọng số 0, đồ thị xác định Gkhơng có đƣờng kiểu 3, chu trình khơng có đỉnh khóa, cung tham gia vào chu trình có trọng số Để thực tìm đƣờng từ đỉnh khởi đầu đến đỉnh kết thúc có trọng số lớn nhất, ta gán cung có trọng số thành trọng số -1, áp dụng thuật tốn Bellman –Ford (xem [6, 22]) tìm đƣờng ngắn đồ thị trọng số âm có chu trình khơng âm, –d giá trị nhỏ tìm đƣợc d trọng số lớn đƣờng từ đỉnh (s1, s2) đến đỉnh (f1, f2) G Thực toàn bƣớc có độ phức tạp thời gian (|Q|2|E|2) - Tổng hợp lại thuật tốn có độ phức tạp thời gian (|Q|2|E|2) = (|E|3) = ((|Q|+|E|)3) 4.6 Kết luận chƣơng Chƣơng trình bày hai kết đóng góp luận án phƣơng pháp xác định độ không nhập nhằng độ trễ giải mã ngôn ngữ, từ đề xuất: mở rộng kiểu kiểu otomat; xây dựng otomat hữu hạn  tích otomat nhận đƣợc sau lƣỡng cực hóa, mở rộng kiểu kiểu 5; đồ thị có gán nhãn G đƣợc xác định  tƣơng ứng, nhờ kỹ thuật chép đồ thị hay tìm kiếm tơ màu đỉnh, cho ta xác định giá nhỏ đƣờng kiểu 2, tồn đƣờng kiểu hay đƣờng có trọng số lớn Từ cho phép ta xác định độ không nhập nhằng nhƣ độ trễ giải mã ngơn ngữ đƣợc đốn nhận otomat hữu hạn đầu vào Tính đắn phƣơng pháp đƣợc chứng minh chặt chẽ Bổ đề 4.1, 4.2 4.3, Định lý 4.1 4.2 Từ phƣơng pháp đề xuất trên, ta nhận đƣợc: thuật tốn xác định độ khơng nhập nhằng ngơn ngữ có độ phức tạp thời gian (n4) với đầu vào otomat đa định, (n2logn) với đầu vào otomat đơn định, n số trạng thái otomat đầu vào; thuật toán xác định độ trễ giải mã có độ phức tạp thời gian (h3), với h kích cỡ otomat hữu hạn đầu vào KẾT LUẬN Luận án sử dụng kỹ thuật mơ hình otomat nâng cao đề xuất phƣơng pháp mới, giải số toán so mẫu xấp xỉ, kiểm định mã, đặc trƣng mã ngơn ngữ gần mã Từ đó, ta xây dựng đƣợc thuật toán hiệu - độ phức tạp thời gian đa thức bậc thấp, với đầu vào ngơn ngữ đƣợc đốn nhận otomat hữu hạn Các thuật toán áp dụng trực tiếp cho otomat đa định nhƣ otomat đơn định, mà chuyển đổi từ otomat đa định sang otomat đơn định, với độ phức tạp thời gian hàm mũ Các phƣơng pháp đề xuất là: - Xác định LCS, độ dài LCS tập LCS hai ngơn ngữ hữu hạn đƣợc đốn nhận hai otomat hữu hạn tƣơng ứng Thuật tốn có độ phức tạp thời gian (hl), h, l lần lƣợt kích cỡ hai otomat hữu hạn - Xác định khoảng cách soạn thảo DL hạn chế hai ngơn ngữ đƣợc đốn nhận hai otomat hữu hạn tƣơng ứng, lần lƣợt có kích cỡ h l Thuật tốn có độ phức tạp thời gian (hl) - Kiểm định ω-mã, Z-mã ngôn ngữ đƣợc đoán nhận otomat hữu hạn Thuật toán có độ phức thời gian (n3) với otomat đơn định, (n5) với otomat đa định, n số trạng thái otomat - Xác định độ khơng nhập nhằng ngơn ngữ đƣợc đốn nhận otomat hữu hạn Thuật tốn có độ phức tạp thời gian (n4) với otomat đa định, (n2logn) với otomat đơn định, n số trạng thái otomat Về khả ứng dụng, ta sử dụng ngơn ngữ khơng mã, nhƣng có độ khơng nhập nhằng đủ lớn để mã hóa thơng tin mật - Xác định độ trễ giải mã ngôn ngữ đƣợc đốn nhận otomat hữu hạn có kích cỡ h Thuật tốn có độ phức tạp thời gian (h3) Từ đó, cho phép loại bỏ thao tác quay lui tăng hiệu thời gian trình giải mã Với kết đạt đƣợc luận án, ta thấy lý thuyết otomat bộc lộ rõ tiềm vai trò quan trọng việc thiết kế thuật toán hiệu Hƣớng nghiên cứu phát triển luận án sử dụng kỹ thuật mơ hình otomat nâng cao để nghiên cứu phát triển tốn tìm kiếm liệu mã, xác định độ đo xấp xỉ cho toán sánh mẫu ứng dụng otomat có trọng số, xây dựng thuật tốn định lƣợng cho ngơn ngữ gần mã Các kết nghiên cứu góp phần vào phát triển mạnh mẽ lý thuyết ứng dụng lĩnh vực otomat, ngôn ngữ mã DANH MỤC CÁC CƠNG TRÌNH KHOA HỌC CỦA TÁC GIẢ LIÊN QUAN ĐẾN LUẬN ÁN Nguyễn Đình Hân, Đặng Quyết Thắng, Hồ Ngọc Vinh (2010), “Tính tốn độ trễ giải mã ngôn ngữ otomat”, Kỷ yếu Hội thảo quốc gia lần thứ XIII – Một số vấn đề chọn lọc Công nghệ thông tin Truyền thông, Hƣng Yên, ngày 1920 tháng năm 2010, Nhà xuất Khoa học Kỹ thuật, tr 321-332 Dang Quyet Thang, Phan Trung Huy (2010), “Determining restricted DamerauLevenshtein edit-distance of two languages by extended automata”, Proceedings of the 2010 IEEE-RIVF International Conference on Computing and Communication Technologies, Hanoi, Vietnam, November 1-4, 2010, Institute of Electrical and Electronic Engineers (IEEE), pp 53-58 Dang Quyet Thang (2011), “Algorithm to Determine Longest Common Subsequences of Two Finite Languages”, New Challenges for Intelligent Information and Database Systems, Studies in Computational Intelligence, Daegu, Korea, April 20-22, 2011, Springer –Verlag Berlin Heidelberg, 351, pp 3-12 Hồ Ngọc Vinh, Nguyễn Đình Hân, Đặng Quyết Thắng, Phan Trung Huy (2011), “Độ không nhập nhằng -ngôn ngữ ứng dụng”, Kỷ yếu Hội thảo quốc gia lần thứ XIV – Một số vấn đề chọn lọc Công nghệ thông tin Truyền thông, Cần Thơ, ngày 7-8 tháng 10 năm 2011, Nhà xuất Khoa học Kỹ thuật, tr 95108 Nguyen Dinh Han, Ho Ngoc Vinh, Dang Quyet Thang, Phan Trung Huy (2012), “Algorithms for testing of codes and -Codes”, Proceedings of the 2012 IEEERIVF International Conference on Computing and Communication TechnologiesResearch, Innovation and Vision for the Future, Ho Chi Minh City, Vietnam, February 27 – March 01, 2012, Institute of Electrical and Electronic Engineers (IEEE), pp 45-50 Nguyen Dinh Han, Phan Trung Huy, Dang Quyet Thang (2012), “A Quadratic Algorithm for Testing of Omega-Codes”, Intelligent Information and Database Systems, Lecture Notes in Artificial Intelligence, 4th Asian Conference, ACIIDS 2012, Kaohsiung, Taiwan, March 19-21, 2012, Proceedings, Part I, Springer – Verlag Berlin Heidelberg, 7196, pp 338-347 Nguyễn Đình Hân, Đặng Quyết Thắng, Hồ Ngọc Vinh, Phan Trung Huy (2012) “Độ không nhập nhằng ngôn ngữ ứng dụng” Tạp chí Cơng nghệ Thơng tin Truyền thơng, Các cơng trình nghiên cứu phát triển ứng dụng Công nghệ thông tin Truyền thông V-1, 7(27), tr 82-89 Dang Quyet Thang, Nguyen Dinh Han, Phan Trung Huy (2012), “Algorithms Based on Finite Automata for Testing of Omega-Codes”, Future Information Technology, Application, and Service - Lecture Notes in Electrical Engineering, Vancouver, Canada, June 26-28, 2012, Springer Science+ Business Media Dordrecht, 164, pp 271-279 Đặng Quyết Thắng, Nguyễn Đình Hân, Phan Trung Huy (2012), “Xác định độ khơng nhập nhằng ngơn ngữ quy theo otomat”, Tạp chí Tin học Điều khiển học, 28(1), tr 52-63 10 Dang Quyet Thang, Nguyen Dinh Han, Phan Trung Huy (2012), “Algorithms Based on Finite Automata for Testing of Z-codes”, Proceedings of the 9th IFIP International Conference on Network and Parallel Computing (NPC 2012), Lecture Notes in Computer Science (LNCS), Gwangju, Korea, Septemper 6-8, 2012, 7513, pp 631-641 11 Đặng Quyết Thắng, Nguyễn Đình Hân, Phan Trung Huy (2012), “Thuật toán xác định độ trễ giải mã ngơn ngữ quy”, Tạp chí Tin học Điều khiển học, 28(2), tr 141-152 12 Nguyen Dinh Han, Dang Quyet Thang, Phan Trung Huy (2013), “A Quadratic Algorithm for Testing of Z-Codes”, Intelligent Information and Database Systems, Lecture Notes in Artificial Intelligence, 5th Asian Conference, ACIIDS 2013, Kuala Lumpur, Malaysia, March 18-20, 2013, Proceedings, Part I, Springer – Verlag Berlin Heidelberg, 7802, pp 455-464 TÀI LIỆU THAM KHẢO Tiếng Việt Phan Đình Diệu (1977), Lý thuyết ơtơmát thuật tốn, Nhà xuất Đại học Trung học Chuyên nghiệp Đỗ Đức Giáo (2000), Toán rời rạc, Nhà xuất Đại học Quốc Gia Hà Nội Nguyễn Đình Hân (2012), Bài tốn kiểm định mã phân bậc ngôn ngữ theo độ không nhập nhằng, Luận án tiến sĩ Công nghệ thông tin, Trƣờng Đại học Bách khoa Hà Nội Nguyễn Đình Hân, Hồ Ngọc Vinh, Phan Trung Huy, Đỗ Long Vân (2010), “Thuật tốn xác định tính chất mã ngơn ngữ quy”, Tạp chí Tin học Điều khiển học, 27(1), tr 1–9 Phan Trung Huy, Vũ Thành Nam (2002), “Một số độ đo nhập nhằng mã”, Tạp chí Tin học Điều khiển học, 18(3), tr 253–261 Nguyễn Đức Nghĩa, Nguyễn Tơ Thành (1997), Tốn rời rạc, Nhà xuất Giáo dục, Hà Nội Đặng Huy Ruận (2002), Lý thuyết ngơn ngữ hình thức otomat, Nhà xuất Đại học Quốc Gia Hà Nội Salomaa A (1992), Nhập môn tin học lý thuyết tính tốn otomat (Nguyễn Xn My, Phạm Trà Ân dịch), Nhà xuất Khoa học Kỹ thuật, Hà Nội Dƣơng Quốc Việt (2004), Đại số đại cương Nhà xuất Khoa học kỹ thuật, Hà Nội 10 Hồ Ngọc Vinh, Nguyễn Đình Hân, Phan Trung Huy (2010), “Mã với tích biên độ trễ giải mã”, Tạp chí Cơng nghệ Thơng tin Truyền thơng, Các cơng trình nghiên cứu phát triển ứng dụng Công nghệ thông tin Truyền thông V-1, 4(24), tr 46-56 Tiếng Anh 11 Aho A.V (1991), Algorithms for Finding Patterns in String, Handbook of Theoretical Compter Science (Vol A), MIT Press 12 Aho A.V., Sethi R., Ullman J.D (1986), Compilers: principles, techniques, and tools, Addison Wesley 13 Anselmo M (1999), “A non-ambiguous language factorization problem”, In Proceedings of Developments in Language Theory, pp 141-152 14 Anselmo M (2003), “A non-ambiguous decomposition of regular languages and factorizing codes”, Discrete Applied Mathematics, 126(2-3), pp 129-165 15 Augros X., Litovsky I (1999), “Algorithm to test rational ω-codes”, Proceedings of the Conference of The Mathematical Foundation of Informatics, World Scientific, pp 23-37 16 Berman K.A., Paul J.L (2005), Algorithms - Sequential, parallel, and distributed, Thomson Learning, Inc 17 Berstel J., Perrin D (1985), Theory of Codes, Academic Press, Inc 18 Berstel J., Reutenauer C (1988), Rational Series and Their Languages, Springer Verlag: Berlin-New York 19 Béal M.P., Perrin D (2006), “Codes, unambiguous automata and sofic systems”, Theoretical Computer Science, 356(1), pp 6-13 20 Carton O., Perrin D., Pin J.E (2007), “Automata and semigroups recognizing infinite words”, Logic and Automata, Amsterdam University Press, pp 133-167 21 Chrochemore M., Hancart C (1997), “Automata for matching Handbook of formal languages, Springer Verlag, 2, pp 399–462 patterns”, 22 Cormen T.H., Leiserson C.E., Rivest R.L., Stein C (2009), Introduction to Algorithms (3rd ed.), MIT Press and McGraw-Hill 23 Damerau F.J (1964), “A technique for computer detection and correction of spelling errors” Communications of the ACM, 7(3), pp 171-176 24 Devolder J., Latteux M., Litovsky I., Staiger L (1994), “Codes and infinite words”, Acta Cybernetica, 11(4), pp 241-256 25 Devolder J., Timmerman E (1992), “Finitary codes for biinfinite words”, Informatique théorique et applications, 26, pp 363–386 26 Epstein D.B.A., Paterson M.S., Cannon J.W., Holt D.F., Levy S.V., Thurston W P (1992), Word processing in groups, Jones and Bartlett 27 Friedl J.E.F (2002), Mastering regular expressions, Second Edition, O’Reilly Media 28 Gilbert E.N., Moore E.F (1959), “Variable length binary encodings”, Bell System Technical Journal, Monograph 3515, 38, pp 933–967 29 Haeseler F V (2003), Automatic sequences, Walter de Gruyter 30 Hirschberg D.S (1977), An Information Theoretic Lower Bound for the Longest Common Subsequence Problem, Rice Technical Report No 7705 31 Hunt J.W., Szymanski T.G (1977), “A fast algorithm for computing longest subsequences”, Commun ACM, 20(5), pp 350–353 32 Phan Trung Huy, Nguyen Quy Khang (2002), “A new Algorithm for LCS Problem”, Proceedings of The sixth Vietnamese Mathematical Conference, Hue City, Vietnam, September 07-10, pp 145-157 33 Phan Trung Huy, Do Long Van (2000), “On non-ambiguous Büchi V-automata”, Proceedings of the third Asian Mathematical conference 2000, Diliman, Philippines, October 23 - 27, World Scientific, pp 224-233 34 Iliopoulos C.S., Rahman M.S (2009), “A New Efficient Algorithm for Computing the Longest Common Subsequence”, Theory of Computing Systems, Springer New York, 45(2), pp 355-371 35 Jiang T., Li M (1995), “On the approximation of shortest common supersequences and longest common subsequences”, SIAM Journal of Computing, 24(5), pp 11221139 36 Kleene S.C (1956), “Representation of events in nerve nets and finite automata”, Automata studies, Princeton University Press, pp 3–42 37 Lallement G (1979), Semigroups and Combinational Applications, John Wiley & Sons, Inc 38 Nguyen Huong Lâm, Do Long Van (1990), “On a Class of Infinitary Codes”, Theoretical Infomatics and Applications, 24(5), pp 441-458 39 Levenshtein V.I (1964), “Some properties of coding and self-adjusting automata for decoding messages”, Problemy Kirbernet, 11, pp 63-121 40 Levenshtein V.I (1965), “Binary codes capable of correcting spurious insertions and deletions of ones”, Problems of Information Transmission, 1(1), pp 8–17 41 Levenshtein V.I (1966), “Binary codes capable of correcting deletions, insertions, and reversals”, Soviet Physics – Doklady, 10(8), pp 707–710 42 Lind D., Marcus B (1995), An Introduction to Symbolic dynamics and coding, Cambridge University Press 43 Madonia M., Salemi S., Sportelli T (1993), “A generalization of SardinasPatterson algorithm to Z-codes”, Theoretical Computer Science, 108(2), pp 251270 44 Markov A.A (1962), “On alphabet coding”, Soviet Physics – Doklady, 6, pp 553554 45 Mateescu A., Mateescu G.D., Rozenberg G., Salomaa A (1997), “Shuffle–Like Operations on –words”, New Trends in Formal Languages, Lecture Notes in Computer Science, Springer Verlag, Berlin, Heidelberg, pp 395–411 46 McCloskey R (1996), “An O(n2) Time Algorithm for Deciding Whether a Regular Language is a Code”, Journal of Computing and Information, 2(1), pp 79-89 47 McCulloch W.S., Pitts W.H (1943), “A logical calculus of the ideas immanent in nervous activity”, Bulletin of Mathematical Biophysics, 5, pp 115–133 48 Mohri M (2003), “Edit-Distance of Weighted Automata: General Definitions and Algorithms”, International Journal of Foundations of Computer Science, 14(6), pp 957-982 49 Mohri M., Pereira F., Riley M (2000), “The design principles of a weighted finitestate transducer library”, Theoretical Computer Science, 231(1), pp 17–32 50 Mohri M., Pereira F., Riley M (2007), “Speech Recognition with Weighted FiniteState Transducers”, Handbook on Speech Processing and Speech Communication, Part E: Speech recognition, Springer Heidelberg, pp 1-31 51 Mozes S., Tsur D., Weimann O., Ziv-Ukelson M (2009), “Fast algorithms for computing tree LCS”, Theoretical Computer Science, 410(43), pp 4303 -4314 52 Navarro G (2001), “A guided tour to approximate string matching”, ACM Computing Surveys, 33(1), pp 31-88 53 Perrin D., Pin J.E (2004), Infinite Words: Automata, Semigroups, Logic and Games , Pure and Applied Mathematics Vol 141, Elsevier 54 Petzold C (1999), Codes, Microsoft Press 55 Pin J.E (1986), Varieties of formal languages, North Oxford Academic 56 Restivo A (1989), “Codes and automata”, Formal Properties of Finite Automata and Applications, Lecture Notes in Computer Science, 386, pp 186-198 57 Roche E., Schabes Y (1997), Finite-state language processing, The MIT Press 58 Salomaa A., Soittola M (1978), Automata-Theoretic Aspects of Formal Power Series, Springer-Verlag: New York 59 Schützenberger M.P (1961), “On the definition of a family of automata”, Information and Control, 4(2-3), pp 245-270 60 Schützenberger M.P (1966), “On a question concerning certain free submonoids”, Journal Combinatorial Theory, 1, pp 437-422 61 Sedgewick R (2002), “Algorithms in C++”, Part 5: Graph algorithms, AdditionWesley, Pearson Education, Inc, USA 62 Shannon C.E (1948), “Communication Theory of Secrecy Systems”, Bell Systems Technical Journal, 28, pp 656–715 63 Sims C.C (1994), Computation with finitely presented groups, Cambridge University Press 64 Staiger L (1986), “On infinitary finite length codes”, Informatique Théorique et Applications, 20(4), pp 483-494 65 Stavros K (2002), “Transducers and the Properties of Error –Detection, ErrorCorrection, and Finite-Delay Decodability”, Journal of Universal Computer Science, 8(2), pp 278 – 291 66 Turing A.M (1936), “On computable numbers with an application to the Entscheidungsproblem”, Proceedings of the London Mathematical Society, 2(42), pp 230–265 67 Do Long Van (1985), Contribution to Combinatorics on Words, PhD thesis, Humboldt University, Berlin 68 Do Long Van, Nguyen Huong Lam, Phan Trung Huy (1993), “On codes concerning bi-infinite words”, Acta Cybernetica, 11(1-2), pp 97–109 69 Do Long Van, Litovsky I (2002), “On a Family of Code with Bounded Deciphering Delay”, Developments in Language Theory, 6th International Conference, DLT 2002, Kyoto, Japan, September 18-21, Springer-Verlag Berlin Heidelberg LNCS, 2450, pp 369-380 70 Do Long Van, Thomas D.G., Subramanian K.G., Siromoney R (1990), “BiInfinitary Codes”, RAIRO - Theoretical Informatics and Applications, 24(1), pp 67-87 71 Wagner R.A., Fischer M.J (1974), "The string-to-string correction problem", Journal of the ACM, 21(1), pp 168-173 ... Quyết Thắng MỘT SỐ VẤN ĐỀ LÝ THUYẾT VÀ ỨNG DỤNG CỦA CÁC MƠ HÌNH OTOMAT NÂNG CAO Chuyên ngành: Bảo đảm toán học cho máy tính hệ thống tính tốn Mã số: 62 46 35 01 LUẬN ÁN TIẾN SĨ TOÁN HỌC NGƢỜI... chuỗi số [29], mô tả thuật tốn lý thuyết nhóm [63], phát triển lý thuyết đại số ngơn ngữ đốn nhận phạm vi lý thuyết nửa nhóm hữu hạn [55], D.B.A Epstein cho thấy otomat công cụ quan trọng lý thuyết. .. phong phú lý thuyết ứng dụng Lý thuyết mã có vai trị thiết yếu nhiều lĩnh vực nhƣ xử lý thông tin, nén liệu, truyền thơng mật mã… có liên hệ chặt chẽ với lý thuyết tổ hợp từ, lý thuyết otomat,

(Luận án tiến sĩ) một số vấn đề lý thuyết và ứng dụng của các mô hình otomat nâng cao

Thông tin tài liệu

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan