1. Trang chủ
  2. » Giáo Dục - Đào Tạo

Luận văn thạc sĩ bài toán đối sánh mẫu sử dụng giải thuật di truyền

84 3 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 84
Dung lượng 390,87 KB

Nội dung

ĐẠI HỌC THÁI NGUYÊN TRƢỜNG ĐẠI HỌC CNTT VÀ TRUYỀN THƠNG NGÂN HỒNG MỸ LINH BÀI TỐN ĐỐI SÁNH MẪU SỬ DỤNG GIẢI THUẬT DI TRUYỀN LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH THÁI NGUN - 2015 Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn ĐẠI HỌC THÁI NGUYÊN TRƢỜNG ĐẠI HỌC CNTT VÀ TRUYỀN THÔNG NGÂN HỒNG MỸ LINH BÀI TỐN ĐỐI SÁNH MẪU SỬ DỤNG GIẢI THUẬT DI TRUYỀN Chuyên ngành: KHOA HỌC MÁY TÍNH Mã số: 60 48 01 01 LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH Ngƣời hƣớng dẫn khoa học: TS VŨ MẠNH XUÂN THÁI NGUYÊN - 2015 Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn i LỜI CAM ĐOAN Tôi xin cam đoan luận văn tự thân tơi tìm hiểu, nghiên cứu dƣới hƣớng dẫn TS Vũ Mạnh Xuân Các chƣơng trình thực nghiệm thân tơi lập trình, kết hoàn toàn trung thực Các tài liệu tham khảo đƣợc trích dẫn thích đầy đủ TÁC GIẢ LUẬN VĂN Ngân Hồng Mỹ Linh Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn ii LỜI CẢM ƠN Tôi xin bày tỏ lời cảm ơn chân thành tới tập thể thầy cô giáo Viện công nghệ thông tin – Viện Hàn lâm Khoa học Công nghệ Việt Nam, thầy cô giáo Trƣờng Đại học Công nghệ thông tin truyền thông - Đại học Thái Nguyên dạy dỗ suốt trình học tập chƣơng trình cao học trƣờng Đặc biệt tơi xin bày tỏ lịng biết ơn sâu sắc tới thầy giáo TS Vũ Mạnh Xuân quan tâm, định hƣớng đƣa góp ý, gợi ý, chỉnh sửa q báu cho tơi q trình làm luận văn tốt nghiệp Cuối cùng, xin chân thành cảm ơn bạn bè đồng nghiệp, gia đình ngƣời thân quan tâm, giúp đỡ chia sẻ với tơi suốt q trình làm luận văn tốt nghiệp Thái Nguyên, tháng 08 năm 2015 Ngân Hoàng Mỹ Linh Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn iii MỤC LỤC MỞ ĐẦU CHƢƠNG MỘT SỐ THUẬT TOÁN ĐỐI SÁNH MẪU 1.1 Giới thiệu toán đối sánh mẫu 1.2 Phát biểu toán 1.3 Một số thuật toán đối sánh mẫu 1.3.1 Thuật toán Brute Force 1.3.2 Thuật toán Knuth-Morris-Pratt 1.3.3 Thuật toán Automat hữu hạn 1.3.4 Thuật toán Boyer-Moore 1.3.5 Thuật toán Karp-Rabin 10 1.3.6 Một số thuật toán khác 11 CHƢƠNG GIỚI THIỆU VỀ GIẢI THUẬT DI TRUYỀN 13 2.1 Tổng quan chung giải thuật di truyền (GA) 13 2.1.1 Giới thiệu 13 2.1.2 Các vấn đề GA 15 2.1.3 Sự khác biệt GA với giải thuật khác 18 2.2 Giải thuật di truyền kinh điển 20 2.2.1 Giới thiệu 20 2.2.2 Các toán tử di truyền 21 2.2.3 Các bƣớc quan trọng việc áp dụng giải thuật di truyền kinh điển 26 2.2.4 Ví dụ 27 CHƢƠNG BÀI TOÁN ĐỐI SÁNH MẪU SỬ DỤNG GIẢI THUẬT DI TRUYỀN 30 3.1 Bài toán đối sánh mẫu file văn 30 3.1.1 Phân tích thuật tốn 31 3.1.2 Các trình hoạt động chƣơng trình 36 3.1.3 Kết đánh giá 40 3.2 Bài toán đối sánh mẫu nhiều file văn 55 Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn iv 3.2.1 Phát biểu toán 55 3.2.2 Kết thử nghiệm 56 KẾT LUẬN VÀ HƢỚNG PHÁT TRIỂN 63 *) Kết luận 63 *) Hƣớng nghiên cứu phát triển 63 TÀI LIỆU THAM KHẢO 64 DANH MỤC THUẬT NGỮ, TỪ VIẾT TẮT, KÍ HIỆU GA Giải thuật di truyền NST Nhiễm sắc thể Population Quần thể Pattern matching Đối sánh mẫu TSP Bài toán ngƣời bán hàng Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn v DANH MỤC CÁC HÌNH VẼ Hình 1.1 : Sơ đồ automat Hình 1.2 Mis-match so sánh vị trí j Hình 1.3 Good-suffix shift, trƣờng hợp u lại xuất x Hình 1.4 Good-suffix shift, trƣờng hợp có suffix u xuất x Hình 1.5 Bad-character shift Hình 1.6 Hình 2.1 Sơ đồ giải thuật GA 14 Hình 3.1 Giao diện chƣơng trình 40 Hình 3.2 Giao diện chƣơng trình mở rộng 57 DANH MỤC BẢNG BIỂU Bảng 2.1 Bảng quần thể khởi tạo ban đầu 28 Bảng 3.1 Ví dụ biểu diễn cá thể 36 Bảng 3.2 Kết chƣơng trình với độ xác 100% 42 Bảng 3.3 Kết chƣơng trình với độ xác 90% 43 Bảng 3.4 Kết chƣơng trình với độ xác 80% 44 Bảng 3.5 Kết chƣơng trình với tỉ lệ a – b: 0.5 – 0.5 46 Bảng 3.6 Kết chƣơng trình với tỉ lệ a – b: 0.6 – 0.4 46 Bảng 3.7 Kết chƣơng trình với tỉ lệ a – b: 0.8 – 0.2 47 Bảng 3.8 Kết chƣơng trình với tỉ lệ a – b: 0.9 – 0.1 48 Bảng 3.9 Kết chƣơng trình mở rộng với độ xác 100% 58 Bảng 3.10 Kết chƣơng trình mở rộng với độ xác 90% 59 Bảng 3.11 Kết chƣơng trình mở rộng với độ xác 80% 60 Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn MỞ ĐẦU Hiện nay, với phát triển không ngừng ngành khoa học máy tính việc hệ thống thông tin đƣợc lƣu trữ ngày đồ sộ Đối với kho thông tin lớn nhƣ vậy, việc ngƣời dùng muốn tra cứu, truy vấn liệu ngày khó khăn Bên cạnh đó, lƣợng thông tin phát triển nhiều, việc tổ chức, quản lí chúng để kiểm sốt đƣợc việc bùng nổ thông tin vấn đề cần quan tâm nhà quản lí Hiện có nhiều cơng cụ truy vấn hỗ trợ cho ngƣời dùng phần việc tìm kiếm: * Cơng cụ tìm kiếm wikipedia: Chỉ tìm tên tựa văn trùng hợp với từ khóa * Cơng cụ tìm kiếm phần mềm ứng dụng Microsoft word: Công cụ FIND cho phép ngƣời dùng tìm kiếm cụm từ nội bên hồ sơ, văn * Cơng cụ tìm kiếm hệ điều hành Microsoft Windows Adobe Reader: Cả hai cơng cụ cho phép tìm kiếm hồ sơ có chứa từ khóa hồ sơ, thƣ mục hay ổ đĩa máy tính Tuy nhiên, công cụ tồn hạn chế định.Trong đó, cơng việc tìm kiếm, truy vấn liệu để nhanh chóng hiệu vấn đề cấp thiết đƣợc nhiều ngƣời dùng quan tâm Các thông tin đƣợc lƣu trữ máy tính lớn nhƣng đa số đƣợc lƣu dƣới dạng văn bản, có nhiều cơng cụ tìm kiếm nhƣng chế chung chúng dựa phƣơng pháp sử dụng chuỗi Đối sánh mẫu (pattern matching) tốn quan trọng việc hỗ trợ tìm kiếm văn đƣợc áp dụng để tìm xâu khớp với mẫu văn tìm văn có chứa mẫu Giải thuật di truyền (GA – Genetic Algorithms) kỹ thuật tính tốn mềm nhằm tìm kiếm giải pháp thích hợp cho tốn tối ƣu tổ hợp, vận dụng nguyên lý tiến hóa nhƣ lai ghép, đột biến, chọn lọc Ngày nay, Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn giải thuật di truyền đƣợc ứng dụng rộng rãi lĩnh vực nhƣ tin sinh học, khoa học máy tính, trí tuệ nhân tạo, tài số ngành khác Đề tài “Bài toán đối sánh mẫu sử dụng giải thuật di truyền” nhằm mục đích nghiên cứu tốn đối sánh mẫu, giải thuật di truyền ứng dụng giải thuật di truyền đối sánh mẫu tìm kiếm văn Ngoài phần mở đầu kết luận, luận văn gồm có chƣơng: - Chƣơng 1: Một số thuật toán đối sánh mẫu - Chƣơng 2: Giới thiệu giải thuật di truyền - Chƣơng 3: Bài toán đối sánh mẫu sử dụng giải thuật di truyền Phƣơng pháp nghiên cứu Trong luận văn, học viên sử dụng phƣơng pháp nghiên cứu sau: - Phƣơng pháp nghiên cứu lý thuyết: Tìm tịi, tổng hợp tài liệu, hệ thống lại kiến thức, tìm hiểu khái niệm, thuật toán sử dụng luận văn - Lập trình thử nghiệm: Luận văn sử dụng ngơn ngữ lập trình Visual Studio C# 2012 để viết chƣơng trình thử nghiệm - Các phƣơng pháp so sánh Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn CHƢƠNG MỘT SỐ THUẬT TOÁN ĐỐI SÁNH MẪU Chương giới thiệu phát biểu toán đối sánh mẫu, tìm hiểu số thuật tốn sử dụng để giải toán đối sánh mẫu 1.1 Giới thiệu toán đối sánh mẫu Trong khoa học máy tính, đối sánh mẫu hành động kiểm tra xem trình tự kí tự có diện xâu cho trƣớc hay không Ngƣợc lại với nhận dạng mẫu, đối sánh mẫu thƣờng có xác Dạng phổ biến tốn đối sánh mẫu là: Cho trƣớc nguồn tìm kiếm tập D văn bản, cho câu hỏi dạng văn q (thƣờng từ, xâu văn ngắn), tìm tất văn thuộc D mà có chứa q Trong nhiều trƣờng hợp (chẳng hạn, tìm kiếm thơng qua máy tìm kiếm) q cịn đƣợc gọi “truy vấn” tốn cịn có tên gọi “tìm kiếm theo truy vấn” Để tìm đƣợc văn có chứa văn truy vấn q, hệ thống tìm kiếm cần phải kiểm tra văn truy vấn q có xâu văn thuộc tập D hay không (sánh mẫu) đƣa văn đáp ứng Trong nhiều trƣờng hợp, tốn cịn địi hỏi tìm tất vị trí xâu văn trùng với q Đồng thời, điều kiện tìm kiếm đƣợc làm “xấp xỉ” theo nghĩa văn kết khơng cần chứa q mà cần “liên quan” tới q, nghĩa có xâu văn xấp xỉ q Có thể thấy, máy tìm kiếm sử dụng chế tìm kiếm xấp xỉ mà văn kết tìm kiếm khơng chứa hồn tồn xác văn truy vấn [6] 1.2 Phát biểu toán Đối sánh mẫu toán xử lý văn bản, tốn u cầu tìm nhiều vị trí xuất mẫu q văn S Mẫu q văn S chuỗi có độ dài M N (M ≤ N); q S xâu ký tự bảng chữ Σ có δ ký tự Bài tốn sánh mẫu tổng quát đƣợc phát biểu nhƣ sau: Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn 54 Cá thể khởi tạo tốt có giá trị: 0.733333 cá thể thứ 17 vị trí 2889 Thế hệ thứ: hàm mục tiêu đạt giá trị tốt Thế hệ thứ: hàm mục tiêu đạt giá trị tốt Thế hệ thứ: hàm mục tiêu đạt giá trị tốt Thế hệ thứ: hàm mục tiêu đạt giá trị tốt 0.861905 vị trí văn 2894 Thế hệ thứ: hàm mục tiêu đạt giá trị tốt 0.861905 vị trí văn 2894 Thế hệ thứ: hàm mục tiêu đạt giá trị tốt 0.861905 vị trí văn 2894 Thế hệ thứ: hàm mục tiêu đạt giá trị tốt 0.861905 vị trí văn 2894 Thế hệ thứ: hàm mục tiêu đạt giá trị tốt 0.861905 vị trí văn 2894 Thế hệ thứ: hàm mục tiêu đạt giá trị tốt 0.861905 vị trí văn 2894 Thế hệ thứ: 10 hàm mục tiêu đạt giá trị tốt vị trí văn 2893 Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn 55 Thế hệ thứ: Thế hệ thứ: Thế hệ thứ: Thế hệ thứ: Thế hệ thứ: Thời gian tiến hóa hệ: 0.0804789 giây 3.2 Bài toán đối sánh mẫu nhiều file văn 3.2.1 Phát biểu toán Với mục đích nâng cao hiệu chƣơng trình, ta mở rộng phạm vi tìm kiếm tập văn bản: D = {d1,…, dM}, di file văn có định dạng *.txt Muốn biết đƣợc văn thuộc D có chứa mẫu q hay khơng, hệ thống tìm kiếm cần kiểm tra mẫu q có xâu văn thuộc tập D hay không (sánh mẫu) đƣa văn đáp ứng Trong nhiều trƣờng hợp, tốn cịn địi hỏi tìm tất vị trí xâu văn trùng với q Với thuật tốn tìm kiếm tuyến tính, trƣờng hợp số phần tử D độ dài văn lớn dẫn đến khó tìm kết thời gian ngắn Giải thuật di truyền với thời gian tiến hóa quần thể ngắn giúp ta giải tốt vấn đề Ta phát biểu tốn đối sánh mẫu nhiều file văn nhƣ sau: “Cho tập D văn mẫu đối sánh q Tìm văn d i (i=1 M) có chứa mẫu đối sánh q vị trí xuất mẫu văn tìm được” Với mục đích thử nghiệm, chƣơng trình sử dụng tập văn gồm 10 file văn bản, văn có độ dài khoảng 4000 kí tự, input output toán nhƣ sau: Input: Tập D = {d1,… ,d10}, mẫu đối sánh q Các file thuộc tập D có định dạng: *.txt Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn 56 Output: Các file di có chứa mẫu q vị trí xuất mẫu file di *) Phân tích tốn Trong tốn này, xây dựng q trình thực GA giống với toán mục 3.1 luận văn Tuy nhiên, toán có thay đổi số lƣợng cá thể quần thể ban đầu, cách sử dụng vòng lặp số vòng lặp lần thực giải thuật Với 10 file liệu vào, chƣơng trình tìm kiếm mẫu q lần lƣợt file Tại file di chƣơng trình thực GA 25 lần tức khởi tạo tiến hóa 25 lần, nhiên chƣơng trình không thực hết 25 lần lặp lần lặp tìm đƣợc vị trí xuất mẫu q thực file Kết file đƣợc kết luận vùng hiển thị kết giao diện chƣơng trình, với file KETQUA.txt ghi lại tồn quần thể khởi tạo, tiến hóa kết luận file File KETQUA.txt đƣợc lƣu tự động thƣ mục \bin\Debug thƣ mục nơi cài đặt chƣơng trình Về số cá thể khởi tạo ban đầu: Chƣơng trình khởi tạo quần thể ban đầu 100 cá thể, qua nhiều lần chạy thử nghiệm ta thấy điều giúp cho việc tìm kiếm hiệu hơn, có ý nghĩa file văn có số lần xuất mẫu 3.2.2 Kết thử nghiệm 3.2.2.1 Giao diện chƣơng trình Giao diện chƣơng trình nhƣ sau: Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn 57 Hình 3.2 Giao diện chương trình mở rộng *) Chức đối tƣợng giao diện: - Ơ Độ xác: thiết lập độ xác cho kết tìm kiếm - Ơ Số hệ tiến hóa: đặt số hệ tiến hóa cho quần thể - Ơ Textbox nút thực hiện: nhập mẫu tìm kiếm q vào textbox nhấn nút - Vùng ListBox kết tìm kiếm: hiển thị kết tìm kiếm *) Thực chƣơng trình: Khi chạy chƣơng trình, ta thực điền đầy đủ thơng số, nhập mẫu tìm kiếm từ, cụm từ vào Textbox sau nhấn nút Thực Chƣơng trình đọc lần lƣợt file từ d1.txt d10.txt, file đƣợc lƣu thƣ mục \bin\Debug thƣ mục nơi cài đặt chƣơng trình Mẫu q lần lƣợt đƣợc tìm văn này, tìm đƣợc in thơng báo lên ListBox file thứ d i có chứa mẫu q vị trí tìm đƣợc Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn 58 3.2.2.2 Một số kết Để thử nghiệm ta tạo file văn nhƣ sau: file d1 d10 chứa đoạn văn với độ dài khác nhau, sau thêm mẫu truy vấn q = “genetic algorithms” vào lần lƣợt file văn vị trí ngẫu nhiên nhƣ sau: d1 vị trí 27; d2 vị trí 2289; d3 vị trí 799; d4 vị trí 806; d5 vị trí 1195; d6 vị trí 774; d7 vị trí 1155; d8 vị trí 2637; d9 vị trí 4312; d10 vị trí 505 Sau kết chạy chƣơng trình với mức độ xác: 100%, 90% 80% *) Độ xác : Bảng 3.9 Kết File di 10 Chƣơng trình cho kết tốt lần chạy với việc tìm đƣợc vị trí xuất mẫu tất file Với file thực giải thuật GA Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn 59 khoảng đến lần tìm đƣợc kết quả, với thời gian khởi tạo tiến hóa quần thể từ 0.21 đến 0.26 giây *) Độ xác : 0.9 Bảng 3.10 Kết qu File di 10 Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn 60 Với độ xác 0.9 chƣơng trình cần số lần lặp so với độ xác 1, cần từ đến lần lặp cho file, với thời gian tiến hóa quần thể đạt ngƣỡng từ 0.17 đến 0.24 giây Trong 10 file tìm kiếm, chƣơng trình cho kết xác vị trí xuất mẫu 6/10 file *) Độ xác : 0.8 Bảng 3.11 Kết qu File di 10 Số hóa Trung tâm Học liệu – ĐHTN 61 Với độ xác 0.8, chƣơng trình cần lặp từ đến lần cho file tìm đƣợc kết Các kết đạt đƣợc đạt yêu cầu, đặc biệt file thứ chƣơng trình tìm đƣợc xác vị trí mẫu; với khoảng thời gian từ 0.20 đến 0.26 giây Những kết tƣơng ứng với độ xác cho ta thấy, độ xác cao chƣơng trình chạy lâu hơn, cần nhiều lần lặp ngƣợc lại độ xác giảm chƣơng trình thực lần lặp kết thời gian chạy chƣơng trình giảm đáng kể GA cho kết lần chạy khác nhau, điều với tính chất Những kết đa số lần thử nghiệm đạt kết tốt, chƣơng trình tìm đƣợc vị trí xuất mẫu cho dù mẫu tìm kiếm xuất lần văn tập D, nhiên ta tránh khỏi lần thử nghiệm chƣơng trình khơng cho kết xác, ví dụ 10 file xuất mẫu nhƣng tìm đƣợc 7, file chứa mẫu, điều xảy với xác suất cao với file văn có số kí tự lớn mẫu tìm kiếm văn lại xuất Về thời gian khởi tạo tiến hóa quần thể, chƣơng trình tốn tăng lên so với chƣơng trình luận văn, dễ nhận chƣơng trình ta tăng số cá thể quần thể khởi tạo lên 100 cá thể (so với 26 cá thể chƣơng trình chính), điều làm thời gian thực toán tử GA nhiều (đúng với nhận xét quần thể khởi tạo trình bày: số cá thể quần thể khởi tạo q dẫn đến khó tìm đƣợc cá thể tốt nhất, ngƣợc lại số cá thể lớn khả tìm đƣợc cá thể tốt tăng lên nhƣng chƣơng trình chạy chậm đi) Tuy vậy, thời gian thực chƣơng trình cịn phụ thuộc vào độ dài ngắn mẫu tìm kiếm Với mẫu tìm kiếm khơng xuất tất văn Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn 62 tập D chƣơng trình phải thực nhiều lần giải thuật GA cho file, dẫn đến thời gian thực chƣơng trình tăng cao Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn 63 KẾT LUẬN VÀ HƢỚNG PHÁT TRIỂN *) Kết luận Đề tài đạt đƣợc số kết nhƣ sau : - Tìm hiểu đƣợc số phƣơng pháp đối sánh mẫu bản, nắm đƣợc tƣ tƣởng thuật toán - Bƣớc đầu đƣa đƣợc giải pháp giải toán đối sánh mẫu cách áp dụng giải thuật di truyền, lớp giải thuật xác suất đƣa đƣợc kết chấp nhận đƣợc - Giải đƣợc tốn tìm kiếm mẫu nhiều file văn bản, với kết xác so với tìm kiếm tuần tự, với chi phí thời gian ngắn *) Hƣớng nghiên cứu phát triển - Nâng cấp tốn cho tốn thời gian mà cho kết xác - Kết hợp GA với số giải thuật hiệu khác nhằm tăng hiệu tốn - Có thể tiến hành đối sánh, tìm kiếm nhiều định dạng file khác nhau, ví dụ file doc, ppt, pdf… - Sử dụng đƣợc tốn khơng gian tìm kiếm lớn Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn 64 TÀI LIỆU THAM KHẢO [1] Nguyễn Thị Ngọc Chi, Trần Kim Hƣơng (2015) “Giải Thuật Di Truyền (Gas) ứng dụng”, Hội nghị NCKH khoa Toán – Tin, tr.94 – 101 [2] Mr.Datnh(2014),“Thuật toán Boyer-Moore”,Http://laptrinh.vn,ngày 21/08/2014 [3] Nguyễn Thị Thuý Hoài (2008), Thuật giải di truyền ứng dụng, Trƣờng Đại học Sƣ Phạm – ĐH Đà Nẵng, Báo cáo “ Hội nghị Sinh viên Nghiên cứu Khoa học” lần thứ 6, tr.266 – 270 [4] Nguyễn Hữu Mùi (2006), “Thuật toán di truyền ứng dụng”, Nxb ĐHSP, Hà Nội [5] Nguyễn Văn Quyết (2009), Bài tốn tìm kiếm văn sử dụng giải thuật di truyền, Luận văn thạc sĩ Khoa học máy tính, Đại học cơng nghệ thơng tin truyền thơng – ĐHTN [6] Nguyễn Đức Thiện (2010), “Thuật toán đối đối sánh mẫu (pattern matching) văn bản”, Http://ndthien.blogspot.com, ngày 14/04/2010 [7] Nguyễn Thị Thúy (2012), Một họ thuật toán đối sánh mẫu Wu-Manber thực nghiệm, Luận văn thạc sĩ Hệ thống thông tin, Trƣờng đại học Công nghệ - Đại học Quốc Gia Hà Nội [8] Mai Ngọc Tùng (2012), Nghiên cứu ứng dụng giải thuật di truyền để tìm kiếm thơng tin văn bản, Bài thu hoạch môn học phƣơng pháp nghiên cứu khoa học tin học, Đại học Quốc gia Thành phố Hồ Chí Minh [9] Vũ Mạnh Xuân (2012), Bài giảng giải thuật di truyền, Trƣờng Đại học Sƣ Phạm – ĐHTN [10] Gonzalo Navarro, Mathieu Raffinot (2002), Flexible Pattern Matching in [11] Strings Lance Chambers (1995), Practical Handbook of genetic Algorithms: Applications Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn ... tốn đối sánh mẫu, giải thuật di truyền ứng dụng giải thuật di truyền đối sánh mẫu tìm kiếm văn Ngoài phần mở đầu kết luận, luận văn gồm có chƣơng: - Chƣơng 1: Một số thuật toán đối sánh mẫu -... SỐ THUẬT TOÁN ĐỐI SÁNH MẪU Chương giới thiệu phát biểu toán đối sánh mẫu, tìm hiểu số thuật tốn sử dụng để giải toán đối sánh mẫu 1.1 Giới thiệu toán đối sánh mẫu Trong khoa học máy tính, đối sánh. .. sánh mẫu - Chƣơng 2: Giới thiệu giải thuật di truyền - Chƣơng 3: Bài toán đối sánh mẫu sử dụng giải thuật di truyền Phƣơng pháp nghiên cứu Trong luận văn, học viên sử dụng phƣơng pháp nghiên cứu

Ngày đăng: 09/06/2021, 06:49

w