Kho dữ liệu đóng một vai trò quan trọng trong việc lưu trữ, phân tích và cung cấp thông tin. Các kho dữ liệu đều chứa nhiều thông tin hữu ích cung cấp cho các hệ trợ giúp quyết định. Việc tìm và đưa ra những tài liệu cần thiết từ kế hoạch xử lý đa dạng của hệ thống đã tạo ra những thách thức khi nghiên cứu về kho dữ liệu.
JOURNAL OF SCIENCE OF HNUE FIT., 2011, Vol 56, pp 102-111 ỨNG DỤNG GIẢI THUẬT DI TRUYỀN ĐỂ TÌM KIẾM TÀI LIỆU TRONG KHO DỮ LIỆU Nghiêm Thị Lịch(∗) Khoa Tin học thương mại, Trường Đại học Thương mại Nguyễn Tân Ân Khoa CNTT - ĐHSP Hà Nội Email :lichnt72@gmail.com (∗) Tóm tắt Kho liệu đóng vai trị quan trọng việc lưu trữ, phân tích cung cấp thông tin Các kho liệu chứa nhiều thơng tin hữu ích cung cấp cho hệ trợ giúp định Việc tìm đưa tài liệu cần thiết từ kế hoạch xử lý đa dạng hệ thống tạo thách thức nghiên cứu kho liệu Vấn đề tốn lớp NP khó [4] Một số tác giả dùng giải thuật heuristic để giải Dưới đây, chúng tơi trình bày cách ứng dụng giải thuật di truyền để giải toán đặt Những vấn đề mã hóa cá thể, tốn tử giải thuật trường hợp cụ thể đề cập đến Từ khóa: Kho liệu, Giải thuật di truyền, Khai phá liệu Giới thiệu Hiện nay, phát triển nhanh chóng khoa học kỹ thuật sản xuất, ngày có nhiều thông tin Cũng nhờ thành tựu khoa học kỹ thuật, thiết bị lưu trữ thông tin ngày lưu trữ lượng thơng tin lớn đa dạng Cùng với việc tăng không ngừng khối lượng liệu, hệ thống thông tin chun mơn hóa, phân chia theo lĩnh vực ứng dụng sản xuất, tài chính, thị trường Như vậy, với chức khai thác liệu có tính chất tác nghiệp, thành cơng hệ thống thơng tin khơng cịn khả lưu trữ mà tính linh hoạt sẵn sàng đáp lại yêu cầu thực tế Cơ sở liệu (CSDL) cần đem lại “tri thức” liệu Các mơ hình CSDL truyền thống ngơn ngữ SQL tỏ có nhiều hạn chế thực công việc với nguồn thông tin lớn Để lấy thông tin có tính “tri thức” khối liệu khổng lồ, người ta tìm kỹ thuật có khả hợp liệu từ hệ thống giao dịch khác nhau, chuyển đổi 102 Ứng dụng giải thuật di truyền để tìm kiếm tài liệu kho liệu thành tập hợp sở liệu ổn định, có chất lượng, sử dụng riêng cho vài mục đích Các kỹ thuật gọi chung kỹ thuật tạo kho liệu (data warehousing) nơi chứa liệu có gọi kho liệu (data warehouse) Vấn đề đặt với kho liệu định, hệ thống cung cấp kế hoạch xử lý đa dạng, làm để chọn, đưa tập tài liệu liệu thích hợp với mục đích đặt (View Selection Problem: VSP) từ kho liệu với chi phí thấp Điều đồng nghĩa với việc làm để chọn kế hoạch truy vấn, tìm kiếm chi phí số kế hoạch xử lý đa dạng (Multiple View Processing Plan: MVPP) để đưa tài liệu cần tìm Do kho liệu lớn liệu chứa đa dạng, kế hoạch xử lý hệ thống phức tạp nên việc chọn kế hoạch tìm kiếm nhằm đưa tài liệu cho trước với chi phí thấp tốn khó Theo [4] tốn NP-khó (NP-hard) Một số tác giả giải vấn đề nhờ giải thuật heuristic Bài báo giới thiệu cách giải vấn đề đặt giải thuật di truyền (GA) Nội dung nghiên cứu 2.1 2.1.1 Vấn đề tìm kiếm tài liệu Mơ hình tốn học vấn đề tìm kiếm tài liệu [6] Một MVPP để tìm kiếm, đưa tài liệu cung cấp hệ thống kho liệu, kế hoạch tiếp cận cục cho truy vấn riêng lẻ hợp dựa toán tử chia sẻ tập liệu chung MVPP biểu diễn sau: r M = (V, A, Caq , Cm , fq , fu ) Trong V tập đỉnh, A tập cung V , cho: Với toán tử đại số quan hệ truy vấn, với quan hệ sở, với câu truy vấn riêng biệt, ta có đỉnh Với v ∈ V , T (v) quan hệ tạo tương ứng với đỉnh v T (v) quan hệ sở, kết trung gian kết cuối truy vấn Với đỉnh bất kỳ, (tức khơng có cạnh xuất phát từ đỉnh này), T (v) tương ứng với quan hệ sở, mô tả cách sử dụng kí hiệu Ký hiệu L tập nút Với đỉnh v ∈ V , fu (v) tần số cập nhật v Với đỉnh gốc v bất kỳ, (nghĩa khơng có cạnh đỉnh này), T (v) tương ứng với câu truy vấn tồn cục, mơ tả cách sử dụng kí hiệu Ký hiệu R tập nút gốc, với đỉnh thuộc V , fq (v) tần số truy cập câu truy vấn v Nếu T (u) tương ứng với đỉnh u cần phải xử lý tiếp nút v, ta có cung 103 Nghiêm Thị Lịch, Nguyễn Tân Ân từ u tới v Với đỉnh v, S(v) biểu diễn nút nguồn (nút gốc) có cung trỏ tới v ; với v ∈ L, S(v) = 0: S ∗ {v} = S(v) ∪ { ∪ S ∗ {v ′ }} tập cháu v′ ∈S(v) v ; Với đỉnh v, D(v) biểu thị nút đích mà v trỏ tới; với v ∈ R, D(v) = 0: D ∗ {v} = D(v) ∪ { ∪ D ∗ (v ′ )}} tập tổ tiên v v′ ∈D(v) r Với v ∈ V , chi phí câu truy vấn q với truy cập T (v); Cm (v) ∗ chi phí trì T (v) dựa thay đổi quan hệ sở S (v) ∩ R, T (v) lựa chọn để đưa Giới thiệu lại tất ký hiệu sử dụng tài liệu này: - Có k truy vấn cung cấp hệ thống quản trị kho liệu - Với truy vấn q bất kỳ, có tập kế hoạch thực truy vấn - Có n nút (biểu thức/truy vấn phụ) tham gia vào tất kế hoạch - Một MVPP xây dựng k kế hoạch (mỗi truy vấn biểu diễn kế hoạch) Bây giờ, vấn đề lựa chọn tài liệu mơ tả sau: - Làm để chọn, đưa tập tài liệu thích hợp từ MVPP cho cho tổng chi phí xử lý truy vấn tổng chi phí trì tài liệu đưa nhỏ - Cụ thể, cho trước MVPP, cho M tập tài liệu MVPP đưa fq , fu tương ứng tần số thực truy vấn tần số cập nhật r quan hệ sở Hơn cho v ∈ M, cho Caq (v) Cm (v) biểu thị chi phí truy cập cho truy vấn q sử dụng v chi phí trì tài liệu v vào thay đổi cho quan hệ sở r (trong v ∈ R tập truy vấn r ∈ L tập quan hệ sở) Khi đó, chi phí xử lý truy vấn là: Cqueryprocessing (v) = fq Caq (v) Caq (v) q∈R Và chi phí trì tài liệu đưa là: r Cmaintenance (v) = fu Cm (v) r∈L Ví dụ: Cho quan hệ sở tập truy vấn: DEPARTMENT (DNAME, DNUMBER, MGRSSN, GGRSTARTDATE) EMPLOYEE (FNAME, LNAME, SSN, BDATE, ADDRESS, SEX, SALARY, SUPERSSN, DNO) PROJECT (PNAME, PNUMBER, PLOCATION, DNUM) Q0: SELECT * 104 Ứng dụng giải thuật di truyền để tìm kiếm tài liệu kho liệu FROM EMPLOYEE, DEPARTMEENT WTHUSHERE SALARY > 50000 AND DUNMBER = DNO Q1: SELECT * FROM EMPLOYEE, DEPARTMEENT, PROJECT WHERE DNO = DNUMBER AND DNUM = DNUMBER AND PNAME = ‘Intec’; Như vậy, tổng chi phí để chọn lựa tài liệu v là: r Ctotal (v) = fq Caq (v) + fu Cm (v) r∈L q∈R Vì vậy, tổng chi phí để lựa chọn tập tài liệu M Ctotal : Ctotal (v) = Ctoal (v) v∈M Đây mơ hình tốn học khả quan mô tả vấn đề lựa chọn tài liệu VSP giải bước sau đây: Bước 1: Tạo MVPP tốt cách kết hợp siêu biểu thức chung Bước 2: Lựa chọn tài liệu từ tập MVPP tốt Tuy nhiên mô tả trên, số tập tài liệu tiềm đưa bị bỏ lỡ lựa chọn khơng nằm MVPP tốt Trong tài liệu này, đưa cách tiếp cận khác để giải VSP Chúng cố gắng duyệt qua tất MVPP khả tìm kiếm giải pháp tốt cho VSP 2.1.2 Một số ví dụ điển hình Hình minh họa bốn ví dụ đơn giản MVPP Đây ví dụ lấy từ hệ thống kho liệu mà mô Các quan hệ thuộc tính lược đồ cho ứng dụng hai truy vấn đưa bên Lược đồ truy vấn xuất phát từ Trong hình 1, đồ thị MVPP xây dựng cách kết hợp kế hoạch thực truy vấn tiềm gán nhãn đầu nút truy vấn tần số cập nhật quan hệ sở gán nhãn bên nút quan hệ sở Đối với nút, không kể nút gốc (nút truy vấn) nút (nút quan hệ sở), có hai thơng tin liệu liên kết với Dữ liệu bên trái đại diện cho toán tử truy vấn, bên phải đại diện cho chi phí tạo nút trừ quan hệ sở Con số bên nút (trừ nút gốc) số lượng nút trung gian cần lựa chọn Con số giống MVPP khác đại diện cho toán tử tương tự Để tính tốn chi phí, chúng tơi đưa giả định sau: - Có 10 quan hệ DEPARTMENT 105 Nghiêm Thị Lịch, Nguyễn Tân Ân - Có 30 k quan hệ EMPLOYEE, thuộc tính DNO khơng rỗng - Có 20 quan hệ PROJECT Chi phí trả lời câu truy vấn Q số dòng bảng sử dụng để xây dựng Q Việc tính tốn chi phí trả lời cho câu truy vấn tương tự Phương thức để tiến hành lựa chọn cách cài đặt kết hợp (liên kết) tốn tử tìm kiếm tuyến tính vịng lặp lồng Hình 1: Ví dụ MVPP Dựa sở giả định trên, chi phí nút tốn tử hình gán nhãn phía bên phải nút Giả sử số nút trung gian lựa chọn Đối với truy vấn, chi phí xử lý truy vấn tần số truy vấn nhân với chi phí truy cập truy vấn từ nút lựa chọn Chi phí trì cho việc lựa chọn liệu chi phí sử dụng để xây dựng đưa tài liệu Ví dụ, hình 1a, nút lựa chọn để đưa ra, chi phí xử lý truy vấn cho Q0 Q1 3*30k 2*30.02k Chi phí trì tài liệu (8+0.5)*(300k) Tổng chi phí cho MVPP tổng chi phí xử lý truy vấn trì tài liệu Mục tiêu việc giải VSP tìm kiếm tập nút lựa chọn cho tổng chi phí nhỏ 106 Ứng dụng giải thuật di truyền để tìm kiếm tài liệu kho liệu 2.2 Ứng dụng giải thuật di truyền để tìm kiếm tài liệu Giải thuật di truyền cổ điển kỹ thuật theo q trình thích nghi tiến hố quần thể sinh học dựa học thuyết Darwin [1, 3] Tư tưởng giải thuật di truyền mô tượng tự nhiên: Kế thừa đấu tranh sinh tồn để cải tiến lời giải khảo sát không gian lời giải Giải thuật di truyền sử dụng thuật ngữ vay mượn di truyền học Ta nói cá thể (hay kiểu gen, cấu trúc) quần thể; cá thể gọi chuỗi hay nhiễm sắc thể Mỗi kiểu (nhóm) gen (ta gọi nhiễm sắc thể) biểu diễn lời giải toán giải (ý tưởng nhiễm sắc thể cụ thể người sử dụng xác định trước); tiến trình tiến hố thực quần thể nhiễm sắc thể tương ứng với q trình tìm kiếm lời giải khơng gian lời giải Tìm kiếm cần cân đối hai mục tiêu: Khai thác lời giải tốt khảo sát khơng gian tìm kiếm Giải thuật di truyền (GA) phương pháp tìm kiếm (độc lập miền) tạo cân đối đáng kể việc khai thác khảo sát khơng gian tìm kiếm Thực ra, GA thuộc lớp thuật giải xác suất, lại khác thuật giải ngẫu nhiên chúng kết hợp phần tử tìm kiếm trực tiếp ngẫu nhiên Khác biệt quan trọng tìm kiếm GA phương pháp tìm kiếm khác GA trì xử lý tập lời giải (ta gọi quần thể) tất phương pháp khác xử lý điểm khơng gian tìm kiếm Chính mà GA mạnh phương pháp tìm kiếm có nhiều Sau ta ứng dụng GA để giải vấn đề tìm kiếm tài liệu kho liệu 2.2.1 Biểu diễn nhiễm sắc thể Để ứng dụng GA, việc mã hóa giải pháp vấn đề lựa chọn tài liệu việc biểu diễn nhiễm sắc thể Nhưng cần nhìn nhận lại vấn đề bước sau: - Làm để mã hóa số kế hoạch truy vấn tài liệu MVPP nhiễm sắc thể? - Mỗi nhiễm sắc thể có độ dài khác tập kế hoạch truy vấn khác tạo MVPP khác có số nút khác Nếu muốn ứng dụng GA, phải khắc phục hai vấn đề biểu diễn nhiễm sắc thể Xem xét hai vấn đề đó, tạo kế hoạch thực truy vấn cho truy vấn, hỗ trợ kho liệu sau liệt kê tất tài liệu xuất kế hoạch Mỗi nhiễm sắc thể biểu diễn hai phần Phần thứ nhất, gọi chuỗi kế hoạch truy vấn, ghi lại kế hoạch truy vấn lựa chọn để trả lời cho truy vấn Trong sở liệu xử 107 Nghiêm Thị Lịch, Nguyễn Tân Ân lý truy vấn, truy vấn có nhiều kế hoạch thực Mỗi kế hoạch thực sử dụng toán tử trung gian Truy vấn tối ưu cuối chọn lựa kế hoạch thực để trả lời câu truy vấn theo mơ hình chi phí Vì vậy, truy vấn có số đại diện cho kế hoạch truy vấn lựa chọn Phần thứ hai, gọi chuỗi tài liệu, ghi lại tài liệu đưa kho liệu Phần bao gồm chuỗi bit nhị phân Bít tương ứng với tài liệu thích hợp đưa Ngược lại, tài liệu tương ứng không đưa Độ dài phần số tài liệu thích hợp xuất tất MVPP Ví dụ, cho trước bốn truy vấn giả định truy vấn có ba kế hoạch thực tổng số tài liệu xuất 12 kế hoạch 20 Nhiễm sắc thể biểu diễn sau: [0,2,1,2][1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0] Mảng biểu diễn MVPP xây dựng từ kế hoạch thực cho truy vấn kế hoạch thứ cho truy vấn 2, kế hoạch thứ cho truy vấn 3, kế hoạch thứ cho truy vấn Mảng sau tài liệu thích hợp lựa chọn để đưa Chú ý nhiễm sắc thể khơng thể trở thành giải pháp khả thi khơng phải tất tài liệu xuất MVPP Ví dụ, tài liệu thích hợp khơng nằm MVPP xây dựng kế hoạch thứ 1, 2, cho truy vấn 1, 2, 3, Khi đó, nhiễm sắc thể [0,2,1,2][1,0,0,0,0,0,0,0,0,0,0,0,0,0, .] không trở thành giải pháp khả thi Một MVPP bao gồm tài liệu thích hợp Chúng ta trở lại MVPP hình Có tài liệu thích hợp tất MVPP gộp lại Tuy nhiên, tài liệu 1, 2, tài liệu thích hợp chúng sử dụng MVPP hình 1a Trong trường hợp này, vị trí 0, 1, 2, (tài liệu vị trí q trình mơ tả) xuất giá trị Các vị trí khác nên đặt Chúng ta cần quan tâm đến vị trí MVPP giải Bởi khơng gian tìm kiếm giảm xuống đến giới hạn thấp cách tiếp cận xấp xỉ Với giải pháp (nhiễm sắc thể), có tập tài liệu đưa tương ứng với nút việc giải MVPP Và giải pháp, hàm chi phí trả tổng chi phí chi phí truy vấn chi phí trì Giá trị hàm chi phí nhận nhỏ giải pháp tốt 2.2.2 Giải thuật GLS (Genetic Local Search) Giải thuật GLS phương pháp giải vấn đề cách sử dụng quy tắc có từ kinh nghiệm kết hợp ưu điểm giải thuật mẫu dựa vào tìm kiếm giải thuật di truyền tối ưu cục Tìm kiếm cục di chuyển lặp lại từ giải pháp tới giải pháp lân cận đạt cực tiểu cục 00 Trong nhanh chóng tìm giải pháp tốt miền nhỏ khơng gian tìm kiếm, toán tử di truyền phù 108 Ứng dụng giải thuật di truyền để tìm kiếm tài liệu kho liệu hợp cho tình khám phá khơng gian tìm kiếm để nhận dạng tài liệu quan tâm Trên khuôn mẫu giải thuật GLS cho VSP Như mô tả trên, tất giải pháp giải pháp khả thi Trong giải thuật, thiết kế hàm kiểm tra tính khả thi để loại bỏ gen không phù hợp Để loại gen khơng thích hợp, hàm kiểm tra làm giảm bớt khơng giam tìm kiếm Khi quần thể ban đầu tạo Hàm Check_feasible() liệt kê tài liệu liên quan theo chuỗi kế hoạch truy vấn ghi lại chúng Hàm tìm kiếm cục Local_search() sử dụng để điều chỉnh giá trị chuỗi tài liệu theo giá trị chuỗi kế hoạch truy vấn Tìm kiếm cục thực cho cá thể nhằm thu quần thể cực tiểu cục Trong vịng lặp chính, tốn tử trao đổi chéo đột biến áp dụng để lựa chọn ngẫu nhiên cá thể riêng lẻ cho số lần định trước 2.2.3 Các toán tử di truyền Trong phần này, chúng tơi giới thiệu tốn tử di truyền bao gồm: Chọn lọc, trao đổi chéo đột biến Toán tử chọn lọc 109 Nghiêm Thị Lịch, Nguyễn Tân Ân Mục đích chọn lọc giải thuật di truyền q trình cá thể chọn để tham gia vào pha q trình tiến hóa Việc chọn lựa tùy thuộc vào hàm thích nghi cá thể đó, có nghĩa cá thể có giá trị hàm thích nghi cao có khả có nhiều cháu hệ Có nhiều kiểu chọn lọc biết đến chọn lọc ngẫu nhiên, chọn lọc bánh xe quay, chọn lọc xếp hạng, Điểm việc chọn lọc giữ lại hệ cha mẹ tốt để có hội tốt chọn lọc Chúng chọn lựa cách tiếp cận phương pháp chọn lọc xếp hạng Chọn lọc xếp hạng phương pháp xếp cá thể dựa độ thích nghi chúng Các cá thể lựa √ chọn cách ngẫu nhiên từ đến n, n kích thước quần thể Tốn tử trao đổi chéo Trong giải thuật di truyền, trao đổi chéo tổ hợp lại gen nhiễm sắc thể cha mẹ để tạo Toán tử trao đổi chéo cho phép xác định điểm bắt đầu cho tìm kiếm cục dựa thơng tin chứa quần thể Mục đích trao đổi chéo xác định vùng khơng gian tìm kiếm mà giải pháp tốt có khả tìm thấy thủ tục tìm kiếm cục Trong cách tiếp cận này, áp dụng điểm trao đổi chéo cho nhiễm sắc thể lựa chọn Nhiễm sắc thể bao gồm hai phần, phần trao đổi chéo sau: Chuỗi kế hoạch truy vấn: hai chuỗi kế hoạch truy vấn từ hai nhiễm sắc thể lựa chọn để trao đổi chéo sinh hai Ví dụ, cho bốn truy vấn số kế hoạch thực truy vấn 2, 2, 4, Áp dụng điểm trao đổi chéo tới hai chuỗi kế hoạch truy vấn [1100] [3311] sinh con: [1111] [3300] điểm cắt vị trí thứ Hàm check-feasible áp dụng để kiểm tra tính khả thi hệ Chúng ta sử dụng hàm “mod” để điều chỉnh giải pháp khơng khả thi Trong ví dụ, chuỗi kế hoạch truy vấn [3300] giải pháp không khả thi Vì vậy, ta sử dụng hàm “mod” để điều chỉnh tới [1100] Chuỗi tài liệu: thường trao đổi hai chuỗi tài liệu từ hai cha mẹ sử dụng hàm check-feasible() để tạo nhiễm sắc thể sinh phù hợp Toán tử đột biến Trong giải thuật di truyền, đột biến không xảy thường xuyên (với khả nhỏ) thay đổi ngẫu nhiên giá trị vị trí bit Đột biến cần thiết, cho dù chép lại trao đổi chéo tìm kiếm hiệu quả, tổ hợp lại khái niệm có, đơi chúng trở nên tích cực (có hiệu quả) số gen cần thiết có ích (các vị trí đặc biệt 1) Trong tài liệu này, đột biến chuỗi tài liệu đơn giản thay đổi thành ngược lại nhiễm sắc thể Đột biến chuỗi kế hoạch truy vấn tăng thành truy vấn lựa chọn chắn có khả trở thành số kế hoạch 110 Ứng dụng giải thuật di truyền để tìm kiếm tài liệu kho liệu Kết luận Quá trình tìm kiếm kho liệu lớn vấn đề nhà tin học quan tâm Đã có nhiều phương pháp tìm kiếm, lựa chọn tài liệu đưa Ứng dụng GA giải pháp khơng khả thi mà cịn tỏ có nhiều ưu điểm Việc cải tiến hàm thích nghi tốn tử giải thuật cịn phải nghiên cứu thử nghiệm thêm Những vấn đề trình bày báo cáo tiếp sau REFERENCES [1] Nguyễn Đình Thúc, (2001) Trí tuệ nhân tạo: Lập trình tiến hố Nxb giáo dục thành phố Hồ chí Minh [2] Võ Huỳnh Trâm, Trần Ngân Bình, (2002) Giáo trình trí tuệ nhân tạo Nxb giáo dục [3] J.R.Goldberg - D.E Fogel, (1996) Genetic programming, proceeding of the first annual conference Cambrige, MA Mit press [4] H Gupta and I S Mumick, (1999) Selection of views to materialize under a maintenance cost constraint Proc Int Conf Database Theory (ICDT), pp 453–470 [5] Gupta A, Mumick, (1995) Maintenance of materialized views: problems, techniques, and applications IEEE Data Eng Bulletin, (Special Issue on Materialized Views and Data Warehousing), pp 3–18 [6] Gupta H, (1997) Selection of views to materialize in a data warehouse Proceedings of the 23rd VLDB conference, Athens, Greece, pp.156–165 [7] Horng JT, Chang YJ, Liu BJ, (1999) Materialized View Selection Using Genetic algorithms in Data Warehouse System Late Breaking Papers at the Genetic and Evolutionary Computation Conference, pp 107–115 [8] http://www.felk.com [9] http://www.codeproject.com ABSTRACT Apply Genetic algorithm in searching information in data warehouse A data warehouse plays an important role for storage and analysis and supply information Data warehouses store lots of materialized views to provide an efficient decision-support system Selection of a fitness set of materialized views from a variety of Multiple View Processing Plan (MVPP) forms a challenge in data warehouse research This is an NP complete [4] Some authores used heuristic algorithms to solve this problem In this paper, we present genetic algorithm to choose materialized views How to code chromosomes and operators of this algorithm in this case are presented 111 ... trì tài liệu Mục tiêu việc giải VSP tìm kiếm tập nút lựa chọn cho tổng chi phí nhỏ 106 Ứng dụng giải thuật di truyền để tìm kiếm tài liệu kho liệu 2.2 Ứng dụng giải thuật di truyền để tìm kiếm tài. .. 110 Ứng dụng giải thuật di truyền để tìm kiếm tài liệu kho liệu Kết luận Quá trình tìm kiếm kho liệu lớn vấn đề nhà tin học quan tâm Đã có nhiều phương pháp tìm kiếm, lựa chọn tài liệu đưa Ứng dụng. .. giải thuật di truyền để tìm kiếm tài liệu kho liệu hợp cho tình khám phá khơng gian tìm kiếm để nhận dạng tài liệu quan tâm Trên khuôn mẫu giải thuật GLS cho VSP Như mô tả trên, tất giải pháp giải