Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 27 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
27
Dung lượng
382,78 KB
Nội dung
BỘ QUỐC PHÒNG HỌC VIỆN KỸ THUẬT QUÂN SỰ ———————————— PHẠM ĐÌNH THÀNH NGHIÊN CỨU PHÁT TRIỂN MỘT SỐ THUẬT TỐN TIẾN HĨA GIẢI BÀI TỐN CÂY KHUNG PHÂN CỤM ĐƯỜNG ĐI NGẮN NHẤT Chuyên ngành : Cơ sở toán học cho tin học Mã số : 46 01 10 TĨM TẮT LUẬN ÁN TIẾN SĨ TỐN HỌC HÀ NỘI - NĂM 2021 CƠNG TRÌNH ĐƯỢC HỒN THÀNH TẠI HỌC VIỆN KỸ THUẬT QUÂN SỰ - BỘ QUỐC PHÒNG ———————————————— Người hướng dẫn khoa học: PGS.TS Huỳnh Thị Thanh Bình Phản biện 1: PGS.TS Lê Trọng Vĩnh Phản biện 2: PGS.TS Ngô Hồng Sơn Phản biện 3: PGS.TS Nguyễn Quang Uy Luận án bảo vệ Hội đồng đánh giá luận án cấp Học viện theo định số / ., ngày tháng năm Giám đốc Học viện Kỹ thuật Quân sự, họp Học viện Kỹ thuật Quân vào hồi ngày tháng năm Có thể tìm hiểu luận án tại: − Thư viện Học viện Kỹ thuật Quân − Thư viện Quốc gia GIỚI THIỆU Trong nhiều ứng dụng mạng, nhằm đảm bảo tính hiệu bảo mật, thiết bị đầu cuối chia vào nhóm cho việc kết nối thiết bị đầu cuối nhóm có tính “cục bộ” Khi đó, việc đảm bảo liên kết thiết bị đầu cuối, tương ứng với việc cần phải tìm khung đồ thị với đỉnh thuộc nhóm Ví dụ, lĩnh vực nơng nghiệp, người từ sớm có nhu cầu tối ưu hệ thống dẫn nước tưới tiêu từ giếng nước tới ốc đảo sa mạc; ốc đảo lại cần tối ưu hệ thống dẫn nước tới vị trí trồng Trong lĩnh vực bưu chính, giao vận, cơng ty có nhu cầu tối ưu vận chuyển thư từ, hàng hóa, từ trung tâm tới tỉnh, từ tỉnh lại vận chuyển tới huyện, xã Với yêu cầu thực tiễn đó, lớp tốn khung, tập đỉnh phân chia thành tập quan tâm nghiên cứu Trong đó, tốn phân cụm đường ngắn (Clustered Shortest-Path Tree Problem - CluSPT) [20] tốn có vai trị quan trọng ứng dụng thực tiễn nhận nhiều quan tâm nhà nghiên cứu Do CluSPT tốn thuộc lớp NP-Khó [19, 20] nên luận án lựa chọn hướng tiếp cận giải xấp xỉ, sử dụng thuật toán metaheuristic heuristic Hiện nay, thuật toán thuộc lớp meta-heuristic heuristic sử dụng để giải toán tối ưu đa dạng, từ thuật toán dựa hướng giảm hàm số (gradient descent) [45], thuật tốn tiến hóa (Evolutionary Algorithm - EA) [6-8], hay thuật toán lấy ý tưởng từ tối ưu tự nhiên [9, 89] Trong năm gần đây, thuật tốn có ý tưởng bắt nguồn từ tự nhiên sử dụng rộng rãi để giải tốn có mức độ phi tuyến cao toán tối ưu khó [90] Trong thuật tốn lấy ý tưởng từ q trình tối ưu hóa tự nhiên, EA nhóm thuật tốn quan tâm nghiên cứu nhiều kỹ thuật tính tốn thơng minh quan trọng [16, 52, 93] Các thuật toán EA sử dụng khái niệm sinh học áp dụng vào lĩnh vực khoa học máy tính Tối ưu đa nhân tố (multi-factorial optimization) mơ hình tiến hóa đa nhiệm vụ (evolutionary multi-tasking) [35, 48, 77] Điểm khác biệt dễ nhận thấy tối ưu đa nhân tố thuật tốn EA thuật toán EA tập trung vào giải toán tối ưu thời điểm tối ưu đa nhân tố thường giải đồng thời nhiều tốn tối ưu Thuật tốn tiến hóa đa nhân tố (Multi-Factorial Evolutionary Algorithm - MFEA) nghiên cứu kết hợp tối ưu đa nhân tố với thuật toán di truyền [35, 36] Do thuật toán MFEA kế thừa ưu điểm trình trao đổi tri thức tiềm ẩn (implicit knowledge transfer) tốn nên q trình tìm kiếm lời giải thuật toán MFEA cải thiện tốc độ chất lượng so với lời giải tìm sử dụng thuật tốn tiến hóa Mặc dù áp dụng vào giải hiệu nhiều lớp toán, ứng dụng thuộc nhiều lĩnh vực khác thực tế, nhiên, nghiên cứu ứng dụng thuật toán EA thuật toán MFEA vào giải toán đồ thị, đặc biệt tìm lời giải cho tốn khung phân cụm cịn hạn chế Vì vậy, luận án tập trung vào việc xây dựng thuật tốn tiến hóa tiến hóa đa nhân tố hiệu để giải toán khung phân cụm, bao gồm từ xây dựng tốn tử tiến hóa lai ghép, đột biến, giải mã, tìm chế việc kết hợp hiệu thuật toán MFEA với thuật toán khác Mục tiêu nghiên cứu luận án Mục tiêu nghiên cứu luận án xây dựng thuật tốn xấp xỉ để giải tốn CluSPT, luận án tập trung vào hai hướng: sử dụng thuật tốn tiến hóa (chương 3) sử dụng thuật tốn tiến hóa đa nhân tố (chương 4) Các mục tiêu cụ thể luận án sau: Nghiên cứu toán CluSPT Nghiên cứu, đề xuất toán tử tiến hóa hiệu giải tốn CluSPT, đặc biệt toán tử cần thiết để áp dụng thuật tốn MFEA tốn tử mã hóa giải mã Nghiên cứu, đề xuất chế kết hợp thuật toán MFEA với thuật toán xấp xỉ Nghiên cứu, đề xuất thuật toán xấp xỉ giúp tìm kiếm nhanh lời giải tốn CluSPT, dễ cài đặt sở để so sánh, đánh giá thuật toán EA MFEA đề xuất Nghiên cứu phương pháp đánh giá thuật toán bao gồm xây dựng liệu phương pháp đánh giá thực nghiệm Phương pháp nghiên cứu Phương pháp nghiên cứu dựa nghiên cứu lý thuyết, phân tích tài liệu, mơ hình tốn học thực nghiệm để đánh giá thuật toán đề xuất, so sánh với thuật toán nghiên cứu có để giải tốn CluSPT Từ đó, đề xuất hướng tiếp cận phù hợp hiệu giải toán CluSPT Phạm vi nghiên cứu luận án Luận án tập trung nghiên cứu: • Bài tốn CluSPT • Các thuật tốn heuristic hiệu tốn đồ thị • Thuật tốn di truyền giải toán tối ưu đồ thị, đặc biệt tốn có tập đỉnh chia thành tập nhỏ • Thuật tốn MFEA áp dụng giải tốn tối ưu tổ hợp • Phương pháp xây dựng liệu, phương pháp đánh giá tiến hành thực nghiệm Các đóng góp luận án Về lý thuyết: Đề xuất thuật tốn xác SLA-M giải toán CluSPT đồ thị metric (metric graph) Đề xuất thuật toán HB-RGA kết hợp thuật toán tham lam ngẫu nhiên kết hợp với ý tưởng thuật toán Dijkstra để giải toán CluSPT Thuật tốn HB-RGA tìm lời giải thời gian ngắn chất lượng lời giải tốt thuật toán có trước Đề xuất hai thuật tốn tiến hóa C-EA N-EA để giải tốn CluSPT Với thuật toán, luận án đề xuất toán tử lai ghép, toán tử đột biến phương pháp mã hóa lời giải Luận án đề xuất cách cài đặt thực nghiệm tính hàm mục tiêu tốn CluSPT để giảm chi phí tính tốn Đề xuất thuật tốn tiến hóa đa nhân tố G-MFEA giải toán CluSPT Thuật toán G-MFEA cho kết tốt thuật toán nghiên cứu trước đây, đó, thuật tốn G-MFEA tìm lời giải tối ưu nhiều tập liệu khác Về mặt ứng dụng: thuật toán đề xuất luận án áp dụng trực tiếp vào giải toán thực tế kỹ thuật, sản xuất, v.v Cấu trúc luận án Ngoài phần Giới thiệu, luận án gồm phần sau: • Chương trình bày hai vấn đề: kiến thức thuật tốn tốn CluSPT • Chương trình bày đề xuất thuật tốn xác thuật toán tham lam ngẫu nhiên để giải toán CluSPT • Chương trình bày hai thuật tốn tiến hóa giải tốn CluSPT • Chương trình bày thuật tốn tiến hóa đa nhân tố giải tốn CluSPT • Chương trình bày kết thực nghiệm thuật toán CHƯƠNG 1: TỔNG QUAN 1.1 Thuật toán di truyền Thuật toán di truyền giới thiệu lần đầu vào năm 1975 John Holland [39] mơ hình thuật tốn EA xây dựng sử dụng [3, 4, 79] 1.2 Thuật toán tiến hóa đa nhân tố Ý tưởng MFEA sau: • Tạo khơng gian tìm kiếm với cách biểu diễn chung cho tất tác vụ • Áp dụng tốn tử thuật toán EA khởi tạo quần thể, lai ghép, đột biến lên khơng gian khơng gian tìm kiếm chung (Unified Search Space - USS) để biến đổi quần thể • Đánh giá cá thể khơng gian tìm kiếm chung thơng qua tiêu chí tác vụ quần thể 1.3 Bài toán phân cụm đường ngắn 1.3.1 Một số định nghĩa Cho G = (V, E, w) đồ thị vơ hướng, liên thơng, có trọng số cạnh khơng âm; V E tập đỉnh tập cạnh đồ thị; w ma trận trọng số cạnh đồ thị Cho trước tập đỉnh S ⊆ V , ký hiệu G[S] đồ thị G cảm sinh tập S Tương tự, T [S] đồ thị khung T cảm sinh tập S Định nghĩa 1.1 (Phân hoạch tập đỉnh đồ thị [51]) Cho G = (V, E, w) đồ thị vơ hướng, liên thơng, cạnh có trọng số không âm Tập C = {C1 ,C2 , ,Ch } gọi phân hoạch V C1 ∪C2 ∪ ∪Ch = V Ci ∩C j = 0, / ∀i, j ∈ [1, h], i = j Định nghĩa 1.2 (Chi phí định tuyến hai đỉnh [20]) Cho G = (V, E, w) đồ thị vô hướng, liên thông, cạnh có trọng số khơng âm Chi phí định tuyến hai đỉnh u, v ∈ V khung T (ký hiệu dT (u,v)) đồ thị G tính chi phí đường nối hai đỉnh khung T 1.3.2 Phát biểu toán Bài toán CluSPT phát biểu sau [19, 20]: Cho đơn đồ thị vô hướng G = (V, E, w), phân hoạch C = {C1 ,C2 , ,Ch } V đỉnh nguồn s ∈ V Mục tiêu tốn CluSPT tìm khung T đồ thị G cho: • Với cụm Ci (i = 1, , h), đồ thị T [Ci ] đồ thị liên thơng • Tổng chi phí định tuyến đỉnh nguồn s đỉnh lại khung T nhỏ nhất, hay nói cách khác: f (T ) = ∑ dT (s, v) → (1.1) v∈V (T ) Có hai trường hợp lời giải s toán CluSPT khơng hợp lệ: • Lời giải s khơng phải khung • Tồn đồ thị cụm lời giải s đồ thị khơng liên thơng 1.3.3 Tổng quan tình hình nghiên cứu Các toán liên quan đến tập đỉnh phân vào cụm biết đến từ năm 70 kỷ trước [5, 38, 54] Gần đây, tác giả D’Emidio cộng [19, 20] nghiên cứu dạng khác toán khung phân cụm, toán CluSPT Bài toán CluSPT xuất nhiều ứng dụng cần tối ưu thiết kế mạng, kết nối hệ thống cáp TV hệ thống cáp quang Tác giả đề xuất thuật toán xấp xỉ AAL (Approximation Algorithm) để giải tốn CluSPT Ý tưởng thuật tốn AAL tìm khung nhỏ cho đồ thị cảm sinh từ tập đỉnh cụm đồ thị nhận cách coi cụm đỉnh 1.4 Kết luận chương Chương trình bày: kiến thức thuật tốn (thuật tốn tiến hóa thuật tốn tiến hóa đa nhân tố); giới thiệu toán CluSPT - tốn thuộc lớp tốn NP-Khó; trình bày ứng dụng toán CluSPT lĩnh vực mạng truyền thông, nông nghiệp phân phối hàng hóa, dịch vụ; giới thiệu thuật tốn xấp xỉ giải toán CluSPT Chương giới thiệu số nghiên cứu liên quan tới toán CluSPT CHƯƠNG 2: THUẬT TOÁN XẤP XỈ GIẢI BÀI TOÁN CÂY PHÂN CỤM VỚI ĐƯỜNG ĐI NGẮN NHẤT Chương trình bày hai thuật toán xấp xỉ giải toán CluSPT: thuật tốn dựa chiến lược tìm kiếm tham lam ngẫu nhiên thuật tốn tìm lời giải dựa chiến lược hình 2.1 Thuật tốn xây dựng khung hình Phần trình bày thuật tốn tìm lời giải tốn CluSPT lớp đồ thị đầy đủ Luận án chứng minh rằng, đồ thị metric [51], lời giải tìm tối ưu 2.1.1 Lược đồ thuật toán Luận án đề xuất thuật toán xấp xỉ (ký hiệu SLA) giải tốn CluSPT thơng qua việc tìm khung có dạng hình (star-like) gồm hai mức (two-level) Trong khung dạng hình sao, đỉnh đóng vai trị đỉnh trung tâm, đỉnh lại nối với đỉnh thông qua cạnh nối hai đỉnh đường nối hai đỉnh Mã giả thuật tốn SLA trình bày thuật tốn 2.1 Thuật toán 2.1: Thuật toán SLA Input: Đồ thị phân cụm G = (V, E, w,C); Đỉnh nguồn s; Output: Một lời giải toán CluSPT T = (VT , ET ); 10 11 12 begin VT ← V ; ET ← 0; / Ct ← Cụm chứa đỉnh nguồn s; foreach đỉnh v ∈ Ct , v = s pv ← Đường ngắn nối s v đồ thị G[Ct ]; ET ← ET ∪ pv ; foreach cụm Ci với i = t foreach đỉnh v ∈ Ci pv,u ← Đường ngắn nối v u(u ∈ Ci ) G[Ci ]; dv,u ← Chi phí đường pv,u ; fv ← |Ci | × d(s, v) + ∑ dv,u ; u∈Ci 13 14 15 16 17 ri = argmin { f (v)|v ∈ Ci }; ET ← ET ∪ pri ,u , ∀u ∈ Ci , u = ri ; foreach cụm Ci , i = n ET ← ET ∪ e = (s, ri ); return (VT , ET ); 2.1.2 Thuật tốn dạng hình đồ thị metric Bổ đề 2.1.1 Nếu T lời giải tối ưu toán CluSPT đồ thị metric khung phận (local tree) T đồ thị dạng Bổ đề 2.1.2 Nếu khung T lời giải tối ưu toán CluSPT đồ thị metric cạnh liên cụm (inter-cluster edge) lời giải T cạnh nối gốc khung phận đỉnh nguồn s đồ thị G Từ bổ đề (2.1.1) (2.1.2) suy thuật tốn SLA tìm lời giải tối ưu toán CluSPT đồ thị metric (ký hiệu SLAM) thay khoảng cách hai đỉnh v u trọng số cạnh nối hai đỉnh v u 2.2 Thuật toán tham lam ngẫu nhiên Thuật toán đề xuất (ký hiệu HB-RGA) dựa kết hợp thuật toán tham lam ngẫu nhiên (Randomized Greedy Algorithm - RGA) thuật toán đường ngắn (Shortest Path Tree Algorithm SPTA), đó: • Thuật tốn SPTA sử dụng để tạo đường ngắn cho cụm • Thuật tốn RGA sử dụng để tìm cạnh nối cụm Lược đồ thuật tốn HB-RGA trình bày thuật toán 2.2 Trong thuật toán 2.2, phương thức Find_Shortest_Path_Tree(x) sử dụng thuật tốn Dijkstra để tìm đường ngắn với đỉnh bắt đầu đỉnh x 2.3 Kết luận chương Mặc dù thuật toán HB-RGA có nhiều ưu điểm như: ý tưởng cài đặt đơn giản, độ phức tạp tính tốn khơng cao, kết gần với kết tối ưu Tuy nhiên, thuật tốn HB-RGA có hạn chế chiến lược tìm kiếm phù hợp với tốn CluSPT, khơng thể sử dụng cho toán khác, kể tốn mà lời giải có cấu trúc (chỉ khác hàm mục tiêu) Thuật tốn SLA-M tìm lời giải tối ưu đồ thị metric Tuy nhiên, thuật tốn SLA-M có hạn chế áp dụng có hiệu lớp đồ thị metric Nghiên cứu chương công bố cơng trình [III] [VI] CHƯƠNG 3: THUẬT TỐN TIẾN HĨA GIẢI BÀI TỐN CÂY PHÂN CỤM VỚI ĐƯỜNG ĐI NGẮN NHẤT Chương trình bày đề xuất dựa thuật tốn tiến hóa để giải tốn CluSPT Thuật tốn đề xuất đảm bảo lời giải tìm ln hợp lệ xây dựng dựa ý tưởng phân rã toán CluSPT Thuật toán 3.1: Lược đồ thuật toán C-EA Input: Đồ thị phân cụm G = (V, E, w,C); Đỉnh nguồn s; Output: Lời giải toán CluSPT; 10 11 12 13 14 15 16 17 18 19 20 21 begin P0 ← Tạo ngẫu nhiên N cá thể; foreach cá thể ind j ∈ P0 Tạo cây khung phận khung tồn cục lời giải tốn CluSPT s j tương ứng với cá thể ind j ; Tính giá trị thích nghi cá thể ind j dựa chi phí lời giải s j ; t ← 0; while điều kiện dừng chưa thỏa mãn Ot ← 0; / while số_cá_thể_con_được_sinh < N Chọn ngẫu nhiên hai cá thể pa pb từ quần thể Pt ; Lai ghép, đột biến cá thể pa pb tạo hai cá thể oa ob ; Ot ← Ot ∪ {oa , ob }; foreach cá thể o j ∈ Ot Tạo cây khung phận khung toàn cục lời giải toán CluSPT s j tương ứng với cá thể o j ; Tính giá trị thích nghi cá thể o j dựa chi phí lời giải s j ; Rt ← Ot ∪ Pt ; Pt+1 ← Chọn N cá thể tốt từ Rt ; t ← t + 1; ind ∗ ← cá thể tốt từ Pt ; Tạo khung phận khung toàn cục lời giải toán CluSPT s∗ tương ứng với cá thể ind ∗ ; return s∗ ; 11 3.1.5 Toán tử đột biến Toán tử đột biến thực hai thay đổi khác cá thể: • Thay đổi đầu tạo chuỗi Cayley cách hoán đổi vị trí hai gen đoạn • Thay đổi thứ hai tác động lên đoạn M-Seg thông qua thay đổi gốc khung phận 3.2 Hướng tiếp cận dựa giảm khơng gian tìm kiếm thuật tốn tiến hóa 3.2.1 Cách tiếp cận Hướng tiếp cận dựa thuật tốn EA để tìm kiếm lời giải hợp lệ có chi phí nhỏ tốn CluSPT Thơng thường hướng tiếp cận tìm kiếm lời giải tồn khơng gian lời giải tốn CluSPT Do tốn CluSPT thuộc lớp tốn NP-Khó, nên việc tiếp cận dẫn tới hao phí tài nguyên tính tốn thời gian, đặc biệt số chiều đồ thị đầu vào lớn Vì vậy, phần giới thiệu hướng tiếp cận (gọi N-EA) dựa việc phân rã toán CluSPT thành hai toán nhỏ 3.2.2 Phương pháp phân rã toán CluSPT Bài toán CluSPT phân rã thành hai toán (sub-problem): toán thứ (ký hiệu H-Problem) tìm cạnh nối cụm; toán thứ hai (ký hiệu L-Problem) xác định khung đồ thị cụm Với cách tiếp cận này, thuật toán N-EA giải tốn H-problem trước, sau ứng với lời giải tốn H-Problem tìm lời giải toán L-Problem Mã giả thuật toán đề xuất trình bày thuật tốn 3.2 Trong thuật tốn 3.2, giá trị thích nghi cá thể tính thơng qua chi phí lời giải tốn CluSPT (dịng dịng 11 thuật 12 tốn 3.2) Thuật toán 3.2: Lược đồ thuật toán N-EA 10 11 12 13 14 15 16 17 Input: Đồ thị phân cụm G = (V, E, w,C); Đỉnh nguồn s; Output: Lời giải toán CluSPT; begin P0 ← Tạo ngẫu nhiên N cá thể toán H-Problem; foreach cá thể ind j ∈ P0 Xây dựng lời giải s j CluSPT dựa cá thể ind j ; Tính giá trị thích nghi ind j dựa chi phí s j ; t ← 0; while điều kiện dừng chưa thỏa mãn Pt ← Tournament Selection(Pt ); Ot ← Thực lai ghép đột biến(Pt ); foreach cá thể c j ∈ Ot Xây dựng lời giải s j CluSPT dựa c j ; Tính giá trị thích nghi c j từ chi phí s j ; Rt ← Ot ∪ Pt ; Pt+1 ← Chọn N cá thể tốt từ Rt ; t ← t + 1; ind ∗ ← cá thể tốt từ Pt ; Xây dựng lời giải s∗ CluSPT dựa cá thể ind ∗ ; return s∗ ; 3.2.3 Biểu diễn cá thể Mỗi nhiễm sắc thể mảng đỉnh, đó, phần tử thứ i mảng đỉnh gốc ri cụm thứ i Gốc cụm thứ i sử dụng để xây dựng cạnh nối cụm thứ i cụm khác 3.2.4 Phương pháp khởi tạo cá thể Thuật toán N-EA tạo ngẫu nhiên cá thể Ind=(ind1 , ind2 , , indh ), indi gốc cụm thứ i (i = 1, , h) 3.2.5 Toán tử lai ghép Toán tử lai ghép thuật toán N-EA xây dựng dựa toán tử lai ghép hai điểm cắt Tuy nhiên, tốn tử lai ghép tạo cá thể không hợp lệ gốc cụm không nối với 13 Khi có cá thể khơng hợp lệ, tốn tử lai ghép loại bỏ cá thể 3.2.6 Tốn tử đột biến Ý tưởng tốn tử đột biến thuật toán N-EA thay đổi gốc cụm nhiễm sắc thể 3.2.7 Cách đánh giá cá thể Chi phí lời giải T tính biến đổi sau: f (T ) = ∑ dT (s, u) (3.1) u∈V k = ∑ |Ci | ∗ dT (s, ri ) + i=1 ∑ dT (ri , u) (3.2) u∈Ci Do số chiều đồ thị cụm nhỏ số chiều đồ thị đầu vào G, nên độ phức tạp tính tốn tính chi phí lời giải tốn CluSPT cơng thức (3.2) nhỏ tính công thức (3.1) 3.3 Kết luận chương Do thuật tốn C-EA mã hóa khung mã Cayley sử dụng tốn tử tiến hóa để tạo khung cho đồ thị cụm đồ thị cạnh nối cụm nên chất lượng lời giải thuật tốn C-EA cịn hạn chế Thuật tốn C-EA có ưu điểm như: tốn tử tiến hóa có ý tưởng rõ ràng dễ cài đặt; tốn tử tiến hóa áp dụng cho tốn có cấu trúc lời giải tương tự khác Do thuật toán N-EA sử dụng thuật toán Dijkstra để tìm khung cụm nên thuật toán EA sử dụng để tối ưu cạnh nối cụm Bên cạnh đó, thuật tốn N-EA cịn biến đổi cơng thức tính hàm mục tiêu lời giải tốn CluSPT giúp giảm chi phí tính tốn cài đặt thực nghiệm Tuy nhiên, thuật toán N-EA hạn chế như: Khi đồ thị đầu vào đồ thị thưa, thuật toán tốn nhiều tài nguyên để tìm kiểm tra đồ thị tương ứng với cá thể có liên thơng hay khơng? Trong lời giải tìm thuật tốn N-EA cụm nối với cụm khác thơng qua đỉnh Các tốn tử tiến hóa sử dụng thuật tốn N-EA sử để giải toán CluSPT 14 Thuật toán trình bày chương cơng bố cơng trình [I] [IV] CHƯƠNG 4: THUẬT TỐN TIẾN HĨA ĐA NHÂN TỐ GIẢI BÀI TOÁN CÂY PHÂN CỤM VỚI ĐƯỜNG ĐI NGẮN NHẤT Thuật toán MFEA đề xuất (ký hiệu G-MFEA) gồm có hai tác vụ: tác vụ thứ xác định lời giải hợp lệ tốn CluSPT; tác vụ thứ hai tìm lời giải tốt dựa tối ưu cạnh nối cụm lời giải toán CluSPT tìm tác vụ thứ 4.1 Ý tưởng đề xuất thuật tốn G-MFEA Thuật tốn N-EA có số hạn chế như: • Do cụm nối với cụm khác thông qua đỉnh nên số trường hợp, lời giải tìm khơng tốt • Trong trường hợp tồn nhiều cạnh nối hai cụm, thuật tốn N-EA khơng tiến hành đánh giá cạnh để chọn cạnh tốt • Phương thức tạo ngẫu nhiên cá thể tốn tử lai ghép địi hỏi số lượng lớn tài ngun để tìm đồ thị liên thơng Để khắc phục hạn chế thuật toán N-EA, thuật tốn G-MFEA sử dụng mã hóa lời giải dựa biểu diễn cạnh Điểm bật cách mã hóa thuật tốn G-MFEA cụm nối với cụm khác thông qua nhiều cạnh nhiều đỉnh khác Cách mã hóa giúp cải thiện chất lượng lời giải tạo ra, đặc biệt đồ thị đầu vào đồ thị không đầy đủ 4.2 Lược đồ thuật toán G-MFEA Thuật tốn G-MFEA có đặc trưng sau: • Mỗi cá thể không gian USS lời giải tốn H-Problem • Thuật tốn G-MFEA có hai tác vụ, đầu hai tác vụ lời giải toán CluSPT Các lời giải xây dựng từ cá thể không gian USS thông qua hai thuật toán khác 4.3 Biểu diễn cá thể Một cá thể không gian USS lưu thông tin: thông tin cạnh nối cụm (lưu vào thuộc tính ES); thơng tin 15 Thuật toán 4.1: Lược đồ thuật toán G-MFEA Input: Đồ thị phân cụm G = (V, E,C); Đỉnh nguồn s; Output: Lời giải toán CluSPT; 10 11 12 13 14 15 16 17 18 19 begin t ← 0; Pt ← Tạo ngẫu nhiên N cá thể toán H-Problem; foreach cá thể ind j ∈ Pt Gán ngẫu nhiên số kỹ phù hợp τ j cho ind j ; Tạo lời giải s j toán CluSPT dựa ind j τ j ; Tính chi phí tác vụ cá thể ind j dựa chi phí lời giải s j ; Tính xếp hạng tác vụ, giá trị thích nghi vơ hướng cá thể ind j ; while điều kiện dừng chưa thỏa mãn Pt ← Tournament Selection(Pt ); Ot ← Thực lai ghép đột biến (Pt ) ; foreach cá thể c j ∈ Ot Tạo lời giải s j toán CluSPT dựa c j số kỹ phù hợp c j ; Đánh giá chi phí tác vụ c j dựa chi phí lời giải s j ; Rt ← Ot ∪ Pt ; Cập nhật xếp hạng tác vụ, giá trị thích nghi vơ hướng số kỹ phù hợp cá thể tập Rt ; Pt+1 ← Chọn N cá thể tốt tập Rt ; t ← t + 1; return Lời giải toán CluSPT tốt hai tác vụ; 16 đỉnh có cạnh nối đỉnh thuộc cụm khác (lưu vào thuộc tính IE) thông tin đỉnh gốc cụm (lưu vào thuộc tính LR) 4.4 Phương pháp khởi tạo cá thể Cá thể khởi tạo ngẫu nhiên thông qua ba bước sau: Tạo đồ thị G − Graph G’ = (V’, E’) từ đồ thị đầu vào G = (V, E) Áp dụng thuật toán tạo khung ngẫu nhiên [69] cho đồ thị G’ Với cạnh (Ci ,C j ) đồ thị G’, tìm cạnh ngẫu nhiên đồ thị G nối đỉnh thuộc cụm Ci với thuộc cụm C j 4.5 Toán tử lai ghép Các cá thể sinh kế thừa thông tin từ cá thể cha mẹ theo quy tắc sau: • Nếu cạnh cá thể xuất hai cá thể cha mẹ hai thuộc tính IE, LR cá thể chọn ngẫu nhiên từ hai cá thể cha mẹ • Nếu cạnh cá thể có cá thể cha mẹ thuộc tính IE, LR thể kế thừa từ cá thể cha mẹ 4.6 Tốn tử đột biến Cá thể thực đột biến thông qua hai bước: bước tạo khung cách thêm ngẫu nhiên cạnh vào cá thể để tạo thành chu trình, sau xóa ngẫu nhiên cạnh từ chu trình (cạnh xóa phải khác cạnh vừa thêm) để tạo thành khung Bước thứ hai cập nhập thơng tin thuộc tính IE LR cá thể 4.7 Phương pháp giải mã Phương pháp giải mã gồm bước: • Đối với tác vụ thứ nhất, lời giải toán CluSPT xây dựng cách sử dụng thuộc tính LR IE • Đối với tác vụ thứ hai, thuật tốn HB-RGA sử dụng để tìm cạnh tốt nối đỉnh hai cụm khác 4.8 Cách tác vụ thứ hai cải thiện chất lượng lời giải Do thuật toán HB-RGA sử dụng chiến lược tham lam vét cạn nên cạnh nối cụm thuật tốn HB-RGA tìm thường tốt cạnh xây dựng phương thức giải mã tác vụ thứ 17 4.9 Kết luận chương Khác với nghiên cứu trước thuật toán MFEA, thuật tốn G-MFEA có tốn đầu vào, từ tốn thuật tốn GMFEA phân rã thành hai toán để giải hai tác vụ Trong thuật tốn G-MFEA, thuật tốn HB-RGA đóng vai trị tương tự thuật tốn tìm kiếm cục bộ, giúp cải thiện chất lượng lời giải tìm tác vụ sử dụng thuật toán EA Tuy nhiên, khác với thuật tốn tìm kiếm cục bộ, q trình trao đổi vật chất di truyền hai tác vụ liên tục thực thơng qua q trình truyền lại đặc tính theo chiều dọc chế ghép đơi loại, tốn tử tiến hóa thuật tốn G-MFEA Thuật tốn G-MFEA có đặc điểm: Điểm mạnh: • Thuật tốn G-MFEA sử dụng tác vụ thứ hai đóng vai trị tương tự thuật tốn tìm kiếm cục nên chất lượng lời giải tìm gần với kết tối ưu • Thuật tốn khắc phục hạn chế thuật toán khác Hạn chế: • Mã hóa cá thể thuật tốn G-MFEA cần lưu trữ nhiều thơng tin • Do sử dụng kết hợp hai thuật toán MFEA HB-RGA nên khó để cài đặt thực nghiệm thuật tốn G-MFEA Thuật tốn trình bày chương cơng bố cơng trình [V] CHƯƠNG 5: KẾT QUẢ THỰC NGHIỆM 5.1 Dữ liệu thực nghiệm đánh giá lời giải 5.1.1 Đồ thị metric Thông tin liệu cập nhật [74] 5.1.2 Đồ thị đầy đủ phi metric Thông tin liệu đầy đủ phi metric cập nhật [74] 5.1.3 Tiêu chí đánh giá Chất lượng thuật toán đánh giá qua chất lượng lời giải thời gian tính 18 5.1.4 Mơi trường, tham số thực nghiệm Luận án tiến hành hai nhóm thực nghiệm chính: • Phân tích hiệu thuật tốn mà luận án đề xuất với thuật toán nghiên cứu trước hai phương diện chất lượng lời giải tìm thời gian thực • Phân tích ảnh hưởng số tham số: số đỉnh đồ thị đầu vào, số cụm đồ thị đầu vào, tới hiệu thuật toán đề xuất, tới kết so sánh thuật toán Với liệu, thuật tốn thực nghiệm 30 lần máy tính: CPU - Intel Core i7 (4790M), RAM - 16GB Thuật toán HBRGA: γ = 50; thuật toán EA MFEA: số lần đánh giá 5000 lần, kích thước quần thể P = 100, pc = 0.5, pm = 0.05, rmp = 0.5 5.2 Kết thực nghiệm Luận án tiến hành phân tích kết thực nghiệm theo ba hình thức: • Phân tích thống kê: luận án sử dụng phân tích thống kê để phân tích hiệu đề xuất • Phân tích chi tiết: so sánh chi tiết kết tìm thuật toán theo liệu thuộc thuật tốn khác • Phân tích nhân tố ảnh hưởng: phân tích ảnh hưởng đặc trưng liệu đầu vào tới hiệu thuật tốn 5.2.1 Đồ thị metric a) Phân tích thống kê Luận án sử dụng thống kê phi tham số (Non-parametric statistic) để phân tích kết hai bước chính: • Bước sử dụng kiểm định Friedman, Aligned Friedman, Quade để kiểm tra khác biệt kết thuật tốn có ý nghĩa thống kê hay khơng • Bước sử dụng phân tích thống kê hậu kiểm (Post-hoc statistical) để xác định chi tiết khác biệt kết thuật toán, xác định thuật toán tốt (theo chất lượng lời giải) Kết thống kê kiểm định Friedman Iman-Davenport bảng 5.3 cho thấy khác biệt kết thuật tốn có ý nghĩa thống kê với ngưỡng α = 0.05 Giá trị xếp hạng trung bình thuật tốn đánh giá theo kiểm định Friedman, Friednman Aligned 19 Quade bảng 5.4 cho thấy thuật tốn G-MFEA có thứ hạng nhỏ nên thuật toán G-MFEA chọn làm thuật toán điều khiển (control algorithm) phân tích thống kê hậu kiểm Giá trị hiệu chỉnh trị số p thu từ kiểm định Friedman Quade bảng 5.6 cho thấy G-MFEA tốt ba thuật toán AAL, C-EA N-EA ngưỡng xem xét α = 0.05 b) So sánh kết tập liệu Dữ liệu bảng 5.7 cho thấy thuật tốn G-MFEA có nhiều số lần tìm lời giải tối ưu (29 lần) số lần tìm lời giải tốt (95 lần); thuật tốn HB-RGA có số lần tìm lời giải tốt lớn thứ với 47 lần, tiếp sau đến thuật tốn N-EA với lần tìm lời giải tốt nhất; hai thuật tốn AAL C-EA khơng lần có lời giải tốt tìm lời giải tối ưu Kết bảng 5.19 – bảng 5.21 cho thấy lời giải tìm thuật tốn thuật toán AAL, tiếp đến thuật toán C-EA N-EA Tương tự, xếp hạng trung bình thuật toán N-EA đáng kể so với hai thuật tốn G-MFEA HB-RGA Giá trị trung bình RPD tập liệu thuật tốn trình bày bảng 5.8 cho thấy thuật tốn AAL tìm lời giải có chất lượng năm thuật toán so sánh Đối với giải thuật đề xuất, lời giải nhận từ thuật toán C-EA thường so với ba thuật toán HB-RGA, N-EA G-MFEA Giá trị RPD ba thuật toán HB-RGA, N-EA G-MFEA không chênh lệch nhiều hai thuật toán AAL C-EA Chất lượng lời giải tìm thuật tốn xếp theo thứ tự giảm dần là: G-MFEA → HB-RGA → N-EA → C-EA → AAL c) Các yếu tố ảnh hưởng tới hiệu thuật tốn Hình 5.3 ta thấy với liệu có nhiều 25 cụm thuật tốn HB-RGA tìm lời giải tốt thuật tốn G-MFEA Hình 5.4 cho thấy thuật tốn G-MFEA có hiệu cao liệu có số cụm bé Hình 5.5(a) 5.5(b) cho thấy, với liệu có số đỉnh nhỏ 99 (đối với Type 1), 300 (đối với Type 5) thuật tốn G-MFEA tìm kết tốt thuật tốn HB-RGA 20 Các phân tích cho thấy thuật tốn N-EA HB-RGA khơng hiệu thuật tốn G-MFEA số cụm số đỉnh đồ thị đầu vào nhỏ Nguyên nhân dẫn tới kết thuật toán G-MFEA sử dụng đồng thời hai tác vụ để tìm lời giải cho liệu nên có trao đổi thơng tin hỗ trợ lẫn tác vụ trình tìm lời giải Bên cạnh đó, thuật tốn G-MFEA kết hợp mạnh trình khai phá (exploration) khơng gian tìm kiếm lời giải thuật tốn EA khai thác (exploitation) khơng gian lời giải có thuật tốn HB-RGA Với hệ, tác vụ có thuật tốn EA giúp tạo quần thể đa dạng, sau lựa chọn cá thể tốt để tạo thành quần thể cho hệ sau Trong khi, tác vụ có thuật tốn HB-RGA đóng vai trị bước tìm kiếm cục Thuật tốn HB-RGA lựa chọn cá thể từ khơng gian USS quần thể xét để cải thiện chất lượng lời giải d) So sánh thời gian thực Thuật tốn N-EA có thời gian tính tốn thấp thuật tốn cịn lại, thuật tốn G-MFEA có thời gian tính tốn lớn Thuật tốn N-EA có thời gian thực thấp cá thể thuật tốn mã hóa số cụm đồ thị đầu vào nên tốn tử tiến hóa thực nhiễm sắc thể có chiều dài số lượng cụm Thời gian tính tốn thuật tốn G-MFEA lớn tốn tử tiến hóa cần thời gian để xác định thông tin cụm, cạnh nối cụm thông tin đỉnh gốc cục Bên cạnh đó, thuật tốn G-MFEA xây dựng đồ thị đầu vào cho thuật toán HB-RGA, sau áp dụng thuật tốn HB-RGA để tìm lời giải tốn CluSPT phí tính tốn tăng thêm Thời gian tính tốn ba thuật toán N-EA, HB-RGA C-EA khác không nhiều 5.2.2 Đồ thị đầy đủ phi metric Do thuật tốn SLA-M khơng áp dụng với đồ thị phi metric nên phần này, luận án đánh giá năm thuật toán AAL, C-EA, N-EA, HB-RGA G-MFEA a) Phân tích thống kê Các giá trị Friedman Iman-Davenport bảng 5.10 cho thấy khác biệt kết thuật toán tập liệu đầy đủ phi 21 metric có ý nghĩa thống kê với ngưỡng α = 0.05 Trong bảng 5.11, thuật toán G-MFEA có thứ hạng nhỏ nên thuật tốn G-MFEA có hiệu tốt Ước lượng kết so sánh đối kháng thuật toán bảng 5.12 cho thấy thuật tốn G-MFEA có hiệu tốt Thuật toán AAL hiệu Thuật toán HB-RGA tốt hai thuật toán N-EA C-EA; thuật toán N-EA cho kết tốt thuật toán C-EA b) So sánh kết tập liệu Khác với kết liệu metric, hiệu thuật tốn có khác biệt rõ ràng liệu đầy đủ phi metric Kết bảng 5.14 cho thấy: • Thuật tốn AAL thuật toán khác tất liệu thực nghiệm • Thuật tốn C-EA ba thuật toán N-EA, HB-RGA GMFEA tất liệu • Số liệu mà thuật toán N-EA thuật toán HB-RGA thuật toán G-MFEA 20/23 18/23 (Type 1), 18/18 (Type 5), 30/34 28/34 (Type 6) • Số liệu mà thuật toán HB-RGA thuật toán GMFEA 17/23 (Type 1), 15/18 (Type 5) 22/34 (Type 6) Thứ tự chất lượng lời giải tìm thuật toán là: G-MFEA → HB-RGA → N-EA → C-EA → AAL c) Các yếu tố ảnh hưởng tới hiệu thuật toán Biểu đồ phân tán theo số cụm đồ thị hình 5.7(a) cho thấy số cụm nhỏ 10 thuật tốn G-MFEA tốt hai thuật toán HB-RGA N-EA; giá trị nhỏ số cụm để thuật toán G-MFEA hai thuật toán N-EA HB-RGA 10 Trong hình 5.7(b) cho thấy tập liệu Type 5, khơng có trường hợp thuật tốn G-MFEA có kết thuật tốn N-EA Hình 5.7(c) số cụm nhỏ thuật toán G-MFEA tốt hai thuật toán HB-RGA N-EA; thuật tốn HB-RGA (N-EA) có kết tốt thuật toán G-MFEA số cụm lớn (20) 22 5.3 Kết luận chương Các phân tích tiến hành dựa kết thực nghiệm thuật toán thu từ 215 liệu thuộc hai dạng đồ thị: metric đầy đủ phi metric Các phân tích kết thực nghiệm thuật tốn GMFEA tìm lời giải tốt nhất, thuật tốn C-EA tìm lời giải Lời giải tìm thuật tốn HB-RGA N-EA có chất lượng gần nhau, nhiên thuật tốn HB-RGA có xu hướng tốt thuật toán N-EA Luận án ảnh hưởng số cụm, số đỉnh đồ thị đầu vào tới kết thuật toán Từ phần dự đốn kết nhận thuật tốn theo hai thuộc tính đồ thị đầu vào KẾT LUẬN Các đóng góp Đối với tốn NP-khó tốn CluSPT, có ba hướng tiếp cận để phát triển thuật toán giải: 1) hướng tiếp cận đúng, 2) hướng tiếp cận heuristic, 3) hướng tiếp cận meta-heuristic Đóng góp luận án đề xuất thuật toán giải toán CluSPT theo ba hướng tiếp cận: • Đối với hướng tiếp cận đúng, luận án đề xuất thuật toán dựa phương pháp duyệt đồ thị theo chiều rộng xây dựng đồ thị có dạng hình Kết thực nghiệm cho thấy, thuật toán đề xuất giải toán CluSPT nhanh với đồ thị khoảng 500 đỉnh 50 cụm • Đối với cách tiếp cận heuristic, thuật toán HB-RGA dựa thuật toán tham lam ngẫu nhiên đề xuất để giải tốn CluSPT Thuật tốn HB-RGA có ưu điểm thời gian thực nhanh, không phụ thuộc nhiều vào số lượng cụm đồ thị đầu vào chất lượng lời giải tìm có tính “ổn định” cao • Đối với hướng tiếp cận meta-heuristic, luận án đề xuất ba thuật toán dựa thuật toán tiến hóa (thuật tốn C-EA thuật tốn N-EA) tiến hóa đa nhân tố (thuật tốn G-MFEA) – Thuật tốn C-EA sử dụng mã hóa Cayley để mã hóa lời giải nên có ưu điểm thời gian thực hiện, cài đặt đơn giản 23 sử dụng tốn tử tiến hóa có nên khơng cần xây dựng thêm tốn tử tiến hóa đặc trưng tốn CluSPT Hơn nữa, sử dụng tốn tử tiến hóa khơng phải thiết kế riêng cho tốn CluSPT nên thuật tốn áp dụng để giải toán khung phân cụm (clustered spanning tree) – Thuật toán N-EA dựa kết hợp thuật toán EA thuật tốn Dijkstra Do sử dụng thuật tốn Dijkstra để tìm khung nhỏ cụm sử dụng thuật tốn EA để tối ưu hóa cạnh nối cụm nên lời giải tìm thuật tốn N-EA cải thiện nhiều so với thuật toán C-EA – Thuật toán G-MFEA dựa kết hợp thuật tốn MFEA thuật tốn HB-RGA Điểm đóng góp thuật tốn G-MFEA so với nghiên cứu có đề xuất chế giúp phân rã toán đầu vào thành hai toán riêng biệt cho hai tác vụ thực Do tác vụ giúp khai phá khơng gian lời mới, cịn tác vụ giúp khai thác khơng gian lời giải có nên lời giải tìm thuật tốn G-MFEA tiệm cận với lời giải tối ưu Kết thực nghiệm nhiều liệu cho thấy đề xuất luận án cho chất lượng lời giải tốt thuật tốn cơng bố trước Hạn chế: Thuật tốn G-MFEA có độ phức tạp nhớ sử dụng cao Hướng phát triển Trong nghiên cứu tiếp theo, luận án tiếp tục mở rộng nghiên cứu vấn đề: • Đề xuất tốn tử tiến hóa để áp dụng thuật tốn MFEA-II giải tốn CluSPT • Nghiên cứu tốn CluSPT với trọng số cạnh đồ thị đầu vào thay đổi theo thời gian 24 DANH MỤC CÔNG TRÌNH CƠNG BỐ I Dinh, Thanh Pham, Binh Huynh Thi Thanh, Trung Tran Ba, and Long Nguyen Binh “Multifactorial evolutionary algorithm for solving clustered tree problems: competition among Cayley codes.” Memetic Computing 12, no (2020): pp 185-217 (Q1, IF: 3.860) II P D Thanh, D A Dung, T N Tien and H T T Binh, “An Effective Representation Scheme in Multifactorial Evolutionary Algorithm for Solving Cluster Shortest-Path Tree Problem,” 2018 IEEE Congress on Evolutionary Computation (CEC), Rio de Janeiro, 2018, pp 1-8 III P D Thanh, H Thi Thanh Binh, D D Dac, N Binh Long and L M Hai Phong, “A Heuristic Based on Randomized Greedy Algorithms for the Clustered Shortest-Path Tree Problem,” 2019 IEEE Congress on Evolutionary Computation (CEC), Wellington, New Zealand, 2019, pp 2915-2922 IV Huynh Thi Thanh Binh, Pham Dinh Thanh, and Ta Bao Thang “New approach to solving the clustered shortest-path tree problem based on reducing the search space of evolutionary algorithm” Knowledge-Based Systems, 180:12–25, 2019 (Q1, IF: 5.921) V Thanh, P.D., Binh, H.T.T and Trung, T.B “An efficient strategy for using multifactorial optimization to solve the clustered shortest path tree problem.” Applied Intelligence 50, 1233–1258 (2020) (Q2, IF: 3.325) VI Hanh, Phan Thi Hong, Pham Dinh Thanh, and Huynh Thi Thanh Binh “Evolutionary algorithm and multifactorial evolutionary algorithm on clustered shortest-path tree problem.” Information Sciences 553 (2021): 280-304 (Q1, IF: 5.91) VII Huynh, Thi Thanh Binh, Dinh Thanh Pham, Ba Trung Tran, Cong Thanh Le, Minh Hai Phong Le, Ananthram Swami, and Thu Lam Bui “A multifactorial optimization paradigm for linkage tree genetic algorithm.” Information Sciences 540 (2020): 325-344 (Q1, IF: 5.91) 25 ... thiệu số nghiên cứu liên quan tới tốn CluSPT CHƯƠNG 2: THUẬT TỐN XẤP XỈ GIẢI BÀI TOÁN CÂY PHÂN CỤM VỚI ĐƯỜNG ĐI NGẮN NHẤT Chương trình bày hai thuật tốn xấp xỉ giải toán CluSPT: thuật toán dựa... dụng thuật tốn tiến hóa hai tốn kết hợp áp dụng thuật tốn tiến hóa giải toán thứ áp dụng thuật toán giải toán thứ hai 3.1 Thuật tốn tiến hóa dựa mã Cayley Phần trình bày áp dụng thuật tốn tiến hóa. .. dựa thuật tốn tiến hóa để giải toán CluSPT Thuật toán đề xuất đảm bảo lời giải tìm ln hợp lệ xây dựng dựa ý tưởng phân rã toán CluSPT Thuật toán 2.2: Thuật toán HB-RGA Input: Đồ thị phân cụm