Thực nghiệm so sỏnh thuật toỏn ACO-MGA với thuật toỏn Greedy và

Một phần của tài liệu (LUẬN án TIẾN sĩ) một số thuật toán dóng hàng các mạng protein luận án TS máy tính 94801 (Trang 72 - 83)

2.2.4 .Thủ tục tỡm kiếm cục bộ

2.5. Cỏc kết quả thực nghiệm

2.5.2. Thực nghiệm so sỏnh thuật toỏn ACO-MGA với thuật toỏn Greedy và

và GAVEO

Thực nghiệm nhằm so sỏnh ACO-MGA với hai thuật toỏn Greedy và thuật toỏn tiến húa GAVEO về chất lượng lời giải và thời gian chạy. Cỏc thực nghiệm bao gồm:

1) Chạy cỏc thuật toỏn trờn cựng một bộ dữ liệu với số vũng lặp định trước để so sỏnh về chất lượng dúng hàng và thời gian chạy.

2) Chạy cỏc thuật toỏn trờn cựng một bộ dữ liệu với cựng một thời gian định trước để so sỏnh về chất lượng dúng hàng.

Cỏc thớ nghiệm của chỳng tụi được thực hiện trờn mỏy tớnh cú cấu hỡnh: CPU Dual Core 2.2Ghz, RAM DDR3 3GB trờn hệ điều hành Windows XP SP3.

Đối với thuật toỏn ACO-MGA, sau khi tiến hành thực nghiệm với cỏc giỏ trị khỏc nhau của từng tham số, chỳng tụi thấy rằng với cỏc giỏ trị của cỏc tham số như dưới đõy sẽ cho kết quả lời giải tốt nhất, vỡ vậy trong cỏc thực nghiệm cỏc tham số của thuật toỏn được thiết lập như sau:

 Số kiến trong mỗi lần lặp là 20 ;

 =0.06, 𝛼 = 𝛽 = 1;

 max = 1.0 và min = max/(n2.Vmax2), trong đú n là số đồ thị, Vmax là số đỉnh

của đồ thị cú nhiều đỉnh nhất.

Trong thời gian đầu tiến hành nghiờn cứu bài toỏn MGA, do chưa cú dữ liệu thực, chỳng tụi sinh ngẫu nhiờn cỏc tập dữ liệu thực nghiệm là cỏc tập đồ thị với cỏc đồ thị cú 20 và 50 đỉnh, số đồ thị lần lượt là 4,8,16 và 32.

2.5.2.1. So sỏnh về hiệu quả và thời gian chạy

Bảng 2.1 và bảng 2.2 dưới đõy là kết quả so sỏnh cỏc thuật toỏn ACO-MGA, GAVEO và Greedy về điểm chất lượng dúng hàng và thời gian chạy của cỏc thuật toỏn. Bảng 2.1 là kết quả dúng hàng ứng với cỏc đồ thị cú trung bỡnh là 20 đỉnh và bảng 2.2 là kết quả ứng với cỏc đồ thị cú trung bỡnh là 50 đỉnh. Cỏc kết quả tốt hơn được thể hiện bằng chữ in đậm, thời gian chạy ngắn hơn được thể hiện bằng chữ in nghiờng, đậm.

Bảng 2.1. So sỏnh chất lượng dúng hàng S(A) và thời gian chạy với cỏc bộ dữ liệu gồm 4, 8, 16 và 32 đồ thị, số đỉnh trung bỡnh của mỗi đồ thị là 20 đỉnh.

Thuật toỏn/Số đồ thị 4 8 16 32 Greedy Điểm -40 -35 -570 -1055 Thời gian (s) 0.6 2.3 6 17 GAVEO Điểm -20 65 45 1132 Thời gian (s) 249 501 1087.7 2484.1 ACO-MGA Điểm 124 696 1480 7289 Thời gian (s) 33.6 231.5 481.2 1266

Bảng 2.2. So sỏnh chất lượng dúng hàng S(A) và thời gian chạy với cỏc bộ dữ liệu gồm 4, 8, 16 và 32 đồ thị, số đỉnh trung bỡnh của mỗi đồ thị là 50 đỉnh

Thuật toỏn/Số đồ thị 4 8 16 32 Greedy Điểm -1144 -4704 -31004 -155508 Thời gian (s) 4.8 11.3 49 210.8 GAVEO Điểm -101 -75 -10872 -33698 Thời gian (s) 1164 2739.1 6921.3 16340.8 ACO-MGA Điểm 685 3338 1273 -18643 Thời gian (s) 763.4 6523.5 12670.5 28859.8 Kết quả thực nghiệm cho thấy rằng:

 Trong cả 2 trường hợp cỏc đồ thị gồm 20 đỉnh và đồ thị 50 đỉnh thỡ thuật toỏn Greedy đều cho thời gian chạy rất nhanh so với 2 thuật toỏn cũn lại. Tuy nhiờn kết quả về điểm dúng hàng của thuật toỏn này lại rất thấp so với GAVEO và ACO-MGA.

 Thuật toỏn ACO-MGA cho chất lượng dúng hàng tốt hơn thuật toỏn GAVEO. Với cỏc đồ thị 20 đỉnh, thời gian chạy của ACO-MGA nhanh hơn so với GAVEO nhưng khi số đỉnh trong đồ thị tăng lờn thỡ thời gian chạy của GAVEO nhanh hơn khi số đồ thị vượt quỏ 4. Tuy nhiờn, thực nghiệm ở mục sau cho thấy cựng thời gian chạy thỡ ACO-MGA vẫn cho kết quả tốt hơn nhiều.

 Trong một số trường hợp, điểm chất lượng dúng hàng của cỏc thuật toỏn là số õm. Điều này cú thể giải thớch là do khi tớnh điểm dúng hàng theo cỏc cụng thức 2.1, 2.2 và 2.3. Điểm dúng hàng phụ thuộc vào cỏc tham số nsm = 1.0; nsmm = -5.0; ns = -2.5; esm = 0.2; esmm =-0.1, ε =0.2. Trong đú nsmm = -5.0; ns = -2.5 là điểm phạt khi 2 đỉnh dúng hàng cú nhón khỏc nhau hoặc dúng hàng một đỉnh thực với 1 đỉnh giả (ký hiệu ). Tham số esmm =-0.1 là điểm phạt khi cỏc cạnh được dúng hàng khụng tương thớch về trọng số. Khi dúng hàng cựng lỳc nhiều đồ thị với số lượng cỏc đỉnh khỏc nhau nhiều sẽ dẫn tới hàm đỏnh giỏ cú kết quả õm.

2.5.2.2. So sỏnh ACO-MGA với GAVEO với cựng thời gian chạy

Vỡ thuật toỏn Greedy cú thời gian chạy ngắn nhưng lại cú điểm thấp nờn luận ỏn chỉ tiến hành cỏc thớ nghiệm để so sỏnh hiệu quả của thuật toỏn GAVEO và thuật toỏn ACO-MGA với cựng thời gian chạy.

Thực nghiệm thứ nhất cỏc thuật toỏn được chạy trờn cựng một bộ dữ liệu và cựng thời gian chạy. Cỏc bộ dữ liệu thực nghiệm gồm cú 8, 16 và 32 đồ thị.

mà cỏc đồ thị cú trung bỡnh là 20 đỉnh và thời gian chạy là 50s, 150s và 200s. Kết quả thớ nghiệm được thể hiện ở bảng 2.3, bảng 2.4 và bảng 2.5.

Bảng 2.3. So sỏnh điểm chất lượng dúng hàng S(A) với cỏc bộ dữ liệu là 8,16 và 32 đồ thị, với số đỉnh trung bỡnh của mỗi đồ thị là 20 đỉnh và thời gian

chạy là 50s.

Thuật toỏn/Số đồ thị 8 16 32

GAVEO 57 46 -1327

ACO-MGA 690 2004 6511

Bảng 2.4. So sỏnh điểm chất lượng dúng hàng S(A) với cỏc bộ dữ liệu là 8,16

và 32 đồ thị, với số đỉnh trung bỡnh của mỗi đồ thị là 20 đỉnh và thời gian chạy là 150s

Thuật toỏn/Số đồ thị 8 16 32

GAVEO 75 35 953

ACO-MGA 690 2181 7166

Bảng 2.5. So sỏnh điểm chất lượng dúng hàng S(A)với cỏc bộ dữ liệu là 8,16 và 32 đồ thị, với số đỉnh trung bỡnh của mỗi đồ thị là 20 đỉnh và thời gian

chạy là 200s

Thuật toỏn/Số đồ thị 8 16 32

GAVEO 74 -38 1254

ACO-MGA 690 2262 10060

Thực nghiệm thứ 2, luận ỏn tiến hành chạy cỏc thuật toỏn ACO-MGA và GAVEO trờn cỏc bộ dữ liệu gồm cú lần lượt là 4, 8, 16 và 32 đồ thị, cỏc đồ thị cú trung bỡnh là 50 đỉnh và thời gian chạy lần lượt là 200s, 300s và 600s. Kết

quả của thực nghiệm này được thể hiện trong bảng 2.6, 2.7 và bảng 2.8. Cỏc kết quả tốt hơn thể hiện bằng chữ in đậm.

Bảng 2.6. So sỏnh điểm chất lượng dúng hàng S(A) với cỏc bộ dữ liệu là 4, 8,16 và 32 đồ thị, với số đỉnh trung bỡnh của mỗi đồ thị là 50 đỉnh và thời

gian chạy là 200s

Thuật toỏn/Số đồ thị 4 8 16 32

GAVEO -107 -98 -16341 -150400

ACO-MGA 674 2699 -99 -30583

Bảng 2.7. So sỏnh điểm chất lượng dúng hàng S(A) với cỏc bộ dữ liệu là 4, 8,16 và 32 đồ thị, với số đỉnh trung bỡnh của mỗi đồ thị là 50 đỉnh và thời

gian chạy là 300s

Thuật toỏn/Số đồ thị 4 8 16 32

GAVEO -103 57 -6977 -124198

ACO-MGA 737 2744 637 -25648

Bảng 2.8. So sỏnh điểm chất lượng dúng hàng S(A) với cỏc bộ dữ liệu là 4, 8,16 và 32 đồ thị, với số đỉnh trung bỡnh của mỗi đồ thị là 50 đỉnh và thời

gian chạy là 600s

Thuật toỏn/Số đồ thị 4 8 16 32

GAVEO -107 -77 -5282 -96123

ACO-MGA 673 2898 744 -16945

Cỏc kết quả thực nghiệm được trỡnh bày ở cỏc bảng trờn cho thấy khi so sỏnh 2 thuật toỏn ACO-MGA và GAVEO với cựng một bộ dữ liệu, trờn cựng

một cấu hỡnh mỏy và cựng thời gian chạy thỡ thuật toỏn ACO-MGA cũng cho kết quả tốt hơn nhiều so với thuật toỏn GAVEO

2.5.3. Thực nghiệm so sỏnh cỏc thuật toỏn ACOTS-MGA, ACO-MGA2, GAVEO và Greedy

Vỡ ACO-MGA2 được cải tiến từ ACO-MGA, với nhiều cải tiến đó được phõn tớch trong phần đầu của mục 2.3 đảm bảo thuật toỏn cho chất lượng lời giải tốt hơn so với ACO-MGA, nờn cỏc thực nghiệm ở đõy chỉ so sỏnh cỏc thuật toỏn ACOTS-MGA, ACO-MGA2 với hai thuật toỏn Greedy và thuật toỏn tiến húa GAVEO về chất lượng lời giải và thời gian chạy.

Thực nghiệm thực hiện như sau:

1) Chạy cỏc thuật toỏn trờn cựng một bộ dữ liệu với số vũng lặp định trước để so sỏnh về chất lượng dúng hàng và thời gian chạy.

2) Chạy cỏc thuật toỏn trờn cựng một bộ dữ liệu với cựng một thời gian định trước để so sỏnh về chất lượng dúng hàng. Thời gian chạy được thay đổi tăng dần để đỏnh giỏ tớnh hội tụ

Cỏc thuật toỏn đều được chạy lại trờn mỏy tớnh cú cấu hỡnh: CPU Dual Core 3 Ghz, RAM DDR2 4GB trờn hệ điều hành Windows 7.

Thuật toỏn GAVEO sử dụng cỏc tham số được lựa chọn như trong bài bỏo [Fober et al., 2009]. Đối với 2 thuật toỏn ACO-MGA2 và ACOTS-MGA, sau khi tiến hành thực nghiệm với cỏc giỏ trị khỏc nhau của cỏc tham số. Cỏc bộ tham số mà cỏc thuật toỏn cho chất lượng lời giải tốt nhất được lựa chọn. Cỏc tham số cụ thể như sau:

Thuật toỏn ACO-MGA2

 Số kiến trong mỗi lần lặp là 30 ;

 max = 1.0 và min = max/(n2.Vmax2), trong đú n là số đồ thị, Vmax là số

nỳt của đồ thị cú nhiều nỳt nhất.

 Thủ tục tỡm kiếm cục bộ được gọi trong 30% số vũng lặp cuối cựng.

Thuật toỏn ACOTS-MGA

 Số kiến trong mỗi lần lặp là 30 ;

 1=0.3, 2=0.7, 𝛼 = 𝛽 = 1;

 max = 1.0, min = max/(n2.Vmax2) và mid=0.8;

 Thủ tục tỡm kiếm cục bộ được gọi trong 20% số vũng lặp cuối cựng.

2.5.3.1. So sỏnh về chất lượng lời giải và thời gian chạy

Trong thực nghiệm này, chỳng tụi chạy cỏc thuật toỏn trờn cựng bộ dữ liệu đó được giới thiệu ở mục 2.5.1 với số vũng lặp định trước. Để so sỏnh chất lượng lời giải và thời gian chạy của cỏc thuật toỏn, chỳng tụi chạy mỗi thuật toỏn trờn cỏc mỏy tớnh cú cựng cấu hỡnh, mỗi thuật toỏn chạy 20 lần và lấy giỏ trị trung bỡnh của 20 lần chạy để so sỏnh.

Chất lượng lời giải và thời gian chạy của cỏc thuật toỏn được thể hiện lần lượt trong cỏc bảng 2.9 và 2.10.

Bảng 2.9. So sỏnh chất lượng lời giải của cỏc thuật toỏn với cỏc tập dữ liệu

gồm 4, 8, 16 và 32 đồ thị Thuật toỏn/Số đồ thị 4 8 16 32 Greedy -4098 -11827 -56861 -267004 GAVEO -1224 -2729 -10604 -63205 ACO-MGA2 -972 -2277 -7857 -53960 ACOTS-MGA -963 -1089 -5671 -42216

Bảng 2.10. So sỏnh thời gian chạy (tớnh theo giõy) của cỏc thuật toỏn với cỏc tập dữ liệu gồm 4, 8, 16 và 32 đồ thị Thuật toỏn/Số đồ thị 4 8 16 32 GAVEO 1892 2851 10067 20671 ACO-MGA2 272 1374 4151 18005 ACOTS-MGA 171 809 6839 53800

Nhận xột: Cỏc kết quả thực nghiệm trong bảng 2.9 cho thấy thuật toỏn

ACOTS-MGA cho chất lượng lời giải tốt hơn Greedy, GAVEO và ACO-MGA2 đối với cả 4 tập dữ liệu. Khi số lượng đồ thị tăng thỡ chất lượng lời giải của ACOTS-MGA cao hơn so với cỏc thuật toỏn Greedy, GAVEO và ACO-MGA2 càng thể hiện rừ rệt hơn.

Kết quả so sỏnh ở bảng 2.10 cho thấy thời gian chạy của thuật toỏn ACOTS-MGA thấp hơn so với thuật toỏn GAVEO và ACO-MGA2 khi số lượng đồ thị gồm 4 đến 8 đồ thị. Trong trường hợp số đồ thị lớn gồm 16 hoặc 32 đồ thị thỡ cỏc thuật toỏn GAVEO và ACO-MGA2 cú thời gian chạy nhanh hơn.

Lý do ACOTS-MGA chạy lõu hơn ACO-MGA2 khi số đồ thị lớn là do trong thuật toỏn ACOTS-MGA thủ tục tỡm kiếm Tabu được thực hiện lặp nhiều lần, trong khi trong thuật toỏn ACO-MGA2 thủ tục tỡm kiếm cục bộ chỉ thực hiện 1 lần, trong khi đú cỏc thủ tục này cú thời gian thực hiện rất lớn. Trong trường hợp số lượng đồ thị nhỏ, thuật toỏn ACOTS-MGA chạy nhanh hơn là do số lượng trạng thỏi tỡm kiếm nhỏ, vỡ vậy thuật toỏn đạt đến lời giải tốt nhanh hơn do thuật toỏn tỡm kiếm Tabu được thực hiện với số lần lặp ớt hơn.

2.5.3.2. So sỏnh cỏc thuật toỏn khi chạy với cựng khoảng thời gian ấn định trước

Vỡ thuật toỏn Greedy cú thời gian chạy rất nhanh nhưng lại cho chất lượng lời giải quỏ thấp, nờn trong thực nghiệm này chỉ so sỏnh chất lượng lời giải của thuật toỏn GAVEO, ACO-MGA2 và ACOTS-MGA khi chạy trong cựng một khoảng thời gian.

Thực nghiệm tiến hành chạy cỏc thuật toỏn trờn cựng bộ dữ liệu gồm 16 đồ thị, thời gian chạy cỏc thuật toỏn được tăng dần từ 1000s đến 6000s. Cỏc kết quả được thể hiện qua biểu đồ ở hỡnh 2.6.

Hỡnh 2.6. So sỏnh chất lượng lời giải cỏc thuật toỏn với bộ dữ liệu gồm 16 đồ thị và thời gian tăng từ 1000s đến 6000s.

Biểu đồ ở hỡnh 2.6 cho thấy khi tăng thời gian chạy từ 1000s đến 6000s chất lượng lời giải của thuật toỏn ACOTS-MGA luụn luụn tốt hơn thuật toỏn ACO-MGA2 và GAVEO.

Biểu đồ trờn cho ta thấy giai đoạn đầu trước 2000s thỡ cả 2 thuật toỏn ACO-MGA2 và thuật toỏn ACOTS-MGA đều cho chất lượng lời giải chưa cao là vỡ giai đoạn này chỉ ỏp dụng thuật toỏn ACO thuần tỳy mà chưa cú kết hợp

-35000 -30000 -25000 -20000 -15000 -10000 -5000 0 1000s 2000s 3000s 4000s 5000s 6000s Điểm chất lư ợng dúng hàng Thời gian GAVEO ACO-MGA2 ACOTS-MGA

sử dụng tỡm kiếm cục bộ. Tuy nhiờn ACOTS-MGA cho chất lượng lời giải tốt hơn ACO-MGA2 là do sự cải tiến của thủ tục bước ngẫu nhiờn của ACOTS-MGA theo chiến thuật beam search, cỏc kiến ưu tiờn lựa chọn cỏc đỉnh cựng nhón với cỏc đỉnh đó được dúng hàng trước đú trờn cựng vộctơ dúng hàng. Vỡ vậy sẽ làm tăng độ tương đồng về nhón của cỏc đỉnh.

Sau thời điểm 2000s, chất lượng lời giải của cỏc thuật toỏn tăng nhanh hơn là vỡ khi đú đó cú ỏp dụng kỹ thuật tỡm kiếm cục bộ và tỡm kiếm bằng Tabu Search. Thuật toỏn ACOTS-MGA2 cho chất lượng lời giải tốt hơn ACO-MGA2 vỡ thuật toỏn tỡm kiếm Tabu được gọi lặp lại nhiều lần trờn cỏc lời giải tốt nhất tỡm được, cũn trong thuật toỏn ACO-MGA2, thủ tục tỡm kiếm cục bộ chỉ được gọi 1 lần sau mỗi vũng lặp.

Sau thời điểm 6000s thỡ chất lượng lời giải cỏc thuật toỏn ổn định nờn luận ỏn chỉ tiến hành so sỏnh đến thời điểm này.

Ngoài ra, để kiểm tra chất lượng lời giải của cỏc thuật toỏn ACOTS- MGA với ACO-MGA2 và GAVEO trong cựng thời gian. Chỳng tụi lần lượt chạy thuật toỏn cỏc thuật toỏn GAVEO và ACO-MGA2 trờn cựng bộ dữ liệu với thời gian tương đương với thời gian chạy của thuật toỏn ACOTS-MGA được cho trong bảng 2.10. Kết quả thu được như sau:

Bảng 2.11. So sỏnh điểm chất lượng dúng hàng S(A) của 3 thuật toỏn với cựng thời gian chạy với cỏc tập gồm 4,8,16 và 32 đồ thị.

Thuật toỏn/Số đồ thị 4 8 16 32

GAVEO -1224 -2879 -10744 -63205

ACO-MGA2 -989 -1524 -7757 -53960

Qua bảng 2.11 cú thể thấy khi chạy trong cựng một thời gian bằng với thời gian chạy của thuật toỏn ACOTS-MGA được cho trong bảng 2.10, với cả 4 tập dữ liệu thỡ thuật toỏn ACOTS-MGA đều cho kết quả tốt hơn so với GAVEO và ACO-MGA2.

2.6. Kết luận chương

Bài toỏn MGA là cỏch tiếp cận mới để phõn tớch cấu trỳc của sinh học phõn tử. Trong chương này, chỳng tụi trỡnh bày cỏc khỏi niệm liờn quan đến bài toỏn dúng hàng tập gồm nhiều đồ thị và đề xuất 3 thuật toỏn là ACO-MGA, ACO-MGA2 và ACOTS-MGA để giải quyết bài toỏn dúng hàng nhiều đồ thị. Kết quả thực nghiệm trờn cỏc bộ dữ liệu mụ phỏng và dữ liệu thực cho

Một phần của tài liệu (LUẬN án TIẾN sĩ) một số thuật toán dóng hàng các mạng protein luận án TS máy tính 94801 (Trang 72 - 83)

Tải bản đầy đủ (PDF)

(132 trang)