Dữ liệu thực nghiệm dựa trên các đồ thị dữ liệu đã có sẵn và xây dựng ngẫu nhiên. Các đồ thị dữ liệu có sẵn có thể tải về từ trang web:
http://www.dis.uniroma1.it/challenge9/download.shtml
Dữ liệu bao gồm 3 dạng đồ thị Distance graph, Travel time graph, Coordinates (trong đó Coordinates là dạng đồ thị tọa độ). Để thống nhất với các đồ thị sinh ngẫu nhiên, chúng ta lựa chọn dạng đồ thị Distance graph. Một số đồ thị trong dữ liệu thực nghiệm có sẵn có một số cạnh trùng nhau nên số cạnh khi đƣa vào chƣơng trình sẽ ít hơn số cạnh đƣợc khai báo. Đối với các đồ thị xây dựng ngẫu nhiên: Xây dựng ngẫu nhiên một đơn đồ thị liên thông với đỉnh và
79 1. Tạo một đồ thị
với đỉnh đơn và chƣa có cạnh nối. Tiến hành nối các đỉnh đƣợc sắp xếp theo thứ tự từ nhỏ đến lớn nhƣ 1 và 2, 2 và 3,... cho đến n đỉnh. Bƣớc này đảm bảo đồ thị ngẫu nhiên là liên thông.
2. Đối với tập cạnh còn lại
: Lấy ngẫu nhiên hai đỉnh bất kỳ mà chƣa tồn tại cạnh nối giữa 2 đỉnh, kết nối 2 đỉnh đó. Lặp lại quá trình cho đến khi đủ cạnh.
3. Tất cả các cạnh đƣợc tạo ra với trọng số đƣợc lấy ngẫu nhiên thuộc khoảng
Xây dựng Bộ dữ liệu thực nghiệm
Chọn là số cạnh trong đồ thị đầy đủ đó là
. Chúng tôi tiến hành thực nghiệm đối với các thuật toán trên đồ thị ngẫu nhiên với các bộ Testcase sau:
Testcase1: Dữ liệu đầu vào sẵn có - DIMACS
321270 1070376 1207945 1524453 1890815 2758119 3598623 6262104 800172 2712798 2840208 3897636 4657742 6885658 8778114 15248146 Bảng 5.2. Dữ liệu đồ thị có sẵn. Testcase2: Mật độ đồ thị 275320 321271 551625 1070376 1500000 2097152 3000000 825960 963814 1654876 3211128 4500000 6291456 9000000 Bảng 5.3. Dữ liệu đồ thị với mật độ m=3n Testcase3: Mật độ đồ thị 150000 321270 635666 800000 1000000 1207945 1890815 900000 1927620 3813396 4800000 6000000 7247670 11340890 Bảng 5. 4. Dữ liệu đồ thị với mật độ m=6n Testcase4: Mật độ đồ thị 300000 400000 500000 600000 700000 800000 1000000 3000000 4000000 5000000 6000000 7000000 8000000 10000000 Bảng 5. 5. Dữ liệu đồ thị với mật độ m=10n
80
Testcase5: Mật độ đồ thị
264436 435666 520000 700000 1088092 1379917 1965206 1057744 1742664 2080000 2800000 4352368 5519668 7860824
Bảng 5. 6. Dữ liệu đồ thị với mật độ m=nloglogn
Testcase6: Mật độ đồ thị
50000 100000 250000 350000 500000 626210 800000 780000 1660964 4482892 6445948 9465784 12058479 15687712
Bảng 5.7. Dữ liệu đồ thị với mật độ m=nlogn.
Testcase7: Mật độ đồ thị
256 512 1024 1536 2048 2560 3000
65280 261632 1047552 2357760 4192256 6551040 8997000
Bảng 5.8. Dữ liệu đồ thị với mật độ m=n*(n-1)/2.
Kết cấu của File dữ liệu đầu vào và File kết quả đầu ra
Các giá trị và đƣợc lựa chọn tƣơng đối dựa trên cấu hình của máy tính thực nghiệm nhằm tránh hiện tƣợng tràn bộ nhớ Ram trong quá trình chạy các thuật toán. Sau khi sinh ngẫu nhiên các đơn đồ thị liên thông theo số đỉnh , số cạnh đƣợc chọn trong bảng 4.3-4.8, chúng tôi tiến hành cho chạy các thuật toán với dữ liệu đầu vào là các đơn đồ thị đƣợc sinh ngẫu nhiên theo số đỉnh và số cạnh để tìm SSSP.
Đối với File dữ liệu đầu vào:
Từ các giá trị đƣợc chọn lựa qua các bảng dữ liệu chúng tôi sinh ra các đơn đồ thị ngẫu nhiên và lƣu dƣới dạng File text (đuôi .txt) với các thông số nhƣ sau:
1. Tên File đồ thị bao gồm số đỉnh và số cạnh :
.
2. Kết cấu bên trong đƣợc thể hiện thống nhất theo cấu trúc File của Bộ dữ liệu có sẵn: Trong đó và là số đỉnh và số cạnh của đồ thị, và tƣơng ứng với đỉnh nguồn, đỉnh đích và trọng số của cạnh với
81
Đối với File dữ liệu đầu ra:
Đối với mỗi thuật Với File dữ liệu đầu ra của mỗi thuật toán gồm 2 File: 1. File lƣu lại thời gian chạy của mỗi thuật toán khi tiến hành tìm kiếm ứng với đồ thị tƣơng ứng. File sẽ đƣợc lƣu dƣới dạng text và tên File theo cấu trúc:
Tên thuật toán - số lần tiến hành truy vấn - số đỉnh - số cạnh . Cấu tạo File lƣu thời gian chạy:
Result - timequery -
(Với
và là số lần tìm kiếm và thời gian tìm kiếm)
2. File lƣu lại kết quả đƣờng đi ngắn nhất từ nguồn đến 2 đỉnh trong đồ thị nhằm tiện so sánh (trong đó, 1 đỉnh ngẫu nhiên và 1 đỉnh đích chung cho tất cả các thuật toán).
Cấu tạo File kết quả đƣờng đi :
( là đỉnh nguồn và đỉnh đích, …. là các đỉnh nằm trên đƣờng đi ngắn nhất từ ).