6. Phƣơng pháp nghiên cứu
3.4.2. Đo hiệu năng tính toán với chế độ benchmark
Để thực hiện đo hiệu năng, tác giả đã chạy chương trình ở chế độ benchmark. Các kết quả đo hiệu năng được mô tả trong các phần dưới đây:
Chạy chỉ trên CPU
Nbody –benchmark –n=4096 –cpu
Kết quả:
4096 bodies, total time for 10 iterations: 19996.547 ms
0.008 billion interactions per second
0.168 single-precision GFLOP/s at 20 flops per interaction
[nbody] test results...PASSED Nbody –benchmark –n=4096 –cpu –fp64
60
4096 bodies, total time for 10 iterations: 21194.029 ms
0.008 billion interactions per second
0.237 double-precision GFLOP/s at 30 flops per interaction
[nbody] test results... PASSED Nbody –benchmark –n=16384 –cpu
Kết quả:
16384 bodies, total time for 10 iterations: 321300.938 ms
0.008 billion interactions per second
0.167 single-precision GFLOP/s at 20 flops per interaction
[nbody] test results...PASSED Nbody –benchmark –n=16384 –cpu –fp64
Kết quả:
16384 bodies, total time for 10 iterations: 344385.750 ms
0.008 billion interactions per second
0.234 double-precision GFLOP/s at 30 flops per interaction
[nbody] test results...PASSED
Chạy kết hợp CPU và GPU
Nbody –benchmark –n=4096
Kết quả:
4096 bodies, total time for 10 iterations: 57.419 ms
2.922 billion interactions per second
58.438 single-precision GFLOP/s at 20 flops per interaction
[nbody] test results...PASSED Nbody –benchmark –n=4096 –fp64
61
Kết quả:
4096 bodies, total time for 10 iterations: 479.572 ms
0.350 billion interactions per second
10.495 double-precision GFLOP/s at 30 flops per interaction
[nbody] test results...PASSED Nbody –benchmark –n=16384
Kết quả:
16384 bodies, total time for 10 iterations: 908.327 ms
2.955 billion interactions per second
59.105 single-precision GFLOP/s at 20 flops per interaction
[nbody] test results...PASSED Nbody –benchmark –n=10240 –fp64
Kết quả:
10240 bodies, total time for 10 iterations: 2993.848 ms
0.350 billion interactions per second
10.507 double-precision GFLOP/s at 30 flops per interaction
[nbody] test results...PASSED