Đo hiệu năng tính toán với chế độ benchmark

Một phần của tài liệu Đánh giá hiệu năng phần mềm xử lý song song trên hệ thống kết hợp CPU và GPU (Trang 59 - 61)

6. Phƣơng pháp nghiên cứu

3.4.2. Đo hiệu năng tính toán với chế độ benchmark

Để thực hiện đo hiệu năng, tác giả đã chạy chương trình ở chế độ benchmark. Các kết quả đo hiệu năng được mô tả trong các phần dưới đây:

Chạy chỉ trên CPU

Nbody –benchmark –n=4096 –cpu

Kết quả:

4096 bodies, total time for 10 iterations: 19996.547 ms

0.008 billion interactions per second

0.168 single-precision GFLOP/s at 20 flops per interaction

 [nbody] test results...PASSED Nbody –benchmark –n=4096 –cpu –fp64

60

4096 bodies, total time for 10 iterations: 21194.029 ms

0.008 billion interactions per second

0.237 double-precision GFLOP/s at 30 flops per interaction

 [nbody] test results... PASSED Nbody –benchmark –n=16384 –cpu

Kết quả:

16384 bodies, total time for 10 iterations: 321300.938 ms

0.008 billion interactions per second

0.167 single-precision GFLOP/s at 20 flops per interaction

 [nbody] test results...PASSED Nbody –benchmark –n=16384 –cpu –fp64

Kết quả:

16384 bodies, total time for 10 iterations: 344385.750 ms

 0.008 billion interactions per second

0.234 double-precision GFLOP/s at 30 flops per interaction

 [nbody] test results...PASSED

Chạy kết hợp CPU và GPU

Nbody –benchmark –n=4096

Kết quả:

4096 bodies, total time for 10 iterations: 57.419 ms

2.922 billion interactions per second

58.438 single-precision GFLOP/s at 20 flops per interaction

 [nbody] test results...PASSED Nbody –benchmark –n=4096 –fp64

61

Kết quả:

4096 bodies, total time for 10 iterations: 479.572 ms

0.350 billion interactions per second

10.495 double-precision GFLOP/s at 30 flops per interaction

 [nbody] test results...PASSED Nbody –benchmark –n=16384

Kết quả:

16384 bodies, total time for 10 iterations: 908.327 ms

2.955 billion interactions per second

59.105 single-precision GFLOP/s at 20 flops per interaction

 [nbody] test results...PASSED Nbody –benchmark –n=10240 –fp64

Kết quả:

10240 bodies, total time for 10 iterations: 2993.848 ms

0.350 billion interactions per second

10.507 double-precision GFLOP/s at 30 flops per interaction

 [nbody] test results...PASSED

Một phần của tài liệu Đánh giá hiệu năng phần mềm xử lý song song trên hệ thống kết hợp CPU và GPU (Trang 59 - 61)

Tải bản đầy đủ (PDF)

(75 trang)