Các kết quả thử nghiệm trong luận văn đã cho thấy năng lực tính toán vượt trội của GPU so với CPU trong bài toán tính toán song song mô phỏng n-body. Kết quả cho thấy card đồ họa GeForce 8800 GTX có năng lực xử lý trong bài toán song song gấp khoảng hơn 200 lần so với chip Itel Quad core 2.66GHz. Tuy nhiên độ phức tạp của thuật toán thử nghiệm vẫn ở mức cao O(N2) khi số lượng phần tử tăng lên gấp đôi thì thời gian thực thi tăng lên gấp 4 lần. Đây cũng là một giới hạn khi mà mô phỏng n-body càng sát với thực tế nếu số lượng phần tử càng tăng.
So với kết quả thử nghiệm của [1], luận văn đã thử nghiệm trên tập dữ liệu lớn hơn nhiều lần cỡ 8 triệu phần tử so với 16384 phần tử trong [1]. Từ đó thấy rõ hơn về năng lực xử lý của GPU, CPU, và sự chênh lệch hiệu năng giữa GPU và CPU truyền thống.
Thử nghiệm cho thấy hiệu suất xử lý bài toán n-body của card nVidia GeForce 8800 GTX ở mức xấp xỉ 250 GFLOP/s so với thông số kỹ thuật của card là 518 GFLOP/s (xem trong phụ lục). Điều này chứng tỏ giới hạn của bài toán thử nghiệm, và còn có thể cải tiến để tận dụng được hiệu suất GPU thử nghiệm cao hơn nữa.
Luận văn đã nghiên cứu tổng quan về tính toán song song, mô hình và cách thức hoạt động của các hệ thống song song đó. Đó là điều kiện cần để phát triển ứng dụng GPU thông dụng. Tác giả đã tìm hiểu về tổng quan về GPU, các tiến hóa kiến trúc bên trong nó, và các mô hình tính toán trên GPU. Trong chương 2, luận văn đã tìm hiểu công cụ lập trình GPU phổ biến nhất hiện nay là CUDA. Chương này trình bay chi tiết các mô hình lập trình, thiết lập phần cứng trên card đồ họa của Nvidia, giao diện lập trình cũng như các chỉ dẫn hiệu năng khi chạy ứng dụng trên card đồ họa.
Từ các hiểu biết trên, tác giả đã thực hiện thử nghiệm năng lực tính toán của GPU so sánh với CPU trong bài toán mô phỏng n-body để kiểm chứng, đánh giá những điều mà lý thuyết đã nói. Các kết quả thử nghiệm được trình bày chi tiết trong chương 3 của luận văn. Các kết quả này đã chứng tỏđược năng lực xử lý vượt trội của GPU trong các bài toán tính toán song song.
Với các kết quả đạt được, tác giả mong muốn có các nghiên cứu thêm về cải tiến hiệu năng bài toán mô phỏng n-body trên GPU, giảm độ phức tạp tính toán từ O(N2) xuống còn O(NlogN) [32]. Đồng thời mong muốn nghiên cứu sâu về các hệ thống multi- GPU, GPU cluster, kết hợp nhiều GPU cùng tính toán thông qua mô hình lập trình song song CUDA. Từđó ứng dụng GPU vào giải quyết các bài toán thực tế.
Bảng chi tiết thông số kỹ thuật của card đồ họa nVidia GeForce 8800GTX so với các loại cùng dòng3
