Cài đặt và thử nghiệ m

Một phần của tài liệu Mô phỏng song song sử dụng khối xử lý đồ họa GPGPU (Trang 69 - 70)

Để thực hiện đánh giá, tác giả cài đặt thuật toán theo phương pháp được giới thiệu trong tài liệu Fast N – Body Simulation with CUDA [12], trong đó các tính toán sử dụng bộ nhớ dùng chung GPU để tăng cường hiệu năng mô phỏng. Các luồng được gắn với một block. Mỗi luồng sẽ tính toán lực trên các thực thể của nó bởi thực hiện thuật toán

• Nạp dữ liệu của các thực thể vào bộ nhó phân chia

• Đồng bộ hóa với các luồng khác trong block

• Tính toán các lực của mỗi thực thể nằm trong bộ nhớ phân chia lên thực thể của luồng

• Đồng bộ hóa với các luồng khác trong block

• Lặp lại các bước trên cho tất cả các thực thểđã xử lý

• Từ các lực tổng hợp tính toán được, tính toán lại vị trí và tốc độ • Ghi kết quả ra bộ nhớ ngoài

Để thực hiện đánh giá tác giả đã cài đặt 2 phiên bản. Một phiên bản thực hiện song song với OpenMP trên máy tính thông thường, và một phiên bản thực hiện song song trên GPU của NVIDIA. Máy tính thực hiện có trang bị 4GB bộ nhớ và tốc độ 2 x 2.4GHz. GPU so sánh là GeForce 9600M GS 32

65 cores, cores speed 430MHz, memory 1024MB, kết quả thử nghiệm được đưa ra trong hình 3.2.

Hình 3.2. So sánh hiệu năng mô phỏng N-Body giữa GPU và CPU. Nhận xét rằng, khi số thực thể tăng dần thì hiệu năng của GPU cũng tăng lên nhiều so với CPU. Cụ thể, với số thực thể N=25000 thì hiệu năng của GPU gấp 78 lần CPU. Khi N=50000 thì hiệu năng GPU gấp 225 lần CPU và gấp 424 lần CPU khi N=100000. Các kết quả đưa ra trong thử nghiệm này là hoàn toàn phù hợp với những công bố trong tài liệu [12].

Một phần của tài liệu Mô phỏng song song sử dụng khối xử lý đồ họa GPGPU (Trang 69 - 70)

Tải bản đầy đủ (PDF)

(87 trang)