Những vấn đề sẽ tiếp tục nghiên cứu

Một phần của tài liệu Nghiên cứu kiến trúc hệ thống tính toán hiệu năng cao đa dụng dựa trên card đồ họa (Trang 74 - 77)

- Nghiên cứu sâu về các hệ thống kiến trúc Tesla, cụm GPU. - Tìm hiểu chi tiết về mô hình lập trình CUDA.

KẾT LUẬN

Luận văn đã nghiên cứu tổng quan về tính toán song song, đó là điều kiện cần để phát triển ứng dụng GPU cho mục đích thông dụng. Luận văn cũng đã tìm hiểu về cơ chế hoạt động của GPU, các kiến trúc bên trong nó, mô hình lập trình trên GPU. Trong chương 2, luận văn đã tìm hiểu công cụ lập trình GPU phổ biến nhất hiện nay là CUDA. Luận văn cũng trình bày chi tiết các mô hình lập trình, thiết lập phần cứng trên card đồ họa của NVIDIA, giao diện lập trình cũng như các chỉ dẫn hiệu năng khi chạy ứng dụng trên card đồ họa.

Từ các hiệu biết trên, luận văn đã thực hiện thử nghiệm năng lực tính toán của GPU so sánh với CPU để kiểm chứng những điều mà lý thuyết đã đề cập. Các kết quả thử nghiệm được trình bày chi tiết trong chương 3 của luận văn.

Với các kết quả đạt được, luận văn mong muốn có các nghiên cứu thêm về cải tiến hiệu năng bài toán mô phỏng N-Body trên GPU, giảm độ phức tạp tính toán từ O(N2) xuống còn O(NlogN).

TÀI LIỆU THAM KHẢO

[1] A. Narayanan and V. Shmatikov. Fast dictionary attacks on passwords using time space tradeoff. In CCS05: Proceedings of the 12th ACM conference on Computer and communications security, pages 364-372, New York, NY, USA, 2005. ACM.

[2] NVIDIA. http://www.nvidia.com/object/cuda_home_new.html [3] http://www.data-systems.pl

[4] A. Klein. Attacks on the rc4 stream cipher. Des. Codes Cryptography, 48(3):269-286, 2008.

[5] http://hpcc.hut.edu.vn/ Forum

[6] D. Kahn. The Codebreakers - The Story of Secret Writing. 1967. [7] Tài liệu kĩ thuật, Trung tâm tính toán hiệu năng cao - Trường Đại Học Bách Khoa Hà Nội http://hpcc.hut.edu.vn

[8] http://www.amd.com AMD Architecture

[9] N. T. Courtois and J. Pieprzyk. Cryptanalysis of block ciphers with overdefined systems of equations, 2002. Preprint is available at

http://eprint.iacr.org/2002/044/.

[10] CUDA Reference Manual phiên bản 3. Có sẵn tại địa chỉ:

http://developer.download.nvidia.com/compute/cuda/3_0/toolkit/docs/CudaRefe renceManual.pdf

[11] J. Barnes and P. Hut, “A Hierarchical O(NlogN) Force-Calculation Algorithm,” Nature, vol. 324, pp. 446-449, Dec. 1986.

[12] Blythe, “The Direct3D 10 system,” ACM Transactions on Graphics, vol. 25, no.3, pp. 724-734, Aug. 2006.

[13] M. Harris, “Mapping computational concepts to GPUs,” in GPU Gems 2, M. Pharr, Ed. Addison Wesley, Mar. 2005, ch. 31, pp. 493-508.

[14] L. Greengard and V. Rokhlin, “A fast algorithm for particle

simulations”, Journal of Computational Physics, vol. 73, pp. 325-348, Dec. 1987 [15] GPU Gems 3, Chapter 31. Fast N-Body Simulation with CUDA http://http.developer.nvidia.com/GPUGems3/gpugems3_ch31.html

Một phần của tài liệu Nghiên cứu kiến trúc hệ thống tính toán hiệu năng cao đa dụng dựa trên card đồ họa (Trang 74 - 77)