Tất cả các lệnh điểu khiển (nhánh, lặp) có thể làm cho warp đang hoạt động phân rã.
2.6.4. Tối ƣu hóa sử dụng chỉ lệnh
Tối ƣu hóa các chỉ lệnh sử dụng trong hầu hết các trƣờng hợp là kỹ thuật tối ƣu có độ ƣu tiên thấp nhất và đƣợc thực hiện sau khi xong các tối ƣu trên. GPU đƣợc tối ƣu hóa cao cho các phép toán dấu phẩy động. Vì thế cần cân nhắc việc ƣu tiên cho tốc độ hay cho độ chính xác. Hiện nay GPU hỗ trợ số dấu phẩy động độ chính xác kép, nên có thể cung cấp chính tính toán chính xác hơn với chi phí thực hiện.
Nên cẩn thận khi chuyển đổi số chính xác đôi sang số chính xác đơn. Tránh dùng phép chia, phép chia lấy dƣ, thay vì thế nên dùng phép dịch chuyển.
2.7. nVidia CUDA
CUDA là từ viết tắt trong tiếng Anh của thuật ngữ Compute Unified Device Architecture, tạm dịch là kiến trúc thiết bị hợp nhất cho tính toán. CUDA bắt đầu xuất hiện từ tháng 11 năm 2006 với vai trò ban đầu là một bộ công cụ phát triển phần mềm dựa trên ngôn ngữ lập trình C, và giờ đây cuối năm 2010, sau bốn năm phát triển, CUDA đang tiến hóa thành kiến trúc điện toán GPU, hay còn gọi là GPGPU, của NVIDIA. CUDA có mặt trên hầu hết các GPU đời mới của NVIDIA, từ dòng GeForce giành cho giải trí, đến Quadro giành cho điện toán hình ảnh chuyên nghiệp, ví dụ nhƣ trong thiết kế và sáng tạo, và mới nhất là dòng Tesla cho tính toán hiệu năng cao.
Hình dƣới đây cho chúng ta thấy bức tranh toàn cảnh về điện toán GPU xét trên khía cạnh phần mềm từ quan điểm và công nghệ của NVIDIA. Trong hình này, ở lớp thấp nhất của kiến trúc phần mềm giành cho điện toán GPU, chúng ta có các GPU của NVIDIA đƣợc trang bị kiến trúc tính toán song song CUDA, bao gồm cả trình điều khiển thiết bị CUDA vốn đƣợc nhúng bên trong trình điều khiển thiết bị đồ họa do NVIDIA cung cấp.