Phân loại hệ thống siêu máy tính

Một phần của tài liệu Giải pháp thiết kế và đánh giá hiệu năng siêu máy tính sử dụng CPU GPU (Trang 73 - 76)

Một siêu máy tính bao gồm các bộ xử lý, bộ nhớ, hệ thống I/O và các liên kết. Bộ xử lý sẽ nạp và chạy chƣơng trình. Việc thực thi bao gồm việc tính toán số học và logic, truy cập bộ nhớ và điều khiển luồng của việc thực thi chƣơng trình. Hệ thống bộ nhớ lƣu giữ trạng thái hiện tại của việc tính toán. Một bộ xử lý hoặc một nhóm các bộ xử lý (Đa xử lý đối xứng) và một khối các bộ nhớ thƣờng đƣợc đặt cùng nhau gọi là một nút của máy. Một siêu máy tính hiện đại có đến hàng trăm nghìn nút. Các liên kết sẽ giúp cho các nút của máy tính có thể liên lạc với nhau để cho các nút này cùng hợp tác để giải quyết một bài toán hớn. Các liên kết cũng kết nối các nút tới các thiết bị I/O nhƣ ổ đĩa, cổng mạng. Hệ thống I/O hỗ trợ cung cấp cho các hệ thống con ngoại biên để khi cần thiết có thể cung cấp dữ liệu đồng nhất cho toàn bộ hệ thống.

Siêu máy tính đƣợc phân loại dựa trên cách chúng sử dụng các thiết bị thƣơng mại thông thƣờng hay các thiết bị đã đƣợc đặt hàng sản xuất dựng để tính toán song song hiệu suất lớn. Dựa vào yếu tố đó, siêu máy tính có thể đƣợc chia thành ba loại:

Siêu máy tính đƣợc xây dựng từ các bộ xử lý thƣơng mại (off-the-shelf) đƣợc phát triển các máy trạm hoặc các máy chủ thƣơng mại đƣợc kết nối với một

75

mạng off-the-shelf sử dụng giao diện I/O của các bộ xử lý. Các siêu máy tính này thƣờng đƣợc gọi là siêu máy tính cụm (cluster) vì cấu trúc của nó là gom nhiều máy trạm hoặc máy chủ lại thành một cụm. Siêu máy tính Big Mac đƣợc xây dựng ở Virgina Tech là một là một siêu máy tính cụm. Bộ xử lý trong các máy chủ này là loại bộ xử lý đƣợc sản xuất hàng loạt với số lƣợng lớn do đó có khả năng mở rộng tốt. Số lƣợng lớn cũng là một điều kiện đảm bảo cho thiết kế tốt. Ví dụ, các mạch đƣợc đặt riêng đƣợc sản xuất để đạt đƣợc xung nhịp đồng hồ cao tuy nhiên các bộ xứ lý thƣơng mại lại đƣợc tối ƣu cho cơ chế truy cập bộ nhớ khác với cơ chế trong rất nhiều ứng dụng khoa học do đó các ứng dụng khoa học khi chạy trên loại máy tính này sẽ có một sự thiếu hụt nhỏ trên hiệu năng lý thuyết của máy. Hơn nữa, mạng I/O sử dụng trong máy thƣờng có băng thông toàn cục thấp và độ trễ lớn (so với các thiết kế đặt riêng chuyên dụng)

Siêu máy tính chuyên dụng (đặt hàng) sử dụng các bộ xử lý đã đƣợc thiết kế chuyên dụng cho việc tính toán khao học. Liên kết giữa các nút cũng đƣợc thiết kế chuyên dụng do đó cung cấp băng thông lớn cho giao diện giữa bộ xử lý và bộ nhớ trong cùng một nút cũng nhƣ giữa các nút với nhau ví dụ Cray X1 và NEC Earth Simulater (SX-6). Để giảm độ trễ của các băng thông này, các bộ xử lý này còn triển khai cơ chế che giấu độ trễ. Vì các siêu máy tính này đƣợc sản xuất với số lƣợng ít, bộ xử lý chế tạo riêng nên thƣờng có giá thành rất cao. Các bộ xử lý này có xung nhịp đồng hồ cao và do đó đạt đƣợc hiệu suất cao.

Siêu máy tính lai là sự kết hợp sử dụng cả các bộ xử lý sản xuất hàng loạt với các liên kết chuyên dụng băng thông cao. Siêu máy tính lai thƣờng bao gồm các thiết bị chuyên dụng giữa các bộ xử lý và bộ nhớ để giảm độ trễ và cải thiện băng thông bộ nhớ. Cray T3E và ASC Red Storm là những siêu máy tính lai. Loại siêu máy tính này tận dụng đƣợc hiệu quả (chi phí/hiệu năng) của các bộ xử lý hàng loạt trong khi đó lại tận dụng đƣợc các liên kết chuyên dụng để giải quyết vấn đề tốc độ băng thông của các siêu máy tính cụm.

76

Hình 33: Hệ thống máy tính cụm

Ngoài ra có một cách nữa để phân loại siêu máy tính dựa kết nối giữa các nút tính toán trong hệ thống:

 Sử dụng một lƣợng lớn bộ xử lý đặt gần nhau, và ngƣời ta gọi đây là hệ thống cụm máy tính và đây là kiểu điện toán tập trung. Những bộ xử lý này thƣờng nằm trong nhiều máy tính giống nhau, lân cận nhau (gọi là nút máy tính) và chúng đƣợc kết nối nhằm tạo ra một hệ thống lớn hơn, hoàn chỉnh hơn. Ngƣời ta xem cả hệ thống nhƣ một siêu máy tính duy nhất. Với biện pháp này, các nhà thiết kế cần đảm bảo rằng tốc độ cũng nhƣ tính linh hoạt nội liên kết giữa các máy tính phải đủ đáp ứng yêu cầu công việc. Theo số liệu từ TOP500, số siêu máy tính cluster hiện chiếm đến 82,2% thị phần siêu máy tính toàn cầu. Siêu máy tính IBM Blue Gene/Q sử dụng dạng máy tính cụm.

 Siêu máy tính dạng Massively Parallel Processors (MPP), tức là một máy tính lớn nhƣng có hàng nghìn CPU và thanh RAM trong đó. Chúng đƣợc nối với nhau theo một chuẩn mạng đặc biệt tốc độ siêu cao chứ không xài các thiết bị phổ thông nhƣ mô hình tính toán cụm. Ngoài ra, mỗi CPU sẽ có bộ nhớ riêng của nó và một bản sao hệ điều

77

hành/ứng dụng riêng. MPP hiện chiếm 17,8% thị phần siêu máy tính, theo TOP500. Siêu máy tính IBM Blue Gene/L (đứng thứ 5 thế giới vào năm 2009) đƣợc thiết kế dạng MPP.

Một phần của tài liệu Giải pháp thiết kế và đánh giá hiệu năng siêu máy tính sử dụng CPU GPU (Trang 73 - 76)

Tải bản đầy đủ (PDF)

(126 trang)