Thời kì gần đây (1990-nay)

Một phần của tài liệu Giải pháp thiết kế và đánh giá hiệu năng siêu máy tính sử dụng CPU GPU (Trang 68 - 73)

Đến ngày hôm nay, siêu máy tính dần xuất hiện nhiều hơn và nó cũng có mặt trên nhiều quốc gia hơn. Hệ điều hành, kiến trúc cũng nhƣ phần cứng dùng trong siêu máy tính cũng theo đó thay đổi rất nhiều so với vài chục năm trƣớc.

70

Intel ASCI-Red là siêu máy tính đƣợc xây dựng theo chƣơng trình sáng kiến tính toán chiến thuật tăng tốc (ASCI – Accelerated Stragetic Computing Initiative) để xây dựng công cụ giả lập vũ khí hạt nhân sau khi lệnh cấm thử nghiệm vũ khí hạt nhân ra đời vào năm 1992. Siêu máy tính này sử dụng các phụ kiện phổ biến để giữ giá thành thấp và có thiết kế theo mô hình tính toán song song lớn (MPP – Massively Parallel Processing) bao gồm 28x32x2 CPU (Pentium II Xeon) với 4510 nút tính toán, hệ thống RAM phân tán 1212 GB và 12.5 TB dung lƣợng ổ cứng lƣu trữ [24]. ASCI Red xây dựng dựa trên hệ MIMD và có tốc độ tính toán lên đến 1.3 Teraflop.

Năm 2001, phòng thí nghiệm quốc gia Lawrence Livermore triển khai siêu máy tính IBM ASCI-White với khả năng tính toán lên đến 7.2 teraflops. ASCI-White là siêu máy tính dạng cụm đƣợc xây dựng dựa trên chiếc máy tính thƣơng mại của IBM RS/6000 SP. Nó bao gồm 512 máy tính, mỗi máy có 16 CPU và trong toàn bộ cụm tính toán này có tổng cộng 6 TB RAM và dung lƣợng ổ cứng 160 TB [24]. ASCI-White tiêu thụ 3 MW điện để chạy và thêm 3 MW để làm mát. Nó chạy hệ điều hành AIX – một biến thể của UNIX. Toàn bộ hệ thống trị giá 110 triệu đô la.

Bảng 4: Bảng tổng hợp tốc độ tính toán của các mẫu siêu máy tính thời kì 1995-nay

71

Năm 2002, Nhật Bản công bố siêu máy tính Earth Simulator (ES) để chạy các mô hình giả lập khí hậu toàn cầu nhằm đánh giá hiệu ứng và hậu quả của vấn đề nóng lên toàn cầu và các vấn đề về bề mặt địa cầu. Toàn bộ dự án trị giá 60 tỷ yên. ES là một siêu máy tính véc tơ song song cao cấp, một cụm máy tính xây dựng chủ yếu dựa trên siêu máy tính NEC SX-6 của hãng Cray, mỗi một NEC SX-6 bao gồm 8 bộ xử lý véc tơ và 16 GB RAM. ES có 640 nút với tổng cộng 5120 CPU và 10 TB RAM [24]. ES sử dụng hệ điều hành NEC Super - UX (một biến thể của UNIX). Các chƣơng trình đƣợc viết trên ngôn ngữ tính toán hiệu năng cao Fortran (HPF – High Performance Fortran) và trình dịch NEC tối ƣu.

Năm 2004, IBM công bố siêu máy tính IBM ASCI-Blue Gene/L, chiếc siêu máy tính đầu tiên trong dự án Blue Gene – dự án nhằm đem lại những chiếc siêu máy tính có tốc độ xử lý nằm trong dải petaflops và tiêu thụ điện năng ít. Khi vừa ra đời, Blue Gene/L đã chiếm vị trí dẫn đầu trong bảng xếp hạng các máy tính nhanh nhất thế giới vốn thuộc về ES của NEC đã 2 năm từ 2002. Blue Gene/L có 65536 CPU với 3 mạng tích hợp (các topology mạng khác nhau) đƣợc cấu thành từ một tập hợp các nút song song nhỏ hơn và có thiết kế phân cấp do đó có khả năng mở rộng mạnh mẽ. Blue Gene/L trị giá 100 triệu đô la.

Năm 2008, IBM công bố siêu máy tính Roadrunner tại phòng thí nghiệm quốc gia Los Alamos tại Mexico, Mỹ. Chiếc siêu máy tính trị giá 100 triệu đô này có tốc độ tính toán tối đa 1,7 petaflops. Roadrunner có 6912 CPU 2 nhân Opteron trong đó 6480 nhân để tính toán và 432 nhân để chạy hệ điều hành, kết nối, sắp xếp lịch,… và 12960 CPU PowerXCell 8i – một phiên bản nhanh hơn của CPU của PS3 để tính toán. Roadrunner là siêu máy tính đầu tiên thuộc phân hệ siêu máy tính lai. Các siêu máy tính đời trƣớc chỉ sử dụng một loại bộ xử lý vì nhƣ vậy sẽ đơn giản hơn về mặt thiết kế và và xây dựng chƣơng trình. Để tận dụng hết sức mạnh tính toán của Roadrunner thì các ứng dụng phải đƣợc viết riêng cho kiến trúc lai này. Về mặt cấu trúc có thể coi Roadrunner là một cụm máy tính Opteron với bộ tăng tốc Cell (từ PowerXCell 8i). Ở tầng dƣới cùng của Roadrunner là TriBlade với 2 CPU 2 nhân Opteron với 16 GB RAM và 4 CPU PowerXCell, có 3 TriBlade một khung và có

72

180 TriBlade trên một đơn vị kết nối và có tổng cộng 18 đơn vị kết nối. Blue Gene có giá trị 133 triệu đô la và có công suất tiêu thụ 2.35 MW [24].

Cray Jaguar là siêu máy tính đƣợc xây dựng bởi Cray tại phòng thí nghiệm quốc gia Oak Ridge tại Tennessee, Mỹ. Tốc độ tính toán tối đa của Jaguar vào khoảng trên 1.75 petaflops. Tháng 11/2009 và 6/2010, Danh sách 500 máy tính nhanh nhất thế giới đều xếp Jaguar tại vị trí siêu máy tính nhanh nhất thế giới. Hệ thống siêu máy tính Jaguar đã đƣợc trải qua vài lần nâng cấp từ lần đầu tiên triển khai dựa trên Cray XT3 với tốc độ tính toán 25 teraflops vào 2005. Năm 2008, Jaguar đƣợc nâng cấp chuyển sang sử dụng Cray XT4 với tốc độ tính toán 263 teraflops. Trong 2008, Jaguar đƣợc tăng tốc thêm 1,4 petaflops từ Cray XT5. Năm 2009, sau khi nâng cấp chuyển sang sử dụng bộ xử lý AMD Istanbul 6 nhân 2.6 GHz thay thế cho bộ xử lý AMD Barcelona 4 nhân 2.3 GHz, kết quả là hệ thống có hơn 200000 bộ xử lý đƣợc kết nối với nhau dựa trên mạng Cray Seastar2+. Jaguar có công suất tiêu thụ 6.9 MW. Cray Jaguar đƣợc coi nhƣ là lời giải đáp cho rất nhiều vấn đề khoa học thách thức nhƣ mô hình hóa khí tƣợng, khoa học vật liệu, hóa học, v.v...

Cuối tháng 10/2010, BBC đăng tin siêu máy tính Tianhe-1A của Trung Quốc đã soán vị trí số 1 của Jaguar với tốc độ xử lý lên đến 2,5 triệu tỷ phép tính một giây. Đến tháng 11/2010, danh sách 500 máy tính nhanh nhất thế giới đã công nhận vị trí này của Tianhe-1A và đây cũng là lần đầu tiên một siêu máy tính của Trung Quốc lọt vào danh sách này. Tianhe-1A sử dụng thiết kế lai sử dụng cả CPU và GPU. Tianhe-1A bao gồm 112 cabin máy tính, 12 cabin lƣu trữ, 6 cabin kết nối và 8 cabin thiết bị ngoại vi. Mỗi một cabin máy tính bao gồm 4 khung và mỗi khung gồm 8 lƣỡi (blade) và một bảng mạch chuyển 16 cổng. Mỗi một blade bao gồm 2 nút máy tính, mỗi một máy tính bao gồm 2 bộ xử lý 6 nhân Xeon X5670 và một GPU NVIDIA M2050. Hệ thống có tổng cộng 3584 blade với 7168 GPU và 14336 CPU đƣợc kết nối băng thông lớn bởi Infiniband. Tianhe-1A trị giá 88 triệu đô la và công suất tiêu thụ điện 4MW.

73

Tuy nhiên Tianhe-1A không nắm giữ ngôi vƣơng này lâu vì đến tháng 11/2011, Fujitsu K trở thành máy tính mạnh nhất thế giới với tốc độ tính toán lên đến 8 petaflops. K là viết tắt của từ “Kei” trong tiếng Nhật nghĩa là 10 và đến tháng 11/2011, siêu máy tính Fujitsu K thực sự biến cái tên của mình trở thành sự thật khi tốc độ tính toán cao nhất lên đến 10.5 petaflops. Fujitsu K sử dụng thiết kế truyền thống, không hề sử dụng một bộ tăng tốc xử lý nào. Fujitsu bao gồm 88128 CPU SPARC64 8 nhân 2 GHz trong tổng cộng 864 cabin. Mỗi một cabin bao gồm 96 nút tính toán và 6 nút thiết bị ngoại vi. Mỗi một nút tính toán bao gồm một bộ xử lý và 16 GB RAM. Siêu máy tính K sử dụng hệ thống làm mát bằng nƣớc để tiết kiệm điện năng tiêu thụ. Fujitsu K tiêu thụ 12,6 MW điện và đƣợc xếp hạng nhì về mặt tiêu thụ điện năng hiệu quả trong danh sách 500 máy tính mạnh nhất thế giới với 1kW điện cho 800 gigaflops.

Tháng 6/2012, chiếc siêu máy tính thứ 3 trong dự án Blue Gene với mã Blue Gene/Q đã đứng đầu cả 3 danh sách 500 siêu máy tính mạnh nhất thế giới, 500 siêu máy tính hiệu năng hiệu quả nhất thế giới và 500 siêu máy tính có tải dữ liệu phức tạp cao nhất với 1572864 nhân trong 98304 CPU IBM Power. Blue Gene/Q có tỷ lệ sử dụng điện năng rất hiệu quả, khoảng 2066 gigaflops cho 1 kW. Tuy nhiên hiệu suất thực tế của nó (qua benchmark Lynpack) đạt 16,32 petaflops. Thiết kế của Blue Gene/Q có thể mở rộng đến tốc độ tính toán theo lý thuyết 100 petaflops. Blue Gene/Q trị giá 97 triệu đô la.

Vậy đối với những ngƣời quan tâm đến điện toán hiệu năng cao thì có 2 tháng quan trọng trong năm là tháng 6 và tháng 11, thời điểm mà danh sách 500 máy tính mạnh nhất thế giới đƣợc công bố. Danh sách này không chỉ giúp ta thấy đƣợc những siêu máy tính nào đang có sức mạnh tính toán mạnh nhất mà nó còn giúp cho ta nhìn thấy đƣợc xu hƣớng điện toán hiệu năng cao đang thay đổi nhƣ thế nào. Từ lần công bố đầu tiên vào năm 1993 cho đến thời điểm hiện tại, ta có thể thấy rõ sự tăng lên đáng kể việc sử dụng GPU trong kiến trúc siêu máy tính của các máy tính trong danh sách, đặc biệt vào tháng 11/2011 có đến 39 siêu máy tính sử dụng GPU trong khi chỉ có 17 siêu máy tính sử dụng GPU vào thời điểm 17 tháng trƣớc đó. Và

74

đến tháng 11 năm 2014 thì có đến 53 siêu máy tính sử dụng công nghệ GPU trong đó có 50 chiếc sử dụng chip của NVIDIA và ba chiếc sử dụng chip ATI Radeon.

Ở thời điểm hiện tại, danh sách 500 siêu máy tính mạnh nhất thế giới vào tháng 6/2015 thì siêu máy tính Tianhe-2 liên tục giữ vị trí số 1 của mình trong 5 lần đánh giá liên tiếp. Tianhe-2 đƣợc xây dựng dựa trên chip Intel Xeon Ivy Bridge và bộ đồng xử lý Intel Xeon-Phi với tổng cộng 3120000 nhân trong 16000 nút (2 Ivy Bridge và 3 Xeon-Phi trên một nút tính toán). Tianhe-2 có công suất tiêu thụ lớn 17.8 MW tuy nhiên hiệu suất thực tế của nó chỉ đạt 62% hiệu suất cao nhất trên lý thuyết (33.86 petaflops/ 54.9 petaflops) [24]. Tianhe-2 sử dụng hệ điều hành Kylin Linux, một phiên bản của hệ điều hành Linux đƣợc phát triển bởi đại học công nghệ phòng thủ quốc gia của Trung Quốc (NUDT – National University of Defense Technology).

Một phần của tài liệu Giải pháp thiết kế và đánh giá hiệu năng siêu máy tính sử dụng CPU GPU (Trang 68 - 73)