Itanium là bộ xử lý 64 bit đầu tiên của Intel được xuất xưởng đúng 10 năm trước để cạnh tranh với nền tảng RISC đang thống trị thị trường máy chủ doanh nghiệp thời kỳ đó
BÁO CÁO BÀI TẬP LỚN KỸ THUẬT VI XỬ LÝ ĐỀ TÀI VI XỬ LÝ INTEL ITANIUM 9000 NHÓM THỨ : 12 LỚP: D09CN1 HỌC KỲ: HỌC KỲ 1 NĂM HỌC 2011-2012 Thành viên: 1. Nguyễn Sơn Tùng – CEO 2. Nguyễn Mạnh Tuấn – Giám đốc kỹ thuật 3. Nguyễn Mạnh Tưởng – Giám đốc công nghệ 4. Lê Văn Việt – Giám đốc tập lệnh 5. Vongsakda Mục lục A. Giới thiệu .2 I. Giới thiệu chung II. Các thông số chính III. Lịch sử B. Kiến trúc .7 I. Sơ đồ chung II. Các thành phần và thông số chính III. Kiến trúc tập lệnh C. Đặc tính – Công nghệ .17 I. Công nghệ thuật toán song song II. Công nghệ siêu phân luồng III. Chức năng đa phương tiện IV. Thanh ghi cải tiến tập tin V. Floating-Point ứng dụng kỹ thuật chuyên sâu VI. Modulo theo dự kiến vòng lặp Pipelines VII. Những cải tiến về nhánh VIII. Độ trễ bộ nhớ giảm D. Tổng kết – Đánh giá hiệu năng .28 E. Nguồn – Trích dẫn 30 A. Giới thiệu I. Giới thiệu chung Itanium là bộ xử lý 64 bit đầu tiên của Intel được xuất xưởng đúng 10 năm trước để cạnh tranh với nền tảng RISC đang thống trị thị trường máy chủ doanh nghiệp thời kỳ đó. Hợp tác cùng HP đưa ra thị trường dòng CPU dùng cho máy chủ trung và lớn. Với tham vọng lật đổ nền tảng RISC đồng thời nắm gọn thị trường vi xử lý, itanium được coi như một huyền thoại của intel. 10 năm phát triển từ itanium tới itanium-2 với nhiều cải tiến vượt bậc, và cũng vô vàn khó khăn. Itanium 2 là bộ xử lý thứ 2 thuộc dòng Itanium, các máy chủ và máy trạm chạy Itanium 2 có tốc độ nhanh gấp 2 lần những hệ thống chạy Itanium hiện hành. Bộ xử lý Itanium 2 hỗ trợ giao dịch khối lượng lớn, tính toán phức tạp. Điểm đáng lưu ý là các chip Itanium 2 đều xử lý ứng dụng 64 bit. Itanium 2 9000 series là dòng vi xử lý được Intel Itanium phát triển dưới codename Monecito, đưa ra vào ngày 18 tháng 7 năm 2006. Vi xử lý Monecito, dựa trên công nghệ 90nm, có xung nhịp 1,6 GHz tốc độ FSB 667 MHz với bộ nhớ đệm 3 MB. EPIC cải thiện thông lượng lệnh song song. Với công nghệ EPIC, bộ xử lý bớt đi được gánh nặng phải nhận dạng các cơ hội xử lý song song giúp Itanium 2 đạt mức băng thông xử lý dữ liệu 6G/s. II. Các thông số chính • Codename: Monecito • Process: 90nm • Clock: 1.4 – 1.6 GHz • L2 Cache: 256 kB + 1 MB • L3 Cache: 6-25 MB • Bus: 400/533 MHz • Cores: 2 • Watts/device: 104 • Support: Virtualization, Multithread, no HW IA-32 III. Lịch sử Vào cuối những năm 90, HP nhận định rằng máy tính sử dụng RIC đã đạt đến giới hạn xử lý 1 lệnh/1 chu kỳ và đã phát triển một mới kiến trúc được gọi là toán lệnh song song (EPIC), cho phép các vi xử lý thực thi nhiều hơn một lệnh trong một chu kỳ đồng hồ. HP và Intel đã trở thành đối tác vào năm 1994 và phát triển kiến trúc IA-64. Intel nỗ lực phát triển IA-64 với hi vọng các bộ vi xử lý của hãng sẽ được sử dụng bởi phần lớn các hãng sản xuất máy tính lớn. HP và Intel đã khởi xướng một cuộc thay đổi lớn, trước tiên là việc cung cấp sản phẩm đầu tiên có tên mã là Merced, vào năm 1998. Intel công bố tên chính thức của bộ vi xử lý Itanium vào 04 tháng 10 năm 1998. Bộ vi xử lý Itanium thời kỳ đầu: 2001-2002 Itanium đã được phát hành vào tháng Sáu năm 2001, nó đã không hiệu quả hơn RISC và CISC. Chỉ có một vài nghìn sản phẩm được bán, do sản lượng kém, hiệu suất tương đối thấp, và chi phí cao. Tuy nhiên, các máy này rất hữu ích cho việc phát triển Itanium 2 - bộ vi xử lý sau đó. IBM đã cho ra đời một siêu máy tính dựa trên xử lý này. Itanium 2: 2002-hiện tại Itanium 2 được phát hành vào năm 2002, và chủ yếu hướng tới thị trường máy chủ. Itanium 2 ban đầu có tên mã là McKinley. McKinley sử dụng công nghệ 180 nm, nhưng nó ít xảy ra vấn đề về hiệu suất hơn Itanium đời đầu. Năm 2003, AMD đã phát hành Opteron, sử dụng kiến trúc x86-64. Opteron được chấp nhận nhanh chóng trong thị trường máy chủ doanh nghiệp bởi vì nó cung cấp một bản nâng cấp dễ dàng từ x86. Intel phản ứng bằng cách sử dụng x86-64 trong bộ vi xử lý Xeon được phát hành năm 2004. Intel phát hành một thành viên mới trong họ Itanium 2, được đặt tên Madison, vào năm 2003. Madison sử dụng công nghệ 130 nm và là cơ sở của tất cả các vi xử lý Itaniums sau này, cho đến khi Montecito được phát hành trong tháng sáu năm 2006. Các dòng vi xử lý Itanium đã cho thấy những tiến bộ vượt bậc về hiệu năng. Merced đã là một bằng chứng về mặt khái niệm. McKinley đã cải thiện rất nhiều về phân cấp bộ nhớ và giúp Itanium trở nên khá cạnh tranh trên thị trường. Madison, với sự chuyển đổi sang công nghệ 130nm, được cung cấp đủ không gian cache để vượt qua các điểm tắc nghẽn cơ bản trong quá trình thực thi chính. Monecito, với công nghệ 90nm, cho phép sự thực thi của công nghệ lõi kép và cải tiến chủ yếu trong công năng mỗi watt.Monvale thêm 3 tính năng: core-level lockstep, demand-based switching và front-side bus frequency of up to 667MHz. B. Kiến trúc I. Sơ đồ chung • Dual-Core: Theo Intel, với kiến trúc dual-core, Monecito có hiệu năng gấp đôi phiên bản trước nó, vi xử lý Itanium 2 một lõi, và giảm thiểu tiêu thụ điện năng tới 20%. Ngoài ra, nó còn có khả năng xử lý đa luồng ( 2 luồng mỗi lõi), hệ thống cache mở rộng (12 MB một lõi) và hỗ trợ silicon cho ảo hoá. Bộ vi xử lý Intel Itanium hai lõi 64-bit trên một bộ xử lý có đến 24 MB bộ nhớ cache L3 có độ trễ thấp, cung cấp băng thông rộng cho cả hai lõi. Bộ nhớ cache cao, cùng với Hyper-Threading (HT), tính năng cung cấp tăng gấp hai lần hiệu suất của bộ xử lý lõi kép so với các dòng trước đó. Dual Core là gì và tại sao sử dụng Dual Core với Monecito ? Dual-core ( Lõi kép) là một kiến trúc mà một CPU với 2 nhân xử lý hoàn chỉnh trong một vi xử lý. Hai nhân này, cache của chúng và các bộ điều khiển cache đều được tích hợp vào cùng một IC. Chúng đều có thể được coi là 2 vi xử lý mà làm việc cùng nhau nhằm giúp mỗi bên trong quá trình xử lý và thi hành. Có nhiều điểm phân biệt giữa Dual-core và Dual-core CPU. Dual-core là khái niệm dùng để chỉ 2 nhân riêng biệt mà được đặt cùng nhau trong một chip. Còn Dual-processor là khái niệm để chỉ việc sử dụng 2 vi xử lý, không nhất thiết trên cùng một chip, thậm chí có thể không cùng trên 1 mainboard. Có nhiều lý do giải thích việc dual-core đang phổ biến hiện nay, thực tế là khá thành công. Một số người nói nó là sự san bằng đường cong của clock speed mà đã buộc AMD và Intel phải chịu thua trước công nghệ này. Rào chắn clock speed đã bị đánh bại bởi hai người khổng lồ trong lĩnh vực microprocessor và họ đã chọn một lộ trình thay thế cho hiệu năng tiên tiến hơn, để “ thật hài long với việc ra những sản phẩm mới.” Vấn đề với việc đẩy clock speed lên rất cao là nhiệt năng toả ra. Xung nhịp đồng hồ cao dẫn đến nhiệt năng toả ra lớn, điều này gây ra vô số ảnh hưởng xấu. Nguồn nhiệt năng này phát ra do sự tiêu hao của nguồn điện. Vận hành một vi xử lý tại một xung nhịp cao yêu cầu một lượng khổng lồ điện năng chạy quanh các vi mạch, làm chúng dễ bị ảnh hưởng gây nhiễu. Từ lúc những mạch kẻ trên vi xử lý được đặt trong khoảng cách cực nhỏ, sự rò rỉ điện từ mạch kẻ này sang mạch khác có thể huỷ hoại toàn bộ dữ liệu trên mạch kẻ đó. Những dữ liệu bị huỷ hoại này là nguyên nhân gây ra các lỗi. Một vi xử lý lõi kép là sự kết hợp của vi xử lý 1 lõi và hệ thống 2 nhân. “Một vi xử lý lõi kép sẽ không nhanh gấp đôi vi xử lý 1 nhân hay ngang hệ thống 2 nhân.” Hiệu năng của lõi kép sẽ nằm giữa 2 hệ thống đó, nhưng nó chắc chắn tốt hơn là vi xử lý 1 nhân. Khi có tới 2 hệ thống ống lệnh thì 2 lệnh hoàn toàn được xử lý song song. Ngoài ra, 2 cache của 2 vi xử lý cho phép xử lsy nhiều dữ liệu hơn trên mạch nhằm đẩy tốc độ truy cập. Vấn đề duy nhất là 2 vi xử lý phải chia sẻ cùng một hệ thống bus và bộ nhớ, đây cũng chính là 1 trong nhiều trở ngại của vi xử lý lõi kép. Kết luận, công nghệ lõi kép cung cấp hiệu năng lớn hơn nhiều so với vi xử lý 1 nhân. Nó mang lại nhiều lợi ích, đặc biệt với những người mong muốn vận hành nhiều công việc 1 lúc. Vi xử lý lõi kép mang lại cho các nhà sản xuất một cách không quá đắt để đưa ra những sản phẩm có năng suất cao. Sơ đồ khối II. Các thành phần và thông số chính So sánh giữa Monecito và Madison Madison Monecito Công Nghệ 130nm 90nm Số lượng nhân 1 2 Tần số đồng hồ 1600MHz 1600MHz Số đơn vị INT 6 6 Số đơn vị MM 6 6 Số đơn vị FP 2(*,+) 2(*,+) Số đơn vị ADDR 2L+2S or 4L 2L+2S or 4L Cache L1 16/16KB 16/16KB Cache L2 256KB 1MB/256KB Cache L3 9MB 24MB ngay trên mạch kẻ Hệ thống BUS -Tần số -Độ rộng 6.4GB/s - 400MHz - 128 bit 8.5GB/s - 533MHz - 128 bit [...]... Technologies – Alexander Grudinski 3 Intel Itanium Architecture Update – Dr Feixiong Liu 4 Itanium architecture vol 3 manual – Intel 5 Intel Itanium 9000 – 9100 datasheet – Intel 6 Intel Itanium 2 Product Brief – Intel 7 Dual-core Architecture: The Intel Itanium 2 (9000 series) Intel Processor – Mohd Adnan Khan, Noor Bilal Mohiuddin, Faisal Arafsha 8 Intel Itanium 2 Processor – Intel Software College http://en.wikipedia.org/wiki/Montecito_%28processor%29... trong bộ xử lý Intel Itanium2 HyperThreading là tên của Intel đặt cho công nghệ SMT (Simultaneous Multi-Threading) Công nghệ này cho phép một nhân xử lý có thể thực sự xử lý song song các thread do các ứng dụng tạo ra, bằng cách trang bị thêm một số thành phần của nhân xử lý, khiến hệ điều hành nghĩ rằng nó đang làm vi c với nhiều nhân xử lý Như vậy, với một hệ điều hành tương thích bộ xử lý nhiều... song làm tăng khối lượng công vi c được hoàn tất đối với mỗi bộ vi xử lý trong một chu kỳ xung nhịp do đó làm tăng đáng kể hiệu năng của các phần mềm ứng dụng Bằng vi c thiết lập một nền tảng tiên tiến cho chế độ song song, tăng thông lượng lệnh song song EPIC cho phép mở rộng hiệu năng bộ vi xử lý Với các kiến trúc truyền thống, bộ vi xử lý phải tự xác định được khả năng xử lý song song; EPIC có một bộ...• Là vi xử lý đầu tiên chứa tới 1.72 tỷ transistor • Phần cứng rộng, song song cho năng suất cao: Itanium chứa 128 thanh ghi tổng quát và 128 thanh ghi số thực dấu phẩy động luân phiên hỗ trợ Ngoài ra, một công cụ ngăn xếp được sử dụng để cải tiến quản lý vi c xử lý tài nguyên Một tính năng được giới thiệu trong Itanium 2 là sự hỗ trợ của vi c suy đoán giúp cải thiện hiệu suất xử lý • Bus hệ... với năm trước đó Các kỹ sư của Intel vẫn tiếp tục hoàn thiện bộ xử lý Itanium và giới thiệu thế hệ bộ xử lý Itanium mới là những con chip 8 nhân mang tên mã Poulson Nó sẽ có 3,1 tỷ transistor, nhiều hơn 0,9 tỷ transistor so với model Itanium Tukwila hiện hành Theo số liệu của Brookvood, khi phát triển Poulson, Intel đã xem lại toàn bộ kiến trúc của bộ xử lý này Đối với Itanium, nhược điểm đặc trưng... không có nghĩa là tất cả các kỹ thuật được thực hiện ở hai bộ xử lý Itanium hoặc các bộ vi xử lý Itanium 2 8 Độ trễ bộ nhớ giảm (Memory Latency Reduction) Sự dự đoán giúp loại bỏ các nhánh từ các đường dẫn thực thi quan trọng, nhưng sớm hay muộn chương trình vẫn cần phải nạp từ bộ nhớ Các bộ nhớ cache cấp độ đầu tiên đánh vào bộ vi xử lý Itanium 2 có một độ trễ chỉ có 1 chu kỳ, nhưng mức độ 1/3 bộ... giá hiệu năng Vi xử lý Dual-core Intel Itanium 2 9000 Nhiều tính năng mới nhằm cải thiện hiệu năng: • Dual-Core • 24MB Cache L3 và 2MB Cache L2 • Công nghệ Siêu phân luồng của Intel • Công nghệ Ảo hoá của Intel • 104W, cải thiện hiệu năng lên gấp 2.5 lần • Hỗ trợ PCI Express và DDR2 Bên cạnh đó: • Xây dựng dựa trên kiến trúc EPIC • Đầy đủ các tính năng cho cấp độ máy chủ lớn • Vi xử lý 1.72 tỷ transistor... bù lại nó cần đáp ứng yêu cầu tốc độ khi đồng thời xử lý nhiều luồng dữ liệu 3 Tập lệnh mà intel hỗ trợ cho Itanium 9000 tăng cường khả năng xử lý của CPU qua đó cải thiện rất lớn về mặt tốc độ, độ chính xác Vi c intel tấn công vào thị trường IA-64 là một bước đi mạo hiểm, bởi trước đó nền tảng IA-64 hoàn toàn do AMD nắm dữ, trong thời gian gần đây itanium đang mất dần đi vị trí của mình Liệu nền tảng... không mất thời gian, và bằng vi c giảm bớt lượng công vi c này, bộ xử lý có thể được rảnh rang để tập trung vào chuyên môn hơn 3 Chức năng đa phương tiện (Multimedia Functionality) Kiến trúc Itanium bao gồm khả năng xử lý đa phương tiện hiện đại và thanh ghi cần thiết cho nhiều loại xử lý đa phương tiện hoặc các tiến trình Ứng dụng đa phương tiện ngày càng tăng, và bao gồm video trực tuyến, hình ảnh... là cốt lõi của kiến trúc vi xử lý Itanium 2, được cùng phát triển bởi Intel và HP EPIC thực ra được bắt nguồn từ các phòng phát triển của HP dựa trên những nghiên cứu từ năm 1989 Kiến trúc toán tử song song là một tiến bộ mới mở ra khả năng của vi xử lý nhằm vượt qua các giới hạn của RISC Kiến trúc này mang lại cho các trình biên dịch khả năng kiểm soát được các lợi ích của xử lý song song ( Instruction