Pentium 4 là bộ vi xử lý kiến trúc x86 thế hệ thứ 7 do Intel sản xuất, và là thiết kế CPU hoàn toàn mới đầu tiên của họ kể từ Pentium III năm 1995. Thiết kế mới này được gọi là kiến trúc NetBurst. Không như Pentium II, Pentium III, và các loại Celeron khác nhau, kiến trúc này khác được tạo mới hoàn toàn và thừa kế rất ít từ thiết kế Pentium ProP6.Bộ vi xử lý Pentium 4 đầu tiên, mã hiệu là Willamette, chạy với tốc độ 1.4 và 1.5 GHz và đã được phát hành vào tháng 11 năm 2000 trên nền Socket 423, và sau đó đã chạy với tốc độ từ 1.5 GHz tới 2 GHz trên Socket 478. Được ghi nhận cùng với sự ra đời của Pentium 4 là bus FSB(Front side bus) nhanh với tốc độ 400 MTs. Khi đó, chip AMD Athlon đang chạy với tốc độ 266 MTs.
Trường đại học công nghiệp Hà nội Khoa Công Nghệ Thông Tin - - BÀI TIỂU LUẬN MÔN HỌC: KIẾN TRÚC MÁY TÍNH ĐỀ TÀI: Nghiên cứu tìm hiểu thế hệ vi xử lý InTel Pentium IV Giáo viên hướng dẫn: Nguyễn Thanh Hải Lớp: Đại học KTPM3-K9 Nhóm sô: Hà Nội, ngày tháng 11 năm 2015 Trường đại học công nghiệp Hà nội Khoa Công Nghệ Thông Tin Báo cáo bài tập lớn mơn học: Kiến trúc Máy tính ĐỀ TÀI: Nghiên cứu tìm hiểu thế hệ vi xử lý InTel Pentium IV Nhóm thực hiện: Nhóm 3–Lớp KTPM3-K9 Thành viên nhóm: Leo thị lan Hương Trần hải Linh Nguyễn thị Nga Nguyễn thị Nhã Trần thị Quyên Giáo viên hướng dẫn: Nguyễn Thanh Hải (GV Kiến Trúc Máy Tính) Hà Nợi ,ngày tháng 11 năm 2015 Mở đầu Nhiệm vụ Nghiên cứu tìm hiểu thế hệ vi xử lý InTel Pentium IV Bố cục * Lịch sử phát triển của VXL Pentium IV : - Hoàn cảnh đời của VXL Pentium IV - Đặc trưng công nghệ chung của VXL Pentium IV * Đặc trưng công nghệ chi tiết của từng loại biến thể (version) của VXL Pentium IV Nội dung A.Lịch sử phát triển của VXL Pentium IV Pentium vi xử lý kiến trúc x86 thế hệ thứ Intel sản xuất, thiết kế CPU hoàn toàn của họ kể từ Pentium III năm 1995 Thiết kế gọi kiến trúc NetBurst Không Pentium II, Pentium III, các loại Celeron khác nhau, kiến trúc khác tạo hoàn tồn thừa kế từ thiết kế Pentium Pro/P6 Bộ vi xử lý Pentium đầu tiên, mã hiệu "Willamette", chạy với tốc độ 1.4 1.5 GHz phát hành vào tháng 11 năm 2000 Socket 423, sau chạy với tốc độ từ 1.5 GHz tới GHz Socket 478 Được ghi nhận với đời của Pentium bus FSB(Front side bus) nhanh với tốc độ 400 MT/s Khi đó, chip AMD Athlon chạy với tốc độ 266 MT/s Pentium Dòng vi xử lý Pentium kết thúc vào ngày 27 tháng năm 2006, thay thể dòng Intel Core - dòng sử dụng nhân "Conroe" Produced From 2000 to 2008 Max CPU clock 1.30 GHz to 3.80 GHz rate Pentium sản xuất vào tháng 11 năm 2011 FSB speeds giới thiệu vi xử lý thế hệ Instruction set Nếu vi xử lý đặt số thay tên 400 MT/s to 1066 MT/s x86 (i386), x86-64, MM X,SSE, SSE2, SSE3 gọi 786 đại diện cho thế hệ sau xử lý 686 Vài hình thức khác của Pentium mắt công Microarchitecture NetBurst Transistors 42M 180nm 55M 130nm chúng dựa kiến trúc khuôn xử 169M 130nm (P4EE) lý dựa các nhân Willametter, 125M 90nm Northwood Prescott 188M 65nm Socket(s) Socket 423 Socket 478 LGA 775 Predecessor Pentium III Successor Pentium D Một số công nghệ bật áp dụng kiến trúc NetBurst Hyper Pipelined Technology(Công nghệ siêu ống) mở rộng số hàng lệnh xử lý, làm hiệu suất máy tăng 30% Execution Trace Cache tránh tình trạng lệnh bị chậm trễ chuyển từ nhớ dến CPU, Rapid Execution Engine tang tốc đồng xử lý toán học, bus hệ thống (system bus) 400 MHz 533 MHz; các công nghệ Advanced Transfer Cache, Advanced Dynamic Execution, Enhanced Floating point Multimedia Unit, Streaming SIMD Extensions (SSE2) cải tiến nhằm tạo BXL tốc độ cao hơn, khả tính toán mạnh hơn, xử lý đa phương tiện tốt Ghi nhận với đời của Pentium công nghệ Quad Data Rate cho phép FSB (Front Side Bus) đạt đến tốc độ 400 MHz Khi đó, chip AMD Athlon chạy với tốc độ FSB 266 MHz (công nghệ Double Data Rate) Bộ vi xử lí Pentium IV có đến 42 triệu Tranzito,kích thước chết của 217 mm2,cơng suất tiêu thụ 55 W làm việc mức 1,5GHz.Tốc độ bus hệ thống 3,2 GB/s , cao thời diểm Bảng: So sánh hiệu suất Pentium Pentium Bảng so sánh hiệu suất của Pentium IV 1,5GHz Petium III 1,0 GHz.Rõ ràng ta thấy tính vượt trội dành cho Pentium IV.Các ứng dụng số nguyên cao 15-20 %,trong Ứng dụng dấu chấm động multimedia lên tới 30-70% Pentium (tên mã Willamette) xuất hiện cuối năm 2000 đặt dấu chấm hết cho “triều đại” Pentium III Willamette xuất sản xuất công nghệ 0,18 có 42 triệu transistor(nhiều gần 50% so với Pentium III),bus hệ thống (system bus) 400 MHz,bộ nhớ đệm tích hợp L2 256 KB,socket 423 478 , Socket 423 xuất hiện khoảng thời gian ngắn, từ tháng 11 năm 2000 đến tháng năm 2001 bị thay thế socket 478 P4 Willamette có tốc độ 1.3, 1.4, 1.5, 1.6, 1.7, 1.8, 1.9 , 2.0 GHz P4 Northwood xuất hiện vào tháng năm 2002,được sản xuất cơng nghệ 0,13, có khoảng 55 triệu transistor,bộ nhớ đệm tích hợp L2 512 KB,socket 478.Northwood có dịng gồm Northwood A(system bus 400 MHz),tốc độ 1.6, 1.8, 2.0, 2.2, 2.4, 2.5, 2.6, 2.8 GHz.Northwoood B(system bus 533 MHz) tốc độ 2.26, 2.4, 2.53, 2.66, 2.8, 3.06 GHz(riêng 3.06 GHz có hỗ trợ cơng nghệ siêu phân luồng Hyper Threading-HT).Northwood C (system bus 800 MHz,tất cả hỗ trợ HT),gồm 2.4,2.6, 3.0, 3.2, 3.4 GHz P4 Prescott (năm 2004).Là BXL sản xuất theo cơng nghệ 90nm,kích thước vi mạch giảm 50% so với P4 Willamette.Điều cho phép tích hợp nhiều transistor kích thước (125 triệu transistor so với 55 triệu transistor của P4 Northwood),tốc độ chuyển đổi của transistor nhanh hơn,tăng khả xử lý,tính toán.Dung lượng nhớ đệm tích hợp L2 của P4 Prescott gấp đơi so với P4 Northwood(1MB so với 512KB).Ngoài tập lệnh MMX,SSE,SSE2,Prescott bổ sung tập lệnh SSE3 giúp các ứng dụng xử lý video game chạy nhanh hơn.Đây giai đoạn “giao thời ” socket 478-775LGA,system bus 533 MHz-800MHz sản phẩm đặt tên khiến người dùng bối rối chọn mua Prescott A(FSB 533MHz)có các tốc độ 2.4, 2.26, 2.8 (socket 478),Prescott 505 (2,66GHz), 505J(2.66 GHz),506 (2,66 GHz), 511 (2,8GHz), 515J (2,93GHz), 516 (2,93GHz) , 519J (3,06GHz), 519 J(3,06GHz) sử dụng socket 775LGA Prescott E,F (năm 2004) có nhớ đệm L2 1MB(các phiên bản sau mở rộng 2MB),bus hệ thống 800 MHz.Ngoài tập lệnh MMX,SSE2,SSE3 tích hợp, Prescott E,F cịn hỗ trợ cơng nghệ siêu phân luồng,một số phiên bản sau có hỗ trợ tính toán 64 bit Dịng sử dụng socket 478 gồm Pentium HT 2.8E (2,8GHz), 3.0E (3,0 GHz), 3.2E (3,2 GHz), 3.4E(3,4 GHz).Dòng sử dụng socket 775LGA gồm Pentium 4HT 3.2F, 3.4F, 3.6F, 3.8F, với các tốc độ tương ứng từ 3,2 GHz.Pentium HT 517,520,520J,521,524,530,530J,531,540,540J,541,550,560,560J,561,570J,571 với các tốc độ từ 2.8 GHz đến 3,8 GHz *Những điểm kĩ thuật của Pentium bao gồm: Tốc độ từ 1.3GHz đến 3.8GHz phần mềm tương thích với xử lý Intel 32 bit trước Một số phiên bản hỗ trợ EM64T Bus xử lý (font-side) chạy 400MHz, 533Mhz, SOOMHz hay 1066MHz Những logic số học (ALUs) chạy gấp hai lần tần số nhân xử lý Công nghệ siêu dẫn đường (20-30 tầng) Công nghệ siêu phân luồng hỗ trợ tất cả xử lý 2.4GHz nhanh chạy Bus 800MHz, tất cả xử lý 3.06GHz nhanh chạy Bus 533MHz Thực thi tập lệnh lệnh chuyên nghiệp Bộ dự đoán phụ mở rộng Bộ nhớ đệm LI 8KB ha>16KB cộng với nhớ đệm theo vết thực thi vi lệnh 12k Bộ nhớ đệm L2 56bit khuôn tốc độ nhân 256KB, 512KB, 1MB hoặc 2MB kết hợp đường Bộ nhớ đệm L3 tốc độ nhân 2MB tích hợp khn SSE2-SSE cộng với 144 tập lệnh chưa xử lý âm đồ họa B Nội dung trọng tâm I Các công nghệ Khả cung cấp số công nghệ các tính tăng cường dựa vào các tiến của Intel lĩnh vực thiết kế mạch, quản lý việc tiêu thụ lượng tính toán khơng thể thực hiện các mơ hình vi kiến trúc của các thế hệ CPU trước Bộ dấu chấm động mở rộng Có nhiều trạng thái lượng thấp Intel bỏ số La Mã định 4, số Ả-rập tiêu chuẩn Pentium Bên pentium có kiến trúc mà Intel gọi vi kiến trúc NetBurst, thuật ngữ thị trường không phải thuật ngữ kĩ thuật Intel dùng NetBurst để thí nghiệm cơng nghệ siêu đường dẫn, máy thực thi nhanh, bus hệ thống tốc độ cao (400MHz, 533MHz, 800MHz 1066MHz) nhớ đệm theo vết thực thi Công nghệ siêu đường dẫn làm tăng gấp đôi hay gấp ba lần độ sâu đường dẫn tập lệnh so với Pentium III ( hay Athlon/Athlon 64) nghĩa nhiều bước nhỏ yêu cầu để thực thi tập lệnh Mặc dù điều dường hữu hiệu, cho phét đạt tới xung cao nhiều Bộ máy thực thi nhanh cho phép hai logic số nguyên ( ALUs) chạy gấp đơi tần số nhanh xử lý có nghĩa có tập lệnh thực thi chu kỳ đồng hổ.Bus hệ thống 400MHz/533MHz/800Mhz/1066Mhz bus quad-pumped chạy đồng hồ hệ thống 100Mhz/133Mhz/200Mhz/266Mhz chuyển giao liệu gấp bốn lần chu kì đồng hồ Bộ nhớ đệm theo vết thực thi nhớ đệm L1 tốc độ cao chưa lượng 12K vi hoạt động giải mã Nó di chuyển giải mã tập lệnh từ đường dẫn thực thi chính, làm tăng tốc độ xử lý Trong vấn đề Bus xử lý tốc độ cao đắng kể nhất, mặt kỹ thuật mà nói bus xử lý bus quad-pumped 100MHz, 133MHz, 200MHz hay 266MHz chuyển giao liệu gấp bốn lần chu kỳ (4x) cho tốc độ hiệu dụng 400Mhz, 533Mhz,800Mhz hay 1066Mhz bus dung lượng 64bit (8byte) cho tốc độ lưu lượng 3200MBps, 4266MBps, 6400MBps hay 8532MBps Trong kiến trúc nội đường dẫn 20 tầng hay 30 tầng của pentium tập lệnh đơn bị bả thành nhiều tầng nhỏ so với xử lý trước pentium III, làm cho giống xử lý RISC Khơng may thêm vào số chu kỳ thực thi tập lệnh nếu chúng không tối ưu chô xử lý Một ưu điểm kiến trúc quan trọng khác công nghệ siêu phân luồng, tìm thấy tất cả Pentium 2.4GHz nhanh chạy bus 800MHz hay tất cả Pentium 3.06GHz nhanh chạy bus 533Mhz Siêu phân luồng cho phép xử lý đơn chạy hai luồng thời, hoạt động thế hai xử lý thay Pentium đời đầu sử dụng socket 423 có 423 chân xếp SPGA 39x39 Nhưng phiên bản sau socket 47H, phiên bản hiện dùng socket T (I.GA775) có chân thêm để hỗ trợ tính EM64T ( mở rộng 64 bit), bit vơ hiệu hóa thực thi ( bảo vệ chống tán công của tràn nhớ đệm), cơng nghệ ảo Intel, tính tiên tieean khác Celeron không thiết kế để làm việc socket 423, celeron celeron D có socket 478 hay socket T ( LGA775), cho phép hệ thống hạ giá so với Pentium Bộ chọn điện áp tạo nhờ vào Module điều chỉnh điện áp tự động đặt bo mạch nối đến socket Hyper-Pipelined Technology - Công nghệ Siêu ống Là công nghệ giới thiệu Vi kiến trúc Netburst™ của Intel Nó tăng gấp đôi "độ sâu" của "ống" xử lý lệnh của CPU so sánh với mơ hình Vi kiến trúc P6 sử dụng các thế hệ CPU Pentium III Lệnh thực hiện 20 giai đoạn (20 stages) vi kiến trúc Netburst, so với 10 giai đoạn vi kiến trúc P6 Ống lệnh dài giúp chip Pentium đạt mức xung nhịp cao Execution Trace Cache Là nhớ đệm cấp Bên cạnh 8KB nhớ đệm dùng để chứa liệu , Pentium có khả lưu trữ đến 12K vi lệnh giải mã nhằm giúp tăng cường tốc độ thực thi lệnh của CPU Rapid Execution Engine - Cơ chế thực thi (lệnh) nhanh chóng Điều thực hiện dựa hai Đơn vị Luận lý Số Học thiết kế bên Pentium Nó cho phép Pentium thực hiện các lệnh số học (cộng, trừ, nhân chia) luận lý (And, Or ) với tốc độ gấp lần tần số xử lý bản của xử lý Như CPU Pentium - 2.0Ghz có khả thực hiện các lệnh với tốc độ 4.0Ghz CPU Pentium - 2.53Ghz thực hiện với tốc độ 5.1Ghz Advanced Transfer Cache (ATC) Là nhớ đệm cấp (L2 Cache) thiết kế bên Pentium ATC có hai loại: 512 KB L2 ATC với các tốc độ CPU 2.8Ghz - 2.53Ghz - 2.40Ghz 2.40(B)Ghz -2.26Ghz - 2.20Ghz - 2.0(A)Ghz 1.6(A)Ghz; 256 KB L2 ATC với các tốc độ từ 1.2Ghz - 2.0Ghz ATC cung cấp kênh truyền có thơng lượng cao với nhân của CPU ATC bao gồm giao diện 256-bit (32 byte) để truyền liệu xung clock Điều cho phép ATC (L2 Cache) hỗ trợ tốc độ cao gấp lần tốc độ truyền liệu của L2 Cache sử dụng các CPU Pentium III Ví dụ: CPU Pentium - 2.53Ghz có tốc độ truyền liệu lên tới 81GB/giây, so với tốc độ truyền liệu 16GB/giây của Pentium III - 1.0 Ghz Out-Of-Order Execution Nhân hỗ trợ Out-of-Order Execution xếp lại các vi lệnh, cho phép lệnh (cùng với đầu vào các tài nguyên hệ thống cần thiết) để thực thi tránh lãng phí thời gian Khi vi lệnh chờ cấp phát tài nguyên hoặc liệu, các lệnh khác (thường buffer) chen vào thực thi Nhờ thực thi các lệnh song song, khoảng trễ của pipeline bị loại bỏ Nhân thực thi nhiều lệnh giai đoạn của pipeline Sau in-order retirement unit tìm các lệnh hiện xong khơng cịn phụ thuộc liệu liên quan đến các lệnh rẽ nhánh chưa hoàn thất để xử lý lưu kết quả nhớ theo trật tự ban đầu của Branch Prediction (phỏng đoán nhánh) Kiến trúc NetBurst nhớ các nhánh chương trình chạy, giúp làm giảm độ trễ quá trình nhảy nạp đầy ống lệnh , Các nhánh lưu giữ sở địa lệnh bên Branch Target Buffer (BTB) Bộ vi xử lý dự đoán các nhánh tới trước cả lệnh rẽ nhánh thực hiện Rapid Execution Engine Trong Pentium 4, có ALU hai AGU chạy với mức xung gấp đôi xung clock Rapid execution engine giới thiệu làm giảm độ trễ của việc thực hiện các phép toán đơn giản Điều thực có ý nghĩa hiệu tốc độ của vi xử lý phụ thuộc nhiều vào các tính toán số nguyên ALU Quad Data Rate FSB của Pentium truyền bốn lần liệu xung clock Công nghệ Quad Pumped hay gọi Quad Data Rate (QDR).QDR khiến cho xung nhịp hiệu dụng tăng lên gấp lần so với xung thực Nhờ các CPU Pentium đạt đến 400Mhz System bus, tốc độ truyền nhận liệu vào-ra CPU 3.2GBps so với tốc độ tương ứng 1.06GBps của Pentium III (133Mhz system bus) Real Clock 100MHz 133MHz Performance 400MHz 533MHz Tranfer Rate 3.2GB/s 4.2GB/s 200MHz 266MHz 800MHz 1066MHz 6.4GB/s 8.5GB/s Enhanced Floating Point & Multimedia Unit Bộ xử lý Pentium mở rộng các ghi dấu chấm động lên tới 128bit tạo thêm ghi mở rộng nhằm phục vụ việc di chuyển liệu Do vậy, khả xử lý các ứng dụng dấu chấm động (tính toán kết cấu, số liệu tài chính, số liệu khoa học…) truyền thông đa phương tiện (dựng xử lý phim video, xử lý hình ảnh đồ họa…) tăng cường nhiều 10 Streaming SIMD Extension (SSE2) Instructions Là tập lệnh hỗ trợ đồ họa mở rộng thiết kế cho Pentium Vi kiến trúc Netburst mở rộng khả xử lý theo kiểu cấu trúc SIMD của các cơng nghệ Intel® MMX™ SSE cách thêm vào 144 lệnh Các lệnh bao gồm các tác vụ số nguyên SIMD 128-bit các tác vụ dấu chấm động Các lệnh làm tối ưu hóa khả thực hịên các ứng dụng phim video, xử lý âm - hình ảnh, mã hóa, tính toán khoa học 11 Hyper Threading (siêu phân luồng) Hyper threading công nghệ cho phép CPU vật lý hoạt động hệ điều hành hai CPU logic hoạt động song song Nó dựa nguyên tắc vào thời điểm có phần tài nguyên của CPU sử dụng để thực thi lệnh của tiến trình, phần chưa sử dụng dùng để thực thi các tiến trình khác.Trong các CPU sử dụng công nghệ Hyper-Threading, CPU logic sở hữu tập các ghi, kể cả ghi đếm chương trình PC riêng , CPU vật lý luân phiên các giai đoạn tìm/giải mã hai CPU logic cố gắng thực thi thao tác từ hai chuỗi lệnh đồng thời theo cách hướng tới đơn vị thực thi sử dụng 10 II CẤU TRÚC, CHỨC NĂNG CÁC BỘ PHẬN *Một số điểm đáng ý!!!! Công nghệ Hyper Pipelined với pipeline lên tới 20 stage FSB của Pentium IV có mức xung tối thiểu 400MHz nhờ kỹ thuật QDR (Quad Data Rate), cho phép truyền bốn lần liệu xung clock, nhanh gấp rưỡi system bus 266MHz sử dụng công nghệ Double Data Rate của AMD Nhờ vậy, băng thông lên đến 3.2GB/s Execution Trace Cache: cache lệnh (L1 instruction cache) chuyển từ trước Fetch Unit phía sau Decode Unit có tên “Trace Cache” Có tới 128 ghi, CPU của Intel thuộc thế hệ thứ (như Pentium II , Pentium III) có 40 ghi Advanced Dynamic Execution, nâng cao khả phỏng đoán nhánh thực hiện lệnh không theo thứ tự (out-of-order execution) Rapid Execute Engine, theo ALU của Pentium IV làm việc với xung nhịp gấp đôi xung clock của CPU 11 1.Hyper Pipeline Trong CPU Pentium III pipeline có 10 stage (giai đoạn) Pentium IV có 20 stage Pentium IV với tên mã “Prescott” 90nm chí cịn có tới 31 stage Intel gọi công nghệ siêu ống lệnh (Hyper Pipelined Technology).Việc tăng độ dài pipeline hướng đến mục tiêu tăng xung nhịp Có nhiều giai đoạn đồng nghĩa với các đơn vị chức cấu thành với số lượng transitor Và với transistor dễ dàng nâng cao xung nhịp , bản 20 tầng Pipeline Pentium IV: Stage & - Trace cache next instruction pointer: tìm vi lệnh tiếp theo thực hiện BTB (Branch Target Buffer) Stage & - Trace cache fetch: nạp vi lệnh từ Trace Cache Stage - Drive: gửi vi lệnh đến resource allocator mạch RAT Stage - Allocate: kiểm tra tài nguyên CPU cần thiết cho việc thực hiện lệnh Ví dụ nhớ dùng làm đệm Stages & - Rename: nếu chương trình sử dụng tám ghi chuẩn x86 đổi tên thành 128 thành ghi của Pentium IV Stage - Queue: các vi lệnh đưa vào các hàng đợi dành riêng cho từng loại (ví dụ: truy cập nhớ, xử lý số nguyên hay dấu chấm động …) Lệnh nằm yên hàng đợi cho đến có chỗ trống tương ứng xuất hiện scheduler Stages 10, 11, 12 - Schedule: scheduler xếp lại các lệnh nhằm giữ cho 12 execution unit hoạt động Ví dụ, nếu đơn vị xử lý dấu chấm động rảnh rỗi, scheduler lấy lệnh xử lý dấu chấm động để gửi cho đơn vị đó, mặc dù lệnh tiếp theo chương trình lệnh xử lý số nguyên Stages 13 & 14 - Dispatch: gửi vi lệnh tới Execution Unit tương ứng Stages 15 & 16 - Register Files: đọc register file Stage 17 - Execute: vi lệnh thực hiện Stage 18 - Flags: cờ của vi lệnh cập nhật Stage 19 - Branch Check: kiểm tra nhánh của chương trình có với suy đoán của mạch dự đoán rẽ nhánh hay không Stage 20 - Drive: gửi kết quả của việc kiểm tra tới Branch Target Buffer (BTB) Mặc dù lý thuyết, pipeline dài làm tăng hiệu năng, nhiên, bất chấp điều có quá nhiều stage khiến cho thời gian thực hiện lệnh dài Thứ hai, pipeline dài trở nên hiệu quả trường hợp phỏng đoán nhánh sai (branch prediction error) Sẽ nhiều thời gian để lấp đầy pipeline lần Intel triển khai vài biện pháp để bù lại mát hiệu trường hợp này, Execution Trace Cache Dynamic Execution Engine Thực tế Pentium IV nhanh Pentium III nhờ hoạt động mức xung nhịp cao Với mức xung nhịp, CPU Pentium III nhanh CPU Pentium IV nhờ kích thước pipeline của Bởi hiệu quả của pipeline kiến trúc Netburst, thế hệ vi xử lý thứ của Intel (vi kiến trúc Core) quay trở lại với kiến trúc của Pentium M, kiến trúc dựa tảng của kiến trúc thế hệ thứ thay tiếp tục phát triển thế hệ thứ (Netburst) 2.Bộ Nhớ Đệm a Advanced transfer cache Cache L2 của Pentium kết nối với cache liệu L1 qua bus có độ rộng 256bit Trong các thế hệ vi xử lí trước của Intel độ rộng 64-bit Với m ột vài phép toán đơn giản ta thấy băng thông cache L2 nhân 44.8GB/s với Pentium 13 mức xung 1.4 GHz 48GB/s với Pentium mức xung 1.5 GHz, nhanh gấp lần so với thế hệ trước với xung nhịp b Execution trace cache Cache lệnh chuyển từ trước Fetch Unit phía sau Decode Unit có tên gọi "Trace Cache " Do thay lưu trữ vi lệnh để chuẩn bị nạp Fetch Unit Trace Cache lưu trữ vi lệnh giải mã nhờ Decode Unit Trace Cache lưu trữ 12K vi lệnh, vi lệnh Pentium IV có độ rộng 100bit nên Trace Cache có dung lượng 150KB (12288 x 100 /8).Ý tưởng đằng sau cách kiến trúc để tối ưu vịng lặp bên các chương trình Khi lệnh thực thi nhiều lần , vi lệnh giải mã sẵn lưu Trace Cache, không cần giải mã lại nhiều lần các VXL thế hệ trước.Giống Fetch Unit, Trace Cache có Branch Target Buffer (BTB) lên tới 4K vi lệnh Trong CPU của Intel thế hệ thứ 6, Pentium III, đệm có 512 vi lệnh thế hệ thứ 5, xử lý Pentium có 256 vi lệnh 3.Bộ giải mã - Decoder Từ thế hệ thứ 6, CPU của Intel dùng kiến trúc tập lệnh lai CISC/RISC Bộ vi xử lí phải chấp nhận các lệnh CISC (Complex Instruction Set Computer), biết tập lệnh của x86 Ngày hầu hết phần mềm sử dụng tập lệnh Những vi xử lí sử dụng tập lệnh RISC (Reduced Instruction Set Computer) khơng thể chạy chương trình thơng dụng như: Windows, Office Do các CPU hiện thị trường của cả Intel, AMD sử dụng giải mã CISC / RISC Bên CPU xử lí lệnh kiểu RISC lại chấp nhận lệnh CISC đầu vào Những lệnh CISC x86 gọi chung lệnh , lệnh RISC bên gọi các vi lệnh Những vi lệnh RISC sử dụng trực tiếp chương trình phải sử dụng tập lệnh CISC giải mã qua giải mã Mỗi CPU sử dụng tập lệnh RISC riêng khơng cơng bố rộng rãi khơng tương thích với vi lệnh của CPU khác Ví dụ vi lệnh của Pentium III khác với vi lệnh của Pentium IV , khác với vi lệnh của Athlon 64 Tuỳ theo tính phức tạp của lệnh x86 mà decode thành số lệnh RISC Bộ giải mã của Pentium IV giải mã lệnh x86 xung clock thông thường lệnh x86 giải mã cần vi lệnh Nếu lệnh x86 phức tạp nhiều vi lệnh, định hướng nhớ ROM 14 “Microcode ROM” gọi MIS (Microcode Instruction Sequencer) lưu danh sách tất cả các lệnh mô tả các vi lệnh tương ứng dịch 4.Allocator Register Renamer Trong giai đoạn alloc, allocator sẽ: Dành 126 reorder buffers (ROB) cho vi lệnh hiện thời Nó cho phép thực hiện vi lệnh khơng theo thứ tự , CPU đặt chúng trở lại thứ tự cũ sử dụng bảng Dành 128 register files để lưu trữ kết quả liệu từ xử lí vi lệnh Nếu vi lệnh nạp (LOAD) hoặc ghi (STORE), có nghĩa đọc hoặc viết liệu nhớ RAM, dành số 48 đệm nạp (Load Buffers -LB) hoặc 24 đệm lưu trữ (Store Buffers - SB)tương ứng Dành đầu vào nhớ hoặc hàng đợi, tuỳ thuộc vào từng vi lệnh Tập lệnh CISC x86 có 08 ghi 32-bit (EAX, EBX, ECX, EDX, EBP, ESI, EDI ESP) Số đơn giản quá ít, đặc biệt CPU thực thi theo kiểu out-of-order Do đó, CPU phải đổi tên nội dung của ghi sử dụng chương trình thành 128 ghi của CPU , điều cho phép lệnh sử dụng ghi chạy đồng thời Thậm trí out -of-order, có nghĩa cho phép lệnh thứ hai chạy trước lệnh thứ cả chúng sử dụng ghi Chúng ta cần ý Pentium IV thực có tới 256 ghi: 128 cho lệnh số nguyên 128 ghi cho lệnh dấu chấm động lệnh SSE Renamer của Pentium IV có khả xử lí ba vi lệnh xung clock Sau từ renamer vi lệnh tới hàng đợi 5.Scheduler Scheduler trái tim của hệ thống out-of-order Pentium IV Mục đính của Scheduler giữ cho execution unit CPU luôn làm việc Các vi lệnh tới scheduler phân tích đặt vào bốn scheduler unit tùy theo kiểu của vi lệnh: Memory scheduler unit: cho vi lệnh liên quan đến nhớ Những vi lệnh đến từ hàng đợi của các vi lệnh nhớ (memory microinstruction queue) Fast scheduler unit: cho vi lệnh đơn giản Slow / General FP scheduler unit: cho vi lệnh khác vi lệnh xử lý dấu chấm động phức tạp 15 Simple FP scheduler unit: cho vi lệnh dấu chấm động đơn giản.Scheduler xếp vi lệnh theo kiểu của chúng Sau gửi vi lệnh trực tiếp tới Execution Unit tương ứng để xử lí 6.Execution Unit Như đề cập, Pentium IV có bốn cổng gửi đánh số từ tới Mỗi cổng nối tới một, hai hoặc ba đơn vị thực thi (execution unit) Pentium IV có 05 execution unit làm việc song song (02 FPU cho số dấu chấm động , 03 ALU cho số nguyên) thêm 02 AGU để đọc ghi liệu vào nhớ RAM Phần của Rapid Execution Engine các rapid execution unit, bao gồm hai ALU hai AGU Các vi lệnh đơn giản thực thi đơn vị nửa xung clock , lệnh dịch xoay thực thi các rapid execution unit gửi đến “Slow ALU” Cổng gửi hai vi lệnh xung clock tới rapid execution ALU, số lượng tối đa các vi lệnh chuyển xung clock 6: Hai vi lệnh cho cổng Hai vi lệnh cho cổng Một vi lệnh cho cổng Một vi lệnh cho cổng Một điều cần nhớ lệnh phức tạp cần đến vài xung clock để xử lí Ví dụ cổng số 1, có đơn vị xử lý dấu chấm động Trong đơn vị xử lý lệnh phức tạp vài xung clock, cổng vẫn tiếp tục nhận các lệnh đơn giản chuyển đến ALU FPU bận Nếu để ý chút, ta thấy Intel đặt vào cổng fast unit complex (slow) unit Khi complex unit cịn bận tính toán, đơn vị cịn lại tiếp tục nhận vi lệnh từ cổng tương ứng Nên, mặc dù tối đa có lệnh chuyển, thực CPU có đến lệnh xử lý lúc 16 III Tập Lệnh Khn dạng lệnh P4 Các nhóm lệnh: General Pupose (Nhóm lệnh chung) System Instructions (Các lệnh hệ thống) x87 FPU x87 FPU SIMD Công nghệ MMX SSE SSE2 SSE3 IA-32e: 64-Bit Mode (chế độ 64 bit) C KẾT LUẬN Intel đưa Pentium nhằm tập trung vào tốc độ xung nhịp cao với thiết kế pipeline dài Tuy cách làm tạo tốc độ cao 17 đồng nghĩa với hiệu suất làm việc lại giảm việc thực hiện lệnh cần quá nhiều giai đoạn CPU pentium thường có xung nhịp cao CPU của AMD, lại không nhanh kiểm nghiệm Benchmark Điều khiến người dùng có khuynh hướng lựa chọn vi xử lí Penti um theo họ vi xử lí có tốc độ cao chạy hiệu quả hơn, mặc dù điều khơng phải Trong cơng nghệ HyperThreading (HT) giới thiệu vào giai đoạn của Pentium lại thành cơng khía cạnh … marketing Lợi ích mà HT đem lại thấp (và đơi cịn khơng dùng HT) Trên thực tế, nếu người dùng phổ thơng kích hoạt tính “siêu luồng” máy tính desktop của , họ ch ng ngoại trừ phải trả giá việc giảm tốc độ tới 10%.Tuy nhiên Pentium khơng có nhược điểm Với tập lệnh SSE2 SSE3 công nghệ hàng đầu Quad Data Rate, Trace Cache, Rapid Execution Engine, Dual Channel Memory, Pentium tỏ xuất sắc các ứng dụng từ văn phòng tới multimedia Người dùng các ứng dụng tính toán phức tạp (kiểu rendering của Maya, 3DS) hưởng lợi nhiều từ HyperThreading Và card đồ họa 3D ngày trở nên mạnh mẽ, chip P4 đem đến tảng tuyệt vời cho các game thủ Đặc biệt giới overclock quan tâm tới nhân Northwood phát hành năm 2002 Với bo mạch chủ RAM đủ mạnh, cả người tập overclock đạt tới 1GHz sử dụng giải pháp tản nhiệt thông thường Mục Lục Trường đại học công nghiệp Hà nội .1 ĐỀ TÀI Báo cáo tập lớn mơn học: Kiến trúc Máy tính Nhóm thực hiện: Nhóm 3–Lớp KTPM3-K9 Giáo viên hướng dẫn: Nguyễn Thanh Hải .2 Mở đầu Nhiệm vụ của 2 Bố cục Nội dung 18 A.Lịch sử phát triển của VXL Pentium IV *Những điểm kĩ thuật của Pentium bao gồm: B Nội dung trọng tâm I Các công nghệ Hyper-Pipelined Technology - Công nghệ Siêu ống Execution Trace Cache Rapid Execution Engine - Cơ chế thực thi (lệnh) nhanh chóng .9 Advanced Transfer Cache (ATC) .9 Out-Of-Order Execution Branch Prediction (phỏng đoán nhánh) Rapid Execution Engine 10 Quad Data Rate 10 Enhanced Floating Point & Multimedia Unit 10 10 Streaming SIMD Extension (SSE2) Instructions 10 11 Hyper Threading (siêu phân luồng) 11 II CẤU TRÚC, CHỨC NĂNG CÁC BỘ PHẬN 11 *Một số điểm đáng ý!!!! 11 1.Hyper Pipeline 12 2.Bộ Nhớ Đệm 14 3.Bộ giải mã - Decoder .14 4.Allocator Register Renamer 15 5.Scheduler 16 6.Execution Unit 16 III Tập Lệnh 17 Khuôn dạng lệnh P4 17 C KẾT LUẬN 18 19 ... lệnh Trong CPU của Intel thế hệ thứ 6, Pentium III, đệm có 512 vi lệnh thế hệ thứ 5, xử lý Pentium có 256 vi lệnh 3.Bộ giải mã - Decoder Từ thế hệ thứ 6, CPU của Intel dùng kiến... thị Quyên Giáo vi? ?n hướng dẫn: Nguyễn Thanh Hải (GV Kiến Trúc Máy Tính) Hà Nội ,ngày tháng 11 năm 2015 Mở đầu Nhiệm vụ Nghiên cứu tìm hiểu thế hệ vi xử lý InTel Pentium IV Bố cục *... VXL Pentium IV Pentium vi xử lý kiến trúc x86 thế hệ thứ Intel sản xuất, thiết kế CPU hoàn toàn của họ kể từ Pentium III năm 1995 Thiết kế gọi kiến trúc NetBurst Không Pentium II, Pentium