Nghiên cứu tìm hiểu về thế hệ vi xử lý intel pentium IV

19 6 0
Nghiên cứu tìm hiểu về thế hệ vi xử lý intel pentium IV

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Trường đại học công nghiệp Hà nội Khoa Công Nghê Thông Tin - - BÀI TIỂU LUẬN MÔN HỌC: KIẾN TRÚC MÁY TÍNH ĐÊ TÀI: Nghiên cứu tìm hiểu thê hệ vi xư ly InTel Pentium IV Giáo viên hướng dẫn: Nguyễn Thanh Hải Lớp: Đại học KTPM3-K9 Nhóm sô: Ha Nội, tháng 11 năm 2015 Trường đại học công nghiêp Hà nội Khoa Công Nghê Thông Tin Báo cáo bai tập lớn mơn học: Kiến trúc Máy tính ĐÊ TÀI: Nghiên cứu tìm hiểu thê hệ vi xư ly InTel Pentium IV Nhóm thực hiện: Nhóm 3–Lớp KTPM3-K9 Thành viên nhóm: Leo thị lan Hương Trần hải Linh Nguyễn thị Nga Nguyễn thị Nhã Trần thị Quyên Giáo viên hướng dẫn: Nguyễn Thanh Hải (GV Kiên Trúc Máy Tính) Ha Nợi ,ngay tháng 11 năm 2015  Mở đầu Nhiệm vụ Nghiên cứu tìm hiểu thê vi xư ly InTel Pentium IV Bố cục * Lịch sư phát triển của VXL Pentium IV : - Hoàn cảnh đời của VXL Pentium IV - Đặc trưng công nghê chung của VXL Pentium IV * Đặc trưng công nghê chi tiêt của từng loại biên thể (version) của VXL Pentium IV  Nội dung A.Lịch sư phát triển của VXL Pentium IV Pentium vi xư ly kiên trúc x86 thê thứ Intel sản xuất, thiêt kê CPU hoàn toàn của họ kể từ Pentium III năm 1995 Thiêt kê gọi kiên trúc NetBurst Không Pentium II, Pentium III, các loại Celeron khác nhau, kiên trúc khác tạo hoàn tồn thừa kê từ thiêt kê Pentium Pro/P6 Bộ vi xư ly Pentium đầu tiên, mã hiêu "Willamette", chạy với tốc độ 1.4 1.5 GHz phát hành vào tháng 11 năm 2000 Socket 423, sau chạy với tốc độ từ 1.5 GHz tới GHz Socket 478 Được ghi nhận với đời của Pentium bus FSB(Front side bus) nhanh với tốc độ 400 MT/s Khi đó, chip AMD Athlon chạy với tốc độ 266 MT/s Pentium Dòng vi xư ly Pentium kêt thúc vào ngày 27 tháng năm 2006, thay thể dòng Intel Core - dòng sư dụng nhân Produced From 2000 to 2008 Max 1.30 GHz to 3.80 GHz "Conroe" Pentium sản xuất vào tháng 11 năm 2011 speeds giới thiêu vi xư ly thê 400 MT/s to 1066 MT/s (), , ,, , Nêu vi xư ly đặt số thay tên gọi 786 đại diên cho thê sau xư ly 686 Vài hình thức khác của Pentium mắt công Transistors chúng dựa kiên trúc khuôn xư ly dựa các nhân Willametter, Northwood Prescott Socket(s) Predecessor Successor 42M 180nm 55M 130nm 169M 130nm (P4EE) 125M 90nm 188M 65nm Một số công nghê bật áp dụng kiên trúc NetBurst Hyper Pipelined Technology(Công nghê siêu ống) mở rộng số hàng lênh xư ly, làm hiêu suất máy tăng 30% Execution Trace Cache tránh tình trạng lênh bị chậm trễ chuyển từ nhớ dên CPU, Rapid Execution Engine tang tốc đồng xư ly toán học, bus thống (system bus) 400 MHz 533 MHz; các công nghê Advanced Transfer Cache, Advanced Dynamic Execution, Enhanced Floating point Multimedia Unit, Streaming SIMD Extensions (SSE2) cải tiên nhằm tạo BXL tốc độ cao hơn, khả tính toán mạnh hơn, xư ly đa phương tiên tốt Ghi nhận với đời của Pentium công nghê Quad Data Rate cho phép FSB (Front Side Bus) đạt đên tốc độ 400 MHz Khi đó, chip AMD Athlon chạy với tốc độ FSB 266 MHz (công nghê Double Data Rate) Bộ vi xư lí Pentium IV có đên 42 triêu Tranzito,kích thước chêt của 217 mm2,cơng suất tiêu thụ 55 W làm viêc mức 1,5GHz.Tốc độ bus thống 3,2 GB/s , cao thời diểm Bảng: So sánh hiệu suất Pentium Pentium Bảng so sánh hiêu suất của Pentium IV 1,5GHz Petium III 1,0 GHz.Rõ ràng ta thấy tính vượt trội dành cho Pentium IV.Các ứng dụng số nguyên cao 15-20 %,trong Ứng dụng dấu chấm động multimedia lên tới 30-70% Pentium (tên mã Willamette) xuất hiên cuối năm 2000 đặt dấu chấm hêt cho “triều đại” Pentium III Willamette xuất sản xuất công nghê 0,18 có 42 triêu transistor(nhiều gần 50% so với Pentium III),bus thống (system bus) 400 MHz,bộ nhớ đêm tích hợp L2 256 KB,socket 423 478 , Socket 423 xuất hiên khoảng thời gian ngắn, từ tháng 11 năm 2000 đên tháng năm 2001 bị thay thê socket 478 P4 Willamette có tốc độ 1.3, 1.4, 1.5, 1.6, 1.7, 1.8, 1.9 , 2.0 GHz P4 Northwood xuất hiên vào tháng năm 2002,được sản xuất cơng nghê 0,13, có khoảng 55 triêu transistor,bộ nhớ đêm tích hợp L2 512 KB,socket 478.Northwood có dịng gồm Northwood A(system bus 400 MHz),tốc độ 1.6, 1.8, 2.0, 2.2, 2.4, 2.5, 2.6, 2.8 GHz.Northwoood B(system bus 533 MHz) tốc độ 2.26, 2.4, 2.53, 2.66, 2.8, 3.06 GHz(riêng 3.06 GHz có hỗ trợ cơng nghê siêu phân luồng Hyper Threading-HT).Northwood C (system bus 800 MHz,tất cả hỗ trợ HT),gồm 2.4,2.6, 3.0, 3.2, 3.4 GHz P4 Prescott (năm 2004).Là BXL sản xuất theo công nghê 90nm,kích thước vi mạch giảm 50% so với P4 Willamette.Điều cho phép tích hợp nhiều transistor kích thước (125 triêu transistor so với 55 triêu transistor của P4 Northwood),tốc độ chuyển đổi của transistor nhanh hơn,tăng khả xư ly,tính toán.Dung lượng nhớ đêm tích hợp L2 của P4 Prescott gấp đơi so với P4 Northwood(1MB so với 512KB).Ngoài tập lênh MMX,SSE,SSE2,Prescott bổ sung tập lênh SSE3 giúp các ứng dụng xư ly video game chạy nhanh hơn.Đây giai đoạn “giao thời ” socket 478775LGA,system bus 533 MHz-800MHz sản phẩm đặt tên khiên người dùng bối rối chọn mua Prescott A(FSB 533MHz)có các tốc độ 2.4, 2.26, 2.8 (socket 478),Prescott 505 (2,66GHz), 505J(2.66 GHz),506 (2,66 GHz), 511 (2,8GHz), 515J (2,93GHz), 516 (2,93GHz) , 519J (3,06GHz), 519 J(3,06GHz) sư dụng socket 775LGA Prescott E,F (năm 2004) có nhớ đêm L2 1MB(các phiên bản sau mở rộng 2MB),bus thống 800 MHz.Ngoài tập lênh MMX,SSE2,SSE3 tích hợp, Prescott E,F cịn hỗ trợ cơng nghê siêu phân luồng,một số phiên bản sau có hỗ trợ tính toán 64 bit Dòng sư dụng socket 478 gồm Pentium HT 2.8E (2,8GHz), 3.0E (3,0 GHz), 3.2E (3,2 GHz), 3.4E(3,4 GHz).Dòng sư dụng socket 775LGA gồm Pentium 4HT 3.2F, 3.4F, 3.6F, 3.8F, với các tốc độ tương ứng từ 3,2 GHz.Pentium HT 517,520,520J,521,524,530,530J,531,540,540J,541,550,560,560J,561,570J,571 với các tốc độ từ 2.8 GHz đên 3,8 GHz *Những điểm kĩ thuật của Pentium bao gồm:  Tốc độ từ 1.3GHz đên 3.8GHz  phần mềm tương thích với xư ly Intel 32 bit trước  Một số phiên bản hỗ trợ EM64T  Bus xư ly (font-side) chạy 400MHz, 533Mhz, SOOMHz hay 1066MHz  Những logic số học (ALUs) chạy gấp hai lần tần số nhân xư ly  Công nghê siêu dẫn đường (20-30 tầng)  Công nghê siêu phân luồng hỗ trợ tất cả xư ly 2.4GHz nhanh chạy Bus 800MHz, tất cả xư ly 3.06GHz nhanh chạy Bus 533MHz  Thực thi tập lênh lênh chuyên nghiêp  Bộ dự đoán phụ mở rộng  Bộ nhớ đêm LI 8KB ha>16KB cộng với nhớ đêm theo vêt thực thi vi lênh 12k  Bộ nhớ đêm L2 56bit khuôn tốc độ nhân 256KB, 512KB, 1MB hoặc 2MB kêt hợp đường  Bộ nhớ đêm L3 tốc độ nhân 2MB tích hợp khuôn  SSE2-SSE cộng với 144 tập lênh chưa xư ly âm đồ họa B Nội dung trọng tâm I Các công nghê Khả cung cấp số công nghê các tính tăng cường dựa vào các tiên của Intel lĩnh vực thiêt kê mạch, quản ly viêc tiêu thụ lượng tính toán khơng thể thực hiên các mơ hình vi kiên trúc của các thê CPU trước Bộ dấu chấm động mở rộng Có nhiều trạng thái lượng thấp Intel bỏ số La Mã định 4, số Ả-rập tiêu chuẩn Pentium Bên pentium có kiên trúc mà Intel gọi vi kiên trúc NetBurst, thuật ngữ thị trường không phải thuật ngữ kĩ thuật Intel dùng NetBurst để thí nghiêm cơng nghê siêu đường dẫn, máy thực thi nhanh, bus thống tốc độ cao (400MHz, 533MHz, 800MHz 1066MHz) nhớ đêm theo vêt thực thi Công nghê siêu đường dẫn làm tăng gấp đôi hay gấp ba lần độ sâu đường dẫn tập lênh so với Pentium III ( hay Athlon/Athlon 64) nghĩa nhiều bước nhỏ yêu cầu để thực thi tập lênh Mặc dù điều dường hữu hiêu, cho phét đạt tới xung cao nhiều Bộ máy thực thi nhanh cho phép hai logic số nguyên ( ALUs) chạy gấp đôi tần số nhanh xư ly có nghĩa có tập lênh thực thi chu kỳ đồng hổ.Bus thống 400MHz/533MHz/800Mhz/1066Mhz bus quad-pumped chạy đồng hồ thống 100Mhz/133Mhz/200Mhz/266Mhz chuyển giao liêu gấp bốn lần chu kì đồng hồ Bộ nhớ đêm theo vêt thực thi nhớ đêm L1 tốc độ cao chưa lượng 12K vi hoạt động giải mã Nó di chuyển giải mã tập lênh từ đường dẫn thực thi chính, làm tăng tốc độ xư ly Trong vấn đề Bus xư ly tốc độ cao đắng kể nhất, mặt kỹ thuật mà nói bus xư ly bus quad-pumped 100MHz, 133MHz, 200MHz hay 266MHz chuyển giao liêu gấp bốn lần chu kỳ (4x) cho tốc độ hiêu dụng 400Mhz, 533Mhz,800Mhz hay 1066Mhz bus dung lượng 64bit (8byte) cho tốc độ lưu lượng 3200MBps, 4266MBps, 6400MBps hay 8532MBps Trong kiên trúc nội đường dẫn 20 tầng hay 30 tầng của pentium tập lênh đơn bị bả thành nhiều tầng nhỏ so với xư ly trước pentium III, làm cho giống xư ly RISC Khơng may thêm vào số chu kỳ thực thi tập lênh nêu chúng không tối ưu chô xư ly Một ưu điểm kiên trúc quan trọng khác công nghê siêu phân luồng, tìm thấy tất cả Pentium 2.4GHz nhanh chạy bus 800MHz hay tất cả Pentium 3.06GHz nhanh chạy bus 533Mhz Siêu phân luồng cho phép xư ly đơn chạy hai luồng thời, hoạt động thê hai xư ly thay Pentium đời đầu sư dụng socket 423 có 423 chân xêp SPGA 39x39 Nhưng phiên bản sau socket 47H, phiên bản hiên dùng socket T (I.GA775) có chân thêm để hỗ trợ tính EM64T ( mở rộng 64 bit), bit vô hiêu hóa thực thi ( bảo vê chống tán công của tràn nhớ đêm), công nghê ảo Intel, tính tiên tieean khác Celeron khơng thiêt kê để làm viêc socket 423, celeron celeron D có socket 478 hay socket T ( LGA775), cho phép thống hạ giá so với Pentium Bộ chọn điên áp tạo nhờ vào Module điều chỉnh điên áp tự động đặt bo mạch nối đên socket Hyper-Pipelined Technology - Công nghê Siêu ống Là công nghê giới thiêu Vi kiên trúc Netburst™ của Intel Nó tăng gấp đơi "độ sâu" của "ống" xư ly lênh của CPU so sánh với mơ hình Vi kiên trúc P6 sư dụng các thê CPU Pentium III Lênh thực hiên 20 giai đoạn (20 stages) vi kiên trúc Netburst, so với 10 giai đoạn vi kiên trúc P6 Ống lênh dài giúp chip Pentium đạt mức xung nhịp cao Execution Trace Cache Là nhớ đêm cấp Bên cạnh 8KB nhớ đêm dùng để chứa liêu , Pentium có khả lưu trữ đên 12K vi lênh giải mã nhằm giúp tăng cường tốc độ thực thi lênh của CPU Rapid Execution Engine - Cơ chê thực thi (lênh) nhanh chóng Điều thực hiên dựa hai Đơn vị Luận ly Số Học thiêt kê bên Pentium Nó cho phép Pentium thực hiên các lênh số học (cộng, trừ, nhân chia) luận ly (And, Or ) với tốc độ gấp lần tần số xư ly bản của xư ly Như CPU Pentium - 2.0Ghz có khả thực hiên các lênh với tốc độ 4.0Ghz CPU Pentium - 2.53Ghz thực hiên với tốc độ 5.1Ghz Advanced Transfer Cache (ATC) Là nhớ đêm cấp (L2 Cache) thiêt kê bên Pentium ATC có hai loại: 512 KB L2 ATC với các tốc độ CPU 2.8Ghz - 2.53Ghz - 2.40Ghz 2.40(B)Ghz -2.26Ghz - 2.20Ghz - 2.0(A)Ghz 1.6(A)Ghz; 256 KB L2 ATC với các tốc độ từ 1.2Ghz - 2.0Ghz ATC cung cấp kênh truyền có thơng lượng cao với nhân của CPU ATC bao gồm giao diên 256-bit (32 byte) để truyền liêu xung clock Điều cho phép ATC (L2 Cache) hỗ trợ tốc độ cao gấp lần tốc độ truyền liêu của L2 Cache sư dụng các CPU Pentium III Ví dụ: CPU Pentium - 2.53Ghz có tốc độ truyền liêu lên tới 81GB/giây, so với tốc độ truyền liêu 16GB/giây của Pentium III - 1.0 Ghz Out-Of-Order Execution Nhân hỗ trợ Out-of-Order Execution xêp lại các vi lênh, cho phép lênh (cùng với đầu vào các tài nguyên thống cần thiêt) để thực thi tránh lãng phí thời gian Khi vi lênh chờ cấp phát tài nguyên hoặc liêu, các lênh khác (thường buffer) chen vào thực thi Nhờ thực thi các lênh song song, khoảng trễ của pipeline bị loại bỏ Nhân thực thi nhiều lênh giai đoạn của pipeline Sau in-order retirement unit tìm các lênh hiên xong khơng cịn phụ thuộc liêu liên quan đên các lênh rẽ nhánh chưa hoàn thất để xư ly lưu kêt quả nhớ theo trật tự ban đầu của Branch Prediction (phỏng đoán nhánh) Kiên trúc NetBurst nhớ các nhánh chương trình chạy, giúp làm giảm độ trễ quá trình nhảy nạp đầy ống lênh , Các nhánh lưu giữ sở địa lênh bên Branch Target Buffer (BTB) Bộ vi xư ly dự đoán các nhánh tới trước cả lênh rẽ nhánh thực hiên Rapid Execution Engine Trong Pentium 4, có ALU hai AGU chạy với mức xung gấp đôi xung clock Rapid execution engine giới thiêu làm giảm độ trễ của viêc thực hiên các phép toán đơn giản Điều thực có y nghĩa hiêu tốc độ của vi xư ly phụ thuộc nhiều vào các tính toán số nguyên ALU Quad Data Rate FSB của Pentium truyền bốn lần liêu xung clock Công nghê Quad Pumped hay gọi Quad Data Rate (QDR).QDR khiên cho xung nhịp hiêu dụng tăng lên gấp lần so với xung thực Nhờ các CPU Pentium đạt đên 400Mhz System bus, tốc độ truyền nhận liêu vào-ra CPU 3.2GBps so với tốc độ tương ứng 1.06GBps của Pentium III (133Mhz system bus) Real Clock Performance Tranfer Rate 100MHz 400MHz 3.2GB/s 133MHz 533MHz 4.2GB/s 200MHz 800MHz 6.4GB/s 266MHz 1066MHz 8.5GB/s Enhanced Floating Point & Multimedia Unit Bộ xư ly Pentium mở rộng các ghi dấu chấm động lên tới 128bit tạo thêm ghi mở rộng nhằm phục vụ viêc di chuyển liêu Do vậy, khả xư ly các ứng dụng dấu chấm động (tính toán kêt cấu, số liêu tài chính, số liêu khoa học…) truyền thơng đa phương tiên (dựng xư ly phim video, xư ly hình ảnh đồ họa…) tăng cường nhiều 10 Streaming SIMD Extension (SSE2) Instructions Là tập lênh hỗ trợ đồ họa mở rộng thiêt kê cho Pentium Vi kiên trúc Netburst mở rộng khả xư ly theo kiểu cấu trúc SIMD của các cơng nghê Intel® MMX™ SSE cách thêm vào 144 lênh Các lênh bao gồm các tác vụ số nguyên SIMD 128-bit các tác vụ dấu chấm động Các lênh làm tối ưu hóa khả thực hịên các ứng dụng phim video, xư ly âm - hình ảnh, mã hóa, tính toán khoa học 11 Hyper Threading (siêu phân luồng) Hyper threading công nghê cho phép CPU vật ly hoạt động điều hành hai CPU logic hoạt động song song Nó dựa nguyên tắc vào thời điểm có phần tài nguyên của CPU sư dụng để thực thi lênh của tiên trình, phần chưa sư dụng dùng để thực thi các tiên trình khác.Trong các CPU sư dụng công nghê Hyper-Threading, CPU logic sở hữu tập các ghi, kể cả ghi đêm chương trình PC riêng , CPU vật ly luân phiên các giai đoạn tìm/giải mã hai CPU logic cố gắng thực thi thao tác từ hai chuỗi lênh đồng thời theo cách hướng tới đơn vị thực thi sư dụng II CẤU TRÚC, CHỨC NĂNG CÁC BÔ PHẬN *Một số điểm đáng y!!!!  Công nghê Hyper Pipelined với pipeline lên tới 20 stage FSB của Pentium IV có mức xung tối thiểu 400MHz nhờ kỹ thuật QDR (Quad Data Rate), cho phép truyền bốn lần liêu xung clock, nhanh gấp rưỡi system bus 266MHz sư dụng công nghê Double Data Rate của AMD Nhờ vậy, băng thông lên đên 3.2GB/s  Execution Trace Cache: cache lênh (L1 instruction cache) chuyển từ trước Fetch Unit phía sau Decode Unit có tên “Trace Cache”  Có tới 128 ghi, CPU của Intel thuộc thê thứ (như Pentium II , Pentium III) có 40 ghi  Advanced Dynamic Execution, nâng cao khả phỏng đoán nhánh thực hiên lênh không theo thứ tự (out-of-order execution)  Rapid Execute Engine, theo ALU của Pentium IV làm viêc với xung nhịp gấp đôi xung clock của CPU Hyper Pipeline Trong CPU Pentium III pipeline có 10 stage (giai đoạn) Pentium IV có 20 stage Pentium IV với tên mã “Prescott” 90nm chí cịn có tới 31 stage Intel gọi cơng nghê siêu ống lênh (Hyper Pipelined Technology).Viêc tăng độ dài pipeline hướng đên mục tiêu tăng xung nhịp Có nhiều giai đoạn đồng nghĩa với các đơn vị chức cấu thành với số lượng transitor Và với transistor dễ dàng nâng cao xung nhịp , bản 20 tầng Pipeline Pentium IV:  Stage & - Trace cache next instruction pointer: tìm vi lênh tiêp theo thực hiên BTB (Branch Target Buffer)  Stage & - Trace cache fetch: nạp vi lênh từ Trace Cache  Stage - Drive: gưi vi lênh đên resource allocator mạch RAT  Stage - Allocate: kiểm tra tài nguyên CPU cần thiêt cho viêc thực hiên lênh Ví dụ nhớ dùng làm đêm  Stages & - Rename: nêu chương trình sư dụng tám ghi chuẩn x86 đổi tên thành 128 thành ghi của Pentium IV  Stage - Queue: các vi lênh đưa vào các hàng đợi dành riêng cho từng loại (ví dụ: truy cập nhớ, xư ly số nguyên hay dấu chấm động …) Lênh nằm yên hàng đợi cho đên có chỗ trống tương ứng xuất hiên scheduler  Stages 10, 11, 12 - Schedule: scheduler xêp lại các lênh nhằm giữ cho execution unit hoạt động Ví dụ, nêu đơn vị xư ly dấu chấm động rảnh rỗi, scheduler lấy lênh xư ly dấu chấm động để gưi cho đơn vị đó, mặc dù lênh tiêp theo chương trình lênh xư ly số nguyên 12 Stages 13 & 14 - Dispatch: gưi vi lênh tới Execution Unit tương ứng Stages 15 & 16 - Register Files: đọc register file Stage 17 - Execute: vi lênh thực hiên Stage 18 - Flags: cờ của vi lênh cập nhật Stage 19 - Branch Check: kiểm tra nhánh của chương trình có với suy đoán của mạch dự đoán rẽ nhánh hay không  Stage 20 - Drive: gưi kêt quả của viêc kiểm tra tới Branch Target Buffer (BTB)      Mặc dù ly thuyêt, pipeline dài làm tăng hiêu năng, nhiên, bất chấp điều có quá nhiều stage khiên cho thời gian thực hiên lênh dài Thứ hai, pipeline dài trở nên hiêu quả trường hợp phỏng đoán nhánh sai (branch prediction error) Sẽ nhiều thời gian để lấp đầy pipeline lần Intel triển khai vài biên pháp để bù lại mát hiêu trường hợp này, Execution Trace Cache Dynamic Execution Engine Thực tê Pentium IV nhanh Pentium III nhờ hoạt động mức xung nhịp cao Với mức xung nhịp, CPU Pentium III nhanh CPU Pentium IV nhờ kích thước pipeline của Bởi hiêu quả của pipeline kiên trúc Netburst, thê vi xư ly thứ của Intel (vi kiên trúc Core) quay trở lại với kiên trúc của Pentium M, kiên trúc dựa tảng của kiên trúc thê thứ thay tiêp tục phát triển thê thứ (Netburst) Bộ Nhớ Đêm a Advanced transfer cache Cache L2 của Pentium kêt nối với cache liêu L1 qua bus có độ rộng 256bit Trong các thê vi xư lí trước của Intel độ rộng 64-bit Với m ột vài phép toán đơn giản ta thấy băng thông cache L2 nhân 44.8GB/s với Pentium mức xung 1.4 GHz 48GB/s với Pentium mức xung 1.5 GHz, nhanh gấp lần so với thê trước với xung nhịp b Execution trace cache Cache lênh chuyển từ trước Fetch Unit phía sau Decode Unit có tên gọi "Trace Cache " Do thay lưu trữ vi lênh để chuẩn bị nạp Fetch Unit Trace Cache lưu trữ vi lênh giải mã nhờ Decode Unit Trace Cache lưu trữ 12K vi lênh, vi lênh Pentium IV có độ rộng 100bit nên Trace Cache có dung lượng 150KB (12288 x 100 /8).Ý tưởng đằng sau cách kiên trúc để tối ưu vịng lặp bên các chương trình Khi lênh thực thi nhiều lần , vi lênh giải mã sẵn lưu Trace Cache, không cần giải mã lại nhiều lần các VXL thê trước.Giống Fetch Unit, Trace Cache có Branch Target Buffer (BTB) lên tới 4K vi lênh Trong CPU của Intel thê thứ 6, Pentium III, đêm có 512 vi lênh thê thứ 5, xư ly Pentium có 256 vi lênh Bộ giải mã - Decoder Từ thê thứ 6, CPU của Intel dùng kiên trúc tập lênh lai CISC/RISC Bộ vi xư lí phải chấp nhận các lênh CISC (Complex Instruction Set Computer), biêt tập lênh của x86 Ngày hầu hêt phần mềm sư dụng tập lênh Những vi xư lí sư dụng tập lênh RISC (Reduced Instruction Set Computer) chạy chương trình thơng dụng như: Windows, Office Do các CPU hiên thị trường của cả Intel, AMD sư dụng giải mã CISC / RISC Bên CPU xư lí lênh kiểu RISC lại chấp nhận lênh CISC đầu vào Những lênh CISC x86 gọi chung lênh , lênh RISC bên gọi các vi lênh Những vi lênh RISC sư dụng trực tiêp chương trình phải sư dụng tập lênh CISC giải mã qua giải mã Mỗi CPU sư dụng tập lênh RISC riêng không công bố rộng rãi khơng tương thích với vi lênh của CPU khác Ví dụ vi lênh của Pentium III khác với vi lênh của Pentium IV , khác với vi lênh của Athlon 64 Tuỳ theo tính phức tạp của lênh x86 mà decode thành số lênh RISC Bộ giải mã của Pentium IV giải mã lênh x86 xung clock thông thường lênh x86 giải mã cần vi lênh Nêu lênh x86 phức tạp nhiều vi lênh, định hướng nhớ ROM “Microcode ROM” gọi MIS (Microcode Instruction Sequencer) lưu danh sách tất cả các lênh mô tả các vi lênh tương ứng dịch Allocator Register Renamer Trong giai đoạn alloc, allocator sẽ: Dành 126 reorder buffers (ROB) cho vi lênh hiên thời Nó cho phép thực hiên vi lênh khơng theo thứ tự , CPU đặt chúng trở lại thứ tự cũ sư dụng bảng Dành 128 register files để lưu trữ kêt quả liêu từ xư lí vi lênh Nêu vi lênh nạp (LOAD) hoặc ghi (STORE), có nghĩa đọc hoặc viêt liêu nhớ RAM, dành số 48 đêm nạp (Load Buffers -LB) hoặc 24 đêm lưu trữ (Store Buffers - SB)tương ứng Dành đầu vào nhớ hoặc hàng đợi, tuỳ thuộc vào từng vi lênh Tập lênh CISC x86 có 08 ghi 32-bit (EAX, EBX, ECX, EDX, EBP, ESI, EDI ESP) Số đơn giản quá ít, đặc biêt CPU thực thi theo kiểu out-of-order Do đó, CPU phải đổi tên nội dung của ghi sư dụng chương trình thành 128 ghi của CPU , điều cho phép lênh sư dụng ghi chạy đồng thời Thậm trí out -of-order, có nghĩa cho phép lênh thứ hai chạy trước lênh thứ cả chúng sư dụng ghi Chúng ta cần y Pentium IV thực có tới 256 ghi: 128 cho lênh số nguyên 128 ghi cho lênh dấu chấm động lênh SSE Renamer của Pentium IV có khả xư lí ba vi lênh xung clock Sau từ renamer vi lênh tới hàng đợi Scheduler Scheduler trái tim của thống out-of-order Pentium IV Mục đính của Scheduler giữ cho execution unit CPU luôn làm viêc Các vi lênh tới scheduler phân tích đặt vào bốn scheduler unit tùy theo kiểu của vi lênh: Memory scheduler unit: cho vi lênh liên quan đên nhớ Những vi lênh đên từ hàng đợi của các vi lênh nhớ (memory microinstruction queue) Fast scheduler unit: cho vi lênh đơn giản Slow / General FP scheduler unit: cho vi lênh khác vi lênh xư ly dấu chấm động phức tạp Simple FP scheduler unit: cho vi lênh dấu chấm động đơn giản.Scheduler xêp vi lênh theo kiểu của chúng Sau gưi vi lênh trực tiêp tới Execution Unit tương ứng để xư lí 6 Execution Unit Như đề cập, Pentium IV có bốn cổng gưi đánh số từ tới Mỗi cổng nối tới một, hai hoặc ba đơn vị thực thi (execution unit) Pentium IV có 05 execution unit làm viêc song song (02 FPU cho số dấu chấm động , 03 ALU cho số nguyên) thêm 02 AGU để đọc ghi liêu vào nhớ RAM Phần của Rapid Execution Engine các rapid execution unit, bao gồm hai ALU hai AGU Các vi lênh đơn giản thực thi đơn vị nưa xung clock , lênh dịch xoay thực thi các rapid execution unit gưi đên “Slow ALU” Cổng gưi hai vi lênh xung clock tới rapid execution ALU, số lượng tối đa các vi lênh chuyển xung clock 6: Hai vi lênh cho cổng Hai vi lênh cho cổng Một vi lênh cho cổng Một vi lênh cho cổng Một điều cần nhớ lênh phức tạp cần đên vài xung clock để xư lí Ví dụ cổng số 1, có đơn vị xư ly dấu chấm động Trong đơn vị xư ly lênh phức tạp vài xung clock, cổng vẫn tiêp tục nhận các lênh đơn giản chuyển đên ALU FPU bận Nêu để y chút, ta thấy Intel đặt vào cổng fast unit complex (slow) unit Khi complex unit cịn bận tính toán, đơn vị cịn lại tiêp tục nhận vi lênh từ cổng tương ứng Nên, mặc dù tối đa có lênh chuyển, thực CPU có đên lênh xư ly lúc III Tập Lênh Khuôn dạng lênh P4  Các nhóm lệnh: General Pupose (Nhóm lênh chung) System Instructions (Các lênh thống) x87 FPU x87 FPU SIMD Công nghê MMX SSE SSE2 SSE3 IA-32e: 64-Bit Mode (chê độ 64 bit) C KẾT LUẬN Intel đưa Pentium nhằm tập trung vào tốc độ xung nhịp cao với thiêt kê pipeline dài Tuy cách làm tạo tốc độ cao đồng nghĩa với hiêu suất làm viêc lại giảm viêc thực hiên lênh cần quá nhiều giai đoạn CPU pentium thường có xung nhịp cao CPU của AMD, lại không nhanh kiểm nghiêm Benchmark Điều khiên người dùng có khuynh hướng lựa chọn vi xư lí Penti um theo họ vi xư lí có tốc độ cao chạy hiêu quả hơn, mặc dù điều khơng phải Trong cơng nghê HyperThreading (HT) giới thiêu vào giai đoạn của Pentium lại thành công khía cạnh … marketing Lợi ích mà HT đem lại thấp (và đơi cịn khơng dùng HT) Trên thực tê, nêu người dùng phổ thơng kích hoạt tính “siêu luồng” máy tính desktop của , họ ch ng ngoại trừ phải trả giá viêc giảm tốc độ tới 10%.Tuy nhiên Pentium khơng có nhược điểm Với tập lênh SSE2 SSE3 công nghê hàng đầu Quad Data Rate, Trace Cache, Rapid Execution Engine, Dual Channel Memory, Pentium tỏ xuất sắc các ứng dụng từ văn phòng tới multimedia Người dùng các ứng dụng tính toán phức tạp (kiểu rendering của Maya, 3DS) hưởng lợi nhiều từ HyperThreading Và card đồ họa 3D ngày trở nên mạnh mẽ, chip P4 đem đên tảng tuyêt vời cho các game thủ Đặc biêt giới overclock quan tâm tới nhân Northwood phát hành năm 2002 Với bo mạch chủ RAM đủ mạnh, cả người tập overclock đạt tới 1GHz sư dụng giải pháp tản nhiêt thông thường Mục Lục Trường đại học công nghiêp Hà nội ĐÊ TÀI Báo cáo tập lớn môn học: Kiên trúc Máy tính Nhóm thực hiên: Nhóm 3–Lớp KTPM3-K9 Giáo viên hướng dẫn: Nguyễn Thanh Hải  Mở đầu Nhiêm vụ của 2 Bố cục  Nội dung A.Lịch sư phát triển của VXL Pentium IV *Những điểm kĩ thuật của Pentium bao gồm: B Nội dung trọng tâm I Các công nghê Hyper-Pipelined Technology - Công nghê Siêu ống Execution Trace Cache Rapid Execution Engine - Cơ chê thực thi (lênh) nhanh chóng .9 Advanced Transfer Cache (ATC) Out-Of-Order Execution Branch Prediction (phỏng đoán nhánh) Rapid Execution Engine 10 Quad Data Rate 10 Enhanced Floating Point & Multimedia Unit 10 10 Streaming SIMD Extension (SSE2) Instructions 10 11 Hyper Threading (siêu phân luồng) 11 II CẤU TRÚC, CHỨC NĂNG CÁC BÔ PHẬN 11 *Một số điểm đáng y!!!! 11 1.Hyper Pipeline 12 2.Bộ Nhớ Đêm 14 3.Bộ giải mã - Decoder 14 4.Allocator Register Renamer 15 5.Scheduler 16 6.Execution Unit 16 III Tập Lênh 17 Khuôn dạng lênh P4 17 C KẾT LUẬN 18 ... vụ Nghiên cứu tìm hiểu thê vi xư ly InTel Pentium IV Bố cục * Lịch sư phát triển của VXL Pentium IV : - Hoàn cảnh đời của VXL Pentium IV - Đặc trưng công nghê chung của VXL Pentium IV. .. Nghiên cứu tìm hiểu thê hệ vi xư ly InTel Pentium IV Nhóm thực hiện: Nhóm 3–Lớp KTPM3-K9 Thành vi? ?n nhóm: Leo thị lan Hương Trần hải Linh Nguyễn thị Nga Nguyễn thị Nhã Trần thị Quyên Giáo vi? ?n... (version) của VXL Pentium IV  Nội dung A.Lịch sư phát triển của VXL Pentium IV Pentium vi xư ly kiên trúc x86 thê thứ Intel sản xuất, thiêt kê CPU hoàn toàn của họ kể từ Pentium III năm

Ngày đăng: 09/12/2022, 16:09

Tài liệu cùng người dùng

Tài liệu liên quan