Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 19 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
19
Dung lượng
1,32 MB
Nội dung
Trường đại học công nghiệp Hà nội Khoa Công Nghê Thông Tin - - BAI TIÊU LUÂN MÔN HOC: KIÊN TRUC MAY TINH ĐÊ TAI: Nghiên cứu tìm hiểu thê hệ vi xư ly InTel Pentium IV Giáo iênohươngo dn: Nguyên Thanh Hai Lớ: Đại học KTPM3-K9 Nhomosô: HaoNôi,ongào1o hango11onămo2015 Trường đại học công nghiêp Hà nội Khoa Cơng Nghê Thơng Tin oBáocáobaiotậpolơnomơnohọc:oooooooo oKiếnotrúcoMàotính ĐÊ TAI: Nghiên cứu tìm hiểu thê hệ vi xư ly InTel Pentium IV Nhóm thực hiện:oNhomo3– LơpoKTPM3-K9 Thành viênthị Leo lan nhóm: Hương Trần hải Linh Nguyễn thị Nga Nguyễn thị Nhã Trần thị Quyên Giáo viên hướng dẫn:ooNguênoThanhoHai (GV Kiên Trúc Máy Tính) ooooooHaoNơio,ngào1othang o11onămo2015 Mở đầu Nhiệm vụ Nghiên cứu tìm hiểu thê vi xư ly InTel Pentium IV Bố cục * Lich sư phat triển cua VXL Pentium IVra : đời cua VXL - Hồn canh IV.cơng nghê chung cua VXL Pentium IV - Pentium Đăc trưng * Đăc trưng công nghê chi tiêt cua tưng loại biên thể (version) Pentium IV cua VXL Nội dung A.Lịch sư phat triên cca VXL Pentium IV Pentium vi xư ly kiên trúc x86 thê thứ Intel san xuất, thiêt kê CPU hoàn toàn cua họ kể tư Pentium III năm 1995 Thiêt kê gọi kiên trúc NetBurst Không Pentium II, Pentium III, cac loại Celeron khac nhau, kiên trúc khac tạo hoàn toàn thưa kê tư thiêt Bộ vikê xưPentium ly Pentium đầu tiên, mã hiêu "Willamette", chạy với tốc độ 1.4 Pro/P6 1.5 GHz phat hành vào thang 11 năm 2000 Socket 423, sau chạy với tốc độ tư 1.5 GHz tới GHz Socket 478 Được ghi nhận với đời cua Pentium bus FSB(Front side bus) nhanh với tốc độ 400 MT/s Khi đó, chip AMD Athlon chạy với tốc độ 266 MT/s Dòng vi xư ly Pentium kêt thúc vào ngày 27 thang năm 2006, thay thể "Conroe" dòng Intel Core - dòng sư dụng nhân Pentium Produced From 2000 to 2008 Max CPU clock 1.30 GHz to 3.80 GHz rate Pentium san xuất vào thang 11 năm 2011 FSB speeds 400 MT/s to 1066 MT/s giới thiêu vi xư ly thê Instruction set x86 (i386), x86-64, MM Nêu vi xư ly đăt số thay tên X,SSE, SSE2, SSE3 Microarchitecture NetBurst gọi 786 đại diên cho Transistors thê sau xư ly 686 Vài hình thức chúng dựa kiên trúc khuôn Socket(s) xư Socket 423 Predecessor Socket 478 Pentium LGA 775 III Successor Pentium D Northwood Prescott 55M 130nm 169M 130nm (P4EE) 25M 90nm 188M 65nm khac cua Pentium mắt công ly dựa cac nhân Willametter, 42M 180nm Một số công nghê bật ap dụng kiên trúc NetBurst Hyper Pipelined Technology(Công nghê siêu ống) mở rộng số hàng lênh xư ly, làm hiêu suất may tăng 30% Execution Trace xư Cache tranh tìnhbus Engine tang tốc đồng ly toan học, trạng lênh bi thống (system bus) 400 MHz 533 MHz; cac chậm trễ chuyển tư nhớ dên CPU, Rapid công nghê Advanced Execution Transfer Cache, Advanced Dynamic Execution, Enhanced Floating point Multimedia Unit, Streaming SIMD Extensions (SSE2) cai tiên nhằm tạo BXL tốc độ cao hơn, kha tính toan mạnh hơn, xư ly đa phương tiên tốt Ghi nhận với đời cua Pentium công nghê Quad Data Rate cho phép FSB (Front Side Bus) đạt đên tốc độ 400 đó, chip AMD chạy với tốc độ chêt FSB Bộ viMHz xư lí Khi Pentium IV có đênAthlon 42 triêu Tranzito,kích thước 266cua MHz 217 (cơng nghê Double Data mm2,cơng suất tiêu thụ Rate) 55 W làm viêc mức 1,5GHz.Tốc độ bus thống 3,2 GB/s , cao thời diểm Bang: So sánh hiệu suất Pentium Pentium Bang so sanh hiêu suất cua Pentium IV 1,5GHz Petium III 1,0 GHz.Rõ ràng ta thấy tính vượt trội dành cho Pentium IV.Cac ứng dụng số nguyên cao 15-20 %,trong Ứng dụng dấu chấm động multimedia lên tới 0-70% Pentium (tên mã Willamette) xuất hiên cuối năm chấm hêt cho 2000 đăt “triều dấu đại” Pentium III Willamette xuất san xuất cơng nghê 0,18 có 42 triêu transistor(nhiều gần 50% so với Pentium III),bus thống (system bus) 400 MHz,bộ nhớ đêm tích hợp L2 256 KB,socket 423 478 , Socket thê socket 478 P4 Willamette có tốc độ 1.3, 2001 và423 bi thay 1.4, hiên 1.5, 1.6, xuất khoang thời gian ngắn, tư thang 11 năm 2000 đên thang 7, 1.8, 1.98 ,năm 2.0 GHz P4 Northwood xuất hiên vào thang năm 2002,được san xuất công nghê ,13, có khoang 55 triêu transistor,bộ nhớ đêm tích hợp L2 4512 KB,socket 178.Northwood có dịng gồm Northwood A(system bus 400 2MHz),tốc độ 1.6, 8, 2.0, 2.2, 2.4, 2.5, 2.6, 2.8 GHz.Northwoood luồng Hyper Threading-HT).Northwood C (system B(system bus 800 bus 533 MHz) tốc độ MHz,tất ca hỗ trợ HT),gồm 2.4,2.6, 3.0, 3.2, 3.4 26, 2.4, 2.53, 2.66, 2.8, 3.06 GHz(riêng 3.06 GHz có hỗ trợ cơng GHz P4 siêu Prescott nghê phân(năm 2004).Là BXL san xuất theo cơng nghê 90nm,kích thước vi mạch giam 50% so với P4 Willamette.Điều cho phép tích hợp nhiều transistor kích thước (125 triêu transistor so với 55 triêu transistor cua P4 Northwood),tốc độ chuyển đổi cua transistor nhanh hơn,tăng kha xư ly,tính toan.Dung lượng nhớ đêm tích hợp L2 cua P4 Prescott gấp đôi chạy hơn.Đây giai đoạn “giao thời ” so vớinhanh P4 socket 478-775LGA,system bus 533 MHz-800MHz Northwood(1MB so với 512KB).Ngoài tập lênhvà san MMX,SSE,SSE2,Prescott bổ dùng bối rối phẩm đăt tên khiên người sungchọn tập lênh SSE3 giúp cac ứng dụng xư ly video game mua Prescott A(FSB 533MHz)có cac tốc độ 2.4, 2.26, 2.8 (socket 478),Prescott 505 (2,66GHz), 505J(2.66 GHz),506 (2,66 GHz), 511 (2,8GHz), 515J (2,93GHz), 516 (2,93GHz) , 519J (3,06GHz), 519 J(3,06GHz) sư dụng socket 775LGA Prescott E,F (năm 2004) có nhớ đêm L2 1MB(cac phiên ban sau mở rộng 2MB),bus thống 800 MHz.Ngoài tập lênh MMX,SSE2,SSE3 tích hợp, Prescott E,F cịn hỗ trợ cơng nghê siêu phân luồng,một số phiên bansư sau có hỗ Dòng dụng socket 478 gồm Pentium HT 2.8E (2,8GHz), 3.0E toan (3,0 64 GHz), trợ bit 3.2Etính (3,2 GHz), 3.4E(3,4 GHz).Dòng sư dụng socket 775LGA gồm Pentium HT 3.2F, 3.4F, 3.6F, 3.8F, với cac tốc độ tương ứng tư 3,2 HT 517,520,520J,521,524,530,530J,531,540,540J,541,550,560,560J, GHz.Pentium 561,570J,571 với cac tốc độ tư 2.8 GHz đên 3,8 GHz *Những điểm kĩ thuật cua Pentium gồm: bao Tốc độ tư 1.3GHz đên 3.8GHz phần mềm tương thích với xư ly Intel 32 bit trước Một số phiên ban hỗ trợ EM64T Bus xư ly (font-side) chạy 400MHz, 533Mhz, SOOMHz hay 1066MHz Những logic số học (ALUs) chạy gấp hai lần tần số nhân xư ly Công luồng (20-30 hỗ trợ tất ca xư ly 2.4GHz nhanh Công nghê nghê siêu siêu phân dân đường tầng) chạy Bus 800MHz, tất ca xư ly 3.06GHz nhanh chạy Bus 533MHz Thực thi tập lênh lênh chuyên nghiêp Bộ dự đoan phụ mở rộng Bộ nhớ đêm LI 8KB ha>16KB cộng với nhớ đêm theo vêt thực thi vi lênh 12k Bộ nhớ đêm L2 56bit khuôn tốc độ nhân 256KB, 512KB, 1MB hoăc 2MB kêt Bộ đêm L3 tốc độ nhân 2MB tích hợp khn hợpnhớ đường SSE2-SSE cộng với 144 tập lênh chưa xư ly âm đồ họa B Nôi dung tâm I Cac công nghê Kha cung cấp số công nghê cac tính tăng cường dựa vào cac tiên cua Intel lĩnh vực thiêt kê viêc tiêu thụly lượng tính toan khơng thể thực hiên mạch, quan cac mơ hình vi kiên trúc cua cac thê CPU trước Bộ dấu chấm động mở rộng Có nhiều trạng thai lượng thấp Intel bo số La Mã đinh 4, số A-rập tiêu chuẩn Pentium Bên pentium có kiên trúc mà Intel gọi vi kiên trúc NetBurst, thuật ngữ thi trường không phai thuật ngữ kĩ thuật Intel dùng NetBurst để thí nghiêm cơng nghê siêu đường dân, may thực thi nhanh, bus thống tốc độ cao (400MHz, 533MHz, 800MHz 1066MHz) nhớ đêm theo vêt thực thi Công nghê siêu đường dân làm tăng gấp đôi hay gấp ba lần độ sâu đường dân tập lênh so với Pentium III ( hay Athlon/Athlon 64) nghĩa nhiều bước nho yêu cầu để thực thi tập lênh Măc dù điều dường hữu hiêu, cho phét đạt tới xung cao nhiều Bộ may thực thi nhanh cho phép hai logic số nguyên ( ALUs) chạy gấp đôi tần số nhanh Trong vấn đề Bus xư ly tốc độ cao đắng kể nhất, xư lyky cóthuật nghĩa có tập lênh thực thi chu măt ky đồng hổ.Bus mà nói bus xư ly bus quad-pumped 100MHz, 133MHz, 200MHz 400MHz/533MHz/800Mhz/1066Mhz bus quad-pumped haythống 266MHz chạy đồng hay 1066Mhz bus dung lượng 64bit (8byte) 533Mhz,800Mhz chuyển giao liêu gấp bốn lần chu ky (4x) cho tốc độ cho tốc độ400Mhz, lưu hồ thống 100Mhz/133Mhz/200Mhz/266Mhz hiêu dụng lượng 3200MBps, 4266MBps, 6400MBps hay chuyển giao liêu gấp bốn lần 8532MBps Trong kiên chu trúc kì nội đường tầng hayvêt 30thực tầngthi cua đồng hồ Bộdân nhớ20 đêm theo pentium nhớ tập lênh đêm L1 tốc độ cao đơn ba thành tầng nho so với giai xư ly Nó trước pentium chưabiđược lượngnhiều 12K vi hoạt động mã di chuyển III, làm cho giai mã tập lênh giống xư RISC làm Không may cóxư thể tư đường dân thực thilychính, tăng tốclàđộ ly thêm vào số chu ky thực thi tập lênh nêu chúng không tối ưu chô xư ly Một ưu điểm kiên trúc quan trọng khac công nghê siêu phân luồng, tìm thấy tất ca Pentium 2.4GHz nhanh chạy bus 800MHz hay tất ca Pentium 3.06GHz nhanh chạy bus 533Mhz Siêu phân luồng cho phép xư ly đơn chạy hai luồng thời, hoạt động thê hai xư ly thay Pentium đời đầu sư dụng socket 423 có 423 chân xêp SPGA 39x39 Nhưng phiên ban sau socket 47H, phiên ban hiên dùng socket T (I.GA775) có chân thêm để hỗ trợ tính EM64T ( mở rộng 64 bit), bit vơ hiêu hóa thực thi ( bao vê chống tan công cua tràn nhớ đêm), cơng nghê ao Intel, tính tiên tieean khac Celeron không thiêt kê để làm viêc socket 423, celeron celeron D có socket 478 hay socket T Hyper-Pipelined Technology Cơng nghê ( LGA775), cho phép thống -hạ gia so với Pentium Bộ chọn điên Siêu ống Là công ap tạo ranghê giới thiêu Vi kiên trúc Netburst™ cua Intel Nó tăng gấp Module đơi "độ điều sâu"chỉnh cua "ống" xư tự ly động lênh cua CPU sobo sanh với nhờ vào điên ap đătkhi mạch mơ Vi kiên hình nối trúc P6 sư dụng cac thê CPU Pentium III Lênh thực đên socket 20 giai đoạn (20 stages) vi kiên trúc Netburst, so với 10 giai hiên đoạn vi kiên trúc P6 Ống lênh dài giúp chip Pentium đạt mức xung nhip cao Execution Trace CacheLà nhớ đêm cấp Bên cạnh 8KB nhớ đêm dùng để chứa liêu , Pentium có kha lưu trữ đên 12K vi lênh giai mã nhằm giúp tăng cường tốc độ thực thi lênh cua CPU Rapid Execution Engine - Cơ chê thực thi (lênh) nhanhĐiều chóng thực hiên dựa hai Đơn vi Luận ly Số Học thiêt kê bên Pentium Nó cho phép Pentium thực hiên cac lênh số học (cộng, trư, nhân chia) luận ly (And, Or ) với tốc độ gấp lần tần số xư ly ban cua xư ly Như CPU Pentium - 2.0Ghz có kha thực hiên cac lênh với tốc Advanced Transfer Cache độ 4.0Ghz CPU Pentium - 2.53Ghz thực hiên với tốc độ (ATC) Là nhớ đêm cấp (L2 Cache) thiêt kê bên Pentium 5.1Ghz ATC có hai loại: 512 KB L2 ATC với cac tốc độ CPU 2.8Ghz - 2.53Ghz - 2.40Ghz 40(B)Ghz -2.26Ghz - 2.20Ghz - 2.0(A)Ghz 1.6(A)Ghz; 256 KB L2 tốc tư cac 1.2Ghz - 2.0Ghz ATC cung cấp kênh truyền có thơng ATCđộvới lượng cao với nhân cua CPU ATC bao gồm giao diên 256-bit (32 byte) để truyền liêu xung clock Điều cho phép ATC (L2 Cache) hỗ trợ tốc độ cao gấp lần tốc độ truyền liêu cua L2 Cache sư dụng cac CPU Pentium III Ví dụ: CPU Pentium - 2.53Ghz có tốc độ truyền liêu lên tới 81GB/giây, Out-Of-Order so với tốc độ truyền liêu 16GB/giây cua Pentium III - 1.0 Ghz Execution Nhân hỗ trợ Out-of-Order Execution xêp lại cac vi lênh, cho phép lênh (cùng với đầu vào cac tài nguyên thống cần thiêt) để thực thi tranh lãng phí thời gian Khi vi lênh chờ cấp phat tài nguyên hoăc liêu, cac lênh khac (thường buffer) chen vào thực song thi Nhờ lênh song, khoang trễ cua pipeline bi loại bo Nhân thi nhiều thựcthực thi cac lênh giai đoạn cua pipeline Sau in-order retirement unit tìm cac lênh hiên xong khơng cịn phụ thuộc liêu liên quan đên cac lênh rẽ Branch Prediction (phong đoan nhanh chưa hoàn thất để xư ly lưu kêt qua nhớ theo trật tự nhanh) Kiên trúc NetBurst nhớ cac nhanh chương trình ban đầu cua chạy, giúp làm giam độ trễ qua trình nhay nạp đầy ống lênh , Cac nhanh lưu giữ sở đia lênh bên Branch Target Buffer (BTB) Bộ vi xư ly dự đoan Rapid Execution cac nhanh tới trước ca lênh rẽ nhanh thực hiên Engine Trong Pentium 4, có ALU hai AGU chạy với mức xung gấp đôi xung clock Rapid execution engine giới thiêu làm giam độ trễ cua viêc thực hiên cac phép toan đơn gian Điều thực có y nghĩa hiêu tốc độ cua Quad Data vi xư ly phụ thuộc nhiều vào cac tính toan số nguyên ALU Rate FSB cua Pentium truyền bốn lần liêu xung clock Công nghê Quad Pumped hay gọi Quad Data Rate (QDR).QDR khiên cho xung nhip hiêu dụng tăng lên gấp lần so với xung thực Nhờ cac CPU Pentium đạt đên 400Mhz System bus, tốc độ Tranfer truyền nhận liêu vào-ra Real Clock Performanc CPU 3.2GBps e Rate so với tốc độ tương ứng 1.06GBps cua Pentium III (133Mhz system bus) 100MHz 400MHz 3.2GB/s 133MHz 533MHz 4.2GB/s 200MHz 800MHz 6.4GB/s 266MHz 1066MHz 8.5GB/s Enhanced Floating Point & Multimedia Unit mở rộng cac ghi dấu chấm động lên tới Bộ xư ly Pentium 128bit tạo thêm ghi mở rộng nhằm phục vụ viêc di chuyển liêu Do vậy, kha xư ly cac ứng dụng dấu chấm động (tính toan kêt cấu, số liêu tài chính, số liêu khoa học…) truyền thông đa phương tiên (dựng xư ly phim video, xư SIMD ly hình anh đồ họa…) tăng cường nhiều 10 Streaming Extension (SSE2) Instructions Là tập lênh hỗ trợ đồ họa mở rộng thiêt kê cho Pentium Vi kiên trúc Netburst mở rộng kha xư ly theo kiểu cấu trúc SIMD cua cac cơng nghê Intel® MMX™ SSE cach thêm vào 144 lênh Cac lênh bao gồm cac tac vụ số nguyên SIMD 128-bit cac tac vụ dấu chấm động Cac lênh làm tối ưu hóa kha 11 (siêu phân năngHyper thực Threading hiên cac ứng dụng phim video, xư ly âm - hình luồng) anh, mã hóa, tínhlà cơng nghê cho phép CPU vật ly hoạt động Hyper threading điều hành toan khoa học hai CPU logic hoạt động song song Nó dựa nguyên tắc vào thời điểm có phần tài nguyên cua CPU sư dụng để thực thi lênh cua tiên trình, phần chưa sư dụng dùng để thực thi cac tiên trình khac.Trong cac CPU sư dụng công nghê Hyper-Threading, CPU logic sở hữu tập cac ghi, kể ca ghi đêm chương trình PC riêng , CPU vật ly luân phiên cac giai đoạn tìm/giai mã hai CPU logic cố gắng thực thi 10 thao tac tư hai chuỗi lênh đồng thời theo cach hướng tới đơn vi thực thi sư dụng II CÂU TRUC, CHỨC NĂNG CAC BÔ PHÂN *Một số điểm y yyy Công nghê Hyper Pipelined với pipeline lên tới 20 stage FSB cua Pentium IV có mức xung tối thiểu 400MHz nhờ ky thuật QDR (Quad Data Rate), cho phép truyền bốn lần liêu xung clock, nhanh gấp rưỡi system bus 266MHz sư dụng công nghê Double Data cua AMD Rate Execution Trace Cache: cache lênh (L1 instruction cache) chuyển tư trước Nhờ vậy, băng thông lên đên 3.2GB/s Fetch Unit phía sau Decode Unit có tên “Trace Cache” Có tới 128 ghi, CPU cua Intel thuộc thê thứ (như Pentium II , Advanced Execution, Pentium III)Dynamic có 40 ghi.nâng cao kha phong đoan nhanh thực hiên lênh không theo thứ tự (out-of-order execution) Rapid Execute Engine, theo ALU cua Pentium IV làm viêc với xung nhip gấp đôi xung clock cua CPU 1.Hyper Pipeline 11 Trong CPU Pentium III pipeline có 10 stage (giai đoạn) Pentium IV có 20 stage Pentium IV với tên mã “Prescott” 90nm chí cịn có tới 31 stage Intel gọi công nghê siêu ống lênh (Hyper Pipelined Technology).Viêc tăng độ dài pipeline hướng đên mục tiêu tăng xung nhip Có nhiều giai đoạn đồng nghĩa với cac đơn vi chức cấu thành 20năng tầng Pipeline Pentium IV: với số lượng transitor Và với transistor dễ dàng nâng cao xung nhip , ban Stage & - Trace cache next instruction pointer: tìm vi lênh tiêp theo thực hiên BTB (Branch Target Buffer) Stage & - Trace cache fetch: nạp vi lênh tư Trace Cache Stage - Drive: gưi vi lênh đên resource allocator mạch RAT Stage - Allocate: kiểm tra tài nguyên CPU cần thiêt cho viêc thực hiên & - Rename: nêu chương trình sư dụng tam Stages lênh Ví dụ nhớ dùng làm đêm ghi chuẩn x86 đổi tên thành 128 thành ghi cua Pentium IV Stage - Queue: cac vi lênh đưa vào cac hàng đợi dành riêng cho tưng (ví10, dụ: cập nhớ, xư ly sốsắp nguyên chấm loại Stages 11, truy 12 - Schedule: scheduler xêp lạihay cacdấu lênh nhằm giữ động …) Lênh cho nằm yên hànghoạt đợi động cho đên chỗ trống tương ứng execution unit Ví dụ,có nêu đơn vi xư ly dấu xuất hiên chấm động ranh scheduler rỗi, scheduler lấy lênh xư ly dấu chấm động để gưi cho đơn vi đó, măc dù lênh tiêp theo chương trình 12 lênh xư ly số nguyên Stages 13 & 14 - Dispatch: gưi vi lênh tới Execution Unit tương ứng Stages 15 & 16 - Register Files: đọc register file 17 - Flags: Execute: lênh được thực cập hiên Stage 18 cờvi cua vi lênh nhật Stage 19 - Branch Check: kiểm tra nhanh cua chương trình có với suy đoan cua mạch dự đoan rẽ nhanh hay không Stage 20 - Drive: gưi kêt qua cua viêc kiểm tra tới Branch Target Buffer (BTB) Măc dù ly thuyêt, pipeline dài làm tăng hiêu năng, nhiên, bất chấp điều có qua nhiều stage khiên cho thời gian thực hiên lênh dài Thứ hai, pipeline dài trở nên hiêu qua trường hợp phong đoan nhanh sai (branch prediction error) Sẽ nhiều thời gian để lấp đầy pipeline lần Intel triển khai vài biên phap để bù lại Thực tê Pentium IV nhanh Pentium III nhờ hoạt động mat hiêu trường hợp này, Execution mức xung Trace Cache nhip cao Với mức xung nhip, CPU Pentium III Dynamic Execution Engine nhanh CPU Pentium IV nhờ kích thước pipeline cua Bởi hiêu qua cua pipeline kiên trúc Netburst, thê vi xư ly thứ cua Intel (vi kiên trúc Core) quay trở lại với kiên trúc cua Pentium M, kiên trúc dựa tang cua kiên trúc thê thứ thay tiêp tục phat triển thê thứ (Netburst) 2.Bộ Nhớ Đêm a Advanced transfer cache Cache L2 cua Pentium kêt nối với cache liêu L1 qua bus có độ rộng 256bit Trong cac thê vi xư lí trước cua Intel độ rộng 64-bit Với m ột vài phép toan đơn gian ta thấy băng thông cache L2 nhân 44.8GB/s với Pentium mức xung 1.4 GHz 48GB/s với Pentium mức xung 1.5 GHz, b Execution trace nhanh gấp cache Cache lênh chuyển tư trước Fetch Unit phía sau Decode lầnUnit so với thê có têntrước gọi với xung nhip "Trace Cache " Do thay lưu trữ vi lênh để chuẩn bi nạp 13 Fetch Unit Trace Cache lưu trữ vi lênh giai mã nhờ Decode Unit Trace Cache lưu trữ 12K vi lênh, vi lênh Pentium IV có độ rộng 100bit nên Trace Cache có dung lượng 150KB (12288 x 100 /8).Ý tưởng đằng sau cach kiên trúc để tối ưu vòng lăp bên cac chương trình Khi lênh thực thi nhiều lần , vi lênh giai mã sẵn lưu Trace Cache, không cần giai mã lại nhiều lần cac VXL thê trước.Giống Fetch Unit, Trace 3.Bộ giai mã Cache có Branch Target Buffer (BTB) lên tới 4K vi lênh Trong CPU Decoder Tư thê thứ 6, CPU cua Intel dùng kiên trúc tập lênh lai cua Intel CISC/RISC Bộ vi xư phai nhận cac lênh (Complex Set thêlíhê thứchấp 6, Pentium III, CISC đêm Instruction có 512 vi lênh Computer), thê thứ 5,được biêt làlytập lênh cua Ngày xư Pentium chỉx86 có 256 vi lênh.hầu hêt phần mềm sư dụng tập lênh Những vi xư lí sư dụng tập lênh RISC (Reduced Instruction Set Computer) chạy chương trình thơng dụng như: Windows, Office Do cac CPU hiên thi trường cua ca Intel, AMD sư dụng giai mã CISC / RISC Bên CPU xư lí lênh kiểu RISC lại chấp nhận lênh CISC đầu vào Những lênh CISC x86 gọi chung lênh , lênh RISC bên gọi cac vi lênh Những vi lênh RISC sư dụng Tuy theo trực tiêp tính phức tạp cua lênh x86 mà decode thành chương trình phai sư dụng tập lênh CISC giai mã qua số RISC Bộ giai mã cua Pentium IV giai mã mộtlênh giai lênh mã Mỗi CPU sư dụng tập lênh RISC riêng không công bố rộng rãi x86 xung clock thông thường lênh x86 giai mã cần vi nómỗi khơng lênh Nêu lênh gọi MIS (Microcode Instruction “Microcode ROM” tương thích với vi lênh cua CPU khac Ví dụ vi lênh cua Pentium III Sequencer) lưu x86 phức tạp có vi ta lênh, nólênh đinhứng hướng danh sach tất ca cac nhiều lênh mô cac vi tương khac với vi lênh thể nhớ ROM dich cua Pentium IV , khac với vi lênh cua Athlon 64 4.Allocator Register Renamer Trong giai đoạn alloc, allocator sẽ: 14 Dành 126 reorder buffers (ROB) cho vi lênh hiên thời Nó cho phép thực hiên vi lênh khơng theo thứ tự , CPU đăt chúng trở lại thứ tự cũ sư dụng bang Dành 128 register files để lưu trữ kêt qua liêu lí vilà nạp (LOAD) hoăc ghi (STORE), có nghĩa đọc Nêutưvixư lênh hoăc viêt lênh liêu nhớ RAM, dành số 48 đêm nạp (Load Buffers -LB) hoăc 24 đêm lưu trữ (Store Buffers - SB)tương ứng Dành đầu vào nhớ hoăc hàng đợi, thuộc vào tưng vi lênh Tập lênh CISC x86 có 08 ghi 32-bit (EAX, EBX, ECX, EDX, EBP, ESI, EDI ESP) Số đơn gian qua ít, đăc biêt CPU thực thi theo kiểu out-oforder Do đó, CPU phai đổi tên nội dung cua ghi sư dụng chương trình thành 128 ghi cua CPU , điều cho phép lênh sư dụng ghi chạy đồng thời Thậm trí out -of-order, có nghĩa cho phép lênh thứ 5.Schedule hai chạy trước lênh thứ ca chúng sư dụng rghi Scheduler trai tim cua thống out-of-order Pentium IV Mục đính cua Scheduler Chúng ta cần y Pentium IV thực có tới 256 giữ execution unit CPU luôn làm viêc Cac vi lênh ghi:cho 128mọi scheduler lênh số nguyên 128 ghi cho lênh dấu chấm động phân tích đăt vào bốn scheduler unit tùy theo lênh SSE kiểu cua vi lênh: Renamer cua Pentium IV có kha xư lí ba vi lênh xung Memory unit: cho vi lênh liên quan đên nhớ clock Sauscheduler tư Những vi lênh Slow / General scheduler unit: cho vi lênh khac vi renamer vi lênh FP tới hàng đợi đên tưxư hàng đợi cua cac vi lênh nhớ (memory microinstruction lênh ly dấu queue) chấm động phức tạp Simple FP scheduler unit:những cho lênhgian dấu chấm động đơn Fast scheduler unit: cho vi lênhviđơn gian.Scheduler xêp vi lênh theo kiểu cua chúng Sau gưi vi lênh trực tiêp tới Execution Unit tương ứng để xư lí 15 6.Execution Unit Như đề cập, Pentium IV có bốn cổng gưi đanh số tư tới Mỗi cổng nối tới một, hai hoăc ba đơn vi thực thi (execution unit) Pentium IV có 05 execution unit 02 đọcsong ghi liêucho vào nhớ làmAGU viêcđể song (02dữ FPU sốbộ dấu chấm động , 03 ALU cho số RAM nguyên) cua thêm Phần Rapid Execution Engine cac rapid execution unit, bao gồm hai ALU hai AGU Cac vi lênh đơn gian thực thi đơn vi nưa xung clock , lênh dich xoay thực thi cac rapid execution unit gưi đên “Slow ALU” Cổng gưi hai vi lênh xung clock tới rapid execution ALU, Hai vi lênh cho số cổng lượng tối đa cac vi lênh chuyển Một vi lênhlàcho xung clock 6: cổng Một vi lênh lênh cho cho cổng Hai vi cổng Một điều cần nhớ lênh phức tạp cần đên vài xung clock để xư lí Ví dụ cổng số 1, có đơn vi xư ly dấu chấm động Trong đơn vi xư ly lênh phức tạp vài xung clock, cổng vân tiêp tục nhận cac lênh đơn gian chuyển đên ALU FPU cịn bận Nêu để y chút, ta thấy Intel đăt vào cổng fast unit complex (slow) Nên, măc dù tối đa có lênh chuyển, thực CPU unit Khi có đên lênh complex unit cịn bận tính toan, đơn vi cịn lại tiêp tục xưtư ly lúc nhận vi lênh cổng tương ứng 16 III Tập Lênh Khn dạng lênh P4 Các nhóm lệnh: General Pupose (Nhóm lênh chung) System Instructions (Cac lênh thống) x87 FPU x87 FPU SIMD Công nghê MMX SSE SSE2 SSE3 IA-32e: 64-Bit Mode (chê độ 64 bit) C KẾT LUẬN Intel đưa Pentium nhằm tập trung vào tốc độ xung nhip cao với thiêt kê pipeline dài Tuy cach làm tạo tốc độ cao 17 đồng nghĩa với hiêu suất làm viêc lại giam viêc thực hiên lênh cần qua nhiều giai đoạn CPU pentium thường có xung nhip cao CPU cua AMD, lại không nhanh kiểm nghiêm Benchmark Điều khiên người dùng có cơng khuynh hướng lựa chọn bộđược vi xưgiới lí Penti um Trong nghê HyperThreading (HT) thiêu vào theo vi giaihọ đoạn xư có tốc độ caothành sẽcơng chạyvề hiêu qua hơn,…măc dù điều Lợi cualí Pentium lại khía cạnh marketing ích khơng phai mà HT đem lại thấp (và đơi cịn khơng dùng HT) Trên thực tê, nêu người dùng phổ thông kích hoạt tính “siêu luồng” may tính desktop cua , họ ch ng ngoại trư phai tra gia viêc giam tốc độ tới 10%.Tuy nhiên Pentium khơng có nhược điểm Với tập lênh SSE2 SSE3 công nghê hàng đầucàng trở Quad Rate, Cache, Execution 3D ngày nênData mạnh mẽ,Trace chip P4 Rapid đem đên Engine, tang Dual Channel tuyêt vời cho cac Memory, to overclock xuất cacnhân ứng Northwood dụng tư game thu.Pentium Đăc biêt4 giới sắc quantrong tâm tới văn tới phat phịng hành năm overclock có đạt chu tới sư giaingay phap tannhững nhiêt multimedia Người dùng cac1GHz ứngRAM dụng tính toan phức tạp (kiểu 002 Với bo thể mạch đudụng mạnh, ca thông thường rendering người tập cua Maya, 3DS) hưởng lợi nhiều tư HyperThreading Và card đồ họa Mục Lục Trường đại học công nghiêp Hà nội .1 ĐÊBao cao tập lớn môn Kiên trúc May TANhóm I học: tính thực hiên: Nhóm 3–Lớp KTPM3 K9 Giao viên hướng dân: Nguyễn Thanh Hai .2 Nhiêm vụ cua 2.MởBố đầu cục Nội .2 dung 18 A.Lịch sư phat triên cca VXL Pentium IV * B NôiNhững dung trođiểm ng kĩ thuật cua Pentium bao gồm: tâm I CaH c ycông nghê per-Pipelined Technology - Công nghê Siêu ống Execution Trace Cache Rapid Execution Engine - Cơ chê thực thi (lênh) nhanh chóng .9 Advanced Transfer Cache (ATC) .9 Out-Of-Order Execution đoan 11.Branch Hyper Prediction Threading (ph (siêoung phân nh anh) II.luồng) 11 CÂU TRUC, CHỨC NĂNG CAC BÔ Rapid Execution PH*Một ÂN 11 số điểm y Engine 10 y yy 11 1.HQuad yper Data Rate Pipeline 12 Enhanced Floating Point & Multimedia 2.Bộ Nhớ Unit 10 Đêm 14 III.10 TậpStreaming SIMD Extension (SSE2) Instructions 10 3.Bộ giai mã Lênh Decoder .1 17 Khuôn dạng lênh 4.Allocator Register P4 17 Renamer 15 C KẾT 5.Scheduler LUẬN 16 18 6.Execution Unit 16 19 ...oBáocáobaiotậpolơnomơnohọc:oooooooo oKiếnotrúcoMàotính ĐÊ TAI: Nghiên cứu tìm hiểu thê hệ vi xư ly InTel Pentium IV Nhóm thực hiện:oNhomo3– LơpoKTPM3-K9 Thành vi? ?nthị Leo lan nhóm: Hương... thị Quyên Giáo vi? ?n hướng dẫn:ooNguênoThanhoHai (GV Kiên Trúc Máy Tính) ooooooHaoNơio,ngào1othang o11onămo2015 Mở đầu Nhiệm vụ Nghiên cứu tìm hiểu thê vi xư ly InTel Pentium IV Bố cục * Lich... triên cca VXL Pentium IV Pentium vi xư ly kiên trúc x86 thê thứ Intel san xuất, thiêt kê CPU hoàn toàn cua họ kể tư Pentium III năm 1995 Thiêt kê gọi kiên trúc NetBurst Không Pentium II, Pentium III,