tìm hiểu vi xử lý intel pentium iii
Trang 1HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG KHOA ĐÀO TẠO QUỐC TẾ VÀ SAU ĐẠI HỌC
-********** -BÀI TIỂU LUẬN
Môn: KIẾN TRÚC MÁY TÍNH NÂNG CAO
Chủ đề: “Tìm hiểu vi xử lý Intel Pentium III”
Giáo viên giảng dạy: TS Phạm Văn Cường Nhóm thực hiện: Hoàng Thị Hà
Nguyễn Huyền Trang Phạm Đình Vũ
Hoàng Hoài Nam
Lớp: Cao học Hệ thống thông tin 2013
Trang 2MỤC LỤC
Trang 3NỘI DUNG Phần 1: GIỚI THIỆU
Pentium III ra đời vào mùa xuân năm 1999 với bảng mạch tích hợp các khe cắm PCI (khe cắm mở rộng), đồ họa AGP (khe cắm Card màn hình) Họ vi xử lý Intel Pentium III là một bước nâng cấp từ Pentium II Nhân đầu tiên của Pentium III là Katmai, đặc trưng bởi tập lệnh SSE (Streaming SIMD Extensions), cho phép ứng dụng
xử lý lên tới 4 số thực chính xác đơn cùng lúc Những nhân Pentium khác thêm vào các tính năng khác như 256 và 512 KB trên bộ nhớ đệm L2 và kích thước đóng gói nhỏ hơn Trong suốt vòng đời của nó, lõi bộ vi xử lý đã được thu nhỏ hai lần, từ 0.25 micron tới 0.18 micron, và sau đó là 0.13 micron
Giống như bộ vi xử lý thế hệ trước x86, họ Pentium III bao gồm một vài họ nhỏ hướng tới các phân đoạn khác nhau của thị trường máy tính:
• Pentium III Xeon - phiên bản hiệu suất cao
• Pentium III desktop processors - máy tính để bàn
• Desktop Celeron - phiên bản chi phí thấp
• Mobile Pentium III and mobile Pentium III-M -các phiên bản di động
• Mobile Celeron - phiên bản di động của bộ vi xử lý Intel Celeron
Bộ xử lý Intel Pentium III tích hợp kiến trúc vi xử lý linh hoạt P6, kiến trúc bus độc lập kép DIB (Dual Independent Bus) gồm bus hệ thống đa dịch chuyển và công nghệ cải tiến truyền thông Intel MMX Thêm vào đó, Intel Pentium III cung cấp SSE (Streaming SIMD Extensions), chứa 70 lệnh tăng hiệu suất hoạt động của bộ vi xử lý trong các chức năng xử lý hình ảnh, âm thanh, video 3D, và nhận dạng giọng nói phục
vụ các trải nghiệm Internet nâng cao Các phiên bản cũng bao gồm các công nghệ Advanced Transfer Cache và Advanced System Buffering để đáp ứng các yêu cầu về băng thông dữ liệu lớn hơn của môi trường hiện nay Với hiệu năng tuyệt vời dành cho Internet, các nhà kết nối và các môi trường đa nhiệm, Intel Pentium III nhắm tới phạm
vi chính là người tiêu dùng và doanh nghiệp Bộ xử lý cũng đáp ứng được yêu cầu của các máy trạm và máy chủ mức sơ cấp
Trang 4Phần 2: CẤU TRÚC HỆ THỐNG
Hình 1 là sơ đồ khối của các loại Intel Pentium III Chúng tích hợp kiến trúc vi
xử lý linh hoạt P6, kiến trúc bus độc lập kép DIB (Dual Independent Bus) gồm bus hệ thống đa dịch chuyển và công nghệ cải tiến truyền thông Intel MMX Thêm vào đó, bộ
xử lý Intel Pentium III cung cấp SSE (Streaming SIMD Extensions), chứa 70 lệnh tăng hiệu suất hoạt động của bộ vi xử lý trong các chức năng xử lý hình ảnh, âm thanh, video 3D, và nhận dạng giọng nói phục vụ các trải nghiệm Internet nâng cao Kiến trúc DIB làm tăng băng thông và hiệu suất cho từng bus riêng Công nghệ vi kiến trúc P6 bao gồm khối đoán trước nhiều lệnh rẽ nhánh tĩnh và động (Dynamic Branch Predictor và Static Branch Predictor), phân tích luồng dữ liệu và thực hiện lấy lén
Vi kiến trúc P6 bắt đầu được áp dụng cho Pentium Pro từ năm 1995 và vẫn được
sử dụng cho Pentium III, nhưng linh hoạt hơn Sự linh hoạt ở chỗ nó loại bỏ ràng buộc của trình tự các lệnh giữa các pha đọc và thực hiện truyền thống Có một bộ đệm sắp xếp thứ tự ROB (Recorder buffer) (hình 2) lưu giữ các lệnh chưa thực hiện được ngay
và xác định những phụ thuộc của các thao tác, phân bổ và sắp xếp thứ tự các thanh ghi cho chúng, lập thời gian biểu cho trạm dự phòng RS (Reservation Station)
Hình 1 Sơ đồ khối Pentium III
Trang 5Hình 2 Pha thực hiện thay bằng cặp pha rẽ nhánh/thực hiện và thu hồi trong
kiến trúc P6 lõi.
Pentium III làm việc ở các tần số 450 MHz đến 1,33 GHz Khối giao tiếp bus BIU (Bus Interface Unit) kết nối với 100 đến 133 MHz bus hệ thống với 64 bit và tốc
độ 1 GB/s BIU có các bộ đệm: 4 bộ đệm ghi lại (writeback buffer), 6 bộ đệm làm đầy (full buffer) và 8 của vào hang đợi bus (bus queue entries) Có 32kbyte L1 cache không theo khối, gồm 16kbyte Icache và 16kbyte Dcache Pentium III kết hợp trực tiếp ngay trên chip 256 kbyte L2 ATC (Advanced Transfer Cache) có khối xử lý theo ECC L2 cache là 8 đường liên hợp tập hợp (8 way set associativity), không theo khối
và kết nối qua bus 256 bit trực tiếp với chip vi xử lý Đơn vị tạo địa chỉ AGU (Address Generation Unit) cũng quan trọng như ALU, bởi vì nó chịu trách nhiệm để lưu dữ liệu
từ hoặc tới đúng địa chỉ để nạp hay cất giữ
Pentium III kiến trúc siêu ống lệnh với 10 phân đoạn (hình 3)
Hình 3 Ống lệnh 10 phân đoạn
Các đơn vị thực hiện tính toán số nguyên IEU (Integer Execution Unit) và FPU
có kiến trúc đường ống xử lý các số dấu phảy động 32 bit, 64 bit và 80 bit chính xác kép theo chuẩn 754
Các chipset cho Pentium III
Các chipset của Intel dùng cho các loại Pentium III, Celeron, Xeon phổ biến là
họ Intel 800 (Bảng 5.4) Các chipset 810, 820 còn có thể dùng được cho cả Pentium II
Trang 6Chipset 810 có thể dung cho các vi xử lý Celeron, Pentium II, gồm có hai vi mạch:
82810 GMCH đóng vỏ 412 chân BGA và ICH đóng vỏ 241 chân BGA Chip 82810 GMCH (Graphic and Memory Controller Hub) gồm có: bộ điều khiển bộ nhớ, bộ điều khiển đồ họa với các chế độ 2D, 3D và video Nó hỗ trợ kết nối RAM dung lượng tối
đa 512 MB Các modun nhớ dùng loại SDRAM kết nối qua Bus PC66/100 MHz Chip ICH (I/O Controller Hub) hỗ trợ kết nối PCI 2.2 (6 khe mở rộng Bus PCI), kết nối IDE
Trang 7(2 cổng cho các ổ đĩa cứng), Ultra ATA/66, USB (2 cổng và 1 bộ điều khiển USB), chuột, bàn phím,… Chipset 810 chỉ hỗ trợ hệ thống có 1 bộ vi xử lý Sơ đồ đấu nối Chipset Intel 810 với Pentium III cho ở hình sau:
Chipset 840 có tốc độ dữ liệu với Pentium III cao: 1,0 Gbit/s Sơ đồ khối chức năng kết nối CPU Pentium III với chipset 840 trên bo mạch chủ được mô tả trong hình sau:
Chipset 840 gồm có các chip sau đây:
Trang 8- 82840 : Memory controller Hub- MCH: bộ tập trung điều khiển bộ nhớ, đóng
vỏ 544- pin BGA, giao tiếp với Pentium III qua bus hệ thống 100Mhz tốc độ 1,06 GHz, có giao tiếp AGP4X cho phép các bộ điều khiển đồ họa 3D truy nhập đến bộ nhớ chính với tốc độ 1 Hbit/s, có hai kênh kết nối RDRAM và giao tiếp PCI với hiệu suất I/O cao
- 82801: (I/O Controller Hub- ICH: bộ tập trung điều khiển vào ra): đóng vỏ 241 chân BGA, sử dụng kiến trúc Hub của Intel (IHA Intel Hub Architecture) để kết nối trực tiếp với 82840 MCH Nó hỗ trợ kết nối PCI 32 bit, có bộ điều khiển IDE và bộ điều khiển USB với hai cổng đề kết nối với các thiết bị ngoại vi qua giao tiếp USB, hỗ trợ vi xử lý sử dụng bus hệ thống tốc độ 133MHz Để nâng cao hiệu suất, 2 chip này có thể được kết nối với 2 chip cơ bản sau đây:
o Bộ tập trung điều khiển PCI 82806 64 bit: hỗ trợ các khe PCI 64 bit ở tốc độ 33 hoặc 66 MHz P64H kết nối trực tiếp với 82840 MCH sử dụng kiến trúc IHA
o Bộ tập trung lặp bộ nhớ dựa trên RDRAM 82803 dùng để mở rộng dung lượng RDRAM Nó chuyển đổi từng kênh nhớ thành 2 kênh nhớ cho kết nối
Trang 9Phần 3: ĐẶC TÍNH CÔNG NGHỆ MỚI 3.1 Các tính năng nổi bật
• Bộ xử lý Intel Pentium III có tốc độ trong khoảng từ 450 MHz tới 1.33 GHz
• Phiên bản hiện tại có bus hệ thống 133MHz hoặc 100MHz
• 512 KB Advanced Transfer Cache với mã hiệu chỉnh ECC (Error Correcting Code)
• Các phiên bản kết hợp cổng logic tìm nạp trước dữ liệu (Data Prefetch Logic (DPL), đoán trước dữ liệu mà các ứng dụng cần và nạp trước nó vào Advanced Transfer Cache, được thiết kế để tăng cường hiệu năng của ứng dụng và bộ xử lý
• 32KB (16KB/16KB) non-blocking, bộ nhớ đệm cấp 1 (L1), vi kiến trúc P6 bao gồm dự đoán đa rẽ nhánh, phân tích luồng dữ liệu và thực hiện suy đoán
• Phần mở rộng luồng Internet SIMD- Internet Streaming SIMD Extensions, gồm 70 lệnh cho phép tăng hiệu suất hoạt động của bộ vi xử lý trong các chức năng xử lý hình ảnh, video và âm thanh 3D, nhận dạng giọng nói và các trải nghiệm Internet
• Công nghệ cải tiến truyền thông Intel® MMX™
• Khả năng lưu trữ vùng đệm lên tới 4GB không gian địa chỉ nhớ và khả năng mở rộng bộ nhớ hệ thống lên tới 64GB bộ nhớ vật lý
• Tích hợp dữ liệu và những tính năng tin cậy như Mã hiệu chỉnh lỗi (Error Correction Code), phân tích lỗi (Fault Analysis) và phục hồi cho cả hệ thống và các bus đệm L2
• Các phiên bản dựa trên các tiến trình sản xuất Intel’s 0.13, 0.18 và 0.25 micron để tăng tần số nhân xử lý và giảm thiểu tiêu tốn năng lượng
• Tương thích đầy đủ với các phần mềm kiến trúc Intel hiện có
Các họ bộ xử lý Intel Pentium III hiện nay bao gồm các phiên bản lên đến 1,33 GHz cho máy tính để bàn, cũng như các máy trạm và máy chủ sơ cấp Tất cả đều tương thích với các bộ xử lý Intel thế hệ trước
3.2 Pentium III Cache
Hệ thống con cache được sử dụng trong các thiết kế bộ xử lý Pentium III bao gồm cả cache chính mức 1 và cache thứ cấp mức 2 Cache mức 1 -32K, non blocking
và cache mức 2 non blocking 256K cung cấp truy cập nhanh tới những lệnh và dữ liệu lớn đã dùng gần đây Bộ nhớ cache thứ cấp này cũng hỗ trợ việc giảm thời gian truy cập bộ nhớ trung bình
Trang 10Non- blocking Level 1 cache
Bộ xử lý Intel Pentium III gồm hai bộ cache mức L1 dung lượng 16KB độc lập, một dùng cho các chỉ lệnh và cache còn lại dùng cho dữ liệu, tăng cường hiệu năng tổng thể hệ thống
Với kích thước của bộ cache mức 1 (nhỏ hơn nhiều lần dung lượng của một chương trình trung bình cỡ Megabyte) hoặc một ổ đĩa cứng (Gigabyte), cần bổ sung một vùng nhớ Cache mức 2 (độc lập với chip RAM) được thêm vào cache bên trong
để hoạt động như là một vùng nhớ bổ sung Phần này của cache L2 sử dụng SRAM (RAM tĩnh) nhanh hơn 4/5 lần DRAM và cung cấp toàn bộ ưu điểm như bộ cache nói chung Sự ra đời của cache mức 2 cho phép mở rộng hệ thống tới 2 bộ xử lý và 64 GB
bộ nhớ vật lý cũng như cung cấp khả năng lưu trữ vùng đệm lên tới 4GB không gian địa chỉ nhớ
Non-Blocking Level 2 Cache
Một số phiên bản của bộ xử lý Intel Pentium III bao gồm một bộ cache L2 rời rạc, off- die Bộ cache L2 này chứa một cache thống nhất, non- blocking 256KB, cải thiện hiệu suất qua các giải pháp cache trên bo mạch chủ bằng cách giảm thời gian truy cập bộ nhớ trung bình và cung cấp truy cập nhanh cho các lệnh và dữ liệu đã được
sử dụng gần đây Hiệu suất thực hiện cache trên bo mạch chủ cũng được nâng cao thông qua bus cache chuyên dụng 64 bit
Non- blocking cache hay còn gọi là lookup- free cache lần đầu tiên được đề xuất bởi Kroft [15], bao gồm 3 đặc điểm sau:
1 Vận hành tải là không chia khối
2 Các thao tác ghi không chia khối
3 Cache có khả năng phục vụ nhiều yêu cầu miss cache
Để cho phép các lệnh không chia khối, và phục vụ đa trễ, Kroft đã đưa ra thanh ghi MSHR lưu lại thông tin liên quan đến các yêu cầu chưa được xử lý Mỗi cổng MSHR bao gồm:
1 Địa chỉ khối dữ liệu
2 Khung bộ nhớ cache cho khối
3 Từ gây ra mis trong khối
4 Đơn vị chức năng hoặc thanh ghi mà dữ liệu được chuyển tới
Trang 11Các tải non- blocking là những tính năng cụ thể trong bộ vi xử lý, các thao tác ghi non blocking được hỗ trợ bởi bộ ghi đệm, khi đó, nếu cache có cho phép nhiều truy cập cùng đồng thời chờ xử lý hay không, phụ thuộc không chỉ vào thanh ghi MHSR mà còn phụ thuộc vào băng thông có sẵn của cache, như đã được xác định bởi giao diện giao tiếp giữa cache và modul nhớ
Các tải không chia khối yêu cầu hỗ trợ thêm thanh ghi MSHR kết hợp với cache non blocking vào đơn vị thực thi của vi xử lý Nếu lịch trình các chỉ lệnh tĩnh trong pipeline được sử dụng trong vi xử lý, cần có một bit trống hoặc đầy trong thanh ghi để lưu trữ những phụ thuộc dữ liệu đúng Trong trường hợp lập lịch cho các chỉ lệnh động, đưa ra thực thi ko có thứ tự (out of order), một vài cơ chế bảng ghi được yêu cầu Cả hai chiến lược lập lịch đều cần ngắt xử lý các lịch trình mà có thể giải quyết với các ngắt của lệnh ko chia khối
Các vùng ghi đệm được dùng để loại bỏ các ngăn trong thao tác ghi Chúng cho phép bộ vi xử lý tiếp tục thực thi mặc dù có một vài lệnh ghi chưa được hoàn tất Các
bộ ghi đệm kết hợp với bộ nhớ cache ghi đặc biệt hữu ích trong việc giảm lỗi ghi Đối với cache ghi lại, các vùng đệm cache được dùng để lưu trữ tạm các giá trị được ghi cho đến khi dòng dữ liệu được trả về Một vài thực thi cho phép ghi nhiều lần trên cùng 1 dòng kết hợp, do đó, giảm tổng số lần ghi cho mức tiếp theo của mô hình bộ nhớ phân cấp Một ví dụ khác của bộ ghi đệm là bộ đệm ghi lại(write- back buffer) dùng cho lưu trữ tạm thời những khối được thay thế trong bộ nhớ ghi lại
Trong Pentium III, hiệu suất bộ xử lý được nâng cao thông qua bus cache 64 bit chuyên dụng Bộ xử lý cũng có sẵn EEC- chức năng mã hiệu chỉnh trên bus cache mức
2, đặc biệt cho các ứng dụng yêu cầu bắt buộc độ tin cậy hoặc mật độ dữ liệu
3.3 Advanced Transfer Cache 256KB mức L2
ATC bao gồm những cải tiến để cung cấp một giao diện băng thông dữ liệu lớn hơn giữa cache L2 và nhân bộ xử lý mà hoàn toàn có khả năng mở rộng tần số nhân xử
lý Các tính năng của ATC bao gồm:
• Non-Blocking, tốc độ đầy đủ, bộ cache on-die mức 2
• Liên kết 8 đường
• Bus dữ liệu 256 bit với bộ cache mức 2
• Giao diện giảm độ trễ đối với cache dữ liệu (so sánh với lưu trữ rời rạc)
Trang 123.4 Advanced System Buffering
Advanced System Buffering bao gồm sự tối ưu hóa kích thước vùng đệm bus hệ thống và bảng ghi hàng đợi bus, dẫn đến việc tăng việc sử dụng băng thông có sẵn trong bus hệ thống 100 và 133MHz
• 4 writeback buffers
• 6 fill buffers
• 8 cổng hàng đợi bus
3.5 Bus độc lập kép- Dual Independent Bus (DIB)
Bộ xử lý Intel Pentium III hỗ trợ kiến trúc hiệu năng cao Dual Independent Bus (DIB) Kiến trúc DIB đặt mức 2 bộ nhớ đệm đã trình bày như trên, bus đệm tốc độ cao cho phép bus hệ thống được giải phóng từ cache Kiến trúc này cung cấp băng thông
hệ thống tổng thể cao hơn đáng kể và cho phép cải thiện đáng kể hiệu năng và khả năng mở rộng hệ thống
3.6 Bus hệ thống 133MHz
Bus hệ thống chạy ở tốc độ 100 MHz hoặc 133 MHz cho phép tăng 33% băng thông có sẵn cho bộ xử lý (bus hệ thống trên 100MHz) Bus hệ thống hỗ trợ đa giao dịch quá hạn để tăng tính có sẵn của băng thông Nó cũng cung cấp “glueless” hỗ trợ hai bộ xử lý (chỉ có gói S.E.C.C.2 ) Điều này làm cho chi phí thấp, đa xử lý đối xứng hai chiều, tăng cường hiệu suất đáng kể cho các hệ điều hành đa nhiệm và các ứng dụng đa luồng
Các tính năng quan trọng khác của bộ xử lý Intel Pentium III:
- Đơn vị đường ống dấu chấm động để hỗ trợ các định dạng 32 bit và 64 bit quy định tại tiêu chuẩn IEEE 754 cũng như định dạng 80 bit
- Các tín hiệu chẵn lẻ của bus hệ thống địa chỉ/ yêu cầu- đáp ứng với cơ chế thử lại để đảm bảo tin cậy và toàn vẹn dữ liệu
3.7 P6 Dynamic Execution Microarchitecture
Dự đoán đa nhánh: dự báo thực hiện chương trình thông qua nhiều nhánh, tăng tốc luồng công việc cho bộ xử lý
Phân tích luồng dữ liệu: tạo ra một lịch trình các câu lệnh được tối ưu hóa và sắp xếp lại bằng cách phân tích các phụ thuộc dữ liệu giữa các lệnh
Trang 13Thực hiện suy đoán: thực hiện các lệnh một cách phỏng đoán và dựa trên lịch trình đã được tối ưu, đảm bảo rằng các đợn vị thực thi superscalar, của bộ xử lý luôn duy trì thực hiện, đẩy mạnh hiệu suất chung
3.8 Internet Streaming SIMD Extensions
Internet Streaming SIMD Extensions bao gồm 70 lệnh đơn, đa dữ liệu dấu chấm động, số nguyên SIMD và các lệnh điều khiển khả năng cache Một vài lợi ích đối với máy tính để bàn và các ứng dụng Internet của ISSE:
• Có thể xem và thao tác với các hình ảnh có độ phân giải và chất lượng cao hơn trước đây
• Âm thanh chất lượng cao, video MPEG 2, mã hóa và giải mã đồng thời MPEG2
• Sử dụng CPU cho nhận dạng giọng nói cũng như độ chính xác cao hơn và thời gian đáp ứng nhanh hơn
70 lệnh mới:
Các tính năng SSE trong Katmai chia thành hai loại: các chỉ lệnh SIMD và các tính năng phân luồng bộ nhớ (memory-streaming feature) Mục đích của các chỉ lệnh SIMD là để tăng tốc độ xử lý dữ liệu dạng vector – loại phổ biến nhất trong các ứng dụng đa phương tiện Các chỉ lệnh SIMD cung cấp cho các phần mềm phương thức để biểu diễn tính song song vốn có trong loại dữ liệu này, do đó phần cứng có thể dễ dàng
xử lý nó song song
SSE bao gồm các lệnh số nguyên và các lệnh dấu chấm động SIMD Các lệnh số nguyên thực ra chỉ là phần mở rộng của tập lệnh MMX Tuy nhiên Intel đề cập đến chúng như là "những chỉ lệnh truyền thông mới" (new-media instructions) Cái tên khiến khách hàng dễ hiểu hơn và tránh những ý kiến cho rằng MMX còn thiếu sót, chẳng hạn như việc thiếu khả năng nén video
Các lệnh truyền thông, liệt kê trong bảng dưới đây, sẽ đẩy nhanh các tác vụ đa phương tiện quan trọng mà MMX đáp ứng kém Ví dụ, các lệnh PMAX và PMIN, các lệnh quan trọng đối với thuật toán tìm kiếm Viterbi được sử dụng trong nhận dạng giọng nói, không có trong MMX Các lệnh trung bình (PAVG) được bổ sung để tăng tốc độ giải mã video, và các lệnh Sum of Absolute Differences (PSADBW) đã được thêm vào để tăng tốc độ tìm kiếm chuyển động trong mã hóa video
Để tiết kiệm silicon, Intel sử dụng một thủ thuật thông minh để thực thi PSADBW Lệnh được đưa ra thành ba µop: µop đầu tiên tính toán hiệu số (Ai–Bi) và