Hiện naytốc độ nhanh nhất của bộ xử lý có ừên thị trường là trên 2 GHz hay hơn hai tỷ xung nhịp mỗi giây.Một số người thích sử dụng thủ thuật "ép" xung để chạy ở tốc độ cao hơn, nhưng nê
Trang 1GVHD: Nguyễn Minh Hùng Đề tài: Tìm Hiểu & Nghiên Cứu CPU
Chương IGIỚI THIỆU YỀ CPUI/ KHÁI NIỆM CPU :
CPU là từ viết tắt của cụm Central Processing Unit (Đơn Yị Xử Lý Trung Tâm), làmột bộ phận tính toán chính của máy tính Nó được cấu thành bởi đơn vị số học-lôgic(ALU) và đơn vị điều khiển Ngày nay, CPU trong hầu hết các máy tính được chứa trọnvẹn trên một chip đơn
CPU, đồng hồ và bộ nhớ là những thành phần chính yếu tạo nên máy vi tính của bạn
Nhưng một hệ thống máy tính hoàn chỉnh cần đòi hỏi thêm các thành phần khác như: cácđơn vị điều khiển, các thiết bị nhập, xuất và lưu trữ dữ liệu và một hệ điều hành
Chiếc máy tính mà bạn dùng để đọc trang thông tin của chúng tôi sử dụng một CPU và
nó đang giúp bạn làm công việc này CPU có thể được xem như "quả tim" của bất cứ mộtmáy tính thông thường nào, dù nó là máy tính để bàn, máy chủ hay máy tính xách tay
CPU của bạn có thể là loại Pentium, K6, PowerPC, Sparc hay bất cứ một nhãn hiệu hayloại CPU nào, nhưng tất cả chúng đều thực hiện gần như cùng một thứ và với cách thứcgần như nhau
Neu như bạn đã từng tự hỏi không biết CPU trong máy tính của bạn đang làm gì, hoặcnếu bạn quan tâm về sự khác biệt giữa các loại CPU, thông tin mà chúng tôi cung cấp sẽgiúp bạn tìm hiểu xem làm sao mà các kỹ thuật luận lý số vô cùng đơn giản lại cho phépmáy tính làm rất nhiều việc, từ chơi game, soạn văn bản cho đến việc đọc thư điện tử haynghe nhạc, xem phim
II/GIỚI THIỆU YỀ CPU INTEL
1 Sơ LƯỢC YỀ TẬP ĐOÀN INTEL:
Tập đoàn Intel (Integrated Electronics) thành lập vào ngày 18/7/1968, lúc đó là tậpđoàn hợp nhất về thiết bị điện tử, sản xuất ờ Santa Clara, (Caliíòmia, USA) bởi nhàhoá học kiêm vật lí học Gordon E.Moore và Robert Noyce, sau khi họ đã rời khỏicông ty Fairchild Semiconductor
2 CÁC DÒNG CPU DESKTOP CỦA INTEL:
2.1Pentium 3:
> Pentium III Katmai: : tốc độ: 600 MHz ,FSB:100MHz, 32KB cache 11, 512KB cache 12,Socket242(slot 1) ,sản xuất trên công nghệ: 0,25|xm ,côngxuất tiêu thụ 34.5w
> Pentium IIIXEON :ra đời năm 1999,tốc độ: 600MHz,FSB:133MHz,32KB cache 11,256 KB cache 12,Socket
Trang 2GVHD: Nguyễn Minh Hùng Đề tài: Tìm Hiểu & Nghiên Cứu CPU
SC330(slot2),công nghệ sản xuất 0.18|i.m,công xuất tiêu thụ 19.2w
> Core 2 Quad Q6600: có 4 nhân xử lý,tốc độ 2.4GHz,FSB 1066MHz,8MB cache 12,Socket 775,công xuất tiêu thụ ,sản xuất trên công nghệ 65mn
> Core Ĩ3 530:tốc độ 2.93GHz,FSB:2.5GT/s ,4MB cache L2,Socket 1156,công xuất tiêu thụ 73 w,sản xuất trên công nghệ 32nm
Trang 3GVHD: Nguyễn Minh Hùng Đề tài: Tìm Hiểu & Nghiên Cứu CPU
2.8 Core Ĩ5:
> Core Í5 750: ra đời năm 2009, có 4 nhân ,tốc độ3.2GHz,FSB: 2.5GT/s,8MB cache,Socket 1156,công nghệsản xuất :45mn, công xuất tiêu thụ 95w
2.9 Core Ĩ7:
> Core Ĩ7 920: có 4 nhân,tốc độ 2.93GHz,FSB:4.5GT/s,8MB cache,Socket 1156,công nghệ sản xuất45nm,công xuất tiêu thụ 130w
3 CÁC DÒNG CPU LAPTOP CỦA INTEL:
3.1 Pentium 3:
- Pentium III Mobile :tốc độ: 800MHz ,FSB: 100Mhz ,32KBcache Ll,256KB cache 12,Socket 370, công nghệ sảnxuất: 0.13|xm,công xuất tiêu thụ 0.95v
Công nghệ sản xuất: 65mn ,công xuất tiêu thụ 31 w
Trang 4GVHD: Nguyễn Minh Hùng Đề tài: Tìm Hiểu & Nghiên Cứu CPU
3.4 Core 2 Duo :
> Intel Core 2 Duo T7300 ra đời năm 2007,2 nhân,tốc độ:
2.00GHz, FSB:800MHz,Socket P,4MB cache12,công nghệ sản xuất: 65mn,công xuất tiêu thụ35w
3.5 Core 2 Quad :
> Core 2 quad Q9000:ra đời năm 2009,4 nhân,tốc độ:
2.0GHz,FSB: 1066MHz,Socket,6MB cache ,công nghệ sảnxuất 45nm,công xuất tiêu thụ 45w
3.6 Core 2 solo :
> Core™2 Solo Processor ULV SU3500, 1.4 Ghz, 3 MB,L2 Cache, Mobile Intel GS45 Express ChipỢCH 9),
1066 Mhz, 2 GB, DDR m RAM, 1066 MHz, IntelGraphics Media Accelerator 4500MHD, 512 MB,
3.7 Core Ĩ3 :
Core Ĩ3 330:ra đời 01/2010,2 nhân,tốc độ2.13GHz,FSB:2.5GT/s,3MB cache,Socket,công nghệsản xuất 32mn,công xuất tiêu thụ 35w
!l ệ Core’ i3, i5, Í7 processor
3.8 Core Ĩ5 :
> Core Ì5 430M:ra đời quý 1 năm 2010,2 nhân ,tốcđộ:2.5GHz,FSB 2.5Gt/s,3MB cache,Socket M,công nghệsản xuất 32nm,công xuất tiêu thụ 35w
3.9 Core Ĩ7
> Core Ì7 -72QM:ra đời năm 2009,4 nhân,tốcđộ:2.8GHz,FSB:2.5GT/s,6MB cache,Socket,công nghệsản xuất 45nm,công xuất tiêu thụ 45w
Trang 6GVHD: Nguyễn Minh Hùng Đề tài: Tìm Hiểu & Nghiên Cứu CPU
III/ GIỚI THỆU VỀ CPU AMD :
1 Sơ LƯỢC YỀ TẬP ĐOÀN AMD:
AMD - Advanced Micro Devices ; Inc - (Caliíòmia, USA): là một công ty chuyên về sản xuấtcác chất bán dẫn Hoa Kì Công ty có đại bản doanh ở Sumiyvale - Caliíòmia này được thành lậpnăm 1969 do Jerry Sanders và nhóm nhân viên cũ của Faừchild Semiconductor sáng lập, bao gồmJerry Sanders, Ed Tumey, John Carey, Sven Simonsen, Jack Gifford và ba thành viên củaGifford's team là Frank Botte, Jim Giles, và Larry Stenger Hiện nay chủ tịch hội đồng quản trị và
là tổng giám đốc là Tiến sĩ Hector Ruiz, chủ tịch tập đoàn và là giám đốc điều hành là ngài DừkMeyer
Nhà sản xuất các thiết bị bán dẫn nổi tiếng như các CPU tương thích dòng x86 (x86compatible CPU), các bộ xử lý nhúng (embedded processor), các bộ nhớ truy cập nhanh (ílashmemory), các thiết bị lập trình logic và các thiết bị mạng AMD là công ty đầu tiên sản xuất các bộ
xử lý tương thích 386 và 486 vào các năm 1991, 1993 và là đối thủ cạnh tranh trực tiếp của hãngIntel cho đến ngày nay với các bộ vi xử lý công nghệ mới
AMD bắt cháy các sản phẩm và công nghệ thế hệ kế tiếp của máy tính với các giải pháp antoàn, sức mạnh, độ tin cậy và sự nhanh nhẹn Enjoy a better experience gaming, cloud computing
or editing home videos with the best AMD product for you Thưởng thức một kinh nghiệm tốthơn chơi game, điện toán đám mây hoặc chỉnh sửa video gia đình với sản phẩm AMD tốt nhấtcho bạn
2 CÁC DÒNG CPU DESKTOP CỦA AMD:
2.1 AMD Athlon™ IIX2 :
AMD Athlon™ IIX2 550 3.1GHZ,fsb 4000MHZ ,2x512cache 12,6MB cache 13,Socket AM3, công xuất tiêu thụ 80w,sản xuất theo công
nghệ 45nm
2.2 AMD Athlon IIX3 :
AMD Athlon IIX3 425 2.7GHz,FSB 2000MHz,512mb cache12,Socket am3+/am3,công xuất tiêu thụ 95w,sản xuất theo công nghệ 45mn
2.3 AMD Athlon™ II X4 :
GVHD: Nguyễn Minh Hùng Đề tài: Tìm Hiểu & Nghiên Cứu CPU
AMD Athlon™ IIX4 620 2.6GHz,FSB 4000MHz,2MBcache 12,Socket am3,công xuất tiêu thụ 95w,sản xuất theo công nghệ 45mn
2.4 AMD Phenom™ IIX2 :
AMD Phenom™ IIX2 240 2.80GHz,FSB 4000MHz,2xlmb cache 12
2.5 AMD Phenom™ IIX3 :
AMD Phenom™ IIX3 710 2.6GHz,FSB 4000MHz,3x512kbcache 12,6mb cache 13,tiêu thụ điện năng 95w,Socket am3,công nghệ sản xuất
45nm
2.6 AMD Phenom™ IIX4 :
AMD Phenom™ IIX4 945 3.0GHz,FSB 4000 MHz,2mb cache12,6mb cache 13,Socket AM3 ,công xuất tiêu thụ 125w,công nghệ sản xuất 45nm
2.7 Athlon™ X2 Dual-Core :
Athlon™ X2 Dual-Core 250,3.0GHz,FSB 4000MHz,2mbcache 12,Socket am3,công xuất tiêu thụ 65w,công nghệ sản xuất 45mn
2.8 AMD Sempron™ LE:
> —* AMD Sempron™ LE-1250 ,2.2GHz,FSB 800MHz,512KB
cache 12, Socket am2,công xuất tiêu thụ 45w,sản xuất theo công nghệ 65mn
3 CÁC DÒNG CPU LAPTOP CỦA AMD:
Trang 7GVHD: Nguyễn Minh Hùng Đề tài: Tìm Hiểu & Nghiên Cứu CPU
2.9 AMD Turion™ 64 X2 Mobile :
> AMD Turion™ 64 X2 Mobile Technology TL-58: 1.9 GHz , 2x128KB cache 11,512 x2KB cache12,Socket sl,sản xuất theo công nghệ 65mn,côngxuất tiêu thụ 95w
2.10 Athlon neo X2 :
> Athlon neo X2 L510:1600MHz, 1MB cache12,FSB:800MHz,Socket ASBl,sản xuất theo côngnghệ,công xuất tiêu thụ 18w
IV
Bảng Giới Thiêu:
l Bảng giới thiệu sản phẩm đại diện của Intel:
1 1.1 Intel Pentium III Katmai
1.2 Intel Pentium IIIXEON 1.1 Intel - Pentium III Mobile Processor T2130
2 2.1 Intel Pentium IV
2.2 Intel Pentium D
2.1 Intel Mobile Pentium 4 M 518
3 3.1 Intel Dual Core E6500 3.1 Intel Pentium Dual-Core Mobile
Processor T2130
5 5.1 Intel Core 2 Duo T7300 5.1 Intel Core 2 Duo T7300
6 6.1 Intel Core 2 Quad Q6600 6.1 Intel Core 2 quad Q9000
7 7.1 Intel Core Ĩ3 530 7.1 Intel Core Ĩ3 330
8 8.1 Intel Core Ĩ5 750 8.1 Intel Core Ì5 430M
9 9.1 Intel Core Ì7 920 9.1 Intel Core i7 -72QM
2 Bàng giới thiệu sản phẩm đại diện của AMD :
1 1.1 AMD Athlon™ IIX2 550
2 2.1 AMD Athlon IIX3 425
3 3.1 AMD Athlon™ IIX4 620
4 4.1 AMD Phenom™ IIX2 240
5 5.1 AMD Phenom™ IIX3 710
GVHD: Nguyễn Minh Hùng Đề tài: Tìm Hiểu & Nghiên Cứu CPU
6 6.1 AMD Phenom™ IIX4 945
7 7.1 AMD Athlon™ X2 Dual-Core 250
8 8.1 AMD Sempron™ LE-1250
echnology TL-58
CHƯƠNG II: CẮU TAO VẢ NGUYÊN LÝ HOAT ĐÔNG CỦA CPU:
I/ĐẶC TRƯNG CỦA CPU
1/ Tốc độ làm việc:
Tốc độ xử lý của CPU được quyết định bởi các yếu tố :
- Độ rộng Bus dữ liệu và Bus địa chỉ ( Data Bus và Add Bus )
- Tốc độ xử lý và tốc độ Bus (tốc độ dữ liệu ra vào chân ) còn
gọi là FSB
- Dung lượng bộ rihớ đệm Cache
(Ngoài ra ngày nay tốc độ của CPU còn phụ thuộc vào số lượng nhân của CPU - thật ra
mỗi nhân được xem như 1 CPU)
Độ rộng của bus dữ liệu và bus địa chỉ (data bus and address bus):
- Độ rộng Bus dữ liệu là nói tới số lượng đườngtruyền dữ liệu
bên trong và bên ngoài CPU
- Như ví dụ hình dưới đây thì CPU có 12 đườngtruyền dữ liệu
(ta gọi độ rộng Data Bus là 12 bit)
Minh họa bên trong CPU cổ 12 đường truyền dữ liệu gọi là Data Bus có 12 bit
Tương tự như vậy thì độ rộng Bus địa chỉ (AddBus ) cũng là số đường dây truyền các thông tin
Giả sử : Nếu số đường địa chỉ là 8 đường thì CPU sẽ quản lý được 28 = 256 địa chỉ Hiện
nay trong các CPU Pentium 4 có 64 bít địa chỉ và như vậy chúng quản lý được 264 địa
chỉ nhớ Ngoài ra còn có nhiều công nghệ làm tăng tốc độ xử lý của CPU Yí dụ công
nghệ Core hay Nehalem
Tốc độ xử lý của CPU (Speed ):
- Là tốc độ chạy bên trong của CPU, tốc độ này được tính MHz hoặc GHz
- Thí dụ một CPU Pentium 3 có tốc độ 800MHz tức là nó dao động ở tần số
800.0 000 Hz , CPU Pentium 4 có tốc độ 2,4GHz tức là nó dao động ở tần số
GVHD: Nguyễn Minh Hùng
Trang 8Đề tài: Tìm Hiểu & Nghiên Cứu CPU
Gồm bốn thanh ghi cs, DS, ES, ss, dùng để chứa địa chỉ đoạn Bộ nhớ trong 1MB của CPU
8088 được chia thành các đoạn, mỗi đoạn chứa tối đa 64 KB, ở mỗi thời điểm CPU chỉ có thểtruy xuất tối đa 4 đoạn được xác định bởi 4 thanh ghi cs, DS, ES và ss Cụ thể:
■ Thanh ghi cs (Code Segment): dùng để chứa địa chỉ đoạn của đoạn chứa mã lệnh
■ Thanh ghi DS (Data Segment): dùng để chứa địa chỉ đoạn của đoạn chứa dữ liệu
■ Thanh ghi ES (Extra Segment): dùng để chứa địa chỉ đoạn của đoạn chứa dữ liệu bổ sung
■ Thanh ghi đoạn ss (Stack Segment): dùng để chứa địa chỉ đoạn của đoạn chứa Stack
c Con trỏ lệnh IP (Instruction Pointer)
Dùng để xác định địa chỉ offset của ô nhớ chứa mã lệnh của lệnh kế tiếp sẽ được CPU thi hành (ônhớ này nằm trong đoạn được xác định bởi thanh ghi CS)
Khi CPU thực hiện một lệnh, thanh ghi IP sẽ tự động thay đổi để chỉ đến địa chỉ offset của ô nhớchứa lệnh sẽ được CPU thi hành kế tiếp
5/ BUS địa chỉ (Address BUS):
BUS địa chỉ là dụng cụ để CPU có thể xác định và nhận ra vị trí của các thiết bị trong hệ thống.Các thiết bị này có thể là các ô nhớ, các cổng giao tiếp, số lượng đường dây trên BUS địa chỉ phụthuộc vào từng loại VXL, có thể là 16, 20 hay nhiều hơn Yới bộ VXL 8086/8088 thì BUS địa chỉ
có 20 đường dây ký hiệu từ Ao -> Ai9, như vậy có 220 vị trí địa chỉ có thể phân biệt được
6/ BUS dữ liệu (Data BUS):
BUS dữ liệu (Data BUS) dùng để chuyển thông tin (gồm cả dữ liệu và lệnh) giữa bộ VXL với cácthiết bị khác trong hệ thống
Quá trình chuyển thông tin từ bộ VXL đến các thiết bị khác trong hệ thống (có thể là bộ nhớ hay các thiết bị ngoại vi) được gọi là thao tác ghi (Write Operation), ngược lại quá trình nhận số liệu vào bộ VXL từ các thiết bị ngoại vi được gọi là thao tác đọc (Read Operation) Như vậy BUS dữ liệu vừa phải thu và phát thông tin nên nó là BUS hai chiều (Bidừectional BUS) Tất nhiên không thể thu phát đồng thời cùng một lúc được
Bộ VXL Intel 8088 có điểm khác nhau quan trọng với 8086 là nó chỉ có BUS dữ liệu 8 bít thay vì
16 bít Đặc biệt trong họ VXL Intel (80X86), đều sử dụng kỹthuật Multiplex các đường dây củaBUS địa chỉ và dữ liệu Cụ thể đó là quá trình dùng chung các đường dây (các chân ra) nhưng lúcthì làm việc này, lúc thì làm việc khác, tức là thực hiện các công việc khác nhau ừong các thờigian khác nhau Khi đóng vai trò BUS dữ liệu các
Trang 9GVHD: Nguyễn Minh Hùng Đề tài: Tìm Hiểu & Nghiên Cứu CPU
đường dây sẽ truyền thông tin cho các thiết bị của hệ thống, ngược lại khi đóng vai trò BUS địachỉ, cũng chính các đường dây này được dùng để gửi ra các tín hiệu địa chỉ
7/ BUS điều khiển (Control BUS):
BUS điều khiển (Control BUS) Ịà tập hợp các đường dây điều khiển dùng để điều khiển các tác
vụ của hệ thống BUS điều khiển có từ 4 đến 10 đường tín hiệu, được sinh ra từ CPU, các tínhiệu điều khiển điển hình là: MEMR (MEMory Read), MEMW (MEMory Write), IOR (I/ORead) và IOW (I/O Write)
Ví dụ: khi muốn đọc một byte từ một vùng nhớ, CPU trước hết gửi địa chỉ vùng nhớ đó ra BUS địa chỉ, sau đó đưa ra tín hiệu Memory Read ra BUS dữ liệu Tín hiệu Memory Read sẽ kích hoạt thiết
bị nhớ để thiết bị này gửi số liệu ra BUS dữ liệu, số liệu này theo BUS dữ liệu về CPU
Định thời chu kỳ bus
Mỗi chu kỳ bus bắt đầu bằng việc xuất địa chỉ bộ nhớ hoặc I/O port (chu kỳ xung nhịp Tl) Với
8086 thì địa chỉ này có thể là địa chỉ bộ nhớ 20 bit, địa chỉ I/O gián tiếp 16 bit (thanh ghi DX) hay địa chỉ I/O trực tiếp 8 bit Bus điều khiển có 4 tín hiệu tác động mức thấp là MEMR, MEMW, IOR
và IOW
Các chuỗi sự kiện xảy ra trong một chu kỳ bus đọc bộ nhớ:
TI: CPU xuất địa chỉ bộ nhớ Các đường dữ liệu không hoạt động và các đường điều khiển bị cấm
T2: Đường điều khiển MEMR xuống mức thấp Đơn vị bộ nhớ ghi nhận chu kỳ bus này là quá trìnhđọc bộ nhớ và đặt byte hay word có địa chỉ đó lên bus dữ liệu
T3: CPU đặt cấu hình để các đường bus dữ liệu là nhập Trạng thái này chủ yếu để bộ nhớ có thời gian tìm kiếm byte hay word dữ liệu T4: CPU đợi dữ liệu ừên bus dữ liệu Do đó, nó thực hiện chốt bus dữ liệu và giải phóng các đường điều khiển đọc bộ nhớ Quá trình này sẽ kết thúc chu kỳ bus
Trong một chu kỳ bus, CPU có thể thực hiện đọc 1/0, ghi 1/0, đọc bộ nhớ hay
ghi bộ nhớ Các đường bus địa chỉ và bus điều khiển dùng để xác định địa chỉ bộ nhớ hay
I/O và hướng truyền dữ liệu trên bus dữ liệu
Chú ý rằng CPU điều khiển tất cả các quá trình trên nên bộ nhớ bắt buộc phải cung cấp được dữ liệuvào lúc MEMR lên mức cao trong trạng thái T4 Nếu không,
CPU sẽ đọc dữ liệu ngẫu nhiên không mong muốn trên bus dữ liệu Để giải quyết vấn đề này, ta có thể dùng thêm các trạng thái chờ (wait State)
8/ Kiến trúc nội:
CPU có khả năng thực hiện các tác vụ dữ liệu theo tập lệnh bên trong Một lệnhđược ghi nhận bằng mã đã được định nghĩa trước, gọi là mã lệnh (opcode) Trước khithực thi một lệnh, CPU phải nhận được mã lệnh từ bộ nhớ chương trình của nó Quátrình xử lý
Trang 10GVHD: Nguyễn Minh Hùng Đề tài: Tìm Hiểu & Nghiên Cứu CPU
này gọi là chu kỳ nhận lệnh (fetch cycle) Một khi các mã được nhận vàđược giải mã thì mạch bêntrong CPU có thể tiến hành thực thi (execute) mã lệnh
BIU (Bus Interýace Unỉt - đơn vị giao tiếp bus) nhận các mã lệnh từ bộ nhớ và đặt chúng vào hàng
chờ lệnh EU (Execute Unit - đơn vị thực thi) sẽ giải mã và thựchiện các lệnh trong hàng Chú ý rằng các đơn vị EU và BIU làm việc độc lập vớinhaunên BIU có khả năng đang nhận một lệnh mới trong khi EU dang thực thi lệnh trướcđó Khi EU đã thực hiện xong lệnh, nó sẽ lấy mã lệnh kếtiếp trong hàng lệnh(instruction queue)
Nói một cách bài bản, cache là một cơ chế lưu trữ tốc độ cao đặc biệt Nó có thể là một vùng lưu trữ của bộ nhớ chính hay một thiết bị lưu trữ tốc độ cao độc lập
Có hai dạng lưu trữ cache được dùng phổ biến trong máy tính cá nhân là memory caching (bộ nhớcache hay bộ nhớ truy xuất nhanh) và disk caching (bộ nhớ đệm đĩa)
a/ Memory cache:
Đây là một khu vực bộ nhớ được tạo bằng bộ nhớ tĩnh (SRAM) có tốc độ cao nhưng đắt tiềnthay vì bộ nhớ động (DRAM) có tốc độ thấp hơn và rẻ hơn, được dùng cho bộ nhớ chính Cơ chếlưu trữ bộ nhớ cahce này rất có hiệu quả Bởi lẽ, hầu hết các chương trình thực tế truy xuất lặp đilặp lại cùng một dữ liệu hay các lệnh y chang nhau Nhờ lưu trữ các thông tin này trong SRAM,máy tính sẽ khỏi phải truy xuất vào DRAM vốn chậm chạp hơn
Một số bộ nhớ cache được tích hợp vào trong kiến trúc của các bộ vi xử lý Chẳng hạn, CPU Intelđời 80486 có bộ nhớ cache 8 KB, trong khi lên đời Pentium là 16 KB Các bộ nhớ cache nội(intemal cache) như thế gọi là Level 1 (Ll) Cache (bộ nhớ đệm cấp 1)
Các máy tính hiện đại hơn thì có thêm bộ nhớ cache ngoại (extemal cache) gọi là Level 2 (L2) Cache (bộ nhớ đệm cấp 2) Các cache này nằm giữa CPU và bộ nhớ hệ thống DRAM Sau này, donhu cầu xử lý nặng hơn và với tốc độ nhanh hơn, các máy chủ (server), máy trạm (workstation) vàmới đây là CPU Pentium 4 Extreme Edition được tăng cường thêm bộ nhớ đệm L3 Cache
CPU Slot 1 dạng cartridge với L2 Cache nằm cạnh nhân CPU
b/ Disk cache:
Bộ nhớ đệm đĩa cũng hoạt động cùng nguyên tắc với bộ nhớ cache, nhưng thay vì dùngSRAM tốc độ cao, nó lại sử dụng ngay bộ nhớ chính Các dữ liệu được truy xuất gần đây nhất từđĩa cứng sẽ được lưu trữ trong một buffer (phần đệm) của bộ nhớ Khi chương trình nào cần truyxuất dữ liệu từ 0 đĩa, nó sẽ kiểm ưa trước tiên trong bộ nhớ đệm đĩa xem dữ liệu mình cần đang cósẵn không Cơ chế bộ nhớ đệm đĩa này có công dụng cải thiện một cách đáng ngạc nhiên sứcmạnh và tốc độ của hệ thống Bởi lẽ, việc
Trang 11GVHD: Nguyễn Minh Hùng Đề tài: Tìm Hiểu & Nghiên Cứu CPU
truy xuất 1 byte dữ liệu trong bộ nhớ RAM có thể nhanh hơn hàng ngàn lần nếu truy xuất từ một ổ đĩa cứng
xin nói thêm, người ta dùng thuật ngữ cache hit để chỉ việc dữ liệu được tìm thấy trong cache Yà hiệu năng của một cache được tính bằng hit rate (tốc độ tìm thấy dữ liệu trong cache)
Trở lại chuyện bộ nhớ cache Hồi thời Pentium đổ về trước, bộ nhớ cache nằm trên mainboard và
Pentium II, Intel phát triển được công nghệ đưa bộ nhớ cache vào khối CPU Nhờ nằm chung như vậy, tốc độ truy xuất cache tăng lên rõ rệt so với khi nó nằm trên mainboard Nhưng do L2 Cache vẫn phải ở ngoài nhân CPU nên Intel phải chế ra một bo mạch gắn cả nhân CPU lẫn L2 Cache Yà thế là CPU có hình dạng to đùng như một cái hộp (gọi là cartridge) và được gắn vào mainboard quagiao diện slot (khe cắm), Slot 1 Tốc độ truy xuất cache lúc đó chỉ bằng phân nửa tốc độ CPU Thí
dụ, CPU 266 MHz chỉ có tốc độ L2 Cache là 133 MHz Sang Pentium III cũng vậy Mãi cho tới thế hệ Pentium III Coppermine (công nghệ 0.18-micron), Intel mới thành công trong việc tích hợp ngay L2 Cache vào nhân chip (gọi là on-die cache) Lúc đó, tốc độ L2 Cache bằng với tốc độ CPU
và con CPU được thu gọn lại, đóng gói với giao diện Socket 370 CPU Socket 370 với L2 Cache nằm ngay trên nhân CPU Như đã nói, dung lượng của Cache CPU lợi hại lắm nghen Phổ biến nhất là L2 Cache là một chip nhớ nằm giữa LI Cache ngay trên nhân CPU và bộ nhớ hệ thống Khi CPU xử lý, LI Cache sẽ tiến hành kiểm tra L2 Cache xem có dữ liệu mình cần không trước khi truycập vào bộ nhớ hệ thống Yì thế, bộ nhớ đệm càng lớn, CPU càng xử lý nhanh hơn Đó là lý do mà Intel bên cạnh việc tăng xung nhịp cho nhân chíp, còn chú ý tới việc tăng dung lượng bộ nhớ Cache Do giá rất đắt, nên dung lượng Cache không thể tăng 0 ạt được Bộ nhớ cache chính LI Cache vẫn chỉ ở mức từ 8 tới 32 KB Trong khi, L2 Cache thì được đẩy lên dần tới hiện nay cao nhất là Pentium M Dothan 2 MB (cho máy tính xách tay) và Pentium 4 Prescott 1 MB (máy để bàn) Riêng dòng CPU dành cho dân chơi game và dân multimedia “pro” là Pentium 4 Extreme Edition còn được bổ sung L3 Cache với dung lượng 2 MB Đây cũng là CPU để bàn có tổng bộ nhớ cache lớn nhất (Ll: 8 KB, L2: 512 KB, L3: 2 MB)
10/ Tập lệnh(intrucsion set):
Theo nguyên tắc làm việc của máy tính thì để thực hiện chương trình, CPU lần lượt đọc các lệnh, giải mã lệnh và thực hiện lệnh Đối với một hệ máy tính, một lệnh được chia thành các mức độ khác nhau, mức thứ nhất đó là mức lệnh của người sử dụng Đây là những câu lệnh dạng gần gũi với ngôn ngự tự nhiên của con người và máy tính không thể hiểu được
Để máy tính có thể hiểu được, lệnh của người sử dụng được HĐH hay trình dịch ngôn ngữ phiên dinh thành lệnh ở dạng ngôn ngữ máy và CPU có thể đọc và hiểu được
Khi CPU đọc lệnh dạng mã máy, nó thực hiện việc phiên dịch lệnh này thảnh các vi lệnh để các thành phần của CPU có thể hiểu và thực hiện được Quá trình này gọi là giải mã lệnh
Tập các vi lệnh của CPU cũng là một yếu tố đánh giá khả năng làm việc của CPU, khi
Trang 12GVHD: Nguyễn Minh Hùng Đề tài: Tìm Hiểu & Nghiên Cứu CPU
trang bị một CPU vào hệ thống người ta thường quan tâm đến vấn đế kiến trúc của CPU,
có hai loại kiến trúc CPU, đó là:
CISC: (Complex Instruction Set Computer) máy tính vởitập lệnh đầy đủ Trong kiến trúc CISC, máy tính cần sửdụng rất ít thanh ghi
RISC: (Reduced ỉostmction Set Computer) máy tính vớitập lệnh rút gọn Trong kiến trúc RISC, máy tính cần sửdụng nhiều thanh ghi Đây lầ kiến trúc được các bộ vỉ xử
lý Intel ngày nay sử dụng
Chúng ta có thể lấy một ví dụ để phân biệt giữaSISC và
RISC như sau: Cộng 1 vào một vùng địa chi TrongCISC, lệnh tương ứng phải thực hiện bâ chức năng sau:
đọc vùng bộ nhớ, cộng thêm 1, ghi trả lại kết quả TrongRISC, mỗi chức năng trên là một lệnh Điều khác biệt làtrong CISC không cần tối nhiều thanh ghi, với lệnh trên CISC có thể đọc giá trị tại vùng
nhớ vào ALU, thực hiện tăng lên 1 và trả kết quả vào vùng nhớ Còn đối với CPU RISC,
nếu giá trị cần đọc đã có sin ở thanh ghi thi không cần phải đọc nó từ bộ nhớ, giá trị sau
khi tầng lên 1 có thể chứa ở thanh ghi mà không cần phải ghi kết quả vào bộ nhớ
11/CPU đa lõi:
Lý do lớn nhất việc đặt nhiều lõi lên cùng một vi mạch là sẽ giúp giầm không gian trên bản mạch chỉnh khi có nhu cầu muốn sử dụng với số lượng CPU lồi đơn tương đương Thêm nữa, lợi thế của việc sử dụng đa lõi trên cùng một vi mạch đương nhiên sẽ làm việc kết hợp cùng nhau chặt chẽ và nâng cao được hiệu quả hơn
Khả năng tiết kiệm năng lượng cũng được phát huy thấy rõ đối với thiết kế này Khi nhiều lõi cùng nằm trên một chip, xung tín hiệu truyền giữa các lõi sẽ ngắn hơn Ngoài ra, đặc trưng của CPU đa lõi là chạy với điện năng thấp hơn vì cồng suất tiêu tốn để tín hiệu truyền trên dây bằng với bình phương điện áp chia cho điện trở trong dây, do đó điện năng thấp hơn sẽ dẫn đến kết quả là nguồn điện sử dụng đi
Một lý do khác đối với việc tiết kiệm nguồn điện là tốc độ đồng hồ CPU đa lõi có thể thực thỉ cáchoạt động nhiều lần hơn trong một giây trong khỉ tần số thấp hơn Vỉ dụ bộ xử lý MỈT RAW 16lõi hoạt động ở tần số 425MHz có thể thực thi gấp 100 lần các hoạt động trong một giây đối vớiIntel Pentium 3 đang chạy ở tần số 600 MHz Có một quy tắc đơn giản ỉà mồi một phần trăm tầngthêm tốc độ đồng hồ sẽ tầng 3% điện năng tiêu thụ Và tất nhiên là điều đó còn chưa tính tới tácđộng của các nhân tố khác có ảnh hưởng tới sự tiêu thụ điện năng
CPU đa lõi còn có thể chỉã sẻ một mạch ghép nối bus tốt như mạch lưu trữ Hình bên dưởi là lược
đồ của chip Core 2 dual của Intel - có tính năng lầ một L2 cache được chia sẻ Kết quả lầ tiết kiệm được lượng không gian đáng kể Theo Intel, CPU Core 2 dual có thể lên tcd 4MB được chỉã sẻ L2 Cache
Dua! CPU Core ChiỊĩ
GVHD: Nguyễn Minh Hùng Đề tài: Tìm Hiểu & Nghiên Cứu CPU
Sơ đồ Bộ xử lý Core 2 Dual của Intel
Một nhân tố khác giới hạn lợi ích thực thi của CPU đa lõi là phần mềm chạy trên nó Đối
với người dùng bình thường, hiệu suất lớn nhất mà họ đạt được khi lựa chọn một CPU đa
lõi là tính đa nhiệm được cải thiện Yí dụ, với một CPU đa lõi ta sẽ thấy sự cải thiện lớn
khi xem DVD trong lúc máy vẫn đang được quét virus mà tốc độ không bị ảnh hưởng,
bởi vì từng ứng dụng sẽ được gán trên các lõi khác nhau
Neu người dùng đang chạy một ứng dụng đơn trên máy tính đa lõi thì sẽ không thấy rõ
được việc tăng hiệu suất đáng kể lắm Bởi hầu hết các ứng dụng không được xử lý đa
luồng Chính vì vậy các ứng dụng cũng cần phải thay đổi trong thiết kế Ví dụ một
chương trình quét virus chạy trên một tuyến mới trong khi GUI lại chạy trên một tuyến
khác Việc xử lý đa luồng đúng cách là khi khối lượng công việc được phân chia thảnh
nhiều luồng khác nhau Việc quét virus là một ví dụ, luồng GUI làm việc rất ít, trong khi
luồng quét virus thực hiện một nhiệm vụ rất nặng và không có khả năng chia nhỏ ra và
gửi đến các lõi khác
Việc phát triển một ứng dụng đa luồng đích thực yêu cầu rất nhiều công việc phức tạp
Điều này rõ ràng cũng tốn khá nhiều chi phí vào một chu trình thiết kế phần mềm Đó là
lý do tại sao phần lớn các ứng dụng phần mềm sẽ không được phát triển như các ứng
dụng thực sự đa luồng cho đến khi số lượng lõi đủ cao để thực hiện nhiều tác vụ mà
không làm ảnh hưởng tới hiệu suất Yà điều này sẽ đạt được khi người dùng có nhu cầu
12/ Các thuộc tính kỹ thuật của CPU
Word Size: kích thước từ nhớ là số bit lớn nhất mà CPU có thể xử lý ở một thời điểm
Kích thước đường dữ liệu là số bit dữ liệu có thể vào ra CPU ở một thời điểm từ bus dữ
liệu (data bus)
Kích thước địa chỉ cực đại là không gian địa chỉ vật lý cực đại mà CPU có thể điều khiển
Tốc độ xử lý tính bằng megahertz (MHz) hoặc gigahertz (GHz) Con số đứng trước MHz
hay Ghz chỉ cho biết có bao nhiêu dao độ trong một giây Yí dụ, CPU 600MHz sẽ dao
động 600 triệu lần/giây
Level 1 Execution Trace Cache: là bộ nhớ đệm bổ sung 8 KB, CPU Pentium 4 bao
gồm bộ nhớ dò tìm thi hành lệnh mà dung lượng lên đến 12KB để đọc/giải mã theo thứ tự
sự thực hiện của chương trình Hiệu suất tăng dần này được gở bỏ việc đọc/giải mã theo
mỗi vòng lặp và làm hiệu quả hơn không gian lưu trữ đệm cho đến khi những tập lệnh
không được lưu nữa Kết quả là nó chuyển một khối lượng lớn những lệnh đến bộ xử lý
Level 2 Advanced Transíer Cache (ATC):
Bộ nhớ đệm Level 2 có trong bộ xử lý từ2,4Ghz trở lên Level 2 ATC giúp thông lượngtruyền dữ liệu nhiều hơn giữa hai kênh là bộđệm Level 2 và bộ xử lý Bộ đệm Level 2 cómột mạch ghép nối 256bit (32 byte) mà nótruyền dữ liệu trong mỗi xung
Level 3 cache: chỉ có Pentium 4 ExtremeEdition 3,2GHz trở lên mới có bộ nhớ đệmLevel 3 Đây là bộ nhớ thứ ba được thêm vào
Trang 13GVHD: Nguyễn Minh Hùng Đề tài: Tìm Hiểu & Nghiên Cứu CPU
trên CPU Nó được thiết kế đặc biệt để đáp ứng những nhu cầu cho những ai đòi hỏi cao về năng xuất CPU có bộ nhớ Level 3 cung cấp một đường truyền rộng đến bộ nhớ Thiết kế của cache L3 giúp cho những dữ liệu xử lý chứa đựng ở CPU được nhiều hơn và nhanh hom
HT Technology (Hyper-ThreadingTechnology - Công nghệ siêu phânluồng):
Các CPU có tốc độ truyền dữ liệu vớiMainboard Bus 800MHz trở lên hỗ trợ HTTechnology Công nghệ HT Technology làmột bước đột phá, nó làm thay đồi kỹ thuậtthiết kế bộ xử lý mà tốc độ vượt qua GHzcải thiện hiệu quả làm việc Nó cho phépnhững chương trình phần mềm “thấy 2CPU” và làm việc hiệu quả hơn Kỹ thuậtnầy cho phép CPU chạy hai loạt chuỗi,hoặc luồng của lệnh trong củng một thờiđiểm Theo cách ấy, hệ thống đã được cảitiến hiệu quả, nâng dần hiệu suất xử lýtrong môi trường khi thực hiện cùng lúcnhiều ứng dụng
II/CẤU TẠO:
1/ Các thành phần cơ bản củã cpu:
CU (Control Unit): Đan vị điều khiển: Điểu khiển hoạtđộng của hệ thống theo chương trinh đã dựng sẵn Có chứcnăng điều khiển toàn bộ tiến trình chuyển giao dữ liệu từchồ này sang chồ khác trong khi quá trình tính toán đangtiếp tục thực hiện
ALU (Arithmetic and Logic Unit): Đan vị số học và luận
lý Thực hiện tất cả các tính toán số học và lôgic Đơn vị sốhọc và luận lý chỉ thực hiện các phép toán số học đơn giảnnhư phép cộng, trừ, nhân, chia Đẻ CPU có thề xử lý dữliệu với các số thực với độ chính xác Câo và các phép toánphức tạp như sin, cos, tính tích phân ềc á c CPU thường được trang bị thêm bộ đồng xử
lý toán học (FPU: Floatting Point Unit) còn được gọi là bộ xử lý dấu chấm động
Tập các thanh ghi (Registry)~Dùng để chứa thông tin tạm thời phục vụ cho các hoạt động hiện tại của CPU
How Hyper-Threading TechnologypỊrks
Physical Logical pro«55ors Physical procsssor
Pĩocessore visibla |o os respurce allocatipn Throughput
Reloutt* I
R«ouri* ỉ R«ajr#ỉ
Intel PetitiUìm 4 VỚI cõng nghệ siêu [uổng (HI)
Luãng 1 t i í i c c c
í
Luông 2
Trong BXL hai nhàn CLÍa inteẩ mài luổBig diiọt lú tjf trong
mốt nhan rieng mi ly sang Ihực SLf.
Luértâ 1
Lu*fi£ 2
Trang 15GVHD: Nguyễn Minh Hùng Đề tài: Tìm Hiểu & Nghiên Cứu CPU
21 Các chức năng cơ bản củã cpu:
Thực hiện các lệnh về xử lý dữ liệu & các lệnh nhập xuất dữ liệu, các lệnh đọc, ghi, xóa dữ liệu trên cácthiết bị lưu trữ, các lệnh về quản lý bộ nhớ bao gồm cấp phát và giải phóng tài nguyên bộ nhớ
3/ Các thành phần chính vật lý:
a CPU INTEL:
Bộ vỉ xử lý là trái tỉm củâ máy tỉnh hiện đại; đây là một loại chip được tạo thành từ hàng triệu transistor
và những thành phần khác được tổ chức thành những khối chức năng chuyên biệt, bão gồm đơn vị xử
lý số học, khối quản lý bộ nhớ và bộ nhớ đệm, khối luân chuyển dữ liệu và phép toán luận lý suy đoán
Transistor gồm ba lớp bán dẫn ghép vối nhau hình thành hai mối tiếp giáp P-N, nếu ghép theo thứ
tự PNP ta được Transistor thuận, nếu ghép theo thứ tự NPN ta được Transistor ngược, về phươngdiện cấu tạo Transistor tương đương với hai Diode đấu ngược chiều nhau
Q Cấu tạo Transistor
• Bã lớp bán dẫnđược nối ra thành
ba cực , lớp giữagọi là cực gốc kýhiệu là B (Base), lớp bándẫn B rất mỏng và
có nồng độtạp chất thấp
• Hãi lớp bán dẫn bên ngoài được nối ra thành cực phát (Emitter) viết tắt lầ E, và
cực thu hay cực góp (Collector )viết tắt là c, vùng bán dẫn E và c có cùng loại
bán dẫn (loại N hay p )nhưng có kích thước và nồng độ tạp chất khác nhau nên
không hoán vị chonhau được
Độ vỉ xử lý củã máy tính hiện nay đã phát triển cực mạnh về khả năng, tốc độ và tính
phức tạp so vớỉ thập niên trước đây Tốc độ cao, kích thước nhỏ, số lượng transistor
khổng lồ Nếu bộ xử lý năm 1983 chỉ có 30.000 transistor thi hiện nay với một số bộ xử
lý con số này là trên 40 triệu
Bất kỳ chương trình máy tỉnh nào cũng bao gồm rất nhiều lệnh để thao tác vớỉ dữ liệu
Độ xử lý sẽ thực hiện chương trình qua bốn giãi đoạn xử lý: nạp, giải mã, thực thỉ và
-Trarsistor ngược Transỉstor thuận
GVHD: Nguyễn Minh Hùng Đề tài: Tìm Hiểu & Nghiên Cứu CPU
Giai đoạn nạp (lấy lệnh và dữ liệu) đọc các lệnh của chương trình và dữ liệu cần thiết vào bộ xử lý.Giai đoạn giải mã xác định mục đích của lệnh và chuyển nó đến phần cứng tương ứng
Giai đoạn thực thi là lúc có sự tham gia của phần cứng, với lệnh và dữ liệu đã được nạp sẵn, các lệnh sẽ được thực hiện
Quá trình này có thể gồm các tác vụ như cộng, chuyển bít hay nhân thập phân động
Giai đoạn hoàn tất sẽ lấy kết quả của giai đoạn thực thi và đưa vào thanh ghi của bộ xử lý hay bộnhớ chính
Một bộ phận quan trọng của bộ vi xử lý là đồng hồ xung nhịp được thiết kế sẵn, xác định tốc độlàm việc tối đa của những bộ phận khác và giúp đồng bộ hoá những hoạt động liên quan Hiện naytốc độ nhanh nhất của bộ xử lý có ừên thị trường là trên 2 GHz hay hơn hai tỷ xung nhịp mỗi giây.Một số người thích sử dụng thủ thuật "ép" xung để chạy ở tốc độ cao hơn, nhưng nên nhớ là khi đónhiệt độ làm việc của chip sẽ cao hơn và có thể gây trục trặc
b CPU AMD
Chất liệu chủ yếu chế tạo cpu AMD là ceramic (gốm) và organic ( hữu cơ) từ dòng
Thoroughbred trở đi đều làm bằng organic.Hiện tại, công nghệ được áp dụng cho các CPU là
MOS (Metal Oxide Semi-Conductor - bán dẫn ôxít kim loại), dựa vào một lớp ôxít kim loại nằm trên tấm Silicon kết nối bởi các đường hợp chất dẫn điện.Người ta đã cải tiến MOS thành CMOS(Complimentary MOS - MOS bổ trợ) hoạt động ở điện thế thấp
Đe đáp ứng nhu cầu làm cho CPU ngày càng nhanh hơn, ít tiêu hao năng lượng hơn các côngnghệ 0,25 -> 0,18 -> 0,13 micron lần lượt ra đời Nhưng chính sự thu nhỏ các cầu nối trong CPUnày khiến việc áp dụng MOS và CMOS trở nên ngày càng khó khăn hơn, do các cầu nối nàynằm quá sát nhau nên dễ dẫn đến hiện tượng đóng điện chéo lên các cầu bên cạnh Một nhượcđiểm quan trọng khác của công nghệ MOS là phần Silicon ở giữa các cầu nối (có vai trò như một
tụ điện) phải nạp được điện dung tối đa để có thể đóng - và lại phải thoát hết điện dung để có thể
mở Việc này tốn thời gian xử lý, và lãng phí thời gian xử lý trên CPU
Các nhà sản xuất CPU đã cải tiến MOS hiện có như việc thay oxit nhôm bằng oxit đồng làm tăngxung nhịp lên đáng kể Nhưng để CPU có thể đạt tới tốc độ 5-10 GHz phải có một giải pháp khắcphục triệt để hơn nữa 2 nhược điểm nêu trên Đó chính là công nghệ SOI (Silicon On Insulator).Cải tiến SOI là điện dung của tụ Silicon giữa các cầu được cực tiểu hoá làm giảm thời gian cần thiết
để thoát/nạp, để mở và đóng cầu nối Điều này giúp tăng xung nhịp lên rất nhiều Sở dĩ SOI làmđược điều đó là nhờ việc chèn vào giữa tấm Silicon một lớp vật liệu cách điện và để lại một phầnSilicon nhỏ ở giữa các cầu nối Lóp vật liệu cách điện này là một dạng của ôxít Silicon được tạo rabằng kĩ thuật SIMOX (Seperation by Implantation of Oxygen) - khí ôxi được ép lên bề mặt củaSilicon wafer ở áp suất và nhiệt độ cao, khi
Trang 16GVHD: Nguyễn Minh Hùng Đề tài: Tìm Hiểu & Nghiên Cứu CPU
đó Silicon phản ứng với ôxi tạo nên 1 lóp ôxít Silicon bám vào Silicon wafer bên dưới
SOI sẽ không thay thế hoàn toàn MOS/CMOS mà chỉ tối ưu hoá cho hai công nghệ này:
- CPU dùng SOI sẽ nhanh hơn đến 30% so với CPU dùng MOS/CMOS nếu có cùng một xungđồng hồ như nhau
- Yêu cầu về điện năng thấp hơn nhiều so với MOS/CMOS (ít hơn khoảng 50%), CPU sẽ chạymát hơn - vượt qua một trở ngại lớn của việc nâng tốc độ các bộ xử lý
- Cho phép thu nhỏ công nghệ sản xuất CPU xuống 0.09 micron hay thấp hơn cùng với SOI cónghĩa rằng các bộ vi xử lý sẽ được tăng tốc rất nhanh và tốc độ 5-10GHz sẽ sớm đạt được Thếnhưng SOI cần có Silicon đạt độ nguyên chất 100% - thứ mà công nghệ hiện nay chưa sản xuấtđược Isonics là 1 công ty đang nghiên cứu sản xuất loại Silicon wafer này AMD thực sự trôngđợi vào SOI để khắc phục những nhược điểm của CPU như tiêu tốn nhiều điện năng và chạynóng hơn Cả thế giới đang mong đợi bộ xử lý K8 của họ, hay còn gọi là Haimner dùng côngnghệ SOI
4/ Thành phần chính luận lý:
Mạch của bộ xử lý được thiết kế thành những phần luận lý riêng biệt - khoảng hơn một chục bộphận - được gọi là những đơn vị thực thi Chúng có nhiệm vụ thực hiện bốn giai đoạn trên và cókhả năng xử lý gối đầu Dưới đây là một số đơn vị thực thi phổ biến nhất
a/ Bộ ỉuận lý sổ học: Xử lý tất cả những phép toán số học Đôi lúc đơn vị này được chia thành
những phân hệ, một chuyên xử lý các lệnh cộng và trừ số nguyên, phân hệ khác chuyên tính toáncác phép nhân và chia số phức
b/ Bộ xử lý dấu chẩm động (FPU): Thực hiện tất cả các lệnh liên quan đến dấu chấm động (không
phải là số nguyên) Ban đầu FPU là bộ đồng xử lý gần ngoài nhưng hiện nay nó được tích hợp ngay trên bộ xử lý để tăng tốc độ xử lý
c/ Bộ phận nạp/lưu: Quản lý tất cả lệnh đọc hay ghi bộ nhớ
d/ Bộ phận quản lý bộ nhớ (MMU): Chuyển đổi địa chỉ của ứng dụng thành địa chỉ bộ nhớ vật lý
Điều này cho phép hệ điều hành ánh xạ mã và dữ liệu của ứng dụng vào những khoảng địa chỉ ảo
để MMU có thể thực hiện các dịch vụ theo chế độ bảo vệ bộ
e/ Bộ phận xử ĩỷ rẽ nhánh (BPU): Dự đoán hướng đi của lệnh rẽ nhánh nhằm giảm sự ngắt quãng
thường gặp trong các phép toán so sánh hay kết thúc vòng lặp
f/ Bộ phận xử lý vector (VPU).' Xử lý các lệnh đơn, đa dữ liệu (single instruction multiple SIMD) để tăng tốc các tác vụ đồ hoạ Những lệnh theo kiểu vector này gồm các tập lệnh mở rộng cho multimedia của Intel, 3DNow của AMD, AltiVec của Motorola Trong một vài trường hợp không có bộ phận YPU riêng, chẳng hạn Intel và AMD tích hợp những tính năng này vào trong FPU của Pentium 4 và Athlon
Trang 18GVHD: Nguyễn Minh Hùng Đề tài: Tìm Hiểu & Nghiên Cứu CPU
Không phải tất cả các bộ phận này đều thực thi lệnh Người ta đã có những nỗ lực to lớn
để bảo đảm cho bộ xử lý lấy lệnh và dữ liệu ở tốc độ nhanh nhất Tác vụ nạp truy cập bộ
nhớ chính (không nằm ngay trên CPU) sẽ chiếm nhiều chu kỳ xung nhịp, trong khi đó
CPU lại không làm gì cả
Tuy nhiên, BPU sẽ phải làm việc rất nhiều để lấy sẵn dữ liệu và lệnh
Một cách giảm thiểu tình trạng không hoạt động của CPU là trữ sẵn mã và dữ liệu thường
được truy cập trong bộ nhớ ngay trên chip, như vậy CPU có thể truy cập mã và dữ liệu
trên bộ nhớ đệm chỉ trong một chu kỳ xung nhịp Bộ nhớ đệm chính ngay trên CPU (còn
gọi là Levell hay Ll) thường chỉ có dung lượng khoảng 32KB và chỉ có thể lưu được
một phần chương trình hay dữ liệu Thủ thuật để thiết kế bộ nhớ đệm là tìm giải thuật để
lấy thông tin quan trọng vào LI khi cần đến Điều này có ý nghĩa hết sức quan trọng đối
với tốc độ nên hơn một nửa số lượng transistor của bộ xử lý có thể dành cho bộ nhớ đệm
Tuy nhiên, hệ điều hành đa nhiệm và một loạt các ứng dụng chạy đồng thời có thể làm
quá tải ngay cả với bộ nhớ đệm LI được thiết kế tốt nhất Đe giải quyết vấn đề này, cách
đây nhiều năm, các nhà sản xuất đã bổ sung đường truyền tốc độ cao để bộ xử lý có thể
giao tiếp với bộ nhớ đệm thứ cấp (Level2, L2) với tốc độ khoảng 1/2 hay 1/3 tốc độ của
bộ xử lý
Hiện nay trong những bộ xử lý mới nhất như Pentium 4 hay PowerPC 7450 còn tiến xa
hơn khi đưa bộ nhớ đệm L2 vào ngay trong CPU và hỗ trợ giao tiếp tốc độ cao với bộ
nhớ đệm ngoài L3 Trong tương lai, các nhà sản xuất thậm chí còn tích hợp bộ điều khiển
bộ nhớ ngay trên CPU để tăng tốc độ lên cao hơn nữa
III/NGUYÊN TẮC HOẠT ĐỘNG:
Đối với CPU, do việc
xử lý thông tin trong CPU
là hoàn toàn tự động theonhững chương trình cósẵn trong bộ nhớ, CPUcần phải biết thời điểmđọc lệnh, đọc lệnh xong thì mới chuyển đến thời điểm CPU tiến hành giải mã lệnh, giải
mã lệnh xong thì CPU mới tiến hành việc thực hiện lệnh Thực hiện xong thì CPU mới
tiến hành việc đọc lệnh kế tiếp
Đây là các công đoạn khi CPU thực hiện và không thể lẫn lộn được mà phải được thực
hiện một cách tuần tự
Đe giải quyết vấn đề này, trong CPU cần phải có một bộ tạo nhịp thời gian làm việc
(CPU Clock) Tại nhịp thời gian này, CPU thực hiện việc đọc lệnh, tại nhịp thời gian tiếp
theo, CPU thực hiện việc giải mã lệnh
Nhịp thời gian càng ngắn, tốc độ CPU thực hiện lệnh càng nhanh Chẳng hạn với một
CPU Pentium MMX 233 MHz, điều đó có nghĩa là bộ tạo nhịp của CPU đó tạo ra 233
triệu nhịp làm việc trong 1 giây
Yí dụ: việc phân chia thời gian thực hiện lệnh đối với một CPU (đời cũ) có thể mô tả
1
GVHD: Nguyễn Minh Hùng Đề tài: Tìm Hiểu & Nghiên Cứu CPU
Một CPU xử lý lệnh theo nhịp thời gian như vậy còn gọi là bộ vi xử lý ở chế độ đơn dòng lệnh và chỉ gặp ở các CPU đời cũ Đe tăng tốc độ làm việc của CPU hay tăng hiệu suất làm việc, các CPU thế hệ thứ 3 đều trang bị chế độ xử lý xen kẽ dòng mã lệnh (pipelining)
Yì thế Core 2 Duo tuy có tốc độxung nhịp không cao lắm nhưng sức mạnh thì vượt trội so với Pen 4 Yà còn một vấn đề
nữa đó chính là hiệu quả của thao tác đó Yí dụ như do các thuật toán không chặt chẽ dẫn
đến CPU đoán nhầm và copy khối dữ liệu không cần thiết vào trong bộ nhớ đệm, còn
khối dữ liệu cần dùng thì lại không copy Vì thế khi CPU tìm trong bộ nhớ đệm không
thấy có khối dữ liệu đó lại phải lóc cóc tìm trong RAM, tìm xong lại phải copy vào bộ
nhớ đệm rồi mới xử lý tiếp Như vậy có nghĩa là CPU đã thực hiện rất nhiều thao tác thừa
so với CPU đoán đúng được ngay khối dữ liệu chuẩn bị được xử lý Core 2 Duo có các
thuật toán cao cấp và các công nghệ tiên tiến giúp cho hiệu quả của CPU rất cao Yà
chính vì thế mà hiệu suất của Core 2 Duo vượt trội so với Pentium./
IV/ CÔNG NGHỆ CHẾ TẠO:
Hiện tại: Công nghệ được áp dụng cho các CPU là MOS (Metal Oxide Semi- Conductor - bán dẫn ôxít kim loại), dựa vào một lớp ôxít kim loại nằm trên tấm Silicon kết nối bởi các đường hợp chất dẫn điện
Người ta đã cải tiến MOS thành CMOS (Complimentary MOS - MOS bổ trợ) hoạt động ở điện thế thấp
Đây ỉà 2 công nghệ có mặt trong hầu hết các thiết bị máy tính.
Đe đáp ứng nhu cầu làm cho CPU ngày càng nhanh hơn, ít tiêu hao năng lượng hơn các
GVHD: Nguyễn Minh Hùng Đề tài: Tìm Hiểu & Nghiên Cứu CPU
công nghệ 0,25 -> 0,18 -> 0,13 micron lần lượt ra đời Nhưng chính sự thu nhỏ các cầu nối trongCPU này khiến việc áp dụng MOS và CMOS trở nên ngày càng khó khăn hơn, do các cầu nối nàynằm quá sát nhau nên dễ dẫn đến hiện tượng đóng điện chéo lên các cầu bên cạnh Một nhượcđiểm quan trọng khác của công nghệ MOS là phần Silicon ở giữa các cầu nối (có vai trò như một
tụ điện) phải nạp được điện dung tối đa để có thể đóng - và lại phải thoát hết điện dung để có thể
mở Việc này tốn thời gian xử lý, và lãng phí thời gian xử lý trên CPU
Các nhà sản xuất CPU đã cải tiến MOS hiện có như việc thay oxit nhôm bằng oxit đồng làm tăngxung nhịp lên đáng kể Nhưng để CPU có thể đạt tới tốc độ 5-10 GHz phải có một giải pháp khắcphục triệt để hơn nữa 2 nhược điểm nêu trên Đó chính là công nghệ SOI (Silicon On Insulator).IBM đã phát triển công nghệ này từ đầu những năm 1990 cho CPU của họ, với mục đích giảm điện năng sử dụng, tăng xung nhịp v.v nhưng công nghệ này vẫn chưa thực sự được ứng dụng ngay cho đến cuối thế kỉ 20, khi việc tăng xung nhịp cho các dòng CPU hiện đại cần thêm các phương pháp sản xuất khác
Cải tiến SOI là điện dung của tụ Silicon giữa các cầu được cực tiểu hoá làm giảm thời gian cầnthiết để thoát/nạp, để mở và đóng cầu nối Điều này giúp tăng xung nhịp lên rất nhiều Sở dĩ SOIlàm được điều đó là nhờ việc chèn vào giữa tấm Silicon một lớp vật liệu cách điện và để lại mộtphần Silicon nhỏ ở giữa các cầu nối Lóp vật liệu cách điện này là một dạng của ôxít Silicon đượctạo ra bằng kĩ thuật SIMOX (Seperation by Implantation of Oxygen) - khí ôxi được ép lên bề mặtcủa Silicon wafer ở áp suất và nhiệt độ cao, khi đó Silicon phản ứng với ôxi tạo nên 1 lóp ôxít Silicon bám vào Silicon wafer bên dưới.
SOI sẽ không thay thế hoàn toàn MOS/CMOS mà chỉ tối ưu hoá cho hai công nghệ này:
- CPU dùng SOI sẽ nhanh hơn đến 30% so với CPU dùng MOS/CMOS nếu có cùng một xungđồng hồ như nhau
- Yêu cầu về điện năng thấp hơn nhiều so với MOS/CMOS (ít hơn khoảng 50%), CPU sẽ chạymát hơn - vượt qua một trở ngại lớn của việc nâng tốc độ các bộ xử lý
- Cho phép thu nhỏ công nghệ sản xuất CPU xuống 0.09 micron hay thấp hơn cùng với SOI cónghĩa rằng các bộ vi xử lý sẽ được tăng tốc rất nhanh và tốc độ 5-10GHz sẽ sớm đạt được
Thế nhưng SOI cần có Silicon đạt độ nguyên chất 100% - thứ mà công nghệ hiện nay chưa sản xuất được Isonics là 1 công ty đang nghiên cứu sản xuất loại Silicon wafer này AMD thực sự trông đợi vào SOI để khắc phục những nhược điểm của CPU như tiêu tốn nhiều điện năng và chạy nóng hơn Cả thế giới đang mong đợi bộ xử lý K8 của họ, hay còn gọi là Hammer dùng công nghệ SOI
Chất liệu chủ yếu chế tạo cpu AMD là ceramic (gốm) và organic ( hữu cơ) từ dòng Thoroughbredtrở đi đều làm bằng organic
Nội lực công nghệ - HyperTransport, Cool'n'Quiet
AMD đặc biệt ưu ái CPU 64 bit với công nghệ 'siêu chuyển' HyperTransport và tự điều
Trang 19GVHD: Nguyễn Minh Hùng Đề tài: Tìm Hiểu & Nghiên Cứu CPU
chỉnh hoạt động Cool'n'Quiet
HyperTransport giúp việc truyền thông tin giữa các chip (cầu nam, cầu bắc, BXL, bộ
nhớ, ) nhanh hơn, điều này không có nghĩa tốc độ của chip sẽ nhanh hơn mà chỉ là khả
năng 'nói chuyện' với một chip hoặc thiết bị khác nhanh hơn với lượng dữ liệu nhiều hơn
Bạn có thể hình dung, nếu tuyến đường cao tốc giữa hai thành phố là hai chiều cho hai
làn xe thì sẽ dễ xảy ra tai nạn và tắc nghẽn HyperTransport làm cho tuyến đường này
rộng hơn, do đó xe có thể chạy nhanh và nhiều hơn Công nghệ này có thể áp dụng cho
tất cả băng thông của bo mạch chủ, từ chipset đến BXL, bộ nhớ, AGP, PCI,
Cool'n'Quiet là một cải tiến khác dành cho dòng BXL 64 bit Đe dùng được công nghệ
này thì BMC cũng phải hỗ trợ, khi đó tốc độ và điện năng tiêu thụ của BXL sẽ được điều
chỉnh tự động Nếu có ít ứng dụng được chạy (BXL xử lý ít) thì Cool'n'Quiet sẽ giảm tốc
độ và điện thế BXL, ngược lại, khi cần xử lý nhiều thì BXL sẽ được tăng tốc độ và điện
thế
1/ Các Công Nghệ Sử Dụng Trong sản xuất CPU INTEL :
Như đã biết, thành phần cơ bản tạo nên tất cả các chip máy tính là transistor Trong hàng
chục năm qua, các công ty sản xuất vi mạch, trong đó dẫn đầu là Intel, đã sử dụng Silicon
dioxide (SÌ02) để làm transistor trong các quy trình sản xuất logic Tuy nhiên, với mức
độ ngày càng tinh vi của vi mạch, hiện tượng rò rỉ điện tích trong transistor có xu hướng
tăng lên Quản lý được sự rò rỉ là vấn đề rất quan trọng đối với sự vận hành ổn định với
tốc độ cao của bản thân chip, và đang trở nên ngày càng cấp thiết
* Mọi người đều biết đến công nghệ 22 nm trong sàn xuất bộ vỉ xử
lý của ỉnteỉ, vậy công nghệ này có những j mới ?Intel hiện đang ở chế độ phát triển toàn diện trên công nghệ xử lý 22mn và đúng tiến
độ để tiếp tục mô hình tick-tock của mình trong thế hệ tiếp theo.Các mạch kiểm ưa 22nm bao gồm cả bộ nhớ SRAM và các mạchlogic sẽ được sử dụng trong các bộ vi xử lý 22nm Các cell SRAMvới diện tích 0,108 và 0,092 micromet vuông hoạt động trong mộtdãy có tổng cộng 364 triệu bit Cell có diện tích 0,108 micrometvuông được tối ưu hoá cho các hoạt động điện áp thấp Cell có diệntích 0,092 micromet vuông được tối ưu hoá cho các hoạt động mật độ cao và là cell
SRAM nhỏ nhất trong các mạch hoạt động tính tới thời điểm này
Con chip kiểm tra này đóng gói 2,9 tỷ bóng bán dẫn, gần xấp xỉ gấp đôi mật độ của thế hệ 32mn trước đó, trong một diện tích nhỏ bằng một cái móng tay
Các kích thước 22mn được lấy mẫu với các công cụ phori sáng sử dụng ánh sáng với 1 bướcsóng là 193 nin, một minh chứng rõ nét cho khả năng khéo léo của các kỹ sư phụ trách in thạchbản của InteL/
* Mọi người đều biết đến công nghệ 32 nm trong sản xuẩt bộ vỉ xử
ỉỷ của ỉnteỉ, vậy công nghệ này có những j mói ?Quy trình sản xuất 32 tun sử dụng công nghệ high-k metal gate thế hệ thứ 2 của Intel
con chip đầu tiên sử dụng công nghệ này chính là họ xử lý
45 rnn hiện tại Như đã biết, thành phần cơ bản tạo nên
cả các chip máy tính là transistor
hàng chục năm qua, các công ty sản xuất vi mạch, trong đó
Trang 20GVHD: Nguyễn Minh Hùng Đề tài: Tìm Hiểu & Nghiên Cứu CPU
dẫn đầu là Intel, đã sử dụng Silicon dioxide (SĨ02) để làm transistor trong các quy trình
sản xuất logic Tuy nhiên, với mức độ ngày càng tinh vi của vi mạch, hiện tượng rò rỉ
điện tích trong ừansistor có xu hướng tăng lên Quản lý được sự rò rỉ là vấn đề rất quan
trọng đối với sự vận hành ổn định với tốc độ cao của bản thân chip, và đang trở nên ngày
càng cấp thiết
Intel đã tìm ra giải pháp mang tính đột phá cho vấn đề này Thay vì dùng Silicon dioxide
để làm transistor, các kỹ sư của Intel đã sử dụng vật liệu mới, gọi là “high-k”, hay “Hi-k”,
viết tắt từ “high dielectric constant”, nghĩa là chất có hệ số điện môi cao (k) Sử dụng vật
liệu mới để chế tạo transistor cho phép giảm mức rỏ rỉ điện tới 100 lần.Ngoài ra,
“High-k” còn có những ưu điểm khác, cho phép giải quyết nhiều vấn đề công nghệ trong sản
xuất và vận hành chip
* Mọi người đều biết đến công nghệ 45 nm trong sản xuẩt
bộ vỉ xử lý của ỉnteỉ, vậy công nghệ này có những j mới ?Yào khoảng đầu năm 2008, Intel sẽ tung ra thị trường 2 dòng vi xử kts được sản xuất
trên công nghệ 45nm tiên tiến nhất hiện nay đó là Core 2 Quad vàCore 2 Duo.Một trong những điểm nổi bật của 2 dòng CPU này làdung lượng cache L2 đc tăng thêm gần gấp đôi so với các dòng CPUsản xuất trên công nghệ 65nm trước đây Cụ thể là dòng Intel C2Q
có cache L2 là 12 MB và C2D là 6MB
Những bvxl cũ trc đây chỉ có tập lệnh SSE2 và SSE3, thì dòng CPU này đc tăng thêm tập
lệnh SSE4 giúp tăng tốc xử lý các dữ liệu truyền thông đa phương tiện, đồ hoạ 3D, kỹ
thuật số 1 cách đáng kể Đe phát huy tính năng này ng dùng cần phải bật tuỳ chọn SSE4
trong option của các phần mềm hỗ trợ SSE4
Như thường lệ cứ có dòng sản phẩm mới ra đời Intel lại đặt cho nó 1 mã số để phân biệt
với các dòng sp cũ trc đây Dòng C2Q 65mn có mã số Q6xxx thì dòng C2Q 45nm có mã
hiệu Q9xxx
Nói đến CPU 45nm ta kô thể ko nói đến dòng chipset hỗ trợ công nghệ 45mn của Intel
- Chipset 975X dc chuyển thành X38 và P965 (P: Períòrmance) có khe PCI-ex xl6 trên
bo mạch chủ chuyển thành P35 Điểm nổi bật của 2 dòng chipset này là hỗ trợ cả 2 chuẩn
DDR 2 và DDR3 và có khả năng oc tốt
* Mọi người đều biết đến công nghệ 65 nm trong sản xuất
bộ vỉ xử lý của ỉnteỉ, vậy công nghệ này có những j mới ?Dựa ừên phương pháp xây dựng bộ xử lý Yonah phiên bản lõi kép của chip máv tính
xách tay Pentium M Chu trình sản xuất này mang lại cho các nhà thiết kế
chip của Intel nhiều lựa chọn hơn trong việc nâng cao mật độ mạchđiện, tăng cường hiệu suất hoạt động và hạn chế lượng điện tiêu
thụ, những tính năng mà người sử dụng các thiết bị dùng pin đang
đòi hỏi
Trang 21GVHD: Nguyễn Minh Hùng Đề tài: Tìm Hiểu & Nghiên Cứu CPU
Công nghệ 65 rnn sẽ giảm đáng kể tình trạng rò ri năng lượng trong những thiết bị kích thước nhỏ, không đòi hỏi khả năng vận hành cao giống như máy tính hay server Một trong những nhân tố quan trọng giúp hạ điện năng tiêu thụ của bộ vi xử lý là cải thiện phương thức thiết kế bóng bán dẫn.Việc sử dụng những transistor tiêu thụ ít năng lượng CMOS 35 rnn nhỏ nhất hiện nay cho phép Intel tăng gấp đôi số bóng bán dẫn trên thiết bị xử lý đơn nhất so với phương pháp 90 nm
Đồng thời, giải pháp này “Với số transistor trên bộ vi xử lý vượt mức một tỷ, điểm mạnh trong từngbóng bán dẫn sẽ được nhân lên gấp bội và tạo ra lợi ích khổng lồ cho toàn bộ thiết bị”, Mark Bohr khẳng định “Quá trình thử nghiệm đã chứng minh bộ vi xử lý trên công nghệ 65 nm của Intel có thể giảm mức độ rò rỉ điện năng của transistor xuống gần 1.000 lần so với chu trình sản xuất chuẩn hiện nay của Intel”
• Mọi người đều biết đến công nghệ 90 nm ưong sản xuất
bộ vỉ xử lý của ỉntel, vậy công nghệ này có những j mới ?Quy trình sản xuất 90 nm tích hợp 7 lớp liên kết đồng tốc độ cao, giúp làm tăng tốc độ
của bộ xử lý Một bộ thiết bị in lithography dùng ánh sáng có bước sóng 248
rnn và 193 rnn được sử dụng cho quy trình này Công ty Intel cũng hyvọng tái sử dụng khoảng 75% các công cụ đang được dùng trên phiênbản 300 của công nghệ 0,13 micron hiện nay Điều này sẽ làm giảm chiphí triển khai và đảm bảo đầy đủ công cụ cho cơ sở hạ tầng sản xuất
Chip "Dothan" cũng sẽ tăng tốc độ của bus từ 400MHz lên 533MHz saukhi Intel đưa ra nền tảng "Sonoma" Nen tảng này sẽ bao gồm các chuẩn tích hợp không
dây 802.1 la/b/g đầu tiên của Intel Ngoài ra, tính năng mạng LAN không dây sẽ tương
thích với chuẩn bảo mật 802.1 li
* Mọi người đều biết đến công nghệ 130 nm trong sản xuẩt
bộ vỉ xử lý của inteỉ, vậy công nghệ này có những j mới ?Các nhà sản xuất chip hiện nay vẫn chế tạo phần lớn chip máy tính với công nghệ 130
nanomét (một nanomét bằng 1 phần tỷ mét) Công nghệ mới của Intel cho
phép tạo ra các mạch chỉ rộng 50 nanomét, tức mảnh bằng 1/2.000 lần độdày của một sợi tóc Động thái này hứa hẹn đẩy Intel lên vị trí dẫn đầutrong lĩnh vực sản xuất chip công nghệ cao của thế giới
Công Nghệ Hyper-Threading -siêu phân luồng
Internet, thương mại điện tử và phần mềm ứng dụngdoanh nghiệp đang ngày càng đòi hỏi nhiều năng lực tínhtoán của các máy chủ hơn
Đe nâng cao tốc độ, phần mềm cần phải được “phânluồng” - các chỉ thị sẽ được chia thành nhiều dòng lệnh để
Trang 22GVHD: Nguyễn Minh Hùng Đề tài: Tìm Hiểu & Nghiên Cứu CPU
có thể xử lý đồng thời trên nhiều bộ xử lý Intel đã đưa ra công nghệ “phân luồng” cho phép nâng cao tốc độ và khả năng tính toán song song cho những ứng dụng đa luồng Công nghệ mới của Intel mô phỏng mỗi bộ vi xử lý vật lý như là hai bộ vi xử lý luận lý (logic), tài nguyên vật lý được chia sẻ và có cấu trúc chung giống hệt nhau cho cả hai bộ xử lý lôgic Hệ điều hành và phần mềm ứng dụng sẽ “tưởng” như đang chạy trên hai hay nhiều bộ xử lý, kết quả là tốc độ xử lý trung bình
có thể tăng lên xấp xỉ 40% đối với một bộ xử lý vật lý, Intel gọi công nghệ này là Hyper-Threading(HT - tạm dịch là siêu luồng)
Giói Thiệu Công Nghệ Hyper—Threadỉng
Có một vài nguyên nhân làm cho các đơn vị thực thi không được sử dụng thường xuyên Nói chung, CPU không thể lấy dữ liệu nhanh như nó mong muốn do tắc nghẽn đường truyền (memory bus và front-side-bus), dẫn đến sự giảm sút hoạt động của các đơn vị thực thi Ngoài ra, một nguyên nhân khác đã được đề cập là có quá ít ILP trong hầu hết các chuỗi lệnh thực thi
Hiện thời cách mà đa số các nhà sản xuất CPU dùng để cải thiện hiệu năng trong các thế hệ CPU của họ là tăng tốc độ xung nhịp và tăng độ lớn của bộ nhớ đệm (cache) Nhưng cho dù cả hai cách này cùng được sử dựng thì vẫn không thực sự sử dụng hết được tiềm năng sẵn có của CPU Nếu cócách nào đó cho phép thực thi được nhiều chuỗi lệnh đồng thời mới có thể tăng hiệu quả sử dụng tài nguyên của CPU Đó chính là cái mà công nghệ siêu luồng của Intel đã làm được, bản chất của
nó là chia sẻ tài nguyên để sử dựng hiệu quả hơn các đơn vị thực thi lệnh đã có sẵn trên các CPU đó
Hyper threading - siêu luồng là một cái tên “tiếp thị” cho một công nghệ nằm ngoài “vương quốc” x86, là một phần nhỏ của SMT Ý tưởng đằng sau SMT rất đơn giản: một CPU vật lý sẽ xuất hiện trên hệ điều hành như là hai CPU và hệ điều hành không thể phân biệt được Trong cả hai trường hợp nhiệm vụ của hệ điều hành chỉ là gửi hai chuỗi lệnh tới “hai” CPU và phần cứng sẽ đảm nhiệm những công việc còn lại
Trong các CPU sử dụng công nghệ Hyper-Threading, mỗi CPU logic sở hữu một tập các thanh ghi, kể cả thanh ghi đếm chương trình PC riêng (separate program counter), CPU vật lý sẽ luân phiên các giai đoạn tìm/giải mã giữa hai CPU logic và chỉ cố gắng thực thi những thao tác từ hai chuỗi lệnh đồng thời theo cách hướng tới những đơn vị thực thi ít được sử dựng
Khi giới thiệu tại diễn đàn các nhà phát triển, công nghệ này được trình diễn trên bộ xử lý Xeon cùng với phần mềm dựng hình (rendering) của Maya, trong thí nghiệm đó một bộ xử lý Xeon với công nghệ siêu luồng đã chạy nhanh hơn 30% so với bộ xử lý Xeon thông thường Lợi ích về tốc
độ ấn tượng đến nỗi chẳng ai buồn để ý rằng thực tế công nghệ này đã có sẵn trên tất cả các lõi (nhân) của CPU Pentium 4 và Xeon, nhưng chỉ đơn giản là đã bị chính Intel vô hiệu hoá Những ai
đã mua CPU Xeon đời mới (0,13 micron) cho các workstation/server nên nâng cấp BIOS và có thể
sẽ rất ngạc nhiên với tuỳ chọn thú vị: cho phép hay vô hiệu hoá Hyper-Threading Hiện tại Intel đang mặc định vô hiệu hoá công nghệ này đối với các CPU dành cho máy tính để bàn, nhưng trongtương lai rất gần nó sẽ được kích hoạt bởi tuỳ chọn đặc biệt trong BIOS của các nhà sản xuất bo mẹ
Trang 23GVHD: Nguyễn Minh Hùng Đề tài: Tìm Hiểu & Nghiên Cứu CPU
Yí dụ, cho tới trước khi chipset AMD 760MP được đưa ra, tất cả các nền tảng x86 đa
bộ xử lý chỉ hỗ trợ việc chia băng thông sẵn có giữa các CPU, điều quan trọng nhất là các
ứng dụng và hệ điều hành cần phải có khả năng hỗ trự tính năng này Hiện nay, để giải
quyết nhanh các chuỗi lệnh phức tạp, phần cứng nói chung phải nhờ vào phương án xử lý
đa luồng, hệ điều hành phải hỗ trợ xử lý đa luồng, và phải tăng tốc độ một cách thật sự,
giống như có nhiều bộ xử lý (trong hầu hết các trường hợp) Công nghệ siêu luồng của
Intel giải quyết vấn đề bằng cách thực hiện nhiều hơn một chuỗi lệnh tại cùng một thời
điểm
Công Nghệ Dual - core:
Bộ vi xử lý của họ - Bộ Yi xử lý 2 lõi - Lõi kép - Có hai loại mới dành cho máy tính để
bàn - Pentium D: tức là phiên bản 2 lõi của Pentium 4 quen thuộc (Công nghệ 90nm), và
Pentium Extreme Edition: tức là phiên bản 2 lõi của Pentium 4 Extreme Edition Tuy
nhiên Intel lại không gọi 2 loại này là Pentium p 4
Cùng với việc tung ra bộ vi xử lý lõi kép, Intel cũng công bố 2 thế hệ Chípet mới dành
cho các bộ xử lý này: Ì945 và Ì955 bởi vì các loại Chipset hiện nay không tương thích với
công nghệ Dual-Core cũng như không hổ trợ hệ thống có nhiều CPUs Yì vậy, ngay cả
khi bạn vừa trang bị cho mình một loại Mainboard Socket 775 chipset Ì925 thì cũng
không thể dùng CPU mới này Yì vậy để có thể tận hưởng công nghệ và sức mạnh mới
này, bạn phải bấm bụng bán đi mainboard + CPU cũ để tậu hắn hehe hơi bị đau à nha
Intel hy vọng rằng, cho đến cuối năm 2006, sẽ có khoảng 70% máy tính để bàn sử dụng
ra làm 2 miếng - mỗi miếng, và thế là
chúng bắt buộc phải vẫn dính liền nhaukhi đem dán lên Wafer (đế đúc sẵn) (đểcho dễ hiểu, hãy nghĩ đến 2 em bé songsinh bị dính liền nhau phần ngực, có đủcác cơ quan nội tạng, chân tay)
tongue.gif —và đó chính là loại CPUDual-Core có mã là 8xx Dual-Core - haynói đúng hơn đó là 2 nhân giả mà thật hehe Tuy vậy, loại 8XX này lại không có công
nghệ HT, tuy nhiên 2 lõi dù dính nhau cũng chạy tốt hơn là HT giả mạo lừa Hệ điều hành
phải không
Còn với công nghệ 65mn thì sao thật may Dual-Core được sản xuất với công nghệ này mới thật sự
là 2 lõi riêng biệt nhau - Yì mỗi một lõi sẽ được sản xuất hoàn toàn độc lập và có 2Mb Cache ừên mỗi lõi, sau đó người ta mới cho gắn chúng lại với nhau trên 1 tấm Wafer đúc sẵn, hai lõi độc lập này không nhất thiết phải nằm gần nhau (hãy nghĩ rằng hai
VUhatỉs Dual Core
' Two índepenđent execution cores in the same processor ' Specitic
implementations will vary over time - Driven by design efíicỉenáes
and oplimiỉations No change to OEM designs or End User
Trang 24GVHD: Nguyễn Minh Hùng Đề tài: Tìm Hiểu & Nghiên Cứu CPU
em bé song sinh dính liền nay đã được phẫu thuật tách rời) và đó chinh là bại CPU Dual-Core có
mã là 9xx Dual-Core - hay nói đúng hơn đó là 2 nhân hoàn toàn thật hehe lại có thêm công nghệ
HT nữa nên XP nó nhận ra tới 4 con CPUs thật sướng
Chipset Ì945: Hỗ trợ Bus 800Mhz, hỗ trự tối đa 4G bộ nhớ, Dual channel DDR2-667,1 hoặc 2 PCI-e 16X, 6 PCI-2 IX, SATA n, RAIDể
Chipset Ì955: Hỗ trợ Bus 800/1066Mhz, hỗ ứợ tối đa 8G bộ nhớ, Dual channel DDR2- 667,2 PCI-e 16X, 6 PCI-2 IX, SATA, RAID
Công nghệ EMỐ4TEM64T, viết tắt cho bộ nhớ mồ rộng 64 Công nghệ và bây giờ được biết thường là 64 hoặc Intel XỐ4 (đó là khi bao gồm AMD64 quá), là một siêu-64 bit / phần mở rộng đó được xử lý bởi các đơn vị xử lý trung tâm (CPU) It is widely used in Intel's processors, including Pentium 4, Pentium
D, Pentium Extreme Edition, Celeron D, Xeon, Pentium Dual-Core, and in the Core 2 processors
Nó được dùng rộng rẩi trong bộ vi xử lý của Intel, bao gồm 4 Pentium, Pentium D, Pentium Extreme Edition, Celeron D, Xeon, Pentium Dual-Core, và trong bộ vi xử lý Core 2
Ban đầu có tên mã là Yamhìll, các EM64T, lần đầu tiên được "thông báo" trong năm
2004, khi Chủ tịch Intel vào thời đó, Craig Barrctt, tuyên bố như thể nào nó đã được tiến hành Công nghệ nầy đã đi qua một chút khátên thay đổi, như trong Intel Developer Forum (IDF) nó được gọi là CT (có thể đứng cho Clackamas Công nghệ, mặc dù nó vẫn chưa chắc chắn); sớm, nó đã được gọi là IA~32e và cuối cùng tháng ba năm 2004, nó
đã được chinh thức cồng bố như là EM64T này Tuy nhiên, vào cuối năm 2006, Intel bắt đầu giảm bớt việc sử dụng tên EM64T và bắt đầu xem nó như là 64 Intel, đối thủ có tiềm năng đề AMDỐ4
EMỐ4T ban đâu được thực hiện trong phiên bản E (Prescott) của Pentium 4, được hỗ trợ bởi Ĩ915P (Grantsdale) và Ì925X (Alderwood) chipset trong tháng ố năm 2004 Nó được giả đinh rằng điều này xảy ra để canh tranh với các Opteron và Athlon 64 dòng, còn được gọi là lõi K8, từ AMD Trong Intel, bộ vỉ xử lý đầu tiên mà Intel đã thông qua 64 công nghệ được Nocona (tên mã cho một Xeon) Ngoài ra, xem xét rằng các sản phẩm Xeon Nocona đã được thực hiện dựa tắt củaPentium 4, Pentium 4 cũng hồ trợ công nghệ Intel 64, mặc dù nó không được kích hoạt ban đầu trong việc thiết kế Prescott Intel chỉnh thúc giới thiệu các bộ vi xử lý máy tính để bàn EM64T ở trong N0 Đẩy mạnh Prescott-2M Phiên bản này cũng bao gồm một Vô hiệu hoá thực thi (XD) hỗtrợ cho Intel 64 và vẫn được bão gồm trong các sản phẩm Xeon hiện tại (tên mã là, Irwindale) Intel đầu tiên 64
Trang 25GVHD: Nguyễn Minh Hùng Đề tài: Tìm Hiểu & Nghiên Cứu CPU
cho các bộ xử lý di động là Merom của bộ xử lý Core 2 phát hành vào tháng 7 năm 2006 Thậtkhông may, không ai trong số các phiên bản trước của bộ xử lý di động hỗ trợ các CPU
Ưu điểm của EM64T
Để lưu ý, trước tiên, EM64T chỉ có thể được sử dụng bởi hệ điều hành 64-bit Do đó, hệ điềuhành 32-bit như Windows XP không thể chạy theo chế độ IA32 thường xuyên
• 64-bit cho phép cài đặt lên đến 16 EB (Exabyte) của RAM, tuy nhiên, hiện nay Celeron D,Pentium 4, và Xeon dòng CPU có 36 địa chỉ, mà có thể hỗ trợ 64 GB RAM, trong khiCPU Xeon DP có thể chứa đến 1 TB (terabyte)
• Như tất cả các đăng ký 64-bit vẫn còn sử dụng phương án phân chia cùng, họ cũng cóthể tiến hành các hoạt động từ 8-bit
• RIP, 64-bit mới con trỏ hướng dẫn, đã được tạo ra ở nori EIP, một cho 32-bit, cùng vớimột mới RIP-đỊa chỉ tương đối
• SIMD hướng dẫn có 8 đăng ký mới; CPU có 16 64-bit MMX đăng ký trong chế độ 64-bit
• XMM sổ đăng ký hiện nay 16 hơn là trước đó 8, và chúng được sử dụng bởi các hoạtđộng điểm nổi SSE
• Chỉ có đăng ký FPU là 80-bit, trong khi phần còn lại của sổ đăng ký và hướng dẫn các contrỏ đang rộng 64-bit
Công nghệspeedstep® technology (eist)
Intel SpeedStep® Technology (EIST) là công nghệ đặc biệt của Intel được áp dụng chocác sản phẩm vi xử lý của họ, EIST sẽ giúp các vi xử lý chạy với tốc độ phù hợp nhất trong cácthời điểm khác nhau tuỳ theo trạng thái các ứng dụng đang chạy Ta hãy hình dung một CPU cótốc độ 3.6GHz với công suất 110w có thể chạy chỉ với tốc độ 2.8GHz khi máy tính ở trạng tháinhàn rỗi và mức tiêu hao điện năng cũng như độ ồn hệ thống suy giảm đáng kể
Thực tế ta thấy trong suốt một buổi làm việc, các máy tính thường xuyên hoạt động dưới mứccông suất tối đa vì thế nếu EIST được ứng dụng sẽ tiết kiệm được một lượng điện năng đáng kể,đặc biệt là với các nhà máy công sở có sử dụng máy vi tính với số lượng
Yậy một máy tính như thế nào được gọi là có công nghệ EIST?
1 Máy tính đó phải sử dụng một CPU có công nghệ EIST, tất cả các CPU Pentium 4 6xx,Pentium D 830 trở lên, Core 2 Duo 4300 trở lên đều được tích hợp EIST
2 Chipset: bo mạch chủ phải sử dụng các bộ chipset Intel 910 trở lên
3 Yêu cầu điện áp của bo mạch: bo mạch hỗ trợ Dynamic YID, có thể cung cấp cho CPU cácmức điện áp khác nhau ở các thời điểm khác nhau Tất cả các mainboard Intel thoả mãn điều kiện
2 đều đáp ứng điều kiện 3, và hầu hết các mainboard trên thị trường hiện nay đều đáp ứng điềukiện này