Phân tích kiến trúc, nguyên lí làm việc của bộ vi xử lí AMD k8
TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP HÀ NỘI KHOA CÔNG NGHỆ THÔNG TIN BÀI TẬP LỚN MÔN HỌC Đề tài: Phân tích kiến trúc, nguyên lí làm việc vi xử lí AMD K8 Giáo viên: Ths.Nguyễn Tuấn Tú Các thành viên: 1.Vũ Văn Lương MãSV: 0541060109 2.Nguyễn Thế Duy MãSV: 0541060136 3.Nguyễn Duy Quý Mã SV: 0441360079 Hà Nội 20/6/2012 Mục Lục 1.1.Giới thiệu tổng quát 1.2.Các dòng CPU dùng socket AM2 1.2.1.AMD Sempron 1.2.2.AMD Athlon 64 1.2.3.AMD Athlon 64 X2 10 1.2.4.AMD Athlon 64 FX 12 1.3.Thông tin chi tiết 18 1.3.1.Các tính công nghệ 18 1.3.2 Các tính công nghệ có sẵn 19 2.1Tìm nạp dòng lệnh – Instructions Fetch 21 2.2 Rẽ nhánh .22 2.3Giải mã - Decoding .23 2.4Bộ phận xử lý số nguyên – Interger Execution Unit .24 2.5 Bộ phận dấu phẩy động – Floating Point Unit 25 2.6 Hệ thống nhớ bên 26 2.7Bộ phận điều khiển nhớ - Memory Controller 29 2.8 Lấy trước liệu – Prefetch 30 2.9 Ảo hoá 30 LỜI NÓI ĐẦU Vào ngày tháng năm 2006, AMD thức tung thị trường hệ CPU K8 sử dụng socket AM2 (socket AM2 có 940 chân) Thế hệ CPU K8 hỗ trợ RAM DDR2 có thêm số tính năng, công nghệ công nghệ máy tính ảo AMD Virtualization Đặc biệt hệ CPU K8 dùng socket AM2 có dòng EE (Energy Efficient) với công suất tiêu thụ thấp đáng kể Cốt lõi K8 tương tự K7 Sự thay đổi tích hợp hướng dẫn AMD64 điều khiển nhớ on-chip Bộ điều khiển nhớ đáng kể làm giảm độ trễ nhớ chịu trách nhiệm hầu hết tăng hiệu suất từ K7 lên K8 Dưới số tìm hiểu kiến trúc, nguyên lí làm việc vi xử lí AMD K8 Do thời gian chuẩn bị không nhiều với kiến thức hạn chế thân nên không tránh khỏi thiếu sót Mong thầy tham gia góp ý xây dựng thêm để thông tin hệ thống vi xử lí hoàn thiện ! Nhóm sinh viên thực CHƯƠNG I: KIẾN TRÚC BỘ VI XỬ LÍ AMD K8 1.1.Giới thiệu tổng quát K8 AMD xử lý máy tính vi kiến trúc thiết kế AMD kế thừa cho vi kiến trúc AMD K7 K8 thực AMD64 64-bit mở rộng kiến trúc xử lý x86 Bộ vi xử lý dựa lõi K8 bao gồm: Athlon 64 Athlon 64 X2 Athlon 64 FX Sempron Opteron Turion 64 Cốt lõi K8 tương tự K7 Sự thay đổi tích hợp hướng dẫn AMD64 điều khiển nhớ on-chip Bộ điều khiển nhớ đáng kể làm giảm độ trễ nhớ chịu trách nhiệm hầu hết tăng hiệu suất từ K7 K8 Vào ngày tháng năm 2006, AMD thức tung thị trường hệ CPU K8 sử dụng socket AM2 (socket AM2 có 940 chân) Thế hệ CPU K8 hỗ trợ RAM DDR2 có thêm số tính năng, công nghệ công nghệ máy tính ảo AMD Virtualization Đặc biệt hệ CPU K8 dùng socket AM2 có dòng EE (Energy Efficient) với công suất tiêu thụ thấp đáng kể Hình 1.1: Sơ đồ kiến trúc vi xử lí AMD K8 Hình ảnh sản phẩm Hình 1.2: Socket AMD2 Hình 1.3: AMD 64 Athlon 1.2.Các dòng CPU dùng socket AM2 1.2.1.AMD Sempron Hình 1.4: Sơ đồ kiến trúc AMD Sưmpron Đặc điểm : Bus hệ thống 1600MHz Hỗ trợ RAM DDR2 dual channel 400/533/667MHz Hỗ trợ Cool’n’Quiet Hỗ trợ AMD64 Công suất TDP : 62W ( 35W dòng Energy Efficient) Vcore • 1,20 / 1,25 V (dòng Energy Efficient) • 1,25 / 1,30 / 1,35 V • Các loại CPU AMD Sempron dùng socket AM2 : Bảng 1.1 Các loại CPU AMD Sempron dùng socket AM2 1.2.2.AMD Athlon 64 Hình 1.5: AMD Athlon 64 Đặc điểm : Bus hệ thống 2000MHz Hỗ trợ RAM DDR2 dual channel 400/533/667MHz Hỗ trợ công nghệ AMD Virtualization Hỗ trợ Cool’n’Quiet Hỗ trợ AMD64 Công suất TDP : 62W ( 35W dòng Energy Efficient) Có thể hạ thấp hệ số nhân Như đề cập từ trước, MOP tách làm phép tính số nguyên phép tính địa nhớ hàng đợi Scheduler Pipe số nguyên Dựa vào liệu, Scheduler chuyển phép tính số nguyên sang ALU phép tính địa sang AGU từ hàng đưọi Có tối đa hai yêu cầu nhớ đồng thời Vì vậy, nhiều ba phép tính số nguyên phép tính nhớ (64 bit đọc/viết) xử lý xung nhịp Còn Micro-Operation từ nhiều MOP khác xử lý không theo thứ tự mà tuỳ thuộc vào liệu sẵn sàng Ngay phép tính vi lệnh ( Micro-Ops ) số học MOP xử lý, MOP rời khỏi hàng đợi lập Scheduler nhường chỗ cho phép tính khác Các xử lý K8 chọn phép tính Micro-Ops đòi hỏi địa nhớ theo mức độ chương trình Các yêu cầu nhớ xuất sau mã chương trình xử lý trước phép tính trước Vì thế, phép tính trước chưa thực hiện, tất phép tính địa sau tiến hành toán hạng sẵn sàng Ví dụ: Add ebx, ecx mov eax, [ebx+10h] _ Phép tính nhanh địa mov ecx, [eax+ebx] – địa phụ thuộc vào kết lệnh trước mov edx, [ebx+24h] – lệnh không gửi thực tất địa lệnh trước tính toán xong Việc ảnh hưởng đến tốc độ xử lý K8 bị “thắt nút cổ chai” Do đó, xử lý K8 tiến hành hai lệnh xung nhịp, số mã định, thực đòi hỏi nhớ hiệu xử lý Core 2, đọc lệnh xung nhịp, lại áp dụng quy tắc xử lý lệnh không theo thứ tự đọc ghi trước lệnh trước 2.5 Bộ phận dấu phẩy động – Floating Point Unit Bộ phận Scheduler đơn vị dấu phẩy động (FPU) xử lý K8 tách riêng khỏi phận Scheduler đơn vị số nguyên có thiết kế khác chút Bộ nhớ đệm Scheduler cung cấp tối đa 12 nhóm, nhóm gồm MOP (theo lý thuyết 36 phép tính dấu phẩy động) Khác với Bộ phận số nguyên có Pipe đối xứng, FPU gồm có ba phần khác nhau: FADD cho phép cộng dấu phảy động , FMUL 25 cho phép nhân dấu phảy động FMISC (còn gọi FSTORE) cho phép tính lưu nhớ phép tính bổ trợ Do đó, nhớ đệm Scheduler không cố định rõ MOP vào nhóm khác ( theo hình ) Hình 2.4: Đơn vị dấu phẩy động Mỗi xung nhịp, K8 gửi phép tính đến đơn vị dấu phẩy động để xử lý Bộ xử lý K8 sử dụng đơn vị dấu phẩy động 80 bit Tại phần giải mã, lệnh vector SSE 128 bit tách làm hai MOP xử lý hai nửa 64 bit toán hạng 128 bit Các MOP xử lý xung nhịp khác Điều không làm chậm tiến độ xử lý lệnh vector, mà làm giảm kích thước nhớ đệm Scheduler FPU xuống nửa, giảm hiệu việc xử lý lệnh không theo thứ tự Bộ xử lý K8 thực tải lệnh SSE cách sử dụng Bộ phận FSTORE Một mặt, không cho phép xử lý lúc lệnh khác cần sử dụng Bộ phận Mặt khác, cho phép lần tải lệnh lúc K8 đọc song song hai lệnh lúc số lệnh kết hợp phép tính nhớ phép tính liệu (còn gọi lệnh Load-Execute), ví dụ ADDPS xmm1, [esi] 2.6 Hệ thống nhớ bên Đơn vị tài/lưu trữ - Load/Store Unit Khi địa cần tìm tính toán xong AGU xử lý K8, tất phép tính tải lưu trữ chuyển đến LSU (Đơn vị tải/lưu trữ Load/Store Unit ) LSU chứa hai hàng chờ: LS1 LS2 Đầu tiên, phép tính chuyển vào hàng LS1 với 12 đơn vị Với tốc độ hai phép tính xung nhịp, hàng chờ LS1 cần có nhớ cache L1 xếp mã lập trình Trong trường hợp cache ( Cache –Miss ) , phép tính xếp vào hàng chờ LS2 32 đơn vị Đây lúc cần đến nhớ cache L2 RAM 26 Cache L1 Cache L1 K8 tách riêng: 64KB lệnh (L1I) liệu (L1D) Mỗi cache liên kết hai chiều có độ dài 64 byte Việc dẫn đến xung đột thường xuyên đường có đích đến, làm tăng số cache thiếu ảnh hưởng xấu đến tốc độ xử lý Nhưng tình trạng khắc phục cache L1 có kích thước lớn Ngoài ra, ưu điểm khác L1D có có hai cổng, xử lý hai lệnh đọc hoặc/và viết hai lệnh xung nhịp Cache L2 Mỗi nhân xử lý nhân K8 có cache L2 riêng Cache L2 K8 cũ: 512KB nhân với 16 liên kết Các cache L2 riêng có ưu nhược điểm riêng so với cache L2 chia sẻ CPU Core Chắc chắn ưu điểm lớn việc xung đột cạnh tranh cache nhiều nhân tải lúc không Còn nhược điểm có cache cho nhân có ứng dụng hoạt động Cache L2 riêng: liệu lưu cache L1 L2 không nhân đôi Cache L1 L2 trao đổi liệu qua hai Bus theo hai hướng: để nhận để chuyển liệu Trong xử lý K8, Bus rộng 64 bit (8 byte) Cấu trúc giúp tốc độ chuyển liệu đến cache L2 byte/xung nhịp Nói cách khác, cần xung nhịp để chuyển 64 bit, thời gian chuyển liệu đến nhân bị chậm lại rõ rệt, đặc biệt hai dòng cache L2 chuyển đến lúc Hình 2.5: Bus chuyển liệu cache L1 L2 xử lý K8 Cache L3 Để khắc phục nhược điểm cache L2 có kích cỡ nhỏ, cache L3 2MB tất nhân K8 lại chia sẻ với 32 đường liên kết.Cache L3 có khả thích ứng riêng biệt: lưu trữ liệu từ cache L2 tất nhân liệu chung nhiều nhân Khi nhân yêu cầu đọc dòng lệnh, có 27 nhân sử dụng dòng lệnh đó, chuyển từ không gian trống L3 Còn dòng lệnh nhân khác sử dụng, nằm cache Tuy nhiên, để xếp chỗ cho dòng lệnh đến từ cache 2, dòng lệnh khác trước rời Cache L3 giúp tăng tốc độ luân chuyển liệu nhân Như tìm hiểu, xử lý Athlon 64 tạm thời chuyển đổi liệu nhân thông qua Bus nhớ Do đó, việc chuyển đến liệu chia sẻ diễn chậm nhiều Theo AMD, xử lý nhân K8 trao đổi liệu qua cache L3 Khi yêu cầu từ số nhân chuyển đến, nhân chuyển đổi liệu copy liệu vào cache L3, nơi nhân yêu cầu đọc chúng Thời gian chuyển liệu cache nhân lại rút ngắn nhiều Hình 2.6 : Quá trình chuyển liệu nhân xử lý K8 Cache L3 hoạt động hiệu so với cache L2 Tuy nhiên, AMD cho hiệu trội tuỳ thuộc vào khối lượng công việc Nếu khối lượng công việc không lớn, khả làm việc L3 lớn rõ rệt, khối lượng công việc nặng nề, độ rộng băng thông tăng lên Chúng ta phải chờ để kiểm chứng điều TLB Bên cạnh nhớ Cache cho lệnh cho liệu , vi xử lí có nhiều kiểu Cache : Bộ đệm TLB ( Translation – Lookaside Buffer ) Những đệm dùng 28 để lưu trữ kết nối địa trang vật lí với địa trang ảo từ Bảng trang địa Số lượng danh mục TLB xác định có trang nhớ làm việc mà không công chuyển sang Bảng trang khác Điều hay bị phê phán ứng dụng mà xử lí liệu nhớ ngẫu nhiên , chúng yêu cầu liệu liên tục trang khác , vi xử lí K8 có đệm dịch nhiều có kích thước lớn Để thuận tiên theo dõi , đưa bảng Bảng : Khả TLB vi xử lí K8 ITLB : Bộ đệm TLB cho lệnh DTLB : Bộ đệm TLB cho liệu Như bảng cho thấy nhiều đệm dịch trang 2MB Nó xuất để hỗ trợ cho việc trang có dung lượng lớn 1GB mà dùng hữu ích cho máy chủ xử lí khối lượng liệu lớn Với hỗ trợ thích hợp từ phía hệ điều hành mà ứng dụng dùng trang 2MB 1GB chạy nhanh 2.7Bộ phận điều khiển nhớ - Memory Controller Khi liệu yêu cầu không tìm thấy nhớ Cache , yêu cầu chuyển tới Bộ phận điều khiển nhớ tích hợp bên Die ( Vùng Silcon chứa Chip ) vi xử lí Vị trí Bộ phận điều khiển nhớ nằm Die vi xử lí làm giảm thời gian trễ với nhớ , bên cạnh lại làm cho vi xử lí không linh hoạt với kiểu nhớ khác , lại làm tăng kích thước Die phức tạp thiết kế Bộ phận điều khiển nhớ tích hợp bên CPU điều thuận lợi với vi xử lí K8 29 Đầu tiên , truyền liệu kênh có độ rộng 128bit dùng hai kênh độc lập 64-bit Như hai nhiều nhân vi xử lí làm việc hiệu với nhớ thời gian Thứ hai , thuật toán xếp lại cấp phát Bộ phận điều khiển nhớ tối ưu hoá Những nhóm điều khiển nhớ Đọc Ghi mà Bus nhớ tận dụng cách tối đa Những việc Đọc thuận lợi so với việc Ghi Dữ liệu cần ghi lưu trữ đệm mà không rõ kích thước ( nằm từ 16 30 dòng , mõi dòng 64-byte ) Với việc điều khiển dòng yêu cầu nhóm tránh việc chuyển Bus nhớ từ trạng thái Đọc thành Ghi liên tục để tiết kiệm thời gian Nó cho phép tăng hiệu suất cách đáng kể thay đổi yêu cầu trạng thái Đọc Ghi Thứ ba , Bộ phận điều khiển nhớ phân tích chuỗi yêu cầu thực công việc lấy trước liệu ( Prefetch ) 2.8 Lấy trước liệu – Prefetch Prefetch rõ ràng đem lại lợi ích cho vi xử lí K8 Tích hợp phận điều khiển nhớ cho phép thời gian trễ thấp điều làm cho vi xử lí AMD thực thành công với hệ thống nhớ thời gian dài Tuy nhiên , vi xử lí K8 không đạt hiệu suất làm việc mong đợi với nhớ DDR2 , Core lại có cấu tạo nên sức mạnh với Prefetch Những vi xử lí K8 có 02 Prefetch : mã liệu Prefetch cho liệu lấy liệu vào nhớ Cache L2 phương thức đơn giản liên tục 2.9 Ảo hoá AMD tiếp tục cải tiến công nghệ ảo họ mà máy chủ chạy vài hệ điều hành lúc máy tính Một cải tiến công nghệ ảo cách sâu sắc sử dụng Nested Paging Trong hệ thống trang máy ảo lồng toàn Bảng trang Hypervisor ( Theo dõi máy ảo – tảng ảo cho phép nhiều hệ điều hành chạy PC ) Nếu liên kết tới trang TLB , CPU thực biến đổi tất Bảng tự động , không kiểu Shadow Paging yêu cầu nhiều tài nguyên để quản lí việc chuyển Bảng máy ảo 30 Hình 2.7 : Kiểu Shadow Paging chuyển hệ thống máy ảo Hypervisor phải chuyển Bảng trang xoá TLB thời gian Hình 2.8 : Kiểu Nested Paging chuyển hệ thống máy ảo Hypervisor khong cần phải xoá TLB thời điểm Một số liệu cho dùng Nested Paging làm tăng hiệu suất ứng dụng hệ thống ảo tới 40% so sánh với hiệu suất dùng kiểu Shadow Paging 31 Chương 3: ỨNG DỤNG Ban đầu, AMD thiết kế Neo cho sản phẩm MTXT siêu mỏng (loại MTXT mỏng, nhẹ, có đầy đủ chức năng, giá phải chăng) Tuy nhiên, đây, AMD mở rộng việc sử dụng chip Neo sang PC "tất một" nettop (loại MTĐB giá rẻ, nhỏ sách bìa cứng) Với sức mạnh tổng hợp từ xử lý bên chip, hệ APU AMD nâng tầm tốc độ xử lý đồ họa với hiệu cao, với khả tiết kiệm điện tốt chi phí cạnh tranh nên hệ chip AMD dự báo “thế lực mới” thị trường chip vài năm tới Hình 3.1: HD rực rỡ Sức mạnh tổng hợp từ APU Đầu năm 2011, hãng AMD làm “khuynh đảo” thị trường chip tung xử lý tăng tốc giới mang tên APU (Accelated Processing Unit) tích hợp thành phần quan trọng bên trong, bao gồm: xử lý tính toán (CPU), xử lý đồ họa (GPU) điều khiển cầu bắc (North Bridge) 32 Máy trang bị APU kết hợp hai cách xử lý nối tiếp song song vi xử lý xử lý đồ hoạ Nhờ vậy, khả xử lý tính toán đồ hoạ APU thực vượt trội đáp ứng phần lớn nhu cầu người sử dụng, đồng thời giao tiếp CPU GPU tăng tốc đáng kể Hiện để tăng tốc xử lý đồ họa, mẫu chip hãng khác phải kết hợp với card đồ họa rời sử dụng card đồ họa rời, số mẫu chip phải tắt xử lý đồ họa bên chip, sản phẩm không gia tăng giá trị mà lại không tận dụng hết hiệu sản phẩm Tuy nhiên với chip APU AMD việc xử lý đồ họa tương đương dòng chip kết hợp card rời khác hãng khác GPU tích hợp APU kết hợp với card đồ họa rời giúp tăng tốc xử lý đồ họa lên 80% so với bình thường Ngoài ra, môi trường máy tính xách tay (MTXT) mà người dùng có nhu cầu vừa xử lý công việc thường xuyên vừa muốn chạy ứng dụng yêu cầu cấu hình đồ họa cao chơi game “khủng” mà không muốn sử dụng card rời (nóng máy, tốn pin) chip APU AMD lựa chọn hợp lý, APU chứa triệu transistors AMD giúp cân khối lượng công việc theo cách đại nhờ kỹ thuật ép xung tự động Turbo Cores Hình 3.2: Công nghệ chip APU 33 Các dòng sản phẩm vi xử lý AMD K8 `AMD Sempron LE: Hình 3.3: AMD Sempron LE-1250 Sparta (2.20GHz, 512KB L2 Cache, Socket AM2, 800Mhz FSB) `AMD Sempron LE AMD Socket AM2 Series Socket type Manufacturing Technology ( Công nghệ sản xuất ) Codename (Tên mã) Số lượng Cores CPU Speed (Tốc độ CPU) Bus Speed / HyperTransport L2 Cache Max Thermal Design Power (Công suất tiêu thụ tối đa) (W) V Core (Core Voltage) Max Temperature (°C) Advanced Technologies Công nghệ đồ họa 65 nm AMD Sparta 2.20GHz 0.8 Gb/s 512 KB 45 35 75 ••- Bảng 3.1 Thông tin chi tiết AMD Sempron LE-1250 Sparta (2.20GHz, 512KB L2 Cache, Socket AM2, 800Mhz FSB) 34 AMD Athlon 64: Hình 3.4: AMD Athlon 64 3000+ (2.0GHz, 52KB L2 Cache, Socket 939, 1600MHz FSB) AMD Athlon 64 AMD Socket 939 Series Socket type Manufacturing Technology ( Công nghệ sản xuất ) Codename (Tên mã) CPU Speed (Tốc độ CPU) Bus Speed / HyperTransport L2 Cache Max Thermal Design Power (Công suất tiêu thụ tối đa) (W) V Core (Core Voltage) Max Temperature (°C) Advanced Technologies Công nghệ đồ họa 90 nm AMD Venice 2.00GHz 1.6 Gb/s 512 KB 89 1.50V 70 ••- Bảng 3.2: AMD Athlon 64 3000+ (2.0GHz, 52KB L2 Cache, Socket 939, 1600MHz FSB) 35 AMD Athlon 64 X2 Hình 3.5: CPU AMD Athlon 64 X2 QL-60 Model Hãng sản xuất AMD Thông số kỹ thuật • MMX • SSE • SSE2 • SSE3 • 3DNow! Multimedia Instruction Tính toán 64bit Hỗ trợ Siêu phân luồng (HT) Hỗ trợ công nghệ ảo hóa Điện sử dụng 1.075 - 1.125 Bảng 3.3: CPU AMD Athlon 64 X2 QL-60 36 AMD Athlon 64 FX Hình 3.6: AMD Athlon FX-53 (2.4GHz, 1MB L2 Cache, Socket 940, 1600MHz FSB) AMD Athlon FX AMD Socket 940 Series Socket type Manufacturing Technology ( Công nghệ sản xuất ) 130 nm AMD 2.40GHz 1.6 Gb/s MB Codename (Tên mã) Số lượng Cores CPU Speed (Tốc độ CPU) Bus Speed / HyperTransport L2 Cache Max Thermal Design Power (Công suất tiêu thụ tối đa) (W) V Core (Core Voltage) Max Temperature (°C) 89 1.50V 70 • HyperTransport • 64 bit •- Advanced Technologies Công nghệ đồ họa Bảng 3.4: AMD Athlon FX-53 (2.4GHz, 1MB L2 Cache, Socket 940, 1600MHz FSB) 37 KẾT LUẬN Trong điều kiện nay, công nghệ phát triển nhanh bão Có nhiều công nghệ đời Việc hiểu ứng dụng công nghệ vào sống gặp khó khăn định Công nghệ vi xử lí Hiện thị trường có nhiều hãng sản xuất vi xử lí hàng đầu như: Intel, Amd, IBM, HP, HITACHI… Việc người sử dụng hiểu tìm cho vi xử lí thích hợp với yêu cầu công việc tài không dễ Việc tìm hiểu vi xử lí AMD K8, vi xử lí thuộc hãng AMD, mang cho chúng em thông tin hữu ích vi xử lí Một vi xử lí hứa hẹn mang lại nhiều tiện ích, hi vọng tương sản phẩm có cải tiến định Một lần chúng em xin chân thành cảm ơn Giảng viên Thạc sĩ Nguyễn Tuấn Tú có đóng góp kiến thức để chúng em hoàn thành tập lớn này! Nhóm sinh viên thực 38 TÀI LIỆU THAM KHẢO http://vozforums.com/showthread.php?t=1881613 http://www.wikipedia.org/ http://www.amd.com/sg/Pages/AMDHomePage.aspx http://www.cpushack.com http://www.vatgia.com/home/ http://www.pcworld.com.vn/ https://www.google.com.vn/ 39 [...]... phận điều khiển bộ nhớ tích hợp bên trong Die ( Vùng Silcon chứa Chip ) của bộ vi xử lí Vị trí của Bộ phận điều khiển bộ nhớ nằm trên Die của bộ vi xử lí làm giảm thời gian trễ với bộ nhớ , nhưng bên cạnh đó nó lại làm cho bộ vi xử lí không linh hoạt với những kiểu bộ nhớ khác nhau , nó lại làm tăng kích thước của Die và sự phức tạp trong thiết kế Bộ phận điều khiển bộ nhớ được tích hợp bên trong CPU... Bộ phận điều khiển bộ nhớ có thể phân tích chuỗi yêu cầu và thực hiện công vi c lấy trước dữ liệu ( Prefetch ) 2.8 Lấy trước dữ liệu – Prefetch Prefetch rõ ràng đem lại lợi ích cho những bộ vi xử lí K8 Tích hợp bộ phận điều khiển bộ nhớ cho phép thời gian trễ thấp điều đó làm cho những bộ vi xử lí của AMD thực hiện thành công với hệ thống nhớ trong một thời gian dài Tuy nhiên , những bộ vi xử lí. .. sẵn AMD6 4 (Công nghệ tính toán 64-bit) HyperTransport Technology (Công nghệ siêu truyền) Integrated Memory Controller (Bộ điều khiển bộ nhớ tích hợp) Cool’n’Quiet (Công nghệ làm mát và tiết kiệm điện năng) 19 Enhanced Virus Protection (Tính năng phòng chống virus) 20 CHƯƠNG II: NGUYÊN LÝ LÀM VI C CỦA BỘ XỬ LÝ AMD K8 2.1Tìm nạp dòng lệnh – Instructions Fetch Bộ xử lý bắt đầu quá trình mã hoá bằng vi c. .. thuận lợi với những bộ vi xử lí K8 29 Đầu tiên , bây giờ nó có thể truyền dữ liệu không phải bằng một kênh có độ rộng 128bit và nó dùng hai kênh độc lập 64-bit Như vậy hai hoặc nhiều nhân của bộ vi xử lí có thể làm vi c hiệu quả hơn với bộ nhớ trong cùng một thời gian Thứ hai , thuật toán sắp xếp lại và cấp phát trong Bộ phận điều khiển bộ nhớ được tối ưu hoá Những nhóm điều khiển bộ nhớ Đọc và Ghi... những ứng dụng mà xử lí dữ liệu bộ nhớ ngẫu nhiên , khi chúng yêu cầu dữ liệu liên tục trong những trang khác nhau , bộ vi xử lí K8 có những bộ đệm dịch nhiều hơn và có kích thước cũng lớn hơn Để thuận tiên theo dõi , chúng tôi đưa ra bảng dưới đây Bảng 2 1 : Khả năng TLB của bộ vi xử lí K8 ITLB : Bộ đệm TLB cho lệnh DTLB : Bộ đệm TLB cho dữ liệu Như bảng trên cho thấy nhiều bộ đệm dịch những trang 2MB... động để xử lý Bộ xử lý K8 sử dụng đơn vị dấu phẩy động 80 bit Tại phần giải mã, các lệnh vector SSE 128 bit sẽ được tách làm hai MOP xử lý hai nửa 64 bit của một toán hạng 128 bit Các MOP này sẽ được xử lý lần lượt tại các xung nhịp khác nhau Điều này không chỉ làm chậm tiến độ xử lý lệnh vector, mà còn làm giảm kích thước của bộ nhớ đệm Scheduler FPU xuống một nửa, và do đó giảm hiệu quả vi c xử lý... giữa các nhân trong bộ xử lý K8 Cache L3 sẽ hoạt động hiệu quả hơn so với cache L2 Tuy nhiên, AMD cho rằng hiệu quả trội hơn này còn tuỳ thuộc vào khối lượng công vi c Nếu khối lượng công vi c không quá lớn, khả năng làm vi c của L3 sẽ lớn hơn rõ rệt, còn nếu khối lượng công vi c rất nặng nề, độ rộng băng thông sẽ tăng lên Chúng ta sẽ còn phải chờ để kiểm chứng điều đó TLB Bên cạnh bộ nhớ Cache cho lệnh... liệu , bộ vi xử lí có nhiều kiểu của Cache : đó là Bộ đệm TLB ( Translation – Lookaside Buffer ) Những bộ đệm này được dùng 28 để lưu trữ sự kết nối giữa địa chỉ trang vật lí với địa chỉ trang ảo từ những Bảng trang địa chỉ Số lượng của danh mục TLB xác định có bao nhiêu trang bộ nhớ có thể làm vi c mà không mất công chuyển sang Bảng trang khác Điều này hay bị phê phán trong những ứng dụng mà xử lí. .. pin) thì chip APU của AMD sẽ là lựa chọn hợp lý, vì APU chứa hơn 1 triệu transistors của AMD sẽ giúp cân bằng khối lượng công vi c theo cách hiện đại nhờ kỹ thuật ép xung tự động Turbo Cores Hình 3.2: Công nghệ chip APU 33 Các dòng sản phẩm bộ vi xử lý AMD K8 `AMD Sempron LE: Hình 3.3: AMD Sempron LE-1250 Sparta (2.20GHz, 512KB L2 Cache, Socket AM2, 800Mhz FSB) `AMD Sempron LE AMD Socket AM2 Series... chip khi tung ra bộ xử lý tăng tốc đầu tiên trên thế giới mang tên APU (Accelated Processing Unit) tích hợp 3 thành phần quan trọng bên trong, bao gồm: bộ xử lý tính toán (CPU), bộ xử lý đồ họa (GPU) và bộ điều khiển cầu bắc (North Bridge) 32 Máy trang bị APU có thể kết hợp hai cách xử lý nối tiếp và song song giữa vi xử lý và bộ xử lý đồ hoạ Nhờ vậy, khả năng xử lý tính toán và đồ hoạ của APU thực sự ... thống vi xử lí hoàn thiện ! Nhóm sinh vi n thực CHƯƠNG I: KIẾN TRÚC BỘ VI XỬ LÍ AMD K8 1.1.Giới thiệu tổng quát K8 AMD xử lý máy tính vi kiến trúc thiết kế AMD kế thừa cho vi kiến trúc AMD K7 K8. .. nghệ vi xử lí Hiện thị trường có nhiều hãng sản xuất vi xử lí hàng đầu như: Intel, Amd, IBM, HP, HITACHI… Vi c người sử dụng hiểu tìm cho vi xử lí thích hợp với yêu cầu công vi c tài không dễ Vi c. .. 19 Enhanced Virus Protection (Tính phòng chống virus) 20 CHƯƠNG II: NGUYÊN LÝ LÀM VI C CỦA BỘ XỬ LÝ AMD K8 2.1Tìm nạp dòng lệnh – Instructions Fetch Bộ xử lý bắt đầu trình mã hoá vi c tìm nạp