IV.Các đặc điểm công nghệ mớ

Một phần của tài liệu tìm hiểu kiến trúc vi xử lý intel core 2 duo (Trang 29 - 37)

III. Các dòng của Vi xử lý Core 2 Dou

IV.Các đặc điểm công nghệ mớ

Một số tính năng mới:

Công nghệ xử lý lệnh kiểu mới - Intel Wide Dynamic Excution:

Bằng cách thêm vào một khối giải mã lệnh (decoder) và khối thực thi lệnh (excution) vào mỗi core, công nghệ Wide Dynamic Excution cho phép Core Microarchitecture hoàn tất 4 lệnh cùng lúc trong 1 chu kỳ đồng hồ (nhanh hơn bất kỳ dòng CPU hiện tại nào của Intel và AMD vốn chỉ có khả năng xử lý tối đa 3 lệnh trong 1 chu kỳ đồng hồ).

Tính năng macrofusion giúp tăng tốc độ hoạt động bằng cách kết hợp 2 lệnh vào làm 1 trong quá trình giải mã, nhờ đó chip có thể xử lý giải mã 2 lệnh cùng lúc

Hình trên cho thấy 2 lệnh jne targ và cmp eax, [mem2] được ghép lại thành một microinstruction là cmpjne eax, [mem2], targ.

Các software hiện tại như image, video, audio editing, data encryption, ... dùng rất nhiều các khối lệnh SSE hỗ trợ các phép toán 128 bit. Các CPU đời trước của Intel với bộ nhớ 64bit cho mỗi chu trình nên để thực hiện một khối lệnh SSE phải cần đến 2 chu trình (một khối lệnh SSE 128 bit). Kiến trúc mới Core Microarchitecture có khả năng xử lý SSE 128 bit chỉ trong một chu trình. Việc này sẽ giúp tăng tốc các ứng dụng dùng nhiều khối lệnh SSE.

Không như các CPU dual core dòng Pentium D 800, 900 có cache L2 riêng cho từng core, CPU dựa trên Core Microarchitecture sẽ có Cache L2 chia sẽ cho cả 2 core, cho phép điều chỉnh tự động dung lượng cache L2 cho từng core tùy vào tần suất truy xuất Cache L2 của từng core. Đặc biệt, nếu cả 2 core cùng làm việc một cách đồng bộ trên cùng một dữ liệu thì dữ liệu này sẽ được lưu một lần tại một nơi trên Cache L2. Thiết kế này đem lại hiệu quả cao hơn so với thiết kế dành riêng cho mỗi core một cache L2 riêng.

Một điểm mạnh khác khi chia sẽ bộ nhớ Cache L2 là giảm tải cho bộ nhớ và bus hệ thống. Giả sử tại một thời điểm nào đó, cả 2 core đều làm việc trên cùng một data. Với thiết kế dual core có cache L2 riêng cho từng core thì sau 1 quá trình truy xuất sẽ có 2 bản sao của data này trên cache L2 của từng core. Trước khi mỗi core truy xuất bản sao củadata trên Cache L2 của mình, nó phải đảm bảo đó là bản sao mới nhất của data tại thời điểm đó (vì có thể data đã được cập nhật bởi core còn lại), do đó sẽ có một quá trình update bản sao này diễn ra và quá trình này phải thông qua bộ nhớ và bus hệ thống. Với thiết kế Cache L2 chia sẻ thì không cần phải update vì data được lưu một lần tại một nơi trên Cache L2 chia sẻ giữa 2 core. Khi một core truy xuất data trên Cache L2 chia sẻ thì data đó là mới nhất tại thời điểm đó.

Công nghệ Smart Memory Access cải tiến việc nạp trước dữ liệu. Kiến trúc Core

Microarchitecture có 6 đơn vị nạp trước dữ liệu, 2 đơn vị cho việc nạp trước dữ liệu từ bộ nhớ vào Cache L2 chia sẻ, 2 đơn vị cho việc nạp trước dữ liệu vào Cache L1 của mỗi core. Các đơn vị này hoạt động độc lập và theo dõi các hoạt động truy xuất bộ nhớ của các khối lệnh, cố gắng nạp trước dữ liệu vào cache thậm chí trước khi có yêu cầu truy xuất tương ứng và dữ liệu được truy xuất trực tiếp từ cache (L1, L2) dĩ nhiên sẽ nhanh hơn so với từ bộ nhớ.

Smart Memory Access cũng bao gồm công nghệ kết hợp bộ nhớ - memory disambiguation, giúp nâng cao hiệu quả của việc truy xuất bộ nhớ. Trong đa số trường hợp, các lệnh truy xuất bộ nhớ được thực thi theo thứ tự như khi các lệnh được đưa vào hàng đợi. Tuy nhiên trong số các lệnh truy xuất bộ nhớ đó có những lệnh hoàn toàn độc lập với nhau và công nghệ memory

disambiguation sẽ phát hiện các lệnh như vậy và sắp xếp lại thứ tự thực thi của các lệnh này sao cho tối ưu, qua đó nâng cao hiệu quả truy xuất bộ nhớ.

Mục tiêu ra đời cấu trúc Core của Intel chủ yếu để cạnh tranh với K8 của AMD (được xem là bộ xử lý với giải pháp tiến bộ nhất vào thời điểm đó). Chúng ta hãy cùng xem xét kỹ trên phương diện lý thuyết giữa bộ xử lý vi cấu trúc Core mới của Intel và nền của AMD K8:

Dựa vào bảng so sánh trên ta có thể thấy rằng các bộ xử lý với vi cấu trúc Core có cấu trúc “rộng hơn” cho phép xử lý nhiều lệnh trong 1 chu trình hơn là các CPU với vi cấu trúc K8. Mặc dù các đơn vị thi hành lệnh của hai cấu trúc xử lý này có thể giải quyết được cả 3 lệnh x86 và x87 trong một chu trình đồng hồ, nhưng vi cấu trúc Core đã chứng tỏ được thế mạnh của mình với việc bổ sung số lượng thực thi các lệnh SSE. Trong khi các bộ xử lý của K8 chỉ có thể thực hiện các lệnh 128bit trong một chu trình đồng hồ, Core có thể thi hành được gấp 3 lần số lệnh như vậy.

Ngoài ra, vi cấu trúc Core còn chứng tỏ thêm một điểm mạnh khác: đó là hệ thống giải mã cao cấp hơn. Cùng với 4bộ giải mã, công nghệ marcofusion đã cho phép giải mã lên đến 5 lệnh trong một chu trình đồng hồ (trong trường hợp lý tưởng). Bộ xử lý K8 chỉ có thể giải mã 3 lệnh đồng thời. Tất cả điều này cho thấy rằng bộ giải mã của CPU trên nền vi cấu trúc Core sẽ có khả năng load các đơn vị thi hành lệnh của bộ xử lý tốt hơn bằng cách thực hiện 4 lệnh trên một chu trình trong những điều kiện tốt nhất. Trong trường hợp này tốc độ thực thi lệnh tổng thể sẽ nhanh hơn bộ xử lý K8 AMD đến 33%.

Điểm mạnh của bộ vi cấu trúc này thể hiện rõ nhất trong hệ thống bộ nhớ đệm dữ liệu. Mặc dù bộ nhớ đệm L1 của bộ xử lý Core là nhỏ hơn, nhưng nó lại có tính liên kết cao hơn. Còn về bộ

nhớ đệm L2, nó không những lớn hơn mà còn có bandwidth (băng thông) rộng hơn. Hơn nữa, cấu trúc chia sẻ của bộ nhớ đệm L2 rất có lợi cho việc xử lý đa luồng (multi-threaded)

Một yếu tố quan trọng nữa của thuật toán nạp trước dữ liệu (data prefetch) của các bộ xử lý trên nền Core mới này là công nghệ tách nhánh bộ nhớ độc nhất mà các đối thủ cạnh tranh chưa có vào thời điểm đó.

Bên cạnh những công nghệ trên, các công nghệ khác như nâng cao khả năng bảo mật, công nghệ ảo hóa và khả năng tính toán 64-bit giúp cho Intel® CoreTM 2 Duo trở thành bộ xử lý mới ấn tượng nhất cho một thế giới ngày càng đòi hỏi chất lượng cao cũng như khả năng tính toán, di động.

Trên cùng MainBoard dùng chipset Intel 975X Express (chipset P965 Express cũng hỗ trợ Core 2 Duo), nhóm thử nghiệm chạy lần lượt CPU Core 2 Extreme X6800 2,93GHz và Core 2 Duo E6700 2,67GHz; sau đó, so sánh với hệ thống có cấu hình tương tự chạy nền AM2 dùng RAM DDR2 với BXL "đỉnh" FX-62 của AMD.

Cả hai cấu hình của Intel đều qua mặt AMD trong mỗi ứng dụng của WorldBench 5 cũng như trên mỗi game . Cải tiến rõ nhất là thử nghiệm với nhiều tác dụng, chạy cùng lúc 2 ứng dụng: duyệt web với Mozilla và mã hóa tập tin với Windows Media Encoder. Bên cạnh đó, các thử nghiệm với Photoshop và một số ứng dụng đồ họa cũng chạy khá thuyết phục.

Hệ thống tự lắp chạy Core 2 Extreme X6800 ghi được 160 điểm PC WorldBench 5, tăng 17% so với hệ thống AMD chạy Athlon 64 FX-62 2,8GHz ghi được 137 điểm. Và hệ thống chạy VXL E6700 rẻ tiền hơn cũng đạt đến 153 điểm, vẫn cao hơn 12% so với điểm số của FX-62, và cao hơn 8% so với hệ thống Xi Mtower 64 AGL-SLI nền Intel là hệ thống nhanh nhất mà PC World Mỹ từng thử nghiệm trước đây.

Bên cạnh những hệ thống tự lắp, ta cũng so sánh với bộ Dell XPS 410 giá 2350 USD (tính cả màn hình LCD 20), dùng CPU E6600 2,4GHz có RAM 2GB, card đồ họa NVIDIA GeForce 7900GS và 2 ổ cứng SATA ở RAID 0 có tổng dung lượng 320GB. Hệ thống này ghi được 138 điểm WorldBench, bằng điểm của hệ thống AMD phía trên.

Nhưng ngay cả những điểm số cao "ngút trời" như trên vẫn chưa bì kịp với hệ thống ABS. ABS Ultimate X9 chạy tản nhiệt nước, có 2GB RAM, 2 card Radeon X1900 CrossFire, một cặp ổ cứng Western Digital cấu hình RAID SATA 150GB và BXL Core 2 Extreme X6800 ép xung từ 2,93GHz lên 3,5GHz, và đạt 181 điểm WorldBench. Hệ thống này không phù hợp với người dùng phổ thông nhưng điểm số của nó vượt khá xa so với các hệ thống khác và cũng cho thấy vi kiến trúc Core của Intel còn nhiều hứa hẹn.

điện năng. Sử dụng các bài học từ việc xây dựng thành công CPU di động Pentium M, đầu tiên, Intel đã cải tiến dòng di động và đưa ra CPU Core Duo. Sau đó, hãng đã tăng lực khá nhiều nhưng giảm được điện năng tiêu thụ cho CPU máy tính để bàn. Ví dụ, khi PC chỉ chạy vài ứng dụng đơn giản hoặc ở trạng thái nghỉ, Core 2 Duo có thể chạy chậm lại hoặc ngưng luôn những phần không cần thiết.

Core 2 Duo có nhiều ưu thế về tốc độ so với Pentium là nhờ kiến trúc mới được chêm thêm một hàng thực thi mới trên mỗi nhân CPU.

Bộ đệm cache L2 đến 4MB bảo đảm cung cấp dữ liệu để BXL luôn làm việc ở mức tối đa và Intel cũng đã nỗ lực tinh chỉnh các thuật toán nạp trước (prefetching), ưu tiên tối đa cho dữ liệu thích hợp trước khi BXL cần đến.

Trong khi hầu hết các BXL 2 nhân cố định dung lượng bộ đệm cho mỗi nhân thì Core 2 Duo cho phép chia sẻ cho toàn bộ 4MB bộ nhớ cache. Và BXL có thể phân phối bộ nhớ cache này giữa các nhân theo nhu cầu. Nếu một nhân phải làm việc "nặng" trong một tác vụ phức tạp thì nó có thể dùng hầu hết 4MB của cache L2 trong khi nhân kia chỉ chạy một tác vụ đơn giản hơn, cần ít bộ đệm hơn.

Kết Luận

Như vậy, Lần đầu tiên trong suốt những năm vừa qua, BXL Core 2 Duo rõ ràng mang lại cho Intel lợi thế về tốc độ và hiệu năng so với AMD.

Việc Intel giới thiệu thế hệ Core 2 mới đã hâm nóng và tạo nên cuộc “lật đổ” ngọan mục trước đối thủ AMD. Nếu như trước đây Intel tích hợp hai nhân vi xử lý đơn nhân trước đây vào một chip với sự độc lập khá rõ về bộ đệm xử lý, tách biệt quá trình thực thi vi lệnh chưa tối ưu hóa được tòan bộ hệ thống. Do đó trên Core 2 Duo, thế hệ thứ 2 của kiến trúc Core với 2 lõi tích hợp có tên gọi Conroe, Intel sử dụng chung Cache L2 cho cả 2 lõi cùng một số công nghệ khác nữa. Core 2 Duo mang lại cho bạn hiệu năng( tăng 40%) và tiết kiệm năng lượng(giảm 40%). Với thế hệ CPU mới này, Intel đã khẳng định vị trí tuyệt đối của mình trên đường đua tốc độ, hiệu năng xử lý của mình trước các đối thủ khác. Các cải tiến, công nghệ mới trên dòng thế hệ X2 ngòai thay đổi về phần cứng cấu trúc : công nghệ chế tạo, mật độ Transistor, kích thước Chip mà còn bao gồm bao gồm các tính năng mở rộng chủ yếu sau: (adsbygoogle = window.adsbygoogle || []).push({});

Một phần của tài liệu tìm hiểu kiến trúc vi xử lý intel core 2 duo (Trang 29 - 37)