Đánh giá hiệu năng các chip đa xử lý, đa luồng

Một phần của tài liệu Tối ưu hoá và đánh giá hiệu năng của tổ chức cache trong hệ thống vi xử lý thế hệ sau (Trang 103 - 104)

6. Cấu trúc của luận án

3.3.2.2.Đánh giá hiệu năng các chip đa xử lý, đa luồng

Trong kiến trúc CMP đa luồng, đa cấp cachevớicấp cache cuối cùng là cache chia sẻ thông minh, nhưng cũng là nút tập trung lưu lượng của hệ thống nên gây ra nghẽn nút cổ chai. Do đó, ở các kết quả trên cho thấy rằng: đối với CMP đa luồng

có 3 cấp cache, tại nút Interconnect+L3 cache và MemoryBus+Mem có thời gian chờ đợi, thời gian đáp ứng, và mức độ sử dụng giảm đi nhiều so với tại nút

Interconnect+L2 cache của CMP đa luồng chỉ có 2 cấp cache với L2 cache chia sẻ.

Đồng thời thông lượng của CMP đa luồng có 3 cấp cache cũng lớn hơn so với thông

lượng của CMP đa luồng có 2 cấp cache.

Mặt khác, để đánh giá hiệu năng của CMP đa luồng có 3 cấp cache so với

CMP đa luồng có 2 cấp cache. Theo các số liệu đã cho ở mục 3.3.1,xác định được

thời gian trung bình truy nhập bộ nhớ (AMAT) của từng kiến trúc:

Đối với chip đa lõi có 3 cấp cache (L1, L2, L3)

Thời gian trung bình truy nhập bộ nhớ được tính theo công thức (2.9a)

L1L2L3

AMAT = L1 hit time + L1 miss rate(L2 hit time

+ L2 miss rate(L3 hit time + L3 miss rate(L3 miss penalty)) = 1ns + (0, 3)(2, 5 + (0, 2)(5ns + (0, 2)(40ns)))

= 2, 53ns

Đối với chip đa lõi có 2 cấp cache (L1, L2)

Thời gian trung bình truy nhập bộ nhớ được tính theo công thức (2.5a)

L1L2

AMAT = L1 hit time + L1 miss rate(L2 hit time + L2 miss rate(L2 miss penalty))

= 1ns + (0,3)(2,5ns + (0,2)(40ns))

= 4,5ns

Như vậy, với CMP đa luồng có 3 cấp cache thì thời gian trung bình truy nhập bộ nhớ giảm đi: 4,15 – 2,53 = 1,62ns so với CMP đa luồng có 2 cấp cache.

Ngoài ra, tác giả cũng sử dụng mô hình mạng Petri ngẫu nhiên suy rộng

(GSPN) để thực hiện đánh giá hiệu năng của tổ chức cache đa cấp trong CMP đa luồng có 4-lõi. Kết qủa cho thấy rằng với CMP đa luồng chỉ có 2 cấp cache với L2

Memory lớn hơn nhiều so với tại các ví trí L3 cache và Memory của CMP đa luồng có 3 cấp cache với L3 cache chia sẻ cho các lõi. Đồng thời thông lượng tại các chuyển tiếp của L2 cache và Memory của bộ xử lý 2 cấp cache cũng lớn hơn so với thông lượng tại các chuyển tiếp L3 cache và Memory của bộ xử lý 3 cấp cache.

Điều này chứng tỏ rằng với CMP đa luồng có 3 cấp cache làm giảm đáng kể độ trễ và thời gian truy cập bộ nhớ, do đó giảm nghẽn nút cổ chai tại các cấp cache chia sẻ và tăng hiệu năng của bộ xử lý. Kết quả này đã được công bố trong công trình: “Using Generalized stochastic Petri net for performance evaluation of cache organization in multicore processor chips”. Journal of Science and Technology, Technical Universities in Vietnamese, No 98, (2014), pp.15-22.

Như vậy, kiến trúc CMP đa luồng có 3 cấp cache với L3 cache chia sẻcho tất cả các lõi, các lõi xử lý đa luồng cho kết quả khả quan, giảm được thời gian trung bình truy nhập bộ nhớ, giảm nghẽn nút cổ chai tại cấp cache chia sẻ. Do đó, nâng cao hiệu năng của bộ xử lý.

Một phần của tài liệu Tối ưu hoá và đánh giá hiệu năng của tổ chức cache trong hệ thống vi xử lý thế hệ sau (Trang 103 - 104)