1. Trang chủ
  2. » Luận Văn - Báo Cáo

Tối ưu hoá và đánh giá hiệu năng của tổ chức cache trong hệ thống vi xử lý thế hệ sau

153 732 1

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 153
Dung lượng 31,47 MB

Nội dung

BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI HỒ VĂN PHI TỐI ƯU HÓA VÀ ĐÁNH GIÁ HIỆU NĂNG CỦA TỔ CHỨC CACHE TRONG HỆ THỐNG VI XỬ LÝ THẾ HỆ SAU LUẬN ÁN TIẾN SĨ KỸ THUẬT VIỄN THÔNG Hà Nội - 2014 BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI HỒ VĂN PHI TỐI ƯU HÓA VÀ ĐÁNH GIÁ HIỆU NĂNG CỦA TỔ CHỨC CACHE TRONG HỆ THỐNG VI XỬ LÝ THẾ HỆ SAU Chuyên ngành: Kỹ thuật Viễn thông Mã số: 62520208 LUẬN ÁN TIẾN SĨ KỸ THUẬT VIỄN THÔNG NGƯỜI HƯỚNG DẪN KHOA HỌC: 1. TS. HỒ KHÁNH LÂM 2. TS. NGUYỄN VIẾT NGUYÊN Hà Nội - 2014 LỜI CAM ĐOAN Tôi xin cam đoan đây là công trình của riêng tôi. Tất cả các ấn phẩm được công bố chung với các cán bộ hướng dẫn khoa học và các đồng nghiệp đã được sự đồng ý của các tác giả trước khi đưa vào Luận án. Các kết quả trong Luận án là trung thực, chưa từng được công bố trong bất kỳ công trình nào. Tác giả Luận án Hồ Văn Phi LỜI CẢM ƠN Đầu tiên, tôi xin bày tỏ lời cảm ơn chân thành và sự kính trọng đến các Thầy giáo TS. Hồ Khánh Lâm và TS. Nguyễn Viết Nguyên, các Thầy đã nhận tôi làm nghiên cứu sinh và hướng dẫn tôi rất nhiệt tình trong suốt thời gian học tập, nghiên cứu và thực hiện bản Luận án này. Các Thầy đã tận tình chỉ bảo và giúp đỡ tôi cả về lĩnh vực khoa học cũng như trong cuộc sống. Tôi vô cùng biết ơn sự kiên trì của các Thầy, các Thầy đã dành nhiều thời gian để đọc cẩn thận và góp nhiều ý kiến quý báu cho bản thảo của Luận án. Những kiến thức mà tôi nhận được từ các Thầy không chỉ là bản Luận án mà trên hết là cách nhìn nhận, đánh giá cũng như phương thức giải quyết vấn đề một cách toàn diện và khoa học. Tôi xin trân trọng cảm ơn Lãnh đạo Trường Đại Học Bách khoa Hà Nội, Viện Sau Đại học, Viện Điện tử - Viễn thông và Bộ môn Điện tử & Kỹ thuật máy tính đã tạo điều kiện thuận lợi cho tôi được học tập và làm nghiên cứu sinh, luôn quan tâm động viên tôi trong suốt quá trình học tập và nghiên cứu. Tôi xin chân thành cảm ơn sự giúp đỡ tận tình của các GS, PGS, TS, các Thầy, Cô giáo trong Bộ môn Điện Tử & Kỹ thuật máy tính, Viện Điện tử - Viễn thông, các Nhà khoa học trong và ngoài Trường Đại học Bách khoa Hà Nội. Tôi xin trân trọng cảm ơn Lãnh đạo Trường Đại học Quy Nhơn và Khoa Kỹ thuật & Công nghệ - Trường Đại học Quy Nhơn, cũng như bạn bè đồng nghiệp đã ủng hộ và tạo mọi điều kiện thuận lợi giúp đỡ tôi trong suốt thời gian học tập, nghiên cứu và hoàn thành Luận án. Cuối cùng, tôi muốn dành lời cảm ơn đến những người thân yêu nhất của tôi. Bản Luận án này là món quà quý giá tôi xin được kính tặng cho cha mẹ, vợ và các con thân yêu của tôi. Hà Nội, tháng 06 năm 2014 Tác giả Luận án Hồ Văn Phi MỤC LỤC DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT DANH MỤC CÁC BẢNG DANH MỤC CÁC HÌNH, ẢNH VÀ ĐỒ THỊ MỞ ĐẦU 1 1. Tính cấp thiết của luận án 1 2. Mục đích nghiên cứu của luận án 4 3. Đối tượng và phạm vi nghiên cứu của luận án 4 4. Phương pháp nghiên cứu của luận án 4 5. Ý nghĩa khoa học và thực tiễn của luận án 5 6. Cấu trúc của luận án 5 Chương 1. TỔNG QUAN VỀ KIẾN TRÚC CHIP ĐA XỬ LÝ, ĐA LUỒNG 6 1.1. Giới thiệu 6 1.2. Kiến trúc của chip đa xử lý, đa luồng 6 1.2.1. Kiến trúc chung của chip đa xử lý, đa luồng 6 1.2.2. Kiến trúc chip đa xử lý, đa luồng đồng thời 11 1.2.3. Mạng liên kết trên chip 12 1.2.4. Phân cấp hệ thống nhớ 16 1.3. Kết luận chương 1 18 Chương 2. NGHIÊN CỨU TỔ CHỨC CACHE, CHÍNH SÁCH THAY THẾ CACHE TRONG KIẾN TRÚC CHIP ĐA XỬ LÝ, ĐA LUỒNG 19 2.1. Tổ chức cache trong kiến trúc chip đa xử lý, đa luồng 19 2.1.1. Cache và các nguyên tắc làm việc của cache 19 2.1.1.1. Vị trí tạm thời 20 2.1.1.2. Vị trí không gian 20 2.1.1.3. Vị trí tuần tự 20 2.1.2. Các thành phần của cache 20 2.1.3. Các tổ chức cache 21 2.1.3.1. Cache liên kết đầy đủ 22 2.1.3.2. Cache sắp xếp trực tiếp 24 2.1.3.3. Cache liên kết tập hợp 26 2.2. Các đặc tính hiệu năng của cache 28 2.2.1. Các tỷ số trúng cache và trượt cache 29 2.2.1.1. Trúng cache 29 2.2.1.2. Trượt cache 29 2.2.1.3. Tỷ số trúng cache, trượt cache và trượt penalty 29 2.2.1.4. Bus bộ nhớ, kích thước từ nhớ, kích thước khối và trượt penalty 31 2.2.1.5. Trượt cache cục bộ và toàn cục 31 2.2.1.7. Ảnh hưởng của tổ chức cache đến trượt penalty 33 2.2.1.8. Kích thước khối cache và tỷ số trượt 34 2.2.1.9. Các loại trượt cache 35 2.2.1.10. Tổ chức cache ảnh hưởng đến tốc độ của CPU 36 2.2.2. Các giải pháp tăng hiệu năng của cache 38 2.3. Các chính sách thay thế dòng cache 38 2.3.1. Chính sách thay thế cache LRU 39 2.3.2. Chính sách thay thế cache LFU 39 2.3.3. Chính sách thay thế cache FIFO 39 2.3.4. Chính sách thay thế cache Random 39 2.3.5. Chính sách thay thế cache NRU 40 2.3.6. Chính sách thay thế cache SRRIP 40 2.3.7. Chính sách thay thế cache DRRIP 42 2.4. Ghi và đọc cache 42 2.4.1. Ghi cache 42 2.4.1.1. Ghi thông qua 43 2.4.1.2. Ghi trở lại 44 2.4.2. Đọc cache 46 2.4.2.1. Đọc bên cạnh 46 2.5.2.2. Đọc thông suốt 47 2.5. Cache chia sẻ thông minh 48 2.5.1. Tổ chức phân cấp cache trong các chip đa xử lý 48 2.5.2. Cache chia sẻ thông minh 49 2.6. Tính nhất quán cache trong các chip đa xử lý, đa luồng 50 2.6.1. Thế nào là nhất quán cache 50 2.6.2. Các giao thức nhất quán cache 52 2.7. Kết luận chương 2 52 Chương 3. PHÂN TÍCH ĐÁNH GIÁ HIỆU NĂNG CỦA TỔ CHỨC CACHE TRONG KIẾN TRÚC CHIP ĐA XỬ LÝ, ĐA LUỒNG 53 3.1. Cơ sở lý thuyết để phân tích đánh giá hiệu năng của tổ chức cache 53 3.1.1. Kiến trúc chip đa xử lý, đa luồng là mạng xếp hàng đóng đa lớp có dạng tích các xác suất (MCPFQN) 53 3.1.1.1. Khái quát mạng xếp hàng đóng 53 3.1.1.2. Khái quát mạng xếp hàng đóng có dạng tích các xác suất 56 3.1.1.3. Kiến trúc chip đa xử lý, đa luồng là mạng xếp hàng đóng đa lớp có dạng tích các xác suất (MCPFQN) 58 3.1.2. Thuật toán phân tích giá trị trung bình (MVA) đánh giá hiệu năng cho các mạng xếp hàng đóng có dạng tích các xác suất 59 3.1.2.1. Mạng xếp hàng đóng đơn lớp có dạng tích các xác suất 59 3.1.2.2. Mạng xếp hàng đóng đa lớp có dạng tích các xác suất 61 3.2. Mô hình tổ chức cache trong kiến trúc chip đa xử lý, đa luồng 62 3.2.1. Khái quát 62 3.2.2. Mô hình tổ chức cache trong kiến trúc chip đa xử lý, đa luồng 63 3.3. Phân tích đánh giá hiệu năng của tổ chức cache trong kiến trúc chip đa xử lý, đa luồng 64 3.3.1. Mô hình thực hiện phân tích hiệu năng của kiến trúc chip đa xử lý, đa luồng 64 3.3.1.1. Mô hình tổng quát 64 3.3.1.2. Mô hình rút gọn 66 3.3.2. Kết quả mô phỏng và đánh giá hiệu năng cho kiến trúc CMP đa luồng 72 3.3.2.1. Kết quả mô phỏng cho các kiến trúc CMP đa luồng 72 3.3.2.2. Đánh giá hiệu năng các chip đa xử lý, đa luồng 83 3.4. Kết luận chương 3 84 Chương 4. GIẢI PHÁP TỐI ƯU HÓA HIỆU NĂNG CỦA TỔ CHỨC CACHE TRONG KIẾN TRÚC CHIP ĐA XỬ LÝ, ĐA LUỒNG 85 4.1. Kiến trúc cụm lõi cho chip đa xử lý, đa luồng 85 4.1.1. Khái quát 85 4.1.2. Mô hình MCPFQN cho kiến trúc cụm lõi 86 4.1.2.1. Mô hình MCPFQN tổng quát của kiến trúc cụm lõi 86 4.1.2.2. Mô hình MCPFQN rút gọn của kiến trúc cụm lõi 88 4.1.3. Kết quả mô phỏng và đánh giá hiệu năng cho kiến trúc cụm lõi 90 4.1.3.1. Kết quả mô phỏng cho kiến trúc cụm lõi 90 4.1.3.2. Đánh giá hiệu năng cho kiến trúc cụm lõi 93 4.2. Lựa chọn cấu hình mạng liên kết trên chip 94 4.2.1. Khái quát 94 4.2.2. Đề xuất công thức tính trễ truyền thông trung bình cho mạng liên kết trên chip 94 4.2.3. Lựa chọn cấu hình mạng liên kết trên chip 99 4.2.3.1. Kết quả mô phỏng 99 4.2.3.2. Đánh giá kết quả 104 4.3. Kết luận chương 4 104 KẾT LUẬN 106 TÀI LIỆU THAM KHẢO 107 DANH MỤC CÁC CÔNG TRÌNH ĐÃ CÔNG BỐ CỦA LUẬN ÁN 115 PHỤ LỤC 116 Phụ lục 1. Kịch bản mô phỏng đánh giá hiệu năng của tổ chức cache trong kiến trúc CMP đa luồng có 2 cấp cache và 3 cấp cache 116 Phụ lục 2. Kịch bản mô phỏng đánh giá hiệu năng của tổ chức cache trong kiến trúc cụm lõi 3 cấp cache 130 DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT Ký hiệu Tên tiếng Anh Tên tiếng Việt A ACM Association for Computing Machinery Hiệp hội kỹ thuật tính toán Hoa Kỳ ALU Arithmetic Logic Unit Đơn vị số học và logic AMAT Average Memory Access Time Thời gian trung bình truy nhập bộ nhớ AMC Asymmetric Multi-core Chip Chip đa lõi bất đối xứng ANSI American National Standards Institute Viện tiêu chuẩn quốc gia Hoa Kỳ ASCII American Standards Code for Information Interchange Chuẩn mã trao đổi thông tin Hoa Kỳ ASIC Application-Specific Integrate Circuit Mạch tích hợp ứng dụng chuyên biệt B BCE Base Core Equivalents Tương đương lõi cơ sở BIP Bimodal Insertion Policy Chính sách chèn hai phương thức BRRIP Bimodal Re-Reference Interval Prediction (Bimodal RRIP) Hai phương thức dự báo khoảng tham chiếu lại C CAD Computer Aided Design Thiết kế bằng máy tính ccNUMA cache-coherent Non-Uniform Memory Access Truy cập bộ nhớ không đồng nhất tương quan cache CD Compact Disk Đĩa compact CISC Complex Instruction Set Computer Máy tính có tập lệnh phức [...]... cứu của bản Luận án này Đề tài luận án: Tối ưu hoá và đánh giá hiệu năng của tổ chức cache trong hệ thống vi xử lý thế hệ sau 4 2 Mục đích nghiên cứu của luận án - Nghiên cứu phân tích ảnh hưởng của tổ chức cache đa cấp và các chính sách thay thế cache đến hiệu năng của chip đa xử lý, đa luồng - Xây dựng các mô hình kiến trúc chip đa xử lý, đa luồng, đa cấp cache Tiến hành phân tích và đánh giá hiệu. .. dung của luận án được trình bày gồm 4 chương như sau: Chương 1: Tổng quan về kiến trúc chip đa xử lý, đa luồng Chương 2: Nghiên cứu tổ chức cache, chính sách thay thế cache trong kiến trúc chip đa xử lý, đa luồng Chương 3: Phân tích đánh giá hiệu năng của tổ chức cache trong kiến trúc chip đa xử lý, đa luồng Chương 4: Giải pháp tối ưu hóa hiệu năng của tổ chức cache trong kiến trúc chip đa xử lý, đa... v.0.8.0 để đánh giá hiệu năng của kiến trúc chip đa xử lý, đa luồng 5 Ý nghĩa khoa học và thực tiễn của luận án Nghiên cứu và đề xuất các kiến trúc chip đa xử lý, đa luồng nhằm nâng cao hiệu năng xử lý của hệ thống luôn được các nhà nghiên cứu và chế tạo chip trong và ngoài nước quan tâm và hướng tới Đây là vấn đề có tính khoa học và thực tiễn cao Luận án là nghiên cứu mở đầu về kiến trúc chip đa xử lý, đa... trên chip; chọn bao nhiêu cấp cache; cấu trúc tổ chức cache như thế nào; dung lượng cache và kích thước dòng cache là bao nhiêu; đồng thời mạng liên kết trên chip có cấu hình như thế nào để đạt được hiệu năng tối ưu của bộ xử lý? Tại Vi t Nam vấn đề nghiên cứu và sản xuất chip đa xử lý cũng được bắt đầu quan tâm và được ưu tiên hàng đầu trong lĩnh vực khoa học và công nghệ nhưng chỉ là bước đầu sơ khai... rằng, vi c nghiên cứu và chế tạo chip đa xử lý, đa luồng đã và đang là một vấn đề thu hút sự quan tâm đặc biệt lớn trên thế giới và Vi t Nam Đây là một vấn đề thời sự và cấp thiết nhằm giải quyết bài toán hiệu năng của chip đa xử lý, đa luồng Định hướng nghiên cứu tối ưu hóa tổ chức cache nhằm nâng cao hiệu năng của chip đa xử lý, đa luồng là một định hướng đúng đắn có ý nghĩa khoa học và thực tiễn Đây... cứu tổ chức cache đa cấp trong kiến trúc chip đa xử lý, đa luồng  Phạm vi nghiên cứu: - Luận án tập trung nghiên cứu các tổ chức cache 2 cấp (với L1 cache riêng cho mỗi lõi và L2 cache chia sẻ cho tất cả các lõi), và tổ chức cache 3 cấp (với L1, L2 cache riêng cho mỗi lõi và L3 cache chia sẻ cho tất cả các lõi) cho các kiến trúc chip đa xử lý, đa luồng có 2-lõi, 4-lõi, và 8-lõi trên chip - Dựa vào... hành phân tích và đánh giá hiệu năng của các kiến trúc để lựa chọn tổ chức cache tối ưu nhằm nâng cao hiệu năng của chip đa xử lý, đa luồng - Nghiên cứu ảnh hưởng của các mạng liên kết giữa các lõi trên chip đến hiệu năng của chip đa xử lý, đa luồng để từ đó lựa chọn mạng liên kết trên chip phù hợp với kiến trúc chip đa xử lý, đa luồng 3 Đối tượng và phạm vi nghiên cứu của luận án  Đối tượng nghiên... (MCPFQN) để phân tích, đánh giá hiệu năng của chip đa xử lý, đa luồng với đa cấp cache theo các thông số hiệu năng (thời gian chờ đợi, thời gian đáp ứng, mức độ sử dụng, thông lượng tại các nút, thông lượng hệ thống ) Các thông số hiệu năng này được xác định bằng phân tích giá trị trung bình (MVA) Đồng thời, tiến hành đánh giá ảnh hưởng của các cấu hình mạng liên kết trên chip đến hiệu năng của kiến trúc chip... cho 8-lõi, mỗi lõi xử lý 8-luồng 91 Hình 4.6: Biểu diễn giá trị trung bình của Thời gian đáp ứng ở các nút khi hệ thống có 2-cụm, L3 cache riêng cho mỗi cụm và L3 cache chung cho 8-lõi, mỗi lõi xử lý 8-luồng 92 Hình 4.7: Biểu diễn giá trị trung bình của Mức độ sử dụng ở các nút khi hệ thống có 2-cụm, L3 cache riêng cho mỗi cụm và L3 cache chung cho 8-lõi, mỗi lõi xử lý 8-luồng ... đa xử lý, đa luồng 6 Chương 1 TỔNG QUAN VỀ KIẾN TRÚC CHIP ĐA XỬ LÝ, ĐA LUỒNG 1.1 Giới thiệu Các chip đa xử lý (CMP) hay đa lõi xử lý hoặc các kiến trúc đa lõi là một lớp mới của các kiến trúc xử lý hiệu năng cao Ở đây, nhiều lõi xử lý được đặt trong một chip vật lý Kể từ năm 2001, sau khi IBM giới thiệu chip 2-lõi đầu tiên là Power4 cho các dòng máy chủ eServer, pSeries và iSeries [75], CMP bắt đầu . BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI HỒ VĂN PHI TỐI ƯU HÓA VÀ ĐÁNH GIÁ HIỆU NĂNG CỦA TỔ CHỨC CACHE TRONG HỆ THỐNG VI XỬ LÝ THẾ HỆ SAU LUẬN. phỏng đánh giá hiệu năng của tổ chức cache trong kiến trúc CMP đa luồng có 2 cấp cache và 3 cấp cache 116 Phụ lục 2. Kịch bản mô phỏng đánh giá hiệu năng của tổ chức cache trong kiến trúc. TỔ CHỨC CACHE, CHÍNH SÁCH THAY THẾ CACHE TRONG KIẾN TRÚC CHIP ĐA XỬ LÝ, ĐA LUỒNG 19 2.1. Tổ chức cache trong kiến trúc chip đa xử lý, đa luồng 19 2.1.1. Cache và các nguyên tắc làm vi c của

Ngày đăng: 22/07/2014, 11:46

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
[1]. A.C. Sodan, Jacob Machina, Arash Deshmeh, Kevin Macnaughton, Bryan Esbaugh (2010). Parallelism via multithreaded and multicore CPUs. IEEE Computer Society, Vol. 43, Issue 3, pp.24-32 Sách, tạp chí
Tiêu đề: Parallelism via multithreaded and multicore CPUs
Tác giả: A.C. Sodan, Jacob Machina, Arash Deshmeh, Kevin Macnaughton, Bryan Esbaugh
Năm: 2010
[2]. A.I. Fasiku, J. B. Olawale, O. T. Jinadu (2012). A review of architectures - Intel single core, Intel dual core and AMD dual core processors and the benefits. International Journal of Engineering and Technology (IJET), Vol. 2, No. 5, pp.809-817 Sách, tạp chí
Tiêu đề: A review of architectures - Intel single core, Intel dual core and AMD dual core processors and the benefits
Tác giả: A.I. Fasiku, J. B. Olawale, O. T. Jinadu
Năm: 2012
[3]. Aamer Jaleel (2010). High performance cache replacement using re-reference interval prediction (RRIP). ISCA'10 Proceedings of the 37th annual international symposium on Computer architecture, pp.60-71 Sách, tạp chí
Tiêu đề: High performance cache replacement using re-reference interval prediction (RRIP)
Tác giả: Aamer Jaleel
Năm: 2010
[4]. Alex Settle, Dan Connors, Enric Gibert, Antonio Gonzalez (2006) A dynamically reconfigurable cache for multithreaded processors. Journal of Embedded Computing - Issues in embedded single-chip multicore architectures, Vol. 2 Issue 2, pp.221-233 Sách, tạp chí
Tiêu đề: A dynamically reconfigurable cache for multithreaded processors
[5]. Avinatan Hassidim (2009) Cache replacement policies for multicore processors. Massachusetts Institute of Technology, Cambridge, 02139, USA Sách, tạp chí
Tiêu đề: Cache replacement policies for multicore processors
[6]. B. Filipowicz and J. Kwiecień (2008) Queueing systems and networks. Models and applications. Bulletin of the Polish academy of sciences technical sciences, Vol. 56, No. 4, pp.379-390 Sách, tạp chí
Tiêu đề: Queueing systems and networks. Models and applications
[7]. Bashayer M. Al-Babtain, Fajer J. Al-Kanderi, Maha F. Al-Fahad, and Imtiaz Ahmad (2013) A survey on Amdahl's law extension in multicore architectures.International Journal of New Computer Architectures and their Applications (IJNCAA) 3(3), pp.30-46 Sách, tạp chí
Tiêu đề: A survey on Amdahl's law extension in multicore architectures
[8]. Blair Guy (2007) An analysis of multi-core microprocessor capabilities and their suitablity for current day application requirements. Master ’ s Thesis Bowie State University Maryland in Europe Sách, tạp chí
Tiêu đề: An analysis of multi-core microprocessor capabilities and their suitablity for current day application requirements
[9]. Chenjie Yu, Peter Petrov) (2010) Off-chip memory bandwidth minimization through cache partitioning for multi-core platforms. Design Automation Conference (DAC), 47 th ACM/IEEE, pp.132-137 Sách, tạp chí
Tiêu đề: Off-chip memory bandwidth minimization through cache partitioning for multi-core platforms
[11]. D. Wentzlaff, P. Griffin, H. Hoffmann, Liewei Bao, B. Edwards, C. Ramey, M. Mattina, Chyi-Chang Miao, J.F. Brown, A. Agarwal (2007) On-chip interconnection architecture of the tile processor. IEEE Micro, Vol. 27, No. 5, pp.15-31 Sách, tạp chí
Tiêu đề: On-chip interconnection architecture of the tile processor
[12]. Damien Hardy, Isabelle Puaut (2008) WCET analysis of multi-level non- inclusive set-associative instruction caches. RTSS'08 Proceedings of the 2008 Real-Time Systems Symposium, pp.456-466 Sách, tạp chí
Tiêu đề: WCET analysis of multi-level non-inclusive set-associative instruction caches
[13]. Daniel Hackenberg Daniel Molka Wolfgang E. Nagel (2009) Comparing cache architectures and coherency protocols on x86-64 multicore SMP systems. In 42nd Annual IEEE/ACM International Symposium on Microarchitecture, New York, USA, December 12-16, pp.413-422 Sách, tạp chí
Tiêu đề: Comparing cache architectures and coherency protocols on x86-64 multicore SMP systems
[14]. Daniel Molka, Daniel Hackenberg, Robert Schone and Matthias S. Muller (2009) Memory performance and cache coherency effects on an Intel Nehalem multiprocessor system. IEEE Computer Society Washington, DC, USA, pp.261-270 Sách, tạp chí
Tiêu đề: Memory performance and cache coherency effects on an Intel Nehalem multiprocessor system
[15]. Daniel Sanchez, George Michelogiannakis, And christos Kozyrakis (2010) An analysis of on-chip interconnection networks for large-scale chip multiprocessors. ACM Transactions on Architecture and Code Optimization, Vol. 7, No. 1 Sách, tạp chí
Tiêu đề: An analysis of on-chip interconnection networks for large-scale chip multiprocessors
[16]. David Tam (2010) Operating system management of shared caches on multicore processors. A thesis of Doctor of Philosophy Graduate Department of Electrical and Computer Engineering University of Toronto Sách, tạp chí
Tiêu đề: Operating system management of shared caches on multicore processors
[17]. David Tam, Reza Azimi, Livio Soares, and Michael Stumm (2007) Managing shared L2 caches on multicore systems in software. In Proc. of the Workshop on the Interaction between Operating Systems and Computer Architecture (WIOSCA) Sách, tạp chí
Tiêu đề: Managing shared L2 caches on multicore systems in software
[18]. Dennis Abts, Natalie D. Enright Jerger, John Kim (2009) Achieving predictable performance through better memory controller placement in many-core CMPs. ISCA’09, June 20-24, Austin, TX, USA Sách, tạp chí
Tiêu đề: Achieving predictable performance through better memory controller placement in many-core CMPs
[19]. Dong Hyuk Woo and Hsien-Hsin S. Lee (2008) Extending Amdahl’s law for energy-efficient computing in the many-core era. IEEE Computer Society, pp.24-31 Sách, tạp chí
Tiêu đề: Extending Amdahl’s law for energy-efficient computing in the many-core era
[20]. Frederik Rứnn, (2003.) Cache-oblivious searching and sorting. Master's Thesis, Department of Computer Science University of Copenhagen Sách, tạp chí
Tiêu đề: Cache-oblivious searching and sorting
[21]. G. E. Moore (1965) Cramming more components onto integrated circuits. Electronics, pp.114-117 Sách, tạp chí
Tiêu đề: Cramming more components onto integrated circuits

HÌNH ẢNH LIÊN QUAN

Hình 1: Biểu diễn sự gia tăng số lượng transistor trên chip theo định luật Moore  từ năm  1970 - 2015 - Tối ưu hoá và đánh giá hiệu năng của tổ chức cache trong hệ thống vi xử lý thế hệ sau
Hình 1 Biểu diễn sự gia tăng số lượng transistor trên chip theo định luật Moore từ năm 1970 - 2015 (Trang 21)
Hỡnh 1.5: Chip đa lừi linh hoạt (DMC) gồm 16 lừi 1-BCE [40]. - Tối ưu hoá và đánh giá hiệu năng của tổ chức cache trong hệ thống vi xử lý thế hệ sau
nh 1.5: Chip đa lừi linh hoạt (DMC) gồm 16 lừi 1-BCE [40] (Trang 30)
Hình 1.8: CMP với kiến trúc MIMD [72]. - Tối ưu hoá và đánh giá hiệu năng của tổ chức cache trong hệ thống vi xử lý thế hệ sau
Hình 1.8 CMP với kiến trúc MIMD [72] (Trang 31)
Hình 1. 10: Phân lớp của hệ thống nhớ [25, 72] . - Tối ưu hoá và đánh giá hiệu năng của tổ chức cache trong hệ thống vi xử lý thế hệ sau
Hình 1. 10: Phân lớp của hệ thống nhớ [25, 72] (Trang 36)
Hình 2.2: Cache và bộ nhớ chính [72]. - Tối ưu hoá và đánh giá hiệu năng của tổ chức cache trong hệ thống vi xử lý thế hệ sau
Hình 2.2 Cache và bộ nhớ chính [72] (Trang 41)
Hình 2.4: Tìm kiếm trong cache liên kết đầy đủ [62, 72]. - Tối ưu hoá và đánh giá hiệu năng của tổ chức cache trong hệ thống vi xử lý thế hệ sau
Hình 2.4 Tìm kiếm trong cache liên kết đầy đủ [62, 72] (Trang 43)
Hình 2.5: Tìm kiếm trong cache sắp xếp trực tiếp [62, 72]. - Tối ưu hoá và đánh giá hiệu năng của tổ chức cache trong hệ thống vi xử lý thế hệ sau
Hình 2.5 Tìm kiếm trong cache sắp xếp trực tiếp [62, 72] (Trang 45)
Hình 2.6: Tìm kiếm trong cache liên kết tập hợp [62, 72]. - Tối ưu hoá và đánh giá hiệu năng của tổ chức cache trong hệ thống vi xử lý thế hệ sau
Hình 2.6 Tìm kiếm trong cache liên kết tập hợp [62, 72] (Trang 47)
Hình 2.7: So sánh tỷ số trượt cục bộ và toàn cục với 2 cấp cache [25]. - Tối ưu hoá và đánh giá hiệu năng của tổ chức cache trong hệ thống vi xử lý thế hệ sau
Hình 2.7 So sánh tỷ số trượt cục bộ và toàn cục với 2 cấp cache [25] (Trang 53)
Hình 2.9: Sự phụ thuộc của tỷ số trượt cache theo kích thước và tổ chức của cache [75] - Tối ưu hoá và đánh giá hiệu năng của tổ chức cache trong hệ thống vi xử lý thế hệ sau
Hình 2.9 Sự phụ thuộc của tỷ số trượt cache theo kích thước và tổ chức của cache [75] (Trang 55)
Hỡnh 2.16: Tổ chức cache trong cỏc bộ xử lý 8-lừi của Intel Xeon họ 5500 [13, 14, 64, 65] - Tối ưu hoá và đánh giá hiệu năng của tổ chức cache trong hệ thống vi xử lý thế hệ sau
nh 2.16: Tổ chức cache trong cỏc bộ xử lý 8-lừi của Intel Xeon họ 5500 [13, 14, 64, 65] (Trang 68)
Hỡnh 2.17:  Tiled CMP 16-lừi với kiến trỳc L2 cache chia sẻ [49, 50]. - Tối ưu hoá và đánh giá hiệu năng của tổ chức cache trong hệ thống vi xử lý thế hệ sau
nh 2.17: Tiled CMP 16-lừi với kiến trỳc L2 cache chia sẻ [49, 50] (Trang 69)
Hình 3.2: Các kiến trúc  CMP  đa luồng . - Tối ưu hoá và đánh giá hiệu năng của tổ chức cache trong hệ thống vi xử lý thế hệ sau
Hình 3.2 Các kiến trúc CMP đa luồng (Trang 84)
Hình 3.3: Mô hình MCPFQN tổng quát cho CMP đa luồng của hình 3.2. - Tối ưu hoá và đánh giá hiệu năng của tổ chức cache trong hệ thống vi xử lý thế hệ sau
Hình 3.3 Mô hình MCPFQN tổng quát cho CMP đa luồng của hình 3.2 (Trang 85)
Bảng 3.1: Giỏ trị trung bỡnh của cỏc thụng số hiệu năng khi chip cú 2-lừi với 8-luồng/lừi - Tối ưu hoá và đánh giá hiệu năng của tổ chức cache trong hệ thống vi xử lý thế hệ sau
Bảng 3.1 Giỏ trị trung bỡnh của cỏc thụng số hiệu năng khi chip cú 2-lừi với 8-luồng/lừi (Trang 93)
Hỡnh 3.7: Biểu diễn giỏ trị trung bỡnh của Thời gian chờ đợi ở cỏc nỳt khi chip cú 2-lừi,  mỗi lừi xử lý 8-luồng với L2 cache chung và L3 cache chung - Tối ưu hoá và đánh giá hiệu năng của tổ chức cache trong hệ thống vi xử lý thế hệ sau
nh 3.7: Biểu diễn giỏ trị trung bỡnh của Thời gian chờ đợi ở cỏc nỳt khi chip cú 2-lừi, mỗi lừi xử lý 8-luồng với L2 cache chung và L3 cache chung (Trang 94)
Hỡnh 3.9: Biểu diễn giỏ trị trung bỡnh của Mức độ sử dụng ở cỏc nỳt khi chip cú 2-lừi, mỗi  lừi xử lý 8-luồng với L2 cache chung và L3 cache chung - Tối ưu hoá và đánh giá hiệu năng của tổ chức cache trong hệ thống vi xử lý thế hệ sau
nh 3.9: Biểu diễn giỏ trị trung bỡnh của Mức độ sử dụng ở cỏc nỳt khi chip cú 2-lừi, mỗi lừi xử lý 8-luồng với L2 cache chung và L3 cache chung (Trang 95)
Bảng 3.2: Giỏ trị trung bỡnh của cỏc thụng số hiệu năng khi chip cú 4-lừi với 8-luồng/lừi - Tối ưu hoá và đánh giá hiệu năng của tổ chức cache trong hệ thống vi xử lý thế hệ sau
Bảng 3.2 Giỏ trị trung bỡnh của cỏc thụng số hiệu năng khi chip cú 4-lừi với 8-luồng/lừi (Trang 97)
Hỡnh 3.13: Biểu diễn giỏ trị trung bỡnh của Thời gian đỏp ứng ở cỏc nỳt khi chip cú 4-lừi,  mỗi lừi xử lý 8-luồng với L2 cache chung và L3 cache chung - Tối ưu hoá và đánh giá hiệu năng của tổ chức cache trong hệ thống vi xử lý thế hệ sau
nh 3.13: Biểu diễn giỏ trị trung bỡnh của Thời gian đỏp ứng ở cỏc nỳt khi chip cú 4-lừi, mỗi lừi xử lý 8-luồng với L2 cache chung và L3 cache chung (Trang 98)
Hỡnh 3.15: Biểu diễn giỏ trị trung bỡnh của Thụng lượng ở cỏc nỳt khi chip cú 4-lừi, mỗi  lừi xử lý 8-luồng với L2 cache chung và L3 cache chung - Tối ưu hoá và đánh giá hiệu năng của tổ chức cache trong hệ thống vi xử lý thế hệ sau
nh 3.15: Biểu diễn giỏ trị trung bỡnh của Thụng lượng ở cỏc nỳt khi chip cú 4-lừi, mỗi lừi xử lý 8-luồng với L2 cache chung và L3 cache chung (Trang 99)
Hỡnh 3.16: Mụ hỡnh MCPFQN 8 lừi, đa luồng; a) với L2 cache chung và                                                                             b) với L3 cache chung - Tối ưu hoá và đánh giá hiệu năng của tổ chức cache trong hệ thống vi xử lý thế hệ sau
nh 3.16: Mụ hỡnh MCPFQN 8 lừi, đa luồng; a) với L2 cache chung và b) với L3 cache chung (Trang 100)
Hỡnh 3.17: Biểu diễn giỏ trị trung bỡnh của Thời gian chờ đợi ở cỏc nỳt khi chip cú 8-lừi,  mỗi lừi xử lý 8-luồng với L2 cache chung và L3 cache chung - Tối ưu hoá và đánh giá hiệu năng của tổ chức cache trong hệ thống vi xử lý thế hệ sau
nh 3.17: Biểu diễn giỏ trị trung bỡnh của Thời gian chờ đợi ở cỏc nỳt khi chip cú 8-lừi, mỗi lừi xử lý 8-luồng với L2 cache chung và L3 cache chung (Trang 101)
Hỡnh 3.19: Biểu diễn giỏ trị trung bỡnh của Mức độ sử dụng ở cỏc nỳt khi chip cú 8-lừi,  mỗi lừi xử lý 8-luồng với L2 cache chung và L3 cache chung - Tối ưu hoá và đánh giá hiệu năng của tổ chức cache trong hệ thống vi xử lý thế hệ sau
nh 3.19: Biểu diễn giỏ trị trung bỡnh của Mức độ sử dụng ở cỏc nỳt khi chip cú 8-lừi, mỗi lừi xử lý 8-luồng với L2 cache chung và L3 cache chung (Trang 102)
Hỡnh 4.2: Mụ hỡnh MCPFQN tổng quỏt của kiến trỳc cụm lừi cho ở hỡnh 4.1. - Tối ưu hoá và đánh giá hiệu năng của tổ chức cache trong hệ thống vi xử lý thế hệ sau
nh 4.2: Mụ hỡnh MCPFQN tổng quỏt của kiến trỳc cụm lừi cho ở hỡnh 4.1 (Trang 107)
Hỡnh 4.4: Mụ hỡnh MCFPQN 2-cụm lừi, mỗi cụm 4-lừi, đa luồng . - Tối ưu hoá và đánh giá hiệu năng của tổ chức cache trong hệ thống vi xử lý thế hệ sau
nh 4.4: Mụ hỡnh MCFPQN 2-cụm lừi, mỗi cụm 4-lừi, đa luồng (Trang 110)
Hình 4.8: Biểu diễn giá trị trung bình của Thông lượng ở các nút khi hệ thống có 2-cụm,   L3 cache riờng cho mỗi cụm và L3 cache chung cho 8-lừi, mỗi lừi xử lý 8-luồng - Tối ưu hoá và đánh giá hiệu năng của tổ chức cache trong hệ thống vi xử lý thế hệ sau
Hình 4.8 Biểu diễn giá trị trung bình của Thông lượng ở các nút khi hệ thống có 2-cụm, L3 cache riờng cho mỗi cụm và L3 cache chung cho 8-lừi, mỗi lừi xử lý 8-luồng (Trang 113)
Hình 4.10: Trễ truyền thông trung bình của các mạng liên kết Ring, 2DMesh, 2DTorus , - Tối ưu hoá và đánh giá hiệu năng của tổ chức cache trong hệ thống vi xử lý thế hệ sau
Hình 4.10 Trễ truyền thông trung bình của các mạng liên kết Ring, 2DMesh, 2DTorus , (Trang 121)
Hình 4.11: Mức tăng tốc xử lý của các mạng liên kết Ring, 2DMesh, 2DTorus, 3DMesh,  3DTorus, cho cỏc trường hợp số lừi trờn chip n =  8, 16, 32, 64, 128 - Tối ưu hoá và đánh giá hiệu năng của tổ chức cache trong hệ thống vi xử lý thế hệ sau
Hình 4.11 Mức tăng tốc xử lý của các mạng liên kết Ring, 2DMesh, 2DTorus, 3DMesh, 3DTorus, cho cỏc trường hợp số lừi trờn chip n = 8, 16, 32, 64, 128 (Trang 124)
Hình I.1: Giao diện lựa chọn công cụ JMT. - Tối ưu hoá và đánh giá hiệu năng của tổ chức cache trong hệ thống vi xử lý thế hệ sau
nh I.1: Giao diện lựa chọn công cụ JMT (Trang 136)
Hình I.2: Giao diện mô phỏng đồ họa JSIMgraph. - Tối ưu hoá và đánh giá hiệu năng của tổ chức cache trong hệ thống vi xử lý thế hệ sau
nh I.2: Giao diện mô phỏng đồ họa JSIMgraph (Trang 137)

TỪ KHÓA LIÊN QUAN

TRÍCH ĐOẠN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w