Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 33 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
33
Dung lượng
3,51 MB
Nội dung
I DATA PATH Hình đầy đủ (có khối Mux nằm trước khối Register) Tín hiệu điều khiển khối Control R-format RegDst Branch MemRead MemToRead ALUop Add lw 0 1 Add MemWrite ALUSrc RegWrite 1 0 sw x 0 x ALUop0=0 ALUop1=0 1 beq x x ALUop0=1 ALUop1=0 0 X trống nhé! a Giả sử cho hình, hỏi lệnh có tín hiệu MemToRead = ? = lệnh Load word => lấy điểm Hoặc cho đoạn gồm nhiều lệnh, chạy đến đoạn đó, hỏi Tín hiệu điều khiển khối Control (thực chất xét lệnh đề nói, ko quan tâm lệnh chạy qua trước lệnh chưa chạy qua) b CÁCH NHỚ NHANH: học thuộc Thường đề thi cho Vị trí RegDST, Branch, MemRead, MemToReg, ALUop, MemWrite, ALUSrc, RegWrite hình khối Control đặt theo thứ tự rồi, nên cần nhớ: R-format (add, sub, and, or, slt): 10001Add001 Lw: 0011Add011 Sw: x00x ALUop0=0 ALUop0=0 110 Beq: x10x ALUop0=1 ALUop0=0 000 Ví dụ: Giải 1.Coi bảng Tín hiệu khối Control nha Cần nhớ TỔNG QUÁT: Add, sub, and, or, slt: tất khối cần thiết, trừ khối Data memory Bộ cộng dùng cho lệnh nhảy - Lw, sw: tất khối cần thiết, trừ Bộ cộng dùng cho lệnh nhảy 3.Câu này: + a tương Ứng lệnh Add, sub, and, or, slt + b dùng cho lệnh lw, lệnh khác ko rõ nha CRITICAL PATH DÀI NHẤT (hình đầy đủ) Lấy lệnh có Critical path dài nhất, cộng giá trị độ trễ Critical Path => Chu kì + lệnh add, sub, AND, OR, slt I-mem, Control, Mux, Regs, Mux, ALU, Mux, Regs ==> đề cho Control bỏ Control + lệnh lw I-mem, Control, Mux, Regs, Mux, ALU, D-mem, Mux, Regs thường có thgian trễ lớn I ==> đề cho Control bỏ Control + lệnh sw I-mem, Regs, Mux, ALU, D-mem + lệnh beq a I-mem, Regs, Mux, ALU, Mux (xét bằng) b I-mem, Sign-Extend,Shift-left-2, Add, Mux (không xét bằng) ==> Thường a đường chính; beq đường tính imm*4+PC+4 nên chắc, dựa vào kiện tính thử xem đường b có dài đường a khơng cho Ví dụ: Giải - Lệnh And Critical Path là: I-mem, Control, Mux, Regs, Mux, ALU, Mux, Regs - Thời gian trễ lớn lệnh And: 400 + 100 + 30 + 200 + 30 + 120 + 30 + 200 = 1110ps - tương tự: Ví dụ: 1.Ta có tổng qt + Lệnh add, sub, AND, OR, slt I-mem, Control, Mux, Regs, Mux, ALU, Mux, Regs Các lệnh có tổng độ trễ nhau, nên tính độ trễ theo Critical Path trên, chu kì xung clock ln 2.Tương tự ta tính cho lệnh lw vói Critical path: I-mem, Control, Mux, Regs, Mux, ALU, Dmem, Mux, Regs chùm lệnh add, beq,lw,sw chắn thời gian trễ lw lớn nhất, viết Critical path lw, tính độ trễ => chu kì xung clock Nhớ lại BT phần đầu Các khối cần thiết, ko cần thiết - Add, sub, and, or, slt: tất khối cần thiết, trừ khối Data memory Bộ cộng dùng cho lệnh nhảy - Lw, sw: tất khối cần thiết, trừ Bộ cộng dùng cho lệnh nhảy Ta thấy “Data memory” bị truy xuất với lw sw a 20% + 10% = 30% b 35% + 15% = 50% Thật khối “Sign-extend” có tính tốn kết chu kỳ, output cần cho lệnh addi, beq, lw sw; bỏ qua với lệnh lại Vì vậy: a 15% + 20% + 20% + 10% = 65% b 5% + 15% + 35% + 15% = 70% Câu dạng khó khăn nè Giải BT LẤY ĐIỂM NHIỀU, DÙNG HÌNH NHƯ ĐẦU FILE NHÉ II PIPELINE Đối với phần Pipelined KTMT, có ý với kỹ thuật cho phép gửi vượt trước : Forwarding ko cho gửi Non - forwarding sau - Non - forwarding: Khi có lệnh chu kỳ sử dụng chung ghi (1 lệnh đọc lệnh ghi) thì: Chỉ lệnh trước tới cơng đoạn WB (nửa đầu WB dc ghi) lệnh dc phép thực thi công đoạn ID (giải mã lệnh nửa sau ID) => Kết luận: cần ý đặt NOP cho WB lệnh trước thẳng hàng với ID lệnh (tham khảo thêm hình) - Forwarding: với lệnh thuộc kiểu R-Format (add, sub ) EX lệnh trước cần thẳng hàng với ID lệnh sau (đảm bảo EX sau cho KQ truyền thẳng tới ALU lệnh sau nó), lệnh LW MEM lệnh trước thẳng hàng với ID lệnh sau (đảm bảo sau đọc/ ghi DL công đoạn MEM xong dc truyền xuống ALU lệnh kế tiếp) Chia sẻ bỏ qua lệnh ss nhảy beq (vì vướng điều kiện tiên đốn) ^^ Bạn có kinh nghiệm làm dạng cmt chia sẻ với người ^^ p/s: lệnh SW xảy theo trình tự code: lw để load DL từ ô nhớ ghi, thực thi lệnh add, sub cuối lưu lại giá trị ghi xuống nhớ => sw lệnh cuối ko lệnh thực thi sau ^^ TĨM LẠI NHỚ NHƯ VẦY: Giải xung đột: - Non – Forwarding: thêm nop lệnh (thêm nop, vẽ hình WB lệnh trước tự thẳng hàng ID lệnh sau ) Chu kì Lệnh Nop Nop Lệnh IF ID O EX O O MEM O O IF WB O O ID O O EX O MEM WB - Forwarding: dòng lệnh xung đột, dòng lệnh là: + R-Format (add, sub ): ko cần thêm nop (EX lệnh trước tự thẳng hàng ID lệnh sau rồi) Chu kì Lệnh Lệnh IF ID IF EX ID MEM EX WB MEM WB + Lệnh Lw: thêm nop (thêm nop, vẽ hình MEM lệnh trước tự thẳng hàng ID lệnh sau) Chu kì Lệnh Nop Lệnh IF ID O EX O IF MEM O ID WB O EX O MEM WB CHÚ Ý VỀ CÁCH THỨC HOẠT ĐỘNG CỦA CÁC LỆNH ADD, SUB, LW, SW … Để nhìn xung đột Ví dụ: Lw $t0, 12($S0) => Nạp từ nhớ có d0ịa ( 12 + $S0) vào ghi $t0 Sw $t0, 12($S0) => Lưu giá trị ghi $t0 vào vùng nhớ có địa (12 + $S0) -Các công đoạn lệnh Ví dụ: thường cho dạng câu 1,2,3 III PHÉP TỐN SỐ HỌC TRÊN MÁY TÍNH 1.Overflow số khơng dấu Overflow số có dấu (Signed number) -Hàng 1: Nếu cộng hai số dương, mà kết âm => phép toán bị tràn -Hàng 2: Nếu cộng hai số âm, mà kết dương => phép toán bị tràn -Hàng 3: Nếu trừ số dương cho số âm, mà kết âm => phép tốn bị tràn (Tình giống hàng 1, trừ số dương cho số âm, tức cộng số dương với số dương mà kết âm bị tràn) -Hàng 4: Nếu trừ số âm cho số dương, mà kết dương => phép tốn bị tràn (Tình giống hàng 2, trừ số âm cho số dương, tức cộng số âm với số âm mà kết dương bị tràn) Có thể tóm tắt sau: -Nếu phép trừ quy phép cộng dùng bù -Quy tắc tràn số tính sau: +Nếu cộng hai số trái dấu, kết không bị tràn +Nếu cộng hai số dấu mà kết khác dấu => tràn ================================================= TRẮC NGHIỆM HAY HỎI GIỚI BIỂU DIỄN SỐ HỎI TN NÈ PHÉP NHÂN HỌC THUỘC CÁC BƯỚC CỦA GIẢI THUẬT, CỨ THẾ MÀ LÀM Cấu trúc phần cứng hình vẽ nhân số 32 bits, kết số 64 bits, Có: ghi multiplicand 64 bits ghi multiplier 32 bits ghi product 64 bits Ví dụ yêu cầu nhân số bits không dấu, sử dụng cấu trúc phần cứng tương tự hình, kết phải số bits => ghi multiplicand bits (giá trị khởi tao 0000 0010) ghi multiplier bits (giá trị khởi tạo 0011) ghi product bits (giá trị khởi tạo 0000 0000) Iteration Step Multiplier Multiplican d Product Khởi tạo 0011 0000 0010 0000 0000 - Sau khởi tạo xong Mỗi vòng lặp (interation) gồm bước: B1 Kiểm tra bit Multiplier xem có hay khơng; Product = Product + Multiplicand; 0, khơng làm B2 Dịch trái Multiplicand bit B3 Dịch phải Multiplier bit Số vòng lặp cho giải thuật số bit dùng biểu diễn (ví dụ yêu cầu dùng số bit, có vòng lặp) Sau kết thúc số vòng lặp, giá trị ghi Product kết phép nhân Ví dụ: Bảng thực bước giải thuật phép nhân số: 00102 x 00112 PHÉP CHIA COI TRONG SLIDE, HÊN THÌ CHO =)) IV Floating point – số chấm động 1.0ten x 10-9: số thực chuẩn 0.1ten x 10-8: số thực chuẩn 10.0ten x 10-10: số thực chuẩn Biểu diễn số thực dấu chấm động a Biểu diễn số thực dấu chấm động theo chuẩn IEEE 754 (với độ xác đơn) Trong đó: + s: biểu diễn dấu số thực dấu chấm động (1 nghĩa âm, ngược lại dương) + Phần mũ (exponent) có kích thước bit Exponent biểu diễn 127 yyyy (excess-127 bias of 127 ) + Phần lẻ (fraction) dùng 23 bits để biểu diễn ý: thi hỏi = từ tiếng anh: exponent, fraction Tổng quát, số thực dấu chấm động tính dựa theo (với Bias = 127): => Thường dùng b Biểu diễn số thực dấu chấm động theo chuẩn IEEE 754 (với độ xác kép) c Phép toán cộng số thực dấu chấm động Thực cộng hai số thực dấu chấm động chuẩn hệ thập phân sau 9.999ten x 101 + 1.610ten x 10-1 Giả sử số thực dấu chấm động lưu trữ phần trị (significand) dùng chữ số, phần số mũ (exponent) lưu trữ dùng chữ số THI CHO CỘNG SỐ RỒI HỎI TRONG HÌNH NÀY PHÉP NHẠN TƯƠNG TỰ, COI SLIDE, KO CĨ HÌNH TRÊN ĐÂU, CHỈ CĨ CỘNG THÔI ... Mux, Regs Các lệnh có tổng độ trễ nhau, nên tính độ trễ theo Critical Path trên, chu kì xung clock ln 2.Tương tự ta tính cho lệnh lw vói Critical path: I-mem, Control, Mux, Regs, Mux, ALU, Dmem,... beq,lw,sw chắn thời gian trễ lw lớn nhất, viết Critical path lw, tính độ trễ => chu kì xung clock Nhớ lại BT phần đầu Các khối cần thiết, ko cần thiết - Add, sub, and, or, slt: tất khối cần thiết,... khăn nè Giải BT LẤY ĐIỂM NHIỀU, DÙNG HÌNH NHƯ ĐẦU FILE NHÉ II PIPELINE Đối với phần Pipelined KTMT, có ý với kỹ thuật cho phép gửi vượt trước : Forwarding ko cho gửi Non - forwarding sau - Non