(LUẬN văn THẠC sĩ) thiết kế nhân ma trận thưa với véctơ trong tính toán song song và ứng dụng luận văn ths toán học 60 46 35

102 12 0
(LUẬN văn THẠC sĩ) thiết kế nhân ma trận thưa với véctơ trong tính toán song song và ứng dụng luận văn ths  toán học 60 46 35

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

đại học quốc gia hà nội tr-ờng đại học khoa học tự nhiên Ngô thị nhạn Thiết kế nhân ma trận th-a với véctơ tính toán song song ứng dụng luận văn thạc sĩ khoa học Hà Nội - Năm 2011 TIEU LUAN MOI download : skknchat@gmail.com đại học quốc gia hà nội tr-ờng đại học khoa học tự nhiên Ngô thị nhạn Thiết kế nhân ma trận th-a với véctơ tính toán song song ứng dụng Chuyên ngành: Bảo đảm toán học cho máy tính hệ thống tính toán MÃ số: 60 46 35 luận văn thạc sĩ khoa học ng-ời h-ớng dẫn khoa học: nguyễn hữu điển Hà Nội - Năm 2011 TIEU LUAN MOI download : skknchat@gmail.com MỤC LỤC Trang Trang phụ bìa Mục lục Danh mục ký hiệu Danh mục bảng Danh mục hình vẽ Danh mục thuật toán MỞ ĐẦU Chƣơng - TỔNG QUAN VỀ XỬ LÝ SONG SONG 12 1.1 Hệ thống song song 12 1.1.1 Khái niệm xử lý song song 12 1.1.2 Kiến trúc xử lý song song 12 1.2 Các thành phần máy tính song song 15 1.2.1 Bộ nhớ 15 1.2.2 Chương trình dịch hệ điều hành 17 1.3 Các mơ hình lập trình song song 19 1.3.1 Mơ hình chia sẻ nhớ 19 1.3.2 Mơ hình tuyến 20 1.3.3 Mơ hình song song liệu 20 1.3.4 Mơ hình truyền thông điệp 21 1.4 Nguyên lý thiết kế thuật toán song song 22 1.4.1 Định nghĩa thuật toán song song 22 1.4.2 Các giai đoạn thiết kế thuật toán song song 22 TIEU LUAN MOI download : skknchat@gmail.com 1.4.3 Đánh giá độ phức tạp thuật toán song song 25 1.5 Lập trình song song với MPI 27 1.5.1 Giao diện truyền thông điệp - MPI 27 1.5.2 Giới thiệu gói CCP Microsoft 31 1.5.3 Lập trình MPI với VS.NET 34 1.6 Kiến trúc cụm máy tính 35 Chƣơng – THUẬT TOÁN SONG SONG NHÂN MA TRẬN THƢA VỚI VÉCTƠ 38 2.1 Ma trận thưa 38 2.1.1 Đặt vấn đề 38 2.1.2 Cấu trúc liệu cho ma trận thưa 43 2.2 Nhân ma trận thưa với véc tơ song song 48 2.2.1 Thuật toán song song 48 2.2.2 Phân phối ma trận 53 2.2.3 Phân phối véc tơ 60 2.2.3.1 Cận địa phương cho số truyền thông cực đại 62 2.2.3.2 Phân phối véc tơ độc lập 71 2.2.3.3 Phân phối véc tơ đồng thời 78 Chƣơng – KẾT QUẢ THỰC NGHIỆM 83 3.1 Bộ liệu 83 3.2 Kết 83 KẾT LUẬN 93 TÀI LIỆU THAM KHẢO 94 PHỤ LỤC 96 TIEU LUAN MOI download : skknchat@gmail.com BẢNG THUẬT NGỮ VIẾT TẮT Thuật ngữ CCS Tiếng Anh Compressed Column Storage Nghĩa tiếng Việt Lưu trữ nén cột CRS Compressed Row Storage Lưu trữ nén dòng CPU Central Processing Unit Bộ xử lý trung tâm HPC High Performance Computing Tính tốn/máy tính hiệu cao ICRS Incremental Compressed Row Storage Lưu trữ nén dịng có gia số JDS Jagged Diagonal Storage Lưu trữ đường chéo cưa Multi Instruction Stream, Multi Data Stream Multi Instruction Stream, Single Data Stream Đa luồng lệnh, đa luồng liệu MPI Message Passing Interface Giao diện truyền thông điệp NUMA Non-Uniform Memory Access Truy cập nhớ không đồng thời PRAM Parallel Random Access Machine Máy truy trập ngẫu nhiên song song Đơn luồng lệnh, đa luồng liệu TCP Single Instruction Stream, Multi Data Stream Single Instruction Stream, Single Data Stream Transmission Control Protocol UDP User Datagram Protocol Giao thức gói người dùng UMA Uniform Memory Access Truy cập nhớ đồng thời WS Workstation Máy trạm WSC Workstation Cluster Cụm máy trạm MIMD MISD SIMD SISD Đa luồng lệnh, đơn luồng liệu Đơn luồng lệnh, đơn luồng liệu Giao thức điều khiển truyền thông TIEU LUAN MOI download : skknchat@gmail.com DANH MỤC CÁC BẢNG Trang Bảng 3.1 Các file liệu ma trận 83 Bảng 3.2 Thống kê cho ma trận bcsstk13 85 Bảng 3.3 Thống kê cho ma trận lp_cycle 86 Bảng 3.4 Thống kê cho ma trận onetone2 87 Bảng 3.5 Thống kê cho ma trận epb2 88 Bảng 3.7 Thống kê cho ma trận random20k 90 TIEU LUAN MOI download : skknchat@gmail.com DANH MỤC HÌNH VẼ Trang Hình 1.1 Phân cấp hệ thống nhớ 15 Hình 1.2 Mơ hình tuyến 20 Hình 1.3 Các giai đoạn trình thiết kế thuật tốn 23 Hình 1.4 Luật Amdahl 27 Hình 1.5 Mơ kiến trúc cụm tính toán 32 Hình 1.6 Mơ hình kiến trúc lập lịch 33 Hình 2.1 Mơ động lực học ma trận lực thưa 40 Hình 2.2 Minh hoạ nhân ma trận thưa với véc tơ song song 49 Hình 2.3 Minh hoạ truyền thông nhân ma trận thưa với véc tơ 51 Hình 2.4 Phân phối ma trận impcol_b 58 Hình 3.1 Hình dạng thưa ma trận bcsstk13 84 Hình 3.2 Hình dạng thưa ma trận lp_cycle 85 Hình 3.3 Hình dạng thưa ma trận onetone2 86 Hình 3.4 Hình dạng thưa ma trận epb2 87 Hình 3.5 Hình dạng thưa ma trận nasa2910 88 Hình 3.6 Phân phối LA cho random20k với P = 91 Hình 3.7 Phân phối LA cho lp_cycle với P = 92 TIEU LUAN MOI download : skknchat@gmail.com DANH MỤC CÁC THUẬT TỐN Trang Thuật tốn 2.1 Thuật tốn nhân ma trận thưa với véc tơ 39 Thuật toán 2.2 Thuật toán nhân ma trận thưa với véc tơ sử dụng CRS 45 Thuật toán 2.3 Thuật toán nhân ma trận thưa với véc tơ sử dụng ICRS 46 Thuật toán 2.4 Nhân ma trận thưa với véc tơ song song 50 Thuật toán 2.5 Thuật toán Mondrian phân hoạch ma trận thưa 59 Thuật toán 2.6 Xây dựng cận địa phương xử lý s 64 Thuật toán 2.7 Chuyển tập C  thành C   0, , C   1 66 Thuật toán 2.8 Tạo cận địa phương tổng quát cho xử lý s 69 Thuật toán 2.9 Thuật toán biên địa phương (LA) 73 Thuật toán 2.10 Thuật toán phân phối véc tơ đồng thời (LAvu) 80 TIEU LUAN MOI download : skknchat@gmail.com MỞ ĐẦU Nhân loại ngày chứng kiến phát triển mạnh mẽ ngành Công nghệ thông tin, ngành mũi nhọn nhiều quốc gia giới Sự phát triển vượt bậc kết tất yếu phát triển thiết bị phần cứng phần mềm tiện ích Từ máy tính đơn giản, tốc độ xử lý chậm, sử dụng số lĩnh vực kỹ thuật định, ngày chúng có khả tính tốn tốc độ xử lý vượt trội trở thành công cụ thiếu lĩnh vực đời sống Những máy tính đời đầu tiên, hạn chế tốc độ xử lý chế vào liệu nên việc lập trình khó khăn Điều làm cho máy tính khơng có khả sử dụng dễ dàng phổ cập, ứng dụng số lĩnh vực khoa học đặc biệt Ngày nay, với phát triển mạnh mẽ thiết bị lưu trữ, nhớ, tốc độ xử lý thiết bị ngoại vi,… máy tính trở nên thân thiện với người sử dụng, tốc độ tính tốn nhanh nhiều Nhờ mà nhiều tốn lớn có khả thực thi nhiều ứng dụng đưa Tuy nhiên, thực tế nhiều vấn đề lớn với số lượng cần tính tốn khổng lồ mà máy tính thông thường giải Vào thập kỷ 70, nhà khoa học đưa ý tưởng cấu trúc song song nhằm kết hợp sức mạnh nhiều xử lý máy tính, kết hợp nhiều máy tính với thơng qua mạng máy tính tạo thành máy song song ảo Ngồi việc tính nhanh, máy tính song song có độ an tồn cao máy tính đơn, vài xử lý hỏng máy tính song song hoạt động máy tính đơn khơng làm điều Hiện giới có máy tính song song chứa đến hàng nghìn xử lý Để khai thác tiềm sức mạnh máy tính song song, với việc thiết kế kiến trúc song song ta phải nghiên cứu vấn đề quan trọng khác hệ điều hành hỗ trợ xử lý song song, ngôn ngữ lập trình thuật tốn song song Việc nghiên cứu thiết kế máy tính song song, thuật tốn song song ngơn ngữ lập trình hỗ trợ lập trình song song bắt đầu quan tâm từ 10 TIEU LUAN MOI download : skknchat@gmail.com năm 70, ứng dụng chúng lan rộng khắp lĩnh vực đời sống đánh giá khả rủi ro tài chính: dùng để mơ hình hố xu hướng thị trường… Hỗ trợ định phân tích thị trường, dự báo thời tiết… Trí tuệ nhân tạo thiết kế robot… Xử lý ảnh ứng dụng công nghệ nhận dạng… Điều khiển tự động… Trong tốn có liên quan tới ma trận thưa đóng vai trò quan trọng, hay gặp lời giải lặp hệ phương trình tuyến tính, hệ phương trình giá trị riêng, … Do việc nghiên cứu thuật toán ma trận thưa, đặc biệt thuật toán song song ma trận thưa cần thiết Trong phạm vi luận văn trình bày ba phần chính, Chƣơng trình bày tổng quan xử lý song song, thuật toán song song giới thiệu lập trình song song với MPI sử dụng Visual Microsoft; Chƣơng trình bày thuật tốn thiết kế cho nhân ma trận thưa với véc tơ song song; Chƣơng trình bày số kết thực nghiệm số liệu cho chương trình nhân ma trận thưa với véc tơ song song Với thời gian tiếp cận vấn đề lượng thơng tin cịn hạn chế, luận văn cịn nhiều thiếu sót Tơi mong nhận góp ý thầy, anh/chị để tiếp tục phát triển đề tài nghiên cứu đạt kết 11 TIEU LUAN MOI download : skknchat@gmail.com Bảng 3.6 Thống kê cho ma trận nasa2910 Nasa2910: m = 2910, n = 2910, nz = 174296 LA P Véc tơ V / P  V / Pa  LB Max(Nsend,Nreceive) V u 225 225 225 225 450 v 184 184 225 225 735 u 52 103 103 103 206 v 140 140 233 233 1115 u 66 88 107 107 523 v 138 138 257 270 2197 u 77 83 137 137 1232 v 101 104 164 164 3212 u 85 90 158 158 2699 v 90 90 128 133 5701 u 74 74 160 160 4673 16 32 64 Đánh giá: Từ bảng kết 3.2 bảng 3.5, xem thêm phần phụ lục, thuật toán phân phối thành phần véc tơ dựa theo biên địa phương (LA) cho thấy, cận địa phương LB lớn V / P  V / Pa  Trong nhiều trường hợp, cận V / Pa  gần với LB, tức tốt, LB cận tốt Lượng truyền thông cực đại max(Nsend, Nreceive) thuật tốn LA lớn LB, khơng khác xa so với LB 89 TIEU LUAN MOI download : skknchat@gmail.com Như vậy, hầu hết trường hợp tốt, đặc biệt cho liệu lớn Nhưng có số trường hợp LA chưa tốt Ta xem xét Sự khác biệt kết thuật toán LA phụ thuộc vào ma trận ban đầu thuật toán phân phối ma trận cho xử lý Để giải thích có trường hợp LA cho kết xấu, ta xem kết từ ma trận tạo hàm ngẫu nhiên, bảng 3.7 Bảng 3.7 Thống kê cho ma trận random20k Random20K: m = 20000, n= 20000, nz = 99601 P Véc tơ V / P  V / Pa  LB Max(Nsend,Nreceive) v 5087 5087 5087 5087.0  0.0 v 2127 2127 2142 2142.0  0.0 u 2518 2518 2523 2737.3  91.0 v 1254 1254 1292 1516.8  99.0 u 2136 2136 1911 2172.6  14.6 v 1069 1069 970 1116.4  85.2 u 1071 1071 989 1293.9  1595 v 611 611 633 719.9  13.3 u 650 650 631 733.0  1.1 v 344 344 385 413.1  47.9 u 364 364 388 434.5  34.1 16 32 64 Bảng kết trên, bảng 3.7 [23], nhận việc thực phân phối ma trận 10 lần thuật toán Mondrian, với cân tải cho phép 3% Từ kết cho ta thấy trường hợp với P = 4, 16 thuật toán LA cho kết max(Nsend, Nreceive) 90 TIEU LUAN MOI download : skknchat@gmail.com lớn nhiều so với LB Giải thích cho điều này, ta xem trường hợp P = 4, ma trận phân bố hình 3.1: Hình 3.6 Phân phối LA cho random20k với P = Ta thấy trường hợp cột ma trận có nhiều hai xử lý Với cột có hai xử lý có vấn đề cận địa phương Ta hình dung xử lý đỉnh số cột xử lý hai xử lý cạnh kết nối xử lý Ta thấy cạnh xử lý với số lần đỉnh Xem hình (a), LA thực hiện, trước tiên xem xét giá trị cận địa phương L(s) chọn xử lý có giá trị lớn nhất, chọn P0 Tiếp theo, hình (b) sau phân phối số cạnh cho P0, P0 đạt đến cận địa phương Khi xử lý P1 có L(s) cao nhất, chọn để xét Trong hình (c) P1 đạt cận địa phương Tiếp theo xử lý P2, P3 luân phiên phân cho cột Là luân phiên xử lý đạt cột, giá trị L(s) xử lý lại tăng lên, thêm có cột cho phép hai đạt L(s) thời Tuy nhiên hình (d) cịn cạnh kết nối P0 P1, hai xử lý lại không muốn sở hữu thêm cột chúng đại đến cận chúng Điều này, LA thực chọn cách ngẫu nhiên cạnh cho hai xử lý Vì điều ta thấy tất cạnh P0 P1 phân cho P1, L(0) L(1) tăng lên Do max(Nsend, Nreceive) tăng lên Một lý ta thấy, xử lý P2 P3 cần khoảng 2500 cạnh để đạt tới biên địa phương chúng, lại có khảng 4349 cho hai, hình (c) Bởi L(2) L(3) tăng lên làm tăng max(Nsend, Nreceive) 91 TIEU LUAN MOI download : skknchat@gmail.com Xem lại bảng kết quả, cho thấy LA hầu hết tốt, lý giải cho điều ta xem lại bảng 3.2, trường hợp P = 4, có phân phối sau: Hình 3.7 Phân phối LA cho lp_cycle với P = Như hình xử lý có cận cực đại chọn P0, P1, P3 P2 Đến hình (e), tất xử lý đạt cận địa phương, lại số cạnh chưa phân Từ hình (a) ta thấy L(0) = 68, L(1) = 49, L(2) = 29, L(3) = 25, cạnh lại phân, cách tham lam theo pha 2, cho xử lý khác P1, P2 giá trị L(1), L(2) tăng lên không lớn L(0) Xem hình (c), để đạt cận địa phương P3 cần 25 cạnh có 15 cạnh, tăng lên, khơng lớn L(0) Vì max(Nsend, Nreceive) khơng tăng Đối với trường hợp mà đạt cận địa phương mà không làm tăng biên địa phương (LB lớn cận địa phương) thuật tốn LA ln cho kết tốt Tóm lại thuật toán phân phối thành phần véc tơ dựa biên địa phương cho phép ta cực tiểu hoá dung lượng truyền thông cực đại max(Nsend, Nreceive) Cận địa phương (LB) cận tốt nhất, tốt hẳn cận V / P  V / Pa  92 TIEU LUAN MOI download : skknchat@gmail.com KẾT LUẬN Luận văn trình bày số nội dung sau:  Một số kiến thức tổng quan xử lý song song bao gồm hệ thống song song, mơ hình lập trình song song, ngun lý thiết kế thuật toán song song kiến trúc cụm máy tính trung tâm tính tốn hiệu cao Luận văn giới thiệu giao diện truyền thông điệp MPI nhằm mục đích áp dụng lập trình MPI với ngơn ngữ C cho tốn nhân ma trận thưa với véc tơ song song  Thuật toán song song nhân ma trận thưa với véc tơ  Cài đặt chương trình nhân ma trận thưa với véc tơ song song, sử dụng thuật toán phân phối ma trận Mondrian, cài đặt thuật toán biên địa phương phân phối véc tơ cho trường hợp tổng quát, ma trận hình chữ nhật  Chạy thử nghiệm số liệu lấy từ sưu tập trực tuyến, http://www.cise.ufl.edu/research/sparse/matrices  Từ kết nhận được, luận văn thuật toán biên địa phương tốt cho toán nhân ma trận thưa với véc tơ với mục tiêu cực tiểu hoá dung lượng truyền thơng cực đại cân tải tính tốn truyền thông Trong tương lai luận văn tiếp tục nghiên cứu thuật toán phân phối ma trận thưa, áp dụng phương pháp phân phối đa mức phương pháp phân hoạch siêu đồ thị, cải tiến thuật toán phân phối véc tơ phương pháp heuristic 93 TIEU LUAN MOI download : skknchat@gmail.com TÀI LIỆU THAM KHẢO Tiếng Việt Đoàn Văn Ban, Nguyễn Mậu Hân (2006), Xử lý song song phân tán, NXB KHKT Nguyễn Hữu Điển (2006), Một số vấn đề thuật toán, NXB giáo dục Tiếng Anh A Pinar and C Aykanat (1997), “Sparse matrix decomposition with optimal load balancing”, in Proceedings International Conference on High Performance Computing (HiPC'97), pp 224-229 B Hendrickson and R Leland (1995), A multilevel algorithm for partitioning graphs, in Proceedings Supercomputing '95, ACM Press/IEEE Press B Hendrickson (1998), “Graph partitioning and parallel solvers: Has the emperor no clothes?”, in Proceedings Irregular'98, A Ferreira, J Rolim, H Simon, and S.-H Teng, eds., vol 1457 of Lecture Notes in Computer Science, Springer-Verlag, Berlin, pp 218-225 B Hendrickson and T G Kolda (2000), “Graph partitioning models for parallel computing”, Parallel Computing, pp 1519 – 1534 B Hendrickson and T G Kolda (2000), “Partitioning rectangular and structurally unsymmetric sparse matrices for parallel processing”, SIAM Journal on Scientic Computing, pp 2048-2072 Brendan Vastenhouw and Rob H Bisseling (2002), A two-dimensional data distribution method for parallel sparse matrix-vector multiplication, Preprint Nr 1238, Dept of Mathematics, Utrecht University Cameron Hughes, Tracey Hughes (2003), Parallel and Distributed Programming Using C++, Addison Wesley 10 David Ashton, William Gropp, Ewing Lusk: Installation and User’s Guide to MPICH, a Portable Implementation of MPI Version 1.2.5, Agonne National Laboratory 11 G H Golub and C F Van Loan (1996), Matrix Computations, Johns Hopkins Studies in the Mathematical Sciences, The Johns Hopkins University Press, Baltimore, MD, third ed 94 TIEU LUAN MOI download : skknchat@gmail.com 12 G Karypis and V Kumar (1998), “A fast and high quality multilevel scheme for partitioning irregular graphs”, SIAM Journal on Scientic Computing, pp 359-392 13 H Roosta (2000), Parallel Processing and Parallel Algorithms, Springer-Verlag 14 L F Romero and E L Zapata (1995), “Data distributions for sparse matrix vector multiplication”, Parallel Computing, pp 583-605 15 M J Berger and S H Bokhari (1987), “A partitioning strategy for nonuniform problems on multiprocessors”, IEEE Transactions on Computers, C-36, pp 570-580 16 R H Bisseling (1993), “Parallel iterative solution of sparse linear systems on a transputer network”, in Parallel Computation, A E Fincham and B Ford, vol 46 of the Institute of Mathematics and its Applications Conference Series, Oxford University Press, Oxford, UK, pp 253-271 17 R H Bisseling and W F McColl (1994), “Scientic computing on bulk synchronous parallel architectures”, in Technology and Foundations: Information Processing '94, vol I, B Pehrson and I Simon, eds., vol 51 of IFIP Transactions A, Elsevier Science Publishers, Amsterdam, pp 509-514 18 R H Bisseling (2004), Parallel Scientìic Computation, a structured approach using BSP and MPI, Oxford University 19 T Bui and C Jones (1993), “A heuristic for reducing fill in sparse matrix factorization”, in Proceedings Sixth SIAM Conference on Parallel Processing for Scientic Computing, SIAM, Philadelphia, PA, pp 445-452 20 T A Davis (1994-2001), “University of Florida sparse matrix collection”, online collection, http://www.cise.ufl.edu/research/sparse/matrices, Computer and Information Sciences Department, University of Florida, Gainesville, FL 21 U V Catalyurek and C Aykanat (1999), “Hypergraph-partitioning-based decomposition for parallel sparse-matrix vector multiplication”, IEEE Transactions on Parallel and Distributed Systems, 10(7), pp 673-693 22 U V Catalyurek and C Aykanat (2001), “A hypergraph-partitioning approach for coarse-grain decomposition”, in Proceedings Supercomputing 2001, ACM 23 Wouter Meesen (2003), Distributing vector components of a parallel sparse matrixvector multiplication, Utrecht 95 TIEU LUAN MOI download : skknchat@gmail.com PHỤ LỤC Các liệu khác Để cho rõ kết luận Chương 3, đưa thêm số kết chạy chương trình cài đặt với liệu lầy từ sưu tập trực tuyến [20] Bảng liệu chọn lọc Bảng Các tệp liệu ma trận STT Tên tệp m n nz Bài toán ứng dụng gemat1 4929 10595 47369 Power networks problem gemat11 4920 4929 33185 Power networks sequence problem Pres_Poisson 14822 14822 715804 Computational fluid dynamics problem lp_cre_b 9648 77137 260785 Linear programming problem qh882 882 882 3354 Power networks problem bundle1 10581 10581 770811 Computer graphics/vision problem poli3 16955 16955 37849 Economic problem Các bảng kết Chương trình cài đặt chạy cho liệu bảng Trước tiên thực phân phối ma trận thuật toán Mondrian với cân tải cho phép 3%, số tiến trình P từ tới 64 Tiếp theo thực phân phối véc tơ thuật toán biên địa phương tổng quát (LA) Kết chạy thống kê cho cận V / Pa  , V / P  , 96 TIEU LUAN MOI download : skknchat@gmail.com cận địa phương LB (Lower Bound), giá trị max(Nsend, Nreceive), lượng truyền thông V Dưới bảng thống kê kết quả: 1) Ma trận gemat1: Hình dạng thưa ma trận: Hình Hình dạng thưa ma trận gemat1 Bảng thống kê ma trận gemat1: Bảng Thống kê cho ma trận gemat1 gemat1: m = 4929, n = 10595 , nz = 47369 LA P Véc tơ V / P  V / Pa  LB Max(Nsend,Nreceive) V u 39 39 39 39 77 u 58 58 71 71 229 u 46 46 58 61 363 16 u 48 48 68 68 753 32 u 36 36 61 61 1145 64 u 32 32 59 63 2043 97 TIEU LUAN MOI download : skknchat@gmail.com 2) Ma trận gemat11: Hình dạng thưa ma trận: Hình Hình dạng thưa ma trận gemat11 Bảng thống kê kết quả: Bảng Thống kê cho ma trận gemat11 gemat11: m = 4929, n = 4929 , nz =33185 LA P Véc tơ V / P  V / Pa  LB Max(Nsend,Nreceive) V v 20 20 20 20 40 u 22 22 31 31 86 v 15 24 24 60 u 16 16 35 35 126 v 14 14 20 20 21 u 10 13 22 23 160 v 10 12 36 36 308 u 14 14 30 30 424 v 14 14 35 35 884 u 11 12 31 31 667 16 32 64 98 TIEU LUAN MOI download : skknchat@gmail.com 3) Ma trận Pres_Poisson: Hình dạng thưa ma trận: Hình Hình dạng thưa ma trận Pres_Poisson Bảng thống kê kết quả: Bảng Thống kê cho ma trận Pres_Poisson Pres_Poisson: m = 14822, n = 14822 , nz = 715804 LA P Véc tơ V / P  V / Pa  LB Max(Nsend,Nreceive) V v 204 204 204 204 408 v 302 302 408 408 1208 v 139 139 144 144 1112 u 154 176 261 291 1232 v 145 145 248 278 2320 u 106 122 208 208 1696 v 102 102 152 220 3264 u 97 97 156 168 3096 v 81 81 150 167 5180 u 80 80 136 150 5120 16 32 64 99 TIEU LUAN MOI download : skknchat@gmail.com 4) Ma trận lp_cre_b: Hình dạng thưa ma trận: Hình Hình dạng thưa ma trận lp_cre_b Bảng thống kê kết quả: Bảng Thống kê cho ma trận lp_cre_b lp_cre_b: m = 9648, n = 77137 , nz = 260785 LA P Véc tơ V / P  V / Pa  LB Max(Nsend,Nreceive) V u 368 368 368 368 735 u 296 296 303 306 1184 u 295 295 357 359 2358 16 u 256 256 348 350 3397 32 u 199 199 310 310 6368 64 u 146 146 249 249 9288 5) Ma trận qh882: Hình Hình dạng thưa ma trận qh882 100 TIEU LUAN MOI download : skknchat@gmail.com Bảng thống kê kết quả: Bảng Thống kê cho ma trận qh882 qh882: m = 882, n = 822 , nz = 3354 LA P Véc tơ V / P  V / Pa  LB Max(Nsend,Nreceive) V u 6 6 12 v 9 18 u 9 13 13 34 u 13 13 17 18 102 v 21 21 108 u 8 14 15 118 v 13 13 26 26 414 u 13 14 29 30 394 v 18 18 25 27 1114 u 15 15 25 25 939 16 32 64 6) Ma trận bundle: Hình Hình dạng thưa ma trận bundle1 101 TIEU LUAN MOI download : skknchat@gmail.com Bảng thống kê kết quả: Bảng Thống kê cho ma trận bundle1 Bundle1: m = 10581, n = 10581 , nz = 770811 LA P Véc tơ V / P  V / Pa  LB Max(Nsend,Nreceive) V v 1384 1384 1384 1384 2767 v 258 516 516 516 1032 u 1190 1190 1798 1798 4757 v 826 826 1284 1284 6602 u 661 661 1038 1038 5284 v 586 586 910 910 9363 u 692 692 1046 1046 11060 v 376 376 520 520 12017 u 605 605 940 940 19346 v 404 404 726 726 25809 u 356 356 507 507 22738 16 32 64 7) Ma trận poli3: 102 TIEU LUAN MOI download : skknchat@gmail.com Hình Hình dạng thưa ma trận poli3 Bảng thống kê kết quả: Bảng Thống kê cho ma trận poli3 poli3: m = 16955 , n = 16955 , nz = 37849 LA P Véc tơ V / P  V / Pa  LB Max(Nsend,Nreceive) V u 63 63 63 63 125 u 66 66 69 69 262 u 59 59 67 71 468 16 u 42 42 55 55 661 32 u 28 28 45 45 890 v 12 12 59 u 18 18 33 33 1136 64 103 TIEU LUAN MOI download : skknchat@gmail.com ... tốn nhân ma trận thưa với véc tơ 39 Thuật toán 2.2 Thuật toán nhân ma trận thưa với véc tơ sử dụng CRS 45 Thuật toán 2.3 Thuật toán nhân ma trận thưa với véc tơ sử dụng ICRS 46 Thuật toán. .. học quốc gia hà nội tr-ờng đại học khoa học tự nhiên Ngô thị nhạn Thiết kế nhân ma trận th-a với véctơ tính toán song song ứng dụng Chuyên ngành: Bảo đảm toán học cho máy tính hệ thống tính toán. .. song song Có ba phương pháp thiết kế thuật tốn song song: - Song song hoá thuật toán có - Thiết kế thuật tốn song song sở thuật tốn song song có - Thiết kế thuật tốn song song hồn tồn thích ứng với

Ngày đăng: 14/07/2022, 06:40

Hình ảnh liên quan

BẢNG THUẬT NGỮ VIẾT TẮT - (LUẬN văn THẠC sĩ) thiết kế nhân ma trận thưa với véctơ trong tính toán song song và ứng dụng luận văn ths  toán học 60 46 35
BẢNG THUẬT NGỮ VIẾT TẮT Xem tại trang 5 của tài liệu.
Trong mơ hình này mỗi CPU có bộ nhớ riêng, mỗi CPU truy nhập đến bộ nhớ riêng của mình với tốc độ nhanh, còn truy cập đến bộ nhớ của CPU khác thì chậm hơn - (LUẬN văn THẠC sĩ) thiết kế nhân ma trận thưa với véctơ trong tính toán song song và ứng dụng luận văn ths  toán học 60 46 35

rong.

mơ hình này mỗi CPU có bộ nhớ riêng, mỗi CPU truy nhập đến bộ nhớ riêng của mình với tốc độ nhanh, còn truy cập đến bộ nhớ của CPU khác thì chậm hơn Xem tại trang 14 của tài liệu.
Hình 1.3 Các giai đoạn của quá trình thiết kế thuật tốn - (LUẬN văn THẠC sĩ) thiết kế nhân ma trận thưa với véctơ trong tính toán song song và ứng dụng luận văn ths  toán học 60 46 35

Hình 1.3.

Các giai đoạn của quá trình thiết kế thuật tốn Xem tại trang 22 của tài liệu.
 . Ta có biểu đồ thể hiện luật Amdahl như hình 1.4. - (LUẬN văn THẠC sĩ) thiết kế nhân ma trận thưa với véctơ trong tính toán song song và ứng dụng luận văn ths  toán học 60 46 35

a.

có biểu đồ thể hiện luật Amdahl như hình 1.4 Xem tại trang 26 của tài liệu.
Hình 1.5 Mơ phỏng kiến trúc một cụm tính tốn - (LUẬN văn THẠC sĩ) thiết kế nhân ma trận thưa với véctơ trong tính toán song song và ứng dụng luận văn ths  toán học 60 46 35

Hình 1.5.

Mơ phỏng kiến trúc một cụm tính tốn Xem tại trang 31 của tài liệu.
Hình 1.6 Mơ hình kiến trúc lập lịch - (LUẬN văn THẠC sĩ) thiết kế nhân ma trận thưa với véctơ trong tính toán song song và ứng dụng luận văn ths  toán học 60 46 35

Hình 1.6.

Mơ hình kiến trúc lập lịch Xem tại trang 32 của tài liệu.
Hình 2.1 Mô phỏng động lực học bằng ma trận lực thưa - (LUẬN văn THẠC sĩ) thiết kế nhân ma trận thưa với véctơ trong tính toán song song và ứng dụng luận văn ths  toán học 60 46 35

Hình 2.1.

Mô phỏng động lực học bằng ma trận lực thưa Xem tại trang 39 của tài liệu.
inc. Một số khác khơng hình thức được thêm vào cuối mảng, biểu diễn một vị trí hình - (LUẬN văn THẠC sĩ) thiết kế nhân ma trận thưa với véctơ trong tính toán song song và ứng dụng luận văn ths  toán học 60 46 35

inc..

Một số khác khơng hình thức được thêm vào cuối mảng, biểu diễn một vị trí hình Xem tại trang 45 của tài liệu.
Hình 2.2 Minh hoạ nhân ma trận thưa với véctơ song song - (LUẬN văn THẠC sĩ) thiết kế nhân ma trận thưa với véctơ trong tính toán song song và ứng dụng luận văn ths  toán học 60 46 35

Hình 2.2.

Minh hoạ nhân ma trận thưa với véctơ song song Xem tại trang 48 của tài liệu.
Hình 2.4 Phân phối của ma trận impcol_b - (LUẬN văn THẠC sĩ) thiết kế nhân ma trận thưa với véctơ trong tính toán song song và ứng dụng luận văn ths  toán học 60 46 35

Hình 2.4.

Phân phối của ma trận impcol_b Xem tại trang 57 của tài liệu.
Từ bảng trên cho các B(s) như sau: - (LUẬN văn THẠC sĩ) thiết kế nhân ma trận thưa với véctơ trong tính toán song song và ứng dụng luận văn ths  toán học 60 46 35

b.

ảng trên cho các B(s) như sau: Xem tại trang 61 của tài liệu.
Bảng dưới đây, bảng 3.1, biểu diễn các ma trận thưa với các thông tin tên tệp, số hàng (m), số cột (n), số phần tử khác không (nz) và lĩnh vực ứng dụng - (LUẬN văn THẠC sĩ) thiết kế nhân ma trận thưa với véctơ trong tính toán song song và ứng dụng luận văn ths  toán học 60 46 35

Bảng d.

ưới đây, bảng 3.1, biểu diễn các ma trận thưa với các thông tin tên tệp, số hàng (m), số cột (n), số phần tử khác không (nz) và lĩnh vực ứng dụng Xem tại trang 82 của tài liệu.
Bảng 3.2 Thống kê cho ma trận bcsstk13 - (LUẬN văn THẠC sĩ) thiết kế nhân ma trận thưa với véctơ trong tính toán song song và ứng dụng luận văn ths  toán học 60 46 35

Bảng 3.2.

Thống kê cho ma trận bcsstk13 Xem tại trang 84 của tài liệu.
Hình 3.2 Hình dạng thưa của ma trận lp_cycle - (LUẬN văn THẠC sĩ) thiết kế nhân ma trận thưa với véctơ trong tính toán song song và ứng dụng luận văn ths  toán học 60 46 35

Hình 3.2.

Hình dạng thưa của ma trận lp_cycle Xem tại trang 84 của tài liệu.
Bảng 3.3 Thống kê cho ma trận lp_cycle - (LUẬN văn THẠC sĩ) thiết kế nhân ma trận thưa với véctơ trong tính toán song song và ứng dụng luận văn ths  toán học 60 46 35

Bảng 3.3.

Thống kê cho ma trận lp_cycle Xem tại trang 85 của tài liệu.
Bảng 3.4 Thống kê cho ma trận onetone2 - (LUẬN văn THẠC sĩ) thiết kế nhân ma trận thưa với véctơ trong tính toán song song và ứng dụng luận văn ths  toán học 60 46 35

Bảng 3.4.

Thống kê cho ma trận onetone2 Xem tại trang 86 của tài liệu.
Bảng 3.5 Thống kê cho ma trận epb2 - (LUẬN văn THẠC sĩ) thiết kế nhân ma trận thưa với véctơ trong tính toán song song và ứng dụng luận văn ths  toán học 60 46 35

Bảng 3.5.

Thống kê cho ma trận epb2 Xem tại trang 87 của tài liệu.
Bảng 3.6 Thống kê cho ma trận nasa2910 - (LUẬN văn THẠC sĩ) thiết kế nhân ma trận thưa với véctơ trong tính toán song song và ứng dụng luận văn ths  toán học 60 46 35

Bảng 3.6.

Thống kê cho ma trận nasa2910 Xem tại trang 88 của tài liệu.
Bảng 3.7 Thống kê cho ma trận random20k - (LUẬN văn THẠC sĩ) thiết kế nhân ma trận thưa với véctơ trong tính toán song song và ứng dụng luận văn ths  toán học 60 46 35

Bảng 3.7.

Thống kê cho ma trận random20k Xem tại trang 89 của tài liệu.
Hình 3.6 Phân phối LA cho random20k với 4 - (LUẬN văn THẠC sĩ) thiết kế nhân ma trận thưa với véctơ trong tính toán song song và ứng dụng luận văn ths  toán học 60 46 35

Hình 3.6.

Phân phối LA cho random20k với 4 Xem tại trang 90 của tài liệu.
Xem lại các bảng kết quả, cho thấy LA hầu hết là tốt, lý giải cho điều này ta xem lại bảng 3.2, trường hợp P = 4, có phân phối như sau:  - (LUẬN văn THẠC sĩ) thiết kế nhân ma trận thưa với véctơ trong tính toán song song và ứng dụng luận văn ths  toán học 60 46 35

em.

lại các bảng kết quả, cho thấy LA hầu hết là tốt, lý giải cho điều này ta xem lại bảng 3.2, trường hợp P = 4, có phân phối như sau: Xem tại trang 91 của tài liệu.
Bảng 1. Các tệp dữ liệu ma trận - (LUẬN văn THẠC sĩ) thiết kế nhân ma trận thưa với véctơ trong tính toán song song và ứng dụng luận văn ths  toán học 60 46 35

Bảng 1..

Các tệp dữ liệu ma trận Xem tại trang 95 của tài liệu.
Hình dạng thưa của ma trận: - (LUẬN văn THẠC sĩ) thiết kế nhân ma trận thưa với véctơ trong tính toán song song và ứng dụng luận văn ths  toán học 60 46 35

Hình d.

ạng thưa của ma trận: Xem tại trang 96 của tài liệu.
Dưới đây là các bảng thống kê kết quả: 1) Ma trận gemat1:   - (LUẬN văn THẠC sĩ) thiết kế nhân ma trận thưa với véctơ trong tính toán song song và ứng dụng luận văn ths  toán học 60 46 35

i.

đây là các bảng thống kê kết quả: 1) Ma trận gemat1: Xem tại trang 96 của tài liệu.
Hình 2. Hình dạng thưa của ma trận gemat11 Bảng thống kê kết quả:  - (LUẬN văn THẠC sĩ) thiết kế nhân ma trận thưa với véctơ trong tính toán song song và ứng dụng luận văn ths  toán học 60 46 35

Hình 2..

Hình dạng thưa của ma trận gemat11 Bảng thống kê kết quả: Xem tại trang 97 của tài liệu.
Bảng 4. Thống kê cho ma trận Pres_Poisson - (LUẬN văn THẠC sĩ) thiết kế nhân ma trận thưa với véctơ trong tính toán song song và ứng dụng luận văn ths  toán học 60 46 35

Bảng 4..

Thống kê cho ma trận Pres_Poisson Xem tại trang 98 của tài liệu.
Bảng 7. Thống kê cho ma trận bundle1 - (LUẬN văn THẠC sĩ) thiết kế nhân ma trận thưa với véctơ trong tính toán song song và ứng dụng luận văn ths  toán học 60 46 35

Bảng 7..

Thống kê cho ma trận bundle1 Xem tại trang 101 của tài liệu.
Bảng thống kê kết quả: - (LUẬN văn THẠC sĩ) thiết kế nhân ma trận thưa với véctơ trong tính toán song song và ứng dụng luận văn ths  toán học 60 46 35

Bảng th.

ống kê kết quả: Xem tại trang 101 của tài liệu.
Hình 7. Hình dạng thưa của ma trận poli3 Bảng thống kê kết quả:  - (LUẬN văn THẠC sĩ) thiết kế nhân ma trận thưa với véctơ trong tính toán song song và ứng dụng luận văn ths  toán học 60 46 35

Hình 7..

Hình dạng thưa của ma trận poli3 Bảng thống kê kết quả: Xem tại trang 102 của tài liệu.
Bảng 8. Thống kê cho ma trận poli3 - (LUẬN văn THẠC sĩ) thiết kế nhân ma trận thưa với véctơ trong tính toán song song và ứng dụng luận văn ths  toán học 60 46 35

Bảng 8..

Thống kê cho ma trận poli3 Xem tại trang 102 của tài liệu.

Tài liệu cùng người dùng

Tài liệu liên quan