Lập trình song song bài toán nhân ma trận CHƯƠNG 1: TỔNG QUAN VỀ MÔ HÌNH LẬP TRÌNH SONG SONG VỚI OPEN MP ................................ ................................ .............................................................................. 4 1. TÍNH TOÁN SONG SONG ................................ ................................ ............................. 4 1.1. Tính toán song song là gì? .................................................................................. 4 1.2. Tại sao phải tính toán song song? ................................ ................................ ....... 4 2. GIỚI THIỆU VỀ OPENMP ........................................................................................... 4 2.1. Khái niệm về OpenMP ................................ ................................ ........................ 4 2.2. Mô hình lập trình song song OpenMP................................ ................................ . 5 2.2.1. Song song hóa dựa trên cơ chế luồng (Thread based parallelism) ................ 5 2.2.2. Mô hình song song hiện (Explicit Parallelism) ................................ ............ 5 2.2.3. Mô hình ForkJoin ................................ ................................ ...................... 5 2.3. Chỉ thị trong OpenMP ................................ ................................ ......................... 6 2.3.1. Khuôn dạng chỉ thị ................................ ................................ ...................... 6 2.3.2. Phạm vi của chỉ thị: ................................ ................................ .................... 6 2.3.3. Cấu trúc chia sẻ........................................................................................... 7 2.3.3.1. Chỉ thị DoFor ................................ ................................ ........................ 7 2.3.3.2. Chỉ thị Sections ................................ ................................ ...................... 7 2.3.3.3. Chỉ thị Single ................................ ................................ ......................... 7 2.3.4. Cấu trúc đồng bộ dữ liệu ................................ ................................ ............. 8 2.3.4.1. Chỉ thị master ................................ ................................ ......................... 8 2.3.4.2. Chỉ thị critical................................ ................................ ......................... 8 2.3.4.3. Chỉ thị Barrier ................................ ................................ ........................ 8 2.3.4.4. Chỉ thị Atomic ................................ ................................ ........................ 8 2.4. Các mệnh đề trong OpenMP ................................ ................................ ............... 8 2.5. Thư viện và các biến môi trường ......................................................................... 9 2.5.1. Thư viện Runtime ....................................................................................... 9 2.5.2. Biến môi trường ................................ ................................ .......................... 9 CHƯƠNG 2: ỨNG DỤNG LẬP TRÌNH SONG SONG VÀO GIẢI QUYẾT BÀI TOÁN NHÂN MA TRẬN ................................ ................................ ................................ .............. 10 1. BÀI TOÁN NHÂN HAI MA TRẬN ................................ ................................ ................. 10 2. KẾT QUẢ THỰC HIỆN ................................ ................................ ................................ 10
Trang 1TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI
BÁO CÁO MÔN LẬP TRÌNH SONG SONG
Đề tài: ỨNG DỤNG LẬP TRÌNH SONG SONG VÀO GIẢI
QUYẾT BÀI TOÁN NHÂN MA TRẬN
Giảng viên giảng dạy : TS PHẠM DOÃN TĨNH
Học viên thực hiện :
1 PHẠM HOÀNG ANH – CB130528
2 NGUYỄN ĐĂNG HIẾU – CB130529
3 NGUYỄN VĂN LONG – CB130530 Lớp : 13BKTĐT.KH
Hà Nội, 02/2014
Trang 2MỤC LỤC
DANH MỤC BẢNG BIỂU 2
DANH MỤC HÌNH VẼ 2
LỜI NÓI ĐẦU 3
CHƯƠNG 1: TỔNG QUAN VỀ MÔ HÌNH LẬP TRÌNH SONG SONG VỚI OPEN MP 4
1 T ÍNH TOÁN SONG SONG 4
1.1 Tính toán song song là gì? 4
1.2 Tại sao phải tính toán song song? 4
2 G IỚI THIỆU VỀ O PEN MP 4
2.1 Khái niệm về OpenMP 4
2.2 Mô hình lập trình song song OpenMP 5
2.2.1 Song song hóa dựa trên cơ chế luồng (Thread based parallelism) 5
2.2.2 Mô hình song song hiện (Explicit Parallelism) 5
2.2.3 Mô hình Fork-Join 5
2.3 Chỉ thị trong OpenMP 6
2.3.1 Khuôn dạng chỉ thị 6
2.3.2 Phạm vi của chỉ thị: 6
2.3.3 Cấu trúc chia sẻ 7
2.3.3.1 Chỉ thị Do/For 7
2.3.3.2 Chỉ thị Sections 7
2.3.3.3 Chỉ thị Single 7
2.3.4 Cấu trúc đồng bộ dữ liệu 8
2.3.4.1 Chỉ thị master 8
2.3.4.2 Chỉ thị critical 8
2.3.4.3 Chỉ thị Barrier 8
2.3.4.4 Chỉ thị Atomic 8
2.4 Các mệnh đề trong OpenMP 8
2.5 Thư viện và các biến môi trường 9
2.5.1 Thư viện Runtime 9
2.5.2 Biến môi trường 9
CHƯƠNG 2: ỨNG DỤNG LẬP TRÌNH SONG SONG VÀO GIẢI QUYẾT BÀI TOÁN NHÂN MA TRẬN 10
1 B ÀI TOÁN NHÂN HAI MA TRẬN 10
2 K ẾT QUẢ THỰC HIỆN 10
KẾT LUẬN 14
TÀI LIỆU THAM KHẢO 14
Trang 3DANH MỤC BẢNG BIỂU
Bảng 1: Thời gian tính toán nhân hai ma trận không sử dụng OpenMP 10
Bảng 2: Thời gian tính toán nhân hai ma trận sử dụng OpenMP 11
Bảng 3: Tính toán Speed up và Efficiency dựa trên thời gian chạy trung bình 11
Bảng 4: Tính toán Speed up và Efficiency dựa trên thời gian chạy lâu nhất 11
DANH MỤC HÌNH VẼ Hình 1: Kiến trúc OpenMP 5
Hình 2: Mô hình Fork-Join 6
Hình 3:Biểu đồ so sánh thời gian tính toán trung bình 12
Hình 4:Biểu đồ so sánh thời gian tính toán lâu nhất 12
Hình 5:Biểu đồ Speed Up 13
Hình 6:Biểu đồ Efficiency 13
Trang 4LỜI NÓI ĐẦU
Ngày nay sự phát triển của công nghệ được thách thức bởi lớp bài toán lớn cần giải quyết trong nhiều lĩnh vực của đời sống xã hội như dự báo thời tiết, khai phá
dữ liệu, xử lý ảnh, mô phỏng tai nạn xe hơi, tự động hóa Lớp bài toán này vừa đòi hỏi đáp ứng thời gian thực vừa yêu cầu xử lý trên khối dữ liệu lớn Để giải quyết bài toán này đòi hỏi các bộ xử lý có hiệu năng cao
Xử lý song song ra đời với mục đích làm tăng khả năng tính toán của máy tính bằng cách kết hợp nhiều bộ xử lý tham gia đồng thời vào quá trình xử lý thay với việc sử dụng các máy tính chuyên biệt đắt tiền
Với sự phát triển của kiến trúc máy tính và mạng máy tính cho thấy rằng trong tương lai xử lý song song không những được thực hiện trên những siêu máy tính
mà có thể được thực hiện trên các trạm làm việc, máy tính cá nhân, mạng máy tính Nhưng hầu hết các thuật toán ngày nay đều là những thuật toán tuần tự Cho nên cần xây dựng những thuật toán, cấu trúc dữ liệu cho phép xử lý một cách song song
Trong khuôn khổ của bài tập này và yêu cầu của môn học, chúng em lựa chọn bài toán nhân hai ma trận có số lượng phần tử lớn được lập trình tuần tự và song song để đánh giá tốc độ xử lý và hiệu năng sử dụng Thông qua đó, chúng em có thể hiểu nhiều hơn nữa về môn học lập trình song song này
Nội dung của bài báo cáo này gồm các phần:
Chương 1: Tổng quan về mô hình lập trình song song với Open MP
Chương 2: Ứng dụng lập trình song song vào bài toán nhân hai ma trận Chúng em xin được gửi lời cảm ơn chân thành đến giảng viên TS Phạm Doãn Tĩnh đã tận tình giảng dạy và giúp đỡ chúng em trong thời gian học tập học phần này
Trang 5Chương 1: Tổng quan về mô hình lập trình song song với Open MP
1 Tính toán song song
Như chúng ta đã thấy các phần mềm phổ biến ngày nay hầu hết đều được viết trên cơ sở của tính toán tuần tự Các phần mềm này thường được thực hiện trên một máy tính đơn với duy nhất một bộ xử lý Vấn đề ở đây được giải quyết thông qua một chuỗi các lệnh tuần tự được thực hiện bởi một bộ xử lý Tại một thời điểm chỉ có một lệnh được thực hiện
Tính toán song song ra đời là một sự cải tiến của tính toán tuần tự Nó là sự giải quyết vấn đề dựa trên sự thực thi đồng thời của nhiều tài nguyên máy tính Tài nguyên máy tính đây bao gồm:
♣ Một máy tính đơn với nhiều bộ xử lý
♣ Nhiều máy tính nối lại với nhau thành một mạng máy tính
♣ Kết hợp cả hai loại trên
Tính toán song song thường được dùng để giải quyết các vấn đề hết sức phức tạp yêu cầu thời gian tính toán lớn hoặc làm việc với khối dữ liệu lớn như các bài toán dự báo thời tiết, mô phỏng tai nạn xe hơi, xây dựng các mô hình thương mại
và các vấn đề khoa học như khai phá dữ liệu , trí tuệ nhân tạo, an toàn dữ liệu…
Việc tính toán song song là rất cần thiết Ngoài hai nguyên nhân chính là nó được dùng để tính toán các bài toán yêu cầu thời gian tính toán lớn và khối lượng
dữ liệu lớn còn có các nguyên nhân khác như để sử dụng tài nguyên của các máy khác trong một mạng LAN hoặc thông qua mạng internet, có thể sử dụng nhiều tài nguyên tính toán nhỏ kết hợp lại tạo nên một siêu máy tính Do giới hạn về không gian lưu trữ của bộ nhớ trên một máy đơn để giải quyết một vấn đề lớn việc sử dụng nhiều bộ nhớ trên nhiều máy tính là rất hữu hiệu trong trường hợp này
Giới hạn của tính toán tuần tự bao gồm cả hai nguyên nhân thực tế và nguyên nhân vật lý Để xây dựng nên một máy tính tuần tự tốc độ cao gặp rất nhiều hạn chế
♣ Về tốc độ truyền dữ liệu: Tốc độ truyền của máy tính tuần tự phụ thuộc trực tiếp vào sự di chuyển dữ liệu trong phần cứng Cho nên việc tăng tốc độ thực hiện phải chủ yếu căn cứ vào các yếu tố tính toán
♣ Về kích cỡ: Công nghệ chế tạo bộ xử lý cho phép gắn nhiều bóng bán dẫn trên một con chip Tuy nhiên việc làm này sẽ làm tăng kích thước của bộ xử lý
♣ Về thương mại: Việc tạo ra một bộ xử lý tốc độ xử lý cao là rất tốn kém
Sử dụng nhiều bộ xử lý nhỏ đạt hiệu quả tương tự mà lại ít tốn kém hơn
2 Giới thiệu về OpenMP
Theo Wikipedia:
OpenMP (Open Multi-Processing) là một giao diện lập trình ứng dụng API (Application programming interface) hỗ trợ đa nền tảng dựa trên cấu trúc chia sẻ bộ
Trang 6nhớ chung, đa ngôn ngữ lập trình C, C++, Fortran và hầu hết các bộ kiến trúc vi xử
lý và hệ điều hành Linux, Unix, Mac OS X, nền tảng Microsoft Windows
Nó bao gồm :
Các chỉ thị biên dịch (Compiler directives)
Các thư viện Runtime (Library rountines)
Các biến môi trường (Environment variables)
Hình 1: Kiến trúc OpenMP
2.2.1 Song song hóa dựa trên cơ chế luồng (Thread based parallelism)
Trong mô hình trên chương trình xử lý trên bộ nhớ toàn cục bao gồm nhiều luồng thực thi đồng thời OpenMP dựa vào sự tồn tại của nhiều luồng trên một mô hình lập trình chia sẻ bộ nhớ chung
2.2.2 Mô hình song song hiện (Explicit Parallelism)
Mô hình trên là một mô hình lập trình không tự động Người lập trình có quyền điều khiển việc song song hóa một cách độc lập
2.2.3 Mô hình Fork-Join
Trong các mô hình trên thì OpenMP sử dụng mô hình Fork-Join để thực thi công việc song song
Trang 7Hình 2: Mô hình Fork-Join
Trong mô hình này tất cả các chương trình song song đều bắt đầu với việc xử lý đơn bởi một luồng chủ (master thread) Luồng chủ này sẽ thực thi một cách tuần tự cho tới khi bắt gặp vùng song song (parallel region) đầu tiên
FORK: Có nghĩa là luồng chủ sau đó sẽ tạo ra một tập các luồng song song
Và sau đó đoạn mã trong vùng song song được thực thi song song bởi tập luồng song song vừa tạo ra
JOIN: Khi mà tập luồng song song đã hoàn thành đoạn mã trong vùng song song chúng sẽ được đồng bộ và kết thúc rồi sau đó công việc lại được thực hiện bởi luồng chủ
2.3.1 Khuôn dạng chỉ thị
Chỉ thị trong OpenMP được cho dưới dạng sau:
# pragma omp directive-name [clause ] newline
# pragma omp: Yêu cầu bắt buộc đối với mọi chỉ thị OpenMP C/C++
directive-name: Là tên của chỉ thị phải xuất hiện sau #pragma omp và đứng trước bất kì mệnh đề nào
[clause ]: Các mệnh đề này không bắt buộc trong chỉ thị
newline : Yêu cầu bắt buộc với mỗi chỉ thị nó là tập mã lệnh nằm trong khối cấu trúc được bao bọc bởi chỉ thị
2.3.2 Phạm vi của chỉ thị:
Phạm vi tĩnh ( Static Extent ): Đó là những đoạn mã nguyên bản trong phạm vi từ đầu đến cuối khối cấu trúc cho sau mỗi chỉ thị Phạm vi tĩnh của chỉ thị không mở rộng đến các thủ tục và các tệp chứa mã
Chỉ thị đơn độc (Orphaned Directive): Chỉ thị đơn độc là chỉ thị xuất hiện độc lập với chỉ thị khác Nó tồn tại ở ngoài phạm vi tĩnh của chỉ thị khác Chỉ thị đơn độc mở rộng với các thử tục và các tệp mã nguồn
Phạm vi động (Dynamic Extent): Phạm vi động của chỉ thị bao gồm phạm vi tĩnh của của chỉ thị và phạm vi của các chỉ thị mồ côi
OpenMP có rất nhiều chỉ thị như: atomic, barrier, critical, flush, for, master, ordered, parallel, section, single, thread,private
Trang 8Các cấu trúc thường gặp :
Cấu trúc chia sẻ
Cấu trúc đồng bộ
2.3.3 Cấu trúc chia sẻ
Cấu trúc chia sẻ công việc dùng để chia việc thực hiện công việc trong vùng song song cho các luồng trong tập các luồng thực hiện công việc cho bởi vùng song song Cấu trúc chia sẻ công việc phải được bao bọc bởi một vùng song song để có thể thực hiện song song và cấu trúc này có thể được thực hiện bởi tất cả các luồng trong tập các luồng hoặc chỉ một số luồng trong tập các luồng thực thi vùng song song Có ba loại cấu trúc chia sẻ công việc đó là cấu trúc DO/for, cấu trúc SECTIONS và cấu trúc SINGLE
2.3.3.1 Chỉ thị Do/For
Chỉ thị DO/for chỉ ra rằng các công việc lặp đi lặp lại (interations) cho bởi vòng lặp phải được các luồng thực hiện một cách song song Chỉ thị for trong C/C++ được cho dưới dạng sau:
#pragma omp for [clause ] newline schedule ( type [,chunk_size] )
ordered
private ( list ) firstprivate ( list ) lastprivate ( list ) shared ( list ) reduction ( operator : list )
nowait
2.3.3.2 Chỉ thị Sections
Chỉ thị này dùng để chỉ ra các phần mã trong vùng song song chia cho các luồng thực hiện Trong phạm vi của chỉ thị SECTIONS có các chỉ thị SECTION Mỗi một SECTION sẽ được thực hiện bởi một luồng trong tập các luồng và các SECTION khác nhau sẽ được thực hiện bởi các luồng khác nhau Trong C/C++ chi thị SECTIONS được cho dưới dạng sau
#pragma omp sections [clause ] newline
private(list) firstprivate(list) lastprivate(list) reduction(operator:list)
nowait
2.3.3.3 Chỉ thị Single
Trang 9Mệnh đề SINGLE chỉ ra rằng đoạn mã bao quanh chỉ thị chỉ được thực hiện bởi một luồng trong tập các luồng Trong C/C++ chỉ thị SINGLE được cho dưới dạng sau:
#pragma omp single [clause ] newline
private(list) firstprivate(list)
nowait
2.3.4 Cấu trúc đồng bộ dữ liệu
2.3.4.1 Chỉ thị master
Trong chỉ thị master đoạn mã bao quanh chỉ thị chỉ được thực hiện bởi luồng chủ trong tập các luồng
Trong chỉ thị này không có bất cứ mệnh đề nào và các luồng khác không cần chờ đến khi luồng chủ thực hiện xong công việc cho bởi chỉ thị master mới được thực hiện công việc của mình
2.3.4.2 Chỉ thị critical
Trong chỉ thị Critical thì vùng mã được cho bởi chỉ thị tại một thời điểm chỉ được thực hiện tại một luồng
Nếu một luồng nào đó đang thực hiện công việc cho bởi chỉ thị mà có một luồng khác cố gắng đòi thực hiện công việc đó thì nó sẽ bị khóa cho đếnkhi luồng kia thực hiện xong công việc đó
Có thể tồn tại nhiều chỉ thị critical với các tên khác nhau trong cùng một vùng song song
2.3.4.3 Chỉ thị Barrier
Chỉ thị này dùng để đồng bộ tất cả các luông trong tập các luồng khi bắt gặp chỉ thị Barrier thì mỗi luồng sẽ chờ tại thời điểm đó(thời điểm bắt gặp chỉ thị Barrier) cho đến khi tất cả các luồng còn lại bắt gặp chỉ thị Barrier Sau đó các luồng sẽ cùng thực thi chỉ thị barrier
2.3.4.4 Chỉ thị Atomic
Trong chỉ thị Atomic các địa chỉ vùng nhớ được cập nhập một cách nguyên tố hơn là việc dùng nhiều luồng cố gắng ghi lên nó
Vì OpenMP lập trình trên máy tính chia sẻ bộ nhớ chung nên việc hiểu và sử dụng được phạm vi của các biến trong chương trình là rất quan trọng Phạm vi của các biến
ở đây bao gồm hai phạm vi toàn cục và phạm vi bảo vệ Các biến toàn cục bao gồm các biến tĩnh và biến file toàn cục còn các biến bảo vệ bao gồm biến chỉ số trong vòng lặp, biến trong thủ tục được gọi từ vùng song song Các mệnh đề về phạm vi dữ liệu bao gồm các mệnh đề sau
PRIVATE
FIRSTPRIVATE
Trang 10 LASTPRIVATE
SHARED
DEFAULT
REDUCTION
COPYIN
2.5.1 Thư viện Runtime
OpenMP cung cấp một thư viện với rất nhiều các hàm chức năng bao gồm các truy vấn liên quan đến số lượng và chỉ số các luồng, thiết lập số lượng các luồng sử dụng, semaphores, và các hàm thiết lập môi trường thực thi Trong C/C++ để có thể
sử dụng các hàm trên thì phải đính vào file thư viện omp.h
OMP_SET_NUM_THREADS
OMP_GET_NUM_THREADS
OMP_GET_MAX_THREADS
OMP_GET_THREAD_NUM
OMP_GET_NUM_PROCS
OMP_IN_PARALLEL
OMP_SET_DYNAMIC
OMP_GET_DYNAMIC
OMP_SET_NESTED
OMP_GET_NESTED
OMP_INIT_LOCK
OMP_SET_LOCK
OMP_UNSET_LOCK
OMP_TEST_LOCK
2.5.2 Biến môi trường
Các biến môi trường được dùng để điều khiển sự thực hiện đoạn mã song song Bao gồm các biến môi trường sau:
OMP_SCHEDULE
OMP_NUM_THREADS
OMP_DYNAMIC
OMP_NESTED
Trang 11Chương 2: Ứng dụng lập trình song song vào giải quyết bài toán nhân ma trận
1 Bài toán nhân hai ma trận
Cho hai ma trân A (m*n) và B(n*p):
Tích của hai ma trận C = A*B được thực hiện như sau:
Để so sánh sự khác biệt giữa lập trình tuần tự và lập trình song song, ta tiến hành nhân hai ma trận có cùng kích thước (N*N, với N lớn) Thông qua thời gian thực hiện ta thu được kết quả như dưới đây
2 Kết quả thực hiện
Các tham số sử dụng để đánh giá:
Hai ma trận vuông, có kích thước như nhau
Kích thước ma trận tăng dần từ 500 đến 4000, mỗi lần tăng 500
Mỗi lần kiểm tra được chạy 3 lần, lấy thời gian trung bình
Môi trường lập trình: Microsoft Visual Studio 2010
Chạy kiểm tra trên máy tính Core i5 2.27GHz, 4 core
Bảng 1: Thời gian tính toán nhân hai ma trận không sử dụng OpenMP
TT
Kích thước
ma trận
(NxN)
Thời gian chạy lần 1 (Giây)
Thời gian chạyLần 2 (Giây)
Thời gian chạy lần 3 (Giây)
Thời gian chạy trung bình (Giây)
Thời gian chạy lâu nhất (Giây)
2 1000x1000 23.276 22.704 22.679 22.886 23.276
3 1500x1500 73.431 72.957 72.593 72.994 73.431
4 2000x2000 168.976 173.586 149.34 163.967 173.586
5 2500x2500 347.531 352.504 346.597 348.877 352.504
6 3000x3000 650.096 730.219 744.628 708.314 744.628
7 3500x3500 1196.762 1072.1 1079.67 1116.177 1196.762
8 4000x4000 1277.624 1250.586 1260.405 1262.872 1277.624