.6 Phân phối LA cho random20k với =4

Một phần của tài liệu (LUẬN văn THẠC sĩ) thiết kế nhân ma trận thưa với véctơ trong tính toán song song và ứng dụng luận văn ths toán học 60 46 35 (Trang 90 - 91)

Ta thấy trong trường hợp này mỗi cột của ma trận đều có nhiều nhất hai bộ xử lý trên đó. Với các cột có hai bộ xử lý thì sẽ có vấn đề về cận dưới địa phương. Ta hình dung các bộ xử lý là các đỉnh và số cột xử lý bởi cả hai bộ xử lý như là các cạnh kết nối giữa các bộ xử lý. Ta thấy mỗi cạnh sẽ được xử lý với cùng số lần bởi mỗi đỉnh. Xem hình (a), khi LA thực hiện, trước tiên nó xem xét các giá trị cận dưới địa phương L(s) và chọn bộ xử lý có giá trị lớn nhất, chọn P0. Tiếp theo, hình (b) sau khi phân phối một số cạnh cho P0, P0 đã đạt đến cận dưới địa phương. Khi này bộ xử lý P1 có L(s) cao nhất, và nó sẽ được chọn để xét. Trong hình (c) P1 đã đạt được cận dưới địa phương của nó. Tiếp theo các bộ xử lý P2, P3 luân phiên được phân cho các cột. Là luân phiên là bởi vì khi một bộ xử lý đạt được một cột, thì giá trị L(s) của bộ xử lý kia lại tăng lên, thêm nữa có q ít cột cho phép cả hai đạt được L(s) hiện thời. Tuy nhiên như hình (d) vẫn cịn các cạnh kết nối giữa P0 và P1, trong khi cả hai bộ xử lý này lại không muốn sở hữu thêm một cột nào nữa vì chúng đã đại đến cận dưới của chúng. Điều này, LA thực hiện chọn một cách ngẫu nhiên các cạnh cho hai bộ xử lý. Vì điều này ta thấy tất cả các cạnh giữa P0 và P1 đều được phân cho P1, và như vậy L(0) và L(1) đều tăng lên. Do đó max(Nsend, Nreceive)

tăng lên. Một lý do nữa ta thấy, các bộ xử lý P2P3 mỗi cái cần khoảng 2500 cạnh để đạt tới biên địa phương của chúng, nhưng lại chỉ có khảng 4349 cho cả hai, hình (c). Bởi vậy L(2) và L(3) cũng sẽ tăng lên và do đó làm tăng max(Nsend, Nreceive).

Xem lại các bảng kết quả, cho thấy LA hầu hết là tốt, lý giải cho điều này ta xem lại bảng 3.2, trường hợp P = 4, có phân phối như sau:

Một phần của tài liệu (LUẬN văn THẠC sĩ) thiết kế nhân ma trận thưa với véctơ trong tính toán song song và ứng dụng luận văn ths toán học 60 46 35 (Trang 90 - 91)