.6 Phõn phối LA cho random20k với =4

Một phần của tài liệu thiết kế nhân ma trận thưa với véctơ trong tính toán song song và ứng dụng (Trang 90 - 91)

Ta thấy trong trường hợp này mỗi cột của ma trận đều cú nhiều nhất hai bộ xử lý trờn đú. Với cỏc cột cú hai bộ xử lý thỡ sẽ cú vấn đề về cận dưới địa phương. Ta hỡnh dung cỏc bộ xử lý là cỏc đỉnh và số cột xử lý bởi cả hai bộ xử lý như là cỏc cạnh kết nối giữa cỏc bộ xử lý. Ta thấy mỗi cạnh sẽ được xử lý với cựng số lần bởi mỗi đỉnh. Xem hỡnh (a), khi LA thực hiện, trước tiờn nú xem xột cỏc giỏ trị cận dưới địa phương L(s) và chọn bộ xử lý cú giỏ trị lớn nhất, chọn P0. Tiếp theo, hỡnh (b) sau khi phõn phối một số cạnh cho P0, P0 đó đạt đến cận dưới địa phương. Khi này bộ xử lý P1 cú L(s) cao nhất, và nú sẽ được chọn để xột. Trong hỡnh (c) P1 đó đạt được cận dưới địa phương của nú. Tiếp theo cỏc bộ xử lý P2, P3 luõn phiờn được phõn cho cỏc cột. Là luõn phiờn là bởi vỡ khi một bộ xử lý đạt được một cột, thỡ giỏ trị L(s) của bộ xử lý kia lại tăng lờn, thờm nữa cú quỏ ớt cột cho phộp cả hai đạt được L(s) hiện thời. Tuy nhiờn như hỡnh (d) vẫn cũn cỏc cạnh kết nối giữa P0 và P1, trong khi cả hai bộ xử lý này lại khụng muốn sở hữu thờm một cột nào nữa vỡ chỳng đó đại đến cận dưới của chỳng. Điều này, LA thực hiện chọn một cỏch ngẫu nhiờn cỏc cạnh cho hai bộ xử lý. Vỡ điều này ta thấy tất cả cỏc cạnh giữa P0 và P1 đều được phõn cho P1, và như vậy L(0) và L(1) đều tăng lờn. Do đú max(Nsend, Nreceive)

tăng lờn. Một lý do nữa ta thấy, cỏc bộ xử lý P2P3 mỗi cỏi cần khoảng 2500 cạnh để đạt tới biờn địa phương của chỳng, nhưng lại chỉ cú khảng 4349 cho cả hai, hỡnh (c). Bởi vậy L(2) và L(3) cũng sẽ tăng lờn và do đú làm tăng max(Nsend, Nreceive).

Xem lại cỏc bảng kết quả, cho thấy LA hầu hết là tốt, lý giải cho điều này ta xem lại bảng 3.2, trường hợp P = 4, cú phõn phối như sau:

Một phần của tài liệu thiết kế nhân ma trận thưa với véctơ trong tính toán song song và ứng dụng (Trang 90 - 91)