η =0.4
δ REN IRGNM PIRGNM
nmin Ts nmin Ts e−4 11 24 3 0.71 e−6 e−5 15 33 6 1.4 e−6 18 40 9 2.08 e−4 11 24 3 0.71 e−7 e−5 15 33 6 1.4 e−6 18 40 9 2.08
Bảng 3.5: Chỉ số dừng của phương pháp PIRGNM vớiη =0.02.m δ Nδ REN REN/δ2/3 m δ Nδ REN REN/δ2/3 e-5 3 4.5e-5 0.096 e-6 5 1.1e-5 0.112 105 e-7 8 1.4e-6 0.065 e-8 10 3.5e-7 0.07 e-9 12 8.6e-8 0.08
3.4 Hệ phương trình có cấu trúc thưa
Xét hệ phương trình phi tuyến F1(x1,x2) =y1 Fi(xi−1,xi,xi+1) =yi, i=2, . . . ,N−1 FN(xN−1,xN) =yN, (3.30)
trong đó các hàmFi:RN →Rđược giả thiết là có đạo hàm riêng liên tục.
Hệ (3.30) xuất hiện một cách tự nhiên khi ta sử dụng phương pháp sai phân hữu hạn để giải bài toán biên hai điểm:
f(t,x,x0,x00) =0, với t0<t <T, g(x(t0),x0(t0)) =0, h(x(T),x0(T)) =0. Nếu hệ (3.30) có nghiệm x† với ma trận Jacobi F0(x†) suy biến, thì phương pháp Newton và các phiên bản song song của nó ( [57, 86]) có thể không hội tụ. Vì vậy ta cần sử dụng phương pháp IRGNM. Tuy nhiên khi số phương trình N khá lớn còn tham số hiệu chỉnh αn đủ nhỏ, trên mỗi bước lặp, ta phải giải hệ 5 đường chéo, điều kiện xấu. Mặt khác, sử dụng PIRGNM chỉ dẫn đếnN hệ phương trình tuyến tính kích thước2×2hoặc3×3.
Để thử nghiệm, ta xét F1(x) =x21+x22+x1x2, F2(x) = 12x12+12x22−x23+x1x2+x1x3+x2x3, Fi(x) =x2i−1+xi2+x2i+1+xi−1xi+xi−1xi+1+xixi+1, 3≤i≤N−1, FN(x) =x2N−1+x2N+xN−1xN, (3.31)
với vế phải yi =y¯i+ηi, i=1,2, . . . ,N, trong đó y¯i =3 nếu i=1,2,N, và y¯i =6
trong các trường hợp còn lại.ηilà những đại lượng ngẫu nhiên có phân bố chuẩn với kỳ vọng bằng 0 và độ lệch chuẩn được chọn sao chokηk ≤δ.
Dễ thấy trong trường hợp này nghiệm đúng x† = (1,1, . . . ,1)T và ma trận JacobianF0(x†)suy biến do có hai hàng đầu bằng(3,3,0, . . . ,0).
số mũµ =1được thỏa mãn cho các phần tử sau:
x01=x02= (1−18ε,1−18ε,1, . . . ,1)T, v1=v2= (ε,ε,0, . . . ,0)T,
xi0= (1, . . . ,1,1−48ε,1−48ε,1−48ε,1, . . . ,1)T, vi= (0, . . . ,0,ε,ε,ε,0, . . . ,0)T, với3≤i≤N−1,
x0N= (1, . . . ,1,1−18ε,1−18ε)T, vN= (0, . . . ,0,ε,ε)T,
trong đóε là tham số bé. Ngoài ra ta chọn xấp xỉ ban đầux0= (1−ε,1. . . ,1)T đủ gầnx†= (1, . . . ,1)T. Cuối cùng, để ý rằng các đạo hàmFi0(x)liên tục Lipschitz , ta đi đến kết luận rằng cả hai Giả thiết 3.3 và 3.4 đều thỏa mãn.
Sau đây ta sẽ so sánh phương pháp IRGNM và phương án song song PIRGNM của nó. Theo (3.17) phương pháp PIRGNM và phương pháp IRGNM có cùng tốc độ hội tụ [22, 54]. Tuy nhiên, trên mỗi bước lặp, phương pháp IRGNM đòi hỏi phải giải hệ 5 đường chéo kích thướcN×N. Hệ này trở thành hệ điều kiện xấu khiN lớn và tham số hiệu chỉnh αn đủ bé. Do ma trận của hệ là đối xứng, xác định dương và rất thưa, nên hệ phương trình tuyến tính này có thể giải hiệu quả bằng phương pháp khai triển Cholesky. Trong khi đó tất cả các thành phần xn+1,idễ dàng tính được đồng thời theo (3.17) bằng các bộ xử lý song song. Trên mỗi bước, ta chỉ phải giải m hệ phương trình tuyến tính kích thước 2×2 hoặc
3×3với ma trận đối xứng xác định dương.
Trong thử nghiệm đầu, chúng tôi chọn N = 105, αn = 0.75n và so sánh phương pháp PIRGNM với phương pháp IRGNM trong chế độ tuần tự. Chúng tôi cố định số bước lặp và so sánh độ chính xác cũng như thời gian tính toán.
Kết quả tính toán cho thấy, trong cả chế độ tuần tự, phương pháp PIRGNM cũng chính xác hơn và chạy nhanh hơn phương pháp IRGNM. Hơn nữa, phương pháp PIRGNM ít nhạy cảm với nhiễu vế phải hơn IRGNM.
Cuối cùng, trong thử nghiệm tiếp theo, chúng tôi lấy N =105, αn=0.75n
và so sánh phương pháp PIRGNM trong cả hai chế độ tuần tự và song song. Hệ số tăng tốc Sp =Ts/Tp đo bằng tỷ số giữa thời gian chạy trên chế độ tuần tự và thời gian chạy ở chế độ song song. Tính hiệu quả của phương pháp song song được cho bởi đại lượng Ep =Sp/p, trong đó p là số bộ xử lý. Thử nghiệm cho thấy S2=1.76,E2 =0.88 và S4 =2.84,E4=0.7. Điều này chứng tỏ phương pháp PIRGNM khá hiệu quả.