Phương pháp chỉnh lặp Gauss-Newton và phương pháp chỉnh lặp Gauss

Một phần của tài liệu Giải hệ phương trình kích thước lớn và điều kiện xấu trên bó máy tính (Trang 89 - 93)

phương pháp chỉnh lặp Gauss-Newton tuần tự (IRGNM).

Các kết quả trong chương này được công bố trong [4], (xem Danh mục các công trình khoa học của tác giả liên quan đến luận án).

3.1 Phương pháp chỉnh lặp Gauss-Newton và phươngpháp chỉnh lặp Gauss -Newton song song pháp chỉnh lặp Gauss -Newton song song

Nhiều bài toán xác định tham số dẫn đến hệ phương trình toán tử:

Fi(x) =yi, 1≤i≤N, (3.2)

trong đó Fi, 1≤ i ≤N, là các toán tử phi tuyến từ không gian Hilbert X của tham số cần xác định x vào không gian HilbertYi của các đại lượng quan sát yi, i=1, . . . ,N. Trong trường hợp dữ liệu có sai số yδ

i với kyδ

i −ykYi ≤δ, ta có hệ chịu nhiễu

Fi(x) =yδ

i , 1≤i≤N. (3.3)

Dễ thấy hệ (3.2) và (3.3) có thể viết lại dưới dạng phương trình toán tử trong không gian tích F(x) =y, (3.4) và F(x) =yδ, (3.5) trong đó F :X →Y =Y1×Y2×...×YN, F(x) = (F1(x), ...,FN(x)), và y= (y1, ...,yN), yδ = (yδ1, ...,yδN).

Cho u= (u1, ...,uN)∈Y và v= (v1, ...,vN)∈Y. Khi đó tích vô hướng và chuẩn trongY được định nghĩa như sau:

hu,viY = N ∑ i=1 hui,viiYi còn kukY = ( N ∑ i=1 kuik2Y i)12.

Một trong các phương pháp hiệu chỉnh giải hiệu quả bài toán đặt không chỉnh phi tuyến là phương pháp chỉnh lặp Gauss-Newton (IRGNM), được Bakushin- skii đề xuất năm 1992 trong [16]

xδn+1=xδn−(F0(xnδ)∗F0(xδn) +αnI−1 F0(xδn)∗(F(xδn)−yδ) +αn(xδn−x0). (3.6) Chúng ta giả thiết rằng:

Giả thiết 3.1. Hệ (3.4) có một nghiệm đúng x† ∈ Br(x0) với Br(x0) = {x ∈ X :

kx−x0k ≤r} và F có các đạo hàm liên tục trong hình cầu B2r(x0) với r>0 đủ lớn.

Giả thiết 3.2. Điều kiện nguồn sau đây [25, 70] thỏa mãn

x†−x0= (F(x†)∗F(x†))µv, (3.7)

với0<µ ≤1vàv∈X. Hơn nữa, giả sử:

i. Nếu 0<µ ≤ 1

2, thì đạo hàm FréchetF0 thỏa mãn các điều kiện sau 1. F0(xe) =R(ex,x)F0(x) +Q(ex,x),

2. kI−R(ex,x)k ≤cR,

3. kQ(ex,x)k ≤cQkF0(x†)(ex−x)k,

với mọiex,xthuộcB2r(x0), trong đócR vàcQ là các hằng số dương. ii. Nếu 1

2 <µ ≤1, thì Fi0 là liên tục Lipschitz

kFi0(x)−Fi0(ex)k ≤Lkx−xek, 1≤i≤N, (3.8)

với mọix,exthuộcB2r(x0).

iii. Các tham số αn được chọn sao cho:

αn >0,αn→0 và 1≤ αn

αn+1

Nếu Giả thiết 3.1 và 3.2 thỏa mãn thì với chỉ số dừngN∗ được chọn là số nguyên dươngnnhỏ nhất thỏa mãn điều kiện η αµ+

1 2 n ≤δ, nghĩa là η αµ+ 1 2 N∗ ≤δ <η αµ+ 1 2 n , 0≤n<N∗. (3.9)

Ta thu được kết quả sau về tốc độ hội tụ của phương pháp IRGNM [22, 54]:

kxδ N∗−x†k=        o(1), µ =0, O(δ 2µ 2µ+1), 0<µ ≤1.

Trong trường hợp dữ liệu chính xác(δ =0,η =0)ta nhận được

kxN−x†k=        o(αNµ), 0≤µ <1, O(αN), µ =1.

Như chúng ta đã biết, tốc độ hội tụ của nghiệm hiệu chỉnhxδ

n vềx† trong trường hợp tổng quát có thể chậm tùy ý. Để đánh giá được tốc độ hội tụxδ

n →x† ta cần một số điều kiện bổ sung. Một dạng điều kiện (3.11) được thiết lập dựa trên tính trơn của nghiệm gọi là điều kiện "nguồn". Nhiều tác giả như Hohage [52], Deuflhard [36], Jin Quinia [53] và các nhà toán học khác [41,76] đã nghiên cứu về sự hội tụ của phương pháp IRGNM dựa trên điều kiện nguồn.

Gần đây phương pháp IRGN-Kaczmarz được Burger và Kaltenbacher đề xuất [25]. Ý tưởng chính của phương pháp này là phân rã bài toán không chỉnh ban đầu thành một số hữu hạn các bài toán con, và thực hiện giải xoay vòng các bài toán con này bằng phương pháp chỉnh lặp Gauss-Newton. Như vậy, thay vì giải một bài toán lớn trên mỗi bước lặp, ta giải một số bài toán nhỏ hơn và điều này làm đơn giản hóa quá trình tính toán. Ngoài ra các điều kiện đặt lên toán tử phi tuyến có thể được giảm nhẹ. Tuy vậy, khi số lượng các phương trình lớn, phương pháp kiểu Kaczmarz tỏ ra không hiệu quả trên siêu máy tính vì tại mỗi thời điểm chỉ sử dụng một bộ xử lý. Cùng với những thành tựu gần đây trong việc thiết kế phần cứng máy tính, các nhà khoa học có thể dễ dàng tiếp cận các cụm tính toán hiệu năng cao, hoặc tối thiểu với các máy tính cá nhân với các bộ xử lý đa lõi. Do đó, việc xây dựng các phương pháp song song hiệu quả để giải hệ phương trình phi tuyến được các nhà khoa học và công nghệ đặc biệt quan tâm. Theo xu hướng phát triển trên, một số phương pháp song song giải bài toán đặt không chỉnh đối với toán tử đơn điệu đã được nghiên cứu [7, 9].

Trong chương này chúng tôi đề xuất một phiên bản song song của phương pháp chỉnh lặp Gauss-Newton (IRGNM) cho hệ các phương trình toán tử đặt không chỉnh (3.2).

Sau đây ta luôn giả thiết rằng:

Hệ (3.2) có nghiệm x† không phụ thuộc liên tục vào vế phải y. Khi đó bài toán (3.2) nói chung đặt không chỉnh. Các toán tửFi, 1≤i≤N, khả vi liên tục theo Fréchet trong một tập mở chứax† vàx0 là một xấp xỉ ban đầu củax†.

Gọi xδ

n là nghiệm xấp xỉ thứ n của x†. Theo phương pháp chỉnh lặp Gauss- Newton (IRGNM), với mỗi n cố định ta tuyến tính hóa phiếm hàm làm trơn Tikhonov Jδ n :=kF(x)−yδkY2+αnkx−x0k2 = N ∑ i=1 kFi(x)−yδ i k2Y i+αnkx−x0k2 trong lân cậnxδ

n và xét bài toán tối ưu không ràng buộc, trong đó Fi0(xδ

n)là đạo hàm theo nghĩa Fréchet củaFi(x)tại điểm xδ

n Φδn(∆x):= N ∑ i=1 kFi(xnδ)−yδi +Fi0(xδn)∆xkY2 i+ N ∑ i=1 kxδn −x0+∆xk2→ min ∆x∈X. Tìm∆xtừ phương trình ∂Φδn ∂(∆x) =0và xác định xấp xỉ tiếp theoxδ n+1 =xδ n+∆xhay xδ n+1=xδ n− N ∑ i=1 Fi0(xδ n)∗Fi0(xδ n) +αnI−1 N ∑ i=1 Fi0(xδ n)∗(Fi(xδ n)−yδ i ) +αn(xδ n −x0). (3.10) Tuy nhiên, trong một số trường hợp tính toán sẽ hiệu quả hơn nhiều khi ta áp dụng IRGNM một cách đồng bộ cho các bài toán con (3.3).

xδn+1,i=xδn−(Fi0(xδn)∗Fi0(xδn) +βnI)−1 Fi0(xδn)∗(Fi(xδn)−yδi ) +βn(xnδ −x0i), (3.11) i=1, . . . ,N, vớiβn:=αn/N và định nghĩa xấp xỉ tiếp theo bằng trung bình cộng của các xấp xỉ trung gianxδ

n+1,i xδ n+1= 1 N N ∑ i=1 xδ n+1,i. (3.12)

Rõ ràng, (3.11) bao gồm đúng một bước lặp IRGNM áp dụng cho mỗi bài toán con (3.3). Tuy vậy, sự hội tụ của của phương pháp PIRGNM (3.11)-(3.12) không suy ra được từ sự hội tụ của phương pháp tuần tự IRGNM (3.10).

Điểm khác biệt giữa phương pháp tuần tự IRGNM (3.10) và phương pháp PIRGNM (3.11) - (3.12) chính là, việc tính toán các bước trung gian xδ

n+1,i là hoàn toàn độc lập và có thể được tính toán một cách đồng thời trênN bộ xử lý. Ngoài ra, việc tính toán ma trận(Fi0(xδ

n)∗Fi0(xδ

n) +βnI)−1 đôi khi dễ dàng hơn rất nhiều so với tính toán ma trận ∑N

i=1

Fi0(xδ

n)∗Fi0(xδ

n) +αnI−1. Phần tiếp theo ta xét điều kiện dừng và sự hội tụ của phương pháp PIRGNM.

Một phần của tài liệu Giải hệ phương trình kích thước lớn và điều kiện xấu trên bó máy tính (Trang 89 - 93)