Sự hội tụ của thuật toán giảm nhanh tìm cực tiểu toàn cục phiếm hàm Tikhonov đối với phương trìnhtoán tử song tuyến tính.. 613.1 Bài toán tìm cực tiểu toàn cục của phươngtrình song tuyến
Các kiến thức cơ sở
Một số tính chất của toán tử tuyến tính liên tục
Định nghĩa 1.1.1 [2] Nếu X, Y là hai không gian Hilbert và
A: X → Y là một toán tử tuyến tính liên tục của X vào Y, thì toán tử liên hợp A ∗ của A :
A ∗ :Y → X là một ánh xạ tuyến tính liên tục của Y vào X, xác định bởi công thức
- Cho X, Y là hai không gian Hilbert và A :X →Y là một toán tử tuyến tính liên tục Khi đó toán tử liên hợp của A ∗ , kí hiệuA ∗∗ : X →Y và A ∗∗ = A.
- Cho A : X → Y là một toán tử liên tục từ không gian Hilbert X vào không gian Hilbert Y, ta kí hiệu
Khi đó, N(A) là không gian con đóng của X và R(A) là không gian con của Y. Định nghĩa 1.1.3.[2] Giả sử A là một toán tử tuyến tính liên tục từ không gian Hillbert X vào không gian Hilbert Y Khi đó, ta có i) R(A) ⊥ = N(A ∗ ) và N(A) ⊥ = R(A ∗ ). ii) X = N(A)⊕R(A ∗ ) và Y = N(A ∗ )⊕R(A).
Tập lồi - hàm lồi
Cho X là không gian Hilbert trên trường thực Tập A⊂ X được gọi là tập lồi nếu
Cho X là không gian Hilbert thực Hàm f : X → R được gọi là lồi nếu ∀x, y ∈ X,∀λ ∈ [0,1], ta có f[λx + (1−λ)y] ≤ λf(x) + (1−λ)f(y). Định lý 1.2.2 [5]
Cho A ⊂R là tập lồi và hàm f : A →R khả vi cấp hai trên A Khi đó f là hàm lồi nếu và chỉ nếu f 00 (x) ≥ 0, ∀x ∈ A
Đạo hàm Fréchet
Định nghĩa 1.3.1 [5]Cho X,Y là các không gian định chuẩn trên trường số K và D là một tập mở khác rỗng trong X Một ánh xạ (có thể không tuyến tính)f : D →Y được gọi là khả vi Fréchet tại x 0 ∈ D nếu tồn tại một toán tử tuyến tính liên tục A ∈ L(X, Y) (phụ thuộc vào x 0 ) sao cho: h→0lim kf(x 0 + h)−f(x 0 )−Ahk khk = 0
Khi đó, ta goi A là đạo hàm Fréchet của f tại x 0 , kí hiệu là A f 0 (x0).
Nhận xét 1.3.2 - Đạo hàm Fréchet của f nếu có là duy nhất.
- Nếu X là không gian Hilbert và f : X → R là khả vi Fréchet tại x 0 ∈ X thì f 0 (x 0 ) là hàm tuyến tính liên tục trên X Do đó theo định lí Riez, tồn tại duy nhất vector trong X, được kí hiệu bởi ∇f(x 0 ) gọi là gradient của f tại x0, thỏa mãn f 0 (x 0 )h = hh,∇f(x 0 )i, ∀h ∈ X. Định nghĩa 1.3.3 [5] Cho f : X → R, x 0 ∈ X, và 0 6= h ∈ X. Đạo hàm theo phương h của f tại x 0 là df(x0, h) = lim t→0 + f(x 0 +th)−f(x 0 ) t
Nhận xét 1.3.4 Nếu f : X → R khả vi Fréchet tại x 0 thì f có đạo hàm theo mọi hướng tại x 0 Thật vậy, f khả vi Fréchet tại x 0 suy ra
∀0 6= h ∈ X ta có f(x 0 +th)−f(x 0 ) = f 0 (x 0 )th+r(x 0 , th). r(x 0 , th) là vector thỏa t→0lim + kr(x 0 , th)k kthk = 0.
Do đó df(x 0 , h) = lim t→0 + f(x0 + th)−f(x0) t = lim t→0 + f 0 (x0)th+r(x0, th) t
Vậy f có đạo hàm theo mọi phương tại x 0 Bổ đề 1.3.5 Cho X là không gian Hilbert thực và f : X → R là một phiếm hàm xác định bởi f(u) = kuk 2 Khi đó f 0 (u)(v) = 2hv, ui.
Nhận xét 1.3.6 Nếu X, Y là hai không gian Hilbert phức và f : X → R là một phiếm hàm xác định bởi f(u) =kuk 2 Khi đó f 0 (u)(v) =hv, ui+hu, vi.
Từ bổ đề này ta dễ dàng suy ra các kết quả sau đây.
Bổ đề 1.3.7 Với các giả thiết như Bổ đề 1.3.5 và F là toán tử tuyến tính liên tục Khi đó ta có i) Nếu f(u) =kF uk 2 thì f 0 (u)(v) = 2hF ∗ F u, vi. ii) Nếu f(u) =kF u−yk 2 thì f 0 (u)(v) = 2hF ∗ F u−F ∗ y, vi. iii) Nếu f(u) = kF u−yk 2 + αkuk 2 thì f 0 (u)(v) 2hF ∗ F u−F ∗ y +αu, vi.
Bài toán đặt chỉnh, bài toán đặt không chỉnh 7
tìm nghiệm của phương trình
F x = y, (1.1) được gọi là đặt chỉnh (theo nghĩa Hadamard) nếu thõa mãn các điều kiện sau đây: i) Với mỗi y ∈ Y, tồn tại x ∈ X sao cho F x= y. ii) Với mỗi y ∈ Y, có duy nhất x ∈ X sao cho F x = y. iii) Bài toán tìm nghiệm của (1.1) là ổn định, tức là toán tử F tồn tại toán tử ngược F −1 : Y →X liên tục trên Y.
Nếu có ít nhất một trong ba điều kiện trên bị vi phạm thì ta nói bài toán tìm nghiệm của phương trình trên là đặt không chỉnh Đặc biệt,chỉ có điều kiện iii) không thõa mãn thì ta nói bài toán tìm nghiệm của phương trình trên là không ổn định.
Toán tử ngược More - Penrose
F x = y (1.2) với F là toán tử tuyến tính liên tục từ không gian Hilbert X vào không gian Hilbert Y và y ∈ Y cho trước.
Nếu tồn tại toán tử ngược F −1 thì nghiệm của phương trình (1.2) là x = F −1 y.
Nếu F không khả nghịch, ta xét F¯ := F| N (F ) ⊥ : N(F) ⊥ → R(F).
Khi đó, F¯ là song ánh tuyến tính liên tục từ N(F) ⊥ lên R(F) Do đó tồn tại toán tử ngược
Từ nhận xét trên ta có định nghĩa sau đây: Định nghĩa 1.5.1 [3] Toán tử ngược More – Penrose F + của F ∈ L(X, Y) được định nghĩa là mở rộng tuyến tính duy nhất của F¯ −1 trên
- Định nghĩa trên là hợp lí, vì N( ¯F) = {0} và R( ¯F) = R(F) nên F¯ −1 tồn tại Mặt khác, vì N(F + ) = R(F) ⊥ nên với mọi y ∈ D(F + ) thì y có biểu diễn duy nhất dưới dạng y = y 1 + y 2 , y 1 ∈ R(F), y 2 ∈ R(F) ⊥
- Toán tử ngược Moore – Penrose là khái niệm mở rộng của toán tử ngược thông thường. Định nghĩa 1.5.3 [3]Cho F : X → Y là toán tử tuyến tính bị chặn.
(i) x ∈ X được gọi là nghiệm bình phương tối tiểu của (1.2) nếu kF x−yk = inf{ kF z −yk |z ∈ X}.
(ii) x ∈ X được gọi là nghiệm xấp xỉ tốt nhất của (1.2) nếu x là nghiệm bình phương tối tiểu cuả (1.2) và kxk= inf{ kzk| z là nghiệm bình phương tối tiểu của (1.2)}.
Nhận xét 1.5.4 - Nếu phương trình (1.2) có nghiệm thì nghiệm đó chính là nghiệm bình phương tối tiểu Do đó, khái niệm nghiệm bình phương tối tiểu là khái niệm mở rộng của khái niệm nghiệm thông thường.
- Nói chung nghiệm bình phương tối tiểu của (1.2) là không tồn tại.
Nếu tồn tại thì chưa chắc duy nhất (vì không gian Hilbert là không gian phản xạ lồi chặt). Định lý 1.5.5 [3] Giả sử P và Q là phép chiếu trực giao lên N(F) và R(F) Khi đó R(F + ) = N(F) ⊥ và
(i) F F + = Q| D(F + ) (ii) F + F = I −P. (iii) F F + F = F. (iv) F + F F + = F + Chứng minh Từ định nghĩa của F + ta có, với mọi y = y 1 + y 2 ∈ D(F + ), trong đó y 1 ∈ R(F), y 2 ∈ R(F) ⊥ thì
Mặt khác, với mọi x ∈ N(F) ⊥ , ta có F + F x = ¯F −1 F x¯ = x Suy ra R(F + ) =N(F) ⊥
(i) Với mọi y ∈ D(F + ) từ (1.3) ta có
Vì Qy ∈ R(F) nên F¯ −1 Qy ∈ N(F) ⊥ Do đó
Vậy F F + = Q| D(F + ) (ii) Với mọi x ∈ X, ta có x = P x+ (1−P)x Vì P là phép chiếu trực giao từ X lên N(F) nên (I−P)x ∈ N(F) ⊥ Suy ra F(I−P)x = ¯F(I− P)x Mặt khác, vì P(x) ∈ N(F) nên F P x = 0 Suy ra F¯ −1 F P x = 0.
Từ định nghĩa của F + và kết quả trên, ta có
Vậy F + F = I −P. (iii) Với mọix ∈ X từ (ii) ta có F F + F x = F(I−P)x = F x−F P x F x Từ đó suy ra F F + F = F.
(iv) Với mọi y ∈ D(F + ) từ (1.3) và (i), ta có
Suy ra F + F F + = F + Định lý 1.5.6 [3] Cho F là toán tử tuyến tính liên tục từ không gian HilbertX vào không gian HilbertY Toán tử ngược More - Penrose
F + có đồ thị gr(F + ) đóng Hơn nữa, F + bị chặn nếu và chỉ nếu R(F) đóng trong Y.
Chứng minh Đầu tiên ta chứng minh
Lấy y 1 ∈ R(F), x := F −1 y 1 Theo định nghĩa của F, suy ra x ∈ N(F) ⊥ , F x = F F + y 1 = F F −1 y 1 = F F −1 y 1 = y 1 Do đó (y1, F −1 y1) = (F x, x) ∈ Y ×N(F) ⊥
Theo định nghĩa của F + : D(F + ) → N(F) ⊥ , với D(F + ) = R(F) ⊕ R(F) ⊥ ta có đồ thị của F + :
Do (1.4) ta có gr(F + ) = [{(Fx,x)|x ∈ X} ∩(Y×N(F) ⊥ )] + [R(F) ⊥ × {0}].
Do F liên tục nên [{(Fx,x)|x ∈ X} ∩(Y ×N(F) ⊥ )] và R(F) ⊥ × {0} là hai không gian con đóng và trực giao của Y⊥X. Do đó Gr(F + ) là không gian con đóng của Y ×X Suy ra F + có đồ thị đóng.
Giả sử R(F) đóng trong Y, khi đó D(F + ) =Y Hơn nữa, do F + có đồ thị đóng nên F + là liên tục.
Ngược lại, giả sử F + : D(F + ) →N(F) ⊥ là liên tục, khi đóD(F + ) R(F) ⊕ R(F) ⊥ = R(F) ⊕ R(F) ⊥ trù mật trong Y Do đó tồn tại duy nhất mở rộng liên tục F + trên Y sao cho F + | D(F + ) = F + Từ F F + = Q| D(F + ) và tính liên tục của f suy ra F F + = Q Do đó,
∀y ∈ R(F), y = Qy = F F + y ∈ R(F) Suy ra R(F) =R(F). Định lý 1.5.7 [5] Giả sử F là toán tử tuyến tính bị chặn từ không gian Hilbert X vào không gian Hilbert Y với y ∈ Y và Q là phép chiếu trực giao từ Y lên R(F) Khi đó với x ∈ X các điều kiện sau là tương đương i) F x = Qy ii) F ∗ F x= F ∗ y iii) kF x−yk ≤ kF z −yk,∀z ∈ X
. ii) ⇔ iii) Với mọi x, z ∈ X ta có hF z −F x, F x−yi+hF x−y, F z −F xi = 2RehF x−y, F(z−x)i.
Do đó kF z −yk 2 − kF x−yk 2 = kF(z−x)k 2 +hF z −F x, F x−yi
(1.5) ii) ⇒ iii) Giả sử F ∗ F x = F ∗ y Từ (1.5) suy ra kF z −yk 2 ≥ kF x−yk 2
Hay kF z −yk ≥ kF x−yk,∀z ∈ X. iii) ⇒ ii) Từ (1.5), suy ra kF(z−x)k 2 + 2RehF ∗ (F x−y), z −xi ≥ 0,∀z ∈ X (1.6)
Lấy z = x+tu, t∈ R thay vào (1.6) ta được
Suy ra tkF uk 2 + 2RehF ∗ (F x−y), ui ≥ 0,∀t > 0,∀u ∈ X (1.7) Trong (1.7) cho t →0 + ta được
Nhận xét 1.5.8 Từ (i) của định lí trên ta nhận thấy nghiệm bình phương tối tiểu của phương trình (1.2) tồn tại nếu và chỉ nếu Qy ∈ R(F) Điều này tương đương với y ∈ D(F + ) =R(F)⊕R(F) ⊥
Thật vậy, vì R(F)⊕R(F) ⊥ là không gian con trù mật trong Y, nên nếu Qy ∈ R(F) thì y = Qy−(I −Q)y ∈ R(F)⊕R(F) ⊥ = R(F)⊕R(F) ⊥
Ngược lại, nếu y ∈ R(F)⊕R(F) ⊥ thì rõ ràng Qy ∈ R(F). Định lí 1.5.9 [5] Cho y ∈ D(F + ) Khi đó x + := F + y là nghiệm bình phương tối tiểu của (1.2) trong N(F) ⊥
Chứng minh Giả sử x, z là hai nghiệm bình phương tối tiểu của phương trình (1.2) trong N(F) ⊥ Khi đó (x −z) ∈ N(F) ⊥ Vì x, z là các nghiệm bình phương tối tiểu nên F x = Qy và F z = Qy Do đó F(x−z) = 0 hay (x−z) ∈ N(F) Suy ra x−z = 0 hay x = z.
Mặt khác, nếu y ∈ D(F + ) thì F + y là nghiệm xấp xỉ tốt nhất của phương trình (1.2) trong N(F).
Thật vậy, giả sử F + y /∈ N(F) ⊥ , khi đó tồn tại vectơ z ∈ N(F) với kzk = 1 sao cho hF + y, zi 6= 0 Vì z ∈ N(F) và y ∈ D(F + ) nên F(F + y − hF + y, ziz) =F F + y− hF + y, ziF z = F F + y = Qy.
Suy ra F + y − hF + y, ziz là một nghiệm bình phương tối tiểu của(1.2).
Vì kzk = 1 nên ta có kF + y− hF + y, zizk 2 = hF + y − hF + y, ziz, F + y − hF + y, zizi
= kF + yk 2 − |hF + y, zi| 2 < kF + yk 2
Suy ra kF + y − hF + y, zizk < kF + yk Điều này mâu thuẫn với F + y là nghiệm bình phương tối tiểu có chuẩn bé nhất.
Phương pháp điều chỉnh tổng quát
F x = y (1.8) trong đó F là một toán tử compact từ không gian Hilbert X vào không gian Hilbert Y và y cho trước thuộc Y Trên thực tế, y có được là nhờ thực nghiệm, đo đạc, , do đó có thể có sai số Vì vậy, bài toán tìm nghiệm gần đúng của (1.8) được chia thành lớp các bài toán sau đây:
1) Tìm nghiệm gần đúng của (1.8) với vế phải cho gần đúng và vế trái cho chính xác.
2) Tìm nghiệm gần đúng của (1.8) với vế phải cho chính xác và vế trái cho gần đúng.
3) Tìm nghiệm gần đúng của (1.8) với cả hai vế cho gần đúng.
4) Tìm nghiệm gần đúng của (1.8) với cả hai vế cho chính xác.
Trong phần này ta chỉ xét đến lớp bài toán 1).
Ta không thể tìm dữ liệu chính xác y nhưng có thể tìm y δ với y −y δ
Trong trường hợp (1.8) là bài toán đặt không chỉnh, khi đó F + y δ nếu tồn tại thì chưa chắc là xấp xỉ tốt nhất của F + y = x + , vìF + chưa chắc liên tục Do đó cần tìm một phương pháp ổn định để tìm nghiệm gần đúng của (1.8). Định nghĩa 1.6.1 [3]Cho F : X → Y là toán tử tuyến tính bị chặn từ không gian Hilbert X vào không gian Hilbert Y và α 0 ∈ (0,+∞], với mỗi α ∈ (0, α 0 ), cho
R α : Y → X là họ các toán tử liên tục (có thể không tuyến tính) Họ {R α } được gọi là một chiến lược điều chỉnh hay toán tử điều chỉnh nếu với mọi y ∈ D(F + ) tồn tại một quy tắc chọn tham số α = α(δ, y δ ) thỏa mãn limδ→0sup{
≤δ} = 0, (1.10) trong đó α : R + ×Y →(0, α 0 ) (1.11) thỏa mãn limδ→0sup α(δ, y δ ) y δ ∈ Y, y δ −y
Với mỗi y ∈ D(F + ), cặp (Rα, α) được gọi là một phương pháp điều chỉnh của phương trình (1.8) nếu (1.10) và (1.12) được thỏa mãn Khi đó chiến lược điều chỉnh nói trên là hội tụ.
Nhận xét 1.6.2 Quy tắc chọn tham số α = α(δ, y δ ) phụ thuộc vào mức nhiễu δ và dữ liệu thực tế y δ , α cũng phụ thuộc vào dữ liệu chính xác y Bởi vì y trong thực tế không biết được nên sự phụ thuộc chỉ có thể là phỏng đoán α cũng phụ thuộc vào toán tử F.
Ta thảo luận giữa hai loại quy tắc chọn tham số: Định nghĩa 1.6.3 [3] Cho α là một quy tắc chọn tham số Nếu α không phụ thuộc vào y δ nhưng phụ thuộc vào δ thì ta gọi α là một quy tắc chọn tham số tiên nghiệm và viết α = α(δ) Ngược lại ta gọi α là quy tắc chọn hậu nghiệm.
- Một quy tắc chọn tiên nghiệm chỉ phụ thuộc vào mức nhiễu δ, không phụ thuộc vào dữ liệu thực tế y δ Do đó, nó không phụ thuộc vào kết quả tính toán đạt được trong thực tế, chẳng hạn phần dư F x δ α −y δ
, trong đó x δ α = R α y δ là nghiệm điều chỉnh.
- Quy tắc chọn tham số có thể chỉ phụ thuộc y δ , không phụ thuộc mức nhiễu δ, kết quả sau chỉ ra rằng quy tắc này không thể là phương pháp điều chỉnh hội tụ của bài toán đặt không chỉnh: Định lý 1.6.5 [3] Cho F : X → Y là toán tử tuyến tính bị chặn và giả sử có họ toán tử điều chỉnh {R α } của F + với quy tắc chọn tham số α chỉ phụ thuộc y δ (không phụ thuộc δ) sao cho phương pháp điều chỉnh (R α , α) hội tụ với mỗi y ∈ D(F + ) Khi đó F + bị chặn.
Theo giả thiết α không phụ thuộc δ, khi đó α = α(y δ ).
≤ δ = 0,∀y ∈ D(F + )Lấy y ≡ y δ , suy ra R α(y) y = F + y với mọi y ∈ D(F + )
Do đó, lấy {y n } ⊂ D(F + ) sao cho y n → y, y ∈ D(F + ) Vì R α là liên tục nên R α y n →R α y.
Suy ra F + liên tục trên D(F + ).
Nhận xét 1.6.6 Theo Định lí 1.5.6 vàF + liên tục nên D(F + ) = Y. Nếu F + không bị chặn thì không có chiến lược điều chỉnh làm cho phương pháp điều chỉnh hội tụ Từ định nghĩa trên phát sinh các câu hỏi sau:
(i) Làm thế nào xây dựng các toán tử điều chỉnh ?
(ii) Làm thế nào xây dựng quy tắc chọn tham số để phương pháp điều chỉnh hội tụ ?
(iii) Các bước thực hiện những điều này như thế nào để mang tính tối ưu ?
Cho toán tử tuyến tính F, câu trả lời cho câu hỏi đầu tiên có thể được đưa ra sau đây:
Mệnh đề 1.6.7 [3] Giả sử R α , α > 0 là toán tử bị chặn (có thể không tuyến tính) Khi đó họ {R α } được gọi là họ toán tử điều chỉnh của F + nếu
Hơn nữa, với mọi y ∈ D(F + ) tồn tại một quy tắc chọn trước tham số điều chỉnh α sao cho (R α , α) là phương pháp điều chỉnh hội tụ đối với phương trình F x= y.
Lấy y ∈ D(F + ) tùy ý Vì R α y → F + y nên tồn tại một hàm số đơn điệu σ :R + → R + ,
Với lim ε→0σ(ε) = 0 sao cho với mỗi ε > 0, ta có
Vì mỗiR σ(ε) , ε >0liên tục nên tồn tạiρ(ε)thõa mãnkz−yk ≤ ρ(ε), ta có
≤ ε 2. Ta định nghĩa hàm ρ: R + →R + , không mất tính tổng quát, giả sử ρ đơn điệu ngặt và lim ε→0ρ(ε) = 0.
Do đó hàm ρ −1 tồn tại, đơn điệu ngặt, liên tục và lim δ→0ρ −1 (δ) = 0.
Hàm α đơn điệu và có lim δ→0α(δ) = 0.
Mặt khác, với mọi ε > 0, tồn tại δ >0, δ := ρ(ε) sao cho y δ −y
Do đó (1.10) và (1.12) thỏa mãn.
- Nếu(R α , α)là phương pháp điều chỉnh hội tụ thìlim δ→0R α(δ,y) y = T + y với mọi y ∈ D(F + ).
- Nếu R α liên tục thì ta có lim σ→0R σ y = F + y.
- Nếu {R α } bị chặn đều , tuyến tính và R(F) không đóng thì sự hội tụ ở (1.13) không thể hội tụ theo nghĩa chuẩn của toán tử, tức là kR α −F + k9 0 khiα →0 (Vì nếu ngược lại F + liên tục Suy ra R(F) đóng).
Mệnh đề 1.6.9 [3] Cho {R α } là họ toán tử điều chỉnh tuyến tính của F + , ta định nghĩa xα := Rαy với mọi y ∈ Y Khi đó x α → F + y khi α →0, y ∈ D(F + ) (1.13) và nếu sup{kF R α k |α > 0} < ∞ (1.14) Khi đó kx α k → +∞ khi α →0,∀y /∈ D(F + ) (1.15)
Theo nhận xét trên ta có lim σ→0R σ y = F + y Mà xα = Rαy Suy ra (1.13) thỏa.
Ngoài ra, vì R α y → F + y khi α → 0,∀y ∈ D(F + ) nên R α → F + theo từng điểm trên D(F + ).
Mà F liên tục và F F + = Q| D(F + ) nên T Rα → Q theo từng điểm trên D(F + ).
Giả sử kF R α k bị chặn đều, F R α → Q theo từng điểm trên toàn bộY và giả sử ∃{α n } sao cho α n →0 thỏa mãn {kα n k} bị chặn.
Khi đó tồn tại dãy con x α nk của x α n sao cho x α nk → x khi k → 0.
Vì F là liên tục yếu nên F x α nk * F x.
Mặt khác,F x α nk = F R α nky →Qy nên F x= Qy Do đó, y ∈ D(F + ).
Vì vậy, nếu y /∈ D(F + ) thì không tồn tại dãy {x α n } bị chặn khi α n → 0 Hay kx α k → +∞ khi α →0.
Mệnh đề 1.6.10 [3] Cho {R α } là họ toán tử điều chỉnh tuyến tính của F + , với mỗi y ∈ D(F + ), đặt α : R + → R + là một quy tắc chọn trước tham số điều chỉnh Khi đó (R α , α) là phương pháp điều chỉnh hội tụ nếu và chỉ nếu limδ→0α(δ) = 0, (1.16) và limδ→0δ R α(δ)
Chứng minh Giả sử (1.16) và (1.17) thỏa mãn Kí hiệu x α := R α y, ta có:
Theo Mệnh đề 1.6.9 và giả thiết, ta có lim α→0x α(δ) = F + y và limδ→0δ
= 0Vì vậy (R α , α) là phương pháp điều chỉnh hội tụ đối với F +
Ngược lại, giả sử α là quy tắc chọn trước tham số và (R α , α) là một phương pháp điều chỉnh hội tụ đối với F + Khi đó lim δ→0α(δ) = 0.
> 0 Khi đó tồn tại dãy δ n → 0 sao cho δ n R α(δ n )
Do đó, tồn tại dãy {z n } ⊂ Y với kz n k = 1 sao cho δ n R α(δ n ) z n
Khi đó, với y ∈ D(F + ), ta có y n := y +δ n z n thì
Suy ra R α(δ n ) y n −F + y →/ 0 Do đó, (R α , α) không là phương pháp điều chỉnh hội tụ đối với F + Vậy limδ→0δ R α(δ)
< +∞ (*) thì (R α , α) hội tụ yếu, có nghĩa là với mọi dãy {δ k } → 0,y k ∈ Y và ky k −yk ≤ δ k thì {R α(δ k ) y k }* F + y.
- Ngược lại, (*) là cần thiết để (R α , α) hội tụ yếu, nếu (*) không thỏa thì tồn tại dãy {δ k } như trên sao cho {R α(δ k ) y k } phân kì trong tôpô yếu (thậm chí không bị chặn).
Phương pháp điều chỉnh Tikhonov
Thay vì biết dữ liệu chính xác y, ta chỉ biết gần đúng y δ với y δ −y
Bài toán tìm nghiệm của (1.18) nói chung là đặt không chỉnh (không ổn định) A N Tikhonov đưa ra một phương pháp điều chỉnh để tìm nghiệm của (1.18) như sau:
Nghiệm điều chỉnh x α của phương trình (1.18) là cực tiểu của phiếm hàm Tikhonov Φα(x) F x−y δ
2 +αkx−xk 2 , ∀x ∈ X (1.20) trong đó α là tham số điều chỉnh Do vậy Φα(xα) = inf x∈X{kF x−yk 2 + αkxk 2 } (1.21) Mệnh đề 1.7.1 [3] Cho F ∈ L(X, Y), khi đó cực tiểu xα của phiếm hàm điều chỉnh Tikhonov tồn tại và duy nhất Hơn nữa, x α là nghiệm duy nhất của phương trình chuẩn
• Tính duy nhất của cực tiểu xα Với mọi x1, x2 ta có
(1.23) Đặt Φ = inf x∈X n kF x−yk 2 +αkxk 2 o
Nếu x 1 , x 2 là cực tiểu của phiếm hàm Tikhonov thì từ đẳng thức trên ta suy ra Φ−Φ α x 1 +x 2 2
• Tồn tại cực tiểu của phiếm hàm Tikhonov.
Từ (1.21) suy ra tồn tại dãy {x n } ⊂ X sao cho Φ α (x n ) → Φ khi n → ∞ Ta chứng minh {x n } là dãy Cauchy Trong (1.23) thay x 1 , x 2 bởi x n , x m ta được Φ α (x n ) + Φ α (x m ) = 2Φ α x n +x m 2
2kx n −xmk 2 Cho m, n → ∞ ta được
2Φ ≥2Φ + lim m,n→∞ α 2kx n −x m k 2 Từ đó suy ra m,n→∞lim kx n −x m k= 0 hay {x n } là dãy Cauchy Do đó tồn tại xα ∈ X sao cho lim n→∞ = xα. Vì Φ α liên tục nên Φ α (x n ) → Φ α (x α ) khi n→ ∞.
• Chứng minh x α là nghiệm của phương trình chuẩn (1.22) Ta có
• Chứng minh F ∗ F +αI : X →X là đơn ánh.
Giả sử F ∗ F x+αx= 0 Khi đó ta có hF ∗ F x, xi+αhx, xi = h0, xi = 0.
Suy ra kF xk 2 +αkxk 2 = 0 hay x = 0.
2 + αkxk 2 ,∀x ∈ X (1.25) Đây là phiếm hàm Tikhonov tương ứng với dữ liệu gần đúng y δ Gọi x δ α là cực tiểu của phiếm hàm Tikhonov (1.25), theo mệnh đề trên thì x δ α tồn tại và duy nhất và là nghiệm của phương trình chuẩn
≤ δ Nếu α = α(δ) sao cho limδ→0α(δ) = 0 và lim δ→0 δ 2 α(δ) = 0 (1.27) thì limδ→0x δ α(δ) = F + y (1.28)
Chứng minh Giả sử δ n →0, ta kí hiệu α n := α(δ n ), y n := y δ n , x n :x δ α n n. Ta kí hiệu phiếm hàm Tikhonov Φn(x) = kF x−ynk+αnkxk 2
Theo Mệnh đề 1.7.1, x n là cực tiểu duy nhất của phiếm hàm Tikhonov Φ n thõa F ∗ F x n +α n x n = F ∗ y n
Kí hiệu x + := F + y, khi đó αnkx n k 2 ≤ Φn(xn) ≤ Φn(x + )
= kF x + −y n k 2 +α n kx + k 2 ≤ δ n 2 +α n kx + k 2 Hay kx n k 2 ≤ δ n 2 α n + x +
Do đó x n bị chặn trong không gian Hilbert X và có dãy con (x n k ) hội tụ yếu x n k * z ∈ X Vì toán tử tuyến tính bị chặn F là liên tục yếu nên
Do đó tồn tại lim k→∞F xn k = y, suy ra kF x n k k → kyk nên tồn tại k→∞lim F x n k = F z.
Vì vậy F z = y Vì cực tiểu của Φn thuộc N(F) ⊥ nên z ∈ N(F) ⊥ và z = x + = F + y, từ đó ta có x n k * x + (1.31)
Từ (1.27) và (1.29) ta có k→∞lim supkx n k k ≤ x +
Do (1.31) và (1.34) nên tồn tại k→∞lim x n k = x + (1.35)
Do vậy lim n→∞x n = x + Định nghĩa 1.7.4 [3] Đặt R α,δ y = x δ α Khi đó, họ {R α,δ } là một chiến lược điều chỉnh theo nghĩa Tikhonov của toán tử F + trên R(F) và x δ α được gọi là nghiệm điều chỉnh theo nghĩa Tikhonov.
Sự hội tụ của thuật toán giảm nhanh tìm cực tiểu toàn cục phiếm hàm Tikhonov đối với phương trình toán tử song tuyến tính
Phương trình toán tử song tuyến tính
F(x) + B(f, à), (2.1) trong đú x = (f, à) ∈ X1 ì X2, X1, X2 là khụng gian Hilbert, A là toán tử tuyến tính liên tục theo f và B là toán tử song tuyến tính theo (f, à).
Giả sử tồn tại hằng số c > 0 thỏa kB(f, à)k ≤ ckfk kàk (2.3) và định nghĩa kBk := inf c ∈ R + : kB(f, à)k ≤ ckfk kàk với mọi(f, à) ∈ X 1 ìX 2 }.
Hơn nữa, kAk và 2kBk được ước lượng bởi 1. kAk+ 2kBk ≤ 1 (2.4)
Tích trong trên X 1 ×X 2 được định nghĩa bởi h(f 1 , à 1 ),(f 2 , à 2 )i := hf 1 , f 2 i +hà 1 , à 2 i. Toán tử khả vi Fréchet cấp hai có thể được xấp xỉ bởi
2F 00 (x 0 )(x−x 0 , x−x 0 ) (2.5) Trong luận văn này ta quan tâm đến việc giải bài toán phương trình
"tuyến tính - song tuyến tính" dạng
F(f, à) = Af +B(f, à) = y (2.6) trong đú hai hàm f và à chưa biết và y chỉ biết gần đỳng.
Ước lượng sai số của phương pháp điều chỉnh
{kx−xk¯ :F(x) = y}. Như vậy, cực tiểu của hàm Φα(x) :y δ −F(x)
2 +αkx−xk¯ 2 (2.7) được kí hiệu là x δ α Ta sẽ hạn chế với quy tắc chọn trước tham số và đưa ra kết quả chính dưới đây. Định lí 2.2.1 [1] Cho F là toán tử liên tục (không tuyến tính)và đóng yếu theo dãy trên miền xác định lồi D(F) và đặt x ∗ là nghiệm có chuẩn nhỏ nhất của tiên nghiệm x¯ đối với toán tử F(x) = y Hơn nữa các điều kiện sau thỏa:
≤ γkx ∗ −xk với mọi x ∈ D(F) nằm trong hình cầu tâm x ∗ đủ lớn.
Khi đó, ta chọn được α ∼δ và đạt được x δ α −x ∗
Chứng minh Chứng minh chi tiết có thể xem [3] (trang 245) Ta có ước lượng sau x δ α −x ∗
√cp 1−γkωkδ 1/2 =: κ(c).δ 1/2 Hàm κ(c) đạt cực tiểu tại c opt = 1 kωk (2.10) Điều này có nghĩa là α = c opt δ là xấp xỉ nhỏ nhất trong ước lượng (2.8) Trong ứng dụng thực tế c opt sẽ không tính được, nhưng ta giả sử rằng một chặn trên của kωk đã được biết kωk ≤ % (2.11)
Ta chọn α = c % δ với c % = 1 % Nếu γ% < 1 thỏa mãn thì với quy tắc chọn tham số này (2.8) và (2.9) trở thành x δ α −x ∗
Tính chất lồi của phiếm hàm Tikhonov
Dưới đây ta sẽ nghiên cứu tính chất lồi của phiếm hàm Tikhonov đối với phương trình toán tử song tuyến tính có dạng (2.1).
Phiếm hàm Tikhonov của toán tử song tuyến tính với tiên nghiệm ( ¯f ,à)¯ cú dạng Φ α (f, à) :y δ −Af −B(f, à)
2 (2.14) Ta sẽ chứng minh hàm ϕ α,h (t) := Φ α ((f α δ , à δ α ) + th) t∈ R, h = (h 1 , h 2 ) ∈ X 1 ìX 2 , (2.15) là hàm lồi trong lõn cận của t = 0, trong đú (f α δ , à δ α ) là cực tiểu toàn cục của (2.14) Sau đó ta chứng minh điều này là điều kiện đủ cho thuật toán giảm nhanh hội tụ.
Trước tiờn ta xột đạo hàm Frộchet Φ 0 α (f, à) của Φ α Với (f, à) tựy ý ta cú Φα((f, à) +th) = Φα(f +th1, à+th2) y δ −A(f +th 1 )−B(f +th 1 , à+th 2 )
(2.16) Định nghĩa toỏn tử tuyến tớnh S à và T f như sau
. (2.19) Vỡ (f α δ , à δ α ) là cực tiểu toàn cục của Φ α nờn ϕ 0 α,h (0) = Φ 0 α (f α δ , à δ α )h = 0, ∀h ∈ X 1 ìX 2 Hàm ϕ α,h (t) là lồi trong lân cận của t= 0 nếu ϕ 00 α,h (t) > 0, ∀t∈ [−r,r],r > 0 Định lý sau sẽ chứng minh ϕ 00 α,h (t) > 2ε =: 2ηδ > 0, ∀t ∈ [−r,r],r > 0. Định lí 2.3.1 [1] Giả sử điều kiện của Định lý 2.2.1 được thỏa mãn đối với toỏn tử F(x) = Af + B(f, à) với A,B thừa (2.1) - (2.4) Hơn nữa, gọi (f α δ , à δ α ) là cực tiểu toàn cục của (2.14), % và η > 0 được chọn sao cho kωk ≤ % < min
(2.20)Khi đó với quy tắc chọn tham số α = δ % , tồn tại một hình cầuK r (f α δ , à δ α ) sao cho ϕ 00 α,h (t) ≥ 2ηδ với mọi t ∈ [−r,r] và khk = 1 Bỏn kính r của K r xác định bởi r = r 1 (%)δ +r 2 (%)√ δ (2.21) trong đó r 1 , r 2 được định nghĩa trong (2.35).
Chứng minh Đầu tiên ta chứng minh ϕ 00 α,h (0) ≥ 2ηδ Thật vậy, đặt h = (h 1 , h 2 ) ∈ X 1 ×X 2 với khk = 1 Từ định nghĩa (2.15) của ϕ α,h và (2.16) ta thu được ϕ 00 α,h (t) = 2(
(2.22) Để cho gọn ta đặt y 1 = y δ −Af δ α −B(f α δ , à δ α ), a = Ah 1 + B(h 1 , à δ α ) +B(f α δ , h 2 ), b = B(h 1 , h 2 ), u 2 = hu, ui,|u| = √ u 2 , u ∈ {a, b, y 1 }. Khi đó ta có phương trình ngắn gọn ϕ 00 α,h (t) = 2(a 2 −2hy 1 , bi+α) + 12tha, bi+ 12t 2 b 2 (2.23) Vì (2.4), (2.13) và khk= 1 ta có
Do đó đặt ε = ηδ ta có ϕ 00 α,h (0)−2ε = 2(a 2 −2hy 1 , bi+α)−2ε
Tiếp theo ta chứng minh ϕ 00 α,h (t) ≥ 2ε với t∈ [−r,r].
Nếu b = B(h 1 , h 2 ) = 0 thì ϕ 00 α,h (t) =ϕ 00 α,h (0) ≥ 2ηδ, t ∈ R. Nếu a = Ah 1 +B(h 1 , à δ α ) +B(f α δ , h 2 ) = 0 thỡ ϕ 00 α,h (t) =ϕ 00 α,h (0) + 12t 2 b 2 > ϕ 00 α,h (0)≥ 2ε, t ∈ R.
Trường hợp a, b 6= 0 và p(t) =ϕ 00 α,h (t)−2ε không có nghiệm thực thì p(t) là tam thức bậc hai có hệ số t 2 là 12b 2 > 0 Do đó p(t) > 0,∀t ∈ R. Trường hợp a, b 6= 0 và p(t) = ϕ 00 α,h (t)−2ε có hai nghiệm thực Theo (2.22),(2,25) hệ số của t 0 , t 2 lần lượt là ϕ 00 α,h (0)−2ε, kB(h 1 , h2)k 2 và các hệ số này đều lớn hơn 0 Do đó hai nghiệm thực sẽ cùng dấu.
Hơn nữa, từ (2.22) ta có ϕ 00 α,h (−t) = ϕ 00 α,−h (t)
Vì vậy ta chỉ cần xét trường hợp hai nghiệm dương. t1,2 = −ha, bi
6b 2 , (2.26) nghĩa là khi đó ha, bi < 0. Đặt τ = − |a||b| ha,bi , τ ∈ [0,1] và t min,h = min{t 1 , t 2 }, t max,h max{t 1 , t2}, ta có t min,h = τ |a|
Theo định lí Vi-et ta có t max,h t min,h = 1
Vì hàm tmax,h đạt giá trị lớn nhất tại τ = 1 nên ta ước lượng được t max,h ≤ |a|
Do (2.24) và (2.25) nên α −2hy 1 , bi −ε dương Cuối cùng t max,h được ước lượng như sau t max,h ≤ |a|
Vậy ta đã tìm được một chặn dưới của t min,h nhưng vẫn còn phụ thuộc vào h (vì a, b phụ thuộc vào h).
0≤ (3τ 2 −2)a 2 −2(α−ε−2hy 1 , bi). Đặc biệt với τ = 1 ta có
1 +k(f α δ , à δ α )k (2.34) Thay (2.32),(2.34)vào (2.30) ta được tmin,h ≥
(2.35) trong đó r không phụ thuộc vào h.
Vậy ta đã chứng minh được ϕ 00 α,h (t) ≥ 2ε = 2ηδ với mọi t ∈ [−r,r].
Như vậy ta đã chứng minh đượcϕ α,h (t)là hàm lồi vớikthk ≤ r 1 (%)δ+ r 2 (%)δ 1/2 Từ (2.26) ta chú ý rằng nghiệm của đa thức p(t) là phức nếu α đủ lớn Trong trường hợp này ϕα,h(t) là hàm lồi với mọi t và h. Định lí 2.3.2 [1] Với các giả thiết như Định lí 2.3.1, hàm ϕ α,h (t) là lồi toàn cục nếu α ≥ α,¯ (2.36) trong đó α¯ là nghiệm có chuẩn lớn nhất của hàm f(α) được định nghĩa trong (2.41) Hơn nữa, với quy tắc chọn tham số này ta suy ra ϕ 00 α,h (t) ≥ 2ε = 2ηδ.
Chứng minh Ta sử dụng các kí hiệu như chứng minh trước Trong chứng minh trước ta đã chỉ ra ϕ 00 α,h (t) − 2ε ≥ 0 trong trường hợp b = B(h1, h2) = 0 Do đó ta giả sử b 6= 0 Bởi vì p(t) = ϕ 00 α,h (t)−2ε là đa thức bậc hai với p(0)≥ 0 Để p(t) ≥0 thì p(t) không có hoặc chỉ có một nghiệm thực khi α đủ lớn Từ (2.26), ta phải chọn α đủ lớn sao cho
Chuẩn |y1| y δ −Af δ α −B(f α δ , à δ α ) được ước lượng bởi
2 ≤ 1 αΦα(f α δ , à δ α ) ≤ 1 αΦα(¯f,à) =¯ 1 α|y|¯ 2 (2.40) Thay (2.39)và (2.40) vào (2.37), đặt ε = ηδ = η%α ta có
Vì (2.20) nên % ≤ 6+η 1 hay η% ≤ 6+η η < 1 Suy ra q < 0 và do đó f(α) < 0 với α đủ lớn Nếu α¯ là nghiệm dương của f(α) với chuẩn lớn nhất thì D ≤ 0 với mọi α ≥α Khi đó¯ ϕ 00 α,h (t) ≥ 2ε > 0 với mọi t∈ R, nghĩa là ϕ α,h (t) là lồi toàn cục với cách chọn tham số này.
Phân tích phương pháp giảm nhanh
Phương pháp giảm nhanh để tìm cực tiểu của hàmΦ α : X 1 ×X 2 → R được định nghĩa bởi
(f k+1 , à k+1 ) = (f k , à k ) +β k ∇Φ α (f k , à k ) (2.42) trong đú ∇Φ α (f k , à k ) kớ hiệu là hướng giảm nhanh của Φ α tại điểm (f k , à k ) và β k là tham số tỉ lệ.
Ta biết rằng phương pháp giảm nhanh sẽ hội tụ đến cực tiểu toàn cục của phiếm hàm Tikhonov Φ α nếu nó bị chặn dưới, khả vi Fréchet cấp 2 và đạo hàm Fréchet bị chặn đều và xác định dương [7]. Đối với hàm Φ α (f, à) ta đó chứng minh rằng hàm ϕ α,h (t) là hàm lồi địa phương Do vậy, ta hi vọng phương pháp giảm nhanh hội tụ đến cực tiểu toàn cục của Φ α (f, à) bắt đầu bằng giỏ trị(f 0 , à 0 ) ∈ K r (f α δ , à δ α ) cho trước và với tham số tỉ lệ βk được chọn sao cho tất cả các bước lặp đều nằm trong K r (f α δ , à δ α )
Trong phần này ta sẽ nghiờn cứu sự hội tụ của (2.42) Với (f k , à k ) ∈ Kr(f α δ , à δ α ), r được định nghĩa như trong Định lớ 2.3.1 và h k = (h 1,k , h 2,k ) := (f α δ −f k , à δ α −à k ) (2.44) Ta định nghĩa hàm ϕ 1 (t), ϕ 2 (t) như sau ϕ1(t) = Φα((fk, àk) +thk), (2.45) ϕ 2 (t) = Φ α ((f α δ , à δ α )−th k ), (2.46)
T f ∗ k(y δ −Afk −B(fk, àk))−α(àk −à), h¯ 2k y δ −Af k −B(f k , à k ), S à k (h 1k )
−αhà k −à, h¯ 2k i y δ −Afk−B(fk, àk), Sà k (h1k) +Tf k (h2k)
Từ (2.16), (2.45) kết hợp với h∇Φ α (f k , à k ), h k i đó tớnh toỏn ở trờn ta suy ra ϕ 1 (t) =ϕ 1 (0)−2h∇Φ α (f k , à k ), h k it+a h k t 2 +b h k t 3 +c h k t 4 (2.47) ϕ 2 (t) =ϕ 2 (0) + 2
∇Φ α (f α δ , à δ α ), h k t+ ¯a h k t 2 + ¯b h k t 3 + ¯c h k t 4 (2.48) trong đó các hệ số a h k , b h k , c h k ,¯a h k ,¯b h k ,¯c h k được xác định như trong (2.16).
Ta cần những thông tin về hàm ϕ 0 1 (t).
Mệnh đề 2.4.1 [1] Gọi ϕ 1 (t) được định nghĩa như trong (2.45) và (f k , à k ) ∈ K r (f α δ , à δ α ) Khi đú ta cú ϕ 0 1 (t) < 0, ∀t ∈ [0,1] (2.49) và ϕ 00 1 (t) ≥2εkh k k 2 , ε > 0∀t ∈ [0,1] (2.50)
Chứng minh Để tiện hơn ta tính toán ϕ 2 (t) và sau đó sử dụng mối quan hệ ϕ 2 (t) = ϕ 1 (1−t) (2.51)
Với định nghĩa từ (2.44) - (2.48) và bằng cách đặt ˜h k = −h k /kh k k ta thu được ϕ 2 (t) = Φ α ((f α δ , à δ α )−th k ), ϕ α, ˜ h k(tkh k k) = Φ α ((f α δ , à δ α ) +tkh k k.h˜ k )
Lấy đạo hàm cấp 2 ta được ϕ 00 2 (t) =ϕ 00 α, ˜ h k(tkh k k)kh k k 2 , với ϕ α, h ˜ k định nghĩa như trong (2.15) Theo định lí 2.3.2 ta có ϕ 00 α, h ˜ k
2ε = 2ηδ với |t| ≤ r, r là bỏn kớnh hỡnh cầu K r (f α δ , à δ α ).
Vỡ (f k , à k ) = (f α δ , à δ α )−h k ∈ K r (f α δ , à δ α ) nờn tkh k k ≤ r, t ∈ [0,1], do đó ϕ 00 2 (t) =ϕ 00 α, ˜ h k(tkh k k)kh k k 2 ≥ 2εkh k k 2 Hơn nữa, từ (2.51) ta tìm được ϕ 00 2 (t) = ϕ 00 1 (1−t) nên (2.50) đúng.
Do (2.50) nên ϕ 0 1 (t) là đơn điệu tăng trên [0,1], từ đó suy ra (2.49).
Mệnh đề 2.4.2 [1] Giả sử rằng (f k , à k ) ∈ K r (f α δ , à δ α ) Khi đú tồn tại một khoảng I = (0, β0] sao cho bước lặp
. Đặc biệt, (fk+1, àk+1) ∈ Kr(f α δ , à δ α ).
Chứng minh Từ (2.42) và (2.44) ta có
Theo Mệnh đề 2.4.1 và (2.47), h∇Φ α (f k , à k ), h k i = −ϕ 0 1 (0)/2> 0 và do đú g(β k ) < 0 với β k nhỏ Bước lặp mới (f k , à k ) gần (f α δ , à δ α ) nhất nếu g(β k ) đạt giá trị nhỏ nhất, khi đó β min = h∇Φ α (f k , à k ), h k i k∇Φ α (f k , à k )k 2 ,do đó ta chọn β 0 = β min h∇Φ α (f k , à k ), h k i cần được biết để tỡm giỏ trị nhỏ nhất của Φ α Do vậy trong thực hành cần tìm một chặn dưới của β 0
Mệnh đề 2.4.3 [1]Gọifj, àj, j = 0, , k+1 là là bước giảm nhanh đến cực tiểu của Φ α và h k được định nghĩa như trong (2.44) Hơn nữa, giả sử (f j , à j ) ∈ K r (f α δ , à δ α ) với j = 0, , k Khi đú h∇Φ α (fk, àk), hki ≥ ckh k k 2 (2.53) với c > 0 định nghĩa trong (2.55).
Chứng minh Gọi ϕ 1 (t), ϕ 2 (t) được định nghĩa như trong (2.45) - (2.48) và t∈ [0,1] Khi đó ϕ 0 1 (t) =−2h∇Φ α (f k , à k ), h k i+ 2a h k t+ 3b h k t 2 + 4c h k t 3 với các hệ số a h k = kAh 1 +B(h 1 , à) + B(f, h 2 )k 2
Theo (2.49) và (2.50) ta có ϕ 0 1 (t) < 0 và 2ah k = ϕ 00 1 (0)≥ 2εkh k k 2 Hơn nữa, c h k ≥ 0 nên suy ra
≥2εkh k k 2 t−3|b h k |t 2 Với kfk ≤ k(f, à)k,kàk ≤ k(f, à)k và (2.4), |b h k | cú thể được ước lượng bởi
≤2 ((kAk+kBk kà k k)kh 1,k k+ kBk kf k k kh 2,k k)kBk kh 1,k k kh 2,k k
≤2 ((kAk+kBk kà k k+ kBk kf k k)kBk kh k k 3
≤2 (1 +k(f k , à k )k)kh k k 3 Vỡ (f j , à j ) ∈ K r (f α δ , à δ α ) với j = 0, , k nờn kh k k(f α δ , à δ α )−(fk, àk)
≤2r +k(f 0 , à 0 )k. Tất cả các điều này cho ta
Hàm g(t) đạt giá trị lớn nhất tại t max = ε
Vì t ∈ [0,1], nên ta xét hai trường hợp (1) t max ≥ 1 Vì g(0) = 0 nên g(1) > 0 và
(2) t max < 1, nghĩa là 2h∇Φ α (f k , à k ), h k i ≥ kh k k 2 (2εt max −3Lt 2 max ) > 0 Đặt c = 1 2min
Mệnh đề 2.4.4 [1] Gọi(f j , à j ), j = 0, , k+ 1là bước giảm nhanh đến cực tiểu của Φ α Nếu (f j , à j ) ∈ K r (f α δ , à δ α ) với j = 0, , k và tham số tỉ lệ βk được chọn sao cho β k ≤ min c k∇Φ α (f k , à k )k 2 ,¯c(Φ α (f k , à k )−φ min,k ) k∇Φ α (f k , à k )k 2
(2.56) thỡ bước lặp mới (f k+1 , à k+1 ) gần (f α δ , à δ α ) hơn (f k , à k ) Trong đú φ min,k = min Φ α ((f k , à k ) + t∇Φ α (f k , à k )) : t∈ R + (2.57) và hằng số c,¯c được định nghĩa trong (2.55) và (2.59) Đặc biệt, (f k+1 , à k+1 ) ∈ K r (f α δ , à δ α )
Chứng minh Cho ϕ 1 , ϕ 2 được định nghĩa như trong (2.45) - (2.48).
Trước tiên ta ước lượng kh k k bởi chặn dưới ϕ 1 (0)−ϕ 1 (1).
Ta cú ϕ 1 (t) = ϕ 2 (1−t) và ∇Φ α (f α δ , à δ α ) = 0 Từ (2.48) ta cú ϕ 1 (0)−ϕ 1 (1) = ϕ 2 (1)−ϕ 2 (0) = ¯a h k + ¯b h k + ¯c h k , với ¯ a h k Ah 1,k +B(h 1,k , à δ α ) +B(f α δ , h 2,k )
, ¯ c h k = kB(h 1,k , h 2,k )k 2 Ta có các bất đẳng thức y δ −Af δ α −B(f α δ , à δ α )
≤ (kAk+kBk à δ α )kh 1,k k+ kBk f α δ kh 2,k k
≤ (1 +r+ k(f 0 , à0)k)kh k k. các đại lượng ¯a h k ,¯b h k ,c¯ h k có thể được ước lượng như sau: a h k ≤ |a h k | ≤ ((1 +r +k(f 0 , à 0 )k) 2 +α+ 6δ)kh k k 2 =: c 1 kh k k 2 , bh k ≤ bh k
Tất cả các điều này suy ra ϕ 1 (0)−ϕ 1 (1) ≤c 1 kh k k 2 +c 2 kh k k 3 +kh k k 4
Trường hợp kh k k ≤ 1 ta có ϕ 1 (0)−φ min,k ≤ ϕ 1 (0)−ϕ 1 (1) ≤c 1 kh k k 2 + c 2 kh k k 3 +kh k k 4
(2.58) Đặt c = c c 1 +c 2 + 1, (2.59) trong đó c định nghĩa như trong (2.55).
Từ (2.53) suy ra h∇Φ α (f k , à k ), h k i ≥ ckh k k 2 = c(c 1 +c 2 + 1)kh k k 2
Trường hợp kh k k> 1 Từ (2.53) ta có h∇Φ α (f k , à k ), h k i ≥ c.
Kết hợp với ước lượng của h∇Φ α (f k , à k ), h k i trong (2.52) suy ra β k ≤ β min và bước lặp mới gần (f α δ , à δ α ) hơn bước lặp cũ. Để chứng minh sự hội tụ của phương pháp giảm nhanh ta cần kết quả sau:
Mệnh đề 2.4.5 [1]GọiK r (f α δ , à δ α ) được định nghĩa như trong Định lớ 2.3.1, (f 0 , à 0 ) ∈ K r (f α δ , à δ α ) và {(f k , à k )} k∈N là bước giảm nhanh của phiếm hàm Tikhonov với β k được chọn thỏa (2.56) Khi đó, tồn tại hằng số M sao cho đạo hàm cấp hai của hàm φ k (t) := Φ α ((f k , à k ) +t∇Φ α (f k , à k )) t ∈ [0,1], bị chặn bởi φ 00 k (t)
Chứng minh Theo cách chọn β k thì tất cả các bước lặp đều thuộc K r (f α δ , à δ α ) Do (2.19) nờn k∇Φ α (f k , à k )k cú thể được ước lượng bởi k(f k , à k )k Do đú, k∇Φ α (f k , à k )k bị chặn trờn bởi hằng số κ, k∇Φ α (f k , à k )k ≤ κ (2.60) Đặt ∇Φ α (f k , à k ) = (h 1 , h 2 ), hàm φ 00 k (t) ước lượng trờn [0,1] như sau: φ 00 k (t)
+ α k∇Φ α (f k , à k )k 2 +6t(kAk+ 2kBk k(f k , àk)k)kBk k∇Φ α (fk, àk)k 3 +6t 2 kBk 2 k∇Φ α (f k , à k )k 4
=: M k k∇Φ α (f k , à k )k 2 Vỡ(f k , à k ) ∈ K r (f α δ , à δ α ) nờn M k bị chặn trờn bởi M, tức là M k ≤ M.
Bây giờ ta phát biểu kết quả hội tụ của phương pháp giảm nhanh. Định lớ 2.4.6 [1] Gọi K r (f α δ , à δ α ) được định nghĩa như trong Định lớ 2.3.1, (f0, à0) ∈ Kr(f α δ , à δ α ) và {(f k , àk)} k∈
N là bước giảm nhanh của hàm Tikhonov Φ α với βk = min c k∇Φ α (f k , à k )k 2 ,c¯(Φ α (f k , à k )−φ min,k ) k∇Φ α (f k , à k )k 2 , 1
, (2.61) trong đó c,¯c, φ min,k và M được định nghĩa như trong Mệnh đề 2.4.4 và 2.4.5 Khi đú (f k , à k ) hội tụ đến cực tiểu toàn cục của Φ α :
Chứng minh Nếu(f 0 , à 0 ) ∈ K r (f α δ , à δ α ) và tham số tỉ lệβ k được chọn như trong (2.61), thỡ theo Mệnh đề 2.4.4, ta cú (f k , à k ) ∈ K r (f α δ , à δ α ).
Dóy Φα(fk, àk) là đơn điệu giảm và bị chặn dưới, do vậy tồn tại Φ0 sao cho Φ α (f k , à k ) ↓ Φ 0 khi k → ∞ Trước tiờn ta sẽ chứng minh tham số tỉ lệ β k bị chặn dưới, nghĩa là β k ≥ β với mọi k Lấy t∈ [0,1], đặt φk(t) := Φα((fk, àk) +t∇Φ α (fk, àk)) Khi đó φ k (t)−φ k (0) = −tk∇Φ α (f k , à k )k 2 + t
Theo Mệnh đề 2.4.5, ta có φ 00 k (t)
≤ Mk∇Φ α (fk, àk)k 2 Khụng mất tính tổng quát ta giả sử M ≥1 Với 0 < t ≤1, suy ra φ k (t)−φ k (0) ≤ −tk∇Φ α (f k , à k )k 2 + t 2 2 Mk∇Φ α (f k , à k )k 2
(2.62) Đặc biệt, nếu ta đặt t= 1/M ≤ 1, thì φ k (1/M)−φ k (0) ≤ − 1
Với φmin,k = min{φ k (t) : t ∈ R}, ta tìm được
Thay (2.63), (2.64) vào (2.61) ta được β k ≥min c κ, ¯c
Tiếp theo ta chứng minh ∇Φ α (fk, àk) → 0 khi k → ∞ Giả sử
∇Φ α (f k , à k ) khụng hội tụ đến 0 Khi đú tồn tại ε 0 > 0 với mọi N ∈ N tồn tại k > N sao cho k∇Φ α (f k , à k )k ≥ ε 0
Vỡ Φα(fk, àk) = φk(0) hội tụ đơn điệu giảm đến Φ0 Hơn nữa ta cú thể giả sử rằng |φ k (0)−Φ 0 | ≤ β 4 ε 2 0 ≤ β 4 k ε 2 0 với k đủ lớn Từ (2.61) suy ra β k ≤ 1/M hay M β k ≤ 1 Trong(2.62) đặt t = β k ta có φ k (β k )−φ k (0) ≤β k
≤ − β 2 k ε 2 0 + β 4 k ε 2 0 = − β 4 k ε 2 0 < 0. Điều này mõu thuẫn với Φ α (f k , à k ) ↓ Φ 0 Do vậy ∇Φ α (f k , à k ) hội tụ đến 0. Đặt h k = (f α δ −f k , à δ α −à k ) Theo (2.53), cuối cùng ta có ckh k k 2 ≤ h∇Φ α (fk, àk), hki ≤ k∇Φ α (fk, àk)k kh k k (2.66)
Suy ra ckh k k ≤ k∇Φ α (f k , à k )k → 0 khi k → 0 với c định nghĩa trong (2.55) và do đú (f k , à k ) → (f α δ , à δ α ).
- Thay vì tính toán tham số tỉ lệ mới β n cho mọi bước lặp, chặn dưới β trong (2.65) có thể sử dụng như tham số tỉ lệ cho mọi bước lặp.
- Ước lượng (2.66) có thể được sử dụng để kiểm tra sự chính xác của bước lặp trong suốt quá trình lặp.
Tiến trình tìm cực tiểu toàn cục của phương pháp điều chỉnh Tikhonov
Gọi (f ∗ , à ∗ ) là nghiệm cú chuẩn nhỏ nhất ứng với tiờn nghiệm ( ¯f ,à)¯ của phương trỡnh y = Af + B(f, à) Đồng thời cỏc điều kiện (2) và (3) của Định lí 2.2.1 được thỏa mãn và kωk ≤ % Với quy tắc chọn trước tham số điều chỉnh α, hàm ϕ α,h (t) = Φ α ((f α δ , à δ α ) + th) là lồi toàn cục nếu α ≥ α¯ (theo Định lí 2.3.2) hoặc là lồi địa phương nếu
Trong trường hợp đầu tiên, phương pháp giảm nhanh để tìm cực tiểu của hàm Tikhonov sẽ hội tụ với giỏ trị bắt đầu (f0, à0) tựy ý Trong trường hợp thứ hai chỉ hội tụ nếu (f 0 , à 0 ) ∈ K r (f α δ , à δ α ) Theo Định lớ 2.3.1, bỏn kớnh r của K r (f α δ , à δ α ) được cho bởi r = r 1 (%) +r 2 (%)δ 1/2 và vế phải hội tụ đến 0 khi δ →0 Do vậy với giỏ trị bắt đầu (f0, à0) thỏa mãn k(f 0 , à 0 )−(f ∗ , à ∗ )k ≤ λ (2.67) thỡ (f 0 , à 0 ) ∈/ K r (f α δ , à δ α ) với α = δ/% nhỏ.
Ta cần xỏc định tham số điều chỉnh α˜ sao cho (f 0 , à 0 ) ∈ K r (f α ˜ ˜ δ , à δ α ˜ ˜ ).
Với điều kiện của Định lí 2.2.1 ta thu được (2.8) và (2.12) Với mọi ˜ α > α,δ˜= %α˜ và y ˜ δ := y δ ta có
Sau đây ta sẽ giả sử rằng
2d(%) < r 2 (%), (2.69) trong đó r2(%) định nghĩa trong (2.35) Điều này luôn đúng với % nhỏ.
Thật vậy, từ định nghĩa của d và r 2 ta suy ra d(%) → 0 và r 2 (%) → ∞ khi % →0, nên (2.69) đúng với % đủ nhỏ.
Hơn nữa, ta có thể chọn q < 1 sao cho d(%) 1 +√
Mệnh đề 2.5.1 [1] Cho điều kiện của Định lí 2.2.1 thõa mãn với kωk ≤ % và gọi y δ , δ thõa mãn y −y δ
≤ δ với α = δ/% và (f 0 , à 0 ) thừa món (2.67) Hơn nữa, giả sử (f 0 , à 0 ) ∈/ K r (f α δ , à δ α ) và (2.69) đỳng.
Chứng minh Trước tiên ta chứng minh δ < δ˜ Từ (2.67) và (2.68) suy ra
Giả sử δ ≥δ˜, thì từ (2.71) ta có λ r2(%)−d(%) = ˜δ 1/2 ≤δ 1/2 Suy ra λ+d(%)δ 1/2 ≤r2(%)δ 1/2 nghĩa là
≤ r 2 (%)δ 1/2 Điều này mõu thuẫn với (f 0 , à 0 ) ∈/ K r (f α δ , à δ α ) Vỡ vậy, δ < δ˜ đỳng và y ˜ δ −y
≤ δ Tương tự như ở trên cũng từ (2.67) và (2.68), ta có˜
Bây giờ đặt α,¯ α˜ như trong (2.36), (2.71) Nếu ta muốn tìm cực tiểu của hàm Tikhonov với quy tắc chọn tham số α = δ/%, (f0, à0) được chọn thỏa mãn (2.67) và α ≥ min{α,¯ α}˜ không thỏa mãn, thì phương pháp giảm nhanh sẽ chỉ hội tụ đến cực tiểu địa phương của phiếm hàmTikhonov.
Mặt khác, đặt α 0 = min{α,¯ α}, thì từ Định lí 2.3.2, Mệnh đề 2.5.1˜ và Định lí 2.4.6 phương pháp giảm nhanh tìm cực tiểu của Φ α 0 với giá trị bắt đầu (f 0 , à 0 ) sẽ hội tụ đến cực tiểu toàn cục của hàm Φ α 0
Trên cơ sở ý tưởng này, ta đề xuất thuật toán giảm nhanh để tìm cực tiểu của phiếm hàm Tikhonov IT/SD (iterated Tikhonov/steepest descent):
• Bước 2: Đặt α 0 = min{α,¯ α},˜ α,¯ α˜ như trong (2.36), (2.71) Nếu α > α 0 thì chuyển sang bước 3 Ngược lại chuyển sang bước 4.
• Bước 3: Tớnh toỏn f α δ , à δ α là phần tử cực tiểu của Φα bằng phương phỏp giảm nhanh với giỏ trị bắt đầu (f 0 , à 0 ) Thuật toỏn kết thỳc.
◦ Tớnh toỏn (fα δ j j, à δ α j j) là phần tử cực tiểu của Φ α j bằng phương phỏp giảm nhanh với giỏ trị bắt đầu (f 0 j , à j 0 ).
♦ Nếu α = α n thì(f α δ n n, à δ α n n) là cực tiểu của Φ α Thuật toán kết thúc.
♦ Nếu α < α n thì chuyển qua bước 5.
• Bước 5: Tớnh toỏn (f α δ , à δ α ) là phần tử cực tiểu của Φ α bằng phương phỏp giảm nhanh với giỏ trị bắt đầu (f α δ n n , à δ α n n ) Thuật toỏn kết thỳc. Định lớ 2.5.2 [1] Cho F(x) = Af +B(f, à), x = (f, à) và y δ thỏa mãn y δ −y
≤ δ, δ > 0 và điều kiện của Định lí 2.2.1 đúng Hơn nữa, giả sử % được chọn sao cho kωk ≤ % < 1 γ , trong đó γ được định nghĩa trong điều kiện 2 của Định lí 2.2.1 và (2.20), (2.69) xảy ra Khi đó, với y δ , δ đã cho thì thuật toán IT/SD hội tụ đến cực tiểu toàn cục của Φ α Chứng minh Theo Định lớ 2.3.2 thỡ ϕ α,h (t) = Φ α ((f α δ , à δ α ) +th) là lồi toàn cục nếu α ≥ α, và phương pháp giảm nhanh sẽ hội tụ với giᯠtrị bắt đầu bất kì đến phần tử cực tiểu duy nhất cuả Φ α Nếu α ≥ α,˜ theo Mệnh đề 2.5.1 ta cũng cú (f 0 , à 0 ) ∈ K r (f α δ , à δ α ) và phương phỏp giảm nhanh cũng sẽ hội tụ đến phần tử cực tiểu của Φ α (theo Định lí 2.4.6).
Giả sử α < α 0 Như đã nói ở trên, bước giảm nhanh tìm cực tiểu của Φ α 0 với giỏ trị bắt đầu (f 0 , à 0 ) sẽ hội tụ đến cực tiểu toàn cục (f α δ 0 0 , à δ α 0 0 ) = (f 0 1 , à 1 0 ).
Ta chứng minh (f 0 j , à j 0 ) ∈ K r (fα δ j j, à δ α j j) với j = 1,2, , n. Đặt y δ j := y δ ta có y δ j −y
≤ d(%)δ j−1 1/2 Theo định nghĩa α j = qα j−1 và (f 0 j , à j 0 ) = (fα δ j−1 j−1 , à δ α j−1 j−1 ) ta thu được δ j = qδ j−1 và
Suy ra (f 0 j , à j 0 ) ∈ K r (fα δ j j, à δ α j j) Theo Định lí 2.4.6 bước giảm nhanh sẽ hội tụ đến cực tiểu
(f α δ j j , à δ α j j ) = (f 0 j+1 , à j+1 0 ) của Φ α j Đặc biệt với j = n, ta tớnh được (f α δ n n , à δ α n n ).
Nếu q n α 0 = α, thì chứng minh kết thúc Ngược lại, ta vẫn còn phải chứng minh (f α δ n n , à δ α n n ) ∈ Kr(f α δ , à δ α ) Vỡ q n+1 α0 < α < q n α0 nờn tồn tại ˜ q sao cho 1> q > q˜ với α = ˜qα 0 Theo (2.73) ta có
Vậy (f 0 n , à n 0 ) = (f α δ n n, à δ α n n) ∈ K r (f α δ , à δ α ) Cũng theo Định lớ 2.4.6 thỡ bước giảm nhanh hội tụ đến (f α δ , à δ α ).
Kết thúc phần này ta chú ý rằng thuật toán IT/SD chỉ hữu dụng nếu dữ liệu y biết chính xác, nghĩa là δ = 0 Với chiến lược chọn tham số α = δ/% thì khi đó chọn α = 0, và thuật toán không thể áp dụng trực tiếp được Tuy nhiên, ta có thể tìm một xấp xỉ tốt đến cực tiểu (f ∗ , à ∗ ) của Φ α=0 Thật vậy, từ (2.8) với α > 0 tựy ý và δ = 0 k(f α , à α )−(f ∗ , à ∗ )k ≤ % p(1−γ%)
Do vậy, ta phải chọn α sao cho (f α , à α ) đủ gần (f ∗ , à ∗ ) Bằng cỏch đặt δ := %α, y δ := y ta có thể sử dụng thuật toán IT/SD để tìm cực tiểu (f α , à α ) của Φ α
Ứng dụng
Bài toán tìm cực tiểu toàn cục của phương trình song tuyến tính trong không gian hai chiều 61
Ta giải phương trình F(x, y) = z, trong đó F(x, y) : R 2 → R được định nghĩa
Với z, α,x,¯ y¯ cho trước tìm cực tiểu của hàm Tikhonov Φ α (x, y) = (z −ax−bxy) 2 + α((x−x)¯ 2 + (y −y)¯ 2 ) (3.1)
Cực tiểu của Φ α làm cho các đạo ham riêng bị triệt tiêu:
0 = ∂x ∂ Φ α (x, y) = 2(z −ax−bxy).(−a−by) + 2α(x−x)¯ 0 = ∂y ∂ Φα(x, y) = −2(z −ax−bxy).bx+ 2α(y −y).¯
Nếu ta cho a = b = 1, z = 3 và α = 0.8,(¯x,y) = (0,¯ 0) thì nghiệm của (3.2) là các điểm tới hạn:
(x1, y1) = (−1.6118,−2.1876), F(x1, y1) = 1.9142, (x 2 , y 2 ) = (−1.0778,−0.2896), F(x 2 , y 2 ) = −0.7657, (x 3 , y 3 ) = (+1.2969,+0.8899), F(x 3 , y 3 ) = 2.4510. trong đó (x 3 , y 3 ) là cực tiểu toàn cục, Φ(x 3 , y 3 ) = 1.9647 và (x 1 , y 1 ) chỉ là cực tiểu địa phương, Φ(x 1 , y 1 ) = 7.0858. j αj xα j yα j Φα j (xα j , yα j ) 0 4.0000 0.6971 0.6540 7.0661 1 2.8000 1.0717 0.7687 6.0902 2 1.9600 1.2361 0.8540 4.9259 3 1.3720 1.2848 0.8828 3.6715 4 0.9604 1.2947 0.8889 2.6761 5 0.6723 1.2964 0.8899 1.9647
Bảng 3.1: Kết quả thuật toán IT/SD sau mỗi bước lặp.
(j là số bước lặp, α j = q j α 0 và (x α j , y α j ) là cực tiểu của Φ α j )Kết quả trên cho ta thấy rằng sử dụng thuật toán IT/SD để tìm cực tiểu toàn cục của phiếm hàm Tikhonov là cần thiết Ví dụ trên chỉ có hai cực tiểu còn trong trường hợp đối với phương trình toán tử trong không gian vô hạn chiều thì tồn tại nhiều điểm cực trị hơn.
Bài toán tìm vùng ảnh trong y học
Trong lĩnh vực chuẩn đoán hình ảnh trong y học, việc tính toán sự phát ra của các hạt đơn lượng tử trong chụp X quang (SPECT) đóng vai trò quan trọng Liên hệ giữa khối lượng dữ liệu y và phân bố phản xạ f được cho bởi biến đổi Radon tắt dần (ATRT): y = R(f,à)(s, ω) =¯
Trong [8], xấp xỉ R bởi ánh xạ song tuyến tính R˜ như sau
Trong đó, số mũ trong (3.3) được thay thế bởi hai số hạng đầu tiên của khai triển Taylor à˜ = à 0 +à Cố định ỏnh xạ à 0 ta tiến hành giải phương trình
R(f, à) =˜ y thay vì giải (3.3) Phương trình này có dạng (2.6), do đó ta có thể áp dụng thuật toán IT/SD Những tính toán này được áp dụng từ phương phỏp ảnh MCAT[9]; phõn phối tắt dần àe được cho bởi một bộ phận của cơ thể người như xương, mô, phổi và độ phóng xạ f ∗ giả sử được cung cấp từ quả tim.
Tóm lại, qua hai ví dụ trên cho ta thấy rằng sử dụng thuật toánIT/SD để tìm cực tiểu toàn cục của hàm Tikhonnov là cần thiết và giải thích được miền lồi càng lớn khi tham số điều chỉnh α càng lớn.