2 Nguyờn lý cực đại Pontriagin trong lý thuyết điều khiển tối ưu
2.3.4. Liờn hệ giữa cỏc nún tiếp xỳc và hàm Hamilton
Bổ đề 2.3.7(Một tớnh chất của hàm Hamilton cực đại). Cho Σ = (X, f, U) là một hệ điều khiển, (x, p, u)∈XìRnìU. Khi đú HΣ(x, p, u) =Hmax
Σ (x, p) khi và chỉ khi hp, vi ≤0, v ∈ {f(x, u)−f(x, u)|u∈U}. Chứng minh. Ta cú: HΣ(x, p, u) =Hmax(x, p) ⇔HΣ(x, p, u)≥HΣ(x, p, u), u∈U, ⇔HΣ(x, p, u)−HΣ(x, p, u)≥0, u∈U, ⇔ hp, f(x, u)−f(x, u)i ≤0, u∈U, ⇔ hp, vi ≤0, v ∈ {f(x, u)−f(x, u)|u∈U},
như vậy ta cú điều phải chứng minh.
Với một hệ Σ = (X, f, U) và x∈X ta kớ hiệu:
FΣ(x) = {f(x, u)|u∈U} ⊂Rn.
Với khỏi niệm này trong Hỡnh 2.5 minh họa lý do hàm Hamilton được cực đại húa: vectơ p ∈ Rn trực giao với một siờu phẳng giỏ của FΣ(x). Sự tồn tại của một vectơ
p như vậy suy ra cực đại húa theo điều khiển của hàm Hamilton xảy ra trờn biờn của
conv(FΣ(x)).
Bổ đề 2.3.8(Hàm Hamilton và nún tiếp xỳc trờn khoảng cố định). Cho Σ = (X, f, U) là một hệ điều khiển, x0 ∈X, t0, t1 ∈R thỏa món t0 < t1 và cho à∈U(x0, t0,[t0, t1]). Với mỗi t ∈ [t0, t1] gọi Kt ⊂Rn là một nún lồi sao cho K(à, x0, t0, t) ⊂Kt và giả sử rằng tại τ ∈[t0, t1] tồn tại λ(t)∈Rn sao cho:
hλ(τ), vi ≤0, v ∈Kτ.
Giả sửt 7→λ(t)là phản hồi liờn hợp của Σdọc theo(ξ(à, x0, t0,ã), à) và bằngλ(τ) tại thời điểm τ. Khi đú, với bất kỳ t ∈Leb(à, x0, t0, τ) ta cú
HΣ(ξ(à, x0, t0, t), λ(t), à(t)) = HΣmax(ξ(à, x0, t0, t), λ(t)).
Hỡnh 2.5: Minh họa điều kiện cực đại húa hàm Hamilton, miền tụ màu làFΣ(x).
Chứng minh. Viết tắt: ξ =ξ(à, x0, t0,ã). Cho t ∈Leb(à, x0, t0, τ) và xột dữ kiện biến phõn nhọn trờn khoảng cố định (t,1, ω) với ω ∈U. Theo Bổ đề 2.3.2, ta cú:
Φ (à, x0, t0, t, τ).(f(ξ(t), ω)−f(ξ(t), à(t)))∈K(à, x0, t0, τ)⊂Kτ. Do đú, hλ(τ),Φ (à, x0, t0, t, τ).f(ξ(t), ω)i − hλ(t),Φ (à, x0, t0, t, τ).f(ξ(t), à(t))i ≤0. Dựng Mệnh đề 2.2.14 cú hλ(t), f(ξ(t), ω)i − hλ(t), f(ξ(t), à(t))i ≤0, hoặc, sử dụng Bổ đề 2.3.7, ta cú HΣ(ξ(t), λ(t), ω)≤HΣ(ξ(t), λ(t), à(t)),
với mọiω ∈U nờn bổ đề được chứng minh.
Theo bổ đề này giỏ trị cực đại của Hamilton tại hầu hết cỏc thời điểm [t0, τ]được suy ra từ sự tồn tại của một siờu phẳng giỏ của nún tiếp xỳc trờn khoảng tự do tạiτ. Sự tồn tại của siờu phẳng giỏ như vậy cho biết đụi điều về điều khiển cực trị. Cụ thể hơn, bằng việc ỏp dụng cỏc biến phõn nhọn, cỏc quỹ đạo tại thời điểm τ. Cỏc Bổ đề 2.3.7 và 2.3.8 cho thấy điều khiển phải cú một tớnh chất cực trị tại hầu hết cỏc thời điểm trước τ.
Bổ đề 2.3.9 (Một điều kiện để hàm Hamilton cực đại bằng 0). Cho Σ = (X, f, U) là mụt hệ điều khiển, x0 ∈ X, t0, t1 ∈ R thỏa món t0 < t1, à ∈ U(x0, t0,[t0, t1]) và τ ∈
[t0, t1]. Với mỗit∈[t0, t1]gọiKt⊂Rnlà một nún lồi sao chospanR(f(ξ(à, x0, t0, τ), à(τ))) ⊂
Kτ. Giả sử tồn tại một ỏnh xạt 7→λ(t) sao cho:
hλ(τ), vi ≤0, v ∈Kτ.
Khi đú
HΣ(ξ(à, x0, t0, t), λ(τ), à(τ)) = 0.
Chứng minh. Vỡ spanR(f(ξ(à, x0, t0, τ), à(τ)))⊂Kτ ta cú:
hλ(τ), αf(ξ(à, x0, t0, τ), à(τ))i ≤0, với mỗiα ∈R. Lấy α = 1 và α=−1thỡ
hλ(τ), f(ξ(à, x0, t0, τ), à(τ))i=HΣ(ξ(à, x0, t0, τ), λ(τ), à(τ)) = 0.
Khi điều khiển bị chặn, kết quả trờn cú thể làm mạnh thành hàm Hamilton cực đại là hằng số.
Bổ đề 2.3.10 (Tớnh khụng đổi của Hamilton cực đại). Cho Σ = (X, f, U) là một hệ điều khiển, x0 ∈ X, t0, t1 ∈R thỏa món t0 < t1, à ∈ U(x0, t0,[t0, t1])TUbdd([t0, t1]). Giả sử λ: [t0, t1]→Rn là một phản hồi liờn hợp củaΣ dọc theo(ξ(à, x0, t0,ã), à) thỏa món:
HΣ(ξ(à, x0, t0, t), λ(t), à(t)) = Hmax
Σ (ξ(à, x0, t0, t), λ(t)),
với hầu hết t ∈[t0, t1] khi đú hàm t7→Hmax
Σ (ξ(à, x0, t0, t), λ(t))là hằng số.