Trình bày một cách tổng quan điều kiện tối ưu cho một số lớp bài toán tối ưu hai cấp quan trọng.
Trang 1ĐIỀU KIỆN TỐI ƯU CHO MỘT SỐ LỚP
BÀI TOÁN TỐI ƯU HAI CẤP
NGUYỄN LÊ DUY (Học viên Cao Học khóa 16)
NGƯỜI HƯỚNG DẪN KHOA HỌC: PGS TS NGUYỄN ĐỊNH
(Trường Đại Học Quốc Tế TP HCM)
TP.Hồ Chí Minh - Năm 2009
Trang 2Lời cảm ơn
Lời đầu tiên, tôi xin chân thành cảm ơn sâu sắc tới PGS TS NGUYỄN ĐỊNH,người Thầy đã tận tình chỉ dẫn và truyền đạt kiến thức trong quá trình học tập vàluôn động viên để tôi hoàn thành luận văn này
Tôi cũng xin bày tỏ lời cảm ơn tới tất cả các Thầy cô của Khoa Toán-Tin trườngĐại Học Khoa Học Tự Nhiên Tp.HCM đã giảng dạy tôi trong suốt quá trình họctập tại trường
Tôi xin cảm ơn gia đình đã tạo điều kiện tốt cho việc học của tôi và bạn bè đã hỗtrợ trong việc hoàn thành luận văn này
Tp Hồ Chí Minh, tháng 9 năm 2009
Nguyễn Lê Duy
Trang 3Lời nói đầu
Bài toán tối ưu hai cấp (Bilevel Optimization Problem) lần đầu tiên đượcH.V.Stackelberg nghiên cứu vào năm 1934 Sau đó nó chính thức được giới thiệutrong cộng đồng tối ưu vào thập kỷ 70 của thế kỷ thứ 20 Bài toán phát triển rấtnhanh chóng cả trong lý thuyết và ứng dụng thực tế Các nhà toán học, nhà kinh tếhọc và những kỹ sư đã và đang không ngừng phát triển vấn đề này cùng với đó là
số lượng các bài báo, tạp chí khoa học, ứng dụng trong kinh tế kỹ thuật xuất hiệnngày càng nhiều hơn
Bài toán tối ưu hai cấp là một bài toán tối ưu có cấp bậc trong đó một phầncác ràng buộc của bài toán - được gọi là bài toán cấp trên (upper level problem)
là tập nghiệm tối ưu của một bài toán tối ưu thứ hai - được gọi là bài toán cấpdưới (lower level problem) Do đó bài toán này là một bài toán rất phức tạp Tuynhiên trong thực tế có rất nhiều bài toán có mô hình toán học là bài toán tối ưuhai cấp Hơn nữa bài toán tối ưu hai cấp có mối liên hệ chặt chẽ với những bài toánquan trọng khác, một trong số đó là bài toán MPECs (Mathematical Programs withEquilibrium Constraints) - là bài toán mở rộng của bài toán đó, cũng có ứng dụngrộng rãi trong giao thông, điều khiển robot, hệ thống mạng,
Đối với bài toán tối ưu hai cấp, các nhà toán học nghiên cứu nhiều vấn đề: sựtồn tại nghiệm, điều kiện tối ưu, các thuật toán, Một vấn đề lớn trong việc nghiêncứu bài toán này là điều kiện tối ưu của nó Luận văn này trình bày một cách tổngquan điều kiện tối ưu cho một số lớp bài toán tối ưu hai cấp quan trọng, bao gồmlớp bài toán trơn, lớp bài toán lồi và tuyến tính, lớp bài toán lipschitz
Cấu trúc chính của luận văn bao gồm bốn chương Chương 1 trình bày các kiếnthức cơ bản sẽ sử dụng cho các chương sau Chương 2 giới thiệu bài toán tối ưu haicấp tổng quát và các mô hình các bài toán thực tế
Phần chính là điều kiện cần tối ưu sẽ trình bày ở chương 3 và chương 4 trong đó đềcập đến các lớp bài toán tối ưu hai cấp hữu hạn và bài toán tối ưu hai cấp vô hạn
Trang 4Mục lục
1.1 Một số kiến thức cơ bản về giải tích lồi 5
1.2 Hàm Lipschitz và dưới vi phân Clarke 11
1.3 Một số kiến thức cơ bản về giải tích đa trị 12
1.4 Dưới vi phân, nón pháp tuyến và đối đạo hàm Mordukhovich 16
2 Khái niệm về bài toán tối ưu hai cấp tổng quát 22 2.1 Giới thiệu bài toán 22
2.2 Mô hình các bài toán thực tế 27
3 Điều kiện tối ưu cho bài toán hai cấp hữu hạn 33 3.1 Điều kiện tối ưu khi bài toán cấp dưới lồi 34
3.2 Điều kiện tối ưu sử dụng dưới vi phân Mordukhovich 49
3.3 Điều kiện tối ưu sử dụng dưới vi phân Clarke 62
4 Điều kiện tối ưu cho bài toán hai cấp vô hạn 80 4.1 Bài toán hai cấp vô hạn 80
4.2 Điều kiện tối ưu cho bài toán DC vô hạn 81
4.3 Điều kiện tối ưu cho bài toán hai cấp vô hạn 87
Trang 54.4 Điều kiện cần và đủ cho bài toán hai cấp lồi đơn giản 93
Trang 6Chương 1
Một số kiến thức cơ bản
(1) Tập lồi và hàm lồi
Giả sử X là không gian vectơ.
Định nghĩa 1.1.1 [1] Tập K ⊆ X là lồi nếu
Như vậy, bao lồi của K là tập lồi nhỏ nhất chứa K.
Định nghĩa 1.1.2 [1] Cho hàm số f : X → R Khi đó f được gọi là hàm lồi nếu
∀x, y ∈ X, ∀λ ∈ [0, 1], λf (x) + (1 − λ)f (y) ≥ 0.
Cho X, Y là các không gian vectơ S là nón lồi trong Y
Định nghĩa 1.1.3 [1] Cho hàm số f : X → Y Khi đó f được gọi là hàm S–lồi nếu
Trang 7∀x, y ∈ X, ∀λ ∈ [0, 1], λf (x) + (1 − λ)f (y) − f (λx + (1 − λ)y) ∈ S.
Nhận xét 1.1.1 Trường hợp f lồi là một trường hợp đặc biệt của hàm S–lồi khi
S = R+.
(2) Dưới vi phân của hàm lồi, đối ngẫu của hàm lồi
(a) Dưới vi phân của hàm lồi
Cho f là hàm số lồi, một hàm số lồi thì có thể không có đạo hàm do đó ta xét
tới khái niệm sau Chúng ta cần nêu ra vài khái niệm cơ bản:
Hàm số thực mở rộng f : X → R trong đó trong đó R = RS{+∞; −∞}
Miền hữu hiệu (domain) domf := {x ∈ X|f (x) < ∞} và đồ thị trên (epigraph) epif := {(x, α) ∈ X × R|f (x) ≤ α}.
Định nghĩa 1.1.4 [1] Cho hàm số f : X → R lồi, và X ∗ là không gian đối ngẫu
của không gian vectơ X Giả sử x o ∈ X và f (x o ) 6= ±∞ Khi đó dưới vi phân của
hàm lồi f tại x o được xác định như sau
∂f (x o ) := {x ∗ ∈ X ∗ : hx ∗ , x − x o i ≤ f (x) − f (x o ), ∀x ∈ X}. (1.1)
Nếu f không hữu hạn tại x thì ∂f (x o ) = ∅.
Mỗi thành phần x ∗ ∈ ∂f (x o ) được gọi là dưới gradient của dưới vi phân ∂f (x o), khi
đó ∂f (x o) còn gọi là tập các dưới gradient
Đây là định nghĩa dưới vi phân cổ điển của hàm số f Các phần sau ta sẽ nêu các định nghĩa dưới vi phân mở rộng.
(b) Đối ngẫu của hàm lồi
Cho X là không gian Banach và hàm f : X → R lồi, luôn luôn proper nghĩa là
f (x) 6= ∞ trên X Gọi X ∗ là không gian đối ngẫu của X
Trang 8Định nghĩa 1.1.5 [1] Hàm đối ngẫu f ∗ : X ∗ → R của f , được xác định như sau:
f ∗ (x ∗ ) := sup{hx ∗ , xi − f (x)|x ∈ X}.
Nhận xét 1.1.2 Do f (x) 6= +∞(x ∈ domf ) suy ra sup {hx ∗ , xi − f (x)|x ∈ X}
luôn 6= ∅ nên f ∗ (x ∗ ) cũng = sup {hx ∗ , xi − f (x)|x ∈ domf }.
Cho hàm f : X → R lồi, là proper nếu f (x) 6= ∞ trên X Nhắc lại hàm đối ngẫu
f ∗ : X ∗ → R đối với f , xác định bởi f ∗ (x ∗ ) := sup {hx ∗ , xi − f (x)| x ∈ X =
sup {hx ∗ , xi − f (x)| x ∈ domf }.
Cho hàm f : X → R lồi tại x ∈ domf và ε > 0 bất kì, thì dưới vi phân xấp xỉ của hàm f là ∂ ε f (x) := {x ∗ ∈ X ∗ | hx ∗ , x − xi ≤ f (x) − f (x) + ε ∀x ∈ X}, ε ≥ 0
Nếu ε = 0 thì ta có ∂ ε f (x) = ∂ o f (x) là dưới vi phân cổ điển có dạng như (1.1).
(3) Bài toán quy hoạch lồi và điều kiện tối ưu
(a) Bài toán quy hoạch lồi đơn giản
Sau đây chúng tôi xin nêu một kết quả về điều kiện tối ưu cho bài toán này
Phần chứng minh sẽ được làm rõ trong phần bài toán quy hoạch lồi tổng quát ngay
sau đây Hai điều kiện chính quy sau đây xem trong [1]
Trang 9Định nghĩa 1.1.6 (Điều kiện chính quy Slater) (Slater) ∃ x ∈ C, g i (x) < 0, i =
trong đó ∂f (x) kí hiệu cho dưới vi phân của hàm số f tại điểm x.
(b) Bài toán quy hoạch lồi tổng quát
Một bài toán tối ưu có dạng như bài toán sau đây được gọi là bài toán quy hoạchlồi tổng quát
Trang 10trong đó A1 ∈ L(X, R m ) và b1 ∈ R m
Một bài toán thứ hai cũng tương tự như bài toán (U), chỉ thay A1x = b1
bởi A2x = b2, và thay i ∈ {1, , n} bởi i ∈ I trong đó I là tập chỉ số tùy ý,
A2 ∈ L(X, Y2) với Y2 là không gian định chuẩn và b2 ∈ Y2.
Ta có thể chuyển hai bài toán này về bài toán lồi tổng quát dễ dàng
Bây giờ, gọi A = {x ∈ X|x ∈ C, g(x) ∈ −S} là tập các điểm chấp nhận được của (P), rõ ràng tập A là lồi đóng trong X.
Định nghĩa 1.1.7 [1] Nón đối ngẫu dương của nón lồi S, ký hiệu S+, được xácđịnh:
S+ = {y ∗ ∈ Y | < y ∗ , s > ≥ 0, ∀s ∈ S}
Định lý 1.1.2 ([1], Điều kiện cần tối ưu Fritz–John) Xét bài toán (P tq ) và
các (GTCB) thỏa mãn và intS 6= ∅ và a ∈ A Khi đó nếu a là nghiệm của (P) thì
∃λ o ∈ R+, λ ∈ S+ không đồng thời bằng 0 sao cho:
Chứng minh
Vì a ∈ A là nghiệm của (P tq ) nên hệ sau vô nghiệm theo x ∈ C :
−(f (x) − f (a)) ∈ intR+, g(x) ∈ −S, x ∈ C
Do vậy hệ sau vô nghiệm −(f (x) − f (a), g(x)) ∈ int(R+× S), x ∈ C, nghĩa là tồn
tại λ = (λ o , λ) ∈ (R+× S)+ với λ 6= (0, 0) sao cho
λ(f (x) − f (a), g(x)) = λ0(f (x) − f (a)) + λg(x) ≥ 0, ∀x ∈ C
hay λ o f (x) − λ0f (a) + λg(x) ≥ 0, ∀x ∈ C(1), cho x = a ta được λg(x) ≥ 0 Mặt
khác ta có λg(x) ≤ 0 (do λ ∈ S+, g(a) ∈ −S), suy ra λg(x) = 0(2).
Từ (1) và (2) ta có: λ o f (x)+λg(x) ≥ λ o f (a)+λg(a), ∀x ∈ C Do vậy a là nghiệm
của bài toán lồi sau đây:
Trang 11inf(λ o f (x) + λg(x)).
Vì λ0f và λg liên tục nên từ đây suy ra 0 ∈ ∂(λ o f + λg)(a) + N C (a),
Cũng vì λ0f và λg liên tục nên suy ra 0 ∈ ∂(λ o f )(a) + ∂(λg)(a) + N C (a).
Vậy định lý được chứng minh ¤
Chú ý : Nếu λ0 = 0 thì điều kiện sẽ không chứa thông tin gì về hàm mục tiêu f
và do đó sẽ không có giá trị gì Do đó việc khẳng định λ0 6= 0 là hết sức quan trọng.
Các điều kiện đặt trên các biểu thức sao cho λ o 6= 0 và có thể chọn λ o = 1 Mộttrong các điều kiện quan trọng là điều kiện chính quy Slater (mở rộng) và điều kiệnchính quy Kartin:
Định nghĩa 1.1.8 Điều kiện chính quy Slater mở rộng (SCQ): ∃ x ∈ C sao
cho −g(x) ∈ intS
Điều kiện chính quy Kartin (KCQ): @ λ ∈ S+và λ 6= 0 sao cho λg(x) ≥ 0, ∀x ∈
C.
Định lý 1.1.3 ([1], Điều kiện cần và đủ KKT) Giả sử các giả thiết như trên
Định lý 1.3.2 và thêm (KCQ) thỏa mãn Khi đó ta có kết luận như trên với λ o = 1
nghĩa là a là nghiệm của (P tq ) khi và chỉ khi tồn tại λ ∈ S+ sao cho hệ sau thỏa:
Giả sử λ o = 0 Khi đó ta có 0 ∈ ∂(λg)(a) + N C (a)
Do đó tồn tại x ∗ ∈ ∂(λg)(a) sao cho −x ∗ ∈ N C (a) hay x ∗ (x − a) ≥ 0, ∀x ∈ C Vậy
(λg)(x) − (λg)(a) ≥ x ∗ (x − a) ≥ 0
Trang 12kết hợp (λg)(a) = 0 suy ra (λg)(x) ≥ 0 mâu thuẫn với (KCQ) Vậy λ0 6= 0 do đó có
điều này tương đương
f (x) + (λg)(x) ≥ f (a) + λg(a) = f (a) (do λg(a) = 0), ∀x ∈ C.
Mặt khác do x ∈ C, g(x) ∈ −S nên λg(x) ≤ 0 , suy ra f (x) ≥ f (a), ∀x ∈ A nghĩa là x = a là nghiệm của bài toán ¤
Các khái niệm thuộc lý thuyết vi phân được đề xuất bởi Clarke vào năm 1973.
Năm 1983 lý thuyết này được Clarke bổ sung và hoàn chỉnh Ở đây ta chỉ nêu một
phần rất nhỏ của lý thuyết này, về hàm Lipschitz địa phương, đạo hàm theo hướng
Clarke và dưới vi phân Clarke.
Cho hàm số thực f : R n → R, và x ∈ R n
Định nghĩa 1.2.1 [5] (Hàm Lipschitz địa phương) Hàm f được gọi là Lipschitz
địa phương tại x, nếu tồn tại hằng số k và ε > 0 sao cho
|f (x1) − f (x2)| ≤ k|x1− x2| ∀x1, x2 ∈ x + εB (1.2)với B là quả cầu đơn vị trong Rn
Trang 13Định nghĩa 1.2.2 [5] (Đạo hàm theo hướng của hàm Lipschitz địa phương)
Cho f Lipschitz địa phương tại x, và v là vecto bất kì trong R n Khi đó đạo hàm
theo hướng v của hàm f tại x, kí hiệu f o (x; v) xác định như sau:
f o (x; v) := lim sup
x0 →x, t↓0
f (x 0 + tv) − f (x 0)
t
Định nghĩa 1.2.3 [5](Dưới vi phân Clarke) Dưới vi phân Clarke của hàm f tại
x, kí hiệu ∂ o f (x) xác định như sau:
∂ o f (x) := {ξ ∈ R n |f o (x; v) ≥ hv, ξi, ∀v ∈ R n }. (1.3)
Mỗi phần tử ξ ∈ ∂ o f (x) được gọi là dưới gradient Clarke.
Tính chất[5]
• Khi f trơn (nghĩa là khả vi chặt hay khả vi liên tục) thì ∂ o f (x) ≡ {∇f (x)}
• Khi f lồi thì ∂ o f (x) ≡ {ξ|f (x + u) − f (x) ≥ hu, ξi}, ∀u ∈ R n (tập dưới vi
phân của hàm f tại x, (xem mục 1.1)).
(1) Ánh xạ đa trị
Cho X, Y là hai tập bất kì Cho F : X ⇒ Y là ánh xạ từ tập X vào toàn bộ các tập con của Y (được kí hiệu là 2 Y ) Ta nói F là ánh xạ đa trị từ X vào Y Như vậy với mỗi x ∈ X, F (x) là một tập con của Y (F (x) có thể = ∅).
Nếu với mỗi x ∈ X, tập F (x) chỉ gồm đúng một phần tử của Y , thì F là ánh xạ đơn
trị từ X vào Y và thay cho kí hiệu F : X ⇒ Y thì ta sử dụng kí hiệu quen thuộc
là F : X → Y
Định nghĩa 1.3.1 [2, Định nghĩa 1.1.1] Đồ thị và miền hữu hiệu của ánh xạ đa trị
F : X ⇒ Y tương ứng được xác định như sau:
gph F = {(x, y) ∈ X × Y |y ∈ F (x)}, (1.4)
dom F = {x ∈ X|F (x) 6= ∅}. (1.5)
Trang 14Nhắc lại, nếu ánh xạ đơn trị, là hàm thực mở rộng f : X → R thì miền hữu hiệu domf := {x ∈ X|f (x) < ∞} và đồ thị trên (epigraph) epif := {(x, α) ∈
X × R|f (x) ≤ α}.
Định nghĩa 1.3.2 [21, Định lý 19.1] Tập M ⊂ R n được gọi là tập lồi đa diện
(polyhedral convex set) nếu M có thể biểu diễn được dưới dạng giao của một số hữu
hạn nửa không gian đóng của Rn , nghĩa là tồn tại các điểm a1, , a p ∈ M và các
phương v1, , q ∈ R n sao cho
Bây giờ giả sử X, Y là các không gian metric.
Định nghĩa 1.3.3 [2, Định nghĩa 1.2.1; 1.2.2; 1.2.3] Ta nói F là nửa liên tục trên (usc) tại x ∈ dom F nếu với mọi tập mở V ⊂ Y thỏa F (x) ⊂ V tồn tại lân cận mở
U của x sao cho
F (x) ⊂ V ∀x ∈ U.
Nếu F usc tại mọi điểm thuộc dom F thì F được gọi là usc trong X
Ta nói F là nửa liên tục dưới (lsc) tại x ∈ dom F nếu với mọi tập mở V ⊂ Y thỏa
F (x) ∩ V 6= ∅ tồn tại lân cận mở U của x sao cho
F (x) ∩ V 6= ∅ ∀x ∈ U ∩ dom F.
Nếu F lsc tại mọi điểm thuộc dom F thì F được gọi là lsc trong X
Ta nói F là liên tục tại x ∈ dom F nếu F đồng thời usc và lsc tại x Nếu F liên tục tại mọi điểm thuộc dom F thì F được gọi là liên tục trên X.
Xét hàm thực mở rộng f : X → R với X là không gian metric.
Định nghĩa 1.3.4 [2]
Ta nói f là usc tại x ∈ dom f nếu
lim inf
x→x f (x) ≥ f (x)
Trang 15epi(f1+ f2)∗ = cl∗ (epif1∗ + epif2∗)
thỏa mãn với mọi hàm lsc và lồi f i : X → R, i = 1, 2, trong đó cl ∗ có thể bỏ đi nếu
f i liên tục tại điểm x ∈ domf1∩ domf2 Hơn nữa chúng ta còn có công thức tổngcác dưới vi phân được thiết lập trong [3] Bổ đề sau đây miêu tả hai yếu tố này:
Bổ đề 1.3.1 [7, 9](Công thức tổng epi và tổng dưới vi phân cho hàm lồi)
Giả sử f i : X → R, i = 1, 2 là lsc, lồi và domf1∩ domf2 6= ∅ Khi đó hai điều kiện sau tương đương:
• (i) Tập epif ∗
1 + epif ∗
2 đóng yếu ∗ trong X ∗ × R.
Trang 16• (ii) Công thức sau thỏa
epi(f1+ f2)∗ = (epif ∗
1 + epif ∗
Hơn nữa, ta có
∂(f1+ f2)(x) = ∂f1(x) + ∂f2(x), với x ∈ domf1∩ domf2, (1.7)
trong đó ∂f (.) là dưới vi phân cổ điển (Định nghĩa 1.1.4).
Chứng minh (xem [9])
Ngay sau sự ra đời của lý thuyết vi phân Clarke, thì năm 1976, Mordukhovich
đã đề xuất những khái niệm về lý thuyết vi phân của riêng ông, từ đó đến nay thìông đã hoàn chỉnh lý thuyết ấy Thực sự giải tích hiện đại nghiên cứu về các đối
tượng không trơn (nonsmooth) như tập, hàm, ánh xạ đa trị và các công cụ giải tích
mở rộng của phép tính vi phân Trong mục này chúng ta sẽ sử dụng các đối tượng
đề xuất bởi Mordukhovich, đây là công cụ tính toán mạnh mẽ và đầy đủ, thích
hợp để nghiên cứu về bài toán tối ưu hai cấp.Việc xây dựng lý thuyết vi phân vô
hạn chiều của ông theo các bước chính:
• Định nghĩa khái niệm dưới vi phân của các hàm số nhận giá trị trong tập số
Sau đây ta xin nêu các khái niệm trong lý thuyết vi phân mở rộng của
Mor-dukhovich Để tìm hiểu cụ thể xin xem trong ([2], chương 1, 4) và [17, 18] (sáchmới nhất năm 2006) của Mordukhovich
Trang 171.4 Dưới vi phân, nón pháp tuyến và đối đạo hàm
Mordukhovich
Xét ánh xạ đa trị F : X ⇒ X ∗ giữa không gian Banach X và không gian đối
ngẫu X ∗ của nó Kí hiệu
Cho hàm f : X → R và tập Ω ⊂ X Các kí hiệu x → f x và x →Ω x tương ứng
có nghĩa là
x → x với f (x) → f (x) và x → x với x ∈ Ω.
Định nghĩa 1.4.1 ([2], Dưới vi phân Fréchet)
Cho X là không gian Banach, xét hàm f : X → R là hàm thực suy rộng, hữu hạn tại x Với mỗi ε ≥ 0, đặt
ˆε f (x) := {x ∗ ∈ X ∗ | lim inf
x→x
f (x) − f (x) − hx ∗ , x − xi
Tập ˆ∂ ε f (x) được gọi là ε− dưới vi phân Fréchet của f tại x, còn các phần tử của
nó là ε− dưới gradient Fréchet của f tại x.
Tập ˆ∂f (x) := ˆ ∂ o f (x) được gọi là dưới vi phân Fréchet của f tại x
Trang 18Ta nhắc lại hai khái niệm khả vi Frechet và khả vi chặt (trơn), (xem [2]).
Hàm f được gọi là khả vi Frechet tại x ∈ X nếu tồn tại x ∗ ∈ X ∗ sao cho
lim
x→x
f (x) − f (x) − hx ∗ , x − xi
khi đó x ∗ được gọi là đạo hàm Frechet của f tại x, và dễ thấy {x ∗ } = ˆ ∂f (x).
Hàm f được gọi là khả vi chặt tại x ∈ X nếu f khả vi Frechet tại x và
Nếu f là hàm lồi thì tập ∂f (x) trùng với dưới vi phân của giải tích lồi (1.1) phần
trên
Bây giờ chúng ta tìm hiểu cụ thể các đối tượng nón pháp tuyến và đối đạo hàm.
Dựa trên nền tảng các đối tượng giải tích do Mordukhovich đề xuất, ta tách các
trường hợp Mục đích của việc tách là chúng ta xét hàm thực mở rộng trong trường
hợp không gian Banach tùy ý và trong không gian hữu hạn, sẽ sử dụng cho bài toán hai cấp vô hạn và bài toán hai cấp hữu hạn (xem cụ thể chương 3 và chương 4
Trang 19Nón pháp tuyến Fréchet được xác định như sau:
Bây giờ chúng ta tìm hiểu khái niệm "Đối đạo hàm":
Xét ánh xạ đa trị F : X ⇒ Y giữa các không gian Banach.
Định nghĩa 1.4.3 [2, Đối đạo hàm Fréchet, đối đạo hàm Mordukhovich] Đối đạo
hàm Fréchet của F tại (x, y) ∈ gph F và đối đạo hàm Mordukhovich tại điểm tương
ứng, lần lượt cho bởi
Nếu F (x) = f (x) đơn trị, thì chúng ta viết ˆ D ∗ f (x) thay cho ˆ D ∗ f (x, f (x)) và viết
D ∗ f (x) thay cho D ∗ f (x, f (x)) Khi đó nếu f tương ứng là khả vi Fréchet và khả
vi chặt tại x thì các đối đạo hàm phía trên xác định như sau:
ˆ
D ∗ f (x)(y ∗ ) = (∇f (x)) ∗ (y ∗ ) ∀y ∗ ∈ Y ∗
D ∗ f (x)(y ∗ ) = (∇f (x)) ∗ (y ∗ ) ∀y ∗ ∈ Y ∗
Lúc này, với mọi y ∗ ∈ Y ∗, ˆD ∗ f (x)(y ∗ ) và D ∗ f (x)(y ∗) là các tập chỉ chứa một phần
tử Nếu f khả vi chặt, thì hai tập này bằng nhau
D ∗ f (x)(y ∗) = ˆD ∗ f (x)(y ∗ ) = (∇f (x)) ∗ (y ∗ ) ∀y ∗ ∈ Y ∗
Trang 20Cuối cùng chúng tôi nêu mối quan hệ giữa đối đạo hàm của ánh xạ đơn trị
Lipschitz địa phương (xem mục 1.2) f : X → Y với dưới vi phân Fréchet của hàm
D ∗ f (x)(y ∗) = ˆ∂hy ∗ , f (x)i.
Trường hợp: f : X → R trong đó X là không gian hữu hạn chiều
Giả sử X = R n , như vậy hàm f trở thành f : R n → R.
Các khái niệm sau xem cụ thể trong ([14], mục 2)
Đầu tiên, chúng ta tìm hiểu khái niệm nón pháp tuyến mở rộng của một tậpkhác rỗng
Cho tập Ω ⊂ R n và x ∈ Ω ; khi đó nón pháp tuyến của Ω tại x xác định bởi
trong đó ” lim sup ” là giới hạn trên theo nghĩa Painlevé-Kuratowski của một ánh
xạ đa trị S : R n ⇒ Rm với u → x xác định bởi
Xét ánh xạ đa trị: D ∗ S(x, y) : R m → R n với giá trị
D ∗ S(x, y)(v) := {u ∈ R m |(u, −v) ∈ N((x, y); gphS)}, v ∈ R m
Trang 21Đây chính là ánh xạ đối đạo hàm của S tại (x, y).
Nếu S đơn trị và khả vi chặt tại x với gradient ∇S(x) nghĩa là
Bây giờ ta xét một số tính chất của hàm Lipschitz, cho hàm ϕ : R n → R liên
tục lipschitz quanh x, có dưới vi phân như sau:
∂ϕ(x) = lim sup
x→x
ˆ
trong đó ˆ∂ϕ(x) là dưới vi phân Fréchet của ϕ tại x Dưới vi phân (1.18) luôn luôn
khác rỗng và compac với mọi hàm Lipschitz địa phương
Rõ ràng nếu các hàm là khả vi chặt thì ∂ϕ(x) = {∇ϕ(x)}.
Ngoài ra ∂ϕ(x) = {v ∈ R n |(v, −1) ∈ N((x, ϕ(x)); epiϕ)} với N(.) xác định như
(1.16)
Nếu ánh xạ S đơn trị, Lipschitz địa phương thì D ∗ S(x)(v) = ∂hv, Si(x) v ∈ R m
trong đó ∂ϕ(.) xác định như (1.18) và hv, Si(x) = hv, S(x)i
Chúng ta sử dụng tính chất của bao lồi của dưới vi phân
co∂(−ϕ)(x) = −co∂ϕ(x) (1.19)
Cho ánh xạ đa trị S : R n ⇒ Rm và một điểm x với S(x) 6= ∅, ta nói rằng S là
nửa compac trong (inner semicompact) tại x nếu với mỗi dãy x v → x với S(x v ) 6= ∅ thì có một dãy y v ∈ S(x v ) chứa một dãy con hội tụ khi v → ∞ Rõ ràng trong
không gian hữu hạn chiều thì "inner semicompactness" thỏa khi S là bị chặn đều
("uniformly bounded") quanh x nghĩa là có một lân cận U của x và tập C bị chặn
⊂ R m sao cho
S(x) ⊂ C khi x ∈ U.
Trang 22Tiếp theo ta tìm hiểu một khái niệm khác, cho ánh xạ đa trị S : R n ⇒ Rm, ta
nói S là nửa liên tục trong (inner semicontinuous) tại (x, y) ∈ gphS nếu với bất kì dãy x v → x thì có một dãy y v ∈ S(x v ) hội tụ về y khi v → ∞.
Lưu ý rằng tính nửa liên tục trong của S tại (x, y) có liên quan đến tính Lipschitz–
like tại điểm này mà mở rộng tính liên tục Lipschitz địa phương của ánh xạ đa trị
trong không gian Hausdorff
Ánh xạ đa trị S : R n⇒ Rm thỏa mãn tính chất Lipschitz–like tại điểm (x, y) ∈ gph S nếu có một lân cận U của x, V của y và một hằng số l ≥ 0 sao cho
S(x) ∩ V ⊂ S(u) + lkx − ukB ∀x, u ∈ U
trong đó B là quả cầu đơn vị đóng Tính chất này được biết là tương đương với tính chính quy metric và tính mở tuyến tính của ánh xạ ngược S −1, có tầm quan trọng
trong tối ưu và giải tích phi tuyến Ngoài ra D ∗ S(x, y)(0) = {0} cung cấp đặc tính
đầy đủ của tính Lipschitz–like của S tại (x, y) M
Trang 23(1) Bài toán tổng quát và các lớp bài toán chính
Bài toán tối ưu hai cấp tổng quát là một bài toán tối ưu trong đó gồm hai
biến x và y với y được chọn là một nghiệm tối ưu của một bài toán thứ hai chứa tham số x Do đó đây là bài toán có cấp bậc theo ý nghĩa các ràng buộc của bài
toán cấp trên (the upper level problem) được xác định bởi một bài toán cấp dưới
(the lower level problem)
Ta xét dạng của bài toán cấp trên:
Trang 24Thông thường khi nghiên cứu điều kiện tối ưu thì người ta ít xét đến các ràng buộc
đẳng thức h j (x, y) = 0 (trong luận văn chúng tôi chỉ trình bày bài toán tối ưu hai
cấp bao gồm cả ràng buộc đẳng thức thế này, trong phần đầu của chương 3 Cácphần còn lại của chương 3 và toàn bộ chương 4, chúng tôi bỏ đi ràng buộc đẳng
thức này) Để hiểu một cách rõ ràng hơn, chúng tôi chia làm 3 lớp bài toán khác
y {f (x, y)|g i (x, y) ≤ 0} nếu không gồm ràng buộc đẳng thức.
Số lượng các ràng buộc hữu hạn, nghĩa là i ∈ I hữu hạn, j ∈ J hữu hạn, k ∈ K hữu
hạn
(b) Lớp bài toán tối ưu hai cấp vô hạn
Các hàm thực mở rộng F, f : X × Y → R, với R = R ∪ {+∞; −∞} trong không gian Banach X, Y tùy ý.
Hàm thực mở rộng g t: Rn × R m → R với t ∈ T , T là tập chỉ số vô hận.
(c) Lớp bài toán tối ưu hai cấp nửa vô hạn
Tương tự như ở lớp bài toán tối ưu hai cấp vô hạn, nhưng nếu chúng ta xét trongkhông gian hữu hạn chiều và giữ nguyên các giả thiết còn lại thì nó trở thành lớpbài toán tối ưu hai cấp nửa vô hạn
Trong luận văn chỉ xét hai lớp bài toán (a) và (b)
Tùy các tính chất khả vi liên tục, khả vi chặt, hay lồi, lipschitz mà chúng ta
có các lớp bài toán được chia nhỏ tương ứng, là bài toán trơn, lồi, lồi hoàn toàn,
lipschitz Vấn đề này sẽ được tìm hiểu cụ thể ở các chương sau Đặt
ϕ(x) := inf
y {f (x, y) sao cho g(x, y) ≤ 0, h(x, y) = 0}.
thì ϕ được gọi là hàm giá trị tối ưu của bài toán cấp dưới.
Trang 25Bây giờ, để hiểu về quá trình hình thành bài toán, ta hãy đến với mô hình kinh
tế, cũng là mô hình xuất hiện đầu tiên như sau
(2) Sự ra đời của bài toán và hai dạng bài toán cơ bản
Bài toán hai cấp có cấp bậc theo nghĩa có hai nhân tố quyết định những chọnlựa trên những mức độ khác nhau về cấp bậc Trong khi nhân tố thứ nhất – thường
gọi là người quyết định cấp trên hoặc ông chủ, đưa ra các chọn lựa x (lúc này x cố
định) của ông ấy trước, thì nhân tố thứ hai – thường được gọi là người quyết định
cấp dưới hoặc người làm công, xác định giải pháp y sau đó của anh ta theo một trong các lựa chọn của ông chủ Do đó biến x đóng một vai trò là tham số trong
(bài toán cần giải quyết) của người làm công
Hơn nữa ông chủ phải lường trước lựa chọn của người làm công, vì doanh thu củacông ty không chỉ phụ thuộc sự chọn lựa của ông ta mà còn cả sự tác động trở lạicủa người làm công
Theo đó, người làm công phải giải quyết bài toán chứa tham số x như sau:
min
y f (x, y) sao cho g(x, y) ≤ 0, h(x, y) = 0, (2.3)
với giả thiết f, g i , h j : Rn × R m → R, i = 1, , p, j = 1, , q và
g(x, y) = (g1(x, y), , g p (x, y)), h(x, y) = (h1(x, y), , h q (x, y)).
Đặt Ψ(x) là tập nghiệm tối ưu của bài toán này,
Ψ(x) := arg min
y {f (x, y)|g(x, y) ≤ 0, h(x, y) = 0} (2.4)
Như vậy bài toán của ông chủ có dạng như (2.1), bao gồm cực tiểu hóa hàm
F : R n × R m → R sao cho y ∈ Ψ(x) và x ∈ X với X tập đóng, X ⊆ R n, nghĩa làgiải quyết bài toán sau:
Trang 26được định nghĩa tốt (well-defined) trong trường hợp nghiệm tối ưu của bài toán cấp dưới (2.3) là duy nhất với mọi giá trị x ∈ X.
Xét trường hợp thứ nhất: nghiệm tối ưu của bài toán (2.3) xác định duy nhất với mọi giá trị tham số x ∈ X.
Định nghĩa 2.1.1 [10], (Nghiệm của bài toán hai cấp) Giả sử Ψ(x) chứa ít nhất 1 điểm với mọi giá trị x ∈ X Khi đó một điểm (x ∗ , y ∗ ) ∈ R n × R mđược
gọi là nghiệm tối ưu địa phương của bài toán (2.5) nếu x ∗ ∈ X, y ∗ ∈ Ψ(x ∗) và
tồn tại một lân cận mở U δ (x ∗ ), δ > 0 sao cho F (x, y) ≥ F (x ∗ , y ∗ ) ∀(x, y) thỏa
x ∈ U δ (x ∗ ), y ∈ Ψ(x) Nó được gọi là nghiệm tối ưu toàn cục của bài toán (2.5) nếu
δ = ∞.
Khái niệm trên mô tả khi nghiệm y = y(x) của người làm công được tiên đoán
bởi ông chủ Do đó ông chủ phải giải bài toán: min
trong đó: Ψ(x) = Arg min
y {−xy|0 ≤ y ≤ 1} (bài toán cấp dưới).
Ta có thể thấy ngay giá trị hàm mục tiêu của bài toán cấp trên là không rõ ràngnếu người làm công không thông tin lựa chọn của anh ta tới ông chủ
Việc giải quyết bài toán the cấp trên của ông chủ phụ thuộc vào tác động trở
Trang 27lại của người làm công: bài toán cấp trên chỉ giải được trong trường hợp khi người
làm công chọn y(0) = 0 ∈ Ψ(x) Do vậy giá trị tối ưu 0 của bài toán 2 cấp không bao giờ đạt được nếu người làm công không chọn y(0) = 0.
Khái niệm giá trị tối ưu thực chất không rõ ràng ở chỗ: có rất nhiều chọn lựa x làm cho hàm F (x, y(x)) tiến về 0 nhưng có thể không đạt tại giá trị ấy Ta không
có khả năng khắc phục nhược điểm này nếu như người làm công được phép chọn
tự do trong khi ông chủ cứ ngồi một vị trí mà theo dõi mọi chọn lựa của anh ta
Người làm công chỉ cần chọn 0.5 ∈ Ψ(0) và thế là bài toán ở ví dụ trên sẽ không có
nghiệm.
Để cho bài toán 2 cấp vẫn được xác định ta phải xét trường hợp thứ hai: nghiệmcủa bài toán cấp dưới (2.3) không duy nhất
Chúng ta có hai dạng bài toán phân biệt khắc phục trở ngại này:
Bài toán hai cấp dạng optimistic:
Ý nghĩa của hai bài toán (2.6) và (2.8): Bài toán hai cấp dạng optimistic được
áp dụng khi ông chủ tin rằng (hoặc ông ta có khả năng thuyết phục) người làm công
sẽ luôn tìm ra giải pháp tối ưu, cũng là lựa chọn tốt nhất từ ông chủ nên bài toán
(2.6) còn gọi là bài toán hai cấp lạc quan Bài toán hai cấp dạng pessimistic được
nhắc đến khi người làm công tỏ vẻ không hợp tác với ông chủ do đó bài toán (2.8)
còn gọi là bài toán hai cấp bi quan.
Trang 28Chúng ta chỉ tập trung nghiên cứu về bài toán tối ưu hai cấp dạng optimistictrong luận văn này.
Ta hãy nêu một số khái niệm cơ bản về nghiệm optimistic, nghĩa là nghiệm chobài toán dạng optimistic Ta nhắc lại đối với bài toán hai cấp dạng optimistic thìngười làm công phải giải quyết bài toán (2.6) Điều này dẫn tới khái niệm sau
Định nghĩa 2.1.2 ([10], Nghiệm tối ưu optimistic) Một điểm (x ∗ , y ∗ ) ∈ R n ×
Rm được gọi là nghiệm tối ưu optimistic địa phương cho bài toán (2.5) nếu x ∗ ∈
X, y ∗ ∈ Ψ(x ∗) sao cho
F (x ∗ , y ∗ ) ≤ F (x ∗ , y), ∀y ∈ Ψ(x ∗)
và tồn tại một lân cận mở U δ (x ∗ ), δ > 0 sao cho ϕ0(x ∗ ) ≤ ϕ0(x) ∀x ∈ X ∩ U δ (x ∗ ) Nếu δ = ∞ thì (x ∗ , y ∗) gọi là nghiệm optimistic toàn cục của (2.5)
(1) Bài toán Stackelberg (Stackelberg Games)
(a) Bài toán kinh tế thị trường (Market economy)
Chúng ta chỉ xét trường hợp đơn giản gồm hai thành phần: kẻ bán và người mua
Kẻ bán ra lệnh bán giá sản phẩm và tích trữ sản phẩm của mình, khi anh ta quyếtđịnh anh ta phải lường trước sự phản ứng của người mua bởi vì lợi nhuận sinh raphụ thuộc quyết định cả hai
Rõ ràng mỗi người ở vị trí của mình đều muốn tận dung triệt để lợi thế để sửdụng tốt nhất sự "đầu tư" của mình Tuy nhiên người bán là người có được sảnphẩm nên họ có vị trí độc lập( chỉ quan sát phản ứng bị phụ thuộc của người muadựa trên quyết định của người này) do vậy anh ta cố gắng đẩy cao lợi nhuận tốtnhất có thể Bài toán đặt ra được gọi là Stackelberg Game, có mô hình như sau:
Lấy X, Y lần lượt là tập chấp nhận được của chiến lược x và y tương ứng của
người bán(1), người mua(2) Giả sử giá trị chọn lựa đếm được nghĩa là hàm sử dụng
lần lượt của (1), (2) là f L (x, y), f F (x, y) Trước quyết định x của (1) thì (2) phải
Trang 29chọn y(x) sao cho hàm sử dụng tương ứng lớn nhất:
y(x) ∈ Ψ(x) := arg max
(b) Bài toán cân bằng Cournot – Nash (Cournot – Nash Equilibria)
Có n người bán và người mua tạo ra n thành phần, sản xuất ra số lượng x i sản
phẩm đồng nhất, i = 1, , n Đặt các hàm hao tổn là f (x i ) tất cả đều khả vi, liên
tục, lồi, không âm và lợi nhuận tương ứng khi bán ra sản phẩm của họ ra thị trường
là x i p(Pn j=1 x j ) Ở đây p : R → R là hàm nhu cầu tiêu dùng mô tả sự phụ thuộc
của giá cả theo số lượng yêu cầu của sản phẩm đó
Giả sử p là hàm khả vi liên tục, lồi chặt và giảm trên tập R++:= {r|r > 0} và hàm g(x) = xp(x) lõm trên R++ Lấy [a i , b i ] ⊂ R++ là tập đóng, bị chặn trong đó thành phần i tin rằng sản phẩm đó đem lại lợi nhuận Khi đó thành phần thứ i sẽ
giải quyết bài toán tìm số lượng sản phẩm tối ưu để lợi nhuận lớn nhất
Bây giờ giả sử thành phần thứ nhất có lợi thế so với các thành phần khác theo
hướng nó cố định số lượng đã xuất ra x1 trước tiên, và do đó tất cả n − 1 thành phần còn lại có tác động trở lại x1 Khi đó n − 1 thành phần ấy phải tính toán
"Nash Equilibrium" giữa nội bộ với nhau bằng cách giải quyết n − 1 bài toán kiểu (2.10) Giả sử "Nash Equilibrium" (x2(x1), , x n (x1))T xác định duy nhất với x1
cố định Khi đó thành phần 1 phải giải bài toán sau để cho lợi nhuận lớn nhất:
Trang 30(2) Bài toán hãng – đại lý (Principal – Agency Problems)
Các hãng(1) luôn phân phối hàng hóa đến các đại lý(2) và các đại lý sẽ đại diệncho hãng đó đối với sản phẩm tương ứng Họ kí kết hợp đồng trong đó (1) ủy quyền(một số) cho (2) qua đó (2) tự do chọn lựa hình thức buôn bán phù hợp với mụctiêu của nó Việc đó dẫn đến (2) sẽ cố gắng maximize lợi nhuận theo hành động củanó:
a là hành động buôn bán, a ∈ A, X: tập chấp nhận được của hành động a, s(x)
công trả cho (2) từ phía (1) tại x, s : X → R
G : R × A → R là hàm sử dụng tính giá trị s(x) từ phía (1) theo tác động của hành
động a và
g là hàm mật độ mô tả xác suất của kết quả thực tế x khi (2) dùng hành động a.
Từ cách quan sát của (1), hàm s mô tả một hệ dùng để thúc đẩy (2) hành động
theo mục đích của (1) Do đó (1) phải chọn hàm này sao cho (1) đạt lợi nhuận tốt
nhất có thể, (1) dùng hàm H : R → R đo bằng x − s(x) và (1) dùng hàm mật độ tương tự như g để đánh giá xác suất của x, (1) sẽ làm maximize:
S: tập chấp nhận được của tăng trưởng, a 0 : giải quyết (2.12) với a cố định
Dĩ nhiên chúng ta phải gắn với điều kiện sau:
Trang 31Tóm lại bài toán "Principal – Agency Problem": chọn s ∈ S, maximize (2.12) sao cho a 0 ∈ A, maximize (2.11) và thỏa (2.13).
(3) Bài toán Cân bằng hóa học tối ưu (Optimal Chemical Equilibria)Trong quá trình sản xuất ra chất hóa học, chúng ta luôn phải đặt ra câu hỏi làmthế nào để bào chế được một hỗn hợp chất sao cho:
(i) chất ta muốn hình thành là kết quả của phản ứng hóa học (PUHH) trong lòphản ứng được mong muốn xuất hiện càng nhiều,
(ii) độc chất hoặc tạp chất trong chất đó bằng không hoặc chiếm một lượng vôcùng bé
đây được xem là một bài toán tối ưu hai cấp, trong đó (i) là bài toán cấp dưới còn(ii) là bài toán cấp trên
Các nhà hóa học không thể quan sát PUHH trong nhiệt độ cao mà chỉ phân tích
được thời điểm cuối của phản ứng, bởi một bài toán lồi Trong bài toán lồi này, hàm
entropi f (x, p, T ) được làm cho bé nhất sao cho thỏa điều kiện là nguyên lý bảo
toàn khối lượng và các khối lượng đều không âm Hiển nhiên là quá trình cân bằng
hóa học phụ thuộc vào áp suất p, nhiệt độ T và khối lượng y của các chất trong
đây là bài toán cấp dưới,
trong đó G là số lượng khí, N là tổng số chất phản ứng (G ≤ N), A là ma trận tạo
bởi các hàng là tương ứng một loại nguyên tố và các cột là tương ứng một loại chất,
x là vecto của khối lượng các chất trong cân bằng hóa học, y là khối lượng ban đầu
của các chất có trong PUHH, A là ma trận con của A có các cột tương ứng với các chất ban đầu, giá trị c i (p, T) cho biết điện hóa của một chất phụ thuộc theo biến p
Trang 32và T
Gọi nghiệm tối ưu của bài toán cấp dưới là x(p, T, y), giả sử nghiệm này duy
nhất Khi ấy bài toán cấp trên có mô hình như sau:
min
p,T,y hc, xi,
(p, T, y) ∈ Y, x = x(p, T, y).
(4) Bài toán kinh tế môi trường (Environmenttal Economics)
Điều kiện sản xuất ảnh huởng tới kết quả của các hoạt động kinh tế trong quátrình sản xuất Điều này có thể thấy ngay trong môi trường khi các nhà sản xuấtlàm ô nhiễm Chúng ta phải làm sạch môi trường, đó là một trong các hoạt độngcần thiết của quá trình sản xuất Chẳng hạn giấy được sinh ra từ nhà máy hay xínghiệp sản xuất giấy từ gỗ, do đó các cây xanh bị khai thác sẽ ảnh hưởng đến môitrường rừng, có tác động gián tiếp đến mực nước ngầm trong lòng đất và mực nướccác con sông Và hơn nữa nước thải trong quá trình sản xuất còn ảnh hưởng tới sựsống của cá, tôm trên dòng sông, ao hồ Do đó các nhà nuôi trồng thủy sản cũngchịu ảnh hưởng nghiêm trọng
Bây giờ, giả sử G P (x1), G F (x1, x2) là lợi nhuận sản xuất của xí nghiệp giấy (1)
và nhà nuôi trồng thủy sản (2), x1, x2 là các hoạt động kinh tế và G F là hàm giảm.Nếu cả (1) và (2) đều muốn lợi nhuận lớn nhất thì thị trường sẽ không tồn tại bởi
vì (2) sẽ phá sản do chất thải tối đa từ (1) tạo ra
Bây giờ, giả sử chính phủ quan tâm tới quyền lợi của (2), thì phải đánh thuế vào củacải của (1) và số tiền này được quốc hữu hóa Một cách hiểu đơn giản là số tiền thuế
phụ thuộc tuyến tính vào x1, hàm lợi nhuận của (1) thay đổi thành: G P (x1) − r(x1),
với r là chỉ số thuế Gọi x1(r) là nghiệm tối ưu Rõ ràng r tăng thì G P giảm và do
đó sự thiệt hại của (2) sẽ giảm khi r tăng (cần thiết để bảo vệ (2)) Hệ quả là tài sản tối ưu của (2) x2(x1(r)) sẽ phụ thuộc r Tiếp theo chính phủ có nhiệm vụ xác định
chỉ số thuế hợp lý để tính toán ra phúc lợi xã hội phụ thuộc vào lượng giấy và thủysản được sản xuất ra, như vậy giá trị thuế sẽ chi trả bởi (1) Ta cần có một hàm số
để thực hiện công việc trên, hàm này phụ thuộc vào r: W (x1(r), x2(x1(r)), r) là lớn
Trang 33và x2 thỏa bài toán max
x2≥0 G F (x1, x2), với r, x1 cho trước và thỏa mãn điều kiện
G F (x1, x2) ≥ 0.
(5) Vài ứng dụng thực tiễn khác(Other Real Applications)
Danh sách các ứng dụng của bài toán hai cấp là vô cùng dài và được phát triển
nhanh chóng Sau đây ta sẽ nêu vài ứng dụng được trình bày ngắn gọn Dĩ nhiên,những ứng dụng này có thể thực hiện và hoàn thiện trong tương lai xa và mục đíchchủ yếu là đưa ra những nghiên cứu khác nhau về các vấn đề thực tế trong đó cóliên quan đến mô hình bài toán tối ưu hai cấp nêu trên
+ giải quyết xung đột trong phân chia nguồn nước các con sống lớn trên thế giới(sông Nin, Hằng)
+ công nghệ vật liệu
+ Cân bằng giao thông
M
Trang 34• Chuyển các lớp bài toán tối ưu hai cấp dạng optimistic về các lớp bài toán
tương đương bằng một trong bốn hướng tiếp cận (các hướng tiếp cận sẽ nói
rõ bên dưới)
• Thiết lập các điều kiện định tính ràng buộc (Constraint Qualification
condi-tions, viết tắt là (CQ)) kèm theo mỗi hướng tiếp cận
• Tùy từng lớp bài toán mà ta áp đặt các tính chất cho các hàm F, f, g, Ψ, ϕ
trong bài toán
• Áp dụng kiến thức cơ bản về điều kiện tối ưu cho bài toán tối ưu một cấp có
chứa tham số
Từ đó thiết lập được điều kiện cần tối ưu cho bài toán tối ưu hai cấp dạng optimisticban đầu
Trang 35Có bốn hướng tiếp cận khi thiết lập điều kiện tối ưu:
Hướng tiếp cận (1) Sử dụng hàm Lagrange và tập nhân tử Lagrange thay thế bài toán cấp dưới lồi và dưới các điều kiện (CQ): (MFCQ), (SMFCQ).
Hướng tiếp cận (2) Sử dụng nón pháp tuyến và đối đạo hàm (do Mordukhovich
đề xuất) đối với đồ thị của ánh xạ (đa trị) tập nghiệm gph Ψ của bài toán cấp dưới
lồi.
Hướng tiếp cận (3) Sử dụng dưới vi phân Mordukhovich để phát triển hàm giá
trị tối ưu ϕ của bài toán cấp dưới dưới điều kiện CQ partially calm, .
Hướng tiếp cận (4) Sử dụng dưới vi phân Clarke phát triển hàm giá trị tối ưu ϕ
của bài toán cấp dưới dưới rất nhiều điều kiện CQ khác nhau.
Sau đây ta tìm hiểu các hướng tiếp cận này bằng ba mục sau Mục (3.1) gồmhai hướng tiếp cận (1) và hướng tiếp cận (2) cho bài toán hai cấp hữu hạn với giả
thiết lồi ở bài toán cấp dưới, Mục (3.2) gồm hướng tiếp cận (3) và mục cuối cùng
(3.3) gồm hướng tiếp cận (4)
Các kết quả trong phần này có liên quan tới [10], [14]
Hướng tiếp cận (1): Sử dụng hàm Lagrange và tập nhân tử
Lagrange thay thế bài toán cấp dưới lồi
Các yếu tố sau được xét trong [10, chương 4, 5]
Xét các bài toán như sau:
min
y {f (x, y)|g(x, y) ≤ 0, h(x, y) = 0} (3.1)min
min
x {ϕ o (x)|x ∈ X}, (3.3)
Trang 36ϕ o (x) = min
với Ψ(.) xác định như (2.4) và F : R n × R m → R, Y ⊆ R m là tập đóng, X = {x ∈
Rn |G(x) ≤ 0} trong đó ràng buộc bài toán cấp trên G : R n → R k, còn các hàm của
bài toán cấp dưới f, g, h đều lồi.
Như vậy bài toán hai cấp gốc ban đầu là: (3.1), (3.2) Bài toán hai cấp dạng mistic là: (3.1), (3.3), (3.4)
λ T g(x, y) = 0, h(x, y) = 0.
Và chúng ta viết lại bài toán hai cấp với dạng KKT thay thế bài toán cấp dưới, nhưsau
min
x,y,λ,µ F (x, y) G(x) ≤ 0,
∇ y L(x, y, λ, µ) = 0, g(x, y) ≤ 0, λ ≥ 0,
λ T g(x, y) = 0,
Khi bài toán cấp dưới (3.1) là lồi thì bài toán (3.5) tương đương với bài toán
hai cấp gốc (3.1), (3.2) (xem [10, Chương 5])
Trang 37Tuy vậy sự khó khăn của bài toán (3.5) là, do nó là bài toán trơn nên một số giả
thiết chính quy và điều kiện định tính ràng buộc (CQ) không thỏa mãn
Ta kí hiệu ∇f (.), ∇ x f (.), ∇ y f (.) tương ứng là gradient của hàm f , gradient của hàm
f theo biến x, gradient của hàm f theo biến y.
Ta có thể nêu giả thiết chính quy do Mangasarian–Fromowitz (MFCQ) đề ra:Định nghĩa 3.1.1 ([10], Mangasarian Fromowitz Constraint Qualification)(MFCQ) thỏa mãn cho bài toán min
y {f (x, y)|g(x, y) ≤ 0, h(x, y) = 0} tại điểm
(x o , y o) nếu có một hướng d sao cho
∇ y g i (x o , y o )d < 0 ∀i ∈ I(x o , y o ) := {j|g j (x o , y o ) = 0},
∇ y h j (x o , y o )d = 0 ∀j = 1, , q
và gradient {∇ y h j (x o , y o )|j = 1, , q}, {∇g i (x, y)|i ∈ I(x o , y o )} độc lập tuyến tính.
Do đó ta cần thiết lập dạng bài toán không trơn sao cho các (CQ) thỏa mãn, xét
định lý sau:
Định lý 3.1.1 ([10], Định lý 5.11) Nếu dạng KKT của bài toán (3.1) là một phần
của các ràng buộc của một bài toán tối ưu thì (MFCQ) không thỏa mãn tại mọi điểm chấp nhận được.
Chứng minh
Đặt w(x, y) := −g(x, y) và xét dạng KKT của (3.1):
∇ y L(x, y, λ, µ) = 0, w(x, y) := −g(x, y) ≥ 0, λ ≥ 0,
λ T w(x, y) = 0 (i), h(x, y) = 0 (ii).
là một phần của các ràng buộc của bài toán tối ưu
Giả sử (MFCQ) thỏa mãn tại điểm chấp nhận được (x, y, λ, µ), thì từ bất đẳng thức
Trang 38(i) và phương trình (ii) ở trên, ta có:
(λ T ∇ x w(x, y), λ T ∇ y w(x, y), w(x, y), 0) T 6= 0 (3.6)
và có một vecto (d, r, s) thỏa:
λ T ∇ x w(x, y)d + λ T ∇ y w(x, y)r + s T w(x, y) = 0, (3.7)
∇ x w i (x, y)d + ∇ y w i (x, y)r > 0, ∀i : w i (x, y) = 0, (3.8)
s i > 0, ∀i : λ i = 0. (3.9)Bây giờ từ (3.8) và (3.9) ta suy ra được
λ T ∇ x w(x, y)d + λ T ∇ y w(x, y)r + s T w(x, y) ≥ 0. (3.10)
Thật vậy nếu ∇ x w i (x, y)d + ∇ y w i (x, y)r ≤ 0 thì w i (x, y) > 0 (3.8), theo dòng 2 trên
ta suy ra λ i = 0 lại suy ra s i > 0 (do (3.9)) nên ta có (3.10) Nếu s i ≤ 0 suy ra
w i (x, y) = 0, do (3.8) và (i) Tóm lại ta có (3.10).
Mặt khác dấu đẳng thức ở (3.10) không xảy ra Thật vậy, nếu w i (x, y) > 0 thì
λ i = 0, do (i) và s i > 0 do (3.9) , do đó (3.10) không xảy ra dấu "=", điều này mâu
Vậy (MFCQ) không thỏa mãn tại điểm chấp nhận (x, y, λ, µ) ¤
Để phá bỏ khó khăn này, một dạng cho bài toán hai cấp không trơn dạng
opti-mistic được xây dựng như sau:
min
x,y,λ,µ F (x, y) G(x) ≤ 0,
∇ y L(x, y, λ, µ) = 0,
Trang 39min{−g(x, y), λ} = 0,
Bây giờ ta trở lại vấn đề chính là điều kiện tối ưu Trước hết ta tìm hiểu mốiquan hệ giữa bài toán hai cấp dạng optimistic và bài toán vừa thiết lập (3.11)
Định lý 3.1.2 ([10], Định lý 5.15) Xét bài toán optimistic bilevel (3.1), (3.3), (3.4)
và giả thiết bài toán cấp dưới (3.1) là bài toán tối ưu tham số lồi sao cho (MFCQ) thỏa mãn tại nghiệm chấp nhận (x o , y o ) với G(x o ) ≤ 0, y o ∈ Ψ(x o ) Khi đó mỗi
nghiệm tối ưu địa phương optimistic của (3.1), (3.3), (3.4) tương ứng là một nghiệm tối ưu địa phương cho bài toán (3.11).
Chứng minh
Giả sử x o là nghiệm tối ưu optimistic địa phương của (3.1), (3.3), (3.4), nghĩa là
tồn tại một lân cận mở U δ (x o ) sao cho ϕ o (x o ) ≤ ϕ o (x), ∀x ∈ U δ (x o ) với G(x) ≤ 0.
Vì dạng KKT là cần và đủ trong bài toán cấp dưới nên ta có:
ϕ o (x o ≤ F (x, y), ∀(x, y), x ∈ U δ (x o)và
∇ y L(x, y, λ, µ) = 0, g(x, y) ≤ 0, λ ≥ 0, λ T g(x, y) = 0, h(x, y) = 0.
điều này có nghĩa là tồn tại một lân cận mở W ² (x o , y o) sao cho
ϕ o (x o ) ≤ F (x, y), ∀(x, y) ∈ W ² (x o , y o)thỏa mãn
∇ y L(x, y, λ, µ) = 0, g(x, y) ≤ 0, λ ≥ 0, λ T g(x, y) = 0, h(x, y) = 0 ¤
Sau đây là điều kiện tối ưu dạng Fritz–John cho bài toán (3.11)
Định lý 3.1.3 [10, Định lý 5.16](Điều kiện tối ưu dạng Fritz John)Nếu (z o , v o)
với z o := (x o , y o ) và v o := (λ o , µ o ), là một nghiệm tối ưu địa phương của (3.11) thì
Trang 40tồn tại một vectơ (κ o , κ, ω, ζ, τ, ξ) 6= 0 thỏa:
i = 0