1. Trang chủ
  2. » Luận Văn - Báo Cáo

Điều kiện tối ưu cho một số lớp bài toán tối ưu hai cấp

104 548 0
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 104
Dung lượng 500,97 KB

Nội dung

Trình bày một cách tổng quan điều kiện tối ưu cho một số lớp bài toán tối ưu hai cấp quan trọng.

Trang 1

ĐIỀU KIỆN TỐI ƯU CHO MỘT SỐ LỚP

BÀI TOÁN TỐI ƯU HAI CẤP

NGUYỄN LÊ DUY (Học viên Cao Học khóa 16)

NGƯỜI HƯỚNG DẪN KHOA HỌC: PGS TS NGUYỄN ĐỊNH

(Trường Đại Học Quốc Tế TP HCM)

TP.Hồ Chí Minh - Năm 2009

Trang 2

Lời cảm ơn

Lời đầu tiên, tôi xin chân thành cảm ơn sâu sắc tới PGS TS NGUYỄN ĐỊNH,người Thầy đã tận tình chỉ dẫn và truyền đạt kiến thức trong quá trình học tập vàluôn động viên để tôi hoàn thành luận văn này

Tôi cũng xin bày tỏ lời cảm ơn tới tất cả các Thầy cô của Khoa Toán-Tin trườngĐại Học Khoa Học Tự Nhiên Tp.HCM đã giảng dạy tôi trong suốt quá trình họctập tại trường

Tôi xin cảm ơn gia đình đã tạo điều kiện tốt cho việc học của tôi và bạn bè đã hỗtrợ trong việc hoàn thành luận văn này

Tp Hồ Chí Minh, tháng 9 năm 2009

Nguyễn Lê Duy

Trang 3

Lời nói đầu

Bài toán tối ưu hai cấp (Bilevel Optimization Problem) lần đầu tiên đượcH.V.Stackelberg nghiên cứu vào năm 1934 Sau đó nó chính thức được giới thiệutrong cộng đồng tối ưu vào thập kỷ 70 của thế kỷ thứ 20 Bài toán phát triển rấtnhanh chóng cả trong lý thuyết và ứng dụng thực tế Các nhà toán học, nhà kinh tếhọc và những kỹ sư đã và đang không ngừng phát triển vấn đề này cùng với đó là

số lượng các bài báo, tạp chí khoa học, ứng dụng trong kinh tế kỹ thuật xuất hiệnngày càng nhiều hơn

Bài toán tối ưu hai cấp là một bài toán tối ưu có cấp bậc trong đó một phầncác ràng buộc của bài toán - được gọi là bài toán cấp trên (upper level problem)

là tập nghiệm tối ưu của một bài toán tối ưu thứ hai - được gọi là bài toán cấpdưới (lower level problem) Do đó bài toán này là một bài toán rất phức tạp Tuynhiên trong thực tế có rất nhiều bài toán có mô hình toán học là bài toán tối ưuhai cấp Hơn nữa bài toán tối ưu hai cấp có mối liên hệ chặt chẽ với những bài toánquan trọng khác, một trong số đó là bài toán MPECs (Mathematical Programs withEquilibrium Constraints) - là bài toán mở rộng của bài toán đó, cũng có ứng dụngrộng rãi trong giao thông, điều khiển robot, hệ thống mạng,

Đối với bài toán tối ưu hai cấp, các nhà toán học nghiên cứu nhiều vấn đề: sựtồn tại nghiệm, điều kiện tối ưu, các thuật toán, Một vấn đề lớn trong việc nghiêncứu bài toán này là điều kiện tối ưu của nó Luận văn này trình bày một cách tổngquan điều kiện tối ưu cho một số lớp bài toán tối ưu hai cấp quan trọng, bao gồmlớp bài toán trơn, lớp bài toán lồi và tuyến tính, lớp bài toán lipschitz

Cấu trúc chính của luận văn bao gồm bốn chương Chương 1 trình bày các kiếnthức cơ bản sẽ sử dụng cho các chương sau Chương 2 giới thiệu bài toán tối ưu haicấp tổng quát và các mô hình các bài toán thực tế

Phần chính là điều kiện cần tối ưu sẽ trình bày ở chương 3 và chương 4 trong đó đềcập đến các lớp bài toán tối ưu hai cấp hữu hạn và bài toán tối ưu hai cấp vô hạn

Trang 4

Mục lục

1.1 Một số kiến thức cơ bản về giải tích lồi 5

1.2 Hàm Lipschitz và dưới vi phân Clarke 11

1.3 Một số kiến thức cơ bản về giải tích đa trị 12

1.4 Dưới vi phân, nón pháp tuyến và đối đạo hàm Mordukhovich 16

2 Khái niệm về bài toán tối ưu hai cấp tổng quát 22 2.1 Giới thiệu bài toán 22

2.2 Mô hình các bài toán thực tế 27

3 Điều kiện tối ưu cho bài toán hai cấp hữu hạn 33 3.1 Điều kiện tối ưu khi bài toán cấp dưới lồi 34

3.2 Điều kiện tối ưu sử dụng dưới vi phân Mordukhovich 49

3.3 Điều kiện tối ưu sử dụng dưới vi phân Clarke 62

4 Điều kiện tối ưu cho bài toán hai cấp vô hạn 80 4.1 Bài toán hai cấp vô hạn 80

4.2 Điều kiện tối ưu cho bài toán DC vô hạn 81

4.3 Điều kiện tối ưu cho bài toán hai cấp vô hạn 87

Trang 5

4.4 Điều kiện cần và đủ cho bài toán hai cấp lồi đơn giản 93

Trang 6

Chương 1

Một số kiến thức cơ bản

(1) Tập lồi và hàm lồi

Giả sử X là không gian vectơ.

Định nghĩa 1.1.1 [1] Tập K ⊆ X là lồi nếu

Như vậy, bao lồi của K là tập lồi nhỏ nhất chứa K.

Định nghĩa 1.1.2 [1] Cho hàm số f : X → R Khi đó f được gọi là hàm lồi nếu

∀x, y ∈ X, ∀λ ∈ [0, 1], λf (x) + (1 − λ)f (y) ≥ 0.

Cho X, Y là các không gian vectơ S là nón lồi trong Y

Định nghĩa 1.1.3 [1] Cho hàm số f : X → Y Khi đó f được gọi là hàm S–lồi nếu

Trang 7

∀x, y ∈ X, ∀λ ∈ [0, 1], λf (x) + (1 − λ)f (y) − f (λx + (1 − λ)y) ∈ S.

Nhận xét 1.1.1 Trường hợp f lồi là một trường hợp đặc biệt của hàm S–lồi khi

S = R+.

(2) Dưới vi phân của hàm lồi, đối ngẫu của hàm lồi

(a) Dưới vi phân của hàm lồi

Cho f là hàm số lồi, một hàm số lồi thì có thể không có đạo hàm do đó ta xét

tới khái niệm sau Chúng ta cần nêu ra vài khái niệm cơ bản:

Hàm số thực mở rộng f : X → R trong đó trong đó R = RS{+∞; −∞}

Miền hữu hiệu (domain) domf := {x ∈ X|f (x) < ∞} và đồ thị trên (epigraph) epif := {(x, α) ∈ X × R|f (x) ≤ α}.

Định nghĩa 1.1.4 [1] Cho hàm số f : X → R lồi, và X ∗ là không gian đối ngẫu

của không gian vectơ X Giả sử x o ∈ X và f (x o ) 6= ±∞ Khi đó dưới vi phân của

hàm lồi f tại x o được xác định như sau

∂f (x o ) := {x ∗ ∈ X ∗ : hx ∗ , x − x o i ≤ f (x) − f (x o ), ∀x ∈ X}. (1.1)

Nếu f không hữu hạn tại x thì ∂f (x o ) = ∅.

Mỗi thành phần x ∗ ∈ ∂f (x o ) được gọi là dưới gradient của dưới vi phân ∂f (x o), khi

đó ∂f (x o) còn gọi là tập các dưới gradient

Đây là định nghĩa dưới vi phân cổ điển của hàm số f Các phần sau ta sẽ nêu các định nghĩa dưới vi phân mở rộng.

(b) Đối ngẫu của hàm lồi

Cho X là không gian Banach và hàm f : X → R lồi, luôn luôn proper nghĩa là

f (x) 6= ∞ trên X Gọi X ∗ là không gian đối ngẫu của X

Trang 8

Định nghĩa 1.1.5 [1] Hàm đối ngẫu f ∗ : X ∗ → R của f , được xác định như sau:

f ∗ (x ∗ ) := sup{hx ∗ , xi − f (x)|x ∈ X}.

Nhận xét 1.1.2 Do f (x) 6= +∞(x ∈ domf ) suy ra sup {hx ∗ , xi − f (x)|x ∈ X}

luôn 6= ∅ nên f ∗ (x ∗ ) cũng = sup {hx ∗ , xi − f (x)|x ∈ domf }.

Cho hàm f : X → R lồi, là proper nếu f (x) 6= ∞ trên X Nhắc lại hàm đối ngẫu

f ∗ : X ∗ → R đối với f , xác định bởi f ∗ (x ∗ ) := sup {hx ∗ , xi − f (x)| x ∈ X =

sup {hx ∗ , xi − f (x)| x ∈ domf }.

Cho hàm f : X → R lồi tại x ∈ domf và ε > 0 bất kì, thì dưới vi phân xấp xỉ của hàm f là ∂ ε f (x) := {x ∗ ∈ X ∗ | hx ∗ , x − xi ≤ f (x) − f (x) + ε ∀x ∈ X}, ε ≥ 0

Nếu ε = 0 thì ta có ∂ ε f (x) = ∂ o f (x) là dưới vi phân cổ điển có dạng như (1.1).

(3) Bài toán quy hoạch lồi và điều kiện tối ưu

(a) Bài toán quy hoạch lồi đơn giản

Sau đây chúng tôi xin nêu một kết quả về điều kiện tối ưu cho bài toán này

Phần chứng minh sẽ được làm rõ trong phần bài toán quy hoạch lồi tổng quát ngay

sau đây Hai điều kiện chính quy sau đây xem trong [1]

Trang 9

Định nghĩa 1.1.6 (Điều kiện chính quy Slater) (Slater) ∃ x ∈ C, g i (x) < 0, i =

trong đó ∂f (x) kí hiệu cho dưới vi phân của hàm số f tại điểm x.

(b) Bài toán quy hoạch lồi tổng quát

Một bài toán tối ưu có dạng như bài toán sau đây được gọi là bài toán quy hoạchlồi tổng quát

Trang 10

trong đó A1 ∈ L(X, R m ) và b1 ∈ R m

Một bài toán thứ hai cũng tương tự như bài toán (U), chỉ thay A1x = b1

bởi A2x = b2, và thay i ∈ {1, , n} bởi i ∈ I trong đó I là tập chỉ số tùy ý,

A2 ∈ L(X, Y2) với Y2 là không gian định chuẩn và b2 ∈ Y2.

Ta có thể chuyển hai bài toán này về bài toán lồi tổng quát dễ dàng

Bây giờ, gọi A = {x ∈ X|x ∈ C, g(x) ∈ −S} là tập các điểm chấp nhận được của (P), rõ ràng tập A là lồi đóng trong X.

Định nghĩa 1.1.7 [1] Nón đối ngẫu dương của nón lồi S, ký hiệu S+, được xácđịnh:

S+ = {y ∗ ∈ Y | < y ∗ , s > ≥ 0, ∀s ∈ S}

Định lý 1.1.2 ([1], Điều kiện cần tối ưu Fritz–John) Xét bài toán (P tq ) và

các (GTCB) thỏa mãn và intS 6= ∅ và a ∈ A Khi đó nếu a là nghiệm của (P) thì

∃λ o ∈ R+, λ ∈ S+ không đồng thời bằng 0 sao cho:

Chứng minh

Vì a ∈ A là nghiệm của (P tq ) nên hệ sau vô nghiệm theo x ∈ C :

−(f (x) − f (a)) ∈ intR+, g(x) ∈ −S, x ∈ C

Do vậy hệ sau vô nghiệm −(f (x) − f (a), g(x)) ∈ int(R+× S), x ∈ C, nghĩa là tồn

tại λ = (λ o , λ) ∈ (R+× S)+ với λ 6= (0, 0) sao cho

λ(f (x) − f (a), g(x)) = λ0(f (x) − f (a)) + λg(x) ≥ 0, ∀x ∈ C

hay λ o f (x) − λ0f (a) + λg(x) ≥ 0, ∀x ∈ C(1), cho x = a ta được λg(x) ≥ 0 Mặt

khác ta có λg(x) ≤ 0 (do λ ∈ S+, g(a) ∈ −S), suy ra λg(x) = 0(2).

Từ (1) và (2) ta có: λ o f (x)+λg(x) ≥ λ o f (a)+λg(a), ∀x ∈ C Do vậy a là nghiệm

của bài toán lồi sau đây:

Trang 11

inf(λ o f (x) + λg(x)).

Vì λ0f và λg liên tục nên từ đây suy ra 0 ∈ ∂(λ o f + λg)(a) + N C (a),

Cũng vì λ0f và λg liên tục nên suy ra 0 ∈ ∂(λ o f )(a) + ∂(λg)(a) + N C (a).

Vậy định lý được chứng minh ¤

Chú ý : Nếu λ0 = 0 thì điều kiện sẽ không chứa thông tin gì về hàm mục tiêu f

và do đó sẽ không có giá trị gì Do đó việc khẳng định λ0 6= 0 là hết sức quan trọng.

Các điều kiện đặt trên các biểu thức sao cho λ o 6= 0 và có thể chọn λ o = 1 Mộttrong các điều kiện quan trọng là điều kiện chính quy Slater (mở rộng) và điều kiệnchính quy Kartin:

Định nghĩa 1.1.8 Điều kiện chính quy Slater mở rộng (SCQ): ∃ x ∈ C sao

cho −g(x) ∈ intS

Điều kiện chính quy Kartin (KCQ): @ λ ∈ S+và λ 6= 0 sao cho λg(x) ≥ 0, ∀x ∈

C.

Định lý 1.1.3 ([1], Điều kiện cần và đủ KKT) Giả sử các giả thiết như trên

Định lý 1.3.2 và thêm (KCQ) thỏa mãn Khi đó ta có kết luận như trên với λ o = 1

nghĩa là a là nghiệm của (P tq ) khi và chỉ khi tồn tại λ ∈ S+ sao cho hệ sau thỏa:

Giả sử λ o = 0 Khi đó ta có 0 ∈ ∂(λg)(a) + N C (a)

Do đó tồn tại x ∗ ∈ ∂(λg)(a) sao cho −x ∗ ∈ N C (a) hay x ∗ (x − a) ≥ 0, ∀x ∈ C Vậy

(λg)(x) − (λg)(a) ≥ x ∗ (x − a) ≥ 0

Trang 12

kết hợp (λg)(a) = 0 suy ra (λg)(x) ≥ 0 mâu thuẫn với (KCQ) Vậy λ0 6= 0 do đó có

điều này tương đương

f (x) + (λg)(x) ≥ f (a) + λg(a) = f (a) (do λg(a) = 0), ∀x ∈ C.

Mặt khác do x ∈ C, g(x) ∈ −S nên λg(x) ≤ 0 , suy ra f (x) ≥ f (a), ∀x ∈ A nghĩa là x = a là nghiệm của bài toán ¤

Các khái niệm thuộc lý thuyết vi phân được đề xuất bởi Clarke vào năm 1973.

Năm 1983 lý thuyết này được Clarke bổ sung và hoàn chỉnh Ở đây ta chỉ nêu một

phần rất nhỏ của lý thuyết này, về hàm Lipschitz địa phương, đạo hàm theo hướng

Clarke và dưới vi phân Clarke.

Cho hàm số thực f : R n → R, và x ∈ R n

Định nghĩa 1.2.1 [5] (Hàm Lipschitz địa phương) Hàm f được gọi là Lipschitz

địa phương tại x, nếu tồn tại hằng số k và ε > 0 sao cho

|f (x1) − f (x2)| ≤ k|x1− x2| ∀x1, x2 ∈ x + εB (1.2)với B là quả cầu đơn vị trong Rn

Trang 13

Định nghĩa 1.2.2 [5] (Đạo hàm theo hướng của hàm Lipschitz địa phương)

Cho f Lipschitz địa phương tại x, và v là vecto bất kì trong R n Khi đó đạo hàm

theo hướng v của hàm f tại x, kí hiệu f o (x; v) xác định như sau:

f o (x; v) := lim sup

x0 →x, t↓0

f (x 0 + tv) − f (x 0)

t

Định nghĩa 1.2.3 [5](Dưới vi phân Clarke) Dưới vi phân Clarke của hàm f tại

x, kí hiệu ∂ o f (x) xác định như sau:

∂ o f (x) := {ξ ∈ R n |f o (x; v) ≥ hv, ξi, ∀v ∈ R n }. (1.3)

Mỗi phần tử ξ ∈ ∂ o f (x) được gọi là dưới gradient Clarke.

Tính chất[5]

• Khi f trơn (nghĩa là khả vi chặt hay khả vi liên tục) thì ∂ o f (x) ≡ {∇f (x)}

• Khi f lồi thì ∂ o f (x) ≡ {ξ|f (x + u) − f (x) ≥ hu, ξi}, ∀u ∈ R n (tập dưới vi

phân của hàm f tại x, (xem mục 1.1)).

(1) Ánh xạ đa trị

Cho X, Y là hai tập bất kì Cho F : X ⇒ Y là ánh xạ từ tập X vào toàn bộ các tập con của Y (được kí hiệu là 2 Y ) Ta nói F là ánh xạ đa trị từ X vào Y Như vậy với mỗi x ∈ X, F (x) là một tập con của Y (F (x) có thể = ∅).

Nếu với mỗi x ∈ X, tập F (x) chỉ gồm đúng một phần tử của Y , thì F là ánh xạ đơn

trị từ X vào Y và thay cho kí hiệu F : X ⇒ Y thì ta sử dụng kí hiệu quen thuộc

là F : X → Y

Định nghĩa 1.3.1 [2, Định nghĩa 1.1.1] Đồ thị và miền hữu hiệu của ánh xạ đa trị

F : X ⇒ Y tương ứng được xác định như sau:

gph F = {(x, y) ∈ X × Y |y ∈ F (x)}, (1.4)

dom F = {x ∈ X|F (x) 6= ∅}. (1.5)

Trang 14

Nhắc lại, nếu ánh xạ đơn trị, là hàm thực mở rộng f : X → R thì miền hữu hiệu domf := {x ∈ X|f (x) < ∞} và đồ thị trên (epigraph) epif := {(x, α) ∈

X × R|f (x) ≤ α}.

Định nghĩa 1.3.2 [21, Định lý 19.1] Tập M ⊂ R n được gọi là tập lồi đa diện

(polyhedral convex set) nếu M có thể biểu diễn được dưới dạng giao của một số hữu

hạn nửa không gian đóng của Rn , nghĩa là tồn tại các điểm a1, , a p ∈ M và các

phương v1, , q ∈ R n sao cho

Bây giờ giả sử X, Y là các không gian metric.

Định nghĩa 1.3.3 [2, Định nghĩa 1.2.1; 1.2.2; 1.2.3] Ta nói F là nửa liên tục trên (usc) tại x ∈ dom F nếu với mọi tập mở V ⊂ Y thỏa F (x) ⊂ V tồn tại lân cận mở

U của x sao cho

F (x) ⊂ V ∀x ∈ U.

Nếu F usc tại mọi điểm thuộc dom F thì F được gọi là usc trong X

Ta nói F là nửa liên tục dưới (lsc) tại x ∈ dom F nếu với mọi tập mở V ⊂ Y thỏa

F (x) ∩ V 6= ∅ tồn tại lân cận mở U của x sao cho

F (x) ∩ V 6= ∅ ∀x ∈ U ∩ dom F.

Nếu F lsc tại mọi điểm thuộc dom F thì F được gọi là lsc trong X

Ta nói F là liên tục tại x ∈ dom F nếu F đồng thời usc và lsc tại x Nếu F liên tục tại mọi điểm thuộc dom F thì F được gọi là liên tục trên X.

Xét hàm thực mở rộng f : X → R với X là không gian metric.

Định nghĩa 1.3.4 [2]

Ta nói f là usc tại x ∈ dom f nếu

lim inf

x→x f (x) ≥ f (x)

Trang 15

epi(f1+ f2) = cl∗ (epif1∗ + epif2)

thỏa mãn với mọi hàm lsc và lồi f i : X → R, i = 1, 2, trong đó cl ∗ có thể bỏ đi nếu

f i liên tục tại điểm x ∈ domf1∩ domf2 Hơn nữa chúng ta còn có công thức tổngcác dưới vi phân được thiết lập trong [3] Bổ đề sau đây miêu tả hai yếu tố này:

Bổ đề 1.3.1 [7, 9](Công thức tổng epi và tổng dưới vi phân cho hàm lồi)

Giả sử f i : X → R, i = 1, 2 là lsc, lồi và domf1∩ domf2 6= ∅ Khi đó hai điều kiện sau tương đương:

• (i) Tập epif ∗

1 + epif ∗

2 đóng yếu ∗ trong X ∗ × R.

Trang 16

• (ii) Công thức sau thỏa

epi(f1+ f2)∗ = (epif ∗

1 + epif ∗

Hơn nữa, ta có

∂(f1+ f2)(x) = ∂f1(x) + ∂f2(x), với x ∈ domf1∩ domf2, (1.7)

trong đó ∂f (.) là dưới vi phân cổ điển (Định nghĩa 1.1.4).

Chứng minh (xem [9])

Ngay sau sự ra đời của lý thuyết vi phân Clarke, thì năm 1976, Mordukhovich

đã đề xuất những khái niệm về lý thuyết vi phân của riêng ông, từ đó đến nay thìông đã hoàn chỉnh lý thuyết ấy Thực sự giải tích hiện đại nghiên cứu về các đối

tượng không trơn (nonsmooth) như tập, hàm, ánh xạ đa trị và các công cụ giải tích

mở rộng của phép tính vi phân Trong mục này chúng ta sẽ sử dụng các đối tượng

đề xuất bởi Mordukhovich, đây là công cụ tính toán mạnh mẽ và đầy đủ, thích

hợp để nghiên cứu về bài toán tối ưu hai cấp.Việc xây dựng lý thuyết vi phân vô

hạn chiều của ông theo các bước chính:

• Định nghĩa khái niệm dưới vi phân của các hàm số nhận giá trị trong tập số

Sau đây ta xin nêu các khái niệm trong lý thuyết vi phân mở rộng của

Mor-dukhovich Để tìm hiểu cụ thể xin xem trong ([2], chương 1, 4) và [17, 18] (sáchmới nhất năm 2006) của Mordukhovich

Trang 17

1.4 Dưới vi phân, nón pháp tuyến và đối đạo hàm

Mordukhovich

Xét ánh xạ đa trị F : X ⇒ X ∗ giữa không gian Banach X và không gian đối

ngẫu X ∗ của nó Kí hiệu

Cho hàm f : X → R và tập Ω ⊂ X Các kí hiệu x → f x và x →x tương ứng

có nghĩa là

x → x với f (x) → f (x) và x → x với x ∈ Ω.

Định nghĩa 1.4.1 ([2], Dưới vi phân Fréchet)

Cho X là không gian Banach, xét hàm f : X → R là hàm thực suy rộng, hữu hạn tại x Với mỗi ε ≥ 0, đặt

ˆε f (x) := {x ∗ ∈ X ∗ | lim inf

x→x

f (x) − f (x) − hx ∗ , x − xi

Tập ˆ∂ ε f (x) được gọi là ε− dưới vi phân Fréchet của f tại x, còn các phần tử của

nó là ε− dưới gradient Fréchet của f tại x.

Tập ˆ∂f (x) := ˆ ∂ o f (x) được gọi là dưới vi phân Fréchet của f tại x

Trang 18

Ta nhắc lại hai khái niệm khả vi Frechet và khả vi chặt (trơn), (xem [2]).

Hàm f được gọi là khả vi Frechet tại x ∈ X nếu tồn tại x ∗ ∈ X ∗ sao cho

lim

x→x

f (x) − f (x) − hx ∗ , x − xi

khi đó x ∗ được gọi là đạo hàm Frechet của f tại x, và dễ thấy {x ∗ } = ˆ ∂f (x).

Hàm f được gọi là khả vi chặt tại x ∈ X nếu f khả vi Frechet tại x và

Nếu f là hàm lồi thì tập ∂f (x) trùng với dưới vi phân của giải tích lồi (1.1) phần

trên

Bây giờ chúng ta tìm hiểu cụ thể các đối tượng nón pháp tuyến và đối đạo hàm.

Dựa trên nền tảng các đối tượng giải tích do Mordukhovich đề xuất, ta tách các

trường hợp Mục đích của việc tách là chúng ta xét hàm thực mở rộng trong trường

hợp không gian Banach tùy ý và trong không gian hữu hạn, sẽ sử dụng cho bài toán hai cấp vô hạn và bài toán hai cấp hữu hạn (xem cụ thể chương 3 và chương 4

Trang 19

Nón pháp tuyến Fréchet được xác định như sau:

Bây giờ chúng ta tìm hiểu khái niệm "Đối đạo hàm":

Xét ánh xạ đa trị F : X ⇒ Y giữa các không gian Banach.

Định nghĩa 1.4.3 [2, Đối đạo hàm Fréchet, đối đạo hàm Mordukhovich] Đối đạo

hàm Fréchet của F tại (x, y) ∈ gph F và đối đạo hàm Mordukhovich tại điểm tương

ứng, lần lượt cho bởi

Nếu F (x) = f (x) đơn trị, thì chúng ta viết ˆ D ∗ f (x) thay cho ˆ D ∗ f (x, f (x)) và viết

D ∗ f (x) thay cho D ∗ f (x, f (x)) Khi đó nếu f tương ứng là khả vi Fréchet và khả

vi chặt tại x thì các đối đạo hàm phía trên xác định như sau:

ˆ

D ∗ f (x)(y ∗ ) = (∇f (x)) ∗ (y ∗ ) ∀y ∗ ∈ Y ∗

D ∗ f (x)(y ∗ ) = (∇f (x)) ∗ (y ∗ ) ∀y ∗ ∈ Y ∗

Lúc này, với mọi y ∗ ∈ Y ∗, ˆD ∗ f (x)(y ∗ ) và D ∗ f (x)(y ∗) là các tập chỉ chứa một phần

tử Nếu f khả vi chặt, thì hai tập này bằng nhau

D ∗ f (x)(y ∗) = ˆD ∗ f (x)(y ∗ ) = (∇f (x)) ∗ (y ∗ ) ∀y ∗ ∈ Y ∗

Trang 20

Cuối cùng chúng tôi nêu mối quan hệ giữa đối đạo hàm của ánh xạ đơn trị

Lipschitz địa phương (xem mục 1.2) f : X → Y với dưới vi phân Fréchet của hàm

D ∗ f (x)(y ∗) = ˆ∂hy ∗ , f (x)i.

Trường hợp: f : X → R trong đó X là không gian hữu hạn chiều

Giả sử X = R n , như vậy hàm f trở thành f : R n → R.

Các khái niệm sau xem cụ thể trong ([14], mục 2)

Đầu tiên, chúng ta tìm hiểu khái niệm nón pháp tuyến mở rộng của một tậpkhác rỗng

Cho tập Ω ⊂ R n và x ∈ Ω ; khi đó nón pháp tuyến của Ω tại x xác định bởi

trong đó ” lim sup ” là giới hạn trên theo nghĩa Painlevé-Kuratowski của một ánh

xạ đa trị S : R n ⇒ Rm với u → x xác định bởi

Xét ánh xạ đa trị: D ∗ S(x, y) : R m → R n với giá trị

D ∗ S(x, y)(v) := {u ∈ R m |(u, −v) ∈ N((x, y); gphS)}, v ∈ R m

Trang 21

Đây chính là ánh xạ đối đạo hàm của S tại (x, y).

Nếu S đơn trị và khả vi chặt tại x với gradient ∇S(x) nghĩa là

Bây giờ ta xét một số tính chất của hàm Lipschitz, cho hàm ϕ : R n → R liên

tục lipschitz quanh x, có dưới vi phân như sau:

∂ϕ(x) = lim sup

x→x

ˆ

trong đó ˆ∂ϕ(x) là dưới vi phân Fréchet của ϕ tại x Dưới vi phân (1.18) luôn luôn

khác rỗng và compac với mọi hàm Lipschitz địa phương

Rõ ràng nếu các hàm là khả vi chặt thì ∂ϕ(x) = {∇ϕ(x)}.

Ngoài ra ∂ϕ(x) = {v ∈ R n |(v, −1) ∈ N((x, ϕ(x)); epiϕ)} với N(.) xác định như

(1.16)

Nếu ánh xạ S đơn trị, Lipschitz địa phương thì D ∗ S(x)(v) = ∂hv, Si(x) v ∈ R m

trong đó ∂ϕ(.) xác định như (1.18) và hv, Si(x) = hv, S(x)i

Chúng ta sử dụng tính chất của bao lồi của dưới vi phân

co∂(−ϕ)(x) = −co∂ϕ(x) (1.19)

Cho ánh xạ đa trị S : R n ⇒ Rm và một điểm x với S(x) 6= ∅, ta nói rằng S là

nửa compac trong (inner semicompact) tại x nếu với mỗi dãy x v → x với S(x v ) 6= ∅ thì có một dãy y v ∈ S(x v ) chứa một dãy con hội tụ khi v → ∞ Rõ ràng trong

không gian hữu hạn chiều thì "inner semicompactness" thỏa khi S là bị chặn đều

("uniformly bounded") quanh x nghĩa là có một lân cận U của x và tập C bị chặn

⊂ R m sao cho

S(x) ⊂ C khi x ∈ U.

Trang 22

Tiếp theo ta tìm hiểu một khái niệm khác, cho ánh xạ đa trị S : R n ⇒ Rm, ta

nói S là nửa liên tục trong (inner semicontinuous) tại (x, y) ∈ gphS nếu với bất kì dãy x v → x thì có một dãy y v ∈ S(x v ) hội tụ về y khi v → ∞.

Lưu ý rằng tính nửa liên tục trong của S tại (x, y) có liên quan đến tính Lipschitz–

like tại điểm này mà mở rộng tính liên tục Lipschitz địa phương của ánh xạ đa trị

trong không gian Hausdorff

Ánh xạ đa trị S : R n⇒ Rm thỏa mãn tính chất Lipschitz–like tại điểm (x, y) ∈ gph S nếu có một lân cận U của x, V của y và một hằng số l ≥ 0 sao cho

S(x) ∩ V ⊂ S(u) + lkx − ukB ∀x, u ∈ U

trong đó B là quả cầu đơn vị đóng Tính chất này được biết là tương đương với tính chính quy metric và tính mở tuyến tính của ánh xạ ngược S −1, có tầm quan trọng

trong tối ưu và giải tích phi tuyến Ngoài ra D ∗ S(x, y)(0) = {0} cung cấp đặc tính

đầy đủ của tính Lipschitz–like của S tại (x, y) M

Trang 23

(1) Bài toán tổng quát và các lớp bài toán chính

Bài toán tối ưu hai cấp tổng quát là một bài toán tối ưu trong đó gồm hai

biến x và y với y được chọn là một nghiệm tối ưu của một bài toán thứ hai chứa tham số x Do đó đây là bài toán có cấp bậc theo ý nghĩa các ràng buộc của bài

toán cấp trên (the upper level problem) được xác định bởi một bài toán cấp dưới

(the lower level problem)

Ta xét dạng của bài toán cấp trên:

Trang 24

Thông thường khi nghiên cứu điều kiện tối ưu thì người ta ít xét đến các ràng buộc

đẳng thức h j (x, y) = 0 (trong luận văn chúng tôi chỉ trình bày bài toán tối ưu hai

cấp bao gồm cả ràng buộc đẳng thức thế này, trong phần đầu của chương 3 Cácphần còn lại của chương 3 và toàn bộ chương 4, chúng tôi bỏ đi ràng buộc đẳng

thức này) Để hiểu một cách rõ ràng hơn, chúng tôi chia làm 3 lớp bài toán khác

y {f (x, y)|g i (x, y) ≤ 0} nếu không gồm ràng buộc đẳng thức.

Số lượng các ràng buộc hữu hạn, nghĩa là i ∈ I hữu hạn, j ∈ J hữu hạn, k ∈ K hữu

hạn

(b) Lớp bài toán tối ưu hai cấp vô hạn

Các hàm thực mở rộng F, f : X × Y → R, với R = R ∪ {+∞; −∞} trong không gian Banach X, Y tùy ý.

Hàm thực mở rộng g t: Rn × R m → R với t ∈ T , T là tập chỉ số vô hận.

(c) Lớp bài toán tối ưu hai cấp nửa vô hạn

Tương tự như ở lớp bài toán tối ưu hai cấp vô hạn, nhưng nếu chúng ta xét trongkhông gian hữu hạn chiều và giữ nguyên các giả thiết còn lại thì nó trở thành lớpbài toán tối ưu hai cấp nửa vô hạn

Trong luận văn chỉ xét hai lớp bài toán (a) và (b)

Tùy các tính chất khả vi liên tục, khả vi chặt, hay lồi, lipschitz mà chúng ta

có các lớp bài toán được chia nhỏ tương ứng, là bài toán trơn, lồi, lồi hoàn toàn,

lipschitz Vấn đề này sẽ được tìm hiểu cụ thể ở các chương sau Đặt

ϕ(x) := inf

y {f (x, y) sao cho g(x, y) ≤ 0, h(x, y) = 0}.

thì ϕ được gọi là hàm giá trị tối ưu của bài toán cấp dưới.

Trang 25

Bây giờ, để hiểu về quá trình hình thành bài toán, ta hãy đến với mô hình kinh

tế, cũng là mô hình xuất hiện đầu tiên như sau

(2) Sự ra đời của bài toán và hai dạng bài toán cơ bản

Bài toán hai cấp có cấp bậc theo nghĩa có hai nhân tố quyết định những chọnlựa trên những mức độ khác nhau về cấp bậc Trong khi nhân tố thứ nhất – thường

gọi là người quyết định cấp trên hoặc ông chủ, đưa ra các chọn lựa x (lúc này x cố

định) của ông ấy trước, thì nhân tố thứ hai – thường được gọi là người quyết định

cấp dưới hoặc người làm công, xác định giải pháp y sau đó của anh ta theo một trong các lựa chọn của ông chủ Do đó biến x đóng một vai trò là tham số trong

(bài toán cần giải quyết) của người làm công

Hơn nữa ông chủ phải lường trước lựa chọn của người làm công, vì doanh thu củacông ty không chỉ phụ thuộc sự chọn lựa của ông ta mà còn cả sự tác động trở lạicủa người làm công

Theo đó, người làm công phải giải quyết bài toán chứa tham số x như sau:

min

y f (x, y) sao cho g(x, y) ≤ 0, h(x, y) = 0, (2.3)

với giả thiết f, g i , h j : Rn × R m → R, i = 1, , p, j = 1, , q và

g(x, y) = (g1(x, y), , g p (x, y)), h(x, y) = (h1(x, y), , h q (x, y)).

Đặt Ψ(x) là tập nghiệm tối ưu của bài toán này,

Ψ(x) := arg min

y {f (x, y)|g(x, y) ≤ 0, h(x, y) = 0} (2.4)

Như vậy bài toán của ông chủ có dạng như (2.1), bao gồm cực tiểu hóa hàm

F : R n × R m → R sao cho y ∈ Ψ(x) và x ∈ X với X tập đóng, X ⊆ R n, nghĩa làgiải quyết bài toán sau:

Trang 26

được định nghĩa tốt (well-defined) trong trường hợp nghiệm tối ưu của bài toán cấp dưới (2.3) là duy nhất với mọi giá trị x ∈ X.

Xét trường hợp thứ nhất: nghiệm tối ưu của bài toán (2.3) xác định duy nhất với mọi giá trị tham số x ∈ X.

Định nghĩa 2.1.1 [10], (Nghiệm của bài toán hai cấp) Giả sử Ψ(x) chứa ít nhất 1 điểm với mọi giá trị x ∈ X Khi đó một điểm (x ∗ , y ∗ ) ∈ R n × R mđược

gọi là nghiệm tối ưu địa phương của bài toán (2.5) nếu x ∗ ∈ X, y ∗ ∈ Ψ(x ∗) và

tồn tại một lân cận mở U δ (x ∗ ), δ > 0 sao cho F (x, y) ≥ F (x ∗ , y ∗ ) ∀(x, y) thỏa

x ∈ U δ (x ∗ ), y ∈ Ψ(x) Nó được gọi là nghiệm tối ưu toàn cục của bài toán (2.5) nếu

δ = ∞.

Khái niệm trên mô tả khi nghiệm y = y(x) của người làm công được tiên đoán

bởi ông chủ Do đó ông chủ phải giải bài toán: min

trong đó: Ψ(x) = Arg min

y {−xy|0 ≤ y ≤ 1} (bài toán cấp dưới).

Ta có thể thấy ngay giá trị hàm mục tiêu của bài toán cấp trên là không rõ ràngnếu người làm công không thông tin lựa chọn của anh ta tới ông chủ

Việc giải quyết bài toán the cấp trên của ông chủ phụ thuộc vào tác động trở

Trang 27

lại của người làm công: bài toán cấp trên chỉ giải được trong trường hợp khi người

làm công chọn y(0) = 0 ∈ Ψ(x) Do vậy giá trị tối ưu 0 của bài toán 2 cấp không bao giờ đạt được nếu người làm công không chọn y(0) = 0.

Khái niệm giá trị tối ưu thực chất không rõ ràng ở chỗ: có rất nhiều chọn lựa x làm cho hàm F (x, y(x)) tiến về 0 nhưng có thể không đạt tại giá trị ấy Ta không

có khả năng khắc phục nhược điểm này nếu như người làm công được phép chọn

tự do trong khi ông chủ cứ ngồi một vị trí mà theo dõi mọi chọn lựa của anh ta

Người làm công chỉ cần chọn 0.5 ∈ Ψ(0) và thế là bài toán ở ví dụ trên sẽ không có

nghiệm.

Để cho bài toán 2 cấp vẫn được xác định ta phải xét trường hợp thứ hai: nghiệmcủa bài toán cấp dưới (2.3) không duy nhất

Chúng ta có hai dạng bài toán phân biệt khắc phục trở ngại này:

Bài toán hai cấp dạng optimistic:

Ý nghĩa của hai bài toán (2.6) và (2.8): Bài toán hai cấp dạng optimistic được

áp dụng khi ông chủ tin rằng (hoặc ông ta có khả năng thuyết phục) người làm công

sẽ luôn tìm ra giải pháp tối ưu, cũng là lựa chọn tốt nhất từ ông chủ nên bài toán

(2.6) còn gọi là bài toán hai cấp lạc quan Bài toán hai cấp dạng pessimistic được

nhắc đến khi người làm công tỏ vẻ không hợp tác với ông chủ do đó bài toán (2.8)

còn gọi là bài toán hai cấp bi quan.

Trang 28

Chúng ta chỉ tập trung nghiên cứu về bài toán tối ưu hai cấp dạng optimistictrong luận văn này.

Ta hãy nêu một số khái niệm cơ bản về nghiệm optimistic, nghĩa là nghiệm chobài toán dạng optimistic Ta nhắc lại đối với bài toán hai cấp dạng optimistic thìngười làm công phải giải quyết bài toán (2.6) Điều này dẫn tới khái niệm sau

Định nghĩa 2.1.2 ([10], Nghiệm tối ưu optimistic) Một điểm (x ∗ , y ∗ ) ∈ R n ×

Rm được gọi là nghiệm tối ưu optimistic địa phương cho bài toán (2.5) nếu x ∗ ∈

X, y ∗ ∈ Ψ(x ∗) sao cho

F (x ∗ , y ∗ ) ≤ F (x ∗ , y), ∀y ∈ Ψ(x ∗)

và tồn tại một lân cận mở U δ (x ∗ ), δ > 0 sao cho ϕ0(x ∗ ) ≤ ϕ0(x) ∀x ∈ X ∩ U δ (x ∗ ) Nếu δ = ∞ thì (x ∗ , y ∗) gọi là nghiệm optimistic toàn cục của (2.5)

(1) Bài toán Stackelberg (Stackelberg Games)

(a) Bài toán kinh tế thị trường (Market economy)

Chúng ta chỉ xét trường hợp đơn giản gồm hai thành phần: kẻ bán và người mua

Kẻ bán ra lệnh bán giá sản phẩm và tích trữ sản phẩm của mình, khi anh ta quyếtđịnh anh ta phải lường trước sự phản ứng của người mua bởi vì lợi nhuận sinh raphụ thuộc quyết định cả hai

Rõ ràng mỗi người ở vị trí của mình đều muốn tận dung triệt để lợi thế để sửdụng tốt nhất sự "đầu tư" của mình Tuy nhiên người bán là người có được sảnphẩm nên họ có vị trí độc lập( chỉ quan sát phản ứng bị phụ thuộc của người muadựa trên quyết định của người này) do vậy anh ta cố gắng đẩy cao lợi nhuận tốtnhất có thể Bài toán đặt ra được gọi là Stackelberg Game, có mô hình như sau:

Lấy X, Y lần lượt là tập chấp nhận được của chiến lược x và y tương ứng của

người bán(1), người mua(2) Giả sử giá trị chọn lựa đếm được nghĩa là hàm sử dụng

lần lượt của (1), (2) là f L (x, y), f F (x, y) Trước quyết định x của (1) thì (2) phải

Trang 29

chọn y(x) sao cho hàm sử dụng tương ứng lớn nhất:

y(x) ∈ Ψ(x) := arg max

(b) Bài toán cân bằng Cournot – Nash (Cournot – Nash Equilibria)

Có n người bán và người mua tạo ra n thành phần, sản xuất ra số lượng x i sản

phẩm đồng nhất, i = 1, , n Đặt các hàm hao tổn là f (x i ) tất cả đều khả vi, liên

tục, lồi, không âm và lợi nhuận tương ứng khi bán ra sản phẩm của họ ra thị trường

là x i p(Pn j=1 x j ) Ở đây p : R → R là hàm nhu cầu tiêu dùng mô tả sự phụ thuộc

của giá cả theo số lượng yêu cầu của sản phẩm đó

Giả sử p là hàm khả vi liên tục, lồi chặt và giảm trên tập R++:= {r|r > 0} và hàm g(x) = xp(x) lõm trên R++ Lấy [a i , b i ] ⊂ R++ là tập đóng, bị chặn trong đó thành phần i tin rằng sản phẩm đó đem lại lợi nhuận Khi đó thành phần thứ i sẽ

giải quyết bài toán tìm số lượng sản phẩm tối ưu để lợi nhuận lớn nhất

Bây giờ giả sử thành phần thứ nhất có lợi thế so với các thành phần khác theo

hướng nó cố định số lượng đã xuất ra x1 trước tiên, và do đó tất cả n − 1 thành phần còn lại có tác động trở lại x1 Khi đó n − 1 thành phần ấy phải tính toán

"Nash Equilibrium" giữa nội bộ với nhau bằng cách giải quyết n − 1 bài toán kiểu (2.10) Giả sử "Nash Equilibrium" (x2(x1), , x n (x1))T xác định duy nhất với x1

cố định Khi đó thành phần 1 phải giải bài toán sau để cho lợi nhuận lớn nhất:

Trang 30

(2) Bài toán hãng – đại lý (Principal – Agency Problems)

Các hãng(1) luôn phân phối hàng hóa đến các đại lý(2) và các đại lý sẽ đại diệncho hãng đó đối với sản phẩm tương ứng Họ kí kết hợp đồng trong đó (1) ủy quyền(một số) cho (2) qua đó (2) tự do chọn lựa hình thức buôn bán phù hợp với mụctiêu của nó Việc đó dẫn đến (2) sẽ cố gắng maximize lợi nhuận theo hành động củanó:

a là hành động buôn bán, a ∈ A, X: tập chấp nhận được của hành động a, s(x)

công trả cho (2) từ phía (1) tại x, s : X → R

G : R × A → R là hàm sử dụng tính giá trị s(x) từ phía (1) theo tác động của hành

động a và

g là hàm mật độ mô tả xác suất của kết quả thực tế x khi (2) dùng hành động a.

Từ cách quan sát của (1), hàm s mô tả một hệ dùng để thúc đẩy (2) hành động

theo mục đích của (1) Do đó (1) phải chọn hàm này sao cho (1) đạt lợi nhuận tốt

nhất có thể, (1) dùng hàm H : R → R đo bằng x − s(x) và (1) dùng hàm mật độ tương tự như g để đánh giá xác suất của x, (1) sẽ làm maximize:

S: tập chấp nhận được của tăng trưởng, a 0 : giải quyết (2.12) với a cố định

Dĩ nhiên chúng ta phải gắn với điều kiện sau:

Trang 31

Tóm lại bài toán "Principal – Agency Problem": chọn s ∈ S, maximize (2.12) sao cho a 0 ∈ A, maximize (2.11) và thỏa (2.13).

(3) Bài toán Cân bằng hóa học tối ưu (Optimal Chemical Equilibria)Trong quá trình sản xuất ra chất hóa học, chúng ta luôn phải đặt ra câu hỏi làmthế nào để bào chế được một hỗn hợp chất sao cho:

(i) chất ta muốn hình thành là kết quả của phản ứng hóa học (PUHH) trong lòphản ứng được mong muốn xuất hiện càng nhiều,

(ii) độc chất hoặc tạp chất trong chất đó bằng không hoặc chiếm một lượng vôcùng bé

đây được xem là một bài toán tối ưu hai cấp, trong đó (i) là bài toán cấp dưới còn(ii) là bài toán cấp trên

Các nhà hóa học không thể quan sát PUHH trong nhiệt độ cao mà chỉ phân tích

được thời điểm cuối của phản ứng, bởi một bài toán lồi Trong bài toán lồi này, hàm

entropi f (x, p, T ) được làm cho bé nhất sao cho thỏa điều kiện là nguyên lý bảo

toàn khối lượng và các khối lượng đều không âm Hiển nhiên là quá trình cân bằng

hóa học phụ thuộc vào áp suất p, nhiệt độ T và khối lượng y của các chất trong

đây là bài toán cấp dưới,

trong đó G là số lượng khí, N là tổng số chất phản ứng (G ≤ N), A là ma trận tạo

bởi các hàng là tương ứng một loại nguyên tố và các cột là tương ứng một loại chất,

x là vecto của khối lượng các chất trong cân bằng hóa học, y là khối lượng ban đầu

của các chất có trong PUHH, A là ma trận con của A có các cột tương ứng với các chất ban đầu, giá trị c i (p, T) cho biết điện hóa của một chất phụ thuộc theo biến p

Trang 32

và T

Gọi nghiệm tối ưu của bài toán cấp dưới là x(p, T, y), giả sử nghiệm này duy

nhất Khi ấy bài toán cấp trên có mô hình như sau:

min

p,T,y hc, xi,

(p, T, y) ∈ Y, x = x(p, T, y).

(4) Bài toán kinh tế môi trường (Environmenttal Economics)

Điều kiện sản xuất ảnh huởng tới kết quả của các hoạt động kinh tế trong quátrình sản xuất Điều này có thể thấy ngay trong môi trường khi các nhà sản xuấtlàm ô nhiễm Chúng ta phải làm sạch môi trường, đó là một trong các hoạt độngcần thiết của quá trình sản xuất Chẳng hạn giấy được sinh ra từ nhà máy hay xínghiệp sản xuất giấy từ gỗ, do đó các cây xanh bị khai thác sẽ ảnh hưởng đến môitrường rừng, có tác động gián tiếp đến mực nước ngầm trong lòng đất và mực nướccác con sông Và hơn nữa nước thải trong quá trình sản xuất còn ảnh hưởng tới sựsống của cá, tôm trên dòng sông, ao hồ Do đó các nhà nuôi trồng thủy sản cũngchịu ảnh hưởng nghiêm trọng

Bây giờ, giả sử G P (x1), G F (x1, x2) là lợi nhuận sản xuất của xí nghiệp giấy (1)

và nhà nuôi trồng thủy sản (2), x1, x2 là các hoạt động kinh tế và G F là hàm giảm.Nếu cả (1) và (2) đều muốn lợi nhuận lớn nhất thì thị trường sẽ không tồn tại bởi

vì (2) sẽ phá sản do chất thải tối đa từ (1) tạo ra

Bây giờ, giả sử chính phủ quan tâm tới quyền lợi của (2), thì phải đánh thuế vào củacải của (1) và số tiền này được quốc hữu hóa Một cách hiểu đơn giản là số tiền thuế

phụ thuộc tuyến tính vào x1, hàm lợi nhuận của (1) thay đổi thành: G P (x1) − r(x1),

với r là chỉ số thuế Gọi x1(r) là nghiệm tối ưu Rõ ràng r tăng thì G P giảm và do

đó sự thiệt hại của (2) sẽ giảm khi r tăng (cần thiết để bảo vệ (2)) Hệ quả là tài sản tối ưu của (2) x2(x1(r)) sẽ phụ thuộc r Tiếp theo chính phủ có nhiệm vụ xác định

chỉ số thuế hợp lý để tính toán ra phúc lợi xã hội phụ thuộc vào lượng giấy và thủysản được sản xuất ra, như vậy giá trị thuế sẽ chi trả bởi (1) Ta cần có một hàm số

để thực hiện công việc trên, hàm này phụ thuộc vào r: W (x1(r), x2(x1(r)), r) là lớn

Trang 33

và x2 thỏa bài toán max

x2≥0 G F (x1, x2), với r, x1 cho trước và thỏa mãn điều kiện

G F (x1, x2) ≥ 0.

(5) Vài ứng dụng thực tiễn khác(Other Real Applications)

Danh sách các ứng dụng của bài toán hai cấp là vô cùng dài và được phát triển

nhanh chóng Sau đây ta sẽ nêu vài ứng dụng được trình bày ngắn gọn Dĩ nhiên,những ứng dụng này có thể thực hiện và hoàn thiện trong tương lai xa và mục đíchchủ yếu là đưa ra những nghiên cứu khác nhau về các vấn đề thực tế trong đó cóliên quan đến mô hình bài toán tối ưu hai cấp nêu trên

+ giải quyết xung đột trong phân chia nguồn nước các con sống lớn trên thế giới(sông Nin, Hằng)

+ công nghệ vật liệu

+ Cân bằng giao thông

M

Trang 34

• Chuyển các lớp bài toán tối ưu hai cấp dạng optimistic về các lớp bài toán

tương đương bằng một trong bốn hướng tiếp cận (các hướng tiếp cận sẽ nói

rõ bên dưới)

• Thiết lập các điều kiện định tính ràng buộc (Constraint Qualification

condi-tions, viết tắt là (CQ)) kèm theo mỗi hướng tiếp cận

• Tùy từng lớp bài toán mà ta áp đặt các tính chất cho các hàm F, f, g, Ψ, ϕ

trong bài toán

• Áp dụng kiến thức cơ bản về điều kiện tối ưu cho bài toán tối ưu một cấp có

chứa tham số

Từ đó thiết lập được điều kiện cần tối ưu cho bài toán tối ưu hai cấp dạng optimisticban đầu

Trang 35

Có bốn hướng tiếp cận khi thiết lập điều kiện tối ưu:

Hướng tiếp cận (1) Sử dụng hàm Lagrange và tập nhân tử Lagrange thay thế bài toán cấp dưới lồi và dưới các điều kiện (CQ): (MFCQ), (SMFCQ).

Hướng tiếp cận (2) Sử dụng nón pháp tuyến và đối đạo hàm (do Mordukhovich

đề xuất) đối với đồ thị của ánh xạ (đa trị) tập nghiệm gph Ψ của bài toán cấp dưới

lồi.

Hướng tiếp cận (3) Sử dụng dưới vi phân Mordukhovich để phát triển hàm giá

trị tối ưu ϕ của bài toán cấp dưới dưới điều kiện CQ partially calm, .

Hướng tiếp cận (4) Sử dụng dưới vi phân Clarke phát triển hàm giá trị tối ưu ϕ

của bài toán cấp dưới dưới rất nhiều điều kiện CQ khác nhau.

Sau đây ta tìm hiểu các hướng tiếp cận này bằng ba mục sau Mục (3.1) gồmhai hướng tiếp cận (1) và hướng tiếp cận (2) cho bài toán hai cấp hữu hạn với giả

thiết lồi ở bài toán cấp dưới, Mục (3.2) gồm hướng tiếp cận (3) và mục cuối cùng

(3.3) gồm hướng tiếp cận (4)

Các kết quả trong phần này có liên quan tới [10], [14]

Hướng tiếp cận (1): Sử dụng hàm Lagrange và tập nhân tử

Lagrange thay thế bài toán cấp dưới lồi

Các yếu tố sau được xét trong [10, chương 4, 5]

Xét các bài toán như sau:

min

y {f (x, y)|g(x, y) ≤ 0, h(x, y) = 0} (3.1)min

min

x {ϕ o (x)|x ∈ X}, (3.3)

Trang 36

ϕ o (x) = min

với Ψ(.) xác định như (2.4) và F : R n × R m → R, Y ⊆ R m là tập đóng, X = {x ∈

Rn |G(x) ≤ 0} trong đó ràng buộc bài toán cấp trên G : R n → R k, còn các hàm của

bài toán cấp dưới f, g, h đều lồi.

Như vậy bài toán hai cấp gốc ban đầu là: (3.1), (3.2) Bài toán hai cấp dạng mistic là: (3.1), (3.3), (3.4)

λ T g(x, y) = 0, h(x, y) = 0.

Và chúng ta viết lại bài toán hai cấp với dạng KKT thay thế bài toán cấp dưới, nhưsau

min

x,y,λ,µ F (x, y) G(x) ≤ 0,

∇ y L(x, y, λ, µ) = 0, g(x, y) ≤ 0, λ ≥ 0,

λ T g(x, y) = 0,

Khi bài toán cấp dưới (3.1) là lồi thì bài toán (3.5) tương đương với bài toán

hai cấp gốc (3.1), (3.2) (xem [10, Chương 5])

Trang 37

Tuy vậy sự khó khăn của bài toán (3.5) là, do nó là bài toán trơn nên một số giả

thiết chính quy và điều kiện định tính ràng buộc (CQ) không thỏa mãn

Ta kí hiệu ∇f (.), ∇ x f (.), ∇ y f (.) tương ứng là gradient của hàm f , gradient của hàm

f theo biến x, gradient của hàm f theo biến y.

Ta có thể nêu giả thiết chính quy do Mangasarian–Fromowitz (MFCQ) đề ra:Định nghĩa 3.1.1 ([10], Mangasarian Fromowitz Constraint Qualification)(MFCQ) thỏa mãn cho bài toán min

y {f (x, y)|g(x, y) ≤ 0, h(x, y) = 0} tại điểm

(x o , y o) nếu có một hướng d sao cho

∇ y g i (x o , y o )d < 0 ∀i ∈ I(x o , y o ) := {j|g j (x o , y o ) = 0},

∇ y h j (x o , y o )d = 0 ∀j = 1, , q

và gradient {∇ y h j (x o , y o )|j = 1, , q}, {∇g i (x, y)|i ∈ I(x o , y o )} độc lập tuyến tính.

Do đó ta cần thiết lập dạng bài toán không trơn sao cho các (CQ) thỏa mãn, xét

định lý sau:

Định lý 3.1.1 ([10], Định lý 5.11) Nếu dạng KKT của bài toán (3.1) là một phần

của các ràng buộc của một bài toán tối ưu thì (MFCQ) không thỏa mãn tại mọi điểm chấp nhận được.

Chứng minh

Đặt w(x, y) := −g(x, y) và xét dạng KKT của (3.1):

∇ y L(x, y, λ, µ) = 0, w(x, y) := −g(x, y) ≥ 0, λ ≥ 0,

λ T w(x, y) = 0 (i), h(x, y) = 0 (ii).

là một phần của các ràng buộc của bài toán tối ưu

Giả sử (MFCQ) thỏa mãn tại điểm chấp nhận được (x, y, λ, µ), thì từ bất đẳng thức

Trang 38

(i) và phương trình (ii) ở trên, ta có:

(λ T ∇ x w(x, y), λ T ∇ y w(x, y), w(x, y), 0) T 6= 0 (3.6)

và có một vecto (d, r, s) thỏa:

λ T ∇ x w(x, y)d + λ T ∇ y w(x, y)r + s T w(x, y) = 0, (3.7)

∇ x w i (x, y)d + ∇ y w i (x, y)r > 0, ∀i : w i (x, y) = 0, (3.8)

s i > 0, ∀i : λ i = 0. (3.9)Bây giờ từ (3.8) và (3.9) ta suy ra được

λ T ∇ x w(x, y)d + λ T ∇ y w(x, y)r + s T w(x, y) ≥ 0. (3.10)

Thật vậy nếu ∇ x w i (x, y)d + ∇ y w i (x, y)r ≤ 0 thì w i (x, y) > 0 (3.8), theo dòng 2 trên

ta suy ra λ i = 0 lại suy ra s i > 0 (do (3.9)) nên ta có (3.10) Nếu s i ≤ 0 suy ra

w i (x, y) = 0, do (3.8) và (i) Tóm lại ta có (3.10).

Mặt khác dấu đẳng thức ở (3.10) không xảy ra Thật vậy, nếu w i (x, y) > 0 thì

λ i = 0, do (i) và s i > 0 do (3.9) , do đó (3.10) không xảy ra dấu "=", điều này mâu

Vậy (MFCQ) không thỏa mãn tại điểm chấp nhận (x, y, λ, µ) ¤

Để phá bỏ khó khăn này, một dạng cho bài toán hai cấp không trơn dạng

opti-mistic được xây dựng như sau:

min

x,y,λ,µ F (x, y) G(x) ≤ 0,

∇ y L(x, y, λ, µ) = 0,

Trang 39

min{−g(x, y), λ} = 0,

Bây giờ ta trở lại vấn đề chính là điều kiện tối ưu Trước hết ta tìm hiểu mốiquan hệ giữa bài toán hai cấp dạng optimistic và bài toán vừa thiết lập (3.11)

Định lý 3.1.2 ([10], Định lý 5.15) Xét bài toán optimistic bilevel (3.1), (3.3), (3.4)

và giả thiết bài toán cấp dưới (3.1) là bài toán tối ưu tham số lồi sao cho (MFCQ) thỏa mãn tại nghiệm chấp nhận (x o , y o ) với G(x o ) ≤ 0, y o ∈ Ψ(x o ) Khi đó mỗi

nghiệm tối ưu địa phương optimistic của (3.1), (3.3), (3.4) tương ứng là một nghiệm tối ưu địa phương cho bài toán (3.11).

Chứng minh

Giả sử x o là nghiệm tối ưu optimistic địa phương của (3.1), (3.3), (3.4), nghĩa là

tồn tại một lân cận mở U δ (x o ) sao cho ϕ o (x o ) ≤ ϕ o (x), ∀x ∈ U δ (x o ) với G(x) ≤ 0.

Vì dạng KKT là cần và đủ trong bài toán cấp dưới nên ta có:

ϕ o (x o ≤ F (x, y), ∀(x, y), x ∈ U δ (x o)và

∇ y L(x, y, λ, µ) = 0, g(x, y) ≤ 0, λ ≥ 0, λ T g(x, y) = 0, h(x, y) = 0.

điều này có nghĩa là tồn tại một lân cận mở W ² (x o , y o) sao cho

ϕ o (x o ) ≤ F (x, y), ∀(x, y) ∈ W ² (x o , y o)thỏa mãn

∇ y L(x, y, λ, µ) = 0, g(x, y) ≤ 0, λ ≥ 0, λ T g(x, y) = 0, h(x, y) = 0 ¤

Sau đây là điều kiện tối ưu dạng Fritz–John cho bài toán (3.11)

Định lý 3.1.3 [10, Định lý 5.16](Điều kiện tối ưu dạng Fritz John)Nếu (z o , v o)

với z o := (x o , y o ) và v o := (λ o , µ o ), là một nghiệm tối ưu địa phương của (3.11) thì

Trang 40

tồn tại một vectơ (κ o , κ, ω, ζ, τ, ξ) 6= 0 thỏa:

i = 0

Ngày đăng: 05/04/2013, 13:59

TỪ KHÓA LIÊN QUAN

TRÍCH ĐOẠN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w