Những kiến thức cơ bản về tập lồi và hàm lồi 4
Tập lồi
Tập lồi là khái niệm cơ bản trong giải tích lồi và toán học, bao gồm các tập quen thuộc như không gian con, siêu phẳng và đoạn thẳng Bài viết này trình bày định nghĩa và tính chất của tập lồi, cùng với một số ví dụ về các tập lồi đặc biệt.
Cho X là không gian tuyến tính tô pô Haussdoff Định nghĩa I.1[2] Với x x 1 , 2 X, đoạn x x 1, 2 được định nghĩa
x x 1, 2 : ={xX :x x 1(1)x 2, 0,1 }. Định nghĩa I.2[2] Tập AXgọi là tập lồi nếu
Nhận xét Nếu x x 1 , 2 A x x 1 , 2 A thì A là tập lồi
Ví dụ 1 a- Trong 2 , Tập B 0,1 x 2 : x 1 là tập lồi
Thật vậy, lấy x y , B 0,1 x 1 , y 1 , với 0,1 ta có:
B là tập lồi b- Tập A x y , 2 : ax by c a b c ; , , là tập lồi
Mệnh đề I.1 Giả sử A X, (I) là các tập lồi với I là tập chỉ số Khi đó, tập
cũng là một tập lồi
Mệnh đề I.2 Cho A i X là các tập lồi; i , i1,n Khi đó, tập
cũng là một tập lồi
Vậy A là một tập lồi
Mệnh đề I.3 Cho X i là các không gian tuyến tính A i X i là các tập lồi (i=1,n) Khi đó, tập A= A 1 A 2 A n là một tập lồi trong X 1 X 2 X n
Vậy, A là tập lồi trong X 1 X 2 X n
Lớp các tập lồi được xác định là đóng với phép giao, phép cộng đại số và phép tích đề các Theo định nghĩa I.3, một véc tơ x thuộc tập X được gọi là tổ hợp lồi của các véc tơ x1, x2, , xn nếu thỏa mãn các điều kiện nhất định.
Mệnh đề I.4 Tập A X là tập lồi khi và chỉ khi nó chứa mọi tổ hợp lồi của các điểm của nó Tức là: A lồi khi và chỉ khi
Nếu A chứa mọi tổ hợp lồi của các điểm của nó thì
Giả sử A lồi Ta chứng minh bằng quy nạp
*Giả sử kết luận đúng với k điểm.Tức là:
*Ta chứng minh kết luận đúng với k+1 điểm
Không mất tổng quát, ta giả sử k 1 1, ta có
Theo giả thiết quy nạp,
Nhận xét Giả sử X, Y là các không gian tuyến tính, f X : Y là ánh xạ tuyến tính Tập A X là tập lồi Khi đó f (A) cũng là tập lồi
Thật vậy, lấy y y 1 , 2 f A ( ) x x 1 , 2 A sao cho: y 1 f x ( ), 1 y 2 f x ( ) 2
(Do x 1 1 x 2 A ) Vậy, f A là tập lồi Định nghĩa I.4 [2] Giả sử A X Giao của tất cả các tập lồi chứa A được gọi là bao lồi của A và kí hiệu là CoA
CoA là tập lồi nhỏ nhất chứa A, và A là tập lồi khi và chỉ khi A bằng CoA Giao của tất cả các tập lồi đóng chứa A được gọi là bao lồi đóng của tập A, ký hiệu là CoA.
CoA là tập lồi đóng nhỏ nhất chứa tập A, và nếu A là tập lồi đóng thì A bằng CoA Theo định lý I.4, bao lồi đóng của tập A trùng với bao đóng của bao lồi của A.
Trước hết, ta chứng minh bao đóng của một tập lồi là tập lồi Tức là, nếu A là tập lồi thì A cũng là tập lồi
Giả sử U là một lân cận lồi của 0 Do x i A nên x i U A i1, 2 Do đó x i ' x i U A i 1, 2 Đặt x ' x 1 ' 1 x 2 ' Khi đó x ' x 1U 1 x 2U x 1 1 x 2U Hay là
Vì A lồi nên x ' A Do đó
xU A Vậy, xA, hay A là tập lồi
Vì CoA là lồi nên CoA lồi Như vậy CoA là một tập đóng chứa A
Mặt khác, do CoA là giao của tất cả các tập lồi (không cần đóng) chứa A nên:
Giả sử X là không gian tuyến tính tô pô Haussdoff Định nghĩa I.6 [2] Tập K Xgọi là nón có đỉnh tại 0 nếu:
K gọi là nón có đỉnh tại x 0 nếu K – x 0 là nón có đỉnh tại 0 Nón K có đỉnh tại 0 được gọi là nón lồi nếu K là một tập lồi
Ví dụ a) A : x x 0 là một nón, không lồi b) B : x x 1 , 2 , , x n n ; x i 0, i 1, n là một nón lồi
Trong giải tích lồi, hai nón lồi điển hình thường được xem xét là nón lùi xa và nón pháp tuyến Theo định nghĩa, một véctơ y khác không được gọi là hướng lùi xa của tập lồi C trong không gian X nếu mọi tia xuất phát từ bất kỳ điểm nào của C theo hướng y đều nằm hoàn toàn trong C Do đó, y là hướng lùi xa khi và chỉ khi điều kiện này được thỏa mãn.
Tập ReC gồm tất cả các hướng lùi xa của C cùng với điểm gốc được gọi là nón lùi xa của C
Mệnh đề I.5 [1] Giả sử C là một tập lồi, đóng Khi đó, y là một hướng lùi xa của C khi và chỉ khi
y C x với một điểm x nào đó thuộc C Định nghĩa I.8 [1] Cho C X là một tập lồi và x C Tập
N C x X y x y C là một nón lồi đóng Nón này được gọi là nón pháp tuyến ngoài của C tại x Tập
gọi là nón pháp tuyến trong của C tại x
Hiển nhiên, nón N C x chứa đỉnh 0
I.13 Tập affine và bao affine
Trong đại số tuyến tính, các khái niệm như không gian con và siêu phẳng là những trường hợp đặc biệt của tập affine Theo định nghĩa, một tập C được coi là tập affine nếu nó bao gồm tất cả các đường thẳng đi qua bất kỳ hai điểm nào trong tập đó.
1) Tập affine là một trường hợp riêng của tập lồi
2) Mọi siêu phẳng trong n đều là tập affine
Mệnh đề sau đây cho ta thấy tập affine chính là ảnh tịnh tiến của một không gian con
Mệnh đề I.6 cho biết rằng một tập M khác rỗng là tập affine khi và chỉ khi nó có dạng M = L + a, trong đó L là một không gian con duy nhất và a thuộc M Để chứng minh điều kiện cần, giả sử M là một tập affine và a thuộc M, ta có thể thấy rằng L = M - a là một không gian con Do đó, M có thể được biểu diễn dưới dạng M = L + a Đối với điều kiện đủ, nếu M được biểu diễn như M = L + a với L là một không gian con và a thuộc M, thì M cũng là một tập affine.
Do x – a và y – a đều thuộc không gian con L nên
1 xa ya L Vậy 1 xyM Suy ra M là một tập affine
Không gian con L ở trên là duy nhất Thật vậy, nếu M = L + a và M L ' a ' , trong đó L, L ’ là những không gian con và a,a ' Mthì
Không gian con L trong mệnh đề trên được gọi là không gian con song song với
M Từ mệnh đề trên ta rút ra định nghĩa sau : Định nghĩa I.10[1] Thứ nguyên (hay chiều) của một tập affine M là thứ nguyên (hay chiều) của không gian con song song với M và được ký hiệu là dimM
Mệnh đề sau đây cho ta thấy rằng, mọi tập affine đều là tập nghiệm của một hệ phương trình tuyến tính
Mệnh đề I.7 [1] Mọi tập affine M n có số chiều r khi và chỉ khi
M x Axb , trong đó b m , A Mat m n , và rank A = n – r
Chứng minh Điều kiện cần: Giả sử M là tập affine có số chiều r và M = L +a với a M Vậy
L = M – a là không gian con có số chiều là r của R n Do đó L có dạng:
L x Ax , trong đó A Mat m n , và rank A = n – r từ M = L +a, suy ra
M là tập hợp các điểm x thuộc không gian n chiều sao cho Ax = b, với A là ma trận m x n và b là véc tơ m chiều Điều kiện cần và đủ là rank của A bằng n - r Tập M là một tập affine, trong khi tập con song song với M là L, được định nghĩa bởi Ax = 0 Từ rank A = n - r, ta suy ra rằng kích thước của L là r, và do đó, kích thước của M cũng là r Theo định nghĩa, x được gọi là tổ hợp affine của các điểm (véc tơ) x1, x2, , xk nếu x có thể biểu diễn dưới dạng tổng các véc tơ này.
j Định nghĩa I.12[1] Bao affine của C là giao của tất cả các tập affine chứa C Ký hiệu là aff C
Mệnh đề sau đây cho chúng ta biết cấu trúc của aff C
Mệnh đề I.8 [1] AffC là tập hợp các tổ hợp affine của các điểm thuộc C
Ta gọi M là tập hợp các tổ hợp affine của các điểm thuộc C, tức là:
Vì C affC và affC là tập affine nên M affC
Ta chứng tỏ M là một tập affine Thật vậy, giả sử x , y M Theo định nghĩa của
Với bất kỳ, ta có
Z là một tổ hợp affine của các điểm thuộc tập C, do đó z thuộc M, từ đó suy ra M là một tập affine Kết luận rằng M = aff C Định nghĩa I.13: Thứ nguyên (hay chiều) của một tập C bất kỳ được xác định như sau.
Trong không gian affine, chiều của tập hợp điểm C bằng chiều của bao affine của nó, tức là dim C = dim (aff C) Các điểm x0, x1, , xk trong không gian n được coi là độc lập affine nếu bao affine được tạo ra bởi chúng có thứ nguyên k.
Mệnh đề dưới đây cho ta một tính chất đặc trưng của các điểm độc lập affine
Mệnh đề I.9 [1] Các điều sau đây tương đương: a Các điểm x 0 , x 1 , , x k độc lập affine b Với mỗi i, các véctơ x j x i , j 0 , 1 , k ; j i độc lập tuyến tính trong n
Chứng minh Đặt S x 0 , x 1 , , x k , L là không gian con song song với aff S Không mất tính tổng quát, ta giả sử i = 0 đặt y j x j x 0 suy ra y j L , j 1 , 2 , , k Cho j k j j x x
là một tổ hợp affine bất kỳ của các điểm x 0 , x 1 , , x k Vì 1
Ta suy ra affS x 0 span y 1 , y 2 , , y k trong đó span y 1 , y 2 , , y k là không gian con sinh bởi các véctơ y 1 , y 2 , , y k Theo mệnh đề 1.1.10, ta có L span y 1 , y 2 , , y k
Vậy dim L = k khi và chỉ khi y 1 ,y 2 , ,y k độc lập tuyến tính trong n
Mệnh đề I.10[1] Cho hai tập affine A và B trong n Giả sử dim A = dim B, khi đó tồn tại một ánh xạ affine 1 – 1 T: A B sao cho TA = B
Theo giả thiết, A và B là các tập affine đồng thời dim A = dim B = m nên chúng là bao affine của m + 1 điểm độc lập affine Giả sử
Do a 0 , a 1 , , a m là các điểm độc lập affine nên theo mệnh đề I.9, các véctơ
Tương tự, các véctơ b 1 b 0 , b 2 b 0 , , b m b 0 cũng độc lập tuyến tính
Với mọi x A đều biểu diễn duy nhất dưới dạng j m j x j
Trong đó j a j a 0 Đặt j b j b 0 , T j j , j 0 , 1 , , m Ta lấy
Dễ dàng kiểm tra được T là ánh xạ affine và TA = B
Trong tối ưu hóa và các lĩnh vực toán học ứng dụng khác, việc làm việc với các tập lồi trong không gian n có thứ nguyên không đầy đủ là phổ biến Những tập lồi này thường không có điểm trong, nhưng nhờ vào cấu trúc lồi, chúng lại có điểm trong tương đối Khái niệm điểm trong tương đối đóng vai trò quan trọng trong giải tích lồi Theo định nghĩa, một điểm a thuộc tập C được gọi là điểm trong tương đối của C nếu nó là điểm trong của C theo tôpô cảm sinh bởi affC.
Tập các điểm tương đối của C ký hiệu là riC Theo định nghĩa trên ta có:
a C B a B affC C riC : , trong đó B là một lân cận mở của gốc tọa độ 0
Tập hợp C được ký hiệu là C và được xác định là bao đóng của C Biên tương đối của C được gọi là C\riC Nếu C bằng riC, thì tập C được xem là mở tương đối Theo định nghĩa, tất cả các tập affine đều là mở tương đối.
1 Nếu int C thì riC int C
2 Nếu C 1 C 2 thì chưa chắc riC 1 riC 2
Mệnh đề dưới đây cho chúng ta thấy điều kiện cần và đủ để một điểm là điểm trong tương đối của một tập lồi
Mệnh đề I.11[1] Cho C n là một tập lồi Khi đó a riC khi và chỉ khi
Bằng cách sử dụng bao affine của tập hợp C, ta có thể giả định rằng kích thước của C là n (dimC = n) Khi đó, tập hợp riC sẽ tương đương với phần trong (int C) Điều kiện cần để điều này xảy ra là với mọi điểm a thuộc phần trong của C (a ∈ int C), tồn tại một hình cầu B[a, r] với bán kính r sao cho hình cầu này hoàn toàn nằm trong C (B[a, r] ⊆ C).
Khi a đủ nhỏ, ta có a + λ(x - a) thuộc tập C Để đảm bảo điều kiện này, ta giả sử a = 0 Gọi e_i (với i = 1, 2, , n) là véctơ đơn vị thứ i trong không gian R^n Theo giả thiết, với x = e_i, tồn tại β_i > 0 sao cho β_i e_i thuộc C Tương tự, với x = -e_i, tồn tại α_i > 0 sao cho -α_i e_i thuộc C.
Lấy min i , i i 1,2, , n và hình cầu B x R n : x 1 , trong đó
với x T x 1 , x 2 , , x n Lấy u i e i i 1 , 2 , , n Vì C là tập lồi nên
Do đó, x là tổ hợp lồi của 0 C , u i C với i I , u i C với iI Vì C là tập lồi nên x C Vậy BC
Hàm lồi
Trong chương trình toán học phổ thông, chúng ta đã làm quen với khái niệm hàm lồi, bao gồm việc sử dụng tính chất lồi, lõm để vẽ đồ thị và chứng minh bất đẳng thức Bài viết này sẽ trình bày khái niệm tổng quát về hàm lồi cùng với những tính chất quan trọng của nó Định nghĩa I.16 [2] nêu rõ rằng cho X là không gian lồi địa phương và D là tập con của X.
Trên đồ thị của hàm f, kí hiệu: epif, được định nghĩa:
Epif:= x r , D : ( ) f x r Định nghĩa I.17 [3] Miền hữu dụng của hàm f, kí hiệu: domf , được định nghĩa
D Định nghĩa I.18[2] Hàm f được gọi là lồi trên D nếu Epif là tập lồi trên X Nhận xét Nếu f là hàm lồi trên D thì domf là tập lồi trên D
Domf là hình chiếu của Epif trên X
Suy ra, D omf là ảnh của tập lồi qua ánh xạ tuyến tính
Vậy, D omf là tập lồi
: : 1 2 2 2 n 2 1 2 f x x x x x là một hàm lồi Định lí I.1 Cho D là một tập lồi trong X, f: D Khi đó, f lồi trênD khi và chỉ khi 0,1 x y , D :
*Điều kiện cần: Giả sử f lồi trên D, (0,1)
( ) f x hoặc f y ( ) Suy ra nếuxC nếuxC
Nếu x y , d omf , nghĩa là f(x) < + và f(y) < +
Theo nhận xét trên: Vì f là hàm lồi nên domf lồi Do đó ta có:
Vì Epif lồi nên ( , ) x r Ep if, ( , ) y s Ep if ta có:
( (1 ) ) 1 f x y f x f y *Điều kiện đủ: Ngược lại, lấy (x,r) Epif, (y,s) Epif, [0,1], Ta cần chỉ ra:
Vậy, Epif là tập lồi Theo định nghĩa, f là hàm lồi.( đpcm) Định nghĩa I.19[2] Cho C n là tập lồi, khác rỗng và hàm f C :
Hàm f được gọi là chính thường nếu domf và f x ,xC
Hàm f được coi là hàm đóng khi ảnh epi f tạo thành một tập đóng trong không gian Euclid n+1 Theo định nghĩa I.20, với hàm f g C: , trong đó C là tập con của n, ta nói rằng g là bao đóng của f nếu epi g bằng epi f Ký hiệu bao đóng của f là f.
1 Từ định nghĩa của epif, ta thấy rằng một hàm lồi hoàn toàn được xác định nếu biết epif
2 Nếu f là hàm lồi trên một tập lồi C n thì ta có thể khai triển f lên toàn không gian n bằng cách đặt
Ta thấy f e x f x , x C và f e lồi trên n Hơn nữa, f e là chính thường khi và chỉ khi f chính thường, f e đóng khi và chỉ khi f đóng
3 Nếu f là một hàm lồi trên R n thì dom f là một tập lồi vì dom f chính là hình chiếu của epif trên tập n , tức là
: , domf x x epif Định nghĩa I.21[2] Cho C n là một tập lồi khác rỗng
Hàm f : n được gọi là lồi chặt trên C nếu x y , C , 0,1 ta có:
Hàm f : n được gọi là lồi mạnh trên C với hệ số nếu
Nhận xét f lồi mạnh trên C với hệ số 0 khi và chỉ khi hàm
Bài viết này sẽ trình bày về một bất đẳng thức quen thuộc trong chương trình phổ thông, đó là một bất đẳng thức tổng quát liên quan đến hàm lồi Các bất đẳng thức nổi tiếng như Cauchy và Bunhiak đều là những trường hợp đặc biệt của bất đẳng thức này.
Mệnh đề I.14 (Bất đẳng thức Jensen) [1]
Nếu f là hàm lồi xác định và nhận giá trị hữu hạn trên tập lồi C thì, với mọi
Ta chứng minh bằng phương pháp quy nạp
Với m = 2: Bất đẳng thức (1.5) được suy ra từ hàm lồi
Giả sử bất đẳng thức đúng với m – 1, ta chứng minh nó đúng với m Thật vậy, giả sử m 1, đặt
m m m m x f y f x y f Theo giả thiết quy nạp, ta có
Sau đây ta sẽ đưa ra điều kiện cần và đủ để một hàm là lồi
Mệnh đề I.15 [1] Một hàm f C: là lồi trên C khi và chỉ khi
Để chứng minh điều kiện cần, giả sử hàm f là hàm lồi trên tập C Khi đó, với mọi x, y thuộc C và mọi α ≥ f(x), β ≥ f(y), ta có thể suy ra rằng các điểm (x, α) và (y, β) đều thuộc tập epif Vì f là hàm lồi, nên tập epif cũng sẽ là một tập lồi.
x 1 y 1 f Điều kiện đủ: Giả sử x, và y, thuộc epif suy ra f x và f y
Theo giả thiết điều kiện đủ, 0 , 1 ta có
Vậy epif là tập lồi hay f là hàm lồi trên C Định nghĩa I.21[2] Hàm f xác định trên X gọi là thuần nhất dương nếu
( x f x f , x X 0, Định lý I.2 Hàm thuần nhất dương f :X ; là hàm lồi khi và chỉ khi:
x y f x f y f x , y X Chứng minh a) Giả sử hàm thuần nhất dương f là lồi Lấy x,yX Khi đó,
Lấy x i , r i epif i 1 , 2 , vì f x 1x 2 f x 1 f x 2 r 1r 2 cho nên
Hơn nữa, vì f là hàm thuần nhất dương, nên nếu x,r epif thì f x r và
, Vậy, epif đóng đối với phép cộng và phép nhân vô hướng Suy ra epif là nón lồi
Hệ quả 1 Giả sử f là hàm lồi chính thường, thuần nhất dương Khi đó, x i X,
Hệ quả 2 Giả sử f là hàm lồi chính thường, thuần nhất dương Khi đó, x X :
Các phép toán về hàm lồi
Định lý I.3 Giả sử f 1 , ,f m là các hàm lồi chính thường trên X Khi đó, tổng f m f 1 là một hàm lồi Định lý I.4 Giả sử F là tập lồi trong X và
x x F f inf : , Khi đó, f là hàm lồi trên X Định lý I.5 Giả sử f 1 , ,f m là các hàm lồi chính thường trên X Khi đó, hàm
1 : , inf là hàm lồi trên X Định lý I.6 Giả sử f I là các hàm lồi trên X Khi đó, các hàm: Sup f x
inf là hàm lồi Để hiểu rõ hơn về các phép toán trên, độc giả có thể xem [2], từ trang 47 đến trang 50
Chương I của bài viết tập trung vào khái niệm về tập lồi và hàm lồi, cùng với các tính chất liên quan như dấu hiệu nhận biết và các phép toán Ngoài ra, bài viết cũng đề cập đến một số tập lồi quan trọng như tập affine và nón Vấn đề dưới vi phân của hàm lồi sẽ được trình bày chi tiết trong chương tiếp theo.
Dưới vi phân của hàm lồi 23
Dưới vi phân của hàm lồi
Cho f là hàm lồi trên X. Định nghĩa II.2 a Phiếm hàm x * X * được gọi là dưới đạo hàm của hàm f tại x X nếu x X
( ) ( ) * , f x f x x x x b Tập tất cả dưới đạo hàm của f tại x được gọi là dưới vi phân của f tại x Kí hiệu là f x ( ) Như vậy,
c Hàm f được gọi là khả dưới vi phân tại x nếu f x ( ) Ở đây, x x * , x là giá trị của phiếm hàm x * tại xx Nghĩa là :
Định lí II.2 Cho f là hàm lồi chính thường X; x domf Khi đó
Vì f có đạo hàm tại x theo phương d nên:
( ; ) * , f x d x d +, Ngược lại; giả sử f x d ( ; ) x d * , Lấy x X x : d x Ta có:
Hệ quả sau nói lên mối quan hệ giữa dưới vi phân và đạo hàm theo phương
( d là dưới vi phân của f x d ( ; ) theo d )
Theo định nghĩa của đạo hàm theo phương, ta có:
( ;0) 0 f x Theo định lí II.2, ta có:
Định lí II.3 Cho f là hàm lồi chính thường x domf trên X Khi đó:
+, Giả sử x * f x ( ) Khi đó, x X ta có:
Lại theo bất đẳng thức young- Fenchel:
Theo bất đẳng thức young- Fenchel: f x ( ) f * ( ) x * x x * ,
Sau đây là các ví dụ về dưới vi phân của một số hàm
Thật vậy, trước tiên ta chứng minh x * f x ( )
( ) ( ) , f x f x x x Điều này không xảy ra vì 0 *
2 Xét hàm chỉ f x ( ) ( / ) x A , Trong đó A là tập lồi khác
* Với x A Khi đó, x X ta có: x * f x( ) f x( ) f x( ) x x, x
Vì x A nên f x ( ) 0 Thay vào bất đẳng thức trên, ta được:
Vậyx * là véctơ pháp tuyến của A tại x, suy ra
3 Cho X là không gian Banack f x( ) x
Vậy, f 0 là hình cầu đơn vị đóng B 0;1
+ Nếu x * X * , x * 1 và x x * , x Khi đó, x X ta có
Theo định nghĩa II.2 thì x * f x ( )
2 x x x x * , x x * , x Kết hợp hai bất đẳng thức trên, ta được: x x * , x
Cho ta được z x z * , Từ đó ta có x * 1
, ta suy ra x x * , x (Vô lý)
Vậy: x * 1 Định lý II.4 Cho f ' x ; là hàm lồi , đóng Khi đó f x và
Ta cần mệnh đề sau: Nếu f là hàm lồi, đóng, thuần nhất dương thì
Mệnh đề II.2 Giả sử f là hàm lồi chính thường trên n Khi đó
Mệnh đề II.3 nêu rằng, nếu f là hàm lồi chính thường trên tập X và x thuộc vào miền xác định của f, thì tập biên của f tại x không rỗng khi và chỉ khi f nửa liên tục dưới tại 0 Định nghĩa II.3 chỉ ra rằng hàm f được coi là khả vi Gâtteaux tại điểm x nếu tồn tại x* thuộc X* thỏa mãn điều kiện nhất định.
Khi đó, ta gọi x * là đạo hàm Gâtteaux của hàm f tại x x f G x
Định lý II.5 chỉ ra rằng nếu f là hàm lồi trên tập X và khả vi Gâtteaux tại điểm x với đạo hàm Gâtteaux là x*, đồng thời f cũng khả dưới vi phân tại x, thì tập hợp đạo hàm riêng f(x) sẽ bằng {x*} Hơn nữa, nếu f là hàm chính thường, liên tục tại x và f(x) = {x*}, thì f sẽ khả vi Gâtteaux tại x và đạo hàm Gâtteaux của f tại x sẽ là x*.
Chứng minh a) Từ định nghĩa về hàm khả vi Gâtteaux, ta có :
x y d x * y * 0 x * y * Vậy, f x x * b) Giả sử f x x * Ta có f ' x , liên tục Do đó f ' x , là hàm đóng Vì vậy,
Vậy, f khả vi Gâtteaux tại x và f G ' x x *
Các định lý cơ bản về dưới vi phân
Cho X là không gian tuyến tính, lồi địa phương Hausdorff
Mệnh đề II.4 Giả sử f là hàm lồi chính thường trên X và 0 Khi đó, x X
Với xdomf , do f lồi chính thường và 0, nên f lồi chính thường và
f x f x Định lý II.6 (Moreau – Rockafellar) Giả sử f 1 , ,f m là các hàm lồi chính thường trên X Khi đó, x X ,
Hơn nữa, nếu tại điểm i m i domf x 1 , tất cả các hàm f 1 , ,f m liên tục ( có thể trừ ra một hàm), thì
Hệ quả Giả sử f 1 , ,f m là các hàm lồi chính thường trên X và 1 0, , m 0 Khi đó, x X ,
Hơn nữa, nếu tại m i i domf x
, tất cả các hàm f 1 , ,f m liên tục ( có thể trừ ra một hàm), thì x X ,
1 1 1 1 Định lý II.7 Giả sử X, Y là các không gian lồi địa phương Hausdorff A : X Y là toán tử tuyến tính liên tục f là hàm xác định trên Y Khi đó,
Hơn nữa, nếu f lồi và liên tục tại một điểm nào đó thuộc ImA thì x X ,
A * Chứng minh a Lấy x * A * f Ax Khi đó, y * f Ax sao cho: x * A * y * Do đó,
A * f Ax fA x b Giả thiết f là hàm lồi, liên tục tại điểm A x , x X Xét hai trường hợp: b 1 ) Nếu fA x , theo (a), A * f Ax b đúng b 2 ) Nếu fA x ta có fA ' x;z f ' Ax;Az
Vì f ' Ax; liên tục tại điểm A x x Im A , nên ta được:
A * f ' Ax ; 0 A * fA x Định lý II.8 Giả sử f s , x lồi theo x với mỗi s S và nửa liên tục trên theo s với mỗi x X Khi đó với mỗi x X ,
Hơn nữa, nếu mỗi s S , hàm f s; liên tục tại x, thì
0 , trong đó, f s là hàm trên X được xác định bởi f s x f s ; x
Hệ qủa Giả sử X R n hàm f s, lồi, liên tục tại x và hàm f ,x nửa liên tục trên Khi đó, mọi y f x đều có thể biểu diễn dưới dạng: m m y y y 1 1 , trong đó m n 1; i 0, 1 m 1; y i f S i x , S i S 0 x i 1, , m
Dưới vi phân của hàm lồi địa phương
Định nghĩa II.4[2] Hàm f xác định trên X được gọi là lồi địa phương tại điểm X x , nếu đạo hàm theo phương f ' x ; tại x tồn tại và lồi.
Giả sử Y là một không gian lồi địa phương Hausdorff Theo định nghĩa II.5, ánh xạ F từ X sang Y được xem là khả vi theo phương d tại điểm x nếu tồn tại giới hạn.
Ánh xạ F: X → Y được coi là khả vi đồng đều theo phương d tại điểm x nếu với mọi lân cận V của 0 trong Y, tồn tại một lân cận U của d trong X và một số λ0 > 0 sao cho với mọi z thuộc U và mọi λ trong khoảng (0, λ0).
Mệnh đề II.5 chỉ ra rằng nếu ánh xạ F : X Y khả vi đồng đều tại điểm x, thì đạo hàm theo phương F, ký hiệu là (x;.), sẽ là ánh xạ liên tục từ X vào Y Theo định nghĩa II.7, một hàm f xác định trên X được coi là lồi địa phương chính quy tại x nếu nó lồi địa phương và khả vi đồng đều tại điểm đó.
Nếu hàm f là hàm lồi địa phương chính quy tại điểm x, thì hàm f, (x;.) sẽ lồi liên tục Theo Định lý II.9, nếu f là hàm lồi chính thường trên tập X, thì f sẽ lồi địa phương chính quy tại x nếu và chỉ nếu f liên tục tại x.
Chứng minh a Giả sử f lồi địa phương chính quy tại x Khi đó, d X , 0, tồn tại lân cận
U của d và số 0 0 sao cho z U , (0, 0 ), ta có
Lấy d=0, ta suy ra f liên tục tại x b Ngược lại, Giả sử f liên tục tại x Do f là hàm lồi, x domf , f x , ( ;.)là hàm lồi
Ta chỉ cần chứng minh, f khả vi đồng đều theo mọi phương, tức là d X , 0, tồn tại lân cận U của d và số 0 0 sao cho:
Do f liên tục tại x nên f liên tục trong lân cận U 0 của x Chọn 0 0 sao cho
Bởi vì x 0 dU 0 , nên f liên tục tại x 0 d Do đó, tồn tại lân cận U của d sao cho:
Không mất tính tổng quát có thể xem tập U là đối xứng qua d, tức là: U chứa z cùng với điểm y z ( để cho 1 d 2 z y ) Hay là, có thể thay U bằng tập
Mặt khác, nếu z U thì y2d z U Do đó,
Hàm f được xác định là hàm lồi địa phương chính quy tại điểm x Theo định nghĩa II.8, dưới vi phân của hàm lồi địa phương f trên tập X tại điểm x thuộc miền xác định của f, ký hiệu là f(x), được định nghĩa rõ ràng.
, trong đó d là dưới vi phân của hàm lồi f ' x d ; theo biến d
Mỗi phần tử f x được gọi là dưới đạo hàm của f tại x Hàm f được gọi là khả dưới vi phân nếu f x
Nếu hàm f là hàm lồi, thì dưới vi phân của nó theo định nghĩa trùng với dưới vi phân của hàm lồi f Định lý II.10 cho biết rằng nếu f1 và f2 là các hàm lồi địa phương chính quy tại điểm x, thì tổng f1 + f2 cũng sẽ là một hàm lồi địa phương chính quy tại x.
Ứng dụng dưới vi phân vào bài toán tối ưu 37
Định nghĩa bài toán tối ưu
Định nghĩa III.1 [3] Một bài toán tối ưu là một bài toán có dạng:
Min f x ( ) | x C } , trong đó, C X là tập chấp nhận được (tập rằng buộc), X là không gian nào đó,
: f C R là hàm mục tiêu Mỗi x C gọi là một phương án chấp nhận được
Một lời giải x gọi là tối ưu (toàn cục) nếu x * C , f x ( ) * f x ( ) x C Một lời giải x gọi là tối ưu địa phương nếu có một lân cận w của x * sao cho:
Vì rằng, Max{ ( ) :f x xC} = -Min f x ( ) : x C }, nên chỉ cần bàn đến các bài toán tìm cực tiểu
Bài toán đặt ra là liệu có tồn tại một lời giải tối ưu hay không Theo định lý III.1, một hàm f(x) nửa liên tục dưới trên một tập compact C sẽ đạt cực tiểu trên tập đó.
Nhắc lại rằng, hàm số f C : R là nửa liên tục dưới tại x C nếu:
Theo định nghĩa của số inf{ ( ) : f x x C }, có dãy { } x * k C sao cho:
Do C compack nên dãy{ } x * k có dãy con hội tụ Có thể giả sử x k n x 0 C Theo định nghĩa về nửa liên tục dưới, f x ( ) 0 Vì f x ( 0 ) R nên
Nếu hàm f(x) chỉ nửa liên tục dưới trên tập đóng C mà không có điều kiện compact, thì có thể không đạt cực tiểu trên C Để đảm bảo điều này, hàm f(x) cần thỏa mãn điều kiện bức trên C, theo Định lý III.2.
( ) f x khi x C , x thì f phải có cực tiểu trên C
Lấy a C , f a( ) Tập D x C f x / ( ) f a ( )} C là tập đóng Ta chỉ ra D là tập compack
Thật vậy, ta chỉ ra D bị chặn Nếu D không bị chặn thì có dãy x k C với:
( k ) ( ) f x f a và x do điều kiện bức, nên f x( k ) (mâu thuẫn).Vậy D bị chặn.Từ đó D compack
Hàm số f(x) đạt cực tiểu trên tập D, và cực tiểu này cũng là cực tiểu trên tập C Theo định lý III.3, nếu f là hàm lồi từ R^n đến R ∪ {+∞}, thì mọi điểm cực tiểu địa phương của f trên tập lồi đều là cực tiểu toàn cục Hơn nữa, tập hợp các điểm cực tiểu tạo thành một tập lồi Nếu hàm f lồi chặt, thì điểm cực tiểu (nếu tồn tại) là duy nhất.
Cho tập lồi C R n Gọi x * là điểm cực tiểu địa phương của f trên C Khi đó tồn tại lân cận U của x * sao cho: f x ( ) * f x ( ) x U C Suy ra
Vậy, x * là cực tiểu toàn cục
Nếu x * ;y * là các cực tiểu toàn cục thì f x( ) * f y( * ) ; f y( * ) f x( ) * Do đó
Lấy z * x * (1 ) y * Do C là tập lồi nên
Vậy, z * cũng là điểm cực tiểu toàn cục
Như vậy, tập các điểm cực tiểu của f trên C là tập lồi Dễ thấy, nếu f lồi chặt thì điểm cực tiểu (nếu tồn tại) là duy nhất
Bây giờ ta xét kỹ hơn đến điều kiện để có cực tiểu của một hàm lồi f Cụ thể là 8 bài toán cực trị sau.
Bài toán lồi
III.2.1 Bài toán lồi không có rằng buộc
Cho không gian lồi địa phương X f là hàm lồi trên X Bài toán tối ưu không rằng buộc là bài toán:
(P1): Min f x ( ) Định lý III.4 Để x * là nghiệm của bài toán (P1), điều kiện cần và đủ là:
0f x Chứng minh x * là nghiệm của (P1) thì x X , ta có
III.2.2 Bài toán lồi có rằng buộc đẳng thức Cho f là hàm lồi trên X, C là đa tạp tuyến tính song song với không gian con M trong X Xét bài toán:
(P2): Min f x ( ) : x C Định lý III.5 a Nếu f liên tục tại một điểm của C, x * là nghiệm của (P2) Khi đó,
b Nếu x * C: f x ( ) * M Khi đó x * là nghiệm của (P2)
L x là hàm lồi trên X Với x C thì L x( ) f x( )
Nếu x là nghiệm của (P2) thì x *C, f x ( ) * f x ( ) Suy ra
L x L x x X Vậy, x là nghiệm của bài toán Min L x ( ) Theo định lí III.4,
Do f liên tục, áp dụng định lý Moreau-Rockerfellar ta được:
0 f x( ) * M b Giả sử x * C thỏa mãn: f x( ) * M Khi đó, x f x ( ) * M
Với x M , Mà với x C thì x x * M nên
( ) ( )* 0 f x f x f x( ) * f x ( ) x C Hay là, x * là nghiệm của (P2) Định lí III.6 Cho X là không gian Banach; x i * X * ; i (i = 1,…,m) và
Giả sử f là hàm lồi trên X và liên tục tại một điểm của M Khi đó, x đạt cực tiểu của hàm f trên C khi và chỉ khi tồn tại i , ( i 1, , ) m sao cho:
Bổ đề Cho X là không gian Banach; x i * X * ; (i = 1,…,m) Đặt:
Chứng minh định lý Đa tạp tuyến tính C song song với không gian con M:
Từ định lý trên, ta suy ra: x đạt cực tiểu của hàm f trên C khi và chỉ khi tồn tại
Theo bổ đề trên: x * M lin x{ , , 1 * x * m }
Do vậy, tồn tại các số 1 , , m sao cho 1 1 x * m m x * f x( ) (Đpcm)
III.2.3 Bài toán lồi với ràng buộc bất đẳng thức
Cho X là không gian lồi địa phương Hausdorff; f 0 , ,f m là các hàm hữu hạn trên
Hàm số sau đây được gọi là hàm Lagrange của bài toán (P3):
L x f x Định lý III.7(Karush-Kuhn-Tucker) Giả sử các hàm f 0 , , f m và tập A lồi x là điểm chấp nhận được của bài toán P(3) Khi đó:
Nếu x là nghiệm của bài toán P(3), thì tồn tại các nhân tử Lagrange i 0
(i1, , )m không đồng thời bằng không sao cho:
(Điều kiện Karush-Kuhn-Tucker) Hơn nữa, nếu điều kiện Slater sau đây thỏa mãn:
Định lý III.8 khẳng định rằng nếu các hàm f 0, , f m liên tục tại một điểm của tập A lồi và x là điểm chấp nhận được của bài toán (P3), thì nếu x là nghiệm của bài toán (P3), sẽ tồn tại các nhân tử Lagrange không đồng thời bằng 0 với điều kiện i 0 (i = 1, , m).
Nếu điều kiện Slatter được thỏa mãn, thì có thể coi rằng 0 0 và 0 1 Nếu giả thiết trong phần (a) đúng với 0 1, thì x sẽ là nghiệm của bài toán (P3) Để chứng minh điều này, ta cần xem xét hàm Lagrange của bài toán (P3).
Do x là nghiệm của (P3), ta thu được điều kiện cần:
, ( i 1, , ) m (Định lí Karush- Kuhn-Tucker)
Vì thế, hàm L 1 (.; 0 , , m ) đạt cực tiểu tại x Từ đó suy ra:
Vì ( / )x A N x A( / ), Theo định lý Moreau-Rockafellar, ta có:
0 f x( ) m f m ( )x N x A( / ) b Giả sử (1) và (2) thỏa mãn với 0 1 Khi đó, tồn tại x i * f x i ( ), ( i 1, , ) m và
Từ định lý Karush- Kuhn-Tucker, x là nghiệm của (P3) (Đpcm)
Bài toán trơn
Giả sử X là không gian banach, Tập M X Định nghĩa III.2.[2] Véc tơ v X được gọi là tiếp xúc với tập M tại điểm x 0 M , nếu 0 và ánh xạ f : 0; X sao cho:
Tại điểm x₀, tập hợp tất cả các véc tơ tiếp xúc với tập M được gọi là nón tiếp tuyến của M, ký hiệu là T M(x₀) Nón này bao gồm véc tơ 0, tức là 0 ∈ T M(x₀).
T M x Định lý Ljusternik [2] Giả sử X, Y là các không gian Banach; U là một lân cận của điểm x 0 X ; Ánh xạ F U : Y khả vi liên tục theo nghĩa Frechet tại x 0 và
Im F x 0 Y Đặt M x U F x : F x Khi đó, không gian tiếp xúc với tập M tạix trùng với KerF , x 0 Nghiã là:
T M x KerF x Đồng thời, tồn tại lân cận U ' U của x 0 , số k 0 và ánh xạ x từ U ' vào
III.3.2 Bài toán trơn không có ràng buộc
Cho X là không gian tôpô tuyến tính Hàm f xác định trên X Xét bài toán
(P4): f x( )min Định lý III.9 Giả sử f là hàm khả vi Gâteaux tại x với đạo hàm Gâteaux f G ' ( )x , x là nghiệm của bài toán (P4) Khi đó:
Do f khả vi Gâteaux tại x, ta có thể khai triển: f x tv f x t f G ' x v , 0 t v X
Vì vậy, tồn tại giới hạn
Do đó, hàm t f x tv có đạo hàm tại điểm 0 là ’(0):
Do x là cực tiểu địa phương của (P4), nên t=0 là cực tiểu địa phương của hàm (t) trên Vì vậy,
Hệ quả Giả sử X là không gian banach, hàm f khả vi Fréchet tại x với đạo hàm
Féchet F x ' ; x là nghiệm của (P4) Khi đó,
III.3.3 Bài toán trơn với ràng buộc đẳng thức
Giả sử X, Y là các không gian Banach, hàm f xác định trên X, ánh xạ F X : Y Xét bài toán:
Hàm Lagrange của bài toán (P5) được thiết lập như sau:
L x y f x y F x 0 R y , * Y * Định lý III.10 (Quy tắc nhân tử Lagrange)
Giả sử hàm f và F khả vi Fréchet tại điểm x với các đạo hàm Fréchet f' (x) và F'(x), trong đó x là cực tiểu địa phương của bài toán (P5) và tập F'(x) X là tập đóng Khi đó, tồn tại các nhân tử Lagrange λ0 và y* không đồng thời bằng 0.
Hơn nữa, nếu F khả vi liên tục theo nghĩa Fréchet tại x và F x X ' Y , thì 0 0 và có thể xem như 0 1
Theo giả thiết, F(x, X') là một không gian con đóng trong Y, có thể xảy ra hai trường hợp: F(x, X') = Y hoặc F(x', X) ⊂ Y Trong trường hợp F(x, X') = Y, theo định lý Ljusternik, không gian này tiếp xúc với tập
M xX F x tại x trùng với K F x er ' Do đó, nếu v K F x er ' , thì
, và tồn tại số 0, ánh xạ r : , X sao cho:
F x t v Đặt t f x t v , Khi đó, t đạt cực tiểu địa phương tại t = 0 Do đó,
Từ giải tích hàm, do F x ' là toán tử tuyến tính liên tục từ không gian Banach X lên không gian Banach Y, nên
Suy ra, tồn tại y * Y * sao cho:
Từ đó suy ra, với 0 1, ta có:
L x x y f x F x y b Trường hợp F x ' X Y: Khi đó, y 0 Y F x X / ' Do Y F x X / ' mở, tồn tại lân cận mở V của y 0 sao cho V F x X ' Khi đó, y * Y * , y * 0 , sao cho:
Bài toán trơn - lồi
Giả sử X, Y là các không gian banach, W là một tập bất kì, các hàm f 0 , f 1 , , f m xác định trên X W và ánh xạ F X W : Y Xét bài toán:
Tập chấp nhận được của bài toán (P6) là:
Q x u X W F x u f x u i m Định nghĩa III.11[2] Cặp x u , Q được gọi là cực tiểu địa phương của bài toán
(P6), nếu tồn tại lân cận U của x sao cho:
Hàm Lagrange của bài toán (P6), được thiết lập như sau:
trong đó, i i 1, , m , y * Y * Định lý III.12 (nguyên lý cực trị )
Giả sử \( u(x) \) là cực tiểu địa phương của bài toán (P6), tồn tại một lân cận \( U \) của \( x \) trong \( X \) sao cho: a Với mỗi \( u \in W \), ánh xạ \( F(., u) \) và các hàm \( f_i(., u) \) (với \( i = 0, \ldots, m \)) khả vi liên tục theo nghĩa Frechet tại \( x \) b Với mỗi \( u \in U \), ánh xạ \( F(., u) \) và các hàm \( f_i(., u) \) thỏa mãn điều kiện lồi: với mọi \( u_1, u_2 \in U \) và \( \alpha \in [0, 1] \), tồn tại \( u \in W \) sao cho:
, , 1 1 , 2 i i i f x u f x u f x u (i=1,…,m) c Ánh xạ F x u x ' , : X Y có đối chiều hữu hạn: co dim F x u x ' , Khi đó, tồn tại các nhân tử Lagrangge 0 0, , m 0 và y * Y * không đồng thời bằng 0 sao cho:
F x u X F x F x u F x u x u X , chứa một lân cận của 0 trong Y, và tồn tại x u,
với mọi i mà f x u i , 0 , thì 0 0 và có thể xem như 0 1
Bây giờ, ta xét bài toán sau:
trong đó, các hàm f 0 ,f 1 , ,f m xác định trên X W ; h 1 , ,h n là các hàm thực xác định trên X W; G X : W Y 1 với Y 1 là không gian Banach
Hàm Lagrange của bài toán (P7) có dạng:
Giả sử \( x \) là cực tiểu địa phương của bài toán (P7), tồn tại lân cận \( U \) của \( x \) trong \( X \) sao cho: a Với mỗi \( u \in W \), ánh xạ \( G(.,u) \) và các hàm \( f_{x_i}(.,) \), \( h_j(.,) \) (với \( i=1,…,m; j=1,…,n \)) khả vi liên tục theo nghĩa Frechet tại \( x \) b Với mỗi \( x \in U \), ánh xạ \( F(x,.) \) và các hàm \( f_i(., u) \), \( h_j(., u) \) thỏa mãn điều kiện lồi sau: với mọi \( u_1, u_2 \in W \) và \( \alpha \in [0,1] \), tồn tại \( u \in W \) sao cho:
, , 1 1 , 2 j j h x u h x u hj x u (j=1,…,n) c G x ' x u , : X Y 1 là ánh xạ lên Im G x ' x u , Y 1
Khi đó, tồn tại các nhân tử Lagrange i 0 (i=1,…,m), j (j=1,…,n), y * Y 1 * không đồng thời bằng 0 sao cho:
Cuối cùng, ta xét bài toán:
Trong bài viết này, chúng ta xem xét một bài toán trong không gian Banach, với F: X → Y và các hàm f0, , fm xác định trên X Định lý III.13 nêu rằng nếu x là nghiệm của bài toán (P8) với A = X, thì cần thỏa mãn hai điều kiện: thứ nhất, ánh xạ F và các hàm f0, , fm phải khả vi liên tục theo định nghĩa Fréchet tại điểm x; thứ hai, điều kiện codimIm F(x) phải nhỏ hơn vô hạn.
Khi đó, tồn tại các nhân tử Lagrange 0 0, , m 0, y * Y * không đồng thời
Hơn nữa, nếu F x ' là ánh xạ lên Im F x ' Y và tồn tại xX sao cho:
F x x f i ' x x 0 với các chỉ số i mà f x i 0 , thì 0 0 và có thể xem như 0 1
Áp dụng nguyên lý cực trị cho bài toán trơn (P8) cho thấy rằng nếu x là nghiệm của bài toán này, thì các hàm f 0 , ,f n đều là hàm lồi trên tập X, và F được định nghĩa là ánh xạ affine.
F x x y , trong đó là toán tử tuyến tính từ X vào Y, y 0 Y; c A là tập lồi
Khi đó, tồn tại các nhân tử Lagrange 0 0, , m 0, y * Y * sao cho:
Hơn nữa, nếu điều kiện Slater sau đây thỏa mãn: F(A) chứa một lân cận của 0 trong Y, và tồn tại x A sao cho:
F x f x i 1, , m , thì 0 0 và có thể xem như 0 1
Ngược lại, giả sử x là điểm chấp nhận được của bài toán (P8), các điều kiện a) - c) và điều kiện Slater thỏa mãn Khi đó, x là nghiệm của bài toán (P8)
Để chứng minh điều kiện cần, ta áp dụng nguyên lý cực trị cho bài toán lồi (P8) và từ đó nhận được điều phải chứng minh Đối với điều kiện đủ, ta chọn x chấp nhận được của (P8), tức là F(x) = 0 và f(x_i) ≤ 0.
i 1, , m x , A Khi đó, từ (5.38) – (5.40), ta có: x A ,
Vậy, x là nghiệm của bài toán (P8)
Nhận xét Định lý III.14 vẫn đúng cho trường hợp X là không gian tuyến tính
Trong toán học phổ thông, học sinh đã được giới thiệu về việc sử dụng đạo hàm để xác định cực tiểu của hàm lồi Điều này cho thấy rằng ứng dụng dưới vi phân trong bài toán tối ưu hóa là một lĩnh vực quan trọng và có nhiều ứng dụng thực tiễn Luận văn đã đề cập đến các vấn đề liên quan đến chủ đề này.
1 Định nghĩa, tính chất của tập lồi và hàm lồi Các phép toán về tập lồi và hàm lồi và trình bày một số tập lồi quan trọng: Tập affine, nón,…
2 Khái niệm dưới vi phân của hàm lồi, của hàm lồi địa phương Điều kiện khả dưới vi phân tại một điểm Điều kiện để hàm khả vi Gaatteaux và các định lý cơ bản về dưới vi phân
3 Định nghĩa tổng quát về bài toán tối ưu, điều kiện để bài toán tồn tại nghiệm tối ưu Tám bài toán tối ưu và điều kiện có nghiệm của chúng
Do hạn chế về thời gian và trình độ, luận văn này không thể tránh khỏi những sai sót Tác giả rất mong nhận được ý kiến đóng góp chân thành từ thầy cô và bạn bè để cải thiện và hoàn thiện luận văn một cách tốt nhất.