Xuất thuật toán

Một phần của tài liệu phương pháp hàm phạt điểm trong giải bài toán cân bằng giả đơn điệu (Trang 50)

3 Một số ứng dụng

3.2.2xuất thuật toán

Cho C là một tập con lồi, đóng trong không gian Euclide thực Rn với tích trong h·,·i và chuẩn tương ứng là || · ||. Khi đó, thuật toán điểm gần kề (P P A) được áp dụng cho bài toán (M V I) như sau: Cho trước xk ∈ C, bước lặp tiếp theo xk+1 được sinh bởi (P P A) là nghiệm duy nhất của bài toán bất đẳng thức biến phân phụ sau:

Tìm x∈C, w ∈F(x) sao cho hw+M(x−xk), y−xi ≥0 ∀y∈C, (3.5) trong đó M là ma trận đối xứng, xác định dương và M(x−xk) được gọi là hàm xấp xỉ trong (P P A). Hàm xấp xỉ tuyến tính này là gradient của một hàm toàn phương, cụ thể là hàm

M(x−xk) = ∇(1

2||x||2M).

Gần đây, một số tác giả đã tập trung nghiên cứu dạng toàn phương của (P P A) bằng cách thay thế hàm tuyến tính M(x−xk) bằng hàm phi tuyến d(x, xk), bắt nguồn từ hàm xấp xỉ Bregman.

Phần này sẽ đề xuất phương pháp (P P A) giải bài toán (M V I) với M là ma trận xác định dương nhưng không cần đối xứng và F là ánh xạ đa trị nhưng không cần giả thiết Lipschitz trên C.

Kí hiệu S∗ là tập nghiệm của (M V I) và để đơn giản, ta giả sử rằng (M V I) luôn có nghiệm (x∗, w∗), nghĩa là S∗ 6=∅.

Để tiện cho việc chứng minh, trước tiên chúng ta nhắc lại một số khái niệm sẽ được dùng trong phần này.

Định nghĩa 3.2. (i) Hàm F được gọi là đơn điệu trên C nếu với mỗi x, x0 ∈C, ta có

hw−w0, x−x0i ≥0 w∈F(x), w0 ∈F(x0).

(ii) Ma trận Mn×n được gọi là xác định dương, nếu tồn tại τ >0 sao cho

hM x, xi ≥τ kxk2 ∀x∈Rn. (3.6) Nhắc lại rằng, PC(·) là kí hiệu hình chiếu lên lên tập C với chuẩn Euclid, nghĩa là

Từ đây về sau, chúng ta giả thiết rằng ánh xạ F đơn điệu, đóng và nửa liên tục trên trên C.

Thuật toán 3.4. Bước 0. Cho M là ma trận xác định dương cỡ n×n, ε >

0, x0 ∈C, w0 ∈F(x0). Gán k= 0.

Bước 1. Tìm điểm gần kề x¯k, wk là nghiệm của bài toán dưới đây:

Tìm x¯∈C, w¯ ∈F(¯x) sao cho hw¯+M(¯x−xk), y−x¯i ≥0 ∀y∈C. (3.7)

Nếu kxk−x¯k k≤ε thì dừng thuật toán.

Ngược lại, chuyển sang Bước 2.

Bước 2. Tính

xk+1 =xk −αkM(xk−x¯k), (3.8)

với

αk =γhM(xk −x¯k), xk −x¯ki

kM(xk−x¯k)k2 , γ ∈[1,2). (3.9)

Gán k:=k+ 1 và quay trở lại Bước 1.

Nhận xét 3.2. Bài toán phụ (3.7) trong Bước 1 tương tự như bài toán phụ (3.5) của lớp (P P A), chỉ khác rằng ma trận M trong (3.7) là ma trận xác định dương nhưng không đối xứng. Do đó, phương pháp được đề xuất là dạng tổng quát của (P P A)-phương pháp cơ sở với hàm xấp xỉ tuyến tính. Chú ý rằng, chúng ta chỉ có thể lấy x¯k là bước lặp mới khi M là ma trận đối xứng và xác định dương.

Nhận xét 3.3. Việc tính bước lặp tiếp theo xk+1 thông qua (3.8)-(3.9) sẽ đơn giản hơn nhiều so với việc giải bài toán (3.7).

Nghiệm của (3.7), x¯k là điểm gần kề tại bước lặp thứ k. Điểm này được xem như véc tơ kiểm tra, vì nó là nghiệm của (M V I) khi và chỉ khi xk = ¯xk. Tức là,

kxk −x¯k k có thể xem như là hàm sai số bị chặn, vì hàm này sẽ kiểm tra xem có bao nhiêu x¯k không là nghiệm của (M V I). Do đó, ta có mệnh đề sau.

Mệnh đề 3.3. Nếu kxk−x¯k k≤ε thì xk là ε− nghiệm của bài toán (M V I).

Bổ đề dưới đây sẽ cho ta một số bất đẳng thức quan trọng, mà các kết quả này sẽ được dùng trong các mục tiếp theo. (adsbygoogle = window.adsbygoogle || []).push({});

Bổ đề 3.2. Với mỗi x∈Rn, ánh xạ PC thỏa mãn

hPC(x)−x, y−PC(x)i ≥0 ∀y∈C, (3.10)

kPC(x)−yk2≤kx−yk2 − kx−PC(x)k2 ∀y∈C. (3.11) 3.2.3 Sự hội tụ của phương pháp

Như ta đã biết, với mỗi x∗ ∈ S∗, thì (xk −x∗) là gradient của hàm khoảng cách 12 k x−x∗ k2 tại điểm xk 6∈ S∗. Một hướng d được gọi là hướng giảm của

1

2 kx−x∗ k2 tại điểm xk, nếu

hxk −x∗, di<0.

Trong phần này, chúng ta sẽ chỉ ra rằng −M(xk−x¯k) là hướng giảm của hàm khoảng cách 12 kx−x∗ k2 tại điểm xk.

Bổ đề 3.3. Cho trước một điểm xk ∈ C và x¯k là điểm gần kề được sinh bởi (3.7). Khi đó, với mỗi (x∗, w∗)∈S∗, ta có

hM(xk−x¯k), xk−x∗i ≥ hM(xk−x¯k), xk −x¯ki. (3.12)

Chứng minh. Vì x¯k ∈C là nghiệm của (3.7), ta có

hwk +M(¯xk−xk), y −x¯ki ≥0 ∀y ∈C. Thế y=x∗∈C vào bất đẳng thức này, ta được

hwk+M(¯xk −xk), x∗−x¯ki ≥0. (3.13) Mặt khác, vì x∗ ∈S∗, w∗ ∈F(x∗) và x¯k ∈C, nên

hw∗,x¯k−x∗i ≥0. (3.14) Kết hợp (3.13) và (3.14), ta có

hM(¯xk −xk), x∗−x¯ki ≥ hwk −w∗,x¯k −x∗i.

Sử dụng tính đơn điệu của F, và do hwk−w∗,x¯k−x∗i ≥0, nên ta thu được

Suy ra

hM(xk−x¯k), xk−x∗i ≥ hM(xk−x¯k), xk −x¯ki.

Vậy (3.12) được chứng minh. 2

Vì M là ma trận xác định dương và theo (3.6), ta có

hM(xk−x¯k), xk −x¯ki ≥τ kxk −x¯k k2.

Bổ đề 3.3 chỉ ra rằng −M(xk −x¯k) là hướng giảm của 12 k x−x∗ k2 tại điểm xk 6∈S∗.

Nhận xét 3.4. Nếu ma trận M trong (3.7) là ma trận đối xứng, thì từ (3.12) ta suy ra rằng

kx¯k−x∗ k2M=k(xk−x∗)−(xk −x¯k)k2M

=kxk−x∗ kM2 −2hM(xk−x¯k), xk−x∗i+kxk −x¯k k2M ≤ kxk−x∗ k2M − kxk −x¯k k2M .

Do đó, ta có thể trực tiếp đặt xk+1 := ¯xk là bước lặp mới và sự hội tụ của nó được suy ra từ bất đẳng thức trên. Tuy nhiên, trong trường hợp ma trận M không đối xứng, chúng ta không thể thiết lập được tính hội tụ của thuật toán nếu lấy xk+1 := ¯xk là bước lặp mới. Trong bước 2 của thuật toán trên, tốc độ tính toán cho bước lặp mới xk+1 thông qua (3.8) khá là nhỏ.

Thay vì tính bước lặp mới theo công thức (3.8), trong đó αk xác định trong công thức (3.9), chúng ta định nghĩa bước lặp mới một cách độc lập như sau:

xk+1 =xk −αM(xk−x¯k). (3.15) Theo cách định nghĩa này,

θ(α) :=kxk−x∗ k2− kxk+1(α)−x∗ k2, (3.16) là hàm thu được tại bước lặp thứ k bằng cách sử dụng công thức (3.15). Vì x∗ là nghiệm và do đó nghiệm này là một ẩn, nên chúng ta không thể tính cực đại củaθ(α) một cách trực tiếp. Định lí dưới đây sẽ chỉ ra cận dưới thực sự củaθ(α), cụ thể là hàm q(α), mà hàm này không chứa nghiệm ẩn x∗.

Định lí 3.4. Với mỗi x∗ ∈S∗ và α≥0, ta có (adsbygoogle = window.adsbygoogle || []).push({});

θ(α)≥q(α), (3.17)

trong đó

q(α) = 2αhM(xk−x¯k), xk−x¯ki −α2kM(xk−x¯k)k2 . (3.18)

Chứng minh. Kết hợp (3.12), (3.15), (3.16) và (3.18) ta thu được

θ(α) =kxk −x∗k2 − k(xk−x∗)−αM(xk−x¯k)k2

=2αhM(xk −x¯k), xk −x∗i −α2kM(xk−x¯k)k2 ≥2αhM(xk −x¯k), xk −x¯ki −α2 kM(xk −x¯k)k2

=q(α).

Định lí được chứng minh. 2

Chú ý rằng q(α)là hàm toàn phương theo α và do đó nó đạt được giá trị lớn nhất tại

αk∗ = hM(xk −x¯k), xk−x¯ki kM(xk−x¯k)k2 .

Để dễ tính toán và giúp thuật toán hội tụ nhanh hơn, trong thực hành, từ các bất đẳng thức (3.7) và (3.17) ta sẽ lấy γ ≥1. Chú ý rằng, với mỗi αk =γα∗k, từ (3.17), (3.18) và (3.9) suy ra rằng:

θ(γα∗k)≥q(γα∗k) = γ(2−γ)αk∗hM(xk −x¯k), xk−x¯ki. (3.19) Để đảm bảo cho vế phải của (3.19) luôn dương, ta sẽ lấy γ ∈[1,2).

Mối quan hệ giữa dãy {xk} được sinh bởi thuật toán và nghiệm bất kỳ của bài toán (M V I) được chỉ ra ở trong định lí sau.

Định lí 3.5. Với mỗi (x∗, w∗)∈S∗, dãy{xk} được sinh bởi thuật toán (3.4) thỏa mãn

kxk+1−x∗ k2≤kxk−x∗ k2 −c0 kxk−x¯k k2, (3.20)

trong đó c0 >0 là hằng số.

Chứng minh. Trước tiên, từ (3.16) và (3.19) ta suy ra rằng

Do đó kxk+1−x∗ k2≤kxk −x∗k2 −γ(2−γ)α∗khM(xk−x¯k), xk−x¯ki. Vì hM(xk−x¯k), xk−x¯ki ≥τ kxk−x¯k k2, (3.22) nên αk∗ =hM(xk −x¯k), xk−x¯ki kM(xk−x¯k)k2 ≥ τ kMTM k.

Kết hợp điều này với (3.22), ta có

α∗khM(xk−x¯k), xk−x¯ki ≥ τ

2

kMTM k kx

k−x¯k k2. Thay bất đẳng thức này vào (3.18) và đặt

c0 = γ(2−γ)τ2

kMTM k,

ta sẽ được điều cần chứng minh. 2

Định lí dưới đây sẽ chỉ ra sự hội tụ của dãy {(xk, wk)}.

Định lí 3.6. Dãy {xk} và {wk} sinh bởi thuật toán hội tụ tới x∞ và w∞ là nghiệm của (M V I).

Chứng minh. Từ (3.20) suy ra rằng dãy {kxk −x∗ k} là dãy không tăng và bị

chặn dưới bởi 0, nên nó phải hội tụ. Do đó, dãy {xk} bị chặn. Bất đẳng thức (3.20) cũng chỉ ra rằng (adsbygoogle = window.adsbygoogle || []).push({});

lim

k→∞ kxk−x¯k k= 0,

và do đó {x¯k} bị chặn. Từ tính chất nửa liên tục trên của F, ta suy ra dãy

{wk} cũng bị chặn. Theo định lí Weierstrass, tồn tại các dãy con {x¯kj} của

{x¯k} và {wkj} của {wk} sao cho x¯kj → x∞ và wkj → w∞ khi j → ∞. Với mỗi

¯

xkj ∈C, wkj ∈F(¯xkj), ta có

Vì F(x) đóng với mọi x∈C và do

lim

j→∞ kxkj−x¯kj k= 0, nên ta có

x∞ ∈C, w∞∈F(x∞) : hw∞, x−x∞i ≥0 ∀x∈C,

do đó (x∞, w∞) là một nghiệm. Chú ý rằng, bất đẳng thức (3.20) đúng với mọi nghiệm của (M V I), suy ra

kxk+1−x∞k2≤kxk−x∞k2 ∀k≥0,

và dãy {xk} hội tụ tới x∞. 2

3.2.4 Áp dụng thuật toán ánh xạ co Banach cho (M V I)

Trong mục này, chúng ta sẽ kết hợp thuật toán 3.4 với nguyên lý ánh xạ co Banach giải bài toán bất đẳng thức biên phân (M V I), trong đó hàm giá F đơn điệu, Lipschitz trên C. Các bài toán phụ (V IPk) là các bài toán bất đẳng thức biến phân đơn điệu mạnh với hằng sốkM k. Khi đó, bài toán này có thể giải một cách hiệu quả bằng thuật toán ánh xạ co Banach. Với mọi x∈C, k = 0,1,2,· · ·, kí hiệu Fk(x) := F(x) +M(x−xk).

Thuật toán 3.5. Bước 0. Cho trước ma trận xác định dương M cỡ n×n, ε >

0, x0 ∈C, w0∈F(x0). Gán k = 0. Chọn β > 2kLM2k.

Bước 1. Bước lặp thứ j, j = 0,1,2,· · ·. Chọn xk,0 = x0, wk,0 ∈ Fk(xk,0) và giải bài toán quy hoạch lồi mạnh

xk,j =argmin{1

2β kx−xk,j k2 +hwk,j, x−xk,ji:x∈C}

thu được nghiệm duy nhất xk,j+1.

Nếuxk,j+1 =xk,j, thìx¯k :=xk,j, wk :=wk,j. Ngược lại, chọnwk,j+1∈Fk(xk,j+1)

và gán j :=j+ 1 rồi quay trở lại Bước lặp thứ j. Nếu x¯k =xk thì dừng thuật toán.

Ngược lại, chuyển sang Bước 2.

Bước 2. Tính

với

αk =γhM(xk −x¯k), xk −x¯ki

kM(xk−x¯k)k2 , γ ∈[1,2).

Gán k:=k+ 1 và quay lại Bước 1. (adsbygoogle = window.adsbygoogle || []).push({});

Sự hội tụ của dãy (xk,j)∞j=1 trong bài toán bất đẳng thức biến phân đơn điệu mạnh (V IPk) được nêu trong mệnh đề sau.

Mệnh đề 3.4. Giả sử rằng ánh xạ F là L-Lipschitz trên C. Nếu thuật toán 3.5 dừng tại bước lặp thứ j trong bước 1, thì (xk, wk) là nghiệm của (V IPk). Hơn nữa, với (xk,∗, wk,∗) là nghiệm bất kỳ của bài toán (V IPk), ta có

kxk,j −xk,∗k≤ δ

j

1−δj kxk,1−xk,0k ∀j = 1,2,· · ·

và mọi điểm tụ wk,∗ của dãy {wk,j} thỏa mãn wk,∗ ∈ Fk(xk,∗), trong đó δ :=

q

1−k2Mβk +kML2k2.

Mệnh đề 3.4 chỉ ra rằng, thuật toán 3.5 dừng tại bước 1. Điều này có nghĩa là xk,j là nghiệm của bài toán (V IPk). Định lí dưới đây sẽ chỉ ra sự hội tụ của thuật toán 3.5.

Định lí 3.7. Dãy {xk} và {wk} được sinh bởi thuật toán hội tụ tới x∞ và w∞ là nghiệm của bài toán (M V I).

Bây giờ, chúng ta sẽ minh họa cho thuật toán 3.5 bằng bài toán kinh tế bán độc quyền. Giả sử rằng, có n công ty cùng sản xuất một loại sản phẩm và giá p phụ thuộc vào các đại lượng σx =x1+x2+· · ·+xn, nghĩa là p=p(σx). Kí hiệu hi(xi) là tổng chi phí của công ty thứ i cung cấp để sản xuất ra mặt hàng thứ xi. Khi đó, lợi nhuận của công ty i sẽ là xip(σx)−hi(xi). Tất nhiên, mỗi công ty sẽ lựa chọn cho mình một phương án sản xuất sao cho lợi nhuận thu được là lớn nhất. Giả sử tập chiến lượcC là một tập lồi đa diện chứa trong Rn được cho bởi

C:={x∈Rn : 13≤

n

X

i=1

xi≤25,1≤xi ≤5 i= 1,2,· · · , n}. (3.23) Khi đó, bài toán kinh tế bán độc quyền có thể phát biểu dưới dạng bài toán cân bằng Nash trong trò chơi không tác hợp, trong đó người chơi thứ i có tập chiến lược C và hàm lợi ích fi(x1,· · · , xn) =xip( n X i=1 xi)−hi(xi) i= 1,2,· · · , n.

Thông thường, một điểm x∗ = (x∗1,· · · , x∗n) ∈ C được gọi là điểm cân bằng của bài toán này nếu:

fi(x∗1,· · · , xi∗−1, yi, x∗i+1,· · · , xn∗)≤fi(x∗1,· · · , x∗n) ∀i= 1,2,· · · , n.

Mệnh đề 3.5. Một điểm x∗ là một điểm cân bằng của bài toán kinh tế bán độc

quyền nếu và chỉ nếu nó là nghiệm của (M V I), trong đó C là hình đa diện được

cho bởi (3.23) và

F(x) =H(x)−p(σx)e−p0(σx)x,

trong đó

H(x) = (h01(x1),· · · , h0n(xn))T, e= (1,· · ·,1)T, σx =hx, ei.

Mệnh đề 3.6. Cho p: C →R+ là hàm lồi, khả vi liên tục cấp hai, không tăng và hàm µτ : R+ → R+ xác định bởi µτ(σx) = σxp(σx+τ) là hàm lõm với mọi

τ ≥ 0. Cho hi : R+ → R i = 1,2,· · · , n, là hàm lồi và khả vi liên tục cấp hai. Khi đó, hàm chi phí F(x) = H(x)−p(σx)e−p0(σx)x đơn điệu trên C.

Dễ thấy rằng, hàm chi phí F là Lipschitz trên C với hằng số LipschitzL <1. Trong ví dụ này, chúng ta chọn (một cách ngẫu nhiên)

n := 7, H(x) = (2x1+ 1,3x2+ 4,4x3+ 2,1.5x4+ 3,4x5+ 1, x6−2,3x7+ 1)T, p(t) := 2 3t t∈(0,+∞), x0 := (1.9,1,1,1,1,5,1)T ∈C, Sai số ε= 10−6, γ = 3 2. M =         1 0 0 0 0 0 0 0 2 0 0 0 0 1 0 0 3 0 0 0 4 0 0 0 1.5 0 0 3 0 0 0 0 2 0 2 0 0 0 0 0 1.6 2 0 0 0 0 1 0 2         7×7

Khi đó, giá trị riêng của ma trận M là 2,3,1.5,1.6,3.4142,0.5858,1, chuẩn của M làkM k= 6.6248và β > L

2 (adsbygoogle = window.adsbygoogle || []).push({});

2kM k ≈0.755. Nếu ta chọnβ = 1thì δ≈0.7209. Trong

Bước lặp (k) xk1 xk2 x3k xk4 xk5 xk6 xk7 0 1.9 1 1 1 1 5 1 1 2.0475 1.0417 1.0246 1.6452 1.1338 5.0954 1.4095 2 2.0364 0.9797 0.9285 1.5003 1.0200 4.9796 1.3394 3 2.0558 1.0043 1.0409 1.5263 1.0573 5.0158 1.3717 4 2.0898 1.0170 0.9878 1.5089 1.0774 5.0317 1.4046 5 2.0813 0.9914 0.9858 1.4641 1.0368 4.9905 1.3784 6 2.0864 0.9997 1.0128 1.4741 1.0490 5.0025 1.3887 7 2.0903 1.0034 1.0072 1.4761 1.0543 5.0074 1.3948 8 2.0906 0.9983 0.9919 1.4641 1.0462 4.9989 1.3917 9 2.0920 1.0005 1.0036 1.4664 1.0493 5.0019 1.3946 10 2.0943 1.0017 0.9991 1.4648 1.0509 5.0029 1.3979 11 2.0933 0.9993 0.9982 1.4608 1.0472 4.9992 1.3955 12 2.0938 1.0000 1.0011 1.4617 1.0483 5.0003 1.3964 13 2.0940 1.0003 1.0003 1.4619 1.0487 5.0007 1.3970 14 2.0939 0.9998 0.9996 1.4608 1.0479 4.9998 1.3965 15 2.0940 1.0000 1.0003 1.4610 1.0482 5.0001 1.3968 Bảng 1 (với n = 7, ε= 10−6, β = 1, δ≈0.7209). Nghiệm xấp xỉ thu được sau 15 bước là

x15 = (2.0940,1.0000,1.0003,1.4610,1.0482,5.0001,1.3968)T.

Kết luận Chương này gồm hai phần chính: Phần đầu cho chúng ta một cái nhìn tổng quát về mối quan hệ giữa hai bài toán (EP) và (V IP). Phần hai trình bầy sơ bộ về phương pháp kiểu điểm gần kề, áp dụng phương pháp điểm gần kề giải bài toán bất đẳng thức biến phân đa trị và đưa ra một ví dụ cụ thể để minh họa cho thuật toán được đề xuất.

Kết luận

Luận văn Phương pháp hàm phạt điểm trong giải bài toán cân bằng

giả đơn điệu đã giải quyết được những vấn đề sau:

1. Nhắc lại một số định nghĩa về giải tích lồi như: Tập lồi, hàm lồi, dưới vi phân · · ·.

2. Phát biểu bài toán cân bằng, một số ví dụ và sự tồn tại nghiệm của bài toán.

3. Trình bày lại phương pháp hàm phạt điểm trong giải bài toán cân bằng trên tập lồi đa diện C =Ax ≤ b trong hai trường hợp: Trường hợp song hàmf thỏa mãn điều kiện Lipschitz và trường hợp song hàm f không thỏa mãn điều kiện Lipschitz bằng cách sử dụng kỹ thuật tìm kiếm theo tia.

4. Đề xuất thuật toán điểm gần kề giải bài toán bất đẳng thức biến phân đa trị (M V I), chứng minh sự hội tụ của thuật toán và trình bày một ví dụ minh họa cho thuật toán được đề xuất.

Một phần của tài liệu phương pháp hàm phạt điểm trong giải bài toán cân bằng giả đơn điệu (Trang 50)