Cân bằng Nash trong trò chơi không hợp tác- 123docz.net

Xét một trò chơi có p người chơi (đấu thủ). Giả sử Cj ⊂ Rpj là tập các phương án mà đấu thủ thứ j có thể lựa chọn trong đó (gọi là tập chiến lược). Đặt C := C1×C2× · · · ×Cp và gọi ϕj : C →R là hàm lợi ích của đấu thủ thứ j khi đấu thủ này chọn phương án chơi xj ∈ Cj, còn các đấu thủ k khác chọn phương án chơi là xk ∈Ck với mọi k 6=j.

Định nghĩa 2.1.3. Ta gọi x∗ = (x∗1, . . . , x∗p) là điểm cân bằng của ϕ = (ϕ1, . . . , ϕp) trên tập C := C1×C2× · · · ×Cp nếu với mọi j và mọi yj ∈Cj, ta có

ϕj(x∗1, . . . , x∗j−1, yj, x∗j+1, . . . , x∗p)≤ ϕj(x∗1, . . . , x∗j−1, x∗j, x∗j+1, . . . , x∗p). Định nghĩa này cho thấy rằng nếu một đấu thủ thứj nào đó rời khỏi phương án cân bằng, trong khi các đấu thủ khác vẫn giữ phương án cân bằng thì đấu thủj sẽ bị thua thiệt. Đây chính là lý do mà khái niệm cân bằng này được chấp nhận trong thực tế. Dưới đây bài toán cân bằng Nash sẽ được hiểu là bài toán tìm một điểm cân bằng của ϕ trên C. Ta sẽ ký hiệu bài toán này là N(ϕ, C). Bài toán cân bằng Nash có thể mô tả dưới dạng bài toán cân bằng EP(f, C).

Thật vậy, xây dựng song hàm f : C ×C →R bằng cách đặt f(x, y) :=

p X

j=1

Nếu x∗ là điểm cân bằng Nash thì f(x∗, y) ≥ 0 với mọi y ∈ C. Ngược lại, giả sử x∗ ∈C là nghiệm của bài toán EP(f, C), tức là

f(x∗, y)≥ 0 ∀y ∈ C.

Ta sẽ chứng tỏ x∗ = (x∗1, . . . , xp∗) vớix∗j ∈ Cj là một điểm cân bằng Nash. Thật vậy, nếu trái lại, sẽ tồn tại j và một yj ∈ Cj sao cho

ϕj(x∗1, . . . , x∗j−1, x∗j, x∗j+1, . . . , x∗p)< ϕj(x∗1, . . . , x∗j−1, yj, x∗j+1, . . . , x∗p).

Khi đó, với phương án y = (x∗1, . . . , x∗j−1, yj, x∗j+1, . . . , x∗p), theo định nghĩa của hàm f, ta có

f(x∗, y) = ϕj(x∗1, . . . , x∗j−1, yj, x∗j+1, . . . , x∗p)−ϕj(x∗)< 0. Điều này mâu thuẫn với x∗ là nghiệm của bài toán EP(f, C). 2.1.5 Bài toán điểm yên ngựa

Cho A ⊆ H, B ⊆ H và L: A×B → R. Bài toán điểm yên ngựa là bài toán tìm (x∗, y∗)∈A×B sao cho

L(x∗, y)≤ L(x∗, y∗)≤ L(x, y∗) ∀(x, y)∈ A×B.

Một điểm (x∗, y∗)∈ A×B thỏa mãn bất đẳng thức trên gọi là điểm yên ngựa

của L trên A× B. Ta chỉ ra rằng bài toán điểm yên ngựa có thể mô tả dưới dạng bài toán cân bằng. Thật vậy, với mỗi u= (x, y)T, v = (x0, y)T, ta đặt

C := A×B, f(u, v) := L(x0, y)−L(x, y0). Khi đó, nếu u∗ là nghiệm của bài toán cân bằng EP(f, C), tức là

u∗ ∈A×B, f(u∗, v)≥ 0 ∀v ∈ C thì

L(x0, y∗)≥ L(x∗, y0) ∀x0 ∈ A, y0 ∈B.

Vậy (x∗, y∗)là điểm yên ngựa. Điều ngược lại, nếu (x∗, y∗)là điểm yên ngựa của L trên A×B, thì u∗ = (x∗, y∗) là lời giải của bài toán cân bằng được suy ra từ định nghĩa.

2.1.6 Sự tồn tại nghiệm của bài toán cân bằng

Trong mục này, chúng ta nói đến sự tồn tại, tính duy nhất nghiệm của bài toán cân bằng.

Mệnh đề 2.1.1(Xem [2]). ChoC là một tập con lồi, compact, khác rỗng trong không gian Hilbert H và song hàm cân bằng f : C×C →R có các tính chất

(i). f(., y) nửa liên tục trên với mọi y ∈ C.

(ii). f(x, .) lồi, nửa liên tục dưới và khả dưới vi phân trên C với mọi x∈ C. Khi đó, bài toán EP(f, C) có nghiệm.

Chứng minh. Với mỗi x ∈ C ta gọi S(x) là tập nghiệm của bài toán

min{f(x, y) :y ∈ C}. (CO) Do C compact và f(x, .) nửa liên tục dưới nên theo định lý Weirerstrass, bài toán này tồn tại nghiệm. Hơn nữa, do C lồi, compact, f(x, .) lồi nên S(x) lồi, compact. Theo định lý cực đại Berge, ánh xạS nửa liên tục trên. Vậy theo định lý điểm bất động Kakutani, tồn tại x∗ ∈C thỏa mãn x∗ ∈ S(x∗).

Bây giờ, ta sẽ chỉ ra x∗ là nghiệm của bài toán cân bằng EP(f, C). Thật vậy, do f(x, .)lồi và khả dưới vi phân trên C, theo điều kiện cần và đủ của quy hoạch lồi, ta có

0∈ ∂2f(x∗, x∗) +NC(x∗).

Theo định nghĩa của dưới vi phân và nón pháp tuyến, tồn tạiv∗ ∈∂2f(x∗, x∗) thỏa mãn v∗, y −x∗ ≥ 0 ∀y ∈ C. Do v∗ ∈ ∂2f(x∗, x∗) nên v∗, y−x∗ ≤ f(x∗, y)−f(x∗, x∗) = f(x∗, y) ∀y ∈C.

Vậy f(x∗, y) ≥ 0 với mọi y ∈ C. Điều này chứng tỏ x∗ là nghiệm của bài toán EP(f, C).

Hệ quả 2.1.1 (Xem [2]). Cho C là một tập lồi đóng (không cần compact) và song hàm cân bằng f như ở mệnh đề trên. Giả sử điều kiện bức (C1) sau đây được thỏa mãn

Tồn tại tập compact B sao cho

C∩B 6= ∅ ∀x∈ C\B, ∃y ∈ C : f(x, y)< 0.

Khi đó, bài toán EP(f, C) có nghiệm

Mệnh đề 2.1.2 (Xem [2]). ChoC là tập lồi, đóng, khác rỗng vàf :C×C → R

là song hàm cân bằng. Khi đó

(i) Nếu f đơn điệu chặt trên C, thì bài toán cân bằngEP(f, C)có nhiều nhất một nghiệm.

(ii) Nếu f(., y) nửa liên tục trên với mọi y ∈ C, f(x, .) lồi, nửa liên tục dưới với mọi x ∈C và f đơn điệu mạnh trên C, thì bài toán EP(f, C) tồn tại duy nhất nghiệm.

Chứng minh. (i) Giả sử EP(f, C) có hai nghiệm x∗, y∗ ∈ C. Khi đó f(x∗, y∗)≥ 0 và f(y∗, x∗)≥0.

Thế nhưng, nếu f(x∗, y∗) ≥ 0 thì theo tính đơn điệu chặt ta phải có f(y∗, x∗)<0. Điều này mâu thuẫn với f(y∗, x∗)≥ 0.

(ii) Lấy x0 ∈ C bất kỳ. Do f(x0, .) nửa liên tục dưới và f(x0, x0) = 0 nên tồn tại µ sao cho

f(x0, v)≥ µ ∀v ∈C ∩B(x0,1).

trong đó B(x0,1) ký hiệu là hình cầu tâm x0, bán kính 1. Ta sẽ chỉ ra f thỏa mãn điều kiện bức (C1). Thật vậy, với x∈ C\B(x0,1) bất kỳ, ta có

λ= 1

kx0−xk < 1.

Khi đó, v = λx+ (1−λ)x0 ∈ ∩B(x0,1). Theo tính lồi của f(x0, .), ta thu được

Vì λ = 1

kx0−xk nên ta suy ra

f(x0, x)≥ µkx0−xk.

Từ đây áp dụng tính đơn điệu mạnh (với hằng số γ) của f, ta có f(x, x0)≤ −f(x0, x)−γkx−x0k2 ≤ −µkx0−xk −γkx−x0k2 ≤ −kx0−xk(µ+γkx−x0k). Do đó nếu kx−x0k >−µ γ thì f(x, x0)≤ −µkx0−xk −γkx−x0k2 < 0.

Bây giờ lấy tập compact U := C ∩B(x0, ) với > max{1,−µ, γ}, ta sẽ có f(x, x0)< 0 ∀x∈ C\U. Vậy tính bức của f được thỏa mãn. Do đó bài toánEP(f, C)có nghiệm. Tính duy nhất nghiệm được suy ra từ phần (i) do tính đơn điệu mạnh kéo theo đơn điệu chặt.

Bài toán cân bằng EP(f, C)có mối liên hệ chặt chẽ với bài toán sau, được gọi là bài toán đối ngẫu của EP(f, C)

Tìm y∗ ∈ C sao cho f(x, y∗)≤ 0 ∀x ∈C. (DEP) Ta ký hiệu tập nghiệm của bài toán đối ngẫu là DS. Mối quan hệ giữa hai bài toán này được thể hiện ở mệnh đề dưới đây.

Mệnh đề 2.1.3 (Xem [2]). Giả sử f : C×C →R là song hàm cân bằng. Khi đó

(i) Nếu f(x, .) là hàm lồi trên C với mọi x∈ C thì tập nghiệm DS lồi. (ii) Nếu f giả đơn điệu trên C, f(., y)nửa liên tục theo mỗi tia với mỗi y ∈ C

và f(x, .) lồi với mỗi x∈ C thì

Chứng minh. (i) Theo định nghĩa của bài toán (DEP), ta có DS ={y ∈C : f(x, y)≤0 ∀x∈ C}.

Do C lồi và f(x, .) lồi với mọi x ∈ C nên DS là giao của một họ vô hạn các tập lồi, do đó nó cũng là một tập lồi.

(ii) Do tính giả đơn điệu của f nên suy ra

Sol(f, C)⊆DS.

Ta chỉ cần chứng minh chiều ngược lại. Giả sử x∗ là nghiệm của bài toán đối ngẫu, tức là

f(x, x∗)≤ 0 ∀x∈ C.

Giả sử phản chứng x∗ không là nghiệm của bài toán EP(f, C). Khi đó tồi tại y∗ ∈ C sao cho

f(x∗, y∗)< 0.

Lấy yt := ty∗+ (1−t)x∗, do C lồi nên yt ∈ C với mọi t ∈ [0,1]. Do tính nửa liên tục trên theo tia của f(., y∗), ta có

lim

t→0f(ty∗+ (1−t)x∗)≤ f(x∗, y∗)< 0.

Vậy tồn tại t∗ ∈ [0,1] thỏa mãn f(yt∗, y∗ < 0. Khi đó, theo tính chất lồi của hàm f(yt∗, .), ta viết được

0 = f(yt∗, yt∗)≤ t∗f(yt∗, y∗) + (1−t∗)f(yt∗,x∗).

Vì f(yt∗, x∗) < 0 nên suy ra f(yt∗, x∗) > 0. Điều này mâu thuẫn với x∗ ∈DS.

2.2 Bài toán cân bằng tách

Trước tiên, ta tìm hiểu bài toán chấp nhận tách. Cho các không gian Hilbert

H1, H2, C ⊂ H1 và Q⊂ H2 là các tập con, lồi, đóng, khác rỗng. Cho A :H1 → H2 là toán tử tuyến tính bị chặn. Bài toán chấp nhận tách (SF P) được phát biểu như sau

Ta gọi Γ là tập nghiệm của SF P, tức là

Γ := {x∗ ∈C : Ax∗ ∈Q}

và giả sử rằng Γ6= ∅.

Giả sửx∗ ∈ Γ, ta cóAx∗ ∈Q. Khi đó,Ax∗−PQAx∗ = 0hay(I−PQ)Ax∗ = 0. Do đó, x∗ là nghiệm của bài toán cực tiểu hóa với giá trị tối ưu 0 sau đây

min

x∈C f(x) := 1

2kAx−PQAxk2.

Bài toán chấp nhận tách có nhiều ứng dụng thực tế trong các bài toán xử lý tín hiệu và khôi phục ảnh, liệu pháp xạ trị điều chỉnh cường độ và trong các bài toán khác. Bài toán chấp nhận tách trong các không gian Hilbert hữu hạn chiều được giới thiệu lần đầu tiên bởi Yair Censor và Tommy Elfving. Để giải bài toán chấp nhận tách trong không gian hữu hạn chiều, Charles Byrne đã đề xuất thuật toán CQ bằng cách xét dãy, với mọi k ≥ 0,

xk+1 =PC(xk +γAT(PQ−I)Axk),

trong đó C, Q lần lượt là hai tập lồi đóng khác rỗng trong Rn và Rm, A là một ma trận thực cỡ m×n, L là giá trị riêng lớn nhất của ma trận ATA và γ ∈ 0, 2

Gần đây, Hong-Kun Xu đã giải bài toán chấp nhận tách trong không gian Hilbert vô hạn chiều trong đó thuật toán CQ có dạng

xk+1= PC(xk +γA∗(PQ−I)Axk), với

γ ∈ 0, 2

kAk2

và A∗ là toán tử liên hợp củaA. Tác giả chứng minh được dãy {xk} hội tụ yếu đến nghiệm của bài toán chấp nhận tách với điều kiện bài toán chấp nhận tách có nghiệm.

Thuật toán CQđể giải bài toán chấp nhận tách đòi hỏi phải tìm được hình chiếu trên các tập C và Q, tuy nhiên trong các trường hợp các C, Q được cho dưới dạng ẩn, ví như tập điểm bất động của một ánh xạ, tập nghiệm của một bài toán bất đẳng thức biến phân, tập nghiệm của bài toán cân bằng, . . . thì

ta không thể tìm được hình chiếu trên chúng. Bài toán chấp nhận tách trong trường hợp này được gọi là bài toán chấp nhận tách suy rộng. Một trong những dạng cơ bản của bài toán chấp nhận tách suy rộng là bài toán cân bằng tách. Dưới đây, chúng ta xét bài toán cân bằng tách, trong đó, C là tập nghiệm của bài toán cân bằng.

Tìm x∗ ∈ K sao cho f(x∗, x)≥ 0 ∀x∈ K. (EP) và Q là tập nghiệm của bài toán quy hoạch lồi

min

y {g(y) : y ∈ A(K)}, (SEO) trong đó, K là tập lồi, đóng trong H1, A : H1 → H2 là toán tử tuyến tính liên tục và g là một hàm lồi hữu hạn trong không gian H2.

Ta cần một số giả thiết sau cho thuật toán và sự hội tụ của thuật toán được trình bày dưới đây. Giả thiết

(A1) Với mỗi x∈ C, f(x, x) = 0 và f(x, .) lồi nửa liên tục dưới yếu trên K. (A2) ∂2f(x, x) 6= ∅, với mọi > 0 và x ∈ K, là tập con bị chặn của K, trong

đó ∂2f(x, x) kí hiệu là - dưới vi phân của hàm lồi f(x, .) tại x, tức là

∂2f(x, x) := {g ∈ H : g, y−x+f(x, x)≤ f(x, y)+ ∀y ∈K}. (P(u)) (A3) f giả đơn điệu trên C với mọi nghiệm của bài toán cân bằng EP(f, K),

điều đó có nghĩa f(x, x∗)≤ 0 với mọi x∈ C, x∗ ∈Sol(f, K) và thỏa mãn điều kiện sau

x∗ ∈Sol(f, K), y ∈ C, f(x∗, y) = f(y, x∗) = 0 ⇒y ∈Sol(f, K). (A4) Với mỗi x∈ K, f(., x) nửa liên tục trên yếu trên K.

Ta nhắc lại ánh xạ gần kề của hàm lồi g với hằng số λ > 0, kí hiệu bởi proxλg được định nghĩa như là nghiệm duy nhất của bài toán lồi mạnh sau

proxλg(u) := argminng(v) + 1

λkv −uk2 :v ∈ H2o.

Với λ > 0, ta định nghĩa h(x) := 12k(I − proxλg)Axk2. Sử dụng điều tối ưu cần và đủ cho bài toán lồi, ta thấy h(x) = 0 nếu và chỉ nếu Ax là nghiệm của

P(u) với u = Ax. Chú ý rằng, thậm trí g có thể không khả vi, h luôn khả vi và Oh(x) =A∗(I−proxλg)Ax. Do đó, h(x) = 0 nếu và chỉ nếu Oh(x) = 0.

Sau đây, ta xét thuật toán và sự hội tụ của thuật toán được đề xuất trong tài liệu [6]. Giả sử các tham số dươngδ, ξ và các dãy số thực {ak}, {δk}, {βk},

{k}, {ρk} thỏa mãn các điều kiện sau.

0< a < ak < b < 1, 0 < ξ ≤ ρk ≤4−ξ ∀k ∈ N; (2.1) δk > δ >0, βk >0, k ≤ 0 ∀k ∈ N; (2.2) lim k→∞ak = 1 2; (2.3) ∞ X k=1 βk δk = +∞, ∞ X k=1 βk2 < +∞; (2.4) ∞ X k=1 βkk δk <+∞. (2.5) Thuật toán 1 ([5]) Bước 0.Chọn x1 ∈C và đặt k:= 1. Bước k. Từ xk tính gk ∈∂k 2 f(xk, xk) và định nghĩa αk = βk γk trong đó γk = max{δk,kgkk}. Tính yk=PC(xk−αkgk), tức là yk−xk+αkgk, x−yk ≥0 ∀x∈C. Đặt µk :=      0 nếu Oh(yk) = 0, ρk h(y k) kOh(yk)k2 nếu Oh(yk)6= 0. (2.6) và tính zk =PC(yk−µkA∗(I−proxλg)(Ayk)). Tính xk+1 =αkxk+ (1−αk)zk.

Nhận xét 2.2.1. Chú ý rằng khi g ≡ 0, bài toán (SEO) trở thành bài toán (EP).

Nhận xét 2.2.2. Nếu chọnk = 0, thìxk = yk vàh(xk) = 0, hay nói cách khác xk là nghiệm. Từ thực tế này, ta gọi xk là-nghiệm nếuk ≤và kxk−ykk ≤,

|h(xk)| ≤ .

Định lý 2.2.1 ([6]). Giả sử rằng bài toán (SEO) có ít nhất một nghiệm. Khi đó, với những điều kiện (A1)−(A4), dãy {xk} được xác định bởi Thuật toán 1 hội tụ yếu tới nghiệm của bài toán (SEO).

Ta cần những bổ đề dưới đây để chứng minh sự hội tụ của thuật toán. Bổ đề 2.2.1 (Xem [6]). Cho S là tập nghiệm của bài toán (SEO) và z ∈ S. Nếu Oh(yk)6= 0 thì ta có

kzk −zk2 ≤ kyk −zk2−ρk(4−ρk) h 2(yk)

kOh(yk)k2. (2.7) Bổ đề 2.2.2 (Xem [6]). Với mỗi k, các bất đẳng thức sau thỏa mãn

i) αkkgkk ≤βk; ii) kyk−xkk ≤ βk.

Bổ đề 2.2.3 (Xem [6]). Cho z ∈ S. Khi đó, với mỗi k sao cho Oh(yk)6= 0 ta có

kxk+1−zk2 ≤ kxk−zk2−ρk(4−ρk) h 2(yk)

kOh(yk)k2

+ 2(1−ak)αkf(xk, z) +Ak (2.8)

và với mỗi k sao cho Oh(yk) = 0, ta có

kxk+1−zk2 ≤ kxk −zk2+ 2(1−ak)αkf(xk, z) +Ak, (2.9)

trong đó Ak = 2(1−ak)(αkk +βk2).

Chứng minh. Do định nghĩa của xk+1 và sử dụng Bổ đề 1.3.2, ta có

kxk+1−zk2 =kakxk + (1−ak)zk −zk2

≤ akkxk −zk2+ (1−ak)kzk−zk2 (2.10) Ta xét hai trường hợp sau

Trường hợp 1: Nếu Oh(yk)6= 0, theo Bổ đề 2.2.1, ta có kxk+1−zk2 ≤ akkxk−zk2+ (1−ak)hkyk−zk2−ρk(4−ρk) h 2(yk) kOh(yk)k2 i . (2.11) Hơn nữa, ta lại có

kyk −zk2 =kz−xk +xk −ykk2

=kxk −zk2− kxk −ykk2+ 2xk −yk, z−xk

≤ kxk −zk2+ 2xk −yk, z−xk. Trong Thuật toán 1, do yk được chọn sao cho

yk −xk +αkgk, x−yk ≥ 0 ∀x∈ C và thế x =z, ta có yk −xk+αkgk, z−yk ≥ 0 ⇐⇒ αkgk, z−yk ≥ xk −yk, z−yk. Do đó kyk −zk2 ≤ kxk −zk2+ 2xk−yk, z−xk =kxk −zk2+ 2αkgk, z−xk+ 2αkgk, xk−yk. (2.12) Từ gk ∈ ∂k 2 f(xk, xk) suy ra f(xk, z)−f(xk, xk)≥ gk, z−xk−k ⇐⇒f(xk, z) +k ≥ gk, z−xk. (2.13) Mặt khác, từ Bổ đề 2.2.2, ta có αkgk, xk −yk ≤ αkkgkkkxk−ykk ≤ βk2 Từ (2.12) và (2.13) và αk > 0 suy ra kyk−zk2 ≤ kxk−zk2+ 2αkf(xk, z) + 2αkk + 2βk2. (2.14) Kết hợp (2.11) và (2.15), ta có kxk+1−zk2kxk−zk2+ 2(1−ak)f(xk, z)

−ρk(4−ρk) h 2(yk)

kOh(yk)k2 +Ak, trong đó Ak = 2(1−ak)(αkk +βk2).

Trường hợp 2: Nếu Oh(yk) = 0, từ định nghĩa của xk+1, ta viết

kxk+1−zk2 ≤ akkxk −zk2+ (1−ak)kzk −zk2. Lập luận tương tự như trong Trường hợp 1, ta có

kyk−zk2 ≤ kxk−zk2+ 2αkf(xk, z) + 2αkk + 2βk2. Khi đó, ta thu được

kxk+1−zk2 ≤ kxk−zk2+ 2(1−ak)f(xk, z) +Ak, trong đó Ak = 2(1−ak)(αkk +βk2).

Tiếp theo, ta chứng minh Định lý 2.2.1.

Chứng minh. Khẳng định 1 Dãy {kxk−zk2} hội tụ với mọi z ∈ S. Thật vậy, lấy z ∈ S. Do z ∈ Sol(f, C) và f giả đơn điệu trên C với mọi nghiệm của bài toán cân bằng (EP), ta có f(xk, z)≤ 0. Nếu Oh(yk)6= 0 thì do kyk −zk2−ρk(4−ρk) h 2(yk) kOh(yk)k2 ≥ 0 nên theo Bổ đề 2.2.3, ta có kxk+1−zk2 ≤ kxk −zk2 +Ak, (2.15) trong đó Ak = 2(1−ak)(αkk +βk2). Do đó, αk = βk γk với γk = max{δk,kgkk}, +∞ X k=1 αkk = +∞ X k=1 βk γk k ≤ +∞ X k=1 βk δk k <+∞.

Chú ý rằng +∞ P k=1 βk2 <+∞ và 0< a < ak < b < 1, ta có +∞ X k=1 Ak < 2(1−a) +∞ X k=1 (akk +βk2)<+∞.

Sử dụng Bổ đề 1.3.3, ta thấy rằng {kxk−zk2} hội tụ với mọi z ∈S. Do đó,

{xk} bị chặn. Vì vậy theo Bổ đề 2.2.2, ta cũng nhìn thấy rằng {yk} bị chặn.

Cân bằng Nash trong trò chơi không hợp tác

Bài toán tối ưu hóa

Ứng dụng vào bài toán sản xuất điện