Cân bằng Nash trong trò chơi không hợp tác- 123docz.net

Xét một trò chơi có p người chơi (đấu thủ). Giả sửCj ⊂ Rpj là tập phương án mà đấu thủ thứ j có thể lựa chọn trong đó (gọi là tập chiến lược).

Đặt C := C1 ×C2× ...× Cp và gọi ϕj : C → R là hàm lợi ích của đấu thủ j

khi đấu thủ này chọn phương án chơi xj ∈ Cj, còn các đấu thủ k khác chọn phương án chơi là xk ∈Ck với mọi k 6=j.

Định nghĩa 1.3.1. (Điểm cân bằng Nash) Ta gọi x∗ = x∗1, ..., x∗p là điểm cân bằng của ϕ= (ϕ1, ..., ϕp) trên tập C :=C1×C2×...×Cp nếu với mọi j và mọi

yj ∈ Cj, ta có:

ϕj x∗1, ..., x∗j−1, yj, x∗j+1, ..., x∗p ≤ ϕj x∗1, ..., x∗j−1, x∗j, x∗j+1, ..., x∗p.

Định nghĩa này cho thấy rằng nếu một đấu thủ j nào đó rời khỏi phương án cân bằng, trong khi các đấu thủ khác vẫn giữ phương án cân bằng thì đấu thủ j sẽ bị thua thiệt. Đây chính là lý do mà khái niệm cân bằng này được

chấp nhận trong thực tế. Điểm cân bằng này được gọi là điểm cân bằng Nash vì khái niệm này do nhà kinh tế học F. Nash đưa ra đầu tiên. Dưới đây bài toán cân bằng Nash sẽ được hiểu là bài toán tìm một điểm cân bằng (Nash) của ϕ trên C. Ta sẽ ký hiệu bài toán này là N (ϕ, C). Bài toán cân bằng Nash có thể mô tả dưới dạng bài toán cân bằng (EP).

Thật vậy, xây dựng hàm f : C ×C →R, bằng cách đặt f(x, y) := p P j=1 [ϕj(x)−ϕj(x1, ..., xj−1, yj, xj+1, ..., xp)]. Nếu x∗ là một điểm cân bằng Nash thì f(x∗, y)≥ 0, ∀y ∈C.

Ngược lại, giả sử x∗ ∈ C là nghiệm của bài toán (EP), tức là

f(x∗, y)≥ 0, ∀y ∈ C .

Ta sẽ chứng tỏ x∗ = x∗1, ..., xp∗ với x∗j ∈Cj là một điểm cân bằng Nash. Thật vậy, nếu trái lại, sẽ tồn tại j và một số yj ∈ Cj sao cho

ϕj x∗1, ..., x∗j−1, x∗j, x∗j+1, ..., x∗p< ϕj x∗1, ..., x∗j−1, yj, x∗j+1, ..., x∗p.

Khi đó, với phương án y = x∗1, ..., x∗j−1, yj, x∗j+1, ..., x∗p, theo định nghĩa của hàm f, ta có

f(x∗, y) = ϕj x∗1, ..., x∗j−1, yj, x∗j+1, ..., x∗p−ϕj(x∗)<0. Mâu thuẫn với x∗ là nghiệm của (EP).

Vậy x∗ là một điểm cân bằng Nash. 1.3.5 Bất đẳng thức biến phân

Xét bài toán bất đẳng thức biến phân đa trị sau:

Cho C là một tập lồi, đóng, khác rỗng trong H và F : C →H là một ánh xạ đa trị (tức là với mỗi x ∈C, giá trị F(x) là một tập khác rỗng). Xét bài toán:

Tìm x∗ ∈ C, v∗ ∈ F(x∗) sao cho hv∗, y−x∗i ≥ 0, ∀y ∈ C.

(VI) Ta có thể minh họa bất đẳng thức biến phân (VI) dưới góc độ mô hình kinh tế như sau: Giả sử C là tâp hợp các chiến lược (tập ràng buộc) các phương án sản xuất có thể lựa chọn. Với mỗi phương án sản xuất x∈ C, tập (ánh xạ giá)

F(x)là tập hợp các giá thành chi phí có thể, ứng với phương án x. Khi đó bài toán (VI) chính là bài toán tìm phương án sản xuất x∗ trong tập chiến lược

C và giá v∗ ứng với x∗ sao cho chi phí là thấp nhất. Trong trường hợp ánh xạ giá không phụ thuộc vào phương án sản xuất, tức là F (x) = c với mọi x, bất đẳng thức biến phân (VI) trở thành bài toán quy hoạch quen thuộc

mincTx :x ∈ C .

(LP) Trong bài toán quy hoach này, véc-tơ giá c không phụ thuộc vào phương án sản xuất.

Về mặt hình học, bất đẳng thức biến phân (VI) là bài toán tìm một điểm

x∗ ∈ C sao cho tập F(x∗) có một phần tử là véc-tơ pháp tuyến (ngoài) của tâp C tại điểm x∗.

Giả sử với mỗi x∈ C, tập F (x) lồi, compact, khác rỗng. Với mỗi x, y ∈C, để mô tả bài toán (VI) về bài toán cân bằng ta đặt

f(x, y) := max

v∈F(x)hv, y−xi.

Từ đây ta suy ra f(x, y) ≥ 0 với mọi y ∈ C khi và chỉ khi x là nghiệm của (VI).

Một trường hợp riêng quan trọng của bài toán (VI) là khi C = Rn

+ và F

đơn trị. Khi đó bài toán (VI) tương đương với bài toán sau, được gọi là bài toán bù:

Tìm x≥ 0 sao cho F(x)≥0, xTF(x) = 0.

(CP) Ta chỉ ra rằng bài toán (CP) này tương đương với bất đẳng thức biến phân:

Tìm x≥ 0 sao cho hF (x), y−xi ≥ 0, ∀y ≥ 0.

Sự tương đương ở đây được hiểu theo nghĩa tập nghiệm của hai bài toán này trùng nhau.

Thật vậy, nếu x là nghiệm của bất đẳng thức biến phân thì

Lần lượt chọn y =x+ei (véc-tơ đơn vị thứ i) ta có

Fi(x) =F(x), x+ei−x

=F(x), ei ≥ 0.

Vậy Fi(x)≥ 0 với mọi i. Ngoài ra, nếu chọn y = 0 ta có

0≤ − hF (x), xi ≤ 0.

Suy raxTF (x) = 0. Điều ngược lại, mọi nghiệm của bài toán bù đều là nghiệm của bất đẳng thức biến phân luôn đúng.

Ngoài ra, bài toán quy hoạch lồi

min{f(x) : x∈ C},

(CO) trong đó f là một hàm lồi khả dưới vi phân trên tập lồi C, có thể mô tả dưới dạng bất đẳng thức biến phân (VI), với F =∂f.

Thật vậy, khi F = ∂f, bài toán (VI) viết được là:

Tìm x∗ ∈ C, v∗ ∈ ∂f(x∗) sao cho hv∗, y−x∗i ≥ 0, ∀y ∈ C.

Nếu x∗ là nghiệm của bất đẳng thức biến phân này, thì do v∗ ∈ ∂f (x∗), nên theo định nghĩa của dưới vi phân, ta có:

hv∗, y−x∗i+f(x∗)≤ f(y), ∀y.

Thế nhưng do x∗ là nghiệm của bất đẳng thức biến phân nên

hv∗, y−x∗i ≥ 0, ∀y ∈ C.

Từ đây suy ra f(x∗) ≤ f(y) với mọi y ∈ C. Vậy x∗ là một nghiệm của bài toán (CO). Trái lại, nếu x∗ là nghiệm của (CO), thì theo điều kiện cần và đủ tối ưu của quy hoạch lồi, ta có

0∈ ∂f(x∗) +NC(x∗).

Từ đây, theo định nghĩa của nón pháp tuyến của C tại x∗, ta suy ra x∗ là nghiệm của bất đẳng thức biến phân (VI), với F = ∂f.

Nhận xét 1.3.1. Trong tất cả các bài toán vừa kể trên, song hàm f đều có tính chất f(y, y) = 0 với mọi y ∈C. Như vậyf là một song hàm cân bằng trên

Chương 2

Hai phương pháp cơ bản giải bài toán cân bằng

Bài toán cân bằng (EP) có thể mô tả dưới các dạng tương đương. Các dạng tương đương này là cơ sở để xây dựng các phương pháp giải. Trong chương này, ta sẽ trình bày một số cách tiếp cận cơ bản để giải bài toán cân bằng (EP). Đó là cách tiếp cận dựa trên phương pháp điểm bất động, cách tiếp cận theo nguyên lý bài toán phụ, tiếp cận theo tối ưu hóa dựa trên kĩ thuật hàm đánh giá. Nội dung chương này được tham khảo từ [6-11], [13], [14].

2.1 Các dạng tương đương

Mệnh đề 2.1.1. Giả sử f : C×C → R là song hàm cân bằng và các điều kiện sau được thỏa mãn:

(A1) f(., y) nửa liên tục trên trên tập C;

(A2) f(x, .) lồi, nửa liên tục dưới và khả dưới vi phân trên C. Khi đó, các điều sau đây là tương đương:

(i) x∗ là nghiệm của bài toán cân bằng (EP); (ii) min

x∈C g(x) = 0 (dạng minimax), trong đó hàm g (hàm đánh giá) được cho bởi:

g(x) := sup

y∈C

(iii) x∗ = arg min

y∈C f(x∗, y) (dạng điểm bất động). Chứng minh:

(i) ⇔ (ii).

Giả sử x∗ là một nghiệm của bài toán (EP). Do f(x, x) = 0 với mọi x∈ C, nên

inf y∈Cf(x, y)≤ 0, ∀x∈ C. Do đó sup x∈C inf y∈Cf(x, y)≤0. Trong khi đó, do x∗ ∈ C, nên

sup

x∈C

inf

y∈Cf(x, y)≥ inf

y∈Cf(x∗, y).

Mặt khác, do x∗ là nghiệm của (EP), nên f(x∗, y)≥ 0 với mọi y ∈ C. Vậy

inf y∈Cf(x∗, y)≥ 0. Suy ra 0≤ inf y∈Cf(x∗, y)≤sup x∈C inf y∈Cf(x, y)≤0. Vậy 0 = sup x∈C inf y∈Cf(x, y) = max x∈C inf y∈Cf(x, y) = inf y∈Cf(x∗, y) = min x∈C sup y∈C f(x, y).

Ngược lại, giả sử có (ii). Khi đó theo lập luận ở trên ta có:

sup x∈C [−f(x∗, y)] = min x∈C sup x∈C [−f(x, y)] = 0 .

Chứng tỏ −f(x∗, y)≤ 0, với mọi y ∈ C hay f(x∗, y)≥ 0, với mọi y ∈C. Vậy x∗ là nghiệm của (EP).

(i) ⇔ (iii).

Thật vậy, x∗ là điểm cực tiểu của f(x∗, .) trên C khi và chỉ khi

f(x∗, y)≥ f(x∗, x∗) = 0, ∀y ∈ C. Mệnh đề đã được chứng minh.

Trong phương pháp giải bài toán cân bằng theo nguyên lý bài toán phụ, mệnh đề dưới đây cho phép thay thế bài toán quy hoạch lồi, không nhất thiết có và duy nhất nghiệm, bằng các bài toán phụ quy hoạch lồi mạnh, luôn có và duy nhất nghiệm. Các bài toán quy hoạch lồi mạnh này đóng vai trò như một bài toán phụ trong các phương pháp giải.

Mệnh đề 2.1.2. Giả sử H : C×C →R là một song hàm cân bằng, không âm và thỏa mãn các tính chất sau đây:

(i) H khả vi trên C và 52H(x, x) = 0 với mọi x∈ C; (ii) H(x, .) lồi mạnh trên C với mỗi x∈ C.

Khi đó với các giả thiết (A1) và (A2), ta có x∗ là nghiệm của bài toán cân bằng

(EP) khi và chỉ khi nó là nghiệm của bài toán sau (được gọi là bài toán hiệu chỉnh):    Tìm x∗ ∈C sao cho ϕ(x∗, y) :=ρf(x∗, y) +H(x∗, y)≥ 0 ∀y ∈ C, (AEP)

trong đó ρ > 0 (tham số hiệu chỉnh). Chứng minh.

Do H là song hàm không âm, nên hiển nhiên rằng x∗ là nghiệm của (AEP), nếu nó là nghiệm của (EP). Trái lại giả sử x∗ là nghiệm của (AEP). Khi đó theo mệnh đề trước, ta có x∗ là nghiệm của quy hoạch lồi mạnh sau:

min{ρf(x∗, y) +H(x∗, y) : y ∈C}.

Do C lồi, f(x∗, .) lồi và H(x∗, y) lồi mạnh, nên bài toán này luôn có duy nhất nghiệm là s(x∗). Theo điều kiện cần và đủ tối ưu của quy hoạch lồi và tính chất 52H(x, x) = 0 của hàm H, ta có:

0∈ ∂2ϕ(x∗, x∗) +NC(x∗)

= ∂2f(x∗, x∗) +NC(x∗)

Vậy, tồn tại u∗ ∈∂2f(x∗, x∗) thỏa mãn:

hu∗, y−x∗i ≥ 0 ∀y ∈ C.

Do tính chất dưới vi phân của hàm lồi f(x∗, .), với mọi y ∈ C, ta lại có:

hu∗, y−x∗i ≤ f(x∗, y)−f(x∗, x∗) = f(x∗, y).

Suy ra f(x∗, y)≥ 0 với mọi y ∈ C. Chứng tỏ x∗ là nghiệm của (EP). Mệnh đề đã được chứng minh.

Hàm hiệu chỉnh hay được dùng là hàm Bregman được cho bởi:

H(x, y) := g(y)−g(x)− h5g(x), y−xi,

trong đó g là một hàm lồi mạnh xác định trên toàn không gian, ví dụ g(x) := 1

2kxk.

2.2 Phương pháp điểm bất động và hàm đánh giá

2.2.1 Phương pháp điểm bất động

Sử dụng dạng điểm bất động, ta có thuật toán lặp tổng quát sau:

Tại mỗi bước lặp k = 0,1, . . . , giả sử đã có xk ∈ C, ta xây dựng dãy lặp theo quy tắc

xk+1 =s xk :=argmin{ϕ xk, y : y ∈ C}, (Pk) trong đó, như đã nói,

với ρ > 0 là tham số hiệu chỉnh. Chú ý rằng do C lồi, f lồi, nửa liên tục dưới theo biến thứ hai và H lồi mạnh, khả vi theo biến thứ hai, nên bài toán (Pk)

luôn có duy nhất nghiệm. Vậy xk+1 được xác định.

Như trên ta đã thấy, nếu may mắn có xk+1 = xk, thì xk là nghiệm của bài toán (AEP), và do đó cũng là nghiệm của (EP). Nếu trường hợp này không bao giờ xảy ra, thì quá trình lặp sẽ kéo dài vô hạn và nó sẽ tạo ra một dãy vô hạn xk thuộc tập C. Câu hỏi đặt ra là với những điều kiện nào, thì dãy vô hạn này sẽ hội tụ đến lời giải của bài toán (AEP)?

Trong mệnh đề dưới đây, ta lấy H(x, y) := 1

2ky −xk2. Hiển nhiên hàm này thỏa mãn các tính chất cho hàm hiệu chỉnh H, nêu ở trên.

Mệnh đề 2.2.1. Giả sử f đơn điệu mạnh trên C với hệ số τ và thỏa mãn điều kiện kiểu Lipschitz, theo nghĩa sau:

(M)    ∃L1 >0, L2 >0 :∀x, y, z ∈ C, ta có f(x, y) +f(y, z)≥f(x, z)−L1kx−yk2−L2ky −zk2

Khi đó với bất kỳ x0 ∈C, dãy xk được xác định theo công thức (Pk)

xk+1 := s(xk) :=argmin y∈C ρf xk, y+ 1 2 y−xk 2 , có tính chất xk+1−x∗ 2 ≤ αxk −x∗ 2 , ∀k ≥ 0, nếu như 0 < ρ ≤ 1 2L2, trong đó x

∗ là nghiệm duy nhất của bài toán (EP) và

α := 1−2ρ(τ −L1). Chứng minh: Với mỗi k ≥ 0, đặt fk(x) := ρf xk, x+ 1 2 x−xk 2 . Khi đó, do f xk,·

lồi, nên hàm fk lồi mạnh trên C với hệ số 1. Vậy

fk xk+1+wk, x−xk+1+ 1 2

x−xk+1 2

≤ fk(x),∀x∈ C, (2.1) trong đó wk ∈ ∂fk xk+1.

Do xk+1 là nghiệm của bài toán (Pk), nên wk, x−xk+1 ≥ 0 với mọi x ∈ C. Từ (2.1) ta có: fk xk+1+ 1 2 x−xk+1 2 ≤ fk(x), ∀x∈ C. (2.2) Trong (2.2) thay x =x∗, theo định nghĩa của fk ta được:

xk+1−x∗ ≤ 2ρ f xk, x∗−f xk, xk+1 +xk−x∗ 2 −xk+1−xk 2 . (2.3)

Do f đơn điệu mạnh với hệ số τ nên:

f xk, x∗ ≤ −f x∗, xk−τ xk−x∗ 2 . Thay vào (2.3) ta có: xk+1−x∗ 2 ≤(1−2ρτ)xk−x∗ 2 + 2ρ[−f x∗, xk −f xk, xk+1]−xk+1−xk 2 .

Bây giờ áp dụng tính Lipschitz (M) với x= x∗, y =xk và z =xk+1, ta được:

−f xk, xk+1−f x∗, xk≤ −f x∗, xk+1+L1 x∗−xk 2 +L2 xk −xk+1 2 ≤ L1 x∗−xk 2 +L2 xk−xk+1 2

Thay vào ta được: xk+1−x∗ 2 ≤ [1−2ρ(τ −L1)]xk −x∗ 2 −(1−2ρL2)xk+1−xk 2 .

Theo giả thiết, 0< ρ < 1

2L2

, nên từ đây suy ra: xk+1−x∗ 2 ≤ 1−2ρ(τ −L1) xk −x∗ 2 .

Vậy mệnh đề được chứng minh.

Hệ quả 2.2.1. Cho L1 < τ và 0 < ρ ≤ 1 2L2 . Khi đó: xk+1−x∗≤ rxk −x∗, ∀k ≥ 0, trong đó 0 < r := p1−2ρ(τ −L1)<1 Do τ ≤ L1 +L2 và 0 < ρ ≤ 1 2L2

, nên ta có 2ρ(τ −L1) < 1. Vậy r đạt giá trị nhỏ nhất tại ρ = 1

2L2

Dựa vào mệnh đề và hệ quả trên, ta có thuật toán sau giải bài toán (EP) khi f đơn điệu mạnh và thỏa mãn điều kiện Lipschitz (M).

Như đã thấy, nếu xk =xk+1, thìxk là nghiệm, do đó ta gọi một điểm x∈ C

là một nghiệm−xấp xỉ của (EP) nếukx−x∗k ≤, trong đóx∗ là một nghiệm chính xác của (EP).

Thuật toán 1 (cho bài toán cân bằng đơn điệu mạnh) Bước khởi đầu. Chọn sai số ≥ 0 và 0< ρ ≤ 1

2L2

. Lấy x0 ∈ C.

Bước lặp k (k = 0,1, . . .). Tính xk+1 bằng cách giải quy hoạch lồi mạnh

xk+1 =argminy∈C{ρf(xk, y) + 1 2 y −xk 2 } (Pk) Nếu xk+1−xk ≤ (1−r) r , với r := p 1−2ρ(τ −L1), thì dừng: xk+1 là một nghiệm -xấp xỉ của (EP).

Trái lại tăng k thêm 1 và thực hiện bước lặp k.

Chú ý rằng do tính chất co xk+1−x∗≤ rxk−x∗ với r < 1, ta có: xk+1−x∗ ≤ r 1−r xk+1−xk, ∀k ≥ 0. Do đó xk+1−x∗ ≤ r k+1 1−r x0−x1, ∀k ≥ 0. Vậy, nếu xk+1−xk ≤ (1−r) r hoặc rk+1 1−r kx0−x1k ≤, thì xk+1−x∗ ≤ . Trong trường hợp này, ta được một nghiệm -xấp xỉ.

Trường hợp bất đẳng thức biến phân Giả sử F là một ánh xạ đa trị sao cho

C ⊆ domF := {x∈ Rn :F(x)6= ∅}

và F(x) compact với mọi x∈ C.

Trong phần trước, ta đã thấy bài toán bất đẳng thức biến phân:    Tìm x∗ ∈ C, v∗ ∈ F(x∗) sao cho: hv∗, y−x∗i ≥ 0,∀y ∈ C (VI) là một trường hợp riêng của bài toán cân bằng (EP), và khi C là một nón lồi, thì bài toán bất đẳng thức biến phân trở thành bài toán bù:

   Tìm x∗ ∈ C, v∗ ∈ F(x∗) sao cho: v∗ ∈C∗,hv∗, x∗i = 0 (CP) trong đó C∗ := {v| hv, xi ≥ 0,∀x ∈ C} là nón đối cực của C. Nhớ rằng khi

C = Rn+ thì C∗ = C. Ta nói rằng F thỏa mãn điều kiện Lipschitz trên C với hằng số Lipschitz L (nói ngắn gọn là L-Lipschitz), nếu F là Lipschitz theo khoảng cách Hausdorff, tức là với mọi x, y ∈ C ta có:

sup

u∈F(x)

inf

v∈F(y)ku−vk ≤Lkx−yk.

Như đã thấy ở đầu chương, để mô tả bất đẳng thức biến phân trên dưới dạng bài toán cân bằng (EP), ta đặt:

f(x, y) := max

v∈F(x)hv, y −xi.