Tính xấp xỉ của bài toán cân bằng Nash mở rộng

Một phần của tài liệu LUẬN ÁN TIẾN SĨ NGÀNH TOÁN HỌC : CÁC TÍNH CHẤT CHÍNH QUY CỦA NGHIỆM BÀI TOÁN TỐI ƯU (Trang 46 - 49)

2 TÍNH XẤP XỈ CỦA BÀI TOÁN TỰA BẤT ĐẲNG THỨC BIẾN

2.3 Tính xấp xỉ của bài toán cân bằng Nash mở rộng

rộng

Chúng ta xét trò chơi không hợp tác gồm I người chơi. Mỗi người chơi i cần tìm véctơ chiến thuật xi := (xi1, . . . , xiki ) Bki với ki thành phần. Véctơ x := (x1, . . . , xI )

Bn là biến quyết định của I người chơi, trong đó n = ∑I

i=1 ki. Để phân biệt người chơi thứ i, ta sử dụng ký hiệu x := (xi, xˆ). Mỗi người chơi i có hàm

i

mục tiêu θi : Bn → R phụ thuộc vào tất cả các người chơi còn lại. Hơn nữa, tập các chiến thuật của người chơi i phụ thuộc vào xˆ của những người chơi khác. Khi đó,

⇒ Bki . Ký hiệu θ = (θ1, . . . , θI ) và ta có ánh xạ đa trị Xi : Bi

X(x) := (X1(x−1), . . . , XI (x−I )) = {y ∈ Bn|yi ∈ Xi(), ∀i = 1, . . . , I} với x ∈ Bn.

i

Véctơ chiến thuật x¯ của I người chơi được gọi là cân bằng Nash mở rộng nếu không có người chơi nào có thể cải thiện hàm mục tiêu của mình bằng cách tự thay đổi chiến thuật của người đó, nghĩa là x¯ ∈ Xx) sao cho, với mọi i ∈ {1, . . . , I},

θixi, x¯ˆ) ≤ θi(xi, x¯ˆ) với mọi xi ∈ Xi).

i i i

Trường hợp tập chiến thuật của mỗi người chơi không phụ thuộc vào chiến thuật của những người chơi còn lại thì khái niệm này trở thành khái niệm cân bằng Nash cổ điển. Ký hiệu GNEP(θ, X) là trò chơi cân bằng mở rộng và G là tập các cân bằng Nash mở rộng của GNEP(θ, X).

Để biến đổi trò chơi GNEP(θ, X) về bài toán tựa bất đẳng thức biến phân đa trị ta cần nhắc lại một số khái niệm sau đây.

Toán tử nón pháp tuyến, xem [6], cho tập mức dưới điều chỉnh của hàm mục tiêu θi được cho bởi công thức sau

a (xi) := {vi ∈ (B ki a (xi)}. N θi )| v i, u i x i 0, u i L θi(·,xˆi) Ta xét Nθa : Bn ở đó Fi(x) :=

⇒ (Bn) được cho bởi công thức, với mỗi x ∈ Bn,

Nθa(x) := F1(x) × · · · × FN (x),

{

¯i

B (0, 1) nếu xi ∈ argminBk θi(·, xˆ),

i i

conv(Na (xi) ∩ Si(0, 1)) trong trường hợp ngược lại,

θi ¯i (0, 1) := {z ∈ B ki |∥z∥ ≤ 1}, B Si(0, 1) := {z ∈ Bki |∥z∥ = 1}.

Theo Định lý 4.2 trong [6], ta có mối quan hệ tương đương giữa điểm cân bằng Nash mở rộng của trò chơi không hợp tác và nghiệm của bài toán tựa bất đẳng thức biến phân đa trị tương ứng như sau.

35

Bổ đề 2.3.1. Giả sử rằng, với i ∈ I, hàm mục tiêu θi là liên tục và tựa lồi nửa chặt tương ứng với biến thứ i và X có giá trị lồi. Khi đó, x¯ là nghiệm của GNEP(θ, X) nếu và chỉ nếu x¯ là nghiệm của QVI(Nθa, X).

Giả sử rằng Bn là không gian Euclide. Chúng ta sẽ thiết lập các xấp xỉ của GNEP(θ, X) theo nghĩa hội tụ graph của các ánh xạ đa trị Nθaν đến Nθa và hội tụ liên tục của ánh xạ chiến thuật đến X. Cụ thể ta xét Nθaν (x) := F1ν (x) × · · · × FNν (x), ở đó := { ¯i (0, 1) ν(·, xˆi), ν B nếu xi ∈ argminBki θi Fi (x) conv(Naν (xi) ∩S

i(0, 1)) trong trường hợp ngược lại.

θi

Ký hiệu là tập nghiệm của GNEP(θν , Xν ).

Định lý 2.3.2. Giả sử rằng, với mỗi i ∈ {1, . . . , I}, các điều kiện sau đây thỏa mãn (i) θi và θiν là liên tục và tựa lồi nửa chặt ứng với biến thứ i;

(ii) Nθaν có đồ thị bị chặn phần cuối và hội tụ graph đến Nθa;

(iii) Xν là Lipschitz trên ( ∪

ν∈N Fix( )) ∪

Fix(X) với cùng hằng số L thuộc [0, 1);

(iv) Xν −→c X trên ( ∪

ν∈N Fix( )) ∪

Fix(X), Xν là lồi với giá trị đóng và X bị chặn;

(v) domX ⊆ domNθa, domX ν ⊆ domNθaν .

Khi đó, Gν P−K G với ν đủ lớn. −−−→

Chứng minh. Từ (i) và (iv), Bổ đề 2.3.1 chỉ ra rằng là nghiệm của GNEP(θν , Xν ) khi và chỉ khi là nghiệm của QVI(Nθaν , Xν ). Theo Mệnh đề 4.2 trong [14] và (i), Nθaν

Nθa có giá trị lồi compắc. Do đó, các giả thiết của Định lý 2.2.5 thỏa mãn. Suy ra Gν P−K G.

−−−→

Định lý 7.4 của A. Jofré và R. J. B. Wets [33] là trường hợp đặc biệt của Định lý 2.3.2 khi các hàm mục tiêu là các hàm lồi và các tập chiến thuật không phụ thuộc và biến quyết định.

Một phần của tài liệu LUẬN ÁN TIẾN SĨ NGÀNH TOÁN HỌC : CÁC TÍNH CHẤT CHÍNH QUY CỦA NGHIỆM BÀI TOÁN TỐI ƯU (Trang 46 - 49)

Tải bản đầy đủ (DOC)

(131 trang)
w