1. Trang chủ
  2. » Giáo Dục - Đào Tạo

Slide môn lý thuyết trò chơi: cân bằng NASH chiến lược hỗn hợp

24 2,9K 6

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 24
Dung lượng 317,29 KB

Nội dung

Sự tồn tại cân bằng Nash chiến lược hỗn hợp B... A-Sự tồn tại cân bằng nash chiến lược hỗn hợp• Ví dụ về thiết lập bài toán để tìm chiến lược cân bằng • Bài toán tổng quát • Định nghĩa

Trang 1

GAME THEORY

Trang 2

Nội dung thảo luận

1 Giới thiệu chung

2 Sự tồn tại chiến lược cân bằng Nash

3 Bài toán 2.6

2

Trang 3

1.Giới thiệu chung

1 Nhà toán học Nash

• Người Mỹ (1928)

• Chuyên ngành LTTC và hình học vi phân.

• Năm 1944 đạt giải nobel về kinh tế.

2 Cân bằng Nash (NE)

• Trò chơi dạng chuẩn: G={S,u}.

• Vectơ chiến lược (s*1,…,s*n) là 1 cân

Trang 4

2.Sự Tồn Tại Cân Bằng Nash

• Nội Dung

A Sự tồn tại cân bằng Nash chiến lược hỗn

hợp

B Trình bày ví dụ 2.6

Trang 5

A-Sự tồn tại cân bằng nash chiến lược hỗn hợp

• Ví dụ về thiết lập bài toán để tìm chiến

lược cân bằng

• Bài toán tổng quát

• Định nghĩa

Trang 6

+Giả sử có 2 đấu thủ:

Thu hoạch của mỗi đối thủ được cho ở bảng:

+ Giả sử (pt,pb) là xác suất để đối thủ hàng

chơi chiến lược (T,B);(pl,pr) là xác suất để

đối thủ cột chơi chiến lược (L,R)

=> Lợi ích kỳ vọng của đấu thủ hàng là: pt*[pl*2+pr*0]+pb*[pl*0+pr*1]

Lợi ích kỳ vọng của đấu thủ cột là : pl*[pt*1+pb*0]+pr*[pt*0+pb*2]

=>Bài toán tìm lợi ích cực đại lợi ích kỳ vọng của đấu thủ hàng:

thủ hàng

T 2,1 0,0

B 0,0 1,2

6

Trang 7

 Bài toán tổng quát

• Kí hiệu J là số chiến lược thuần túy trong và K là số chiến lược thuần túy trong

• Ta viết ; và sd ,

để kí hiệu các chiến lược thuần túy tùy ý trong và

• Nếu đấu thủ 1 tin rằng đấu thủ 2 sẽ chơi các chiến lược với các xác suất => thu hoạch kỳ vọng của đấu thủ 1 với chiến lược thuần túy là:

và thu hoạch kỳ vọng của đấu thủ 1 chơi chiến lược hỗn hợp là :

• Để chiến lược hỗn hợp là phàn ứng tốt nhất của đấu thủ 1 đối với chiến lược hỗn hợp của đấu thủ 2 thì phải có

>0 chỉ nếu

với mọi trong

Trang 8

Bài toán tổng quát (tiếp)

• Làm tương tự đấu thủ 2 như đấu thủ 1

• là cân bằng Nash chiến lược

hỗn hợp nếu chúng là nghiệm của bài toán :

Trang 9

 Định nghĩa :

Cân bằng nash chiến lược hỗn hợp

• Trong trò chơi dạng chuẩn của hai đấu thủ

G={ S1,S2;u1,u2},các chiến lược hỗn hợp

(p*1,p*2) là một cân bàng Nash nếu chiến lược hỗn hợp của mỗi đấu thủ là một phàn ứng tốt

nhất đối với chiến lược của đối thủ kia.

Trang 10

3-Ví dụ 2.6

• Xét bài toán 2 người chơi, mỗi người 2

chiến lược thuần túy

Xét các thu hoạch của đấu thủ 1 ở bảng:

T(q) P(1-q) (1) L(r) x,? y,?

X(1-r) z,? w,?

10

Trang 12

r

q r*(q)

12

Trang 13

Ta có thu hoạch kì vọng của (1).

Thu hoạch kì vọng khi chọn L: q.x + (1 - q).y

Thu hoạch kì vọng khi chọn X: q.z + (1 - q).w

• Gọi A là chênh lệch của thu hoạch kì vọng của (1)

( ) ( )

y q

Trang 14

-• Trong trường hợp này Lên và Xuống đều không bị trội ngặt Như vậy lên phải tối ưu với một số giá trị của q và Xuống tối ưu với một số giá trị khác của q

Trang 15

TH4:x<z và y>w

• Trường hợp này tương tự th3, xét mức

q’=(w-y)/((x-z)+(w-y))

Với q<q’ thì L phản ứng tốt nhất, q>q’ thì X phản ứng tốt nhất; q=q’ thì bàng quan.

(iv)

Trang 17

• Tương tự, Xét thu hoach của người chơi thứ 2

• Cũng như trên mỗi người chơi

đều có 2 chiến lược thuần túy

và chiến lược hỗn hợp của:

X(1-r) ?,z’ ?,w’

Trang 18

Ta có các đồ thị biểu diễn các TH trên như sau:

r

q

r

q r

Trang 19

Biện luận điểm cân bằng Nash

• Ta cho bất kỳ 1 trong 4 hàm phản ứng tốt nhất của đấu thủ 1( r*(q)) kết hợp với bất kỳ 1 trong 4 hàm phản ứng tốt

nhất của đấu thủ 2 ( q*(r)).

• Ta thấy cặp phản ứng tốt nhất này cho ít nhất 1 giao

điểm, do đó trò chơi có ít nhất 1 cân bằng Nash.

• Kiểm tra 16 cặp phản ứng có thể có ,ta có thể phân ra

làm các TH để xét cân bằng Nash:

1 Một cân bằng Nash thuần túy:

Điểm NE

Trang 20

2 Một cân bằng Nash hỗn hợp (NE)

3 Hai NE thuần, một NE hỗn hợp

1 điểm NE hỗn hợp

20

Trang 22

4- Vài mẩu truyện vui-thảo luận

• 1-Đi thẳng vào tù (Câu chuyện 2 người tù)

Người nhạc trưởng dàn giao hưởng ở Liên Xô (vào thời kỳ Stalin) đang trên tàu đến nơi biểu diễn tiếp theo của mình và ông ta chăm chú nhìn vào bản nhạc mà ông ta sẽ chỉ huy dàn nhạc biểu diễn vào tối hôm đó Hai sĩ quan KGB nhìn thấy ông ta đang đọc và họ cho rằng các nốt nhạc mang một mật mã bí mật nào đó nên đã bắt ông

ta như một gián điệp Ông ta cố phản đối, nói rằng bản nhạc đó là bản concerto dành cho violon của Traicôpxki, nhưng vô ích Vào

ngày thứ hai trong tù, người thẩm vấn với một vẻ tự mãn bước vào

và nói với ông ta: “Tốt nhất là hãy khai tất cả đi Chúng ta đã bắt

được bạn của mày, Traicôpxki, và hắn ta đã khai rồi đó”

• 2- Thảo luận tình huống : Đỏ tôi thắng, đen anh thua

22

Trang 23

Vào cuối khóa học, Barry đã kỷ niệm ngày ra trường tại một trong các dạ tiệc khiêu vũ của trường tổng hợp Cambridge Một phần của buổi dạ tiệc là casinô Mỗi người chơi được tặng cho một số thẻ chơi tương đương 20 đôla và cuối buổi người nào tích lũy được một số lượng thẻ có giá trị lớn nhất sẽ được tặng vé miễn phí dạ tiệc năm sau Khi đến vòng quay cuối cùng của bàn rulô, một sự may mắn tình cờ đã khiến Barry dẫn đầu với số thẻ có tổng trị giá 700 đôla, người tiếp theo là một phụ

nữ Anh với 300 đôla Số còn lại gần như đã bỏ cuộc Ngay trước khi vòng quay cuối bắt đầu, người phụ nữ Anh nọ đề nghị chia đôi chiếc vé dạ tiệc năm sau nhưng

Barry đã từ chối Với việc đang dẫn đầu vói khoảng cách bỏ xa như vậy, chẳng có lý

do gì để phải chia đôi giải thưởng

Để hiểu rõ hơn về bước chiến lược tiếp theo, chúng tôi sẽ giải thích qua về quy tắc chơi trò quay rulô Chiến thắng trong trò chơi này phụ thuộc vào vị trí quả bóng sẽ lăn vào khi vòng bánh xe tròn dừng lại Thường sẽ có các số từ 0 đến 36 trên vòng tròn quay Khi quả bóng lăn vào số (0), nhà cái sẽ thắng Cách đặt cược an toàn nhất trong trò rulô là đánh cược vào số chẵn hoặc lẻ (được biểu thị bằng màu đen hoặc đỏ) Đánh cược kiểu này sẽ thu về một số tiến chẵn: cứ 1 đôla đánh cược

thắng sẽ thu về 2 đô la trong khi cơ hội để thắng là 18/37 Ngay cả khi đánh cược toàn bộ số tiền mình có thì người phụ nữ cũng vẫn không thể thắng theo cách này;

do vậy cô ta buộc phải chơi một trò chơi rủi ro hơn là đặt cược toàn bộ bộ số tiền của mình vào các bội số của 3 Chơi theo cách này, người phụ nữ sẽ nhận được tiền gấp ba nếu thắng (số tiền 300 đô la sẽ trở thành 900 đô la) Tuy nhiên cơ hội thắng chỉ còn 12/37 Người phụ nữ đã đặt tiền của mình lên bàn như vậy, vào thời

Trang 24

Bài thuyết trình của nhóm đến

đây là kết thúc!

Cám ơn mọi người đã lắng nghe!

24

Ngày đăng: 03/04/2015, 16:53

TỪ KHÓA LIÊN QUAN

w