BÀI TẬP CHƯƠNG 4LMS1.Ba người ra quyết định đang xem xét lợi ích theo bảng quyết định sau (đơn vị: USD)S1S2S3D1205020D280100100Các xác suất của sự không khác biệt được cho trong bảng sau:Giá trị điều kiệnNgười ANgười BNgười C1001.001.001.00800.950.700.90500.900.600.75200.700.450.60200.500.250.401000.000.000.00a)Hãy vẽ hàm lợi ích theo tiền tệ cho mỗi người ra quyết định.U(100) = 10, U(100) = 0Bảng lợi ích người A:S1S2S3D1795D29,5100Bảng lợi ích người B:S1S2S3D14,562,5D27100Bảng lợi ích người C:S1S2S3D167,54D29100b)Hãy phân loại mỗi người ra quyết định theo né tránh rủi ro, chấp nhận rủi ro hay trung dung.A né tránh rủi ro, B chấp nhận rủi ro, C trung dung.2.Trong vấn đề trên, nếu P(s1) = 0.25, P(s2) = 0.50 và P(s3) = 0.25, hãy xác định quyết định tối ưu theo lợi ích cho mỗi người ra quyết định.Bảng lợi ích người A:S1S2S3EU: lợi ích kỳ vọngD17957.5D29,51007,375XS0.250.50.25A chọn D1Bảng lợi ích người B:S1S2S3EUD14,562,54,75D271006.75XS0.250.50.25B chọn D2Bảng lợi ích người C:S1S2S3EUD167,546.25D291007.25XS0.250.50.25C chọn D23.Bánh xe roulette Las Vegas có 38 giá trị số khác nhau. Nếu một cá nhân đặt cược và thắng, tỷ lệ giá trị là 35:1.a)Hãy lập bảng quyết định cho 10 đặt cược cho một số với phương án đặt cược và không đặt cược.Thắng ThuaEMVĐặt cược350100,53Không đặt cược000Xác suất1383738b)Quyết định được đề nghị khi sử dụng cách tiếp cận giá trị kỳ vọng là gì?Không đặt cượcc)Sòng bạc Las Vegas thích khách hàng chấp nhận rủi ro hay né tránh rủi ro? Hãy giải thích.Sòng bạc Las Vegas thích khách hàng chấp nhận rủi ro vì điều đó khiến họ tham giá đặt cược nên sòng bặc sẽ có lợid)Khoảng các giá trị lợi ích mà người ra quyết định gán cho giá trị 0 để có sự xem xét lợi ích kỳ vọng cho quyết định đặt 10 cá cược?Gọi giá trị lợi ích của 0 là x (x > 0)U(350) = 10, U(10) = 0EU(không cược) = x, EU(cược) = 1038Để có sự xem xét lợi ích kỳ vọng cho quyết định đặt 10 cá cượcEU(không cược) < EU(cược) 1038 > x 0 < x < 1038 4.Một sản phẩm mới có các dự trù lợi nhuận và xác suất tương ứng như sau:Lợi nhuận Xác suất1500000.101000000.25500000.2000.15500000.201000000.10EMV(đưa) 30000a)Sử dụng cách tiếp cận giá trị kỳ vọng để quyết định có đưa sản phẩm ra thị trường hay không.EMV(không đưa) = 0 < EMV(đưa) nên đưa sp ra thị trườngb)Giả sử các xác suất không khác biệt sau được đề xuất. Các lợi ích có phản ánh thái độ của người chấp nhận rủi ro hay né tránh rủi ro hay không?Lợi nhuận Xác suất không khác biệt1000000.95500000.7000.50500000.25U(150000) = 10, U(100000) = 0Thị trường1Thị trường2Thị trường3Thị trường4Thị trường5Thị trường6EUĐưa109.5752,506,025Không đưa5555555XS0,10,250,20,150,20,1 Các lợi ích có phản ánh thái độ của người chấp nhận rủi ro hay né tránh rủi roc)Sử dụng lợi ích kỳ vọng để ra quyết định.Vẫn chọn đưa sp ra thị trường5.Quản lý một kênh truyền hình đang xem xét hai lựa chọn cho khung giờ 8giờ 9 giờ tối thứ hai: một hài kịch hay chương trình thực tế. Tỷ lệ khán giả ước tính phụ thuộc vào mức độ chấp nhận chương trình cho trong bảng sauMức độ chấp nhậnHài kịchChương trình thực tếCao30%40%Trung bình25%20%Thấp20%15%Xác suất liên quan đến mức độ chấp nhận chương trình được cho trong bảng sauMức độ chấp nhậnHài kịchChương trình thực tếCao0.300.30Trung bình0.600.40Thấp0.100.30a)Sử dụng cách tiếp cận giá trị kỳ vọng, chương trình nào sẽ được chọn?EMV(hài kịch) = 26%, EMV(chtrinh thực tế) = 24,5% chọn hài kịchb)Đối với phân tích lợi ích, sự may rủi thích hợp là gì?Định nghĩa sự may rủi. Kết quả tốt nhất sẽ có xác suất p, kết quả tệ nhất sẽ có xác suất (1 p)Kênh có tỷ lệ khán giả 40% sẽ có xác suất p, Kênh có tỷ lệ khán giả 15% sẽ có xác suất (1 p)c)Dựa trên sự may rủi ở b), nhà quản lý cho các xác suất không khác biệt trong bảng sau. Dựa trên đo lường lợi ích, chương trình nào sẽ được đề nghị? Nhà quản lý là người chấp nhận hay né tránh rủi ro?Phần trăm khán giả Xác suất không khác biệt30%0.4025%0.3020%0.10U(40%) = 10, U(15%) = 0Bảng lợi íchCao Trung bình ThấpEUHài kịch4313.1Chương trình thực tế10103.4XS hài kịch0.30.60.1XS chương trình thực tế0.30.40.3chương trình thực tế sẽ được đề nghị chấp nhận rủi ro6.Hai đối thủ, Đỏ và Xanh, mỗi người phải quyết định tấn công hay phòng thủ. Các quyết định này được thực hiện mà không biết quyết định của đối thủ. Bảng quyết định sau cho thấy việc được hay mất đối với quân Đỏ (tức mất hay được đối với quân Xanh)Quân XanhQuân ĐỏTấn côngPhòng thủMinTấn công305030Phòng thủ4000Max4050p1pa)Chiến lược hỗn hợp tối ưu đối với quân Đỏ là gì? chiến lược maximin, 30P+50(1P)=40PGọi p = xác suất quân đỏ chọn tấn công (1p) = xác suất quân đỏ chọn phòng thủNếu quân xanh chọn tấn công: EV = 30p + 40(1p)Nếu quân xanh chọn phòng thủ: EV = 50PĐể tìm xác suất tối ưu cho quân đỏ, ta cho hai giá trị kỳ vọng bằng nhau để tìm giá trị p30P+40(1P)=50P p = 23 EV = 1003b)Chiến lược hỗn hợp tối ưu đối với quân Xanh là gì? chiến lượt minimax, 30Q+40(1Q)=50QGọi p = xác suất quân xanh chọn tấn công (1p) = xác suất quân xanh chọn phòng thủNếu quân đỏ chọn tấn công EV = 30p + 50(1p)Nếu quân đỏ chọn phòng thủ EV = 40pĐể tìm xác suất tối ưu cho quân xanh ta cho hai giá trị kỳ vọng bằng nhau để tìm giá trị p30p + 50(1p) = 40p p = 56 EV = 10037.Hai người chơi với trò chơi tổng bằng 0 có chiến lược hỗn hợp như sauNgười chơi BNgười chơi AB1B2B3A1012A2543A3234a)Các chiến lược nào là bị chi phối để giảm trò chơi xuống trò chơi 2x2?Người chơi AB2B3MinA1121A2433Max42b)Hãy xác định giải pháp chiến lược tối ưu.Gọi p là xs của người A lựa chọn chiến lược A1 (1p) là xs của người A lựa chọn chiến lược A2Nếu người chơi B chọn B2: EV = p + 4(1p)Nếu người chơi B chọn B3: EV = 2p – 3(1p)Để tìm xs tối ưu cho người chơi A, ta cho hai giá trị kỳ vọng bằng nhau để tìm giá trị p:p + 4(1p) = 2p – 3(1p) p = 0.7 Người chơi A sẽ chọn chiến lược A1 với xác suất: p = 0.7__________________ chiến lược A2 với xác suất: 1p = 0.3TRONG BÀI THI THAY p BẰNG Q VÀ LÀM TƯƠNG TỰ ĐỐI VỚI Bc)Giá trị của trò chơi là bao nhiêu?Giá trị của trò chơi: Đối với người chơi A: EV = p + 4(1p) = 0.5_______________ Đối với người chơi B: EV = theo q8.Trong một trò chơi, người chơi A và B có các thẻ 1 và 5. Mỗi người chơi chọn một thẻ mà không biết sự lựa chọn của người kia. Cả hai sẽ đồng thời đưa ra các thẻ đã lựa chọn. Nếu hai thẻ không giống nhau, người chơi A sẽ thắng và ngược lại.a)Hãy xây dựng bảng lý thuyết trò chơi cho trò chơi này. Các giá trị này thể hiện sự được (hay mất) đối với người chơi A.Người chơi AB1B5MinA1151A5155Max15b)Đây có phải là chiến lược thuần túy? Giải thích. Đây không phải là chiến lược thuần túy vì maximin không bằng minimaxc)Hãy xác định các chiến lược tối ưu và giá trị của trò chơi. Có phải trò chơi có ưu thế của một người chơi đối với người kia?Gọi p là xs của người A lựa chọn chiến lược A1 (1p) là xs của người A lựa chọn chiến lược A5Nếu người chơi B chọn B1: EV = p + (1p)Nếu người chơi B chọn B5: EV = 5p – 5(1p)Để tìm xs tối ưu cho người chơi A, ta cho hai giá trị kỳ vọng bằng nhau để tìm giá trị p:p + (1p) = 5p – 5(1p) p = 0.5Người chơi A sẽ chọn chiến lược A1 với xác suất: p = 0.5__________________ chiến lược A5 với xác suất: 1p = 0.5Gọi q là xs của người B lựa chọn chiến lược B1 (1q) là xs của người B lựa chọn chiến lược B5Nếu người chơi A chọn A1: EV = q + 5(1q)Nếu người chơi A chọn A5: EV = q – 5(1q)Để tìm xs tối ưu cho người chơi A, ta cho hai giá trị kỳ vọng bằng nhau để tìm giá trị p:q + 5(1q) = q – 5(1q) q = 56Người chơi A sẽ chọn chiến lược A1 với xác suất: q = 56__________________ chiến lược A5 với xác suất: 1q = 16Giá trị của trò chơi: Đối với người chơi A: EVa = p + (1p) = 0_______________: Đối với người chơi B: EVb = q + 5(1q) = 0Vì giá trị trò chơi đối với hai người chơi A và B là bằng nhau (=0) nên trò chơi không có ưu thế của một người chơi đối với người kiad)Giả sử người chơi B quyết định thay đổi chiến lược tối ưu và chơi mỗi thẻ 50% thời gian. Người chơi A sẽ làm gì để cài thiện chiến thắng? Hãy nhận xét tại sao việc theo đuổi chiến lược tối ưu là quan trọng.TH1: A chỉ chơi thẻ 5 Vì B chơi tuần tự thẻ 1 và 5 nên xác suất thắng thua của AB là như nhau, tức là thắng thua sẽ tuần tự đối với mỗi người chơi, nếu A thua thì A sẽ mất 5 nhưng nếu thắng A chỉ nhận được 1A sẽ rất bất lợi nếu chọn chiến lược nàyTH2: A chỉ chơi thẻ 1Tương tự TH1 nhưng nếu A thắng thì A sẽ nhận được 5, nếu thua A chỉ mất 1A sẽ có lợi khi chọn chiến lược nàyVậy A chơi 5 sẽ gây ra các bất lợi. Nếu muốn tối đa hóa lợi ích thì A cũng chơi lần lượt mỗi thẻ 50% thời gian nhưng thứ tự đưa thẻ ngược lại với B để đảm bảo các thẻ đưa ra là luôn khác nhau. Tuy nhiên trong thực tế không dễ để xác định xác suất đưa thẻ của đối thủ nên việc theo đuổi chiến lược tối ưu là quan trọng.9.Hai công ty cạnh tranh nhau thị phần nước ngọt. Mỗi bên làm việc với công ty quảng cáo để phát triển các chiến lược quảng cáo khác nhau cho những năm sắp tới. Bảng sau cho thấy những thay đổi thị phần dự tính của công ty A khi hai công ty lựa chọn các chiến lược quảng cáo. Chiến lược tối ưu cho mỗi công ty là gì? Giá trị của trò chơi là bao nhiêu?Công ty BCông ty AB1B2B3B4A13024A22210A34256A42610Công ty AB1B2MinA3422A4262Max4610.Khi trận đấu kết thúc với tỉ số hòa, việc đá luân lưu được tiến hành với 5 cầu thủ của mỗi đội. Khi đá luân lưu, người đá và thủ thành đổng thời xác định hướng để di chuyển: bên trái, bên phải và ở giữa. Các chiến lược này tạo nên bảng lý thuyết trò chơi trong đó giá trị đầu tiên là xác suất của người đá ghi bàn và giá trị thứ hai là xác suất của thủ thành cản phá thành côngThủ thànhNgười đáTráiGiữaPhảiTrái0.35; 0.650.90; 0.100.85; 0.15Giữa0.30; 0.700.25; 0.750.45; 0.55Phải0.95; 0.050.90; 0.100.30; 0.70 Đây là ví dụ của trò chơi tổng là hằng số khi mỗi cặp giá trị trong bảng có tổng bằng 1. Nó được phân tích giống như trò chơi có tổng bằng 0.a)Các chiến lược nào là bị chi phối?Thủ thànhNgười đáTráiPhảiTrái0.35; 0.650.85; 0.15Phải0.95; 0.050.30; 0.70b)Giải pháp cho trò chơi đối với người đá và thủ thành là gì?Gọi p là xác suất thủ thành chọn bên trái, (1p) là xác suất thủ thành chọn bên phảiNếu người đá chọn bên trái: EV = 0.65p + 0.15(1p)Nếu người đá chọn bên phải: EV = 0.05p + 0.7(1p)Để xác suất tối ưu cho thủ thành ta cho hai giá trị kỳ vọng bằng nhau:0.65p + 0.15(1p) = 0.05p + 0.7(1p) p = 1123 EV = 0.39Gọi q là xs của người đá chọn bên trái, (1p) là xs người đá chọn bên phảiNếu thủ thành chọn bên trái: EV = 0.35p + 0.95(1p)Nếu thủ thành chọn bên phải: EV = 0.85p + 0.3(1p) Để xác suất tối ưu cho thủ thành ta cho hai giá trị kỳ vọng bằng nhau:0.35p + 0.95(1p) = 0.85p + 0.3 (1p) p = 1323 EV = 0.61 c)Xác suất ghi bàn kỳ vọng là bao nhiêu?Chiến lược thuần tuý tối ưu: maximin=minimax
BÀI TẬP CHƯƠNG 4-LMS Ba người định xem xét lợi ích theo bảng định sau (đơn vị: USD) D1 D2 S1 20 80 S2 50 100 S3 -20 -100 Các xác suất không khác biệt cho bảng sau: Giá trị điều kiện 100 80 50 20 -20 -100 Người A 1.00 0.95 0.90 0.70 0.50 0.00 Người B 1.00 0.70 0.60 0.45 0.25 0.00 a) Hãy vẽ hàm lợi ích theo tiền tệ cho người định U(100) = 10, U(-100) = Bảng lợi ích người A: S1 S2 D1 D2 9,5 10 Người C 1.00 0.90 0.75 0.60 0.40 0.00 S3 Bảng lợi ích người B: D1 D2 S1 4,5 S2 10 S3 2,5 S1 S2 7,5 10 S3 Bảng lợi ích người C: D1 D2 b) Hãy phân loại người định theo né tránh rủi ro, chấp nhận rủi ro hay trung dung A né tránh rủi ro, B chấp nhận rủi ro, C trung dung Trong vấn đề trên, P(s1) = 0.25, P(s2) = 0.50 P(s3) = 0.25, xác định định tối ưu theo lợi ích cho người định Bảng lợi ích người A: S1 S2 S3 EU: lợi ích kỳ vọng D1 7.5 D2 9,5 10 7,375 XS 0.25 0.5 0.25 A chọn D1 Bảng lợi ích người B: S1 S2 S3 EU D1 4,5 2,5 4,75 D2 10 6.75 XS 0.25 0.5 0.25 B chọn D2 Bảng lợi ích người C: D1 D2 XS C chọn D2 S1 0.25 S2 7,5 10 0.5 S3 0.25 EU 6.25 7.25 Bánh xe roulette Las Vegas có 38 giá trị số khác Nếu cá nhân đặt cược thắng, tỷ lệ giá trị 35:1 a) Hãy lập bảng định cho $10 đặt cược cho số với phương án đặt cược không đặt cược Đặt cược Không đặt cược Xác suất Thắng 350 1/38 Thua -10 37/38 EMV -0,53 b) Quyết định đề nghị sử dụng cách tiếp cận giá trị kỳ vọng gì? Khơng đặt cược c) Sịng bạc Las Vegas thích khách hàng chấp nhận rủi ro hay né tránh rủi ro? Hãy giải thích Sịng bạc Las Vegas thích khách hàng chấp nhận rủi ro điều khiến họ tham giá đặt cược nên sịng bặc có lợi d) Khoảng giá trị lợi ích mà người định gán cho giá trị $0 để có xem xét lợi ích kỳ vọng cho định đặt $10 cá cược? Gọi giá trị lợi ích $0 x (x > 0) U(350) = 10, U(-10) = EU(không cược) = x, EU(cược) = 10/38 Để có xem xét lợi ích kỳ vọng cho định đặt $10 cá cược EU(không cược) < EU(cược) 10/38 > x < x < 10/38 Một sản phẩm có dự trù lợi nhuận xác suất tương ứng sau: Lợi nhuận Xác suất $150000 0.10 $100000 0.25 $50000 0.20 $0 0.15 -$50000 0.20 -$100000 0.10 EMV(đưa) $30000 a) Sử dụng cách tiếp cận giá trị kỳ vọng để định có đưa sản phẩm thị trường hay không EMV(không đưa) = < EMV(đưa) nên đưa sp thị trường b) Giả sử xác suất không khác biệt sau đề xuất Các lợi ích có phản ánh thái độ người chấp nhận rủi ro hay né tránh rủi ro hay không? Lợi nhuận Xác suất không khác biệt $100000 0.95 $50000 0.70 $0 0.50 -$50000 0.25 U(150000) = 10, U(-100000) = Đưa Không đưa XS Thị trường1 10 0,1 Thị trường2 9.5 0,25 Thị trường3 0,2 Thị trường4 5 0,15 Thị trường5 2,5 0,2 Thị trường6 0,1 EU 6,025 Các lợi ích có phản ánh thái độ người chấp nhận rủi ro hay né tránh rủi ro c) Sử dụng lợi ích kỳ vọng để định Vẫn chọn đưa sp thị trường Quản lý kênh truyền hình xem xét hai lựa chọn cho khung 8giờ- tối thứ hai: hài kịch hay chương trình thực tế Tỷ lệ khán giả ước tính phụ thuộc vào mức độ chấp nhận chương trình cho bảng sau Mức độ chấp nhận Cao Trung bình Thấp Hài kịch 30% 25% 20% Chương trình thực tế 40% 20% 15% Xác suất liên quan đến mức độ chấp nhận chương trình cho bảng sau Mức độ chấp nhận Hài kịch Chương trình thực tế Cao 0.30 0.30 Trung bình 0.60 0.40 Thấp 0.10 0.30 a) Sử dụng cách tiếp cận giá trị kỳ vọng, chương trình chọn? EMV(hài kịch) = 26%, EMV(chtrinh thực tế) = 24,5% chọn hài kịch b) Đối với phân tích lợi ích, may rủi thích hợp gì? Định nghĩa may rủi Kết tốt có xác suất p, kết tệ có xác suất (1 - p) Kênh có tỷ lệ khán giả 40% có xác suất p, Kênh có tỷ lệ khán giả 15% có xác suất (1 - p) c) Dựa may rủi b), nhà quản lý cho xác suất không khác biệt bảng sau Dựa đo lường lợi ích, chương trình đề nghị? Nhà quản lý người chấp nhận hay né tránh rủi ro? Phần trăm khán giả Xác suất không khác biệt 30% 0.40 25% 0.30 20% 0.10 U(40%) = 10, U(15%) = Bảng lợi ích Cao Trung bình Thấp EU Hài kịch 3.1 Chương trình thực tế 10 3.4 XS hài kịch 0.3 0.6 0.1 XS chương trình thực tế 0.3 0.4 0.3 chương trình thực tế đề nghị chấp nhận rủi ro Hai đối thủ, Đỏ Xanh, người phải định công hay phòng thủ Các định thực mà định đối thủ Bảng định sau cho thấy việc hay quân Đỏ (tức hay quân Xanh) Quân Xanh Qn Đỏ Tấn cơng Phịng thủ Min Tấn cơng 30 50 30 Phòng thủ 40 0 Max 40 50 p 1-p a) Chiến lược hỗn hợp tối ưu quân Đỏ gì? chiến lược maximin, 30P+50(1-P)=40P Gọi p = xác suất quân đỏ chọn cơng (1-p) = xác suất qn đỏ chọn phịng thủ Nếu quân xanh chọn công: EV = 30p + 40(1-p) Nếu quân xanh chọn phòng thủ: EV = 50P Để tìm xác suất tối ưu cho quân đỏ, ta cho hai giá trị kỳ vọng để tìm giá trị p 30P+40(1-P)=50P p = 2/3 EV = 100/3 b) Chiến lược hỗn hợp tối ưu quân Xanh gì? chiến lượt minimax, 30Q+40(1-Q)=50Q Gọi p = xác suất quân xanh chọn công (1-p) = xác suất quân xanh chọn phịng thủ Nếu qn đỏ chọn cơng EV = 30p + 50(1-p) Nếu quân đỏ chọn phòng thủ EV = 40p Để tìm xác suất tối ưu cho quân xanh ta cho hai giá trị kỳ vọng để tìm giá trị p 30p + 50(1-p) = 40p p = 5/6 EV = 100/3 Hai người chơi với trị chơi tổng có chiến lược hỗn hợp sau Người chơi B Người chơi A B1 B2 A1 -1 A2 A3 a) Các chiến lược bị chi phối để giảm trò chơi xuống trò chơi 2x2? Người chơi A A1 A2 Max B2 -1 4 B3 -3 B3 -3 -4 Min -1 -3 b) Hãy xác định giải pháp chiến lược tối ưu Gọi p xs người A lựa chọn chiến lược A1 (1-p) xs người A lựa chọn chiến lược A2 Nếu người chơi B chọn B2: EV = -p + 4(1-p) Nếu người chơi B chọn B3: EV = 2p – 3(1-p) Để tìm xs tối ưu cho người chơi A, ta cho hai giá trị kỳ vọng để tìm giá trị p: -p + 4(1-p) = 2p – 3(1-p) p = 0.7 Người chơi A chọn chiến lược A1 với xác suất: p = 0.7 chiến lược A2 với xác suất: 1-p = 0.3 TRONG BÀI THI THAY p BẰNG Q VÀ LÀM TƯƠNG TỰ ĐỐI VỚI B c) Giá trị trò chơi bao nhiêu? Giá trị trò chơi: Đối với người chơi A: EV = -p + 4(1-p) = 0.5 _ Đối với người chơi B: EV = theo q Trong trò chơi, người chơi A B có thẻ $1 $5 Mỗi người chơi chọn thẻ mà lựa chọn người Cả hai đồng thời đưa thẻ lựa chọn Nếu hai thẻ không giống nhau, người chơi A thắng ngược lại a) Hãy xây dựng bảng lý thuyết trò chơi cho trò chơi Các giá trị thể (hay mất) người chơi A Người chơi A A1 A5 Max B1 -1 1 B5 -5 Min -1 -5 b) Đây có phải chiến lược túy? Giải thích Đây khơng phải chiến lược túy maximin khơng minimax c) Hãy xác định chiến lược tối ưu giá trị trị chơi Có phải trị chơi có ưu người chơi người kia? Gọi p xs người A lựa chọn chiến lược A1 (1-p) xs người A lựa chọn chiến lược A5 Nếu người chơi B chọn B1: EV = -p + (1-p) Nếu người chơi B chọn B5: EV = 5p – 5(1-p) Để tìm xs tối ưu cho người chơi A, ta cho hai giá trị kỳ vọng để tìm giá trị p: -p + (1-p) = 5p – 5(1-p) p = 0.5 Người chơi A chọn chiến lược A1 với xác suất: p = 0.5 chiến lược A5 với xác suất: 1-p = 0.5 Gọi q xs người B lựa chọn chiến lược B1 (1-q) xs người B lựa chọn chiến lược B5 Nếu người chơi A chọn A1: EV = -q + 5(1-q) Nếu người chơi A chọn A5: EV = q – 5(1-q) Để tìm xs tối ưu cho người chơi A, ta cho hai giá trị kỳ vọng để tìm giá trị p: -q + 5(1-q) = q – 5(1-q) q = 5/6 Người chơi A chọn chiến lược A1 với xác suất: q = 5/6 chiến lược A5 với xác suất: 1-q = 1/6 Giá trị trò chơi: Đối với người chơi A: EVa = -p + (1-p) = _: Đối với người chơi B: EVb = -q + 5(1-q) = Vì giá trị trị chơi hai người chơi A B (=0) nên trò chơi khơng có ưu người chơi người d) Giả sử người chơi B định thay đổi chiến lược tối ưu chơi thẻ 50% thời gian Người chơi A làm để cài thiện chiến thắng? Hãy nhận xét việc theo đuổi chiến lược tối ưu quan trọng TH1: A chơi thẻ $5 Vì B chơi thẻ $1 $5 nên xác suất thắng thua A&B nhau, tức thắng thua người chơi, A thua A $5 thắng A nhận $1 A bất lợi chọn chiến lược TH2: A chơi thẻ $1 Tương tự TH1 A thắng A nhận $5, thua A $1 A có lợi chọn chiến lược Vậy A chơi $5 gây bất lợi Nếu muốn tối đa hóa lợi ích A chơi thẻ 50% thời gian thứ tự đưa thẻ ngược lại với B để đảm bảo thẻ đưa khác Tuy nhiên thực tế không dễ để xác định xác suất đưa thẻ đối thủ nên việc theo đuổi chiến lược tối ưu quan trọng Hai công ty cạnh tranh thị phần nước Mỗi bên làm việc với công ty quảng cáo để phát triển chiến lược quảng cáo khác cho năm tới Bảng sau cho thấy thay đổi thị phần dự tính công ty A hai công ty lựa chọn chiến lược quảng cáo Chiến lược tối ưu cho cơng ty gì? Giá trị trị chơi bao nhiêu? Công ty B Công ty A B1 B2 B3 B4 A1 A2 -2 A3 A4 -2 -1 Công ty A B1 B2 Min A3 2 A4 -2 -2 Max 10 Khi trận đấu kết thúc với tỉ số hòa, việc đá luân lưu tiến hành với cầu thủ đội Khi đá luân lưu, người đá thủ thành thời xác định hướng để di chuyển: bên trái, bên phải Các chiến lược tạo nên bảng lý thuyết trò chơi giá trị xác suất người đá ghi bàn giá trị thứ hai xác suất thủ thành cản phá thành công Thủ thành Người đá Trái Giữa Phải Trái Giữa Phải 0.35; 0.65 0.30; 0.70 0.95; 0.05 0.90; 0.10 0.25; 0.75 0.90; 0.10 0.85; 0.15 0.45; 0.55 0.30; 0.70 Đây ví dụ trò chơi tổng số cặp giá trị bảng có tổng Nó phân tích giống trị chơi có tổng a) Các chiến lược bị chi phối? Thủ thành Người đá Trái Phải Trái 0.35; 0.65 0.85; 0.15 Phải 0.95; 0.05 0.30; 0.70 b) Giải pháp cho trò chơi người đá thủ thành gì? Gọi p xác suất thủ thành chọn bên trái, (1-p) xác suất thủ thành chọn bên phải Nếu người đá chọn bên trái: EV = 0.65p + 0.15(1-p) Nếu người đá chọn bên phải: EV = 0.05p + 0.7(1-p) Để xác suất tối ưu cho thủ thành ta cho hai giá trị kỳ vọng nhau: 0.65p + 0.15(1-p) = 0.05p + 0.7(1-p) p = 11/23 EV = 0.39 Gọi q xs người đá chọn bên trái, (1-p) xs người đá chọn bên phải Nếu thủ thành chọn bên trái: EV = 0.35p + 0.95(1-p) Nếu thủ thành chọn bên phải: EV = 0.85p + 0.3(1-p) Để xác suất tối ưu cho thủ thành ta cho hai giá trị kỳ vọng nhau: 0.35p + 0.95(1-p) = 0.85p + 0.3 (1-p) p = 13/23 EV = 0.61 c) Xác suất ghi bàn kỳ vọng bao nhiêu? Chiến lược tuý tối ưu: maximin=minimax ... = Bảng lợi ích Cao Trung bình Thấp EU Hài kịch 3.1 Chương trình thực tế 10 3 .4 XS hài kịch 0.3 0.6 0.1 XS chương trình thực tế 0.3 0 .4 0.3 chương trình thực tế đề nghị chấp nhận rủi ro Hai... độ chấp nhận chương trình cho bảng sau Mức độ chấp nhận Hài kịch Chương trình thực tế Cao 0.30 0.30 Trung bình 0.60 0 .40 Thấp 0.10 0.30 a) Sử dụng cách tiếp cận giá trị kỳ vọng, chương trình... kịch hay chương trình thực tế Tỷ lệ khán giả ước tính phụ thuộc vào mức độ chấp nhận chương trình cho bảng sau Mức độ chấp nhận Cao Trung bình Thấp Hài kịch 30% 25% 20% Chương trình thực tế 40 % 20%