Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 88 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
88
Dung lượng
3,47 MB
Nội dung
Báo cáo Tốn rời rạc (P2) Lý thuyết trị chơi thực gì? Lý thuyết trị chơi biết ngày đời sở thích chơi poker người Nhưng người đàn ơng bình thường mà bắt gặp ngày đường phố đâu Ông nhà tốn học, vật lý học khoa học máy tính có tên John von Neumann Mục tiêu ơng đương nhiên khác so với người chơi poker thông thường muốn chơi giỏi Qua báo Forbes, ơng quan tâm tới poker ơng coi đường để phát triển tốn học vào sống Ơng muốn có lý thuyết chung áp dụng cho ngoại giao, tình u, tiến hóa vạn vật hay chiến lược kinh doanh Lý thuyết ông gọi lý thuyết trị chơi Thơng qua hợp tác với nhà kinh tế học Oskar Morgenstern sách có tên Lý thuyết trò chơi hành vi kinh tế vào năm 1944, ông tiến gần tới mục tiêu Trong sách này, hai người họ khẳng định tình hình kinh tế định nghĩa kết trò chơi hai nhiều người chơi Trị chơi theo lý thuyết trị chơi gì? Giáo sử kinh tế Yale Ben Polak lưu ý trị chơi có thành phần bản: người chơi, chiến thuật phần thưởng có trị chơi Tuy nhiên, khơng phải lúc người chơi có kiến thức hồn hảo yếu tố trò chơi Chiến lược hành động mà người chơi thực trò chơi Chiến lược trung tâm lý thuyết trò chơi Forbes mơ tả lý thuyết trình bày Lý thuyết trò chơi hành vi kinh tế "mơ hình tốn học tương tác chiến lược đối thủ hợp lý, hành động bên phụ thuộc vào bên làm" Khái niệm phụ thuộc lẫn chiến lược- hành động người chơi ảnh hưởng đến hành động người chơi khác - khía cạnh quan trọng phiên lý thuyết trờ chơi von Neumann phù hợp ngày Phần thưởng, mô tả "kết chiến lược người chơi áp dụng" Phần thưởng loạt thứ tùy thuộc vào trị chơi Đó lợi nhuận, hiệp ước hịa bình, mua xe Một phiên lý thuyết trò chơi Von Neumann tập trung vào việc tìm chiến lược tối ưu cho loại trò chơi gọi trị chơi có tổng khơng Trong trị chơi có tổng khơng, người chơi thua người chơi khác lợi Ở có lưu ý người chơi tăng giảm tài ngun có sẵn Các nhà phê bình lưu ý sống khơng đơn giản trị chơi có tổng khơng Có nhiều kịch trị chơi phức tạp giới thực Lý thuyết trò chơi phát triển để phân tích nhiều loại trị chơi trị chơi tổ hợp trị chơi tích phân, nhiên có thời gian để xét trị chơi thơi Một ví dụ kinh đển trò chơi thường nghiên cứu lý thuyết trò chơi gọi "Song đề tù nhân" (The Prisoner's Dilemma) Các phiên khác trò chơi có sẵn Internet Một số có giả thiết sau:"Có hai tù nhân, Đăng Huy, họ vừa bị bắt cướp ngân hàng, nhiên cảnh sát khơng có đủ chứng để kết tội họ, biết họ phạm tội Những cách sát đưa Đăng Huy vào phòng thẩm vấn riêng biệt đưa cho tên lựa chọn: Nếu hai thú nhận hai bị tuyên án 10 năm tù; Nếu tên thú tội tên không thú tôi, tên thú nhận tự tên lại phải ngồi tù 20 năm Nếu hai khơng thú nhận hai phải nhận năm tù cho tội danh khác mà hai bị truy nã Có thể nhận thấy "Song đề tù nhân" chứa đựng yếu tô trò chơi đề cập đến "Lý thuyết trò chơi": Hai người chơi Đăng Huy Chiến lược có sẵn thú tội khơng thú tội Phần thưởng trò chơi bao gồm từ vào tù thụ án 5, 10 20 năm tù Và để so sánh kết cách dễ dàng chúng đưa vào ma trận: Các chiến lược Đăng liệt kê theo hàng trục x, phần thưởng anh liệt kê trước Phần thưởng Huy liệt kê sau chiến lược nằm cột trục y Ma trận gọi "dạng chuẩn tắc" lý thuyết trị chơi Các chuyển động diễn đồng thời, có nghĩa không người chơi biết định người định đưa lúc (như ví dụ hai tù nhân phòng riêng biệt khơng đưa ngồi hai đưa định Một giải pháp phổ biến cho trò chơi đồng thời gọi "chiến lược thống trị" Được định nghĩa "chiến lược mang lại lợi nhuận tốt cho dù người chơi khác chọn Đăng khơng biết liệu Huy có thú nhận hay khơng Khi xem xét lựa chọn Với lựa chọn nêu đương nhiên chiến lược tốt cho Huy thú nhận dẫn đến việc phần thưởng tốt điều khiến tự phải ngồi tù so với việc không thú nhận Và tất nhiên Đăng hoàn cảnh tương tự có lựa chọn giống với Huy Kết là, chiến lược tốt cho Đăng thú nhận dẫn đến mức thưởng tốt mà Huy nhận Trạng thái cân chiến lược thống trị đạt người chơi chọn chiến lược thống trị riêng họ → Vậy chiến lược hai không thú tội lựa chọn tốt nhất? Mặc dù phương án giúp hai người thời gian ngồi tù so với họ thú nhận, hiệu hai người họ biết chắn người không thú nhận Và khơng biết liệu Đăng Huy làm việc với mức độ hợp tác hay khơng Ngồi ra, hai khó chọn chiến lược khơng thú nhận có hình phạt lớn họ thú nhận Việc thú nhận giúp người số họ có khả khơng phải ngồi tù, chí năm tù The Prisoner's Dilemma ví dụ điển hình cho thấy lý thuyết trị chơi trở thành vấn đề tính hợp lý Đây vấn đề gây tranh cãi lý thuyết trò chơi Thật vậy, hầu hết tất lý thuyết dựa giả định tác nhân người chơi hợp lý, người cố gắng tối đa hóa phần thưởng họ, nghiên cứu chứng minh người chơi lúc hoạt động theo lý trí đơi kết luận phân tích hợp lý khơng phù hợp với thực tế Như thấy từ trò chơi này, chiến lược hợp lý mang lại cho hai người chơi thời gian tù lựa chọn tốt mà lựa chọn khiến hai người chơi phải tù lâu lựa chọn Song đề tù nhân phản ánh cách nhà nghiên cứu lý thuyết trị chơi khác khắc phục số vấn đề phiên lý thuyết trò chơi Von Neumann Một số họ nhà tốn học John Nash Ơng tìm cách để xác định chiến lược tối ưu trị chơi hữu hạn Đó "điểm cân Nash" - giải pháp cụ thể cho trò chơi, giải pháp đánh giá thực tế người chơi tạo điều tốt mà họ có, dựa chiến lược sử dụng tất người chơi khác Khi đạt trạng thái cân Nash trị chơi, khơng số người chơi muốn thay đổi chiến lược khác làm dẫn đến kết tồi tệ chiến lược Trong Song đề tù nhân, cân Nash chiến lược hai người chơi thú nhận Khơng có lựa chọn tốt cho hai người chơi để thay đổi Cũng từ ví dụ này, thấy khía cạnh thú vị khác cân Nash → Nhà toán học Iztok Hozo "bất kì điểm cân chiến lược thống trị điểm cân Nash" Nguyên nhân "cân Nash mở rộng khái niệm cân chiến lược thống trị Tuy nhiên ông lưu ý cân Nash sử dụng để giải trị chơi khơng có chiến lược thống trị" Cân Nash rằng, tối đa hóa lợi ích cho cá nhân chưa tối đa hóa lợi ích cho đám đơng Nash nhận nhiều lời khen ngợi cho cân Nash cơng trình khác ơng Lý thuyết trị chơi - khơng phải từ John von Neumann Von Neumann ghen tị, bác bỏ kết Nash thời trẻ, nói là "tầm thường" - đơn giản mặt toán học Và tất nhiên nhiều người khác khơng đồng tình với đánh giá Von Neumann công việc Nash Nash sau chia sẻ Giải tưởng niệm Nobel Khoa học Kinh tế vào năm 1994 cho cơng trình nghiên cứu lý thuyết trò chơi họ Và sau Nash vào năm 2015, trang web học thuật tóm gọn tất thành tựu Nash sau:"Đóng góp Nash cho lý thuyết trò chơi mở lĩnh vực cho nhiều ứng dụng nghiên cứu [ ] Nếu khơng có đột phá ơng ấy, phần lớn lý thuyết trị chơi khơng thực được" Kể từ trở gọi cách Người chơi Người chơi "anh" với người chơi "cơ" với người chơi Trị chơi hợp tác trò chơi bất hợp tác Một trò chơi gọi trò chơi hợp tác người chơi phép xây dựng đội/nhóm/liên minh với lời cam kết ví dụ hợp đồng Một trò chơi bất hợp tác người chơi khơng thể thành lập đội nhóm tất yêu cầu bắt buộc tự thân vận động Các trị chơi bất hợp tác thường phân tích thơng qua khn khổ lý thuyết trị chơi bất hợp tác Lý thuyết trò chơi hợp tác tập trung vào việc dự đốn liên minh hình thành tế nào, hành động người tham gia nhóm kết phần thưởng chung nhóm Đối lập với lý thuyết trò chơi bất hợp tác tập trung vào dự đoán hành động nhân, phần thưởng phân tích Cân Nash Sự tập trung vào lợi ích nhân dẫn tới tượng biết tới Bi kịch tài nguyên dùng chung, tài nguyên sử dụng khai thác mức độ triệt để Việc thiếu hụt giao kèo dẫn tới việc tài nguyên dùng chung thường bị hỏng nhanh, hao hụt nhanh bị sử dụng q nhiều khơng có biện pháp cần thiết để ngăn cá nhân sử dụng mục đích riêng Lý thuyết trị chơi hợp tác cung cấp phương pháp tiếp cận mức độ cao mơ tả cấu trúc, chiến lược phần thưởng liên minh, lý thuyết trị chơi bất hợp tác nhìn vào cách thủ tục thương lượng ảnh hưởng đến việc phân phối phần thưởng với liên minh Vì lý thuyết trò chơi bất hợp tác phổ biến hơn, lý thuyết trị chơi hợp tác phân tích qua cách tiếp cận lý thuyết trò chơi bất hợp tác (điều ngược lại khơng có) cung cấp đủ giả định để đưa chiến lược khả thi có sẵn cho người chơi Dù mong muốn sử dụng lý thuyết nhất, nhiều trường hợp lượng thơng tin khơng đủ để lập mơ hình xác thủ tục thức q trình xây dựng chiến lược mơ hình kết q phức tạo để cung cấp chiến lược thực tế giới thực Trong trường hợp lý thuyết trò chơi hợp tác cung cấp cách tiếp cận đơn giản cho phép phân tích trị chơi nói chung mà đưa giả định việc thương lượng Vậy khác biệt lý thuyết trò chơi hợp tác lý thuyết trò chơi bất hợp tác gì? Cả hai cách tiếp cận có đề lựa chọn phương pháp tiếp cận Chúng ta xây dựng mơ hình tương tác chiến lược lý thuyết trò chơi hợp tác lý thuyết trò chơi bất hợp tác, hai có lẽ hoạt động, chúng có lợi nhược số trường hợp phù hợp với cách tiếp cận lý thuyết trò chơi hợp tác trường hợp khác phù hợp với lý thuyết trò chơi bất hợp tác dựa vào câu hỏi cần giải quyết, thấy thích thú với phương pháp so với phương pháp khác Lấy ví dụ sau: Có đứa trẻ đứa trẻ có số tiền sau: Huy có nghìn đồng, Long có nghìn đồng Dương có nghìn đồng Những đứa trẻ không quan tâm tới số tiền mà chúng có mà quan muốn mua kem Có loại kem loại 500g có giá nghìn đồng, loại 750g có giá nghìn đồng loại 1000g có giá 11 nghìn đồng Chúng ta thấy khơng đứa trẻ (người chơi) mua kem chúng phải góp chung tiền (tài nguyên) chúng phải định chia tức người nhận bao nhiêu? Phân tích vấn đề cách tiếp cận lý thuyết trò chơi hợp tác lý thuyết trò chơi bất hợp tác Hai lý thuyết có điểm khác sau: → Các thỏa thuận không đề cập môi trường chiến lược Những đứa trẻ người bạn chúng dễ dàng viết hợp đồng ràng buộc chúng ví dụ như:"Nếu bạn khơng làm giống tớ khơng nói chuyện với bạn nữa" số cách khác Thỏa thuận ràng buộc thỏa thuận mà có người vi phạm có hình phạt tiền tệ Thỏa thuận đứa trẻ khơng có hình phạt tiền tệ có tác động cảm xúc tâm lý Nếu phân tích môi trường chiến lược mà người tham gia trò chơi biết người khác từ trước, người có khứ có tương lai với lý thuyết trị chơi hợp tác có nhiều lợi ích, dĩ nhiên phân tích chiến lược cách tiếp cận lý thuyết trị chơi bất hợp tác có thỏa thuận tiềm đưa với người khác → Trong lý thuyết trị chơi hợp tác cách tiếp cận thi trị chơi liên minh Còn cách tiếp cận lý thuyết trị chơi bất hợp tác khơng nhìn vào nhóm người chơi mà nhìn vào cá nhân đơn lẻ, mơi trường chiến lược mà người chơi không phép khơng có cách để tham gia liên minh (bởi họ người chơi khác) → Sự khác biệt lớn hai lý thuyết trò chơi lý thuyết trò chơi hợp tác lý thuyết trị chơi hợp tác đưa mơi trường chiến lược trị chơi vào "hộp đen" Tức người chơi tham gia trị chơi mơi trường chiến lược Bởi định người khơng đủ để định đoạt phần thưởng riêng mà người cịn lại có ảnh hưởng Với việc xây dựng mơ hình khơng đưa dự đoán chiến lược, thời gian, Bởi mà biết được??? Quay lại với ví dụ trả lời câu hỏi bạn thực chơi trò chơi Có lẽ khơng thường phải tình với bạn bè mình, khơng có cách chỉnh mực trị chơi có thời gian cố định Gần chắn tất ba đứa trẻ góp tiền qn việc hình thành liên minh thay vào tất muốn góp tiền họ mua kem 1000g Đến có câu hỏi làm để chia kem đó? Chia người góp nhiều tiền chia phần nhiều hơn? Phần nhiều nhiều đến mức nào? Tức họ phân xử đàm phán nào, liệu họ có viết số lên tờ giấy bốc chúng ngẫu nhiên, Vậy quy luật trị chơi mà họ chơi gì? Chúng ta khơng thể biết, mơ hình hóa nó, phụ thuộc vào câu hỏi mà cần giải Nếu không quan tâm tới chi tiết cụ thể trò chơi quan tâm kết cục nên Sau họ tới hàng, mua kem chia đâu kết tối ưu Chúng ta khơng cần quan tâm chuyện xảy "hộp đen", cần nhìn vào đầu nên lý thuyết trị chơi hợp tác có nhiều ý nghĩa Nhưng đơi lý thuyết trị chơi bất hợp tác có mục tiêu mở hộp này, muốn biết điều xảy hộp, chiến lược, hành động, lý nên phải mở hộp khám phá điều xảy bên Điều phụ thuộc vào loại câu hỏi bạn giải Nếu muốn phân tích cách cơng ty cạnh tranh với công ty thay đổi giá họ họ điều chỉnh số lượng họ số lượng họ thay đổi phụ thuộc vào công ty khác Chiến lược, thời gian trị chơi vấn đề cần giải vấn đề cụ thể mơi trường chiến lược, khơng nhìn vào đầu Trong trường hợp cách tiếp cận lý thuyết trò chơi bất hợp tác có nhiều ý nghĩa Lý thuyết trị chơi hợp tác tương đối điều kiện lỏng lẻo, nên lý thuyết trị chơi hợp tác có tính quy chuẩn so sánh với lý thuyết trò chơi bất hợp tác Vì thế, lý thuyết trị chơi bất hợp tác minh bạch người chơi chơi nào, nên chơi Tuy lý thuyết trị chơi hợp tác khơng quan tâm nhiều đến chi tiết trị chơi, dù họ chơi kết cục nên Vậy tóm lại nên dùng lý thuyết trị chơi hợp tác nên dùng lý thuyết trị chơi bất hợp tác Chúng ta mơ hình hóa khơng gian chiến lược hai cách tiếp cận Rõ ràng phụ thuộc vào loại câu hỏi mà tìm câu trả lời, khơng gian lý thuyết trị chơi hợp tác phù hợp; ví dụ suy nghĩ bạn biết tình thương thuyết bạn nhớ bạn chưa trao đổi với nhiều người bán nhiều người mua Những mô tả chiến lược, hành động thời gian cốt yếu nói khơng quan tâm điều xảy bên hộp muốn biết kết cục Có lúc muốn trả lời câu hỏi đâu đề nghị tốt người làm đề nghị đó, thân có tác động tích cực hay tiêu cực muốn nhượng tần số nhượng nên bao nhiều lý thuyết trị chơi bất hợp tác có nhiều tác dụng Nó khơng rõ ràng nhiều trường hợp khơng có khác biệt rõ ràng Nhưng với nêu có lẽ đủ để phân biệt hai cách tiếp cận Strict Dominance Chiến lược thống trị Cốt lõi lý thuyết trò chơi việc nghiên cứu chiến thuật phụ thuộc lẫn - tức tình mà hành động cá nhân tác động tới cá nhân lại ngược lại Chiến lược phụ thuộc lẫn phức tạp, mà người tham gia cần lường trước, hành động phản ứng Song đề tù nhân tốn lâu đời mơ hình nghiên cứu nhiều lý thuyết trò chơi, cách giải táon đơn giản Strict Dominance: Thơng qua tốn Song đề tù nhân, thấy ví dụ thống trị nghiêm ngặt Ta nói chiến lược a thống trị nghiêm ngặt chiến lược b cho người chơi x chiến lược x cung cấp phần thưởng tốt cho người chơi so với chiến lược b người chơi cịn lại làm Như ví dụ người chơi lựa chọn "khai" nhận kết tốt so với im lặng người chơi có làm Khơng bất ngờ người chơi thường không lựa chọn chiến lược bị áp đảo - theo định nghĩa lựa chọn tốt luôn xuất người chơi cịn lại làm Ý nghĩa số vai trò lý thuyết trò chơi Mặc dù có số lượng lớn nhánh lý thuyết trị chơi tập trung nghiên cứu cách dự đốn ích lợi, thường coi phần thưởng người chơi xếp hạng từ đầu mà anh/cơ ta thích thú thích thú Trong Song đề tù nhân, ta giả định người chơi muốn thời gian tù nhỏ Lý thuyết trị chơi khơng bắt buộc người chơi phải có ưu tiên này, tương tự với nhà phê bình thường yêu cầu Thay vào đó, lý thuyết trị chơi phân tích điều nên xảy theo xu hướng mong muốn người chơi Vì người chơi muốn thời gian tù nhỏ sử dụng số âm tháng phải vào tù phần thưởng Những số tương ứng với kết mà họ nhận từ ưu tiên kết có giá trị 0, kết mong muốn kết có giá trị -12, giá trị lại theo cách hợp lý Giá trị số khơng thích hợp với đầu toán Song đề tù nhân Vấn đề Song đề tù nhân hai người chơi không tin tưởng Tuy trường hợp mà bạn người bạn đáng tin cậy bị bắt thẩm vấn vấn đề tương tự? Những cơng cụ giải cịn thơ sơ chưa đủ để đưa câu trả lời Lý thuyết trò chơi đưa cho cách suy luận xác Ứng dụng Song đề tù nhân Có nhiều ứng dụng nêu phần bên Tắc nghẽn (deadlock) Tắc nghẽn trò chơi mà hành động giúp hai bên nhận nhiều lợi ích chiếm ưu Điều tạo tương phản với Song đề tù nhân nơi mà hành động tạo lợi ích chung cho hai bị chi phối Việc khiến Deadlock thú vị khiến quan tâm hơn, khơng có xung đột lợi ích cá nhân lợi ích chung Mặt khác deadlock tác động tới hành vi kinh tế thay đổi kết cân tron xã hội Chiến lược thống trị trò chơi bất đối xứng Chúng ta sử dụng thống trị nghiêm ngặt trị chơi dù khơng có tính đối xứng Song đề tù nhân Tắc nghẽn Lấy ví dụ Kết luận Sau chiến lược trội cơng cụ mạnh lý thuyết trò chơi Nhưng mà khái niệm đơn giản việc áp dụng khó khăn Mặc dù ... Đó kết xác nhận phiên toán lưỡng nan người tù, mà hai người chơi khơng có động động để chệch khỏi tập hợp chiến lược Phiên làm lại toán lưỡng nan người tù giúp ta rút hai điều... tốt cho hai người chơi để thay đổi Cũng từ ví dụ này, thấy khía cạnh thú vị khác cân Nash → Nhà toán học Iztok Hozo "bất kì điểm cân chiến lược thống trị điểm cân Nash" Nguyên nhân "cân Nash mở... John von Neumann Von Neumann ghen tị, bác bỏ kết Nash thời trẻ, nói là "tầm thường" - đơn giản mặt toán học Và tất nhiên nhiều người khác khơng đồng tình với đánh giá Von Neumann cơng việc Nash Nash