Ứng dụng lập trình động trong lý thuyết trò chơi tổ hợp

MỤC LỤC

TèM HIỂU VỀ Lí THUYẾT TRề CHƠI 2.1Cáckháiniệmchung

Trò chơi tổ hợplàtròchơigồm:hai người chơi (ở đây gọi người chơi trước là và𝐴 người chơi sau là 𝐵),mộttập hữu hạn các trạng thái𝑆(viếttắtcủaState)cóthểđạt đượccủatròchơi.Mỗingườichơicómộttập các bước di chuyển hợp lệ𝑄 đểdi chuyểntừtrạngtháinàysangtrạngtháikhác(gọilàluậtchơi)vàmộttậpcáctrạng tháikếtthúcgọilà𝑇⊂𝑆(viếttắtcủaTerminal).Haingườichơisẽluânphiêndi chuyểntừtrạngtháinàysangtrạngtháikhác.Ngườiđếnđượctrạngtháikếtthúc trướcsẽlàngườichiếnthắng. N:tậpcáctrạngtháix Ssaochonếutrạngtháibanđầucủatròchơilà xthìngười chơi trướcluônchiếnthắng. P:tậpcáctrạngtháix Ssaochonếutrạngtháibanđầucủatròchơilà xthìngười chơi sauluônởtrạngtháithắng.

VớimỗitrạngtháisthuộctậpP,tấtcảcáctrạngtháis’đếnđượctừsphảithuộcN Ràngbuộcđầutiênxácđịnhtrườnghợpcơbảnnhất.Hairàngbuộcsausẽgiúpchúng taliêntụcđệquytừtrườnghợpcơbảnđểxâydựngđượctậpPvàNhoànchỉnh.Ta sẽthấyrừđiềunàyởphầnThuật toỏn xỏc định tập vI NP. Nếu𝐴bắt đầu ở trạng thái thuộc N,luôn đi tới trạng thái thuộc Pđể épBđivàotrạngtháithuộcN.Dongườithắnglàngườiđivàotrạngtháikết thúc,màtrạngtháikếtthúclạithuộcPnênchắcchắnAsẽthắng. Trạng thái thắng:chúngtacóthểdichuyểnđếntrạngtháithuanếucómộtđốngbất kỳmàxk s<xk..

Zero-sum game (trò chơi tổng điểm bằng 0):ĐịnhlýMinimaxápdụngchocác tròchơizero-sum,nghĩalàtổngsốđiểmcủacácngườichơilàkhôngđổisaumỗi nướcđi.Nếumộtngườichơiđạtđượclợiích,thìngườichơicònlạisẽchịuthiệt hạitươngứng. Tối ưu hóa chiến lược:ĐịnhlýMinimaxchobiếtcáchmỗingườichơinênlựa chọnnướcđitốiưunhấtdựatrêncáclựachọncósẵncủađốiphương.Mụctiêulà tốiđahóalợiíchcủangườichơihiệntại,đồngthờitốithiểuhóalợiíchtốiđacủa đốiphương. Cây quyết định (game tree):ĐịnhlýMinimaxđượcápdụngtrêncâyquyếtđịnh củatròchơi,trongđómỗinútđạidiệnchomộttìnhhuốngtròchơisaumỗinước đi.Cácnútláđạidiệnchocáctrạngtháikếtthúccủatròchơi.

Chiến lược tối ưu:Chiếnlượcnàyđảmbảorằngdùđốithủcólựachọnnhưthế nào,ngườichơicũngđãchọnđượclựachọntốtnhấtcóthểdựatrêngiảđịnhđối thủchơitốiưu. Cân bằng Nash:Trạngtháitrongđókhôngcóngườichơinàocóđộngcơđểthay đổichiếnlượccủamìnhmộtcáchđơnphương. Cân bằng Nashlàmộtkháiniệmquantrọngtronglý thuyết trò chơi mang lại kết quả tối ưutrongtrườnghợpngườichơikhông đi chệchkhỏichiếnlượcban đầucủahọ.Điềunàyđượcthựchiệnđểđáplạiviệckhôngcóđộngcơnàocung cấpchongườichơivềsựsailệchnhưvậy.TròchơinàyđượcđặttheotêncủaNhà toánhọcJohnNash,ngườixácđịnhlờigiảicủamộttròchơikhônghợptáccósự thamgiacủahaingườichơitrởlên.

Vìngườichơikhácvẫnkhôngthayđổichiếnlượccủamìnhnênmộtcánhân khôngthểnhậnđượclợiíchgiatăngnàotừsựsailệchđó.Một trò chơi có thể có nhiều hoặc không có điểm cân bằng Nash. CânbằngNashcungcấpmộtgiải pháp tối ưuđểđạtđượckếtquảmong muốnbằngcáchkhôngđichệchkhỏichiếnlượcbanđầucủahọ. Vìcáccánhânđãbiếtvềchiếnlượccủanhaunêncả hai người chơi đều giInh chiến thắngkhimọingườiđềunhậnđượckếtquảmàhọnghĩra.

Vìngườichơimongmuốngiànhchiếnthắngnênhọsẽthựchiệnchiến lượcđóđểdẫnhọđếntrạngtháinhưvậy.Vìvậy,chiếnlượcđượclựachọn làgiảipháptốtnhấtvàtốiưunhấtmàhọcóthểsửdụng.Điềunàycũng kếthợp với chiến lược thống trị. Hơnnữa,nhưđãnêu,khôngthểcóbấtkỳtrạngtháicânbằngNashnào trongtròchơi.Vìvậy,không phải lúc nIo chiến lược được chọn cũng lI chiến lược tối ưu.

ỨNG DỤNG LẬP TRèNH ĐỘNG TRONG Lí THUYẾT TRề CHƠI N ĐỒNG XU

BIi toán

VớitròchơiNđồngxu,chúngtacóthểmôphỏngchiếnlượcsửdụnglậptrình độngthôngquamộtvídụcụthể.Giảsửcó4đồngxucógiátrịlầnlượtlà2,4, 6và8.Chúngtasẽtìmchiếnlượctốiưuchongườichơiđầutiên,ngườicố gắngthuthậpsốtiềnnhiềunhất. Mỗitrạngtháicủatròchơiđượcbiểudiễnbởicácđồngxucònlạitrênbàn.Chúng tasẽxâydựngmộtmatrậndptrongđódp[i][j]làsốtiềntốiđamàngườichơiđầu tiêncóthểthuđượckhichỉcòncácđồngxutừvịtríiđếnj.

Khởi tạo vI Định nghĩa

Khitínhdp[i][j],chúngtađangcốgắngtìmsốtiềntốiđamàngườichơihiệntại cóthểthuđượcnếuhọbắtđầuchơitrongphạmvitừđồngxu đếnđồngxu .i j Trongcôngthứcnày:.