BÀI TOÁN TRÒ CHƠI MA TRẬN
Trang 1TRƯỜNG ĐẠI HỌC BÁCH KHOA KHOA CÔNG NGHỆ THÔNG TIN
Tel (84-511) 736 949, Website: itf.ud.edu.vn, E-mail: cntt@edu.ud.vn
BÁO CÁO TIỂU LUẬN MÔN HỌC
HỆ HỖ TRỢ RA QUYẾT ĐỊNH
NGÀNH KHOA HỌC MÁY TÍNH
ĐỀ TÀI : BÀI TOÁN TRÒ CHƠI MA TRẬN
(Chú ý không làm thay đổi định dạng trang in)
Học viên thực hiện: LÊ ĐỨC THỌ
Lớp Cao học KHMT Khóa 28 (2013 2015)
Trang 2MỤC LỤC
LỜI MỞ ĐẦU 1
I TỔNG QUAN 2
1 Định nghĩa DSS 2
2 Đặc điểm của hệ hỗ trợ ra quyết định 2
3 Quy trình ra quyết định 3
4 Các loại quyết định 4
5 Phân loại DSS 5
6 Kiến trúc DSS 7
II BÀI TOÁN TRÒ CHƠI MA TRẬN 8
1 Giới thiệu về trò chơi ma trận 8
2 Một số ví dụ 8
III MÔ HÌNH BÀI TOÁN 10
IV PHƯƠNG PHÁP CHỌN 11
V VÍ DỤ MINH HỌA 13
1 Tổng quát về bài toán 13
2 Giải quyết vấn đề 13
VI KẾT LUẬN 16
VII TÀI LIỆU THAM KHẢO 17
Trang 3LỜI MỞ ĐẦU
Ngày nay công nghệ thông tin là lĩnh vực không thể thiếu trong các hoạt động kinh doanh sản xuất, quản lý kinh tế cũng như nghiên cứu khoa học, thống
kê tình hình phát triển xã hội, dân số v.v Với các chức năng khai thác có tính chất tác nghiệp, việc khai thác cơ sở dữ liệu phục vụ các yêu cầu trợ giúp quyết định ngày càng có ý nghĩa to lớn Việc đưa ra quyết định đối với một vấn đề xuất hiện trong khắp các lĩnh vực mà đôi khi chúng ta không nhận ra Từ những việc đơn giản như chọn một món ăn cho một bữa ăn cho đến những việc lớn như phân bổ nguồn ngân sách vào các chương trình quốc gia đều là công việc đưa ra quyết định Việc ứng dụng các hệ hỗ trợ ra quyết định giúp các doanh nghiệp xây dựng chiến lược phát triển sản xuất kinh doanh đúng đắn của mình trong tương lai, mạng lại hiệu quả to lớn cho các doanh nghiệp, tổ chức v.v…
Dữ liệu được lưu trữ và thu thập ngày càng nhiều nhưng người ra quyết định trong quản lý, kinh doanh lại cần những thông tin dưới dạng “tri thức” rút ra
từ những nguồn dữ liệu đó hơn là chính những dữ liệu đó cho việc ra quyết định
Quá trình ra quyết định cần có nhiều phương pháp hỗ trợ, trong số những phương pháp đó thì Dự báo là một phương pháp được sử dụng rất phổ biến và kết quả dự báo chính là đầu vào rất cần thiết trong quá trình đưa ra ý kiến chủ quan chung sau khi thảo luận
Trang 4I TỔNG QUAN
1 Định nghĩa DSS
Thuật ngữ hệ hỗ trợ ra quyết định (Decision Support Systems – DSS) đã bắt đầu xuất hiện từ những năm đầu của thập niên 1970, và đã có rất nhiều các nghiên cứu và các ứng dụng về hệ hỗ trợ ra quyết định Đã có rất nhiều định nghĩa về hệ
hỗ trợ ra quyết định Hệ hỗ trợ ra quyết định là những hệ thống nhằm hỗ trợ người quản lý thực hiện ra các quyết định, nó bao gồm những mục tiêu cần đạt, hàm, cách thức xử lý, … Quyết định có thể là những công việc có tổ chức hay có thể gọi
đó là những công việc có cấu trúc chặt chẽ, nhưng nó cũng có thể là những công việc không có cấu trúc, thực hiện không thường xuyên, nhưng lại có tầm quan trọng Những hệ thống này cung cấp những cơ chế mở rộng và tiện lợi cho người quản lý có thể thực hiện tốt hơn công việc của mình, nhưng nó không thể thay thế người quản lý để tự động đề ra các quyết định
Hệ hỗ trợ ra quyết định là phương pháp lấy tri thức đúng để cho ra quyết định hợp lý vào đúng lúc và có mức phí hợp lý Hay hệ hỗ trợ ra quyết định là hệ các phương pháp xử lý dữ liệu để lấy tri thức nhằm lựa chọn phương án tối ưu theo mục tiêu Đó là sự kết hợp giữa tri thức và việc tạo lập quyết định
Mục đích của hệ hỗ trợ ra quyết định là hỗ trợ việc ra quyết định của nhà quản lý theo mục tiêu đã đề ra
2 Đặc điểm của hệ hỗ trợ ra quyết định
Hệ hỗ trợ ra quyết định là một công cụ giúp đỡ người quản lý thực hiện ra các quyết định Ý định của hệ hỗ trợ ra quyết định là hỗ trợ hơn là thay thế, quản
lý việc ra quyết định với quan điểm là nâng cao tính hiệu quả của việc ra quyết định hơn là năng suất Có rất nhiều khuôn mẫu (framework) và mô hình được đưa
Trang 5ra trong việc xây dựng hệ hỗ trợ ra quyết định Các mô hình này có các đặc điểm chính như sau:
- Thân thiện với người sử dụng
- Linh hoạt trong quá trình thực thi việc hỗ trợ ra quyết định
- Hỗ trợ các hoạt động trong quá trình ra quyết định bằng cách sử dụng các phương thức, dữ liệu, các quy luật và các phương tiện khác
Các hệ hỗ trợ ra quyết định được dùng trong các tổ chức để hổ trợ ra quyết định cho các vấn đề bán cấu trúc và không có cấu trúc Với những vấn đề bán cấu trúc và không có cấu trúc thì con người có thể can thiệp vào quá trình ra quyết định Con người cso thể can thiệp vào tại những thời điểm sau:
- Trong quá trình nhận định vấn đề
- Trong quá trình xử lý vấn đề
- Trong quá trình lựa chọn giải pháp
3 Quy trình ra quyết định
Các yếu tố quan trọng trong hệ hỗ trợ ra quyết định:
- Dữ liệu
- Tri thức
- Mô hình, phương pháp lựa chọn
Quy trình ra quyết định chia làm 3 giai đoạn:
- Thu thập: Lấy yêu cầu, yếu tố môi trường, dữ liệu để xử lý như
thông tin, tri thức … (thu thập, chọn lọc, chuẩn hóa, …)
- Thiết kế: Xây dựng các phương án thay thế, các ràng buộc, các
phương pháp đo lường Định hình các phương pháp lựa chọn
Trang 6- Lựa chọn: Sử dụng các tri thức, thông tin thu được cùng với các
phương pháp hay mô hình lựa chọn (ở bước thiết kế) để lựa chọn, đánh giá các phương án Phương án phù hợp ở đây có thể là chi phí thấp và hiệu quả, cũng có thể là phù hợp với mục tiêu đặt ra
4 Các loại quyết định
Quyết định có thể được chia làm nhiều cấp độ từ quyết định có cấu trúc
hoàn toàn đến quyết định hoàn toàn không có cấu trúc
Có cấu trúc hay không có cấu trúc là dựa vào sự rõ ràng, mập mờ hay tính
phức tạp của các yếu tố trong 3 giai đoạn của ra quyết định
Phương pháp truyền thống trong tạo lập quyết định
Thiết lập
Phương án 3 Phương án 2 Phương án 1
Phương án n Phương án n-1 Mục đích
Ràng buộc
Lựa chọn
Quyết định
Dữ liệu
(Data)
Trang 7Tạo lập quyết định có sử dụng tri thức
5 Phân loại DSS:
Có 5 xu hướng chính
Model – Driven
Mô hình vận dụng các mô hình toán tài chính, các mô hình dự báo, tối ưu,
và các mô hình giả lập để đưa ra sự hỗ trợ trong các quyết định của một vấn đề
Dữ liệu thường bị giới hạn về tham số, không gian (Thường theo các mô hình toán)
Ví dụ: Bài toán vận tải: Mô hình hỗ trợ điều xe cho ít tốn chi phí và đến đủ các nơi
Thiết lập
Phương án 3 Phương án 2 Phương án 1
Phương án n Phương án n-1 Mục
đích
Ràng buộc
định
Tri
thức
Dữ liệu
(Data)
Tri thức
Trang 8Data – Driven
Mô hình sử dụng các dữ liệu có tính chất là chuỗi hay thời gian để tạo lập các báo cáo giúp cho việc ra quyết định
Mô hình phải phân tích và rút trích dữ liệu để tạo lập các báo cáo tổng hợp, các thông tin theo mục đích
Về sau phát triển với các ứng dụng gọi là Data WareHouse
Communication – Driven
Mô hình này quan tâm đến việc hỗ trợ ra quyết định dưới dạng nhóm Giải quyết những vấn đề của nhóm người ra quyết định
- Nhiều phương án khác nhau để lựa chọn
- Nhiều cách giải quyết khác nhau
- Phương pháp kết nối giữa nhóm ra quyết định
Document – Driven
Mô hình sử dụng các phương pháp phân tích và rút trích thông tin dạng văn bản (có thể là văn bản, tài liệu ảnh, phim, âm thanh, …)
Ví dụ: hệ thống hỗ trợ nhà quản trị nhận thức thái độ và thị hiếu tiêu dùng của khách hàng qua các thông tin phản hồi (có thể là thư từ, hay hình ảnh nét mặt của khách hàng khi tới công ty, …) Các hệ khai thác dữ liệu trên mạng (web mining)
Knowledge – Driven
Mô hình sử dụng hệ thống quản lý tri thức để áp dụng vào việc ra quyết định Thường dùng cho những kiểu dữ liệu ít có hay không có cấu trúc, hay loại
dữ liệu không tường minh Được áp dụng cho một lĩnh vực chuyên môn hẹp
Sử dụng các phương pháp trí tuệ nhân tạo Sự phát triển dần hình thành nên các hệ thống gọi là hệ chuyên gia (Expert System)
Trang 96 Kiến trúc DSS
Kiến trúc DSS bao gồm 4 phần căn bản:
- Hệ thống ngôn ngữ (Language System – LS)
- Hệ thống thể hiện (Presentation System – PS)
- Hệ thống tri thức (Knowledge System – KS)
- Hệ thống xử lý (Problem Processing System – PPS)
Người ra
quyết định
Người
nhận tri
thức
Người
phát triển
Nhà quản
trị
…
- Lấy dữ liệu
- Lấy tri thức
- Chọn lọc
- Chuẩn hóa
- Đo lường
- So sánh
- Điều khiển
- Suy diễn
- Mô tả tri thức
- Xử lý tri thức
- Suy diễn trên tri thức
- Tiếp nhận dữ liệu thông tin,
và cả tri thức
- Nơi giao tiếp ngừi dùng
- Xuất thông tin, tri thức ra cho người dùng
- Ra quyết định dạng hỗ trợ
Trang 10II BÀI TOÁN TRÒ CHƠI MA TRẬN
1 Giới thiệu về trò chơi ma trận
Đối tượng nghiên cứu trong lý thuyết trò chơi là các mô hình và các phương pháp ra quyết định trong trường hợp nhiều người tham gia (nhiều người chơi) Mục tiêu của các người chơi khác nhau thường trái ngược nhau Ở đây, chúng ta chỉ xem xét các trò chơi có hai người và quyền lợi của hai người chơi là trái ngược nhau
Trò chơi bao gồm một dãy các bước (phương án) Các bước là ngẫu nhiên (Trong trò chơi cờ tất cả các bước mang tính cá nhân) Kết quả của các bước được đánh giá bởi hàm chiến thắng cho mỗi người chơi Nếu hàm chiến thắng là 0 thì trò chơi được gọi là chơi tổng bằng không
- Chiến lược là một tập hợp các quy tắc, được xác định bởi người chơi, có nghĩa là sự lựa chọn bước đi
- Chiến lược tối ưu được gọi là một chiến lược mà chiến lược đạt được giá trị trung bình mong đợi của người chơi là lớn nhất (tốt nhất) khi trò chơi lặp đi lặp lại
- Trò chơi ma trận: đó là trò chơi mà có hai người tham gia vào trò
chơi, ban đầu hàm chiến thắng của mỗi người chơi bằng 0 Người chơi thứ nhất có hữu hạn số chiến lược: {1, …, m} và người chơi thứ 2 có: {1, …, n} và với (ij)
đưa ra số tiền thưởng aij của người chơi thứ 2 (j) trả cho người chơi thứ nhất (i)
Ma trận (aij) cho kết quả chiến thắng của người chơi thứ nhất và kết quả thất bại của người chơi thứ hai, aij 0!
2 Một số ví dụ
Trò chơi đột kích
Trò chơi có 2 người chơi:
Trang 11Người chơi thứ nhất chọn hệ thống phòng không Người chơi thứ hai chọn máy bay Phần tử aij là xác suất bắn cháy máy bay j bởi hệ thống phòng không i Mục đích của người người chơi thứ hai là vượt qua hệ thống phòng không
Các máy bay
0,5 0,6 0,8
0,9 0,7 0,8
0,7 0,5 0,6
Phương án chọn bước đi là một bộ (2,2) thì có ý nghĩa theo hai hướng: Nếu chọn máy bay 2, thì pháo cao xạ 2 sẽ tốt nhất cho người chơi thứ nhất;
Nếu chọn pháo cao xạ 2 thì máy bay 2 sẽ tốt nhất cho người chơi thứ hai
Trong ma trận có điểm tựa “saddle-node” (điểm ổn định)
Saddle-node của (aij) là (ai0j0) sao cho:
aij0 ai0j0 ai0j, (ij)
Trò chơi tung đồng xu
Người chơi chọn một trong hai phương án {sấp, ngửa} trước lúc tung đồng
xu Nếu lần tung trùng với phương án chọn thì người chơi thứ nhất chiến thắng, còn không thì chiến thắng thuộc người chơi thứ hai
II- người chơi
I- Người chơi
Sấp Ngửa
Ngửa -1 1
Trang 12Một số trò chơi khác như :
Trò chơi tài xỉu từ 3 quân xúc sắt, Trò chơi Oẳn tù xì hay trò chơi tìm đường đi trong mê cung cho hai người chơi v.v…
III MÔ HÌNH BÀI TOÁN
• Lý thuyết trò chơi: nghiên cứu việc chọn quyết định trong trường hợp đối
kháng
• Người chơi
– Người chọn quyết định;
– Đối thủ của người chọn quyết định
• Chiến lược: Tập hợp các hành động để lựa chọn quyết định ứng với mỗi người chơi
• Xét trò chơi gồm 2 người:
– A : i, i:=1,…,n, tập chiến lược
– B : j, j:=1,…,m, tập chiến lược
– Giải thưởng ứng với chiến lược (i,j) của hai người chơi được ký hiệu
là aij (Phần thưởng là cái được của người này và cái mất của người kia)
• Lời giải
– Tìm chiến lược tốt nhất cho mỗi người chơi
1 a11 a12 … a1n
2 a21 a22 … a2n
m am1 am2 … amn
A
B
Đối với A:
Nếu A đi nước 1 thì A sẽ:
- Thắng a11 điểm nếu B đi nước 1
- Thắng a12 điểm nếu B đi nước 2
- …
Đối với B:
Nếu B đi nước 2 thì B sẽ:
- Thua a11 điểm nếu A đi nước 1
- Thua a21 điểm nếu A đi nước 2
- …
- Thua am1 nếu A đi nước m
Trang 13- Nghiệm tối ưu của trò chơi là bộ chiến lược (i*,j*)
- Giải trò chơi có nghĩa là đi tìm nghiệm tối ưu
IV PHƯƠNG PHÁP CHỌN
Nguyên lý Minimax
Minimax (còn gọi là minmax) là một phương pháp trong lý thuyết quyết
định có mục đích là tối thiểu hóa (minimize) tổn thất vốn được dự tính có thể là
"tối đa" (maximize) Có thể hiểu ngược lại là, nó nhằm tối đa hóa lợi ích vốn được
dự tính là tối thiểu (maximin) Nó bắt nguồn từ trò chơi có tổng bằng không Nó
cũng được mở rộng cho nhiều trò chơi phức tạp hơn và giúp đưa ra các quyết định chung khi có sự hiện diện của sự không chắc chắn
Một phiên bản của giải thuật áp dụng cho các trò chơi như tic – tac - toe,
khi mà mỗi người chơi có thể thắng, thua, hoặc hòa Nếu người chơi A có
thể thắng trong 1 nước đi, thì "nước đi tốt nhất" chính là nước đi để dẫn đến kết
quả thắng đó Nếu người B biết rằng có một nước đi mà dẫn đến tình huống người
A có thể thắng ngay ở nước đi tiếp theo, trong khi nước đi khác thì sẽ dẫn đến tình huống mà người chơi A chỉ có thể, tốt nhất, là hòa thì nước đi tốt nhất của người B chính là nước đi sau
Ta sẽ nắm rõ, thế nào là một nước đi "tốt nhất" Giải thuật Minimax giúp tìm ra nước đi tốt nhất, bằng cách đi ngược từ cuối trò chơi trở về đầu Tại mỗi bước, nó sẽ ước định rằng người A đang cố gắngtối đa hóacơ hội thắng của A khi đến phiên anh ta, còn ở nước đi kế tiếp thì người chơi B cố gắng đểtổi thiểu hóacơ hội thắng của người A (nghĩa là tối đa hóa cơ hội thắng của B)
Giả thiết đối thủ toàn năng và đoán được tất cả các phương án (bước đi) Người chơi thứ nhất giả thiết rằng người chơi thứ hai biết hết tất cả và đối với
phương án i (bước đi i) của người chơi thứ nhất chọn j(i): aij(i) aij, j= 1, …, n
Trang 14Ký hiệu i = aij(i) = min aij, i=1, , n Người chơi thứ nhất chọn i0 sao cho
= max i = max min aij = ai0. Đại lượng gọi là giá trị nhỏ nhất của trò chơi
trong các chiến lược
Người chơi thứ hai từ việc cân nhắc một cách thận trọng và cho rằng trước tiên j chọn i(j) sao cho aij(j) aij i, có nghĩa j = max aijvà chọn j sao cho j
nhỏ nhất
= min max aij = j0
Đại lượng gọi là giá trị lớn nhất của trò chơi trong tập chiến lược
Ví dụ : Trong ví dụ sau đây của một trò chơi tổng bằng 0, khi A và B đi các bước
cùng một lúc, minh họa thuật toán minimax Nếu như mỗi người chơi có 3 chọn
lựa và ma trận lợi cho A là:
B chọn B1 B chọn B2 B chọn B3
và B có ma trận lợi như nhau nhưng ngược dấu (i.e nếu các lựa chọn là A1
và B1 thì B trả 3 cho A) sau đó lựa chọn minimax đơn giản cho A là A2 bởi vì kết quả xấu nhất là sau khi phải trả 1, trong khi lựa chọn minimax đơn giản cho B là
B2 bởi vì kết quả xấu nhất là sau đó không phải trả gì cả Tuy vậy, lời giải này là
không ổn định, bởi vì nếu B tin rằng A sẽ chọn A2 thì B sẽ chọn B1 để thắng 1; sau đó nếu A tin rằng B sẽ chọn B1 thì A sẽ chọn A1 để thắng 3; và sau đó B sẽ
chọn B2; và cuối cùng cả hai người chơi sẽ nhận ra sự khó khăn của việc chọn lựa
Do đó một chiến lược ổn định hơn là cần thiết
Một số chọn lựa bị thống trị bởi những người khác và có thể bị loại bỏ: A
sẽ không chọn A3 bởi vì hoặc A1 hay A2 sẽ sinh ra một kết quả tốt hơn, bất kể là