BÀI TOÁN TRÒ CHƠI MA TRẬN

Trang 1

TRƯỜNG ĐẠI HỌC BÁCH KHOA KHOA CÔNG NGHỆ THÔNG TIN

Tel (84-511) 736 949, Website: itf.ud.edu.vn, E-mail: cntt@edu.ud.vn

BÁO CÁO TIỂU LUẬN MÔN HỌC

HỆ HỖ TRỢ RA QUYẾT ĐỊNH

NGÀNH KHOA HỌC MÁY TÍNH

ĐỀ TÀI : BÀI TOÁN TRÒ CHƠI MA TRẬN

(Chú ý không làm thay đổi định dạng trang in)

Học viên thực hiện: LÊ ĐỨC THỌ

Lớp Cao học KHMT Khóa 28 (2013  2015)

Trang 2

MỤC LỤC

LỜI MỞ ĐẦU 1

I TỔNG QUAN 2

1 Định nghĩa DSS 2

2 Đặc điểm của hệ hỗ trợ ra quyết định 2

3 Quy trình ra quyết định 3

4 Các loại quyết định 4

5 Phân loại DSS 5

6 Kiến trúc DSS 7

II BÀI TOÁN TRÒ CHƠI MA TRẬN 8

1 Giới thiệu về trò chơi ma trận 8

2 Một số ví dụ 8

III MÔ HÌNH BÀI TOÁN 10

IV PHƯƠNG PHÁP CHỌN 11

V VÍ DỤ MINH HỌA 13

1 Tổng quát về bài toán 13

2 Giải quyết vấn đề 13

VI KẾT LUẬN 16

VII TÀI LIỆU THAM KHẢO 17

Trang 3

LỜI MỞ ĐẦU

Ngày nay công nghệ thông tin là lĩnh vực không thể thiếu trong các hoạt động kinh doanh sản xuất, quản lý kinh tế cũng như nghiên cứu khoa học, thống

kê tình hình phát triển xã hội, dân số v.v Với các chức năng khai thác có tính chất tác nghiệp, việc khai thác cơ sở dữ liệu phục vụ các yêu cầu trợ giúp quyết định ngày càng có ý nghĩa to lớn Việc đưa ra quyết định đối với một vấn đề xuất hiện trong khắp các lĩnh vực mà đôi khi chúng ta không nhận ra Từ những việc đơn giản như chọn một món ăn cho một bữa ăn cho đến những việc lớn như phân bổ nguồn ngân sách vào các chương trình quốc gia đều là công việc đưa ra quyết định Việc ứng dụng các hệ hỗ trợ ra quyết định giúp các doanh nghiệp xây dựng chiến lược phát triển sản xuất kinh doanh đúng đắn của mình trong tương lai, mạng lại hiệu quả to lớn cho các doanh nghiệp, tổ chức v.v…

Dữ liệu được lưu trữ và thu thập ngày càng nhiều nhưng người ra quyết định trong quản lý, kinh doanh lại cần những thông tin dưới dạng “tri thức” rút ra

từ những nguồn dữ liệu đó hơn là chính những dữ liệu đó cho việc ra quyết định

Quá trình ra quyết định cần có nhiều phương pháp hỗ trợ, trong số những phương pháp đó thì Dự báo là một phương pháp được sử dụng rất phổ biến và kết quả dự báo chính là đầu vào rất cần thiết trong quá trình đưa ra ý kiến chủ quan chung sau khi thảo luận

Trang 4

I TỔNG QUAN

1 Định nghĩa DSS

Thuật ngữ hệ hỗ trợ ra quyết định (Decision Support Systems – DSS) đã bắt đầu xuất hiện từ những năm đầu của thập niên 1970, và đã có rất nhiều các nghiên cứu và các ứng dụng về hệ hỗ trợ ra quyết định Đã có rất nhiều định nghĩa về hệ

hỗ trợ ra quyết định Hệ hỗ trợ ra quyết định là những hệ thống nhằm hỗ trợ người quản lý thực hiện ra các quyết định, nó bao gồm những mục tiêu cần đạt, hàm, cách thức xử lý, … Quyết định có thể là những công việc có tổ chức hay có thể gọi

đó là những công việc có cấu trúc chặt chẽ, nhưng nó cũng có thể là những công việc không có cấu trúc, thực hiện không thường xuyên, nhưng lại có tầm quan trọng Những hệ thống này cung cấp những cơ chế mở rộng và tiện lợi cho người quản lý có thể thực hiện tốt hơn công việc của mình, nhưng nó không thể thay thế người quản lý để tự động đề ra các quyết định

Hệ hỗ trợ ra quyết định là phương pháp lấy tri thức đúng để cho ra quyết định hợp lý vào đúng lúc và có mức phí hợp lý Hay hệ hỗ trợ ra quyết định là hệ các phương pháp xử lý dữ liệu để lấy tri thức nhằm lựa chọn phương án tối ưu theo mục tiêu Đó là sự kết hợp giữa tri thức và việc tạo lập quyết định

Mục đích của hệ hỗ trợ ra quyết định là hỗ trợ việc ra quyết định của nhà quản lý theo mục tiêu đã đề ra

2 Đặc điểm của hệ hỗ trợ ra quyết định

Hệ hỗ trợ ra quyết định là một công cụ giúp đỡ người quản lý thực hiện ra các quyết định Ý định của hệ hỗ trợ ra quyết định là hỗ trợ hơn là thay thế, quản

lý việc ra quyết định với quan điểm là nâng cao tính hiệu quả của việc ra quyết định hơn là năng suất Có rất nhiều khuôn mẫu (framework) và mô hình được đưa

Trang 5

ra trong việc xây dựng hệ hỗ trợ ra quyết định Các mô hình này có các đặc điểm chính như sau:

- Thân thiện với người sử dụng

- Linh hoạt trong quá trình thực thi việc hỗ trợ ra quyết định

- Hỗ trợ các hoạt động trong quá trình ra quyết định bằng cách sử dụng các phương thức, dữ liệu, các quy luật và các phương tiện khác

Các hệ hỗ trợ ra quyết định được dùng trong các tổ chức để hổ trợ ra quyết định cho các vấn đề bán cấu trúc và không có cấu trúc Với những vấn đề bán cấu trúc và không có cấu trúc thì con người có thể can thiệp vào quá trình ra quyết định Con người cso thể can thiệp vào tại những thời điểm sau:

- Trong quá trình nhận định vấn đề

- Trong quá trình xử lý vấn đề

- Trong quá trình lựa chọn giải pháp

3 Quy trình ra quyết định

Các yếu tố quan trọng trong hệ hỗ trợ ra quyết định:

- Dữ liệu

- Tri thức

- Mô hình, phương pháp lựa chọn

Quy trình ra quyết định chia làm 3 giai đoạn:

- Thu thập: Lấy yêu cầu, yếu tố môi trường, dữ liệu để xử lý như

thông tin, tri thức … (thu thập, chọn lọc, chuẩn hóa, …)

- Thiết kế: Xây dựng các phương án thay thế, các ràng buộc, các

phương pháp đo lường Định hình các phương pháp lựa chọn

Trang 6

- Lựa chọn: Sử dụng các tri thức, thông tin thu được cùng với các

phương pháp hay mô hình lựa chọn (ở bước thiết kế) để lựa chọn, đánh giá các phương án Phương án phù hợp ở đây có thể là chi phí thấp và hiệu quả, cũng có thể là phù hợp với mục tiêu đặt ra

4 Các loại quyết định

Quyết định có thể được chia làm nhiều cấp độ từ quyết định có cấu trúc

hoàn toàn đến quyết định hoàn toàn không có cấu trúc

Có cấu trúc hay không có cấu trúc là dựa vào sự rõ ràng, mập mờ hay tính

phức tạp của các yếu tố trong 3 giai đoạn của ra quyết định

Phương pháp truyền thống trong tạo lập quyết định

Thiết lập

Phương án 3 Phương án 2 Phương án 1

Phương án n Phương án n-1 Mục đích

Ràng buộc

Lựa chọn

Quyết định

Dữ liệu

(Data)

Trang 7

Tạo lập quyết định có sử dụng tri thức

5 Phân loại DSS:

Có 5 xu hướng chính

Model – Driven

Mô hình vận dụng các mô hình toán tài chính, các mô hình dự báo, tối ưu,

và các mô hình giả lập để đưa ra sự hỗ trợ trong các quyết định của một vấn đề

Dữ liệu thường bị giới hạn về tham số, không gian (Thường theo các mô hình toán)

Ví dụ: Bài toán vận tải: Mô hình hỗ trợ điều xe cho ít tốn chi phí và đến đủ các nơi

Thiết lập

Phương án 3 Phương án 2 Phương án 1

Phương án n Phương án n-1 Mục

đích

Ràng buộc

định

Tri

thức

Dữ liệu

(Data)

Tri thức

Trang 8

Data – Driven

Mô hình sử dụng các dữ liệu có tính chất là chuỗi hay thời gian để tạo lập các báo cáo giúp cho việc ra quyết định

Mô hình phải phân tích và rút trích dữ liệu để tạo lập các báo cáo tổng hợp, các thông tin theo mục đích

Về sau phát triển với các ứng dụng gọi là Data WareHouse

Communication – Driven

Mô hình này quan tâm đến việc hỗ trợ ra quyết định dưới dạng nhóm Giải quyết những vấn đề của nhóm người ra quyết định

- Nhiều phương án khác nhau để lựa chọn

- Nhiều cách giải quyết khác nhau

- Phương pháp kết nối giữa nhóm ra quyết định

Document – Driven

Mô hình sử dụng các phương pháp phân tích và rút trích thông tin dạng văn bản (có thể là văn bản, tài liệu ảnh, phim, âm thanh, …)

Ví dụ: hệ thống hỗ trợ nhà quản trị nhận thức thái độ và thị hiếu tiêu dùng của khách hàng qua các thông tin phản hồi (có thể là thư từ, hay hình ảnh nét mặt của khách hàng khi tới công ty, …) Các hệ khai thác dữ liệu trên mạng (web mining)

Knowledge – Driven

Mô hình sử dụng hệ thống quản lý tri thức để áp dụng vào việc ra quyết định Thường dùng cho những kiểu dữ liệu ít có hay không có cấu trúc, hay loại

dữ liệu không tường minh Được áp dụng cho một lĩnh vực chuyên môn hẹp

Sử dụng các phương pháp trí tuệ nhân tạo Sự phát triển dần hình thành nên các hệ thống gọi là hệ chuyên gia (Expert System)

Trang 9

6 Kiến trúc DSS

Kiến trúc DSS bao gồm 4 phần căn bản:

- Hệ thống ngôn ngữ (Language System – LS)

- Hệ thống thể hiện (Presentation System – PS)

- Hệ thống tri thức (Knowledge System – KS)

- Hệ thống xử lý (Problem Processing System – PPS)

Người ra

quyết định

Người

nhận tri

thức

Người

phát triển

Nhà quản

trị

…

- Lấy dữ liệu

- Lấy tri thức

- Chọn lọc

- Chuẩn hóa

- Đo lường

- So sánh

- Điều khiển

- Suy diễn

- Mô tả tri thức

- Xử lý tri thức

- Suy diễn trên tri thức

- Tiếp nhận dữ liệu thông tin,

và cả tri thức

- Nơi giao tiếp ngừi dùng

- Xuất thông tin, tri thức ra cho người dùng

- Ra quyết định dạng hỗ trợ

Trang 10

II BÀI TOÁN TRÒ CHƠI MA TRẬN

1 Giới thiệu về trò chơi ma trận

Đối tượng nghiên cứu trong lý thuyết trò chơi là các mô hình và các phương pháp ra quyết định trong trường hợp nhiều người tham gia (nhiều người chơi) Mục tiêu của các người chơi khác nhau thường trái ngược nhau Ở đây, chúng ta chỉ xem xét các trò chơi có hai người và quyền lợi của hai người chơi là trái ngược nhau

Trò chơi bao gồm một dãy các bước (phương án) Các bước là ngẫu nhiên (Trong trò chơi cờ tất cả các bước mang tính cá nhân) Kết quả của các bước được đánh giá bởi hàm chiến thắng cho mỗi người chơi Nếu hàm chiến thắng là 0 thì trò chơi được gọi là chơi tổng bằng không

- Chiến lược là một tập hợp các quy tắc, được xác định bởi người chơi, có nghĩa là sự lựa chọn bước đi

- Chiến lược tối ưu được gọi là một chiến lược mà chiến lược đạt được giá trị trung bình mong đợi của người chơi là lớn nhất (tốt nhất) khi trò chơi lặp đi lặp lại

- Trò chơi ma trận: đó là trò chơi mà có hai người tham gia vào trò

chơi, ban đầu hàm chiến thắng của mỗi người chơi bằng 0 Người chơi thứ nhất có hữu hạn số chiến lược: {1, …, m} và người chơi thứ 2 có: {1, …, n} và với (ij)

đưa ra số tiền thưởng aij của người chơi thứ 2 (j) trả cho người chơi thứ nhất (i)

Ma trận (aij) cho kết quả chiến thắng của người chơi thứ nhất và kết quả thất bại của người chơi thứ hai, aij  0!

2 Một số ví dụ

Trò chơi đột kích

Trò chơi có 2 người chơi:

Trang 11

Người chơi thứ nhất chọn hệ thống phòng không Người chơi thứ hai chọn máy bay Phần tử aij là xác suất bắn cháy máy bay j bởi hệ thống phòng không i Mục đích của người người chơi thứ hai là vượt qua hệ thống phòng không

Các máy bay

0,5 0,6 0,8

0,9 0,7 0,8

0,7 0,5 0,6

Phương án chọn bước đi là một bộ (2,2) thì có ý nghĩa theo hai hướng: Nếu chọn máy bay 2, thì pháo cao xạ 2 sẽ tốt nhất cho người chơi thứ nhất;

Nếu chọn pháo cao xạ 2 thì máy bay 2 sẽ tốt nhất cho người chơi thứ hai

Trong ma trận có điểm tựa “saddle-node” (điểm ổn định)

Saddle-node của (aij) là (ai0j0) sao cho:

aij0  ai0j0  ai0j, (ij)

Trò chơi tung đồng xu

Người chơi chọn một trong hai phương án {sấp, ngửa} trước lúc tung đồng

xu Nếu lần tung trùng với phương án chọn thì người chơi thứ nhất chiến thắng, còn không thì chiến thắng thuộc người chơi thứ hai

II- người chơi

I- Người chơi

Sấp Ngửa

Ngửa -1 1

Trang 12

Một số trò chơi khác như :

Trò chơi tài xỉu từ 3 quân xúc sắt, Trò chơi Oẳn tù xì hay trò chơi tìm đường đi trong mê cung cho hai người chơi v.v…

III MÔ HÌNH BÀI TOÁN

• Lý thuyết trò chơi: nghiên cứu việc chọn quyết định trong trường hợp đối

kháng

• Người chơi

– Người chọn quyết định;

– Đối thủ của người chọn quyết định

• Chiến lược: Tập hợp các hành động để lựa chọn quyết định ứng với mỗi người chơi

• Xét trò chơi gồm 2 người:

– A : i, i:=1,…,n, tập chiến lược

– B : j, j:=1,…,m, tập chiến lược

– Giải thưởng ứng với chiến lược (i,j) của hai người chơi được ký hiệu

là aij (Phần thưởng là cái được của người này và cái mất của người kia)

• Lời giải

– Tìm chiến lược tốt nhất cho mỗi người chơi

1 a11 a12 … a1n

2 a21 a22 … a2n

m am1 am2 … amn

A

B

Đối với A:

Nếu A đi nước 1 thì A sẽ:

- Thắng a11 điểm nếu B đi nước 1

- Thắng a12 điểm nếu B đi nước 2

- …

Đối với B:

Nếu B đi nước 2 thì B sẽ:

- Thua a11 điểm nếu A đi nước 1

- Thua a21 điểm nếu A đi nước 2

- …

- Thua am1 nếu A đi nước m

Trang 13

- Nghiệm tối ưu của trò chơi là bộ chiến lược (i*,j*)

- Giải trò chơi có nghĩa là đi tìm nghiệm tối ưu

IV PHƯƠNG PHÁP CHỌN

Nguyên lý Minimax

Minimax (còn gọi là minmax) là một phương pháp trong lý thuyết quyết

định có mục đích là tối thiểu hóa (minimize) tổn thất vốn được dự tính có thể là

"tối đa" (maximize) Có thể hiểu ngược lại là, nó nhằm tối đa hóa lợi ích vốn được

dự tính là tối thiểu (maximin) Nó bắt nguồn từ trò chơi có tổng bằng không Nó

cũng được mở rộng cho nhiều trò chơi phức tạp hơn và giúp đưa ra các quyết định chung khi có sự hiện diện của sự không chắc chắn

Một phiên bản của giải thuật áp dụng cho các trò chơi như tic – tac - toe,

khi mà mỗi người chơi có thể thắng, thua, hoặc hòa Nếu người chơi A có

thể thắng trong 1 nước đi, thì "nước đi tốt nhất" chính là nước đi để dẫn đến kết

quả thắng đó Nếu người B biết rằng có một nước đi mà dẫn đến tình huống người

A có thể thắng ngay ở nước đi tiếp theo, trong khi nước đi khác thì sẽ dẫn đến tình huống mà người chơi A chỉ có thể, tốt nhất, là hòa thì nước đi tốt nhất của người B chính là nước đi sau

Ta sẽ nắm rõ, thế nào là một nước đi "tốt nhất" Giải thuật Minimax giúp tìm ra nước đi tốt nhất, bằng cách đi ngược từ cuối trò chơi trở về đầu Tại mỗi bước, nó sẽ ước định rằng người A đang cố gắngtối đa hóacơ hội thắng của A khi đến phiên anh ta, còn ở nước đi kế tiếp thì người chơi B cố gắng đểtổi thiểu hóacơ hội thắng của người A (nghĩa là tối đa hóa cơ hội thắng của B)

Giả thiết đối thủ toàn năng và đoán được tất cả các phương án (bước đi) Người chơi thứ nhất giả thiết rằng người chơi thứ hai biết hết tất cả và đối với

phương án i (bước đi i) của người chơi thứ nhất chọn j(i): aij(i)  aij, j= 1, …, n

Trang 14

Ký hiệu  i = aij(i) = min aij, i=1, , n Người chơi thứ nhất chọn i0 sao cho

 = max  i = max min aij = ai0. Đại lượng  gọi là giá trị nhỏ nhất của trò chơi

trong các chiến lược

Người chơi thứ hai từ việc cân nhắc một cách thận trọng và cho rằng trước tiên j chọn i(j) sao cho aij(j)  aij i, có nghĩa j = max aijvà chọn j sao cho j

nhỏ nhất

 = min max aij = j0

Đại lượng  gọi là giá trị lớn nhất của trò chơi trong tập chiến lược

Ví dụ : Trong ví dụ sau đây của một trò chơi tổng bằng 0, khi A và B đi các bước

cùng một lúc, minh họa thuật toán minimax Nếu như mỗi người chơi có 3 chọn

lựa và ma trận lợi cho A là:

B chọn B1 B chọn B2 B chọn B3

và B có ma trận lợi như nhau nhưng ngược dấu (i.e nếu các lựa chọn là A1

và B1 thì B trả 3 cho A) sau đó lựa chọn minimax đơn giản cho A là A2 bởi vì kết quả xấu nhất là sau khi phải trả 1, trong khi lựa chọn minimax đơn giản cho B là

B2 bởi vì kết quả xấu nhất là sau đó không phải trả gì cả Tuy vậy, lời giải này là

không ổn định, bởi vì nếu B tin rằng A sẽ chọn A2 thì B sẽ chọn B1 để thắng 1; sau đó nếu A tin rằng B sẽ chọn B1 thì A sẽ chọn A1 để thắng 3; và sau đó B sẽ

chọn B2; và cuối cùng cả hai người chơi sẽ nhận ra sự khó khăn của việc chọn lựa

Do đó một chiến lược ổn định hơn là cần thiết

Một số chọn lựa bị thống trị bởi những người khác và có thể bị loại bỏ: A

sẽ không chọn A3 bởi vì hoặc A1 hay A2 sẽ sinh ra một kết quả tốt hơn, bất kể là

Tiêu đề	Bài toán Trò chơi Ma trận
Tác giả	Lê Đức Thọ
Trường học	Đại học Đà Nẵng
Chuyên ngành	Khoa học Máy tính
Thể loại	Tiểu luận môn học
Năm xuất bản	2015
Thành phố	Đà Nẵng

Định dạng
Số trang	19
Dung lượng	709,22 KB