1. Trang chủ
  2. » Luận Văn - Báo Cáo

Nghiên cứu planning để giải bài toán xác định lộ trình

143 563 1
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 143
Dung lượng 2,42 MB

Nội dung

Nghiên cứu planning để giải bài toán xác định lộ trình

Trang 1

KHOA CÔNG NGHỆ THÔNG TIN

BỘ MÔN CÔNG NGHỆ TRI THỨC

LUẬN VĂN CỬ NHÂN TIN HỌC

NGHIÊN CỨU PLANNING

ĐỂ GIẢI BÀI TOÁN XÁC ĐỊNH LỘ TRÌNH

GVHD: Th.S Nguyễn Phương Thảo

TP HỒ CHÍ MINH, 2003

Trang 2

Lời mở đầu

Từ trước đến nay có rất nhiều bài toán được đặt ra, cần nghiên cứu cáchgiải quyết Những bài toán khó nhất vẫn là những bài toán thực tế củacuộc sống Với sự phát triển mạnh mẽ của công nghệ thông tin như hiệnnay, các bài toán thường được đưa vào máy tính để xử lí Đa số các bàitoán được giải quyết bằng cách áp dụng trí thông minh nhân tạo(Artificial Intelligent (AI)) Thuật ngữ “planning” được sử dụng trong AIkhi bài toán là bài toán thế giới thực được gọi là AI planning Con ngườithường có thói quen dự định một việc gì đó trước khi làm và hầu như conngười biết có những hành động nào để đạt được những dự định đó Đểgiúp máy tính làm việc như con người, nghĩa là biết những hành độngnào có thể đi đến mục tiêu, ta cần cung cấp tri thức cho nó Tri thức ở đâyrất đa dạng, để máy tính “hiểu” được môi trường xung quanh nó như thếnào là việc rất khó khăn Một máy tính có những trang thiết bị hiện đạinhất vẫn không thể cảm nhận hết những thay đổi của môi trường Tuynhiên, đối với một bài toán cụ thể nào đó, máy tính chỉ cần ghi nhậnnhững tri thức liên quan Với những tri thức đó bộ lập kế hoạch sẽ giúpmáy tính biết cần hành động thế nào để đạt được mục tiêu bằng cách đưara những kế hoạch tương ứng lấy từ tri thức sẵn có Trong lĩnh vực AI,lập kế hoạch là vấn đề khá mới so với nhận dạng, xử lí ảnh, xử lí ngônngữ, xử lí âm thanh,…đã được nghiên cứu rất nhiều Nhưng lập kế hoạchcó sức mạnh rất lớn trong việc tiếp cận và giải quyết những vấn đề thực tếtrong cuộc sống như: chế tạo robot làm việc nhà: biết đi chợ, quét dọnnhà cửa,…; robot tự động làm việc ở những vị trí khá nguy hiểm cho conngười như nhà cao tầng hay ngoài không gian,…Một sức mạnh khác củalập kế hoạch tạo ra những robot có thể phản ứng với những biến đổi bất

Trang 3

mới có thể làm điều này Trong luận văn này, lập kế hoạch được sử dụngđể giải quyết bài toán xác định lộ trình trong thành phố Hồ Chí Minh Vớicác tri thức cần cập nhật như luật đi đường, xuất hiện các sự cố gây tắtnghẽn giao thông ở đoạn đường nào, các trường học, bệnh viện, nhà thờ,trụ sở nhà nước, cây xăng, sân vận động, rạp chiếu phim,… được đặt tạiđâu Bộ lập kế hoạch có thể giúp tìm ra những con đường tốt nhất về thờigian, tốc độ, nhiên liệu,…để đến mục tiêu với tri thức được cập nhậtthường xuyên.

Trang 4

Lời cảm ơn

Chúng em xin chân thành cảm ơn thầy Lê Hoài Bắc và côNguyễn Phương Thảo đã tận tình hướng dẫn và giúp đỡchúng em trong quá trình thực hiện đề tài, cùng toàn thểquý thầy cô khoa Công nghệ thông tin trường Đại HọcKhoa Học Tự Nhiên đã tận tình chỉ bảo, truyền đạt nhữngkiến thức quý báo để chúng em làm hành trang vào đời.

Chúng em xin chân thành cảm ơn tất cả bạn bè đãđộng viên và giúp đỡ vượt qua những khó khăn để hoànthành luận văn này.

Đặt biệt, chúng con xin cảm ơn các bậc cha mẹ vànhững người thân đã hết lòng nuôi nấng dạy dỗ để chúngcon có được ngày hôm nay.

Do còn hạn chế về nhiều mặt nên luận văn cònnhiều thiếu sót, chúng em kính mong quý thầy cô cùng bạnbè đóng góp ý kiến để chúng em có thể khắc phục, hoànthiện hơn.

Thành phố Hồ Chí MinhTháng 7 – 2003

Trang 5

NHẬN XÉT CỦA GIÁO VIÊN HƯỚNG DẪN

Trang 6

NHẬN XÉT CỦA GIÁO VIÊN PHẢN BIỆN

Trang 7

MỤC LỤC

PHẦN I: CƠ SỞ LÝ THUYẾT TRONG LẬP KẾ HOẠCH 11

Lịch sử lập kế hoạch 12

CHƯƠNG 1:CÁC KHÁI NIỆM CƠ BẢN 16

1CÁC THUẬT NGỮ CHUNG TRONG LẬP KẾ HOẠCH 16

2BẢN CHẤT CỦA VẦN ĐỀ LẬP KẾ HOẠCH 18

3MỘT SỐ ỨNG DỤNG CỦA LẬP KẾ HOẠCH TRONG THỰC TẾ 19

3.1.Robot sắp xếp các khối 19

3.2.Robot mua hàng hoá 20

CHƯƠNG 2:CÁC ĐỐI TƯỢNG TRONG LẬP KẾ HOẠCH 22

1.6.1 Agent phản xạ đơn giản 30

1.6.2 Agent lưu vết môi trường 32

1.6.3 Agent dựa trên mục tiêu 34

1.6.4 Agent dựa trên tính hiệu quả 35

2MÔI TRƯỜNG 37

2.1.Khái niệm 37

2.2.Các loại môi trường và thuộc tính của nó 38

2.2.1 Môi trường tiếp cận được và không tiếp cận được 38

Trang 8

2.2.2 Môi trường xác định và không xác định 38

2.2.3 Môi trường episodic và nonepisodic 38

2.2.4 Môi trường tĩnh và động 39

2.2.5 Môi trường rời rạc và liên tục 39

CHƯƠNG 3:CÁC LÝ THUYẾT LIÊN QUAN ĐẾN LẬP KẾ HOẠCH 42

1GIẢI TOÁN BẰNG PHƯƠNG PHÁP TÌM KIẾM 42

1.1.Agent giải quyết bài toán 42

1.1.1 Mô tả 42

1.1.2 Ví dụ 43

1.1.3 Chương trình agent giải quyết bài toán đơn giản 43

1.2.Thiết lập bài toán 44

1.2.1 Các kiểu bài toán 45

1.2.1.1 Bài toán trạng thái đơn 45

1.2.1.2 Bài toán đa trạng thái 46

1.2.1.3 Bài toán ngẫu nhiên 46

1.2.1.4 Bài toán khảo sát 47

1.2.2 Định nghĩa bài toán và giải pháp 47

1.2.3 Đo mức độ thực thi của việc giải toán 48

1.2.3.1 Các phương pháp đo độ thực thi 48

1.2.3.2 Ví dụ 49

1.2.4 Chọn trạng thái và hành động 49

1.3.Tìm kiếm giải pháp 51

1.3.1 Tạo các chuỗi hành động 51

1.3.2 Cấu trúc dữ liệu của cây tìm kiếm 54

2GIỚI THIỆU NGÔN NGỮ MÔ TẢ BÀI TOÁN 56

Trang 9

CHƯƠNG 4:CÁC VẤN ĐỀ TRONG LẬP KẾ HOẠCH 69

1GIỚI THIỆU AGENT LẬP KẾ HOẠCH ĐƠN GIẢN 69

2TỪ GIẢI QUYẾT BÀI TOÁN ĐẾN LẬP KẾ HOẠCH 70

1.1.Ý tưởng thuật toán 88

1.2.Chi tiết thuật toán 89

Trang 10

2VÍ DỤ 90

2.1.Mô tả bài toán 90

2.2.Áp dụng thuật toán POP cho bài toán 91

CHƯƠNG 6:MÔ HÌNH LẬP KẾ HOẠCH PHÂN RÃ PHÂN CẤP 100

1PHÂN RÃ PHÂN CẤP TOÁN TỬ 100

1.4.2 Thuật toán HD-POP 103

2PHÂN TÍCH MÔ HÌNH PHÂN RÃ PHÂN CẤP 106

2.1.Giải pháp thuận và giải pháp nghịch 107

5.1.Chiến lược 2 và bộ lập kế hoạch truy hồi 125

5.2.Chiến lược 3 và bộ lập kế hoạch truy hồi 131

6SO SÁNH LẬP TRÌNH KẾ HOẠCH VÀ LẬP TRÌNH THEO LÝTHUYẾT ĐỒ THỊ 136

Trang 11

6.2.Đối với lập trình kế hoạch 136

Trang 13

Năm 1971, Fikes và Nilsson xây dựng hệ lập kế hoạch quan trọngđầu tiên STRIPS mô tả sự tương tác của ba ảnh hưởng này STRIPS đượcthiết kế như thành phần lập kế hoạch của phần mềm cho dự án robotShakey ở Học viện nghiên cứu quốc tế Stanford (SRI) Cấu trúc điềukhiển toàn thể của nó được mô hình theo GPS và sử dụng QA3 như là thủtục con để thiết lập điều kiện tiên quyết của hành động.

Năm 1986, Lifschitz đưa ra những phê bình chi tiết và sự phân tíchchính thức đối với hệ thống STRIPS.

Năm 1992, Bylander thể hiện việc lập kế hoạch đơn giản theo dạngSTRIPS, đó là PSPACE hoàn chỉnh.

Trang 14

Năm 1993, Fikes và Nilsson tiến hành triển lãm lịch sử trên dự ánSTRIPS, và chỉ ra cái nhìn tổng quan về mối quan hệ của nó với nhữngkết quả lập kế hoạch gần đây.

Trong nhiều năm, sự lộn xộn của những thuật ngữ bao trùm lĩnhvực lập kế hoạch:

• Năm 1987, Genesereth và Nilsson sử dụng thuật ngữ linear để chỉtrật tự tổng thể và nonlinear chỉ trật tự cục bộ.

• Năm 1975, Sacerdoti sử dụng linear để chỉ thuộc tính mà ta gọi làkhông thể xen kẻ Với tập các mục tiêu con cho trước, bộ lập kếhoạch không xen kẻ này có thể tìm thấy những kế hoạch để giảiquyết mỗi mục tiêu con, nhưng sau đó bộ lập kế hoạch chỉ có thểliên kết chúng bằng cách đặt các bước của kế hoạch con trước haysau các bước của những kế hoạch khác Ở thập niên 70, nhiều bộlập kế hoạch là không xen kẻ được, nên chúng không hoàn chỉnh –chúng không luôn luôn tìm ra giải pháp mặc dù giải pháp đó tồntại.

Năm 1975, Waldinger giới thiệu cách lập kế hoạch hồi quy mục tiêu,cách này tiến đến kế hoạch trật tự tổng thể được sắp xếp lại để tránh sựmâu thuẩn giữa các mục tiêu con Năm 1974, cách này cũng được sửdụng bởi bộ lập kế hoạch WARPLAN của Warren WARPLAN là bộ lậpkế hoạch đầu tiên sử dụng ngôn ngữ lập trình logic (Prolog) Năm 1975,Tate với bộ lập kế hoạch INTERPLAN cho phép xen kẽ tuỳ ý các bướckế hoạch để vượt qua Sussman.

Năm 1975, 1977, Sacerdoti đưa ra bộ lập kế hoạch NOAH đi tiênphong trong việc xây dựng những kế hoạch trật tự cục bộ, và nó đượckhai thác kỹ lưỡng trong hệ NONLIN của Tate (1977), và giữ lại cấu trúckhái niệm của bộ lập kế hoạch INTERPLAN NONLIN cũng là bộ lập kế

Trang 15

hoạch đầu tiên sử dụng thuật toán rõ ràng để xác định những điều kiệnđúng sai ở những điểm khác nhau trong kế hoạch cục bộ.

Năm 1987, Chapman đưa ra TWEAK chính thức là hệ lập kế hoạchthứ tự cục bộ Chapman cung cấp sự phân tích chi tiết, bao gồm việcchứng minh tính hoàn chỉnh và khó khăn của việc thiết lập những bàitoán lập kế hoạch khác nhau và các thành phần con của nó Thuật toánPOP sử dụng trong luận văn này dựa trên thuật toán SNLP do Soderlandvà Weld đưa ra năm 1991, thuật toán này là một cài đặt của bộ lập kếhoạch mô tả bởi McAllester và Rosenblitt năm 1991.

Năm 1986, tại hội thảo Timberline đã trình bày những bài báo quan trọng

về lập kế hoạch Reading in Planning (Allen và những người khác, 1990)là tập hợp nhiều bài báo tốt nhất trong lĩnh vực này Planning and

Control (Dean và Wellman, 1991) là sách giáo khoa hay giới thiệu tổng

quát về lập kế hoạch, và điều đặt biệt chú ý ở đây là vì nó tạo ra một kếtquả đặt biệt để kết hợp những kỹ thuật AI planning cổ điển với lý thuyếtđiều khiển cổ điển và hiện đại, sự suy luận, lập kế hoạch tương tác vàgiám sát thực thi.

Năm 1994, Weld cung cấp cái nhìn đặt sắc về các thuật toán lập kếhoạch hiện đại.

Nghiên cứu planning tập trung vào AI vì đây là điểm xuất phát củanó, những bài báo về planning đóng vai trò chủ đạo trong những tạp sanvà hội nghị AI, nhưng cũng có những hội nghị đặt biệt dành riêng choplanning, như hội nghị Timberline, hội nghị DARPA, 1990 với nhữngtiếp cận mới như lập kế hoạch, lập lịch và điều khiển hay những hội nghịquốc tế về các hệ AI Planning.

Trang 16

CHƯƠNG 1:

CÁC KHÁI NIỆM CƠ BẢN

1 Các thuật ngữ chung trong lập kế hoạch2 Bản chất của vấn đề lập kế hoạch

3 Một số ứng dụng của lập kế hoạch trong thực tế

Trang 17

CHƯƠNG 1:

CÁC KHÁI NIỆM CƠ BẢN

1 CÁC THUẬT NGỮ CHUNG TRONG LẬP KẾ HOẠCH

Agent - Tác nhân

Là những gì nhận thức từ môi trường xung quanh qua cơ quan cảm giácvà phản ứng trở lại môi trường qua cơ quan phản ứng Ví dụ: con người,robot,

Goal state - Trạng thái mục tiêu

Trạng thái cuối cùng agent cần đạt được sau khi thực hiện kế hoạch.

Initial state - Trạng thái ban đầu

Trang 18

Trạng thái ban đầu agent có trước khi thực hiện bất kỳ hành động nào.

Agent program - Chương trình tác nhân

Đoạn chương trình cụ thể cài đặt cho một agent cụ thể

Environment - Môi trường

Là tất cả những gì xung quanh agent, cung cấp tri thức cho agent và nhậnnhững phản ứng của agent.

World state - Trạng thái môi trường

Trạng thái môi trường xung quanh agent được xác định trong những thờiđiểm cụ thể.

Plan library - Thư viện kế hoạch

Tập luật về các hành động của agent, đây là tập các kế hoạch, thư việntuy không đầy đủ tất cả các kế hoạch nhưng thư viện này có thể cập nhật

Trang 19

State space - Không gian trạng thái

Bao gồm những trạng thái có thể có của agent khi thực hiện hành động.Đối với bài toán cụ thể, không gian trạng thái là hữu hạn.

Plan space - Không gian kế hoạch

Chứa những kế hoạch của agent Không giống như thư viện kế hoạch,không gian kế hoạch có thể trùng lắp Vì thế không gian kế hoạch thườngvô hạn.

Solution - Giải pháp

Là những kế hoạch thu được mục tiêu.

Causal link - Liên kết nhân quả

Là những liên kết tất yếu, khi thực hiện hành động này chắc chắn thuđược trạng thái kia.

2 BẢN CHẤT CỦA VẦN ĐỀ LẬP KẾ HOẠCH

Lập kế hoạch cũng là một cách tiếp cận để giải quyết bài toán như baocách tiếp cận khác Tuy nhiên, điều khác biệt của lập kế hoạch so vớinhững cách tiếp cận đó là nó tạo ra một agent để xử lí và thực thi hànhđộng trong môi trường cụ thể của bài toán Agent này có cơ quan cảmgiác để cảm nhận và cập nhật tri thức từ môi trường và có cơ quan phảnứng để thực thi các hành động mà agent đưa ra Điều quan trọng nhất

Trang 20

trong agent này là bộ lập kế hoạch, bộ lập kế hoạch tiếp nhận tri thức, xửlí và đưa ra những kế hoạch phù hợp.

Trong luận văn này, do sự giới hạn về nhiều mặt, chúng tôi khôngthể xây dựng các cơ quan cảm giác và cơ quan phản ứng, chỉ xây dựng bộlập kế hoạch tổng quát của agent.

3 MỘT SỐ ỨNG DỤNG CỦA LẬP KẾ HOẠCH TRONGTHỰC TẾ

3.1 Robot sắp xếp các khối

Bài toán như sau: có tập hợp các khối lập phương trên bàn Các khối cóthể sắp xếp thành đống, nhưng chỉ có một khối có thể nằm trên một khốikhác Một cánh tay robot có thể nhấc một khối lên và di chuyển đến vị tríkhác: lên trên bàn hay lên trên một khối khác Trong một thời điểm cánhtay chỉ có thể nhấc một khối, vì vậy nó không thể nhấc một khối đang ởdưới một khối khác Mục tiêu sẽ luôn luôn là xây dựng một hay nhiềuđống các khối, cụ thể là giới hạn khối nào trên khối nào Ví dụ, trạng tháiban đầu của các khối như sau:

Hình 1.1 Trạng thái ban đầu của các khối trong bài toán sắp xếp các khối

Trang 21

Mục tiêu là: khối C trên khối A và khối B trên bàn.

Hình 1.2 Mục tiêu của bài toán sắp xếp các khối

Kế hoạch như sau:

3.2 Robot mua hàng hoá

Có một robot đang ở nhà, chủ nhà cần mua một bếp ga, cà chua và nướctương Bộ lập kế hoạch phải lập ra kế hoạch để robot đến cửa hàng điệnmáy mua bếp ga, đến siêu thị mua nước tương và cà chua sao cho nhanhnhất về thời gian hay ít tốn kém nhất về tiền bạc và quay về nhà.

Nhấc Bê

Trang 23

Hình 2.1 thể hiện sự tương tác giữa agent và môi trường xungquanh nó qua các cơ quan cảm giác và cơ quan phản ứng.

Ví dụ:

− Agent con người có mắt, tai và các cơ quan khác là cơ quan cảmgiác, còn tay, chân, miệng và các phần cơ thể khác là các cơ quanphản ứng.

cơ quan vận độngmôi

cơ quan cảmiá

tri thức

hành động

Hình 2.1 agent tương tác với môi trường qua cơ quan cảm giác và cơ quan phản ứng



Trang 24

− Agent robot với camera và các bộ dò tìm là cơ quan cảm giác, cácđộng cơ khác là cơ quan phản ứng.

− Agent phần mềm mã hoá những dòng bit thành tri thức và hànhđộng của nó.

Không có những đặt trưng rõ ràng để chia môi trường thành agent vànon-agent Ví dụ, cái đồng hồ có thể là agent, cũng có thể là non-agent.Bình thường nó là một agent có ý thức luôn hành động đúng nghĩa là luônchạy đúng giờ Nhưng khi ta đi từ Việt Nam sang Nhật, nếu đồng hồ làmột agent có ý thức nó phải tự động tăng hai giờ nữa, nhưng thực tếkhông phải vậy Lúc này đồng hồ chỉ là vật vô tri, ta gọi nó là non-agent.

1.2 Hành động của agent

Agent có ý thức luôn hành động đúng, hành động đúng làm cho agent

thành công Vấn đề đặt ra là sự thành công của agent được đánh giá như

thế nào và khi nào?

Để đánh giá như thế nào là một agent thành công các chuyên gia

đưa ra nguyên tắt độ đo thực thi Độ đo này đánh giá mức độ hành độngcủa agent Ví dụ, một robot dỡ hàng, độ đo hợp lí sẽ đo số hàng hoá dỡđược trong một ca 8 giờ Độ đo tinh vi hơn còn xét đến năng lượng tiêuthụ (xăng, dầu,…) và tiếng ồn phát ra Tuy nhiên, không có độ đo cố địnhnào phù hợp với tất cả các agent.

Đánh giá khi nào là rất quan trọng Qua đó có thể biết agent nào

làm việc nhanh, agent nào lười biếng.

Các chuyên gia luôn muốn tạo ra một agent sáng suốt Agent nàybiết trước kết quả của những hành động mà nó thực hiện, nhưng điều nàykhông khả thi trong thực tế Vì các agent thường thực hiện hành động màkhông biết kết quả thế nào Trừ khi nó thực hiện một “quẻ bói” Tuy

Trang 25

hiện hành động mà nó cho là đúng, dựa vào tác động của ngữ cảnh,những kết quả có thể không như mong muốn.

Tóm lại, để biết một agent hoạt động tốt hay không ở một thờiđiểm nào đó, ta dựa vào 4 yếu tố sau:

• Độ đo thực thi định nghĩa mức độ thành công.

• Tất cả mọi điều mà agent nhận thức được từ trước đến nay Lịchsử tri thức hoàn chỉnh này được gọi là chuỗi nhận thức.

• Những gì mà agent biết về môi trường.• Những hành động mà agent có thể thực thi.

Một agent là một ánh xạ từ những chuỗi nhận thức sang các hànhđộng.

Giả sử rằng hành vi của agent chỉ phụ thuộc vào chuỗi nhận thứccủa nó, thì bất kỳ một agent cụ thể nào cũng có thể được mô tả bằng mộtbảng gồm các hành động tương ứng với mỗi chuỗi nhận thức (Đối vớihầu hết các agent, bảng này gồm một danh sách rất dài – vô hạn, trừ khinó được giới hạn chiều dài của chuỗi nhận thức được xem xét.) Danhsách này được gọi là một ánh xạ từ các chuỗi nhận thức sang các hànhđộng Nói chung, chúng ta có thể tìm thấy ánh xạ mô tả chính xác agentbằng cách thử tất cả các chuỗi nhận thức và ghi lại các hành động tươngứng mà agent thực hiện (Nếu agent sử dụng các giá trị ngẫu nhiên, thìphải thử những chuỗi nhận thức vài lần để lấy giá trị trung bình về hànhvi của agent.) Một ánh xạ thể hiện một agent và ánh xạ lí tưởng sẽ thểhiện agent lí tưởng Để thiết kế agent lí tưởng cần xác định những hànhđộng mà agent phải thực hiện dựa trên chuỗi tri thức đã có.

Tuy nhiên, không nhất thiết phải tạo một bảng chi tiết cho mọichuỗi nhận thức Ta có thể định nghĩa một ánh xạ cụ thể mà không cầnphải liệt kê tường tận nó Xét ví dụ sau: một agent đơn giản là hàm tính

Trang 26

căn bậc 2 Chuỗi nhận thức của agent này là chuỗi các thao tác gõ phímbiểu diễn một số thực Hành động là thể hiện một số lên màn hình Phép

ánh xạ lí tưởng khi agent nhận được một số x dương, hành động đúnghiển thị một số z dương ứng với z2≈ x, với độ chính xác là 15 chữ số thập

phân Như đã nói phép ánh xạ không yêu cầu người thiết kế phải xâydựng chính xác một bảng gồm căn bậc 2 của các số Và hàm căn bậc 2cũng không cần phải sử dụng bảng thì mới hành động chính xác Bảngsau đây thể hiện sự ánh xạ lí tưởng và chương trình đơn giản được cài đặttheo phương pháp Newton.

Ví dụ căn bậc hai trên đã cho ta thấy mối quan hệ giữa phép ánh xạ lítưởng và việc thiết kế agent lí tưởng với những tác vụ rất hạn chế Tuyrằng bảng mô tả thì rất lớn nhưng chương trình lại nhỏ gọn Điều này nóilên rằng, ta có thể thiết kế các agent tốt, nhỏ gọn, cài đặt phép ánh xạ lýtưởng cho những ngữ cảnh tổng quát hơn: các agent có thể giải quyết cácnhiệm vụ không giới hạn, trong các môi trường không giới hạn.

thức x

Hành động z

1.0000000000000001.0188088481701521.0954451150103321.1401754250991381.1832159566199231.2247448713915891.2649110640673521.3038404810405301.3416407864998741.378404875209022

Trang 27

Loại agentTri thứcHành độngMục đíchMôi trường

Hệ thốngchẩn đoán ykhoa

Các triệuchứng và cáccâu trả lờicủa bệnhnhân

Hỏi, kiểmtra và trịbệnh

Bệnh nhânkhoẻ mạnh,giá cả tốithiểu

Bệnh nhân,bệnh viện

Hệ thốngphân tíchảnh vệ tinh

thay đổi củacác pixel,màu sắc

In ảnh theophân loại

Hoàn thànhviệc phânloại

Ảnh từ vệtinh trên quỹđạo của nó

Dạy TiếngAnh giaotiếp

Các từ đượcnhập vào

In bài tập,gợi ý, sữa lỗi

Điểm tối đacủa sinh viêntrong bàikiểm

Sinh viên

Các agent thông minh thường được xây dựng theo một sườn chung, cụ

thể là, nhận tri thức từ môi trường và tạo ra hành động Ví dụ một agentprogram rất đơn giản:

Trang 28

Mỗi agent sử dụng vài cấu trúc dữ liệu bên trong, chúng sẽ được cập nhậtmỗi khi tri thức mới được đưa vào.

Hai vấn đề cần lưu ý khi xây dựng agent program:

− Thứ nhất, mặc dù phép ánh xạ agent được định nghĩa là một hàmtừ các chuỗi nhận thức đến các hành động, nhưng agent programchỉ nhận các nhận thức đơn giản làm đầu vào của nó Chuỗi nhậnthức được tạo trong bộ nhớ.

− Thứ hai, agent có thể không thể hiện độ đo thực thi Vì độ đo thựcthi thường được dùng để điều chỉnh hành vi của agent, nên ta vẫncó thể có những hành vi phù hợp mà không cần tri thức rõ ràng vềđộ đo thực thi.

Agent program đơn giản nhất là dùng bảng tra Nó thao tác bằng cách lưutoàn bộ chuỗi tri thức trong bộ nhớ và sử dụng chỉ mục trong bảng chỉđến những hành động tương ứng cũng được lưu trong bảng Tuy nhiên,agent này có các khuyết điểm sau:

a) Đối với một bài toán đơn giản agent cũng cần một bảng chỉ mụcrất lớn.

b) Để xây dựng bảng tra, người thiết kế phải mất rất nhiều thời gian.c) Agent không tự động, vì tất cả những hành động tốt nhất người

thiết kế đã tính toán và xây dựng sẵn cho agent Vì vậy, nếu môi

function AGENT(nhận thức) returns hành động

static: bộ nhớ, bộ nhớ lưu nhận thức và hành động của agent

đối với môi trường

bộ nhớ – CẬP NHẬT TRI THỨC(bộ nhớ, tri thức)hành động – CHỌN HÀNH ĐỘNG TỐT NHẤT(bộ nhớ)bộ nhớ – CẬP NHẬT HÀNH ĐỘNG(bộ nhớ, hành động)

return hành động

Trang 29

trường thay đổi trong những tình huống không dự đoán trước thìagent sẽ thất bại.

d) Thậm chí nếu ta cho agent cơ chế tự học để có mức độ tự độngnào đó thì agent cũng phải học mãi mãi những giá trị đúng cho tấtcả các entry của bảng.

1.4 Các yếu tố để xây dựng agent program

Xây dựng agent program phụ thuộc vào rất nhiều yếu tố Do đó, agentprogram thường được tạo ra cho một bài toán cụ thể Các yếu tố quantrọng nhất là:

a) Nhận thức, để có được nhận thức về môi trường agent phải trangbị các cơ quan phản ứng phù hợp

b) Hành độngc) Mục tiêu

d) Môi trường cụ thể mà agent hành động.

Agent phải quen thuộc với con người, nghĩa là nó phải nhận thức và hànhđộng như thói quen của con người Thường có thể dự đoán trước tìnhhuống, trước khi con người nhắc nhở Ví dụ, để xây dựng agent lái taxi tựđộng cần xác định được các yêu cầu sau:

Tài xếtaxi

Camera, đồnghồ tốc độ,GPS, hệthống định vị,mirophone

Lái xe, tăngtốc, thắng lại,trao đổi vớihành khách

An toàn,nhanh, đúngluật, giaothông thuậntiện, thuận lợitối đa

đường phố,các kiểu giaothông khácnhau, kháchbộ hành,hành khách

Trang 30

Agent này có các yêu cầu chất lượng như: xác định đúng vị trí, tiêu tốnnăng lượng ít nhất, thời gian hay chi phí lưu thông ít nhất hoặc cả hai, khảnăng vi phạm luật giao thông là nhỏ nhất, và không làm phiền đến nhữngngười lái khác, an toàn và tiện nghi cho hành khách là lớn nhất, thuận lợitối đa Dĩ nhiên, với các mục tiêu có mâu thuẩn này ta phải thỏa thuận đểgiải quyết.

Yếu tố cuối cùng khi thiết kế agent này là agent sẽ hoạt động trongmôi trường như thế nào, trong các con đường nội thành hay ngoài xa lộ?Ở nơi có đầy tuyết hay hầu như không có tuyết Nó luôn chạy bên phảihay ta muốn nó đủ tinh vi để biết nên lái xe bên phải hay bên trái như ởAnh hay Nhật? Rõ ràng môi trường được giới hạn càng hẹp thì càng dễdàng thiết kế bài toán.

1.5 Cấu trúc agent

Giả sử agent program chạy trên vài thiết bị máy tính được gọi là kiếntrúc Chương trình được chọn phải là chương trình mà kiến trúc chấpnhận và chạy được Kiến trúc thường là một máy tính thuần tuý hoặc cóthể là những phần cứng cụ thể phục vụ cho những tác vụ nào đó, như xửlí ảnh camera hay lọc tín hiệu âm thanh Kiến trúc cũng có thể chứanhững phần mềm phục vụ cho việc lập trình cấp cao Nói chung kiến trúcđưa nhận thức thu được từ cơ quan cảm giác vào chương trình, chạychương trình và cho phép các hành động của chương trình lựa chọn cơquan phản ứng khi nó được tạo ra Mối quan hệ giữa agent, kiến trúc vàchương trình được tóm tắt như sau:

agent = kiến trúc + chương trình

Khi có tri thức mới vào, agent program cập nhật chúng vào các cấu trúcdữ liệu Các cấu trúc dữ liệu này sẽ được thao tác bởi các hàm thực hiện

Trang 31

quyết định của agent để tạo ra hành động, sau đó các hành động này sẽđược đưa vào kiến trúc để thực thi.

1.6 Các loại agent

Xây dựng agent là cài đặt sự ánh xạ từ nhận thức sang hành động Vớimỗi khía cạnh khác nhau có các loại agent program khác nhau Có 4 loạiagent:

• Agent phản xạ đơn giản• Agent lưu giữ sự kiện• Agent dựa trên mục tiêu• Agent dựa trên tiện ích

1.6.1 Agent phản xạ đơn giản

Loại agent này sử dụng bảng tra để lưu giữ những hành động phản hồicủa tri thức và bảng tra này thường rất lớn Ví dụ như đầu vào từ mộtcamera có tốc độ 50 meagbyte/giây (25 khung/giây, 1000×1000 pixel với8 bit màu và 8 bit thông tin) thì bảng tra trong một giờ sẽ là 260×60×50Mmục.

Tuy nhiên, các thành phần trong bảng có thể được tóm tắt bằngcách ghi lại các liên kết nhập/xuất chắc chắn xuất hiện thường xuyên Vídụ, nếu xe phía trước thắng, đèn thắng của nó bật lên, người lái xe phảichú ý điều này và chuẩn bị thắng Nói cách khác, dữ liệu vào lập ra điềukiện “Xe phía trước thắng” tạo ra sự liên kết với hành động “chuẩn bị

thắng” Những liên kết này được gọi là luật điều kiện-hành động hayluật ngữ cảnh-hành động, hay luật if…then….

Ví dụ:

if xe trước thắng then chuẩn bị thắng

Trang 32

Hình 2.2 thể hiện cấu trúc của một agent phản xạ đơn giản ở dạng biểuđồ, thể hiện cách các luật điều kiện-hành động cho phép agent thực hiệnsự kết nối từ tri thức đến hành động Hình chữ nhật thể hiện trạng tháihiện hành bên trong quá trình quyết định của agent, hình oval thể hiệnthông tin nền sử dụng trong quá trình này.

Agent program của agent phản xạ có thể được cài đặt như sau:

function AGENT PHẢN XẠ ĐƠN GIẢN(tri thức) returns hành

static: tập luật, tập các luật điều kiện – hành động

trạng thái – CHUẨN HOÁ ĐẦU VÀO(tri thức)luật – TÌM LUẬT PHÙ HỢP(trạng thái, tập luật)hành động – LẤY HÀNH ĐỘNG (luật)

return hành động

Agent phản xạ đơn giản Hoạt động bằng cách tìm kiếm các luật có các điều kiện phùhợp với ngữ cảnh hiện tại (do tri thức định nghĩa), sau đó thực hiện những hành độngliên quan đến luật đó.

Cơ quan cảm giác

Môi trường nhưthế nào?

Bây giờ, tôi nênthực hiện hànhđộng nào?Các luật điều kiện-

hành động

Cơ quan phảnứng

Trang 33

Hàm CHUẨN HOÁ ĐẦU VÀO tạo ra sự mô tả trạng thái hiện hành từnhững tri thức Hàm TÌM LUẬT PHÙ HỢP trả về luật đầu tiên được tìmthấy trong tập luật phù hợp với trạng thái đã mô tả.

Agent này rất dễ cài đặt, nhưng khả năng của nó rất hạn chế vì nhữngnguyên nhân sau:

a) Agent sử dụng tập luật do người thiết kế tạo ra trước, nên agent chỉcó thể phản ứng theo những gì có sẵn trong tập luật Khi môitrường có những thay đổi ngoài dự kiến, agent không biết phảihành động thế nào

b) Bảng tra thường quá lớn, agent phải tìm kiếm khá lâu để có đượcluật phù hợp.

1.6.2 Agent lưu vết môi trường

Agent phản xạ đơn giản chỉ làm việc khi tri thức đầu vào phù hợp vớinhững gì đã thiết kế Trong những trường hợp có quá nhiều tri thức gầngiống nhau, chẳng hạn xe không chỉ có đèn thắng mà còn đèn sau, đènquẹo trái, đèn quẹo phải,… agent phản xạ đơn giản phải lưu trữ sẵn tất cảcác trạng thái bên trong đã sắp xếp để lựa chọn hành động.

Agent phản xạ theo môi trường giải quyết vấn đề này bằng cáchcập nhật thông tin trạng thái bên trong Nó yêu cầu agent program chứahai loại tri thức Một là, thông tin về sự phát triển của môi trường độc lậpvới agent Hai là, thông tin về những hành động của agent ảnh hưởng đếnmôi trường.

Hình 2.3 biểu diễn cấu trúc của agent phản xạ, thể hiện sự liên kếtgiữa tri thức hiện tại và trạng thái trước để tạo ra những mô tả được cậpnhật của trạng thái hiện hành.

Trang 34

Agent program của agent phản xạ theo môi trường có thể được cài đặtnhư sau:

Trong agent program trên, hàm CẬP NHẬT TRẠNG THÁI tạo ra sự môtả trạng thái mới bên trong cùng với việc giải thích tri thức mới để làm rõhơn những tri thức đang tồn tại về trạng thái, nó sử dụng thông tin vềcách môi trường phát triển để lưu giữ những phần không nhìn thấy của

function AGENT PHẢN XẠ THEO MÔI TRƯỜNG (tri thức)returns hành động

static: trạng thái, mô tả trạng thái hiện tại của môi trường

tập luật, tập luật điều kiện-hành động

trạng thái – CẬP NHẬT TRẠNG THÁI(trạng thái, tri thức)luật – TÌM LUẬT PHÙ HỢP(trạng thái, tập luật)

Cơ quan cảmiá

Môi trường nhưthế nào?

Bây giờ tôi nênthực hiện hànhđộng nào?Trạng thái

Môi trường tiến triểnnhư thế nào?

Hành động của tôi làmgì?

Các luật điều hành động

kiện-Cơ quan phảnứ

Trang 35

môi trường, và cũng để biết về những hành động của agent làm gì đối vớitrạng thái môi trường đó.

1.6.3 Agent dựa trên mục tiêu

Một agent biết về trạng thái của môi trường không phải luôn quyết địnhđược mình phải làm gì Ví dụ, khi đến giao lộ, taxi có thể rẽ trái, phải hayđi thẳng Quyết định đúng sẽ phụ thuộc vào nơi mà taxi muốn đến Haynói cách khác, cùng với sự mô tả trạng thái hiện hành, agent cần thông tinmục tiêu đã sắp xếp, các thông tin này mô tả ngữ cảnh yêu cầu, ví dụ nơiđến của hành khách Agent liên kết thông tin này với thông tin kết quảcủa những hành động có khả năng thực hiện, để chọn những hành độngđạt được mục tiêu Đôi khi việc phối hợp này rất đơn giản, kết quả phùhợp ngay với mục tiêu chỉ với một hành động đơn giản Nhưng đôi khi lạirất phức tạp, agent phải xem xét một chuỗi dài những hành động lẩn quẩnđể tìm con đường đi đến mục tiêu.

Việc thực hiện quyết định của agent này về cơ bản khác với cácluật điều kiện-hành động, vì nó phải xét đến tương lai – các câu hỏi đặt ranhư là “Cái gì sẽ xảy ra nếu tôi làm như vậy?” và “Điều đó có làm tôi hàilòng không?” Trong việc thiết kế agent phản xạ các câu hỏi này khôngđược sử dụng tường minh, vì người thiết kế đã tính trước những hànhđộng chính xác trong những trường hợp khác nhau Ví dụ, agent phản xạsẽ thắng lại khi thấy đèn thắng của xe trước bật lên Nhưng agent dựa trênmục tiêu lập luận rằng, khi thấy đèn thắng của xe trước bật lên, nó sẽ đichậm lại, mục tiêu là không có sự va chạm giữa các xe Mặc dù agent nàykém hiệu quả hơn, nhưng nó tinh vi hơn Nó có thể tự động cập nhật trithức mới một cách hiệu quả khi môi trường thay đổi để phù hợp với điềukiện mới Trong khi đó agent phản xạ phải viết lại một số lớn các luậtđiều kiện-hành động Vì vậy nó có thể đạt được các mục đích khác nhaubằng cách tiếp cận các hành vi mới.

Trang 36

Hình 2.4 thể hiện cấu trúc của agent dựa trên mục tiêu.

1.6.4 Agent dựa trên tính hiệu quả

Chỉ những mục tiêu thôi chưa đủ để agent tạo ra những hành vi có hiệuquả cao Ví dụ, có rất nhiều chuỗi hành động để taxi đi đến nơi cần đến,như vậy ta thu được mục tiêu, nhưng có cái nhanh hơn, có cái an toànhơn, chắc chắn hơn, rẽ hơn, v.v… Các mục tiêu chỉ đưa ra sự phân biệtđơn thuần giữa hai trạng thái “hài lòng” và “không hài lòng” Trong khiđó, độ đo mức độ thực thi tổng quát sẽ so sánh sự khác nhau giữa nhữngtrạng thái môi trường, qua đó có thể xác định agent hài lòng như thế nàokhi thực hiện các chuỗi hành động đó Bởi vì “hài lòng” không có cơ sở

Trạng thái

Môi trường tiến triểnnhư thế nào?

Hành động của tôi làmgì?

Các mục tiêu

Cơ quan cảm giác

Bây giờ môi trườngnhư thế nào?

Sẽ như thế nào nếutôi thực hiện hànhđộng A?

Bây giờ tôi nên thựchiện hành động nào?

Cơ quan phảnứng

Trang 37

khoa học, nên thuật ngữ thông thường nói rằng, nếu môi trường này tốthơn môi trường kia thì nó mang lại hiệu quả cao hơn cho agent.

Tính hiệu quả là một độ đo mức độ hài lòng của agent Xác địnhchính xác tính hiệu quả sẽ giúp đưa ra các quyết định hợp lí trong cáctrường hợp khó khăn Đó là, khi các mục tiêu mâu thuẫn nhau, agent chỉthu được vài mục tiêu (ví dụ, tốc độ và an toàn), tính hiệu quả giúp chỉ ranhững thỏa thuận thích hợp hay khi có những mục tiêu mà agent khó cóthể đạt được, tính hiệu quả có thể đưa ra các cách mà khả năng thànhcông có thể ảnh hưởng xấu đến mục tiêu.

Agent có tính hiệu quả rõ ràng có thể thực hiện các quyết định hợplý, nhưng cũng phải so sánh các hiệu quả đã thu được bởi các chuỗi hànhđộng khác nhau Mặc dù vậy, nếu chỉ với các mục tiêu thô, cũng có thểlàm cho agent lựa chọn hành động đúng hướng nếu nó phù hợp với mụctiêu Đôi khi, chức năng hiệu quả có thể chuyển thành tập các mục tiêu.Như vậy, những quyết định do agent dựa trên mục tiêu thực hiện cũngtương ứng với những quyết định do agent dựa trên tính hiệu quả thựchiện.

Trang 38

Hình 2.5 thể hiện cấu trúc tổng quát của một agent dựa trên tính hiệu quả.

2 MÔI TRƯỜNG2.1 Khái niệm

Môi trường là tất cả những gì xung quanh agent, cung cấp nhận thức choagent và agent tác động trở lại môi trường qua những hành động của nó.Trong môi trường này, ngoài agent được quan sát còn có nhiều agentkhác.

Trạng thái

Môi trường tiến triểnnhư thế nào?

Hành động của tôi làmgì?

Hiệu quả

Cơ quan phảnứng

Môi trường như thếnào?

Sẽ như thế nào nếutôi thực hiện hànhđộng A?

Bây giờ tôi nên thựchiện hành động nào?

Cơ quan phảnứng

Hình 2.5 Agent dựa trên tính hiệu quả hoàn chỉnh

Tôi hài lòng thế nàovới trạng thái này?

Trang 39

2.2 Các loại môi trường và thuộc tính của nó

2.2.1 Môi trường tiếp cận được và không tiếp cậnđược

Môi trường gọi là tiếp cận được đối với một agent nào đó, nếu các côngcụ cảm biến của nó có thể truy cập đến trạng thái hoàn chỉnh của môitrường đó Môi trường có thể được tiếp cận một cách hiệu quả nếu các cơquan cảm biến của agent có thể dò tìm tất cả các khía cạnh phù hợp đểlựa chọn hành động Môi trường tiếp cận được rất thuận lợi bởi vì agentkhông cần phải lưu bất kỳ trạng thái bên trong nào để theo dõi môitrường.

2.2.2 Môi trường xác định và không xác định

Nếu ta có thể xác định trạng thái kế tiếp của môi trường khi biết đượctrạng thái hiện hành và những hành động agent chọn, thì ta gọi đó là môitrường xác định Về nguyên tắc thì agent không phải lo gì về những thayđổi của môi trường tiếp cận được và xác định Tuy nhiên, nếu môi trườngkhông thể truy cập thì nó có thể là không xác định Và đối với những môitrường phức tạp thì rất khó để theo dõi tất cả các khía cạnh không xácđịnh Như vậy, tùy theo góc nhìn của agent mà đánh giá môi trường làxác định hay không xác định.

2.2.3 Môi trường episodic và nonepisodic

Trong môi trường episodic, người ta chia kinh nghiệm của agent thànhcác “episodic” Mỗi episodic bao gồm nhận thức và hành động của agent.Hiệu quả của hành động mà agent thực hiện chỉ phụ thuộc vào episodiccủa nó, vì các episodic sau không phụ thuộc vào các hành động xuất hiệnở các episodic trước.

Trang 40

2.2.4 Môi trường tĩnh và động

Nếu môi trường có khả năng thay đổi trong khi agent đang tính toán, nóđược gọi là môi trường động, ngược lại là môi trường tĩnh Môi trườngtĩnh là môi trường dễ dàng cho agent, bởi vì nó không cần phải lưu giữnhững quan sát môi trường trong khi quyết định một hành động, cũngkhông lo thời gian trôi qua làm thay đổi trạng thái môi trường Nếu môitrường không thay đổi theo thời gian, nhưng kết quả thực thi lại thay đổithì ta gọi đó là môi trường bán tĩnh.

2.2.5 Môi trường rời rạc và liên tục

Nếu có sự phân biệt rõ ràng những tri thức và hành động được định nghĩatrước thì ta gọi môi trường là rời rạc Ví dụ, trò chơi cờ là rời rạc – nó cósự di chuyển cố định trong mỗi lần đi Lái taxi và các phương tiện khác làliên tục - tốc độ và vị trí của taxi quét qua một dãy các giá trị liên tục.

Bảng sau đây nêu lên các thuộc tính của các môi trường quenthuộc Các câu trả lời có thể thay đổi phụ thuộc vào cách ta nhận thứcmôi trường và agent Ví dụ, bài xì phé là xác định nếu agent có thể theodõi các thẻ bài trên bàn, ngược lại là không xác định.

Ngày đăng: 10/11/2012, 08:11

HÌNH ẢNH LIÊN QUAN

MÔ HÌNH LẬP KẾ HOẠCH PHÂN RÃ PHÂN CẤP - Nghiên cứu planning để giải bài toán xác định lộ trình
MÔ HÌNH LẬP KẾ HOẠCH PHÂN RÃ PHÂN CẤP (Trang 12)
Hình 1.1. Trạng thái ban đầu của các khối trong bài toán sắp xếp các khối - Nghiên cứu planning để giải bài toán xác định lộ trình
Hình 1.1. Trạng thái ban đầu của các khối trong bài toán sắp xếp các khối (Trang 20)
Hình 1.1. Trạng thái ban đầu của các khối trong bài toán sắp xếp các khối - Nghiên cứu planning để giải bài toán xác định lộ trình
Hình 1.1. Trạng thái ban đầu của các khối trong bài toán sắp xếp các khối (Trang 20)
Hình 1.2. Mục tiêu của bài toán sắp xếp các khối - Nghiên cứu planning để giải bài toán xác định lộ trình
Hình 1.2. Mục tiêu của bài toán sắp xếp các khối (Trang 21)
Hình 1.2. Mục tiêu của bài toán sắp xếp các khối - Nghiên cứu planning để giải bài toán xác định lộ trình
Hình 1.2. Mục tiêu của bài toán sắp xếp các khối (Trang 21)
Hình 2.1 thể hiện sự tương tác giữa agent và môi trường xung quanh nó qua các cơ quan cảm giác và cơ quan phản ứng. - Nghiên cứu planning để giải bài toán xác định lộ trình
Hình 2.1 thể hiện sự tương tác giữa agent và môi trường xung quanh nó qua các cơ quan cảm giác và cơ quan phản ứng (Trang 23)
Hình 2.1 thể hiện sự  tương tác giữa agent và môi trường xung quanh nó qua các cơ quan cảm giác và cơ quan phản ứng. - Nghiên cứu planning để giải bài toán xác định lộ trình
Hình 2.1 thể hiện sự tương tác giữa agent và môi trường xung quanh nó qua các cơ quan cảm giác và cơ quan phản ứng (Trang 23)
Hình 2.2 thể hiện cấu trúc của một agent phản xạ đơn giản  ở dạng biểu đồ, thể hiện cách các luật điều kiện-hành động cho phép agent thực hiện sự kết nối từ tri thức  đến hành động - Nghiên cứu planning để giải bài toán xác định lộ trình
Hình 2.2 thể hiện cấu trúc của một agent phản xạ đơn giản ở dạng biểu đồ, thể hiện cách các luật điều kiện-hành động cho phép agent thực hiện sự kết nối từ tri thức đến hành động (Trang 32)
Hình 2.2. Cấu trúc dạng biểu đồ của một agent phản xạ đơn giản - Nghiên cứu planning để giải bài toán xác định lộ trình
Hình 2.2. Cấu trúc dạng biểu đồ của một agent phản xạ đơn giản (Trang 32)
Hình 2.3 Agent phản xạ với các trạng thái bên trong - Nghiên cứu planning để giải bài toán xác định lộ trình
Hình 2.3 Agent phản xạ với các trạng thái bên trong (Trang 34)
Hình 2.4 thể hiện cấu trúc của agent dựa trên mục tiêu. - Nghiên cứu planning để giải bài toán xác định lộ trình
Hình 2.4 thể hiện cấu trúc của agent dựa trên mục tiêu (Trang 36)
Hình 2.4 thể hiện cấu trúc của agent dựa trên mục tiêu. - Nghiên cứu planning để giải bài toán xác định lộ trình
Hình 2.4 thể hiện cấu trúc của agent dựa trên mục tiêu (Trang 36)
Hình 2.5 thể hiện cấu trúc tổng quát của một agent dựa trên tính hiệu quả. - Nghiên cứu planning để giải bài toán xác định lộ trình
Hình 2.5 thể hiện cấu trúc tổng quát của một agent dựa trên tính hiệu quả (Trang 38)
Hình 2.5 thể hiện cấu trúc tổng quát của một agent dựa trên tính hiệu quả. - Nghiên cứu planning để giải bài toán xác định lộ trình
Hình 2.5 thể hiện cấu trúc tổng quát của một agent dựa trên tính hiệu quả (Trang 38)
Hình 3.1. Bài toán agent làm sạch môi trường. - Nghiên cứu planning để giải bài toán xác định lộ trình
Hình 3.1. Bài toán agent làm sạch môi trường (Trang 46)
Hình 3.1. Bài toán agent làm sạch môi trường. - Nghiên cứu planning để giải bài toán xác định lộ trình
Hình 3.1. Bài toán agent làm sạch môi trường (Trang 46)
Hình 3.2 Bản đồ đơn giản của Romaria - Nghiên cứu planning để giải bài toán xác định lộ trình
Hình 3.2 Bản đồ đơn giản của Romaria (Trang 51)
Hình 3.2 Bản đồ đơn giản của Romaria - Nghiên cứu planning để giải bài toán xác định lộ trình
Hình 3.2 Bản đồ đơn giản của Romaria (Trang 51)
Hình 3.3 thể hiện sự mở rộng cây tìm kiếm đối với bài toán tìm đường đi từ Arad đến Bucharet. - Nghiên cứu planning để giải bài toán xác định lộ trình
Hình 3.3 thể hiện sự mở rộng cây tìm kiếm đối với bài toán tìm đường đi từ Arad đến Bucharet (Trang 54)
Hình 3.3 thể hiện sự mở rộng cây tìm kiếm đối với bài toán tìm đường đi từ Arad đến Bucharet. - Nghiên cứu planning để giải bài toán xác định lộ trình
Hình 3.3 thể hiện sự mở rộng cây tìm kiếm đối với bài toán tìm đường đi từ Arad đến Bucharet (Trang 54)
Hình 3.4 thể hiện mối quan hệ giữa ngữ nghĩa và câu: - Nghiên cứu planning để giải bài toán xác định lộ trình
Hình 3.4 thể hiện mối quan hệ giữa ngữ nghĩa và câu: (Trang 58)
Ta sử dụng bảng sự thật để thể hiện giá trị của các mệnh đề và liên từ: - Nghiên cứu planning để giải bài toán xác định lộ trình
a sử dụng bảng sự thật để thể hiện giá trị của các mệnh đề và liên từ: (Trang 62)
Hình 4.1 biểu diễn một phần rất nhỏ hai bước đầu tiên trong không gian tìm kiếm của bài toán này và chỉ ra con đường đểđi tới đích. - Nghiên cứu planning để giải bài toán xác định lộ trình
Hình 4.1 biểu diễn một phần rất nhỏ hai bước đầu tiên trong không gian tìm kiếm của bài toán này và chỉ ra con đường đểđi tới đích (Trang 73)
Hình 4.1. Giải quyết bài toán shopping bằng cách tìm kiếm tiến qua không gian ngữ cảnh trong môi trường. - Nghiên cứu planning để giải bài toán xác định lộ trình
Hình 4.1. Giải quyết bài toán shopping bằng cách tìm kiếm tiến qua không gian ngữ cảnh trong môi trường (Trang 73)
Hình 4.1 biểu diễn một phần rất nhỏ hai bước  đầu tiên trong không gian tìm kiếm của bài toán này và chỉ ra con đường để đi tới đích. - Nghiên cứu planning để giải bài toán xác định lộ trình
Hình 4.1 biểu diễn một phần rất nhỏ hai bước đầu tiên trong không gian tìm kiếm của bài toán này và chỉ ra con đường để đi tới đích (Trang 73)
Hình 4.3a thể hiện hai toán tử Start và Finish của kế hoạch. Hình (*) (b) thể hiện kế hoạch ban đầu của bài toán shoes-and-socks. - Nghiên cứu planning để giải bài toán xác định lộ trình
Hình 4.3a thể hiện hai toán tử Start và Finish của kế hoạch. Hình (*) (b) thể hiện kế hoạch ban đầu của bài toán shoes-and-socks (Trang 85)
Hình 4.4 thể hiện kế hoạch thứ tự cục bộ là giải pháp cho bài toán shoes- - Nghiên cứu planning để giải bài toán xác định lộ trình
Hình 4.4 thể hiện kế hoạch thứ tự cục bộ là giải pháp cho bài toán shoes- (Trang 86)
Hình 4.4 thể hiện kế hoạch thứ tự cục bộ là giải pháp cho bài toán shoes- shoes-and-socks và sáu kế hoạch tuyến tính khác - Nghiên cứu planning để giải bài toán xác định lộ trình
Hình 4.4 thể hiện kế hoạch thứ tự cục bộ là giải pháp cho bài toán shoes- shoes-and-socks và sáu kế hoạch tuyến tính khác (Trang 86)
Kế hoạch ban đầu của bài toán được mô tả theo dạng lược đồ ở hình 5.1. - Nghiên cứu planning để giải bài toán xác định lộ trình
ho ạch ban đầu của bài toán được mô tả theo dạng lược đồ ở hình 5.1 (Trang 92)
Hình 5.1 Kế hoạch ban đầu cho bài toán shopping - Nghiên cứu planning để giải bài toán xác định lộ trình
Hình 5.1 Kế hoạch ban đầu cho bài toán shopping (Trang 92)
Đường in đậm trong hình là liên kết nhân quả. Vídụ liên kết bên trái nhất trong hình có nghĩa là bướcBuy(Drill) được thêm vào để thu được điều kiện tiên quyếtHave(Drill) của bướcFinish - Nghiên cứu planning để giải bài toán xác định lộ trình
ng in đậm trong hình là liên kết nhân quả. Vídụ liên kết bên trái nhất trong hình có nghĩa là bướcBuy(Drill) được thêm vào để thu được điều kiện tiên quyếtHave(Drill) của bướcFinish (Trang 93)
Hình thứ hai trong hình 5.2 thể hiện ngữ  cảnh sau khi bộ  lập kế hoạch chọn lựa  để thu được điều kiện tiên quyết Sells bằng cách liên kết chúng với trạng thái ban đầu - Nghiên cứu planning để giải bài toán xác định lộ trình
Hình th ứ hai trong hình 5.2 thể hiện ngữ cảnh sau khi bộ lập kế hoạch chọn lựa để thu được điều kiện tiên quyết Sells bằng cách liên kết chúng với trạng thái ban đầu (Trang 93)
Hình 5.2 Hình trên: Kế hoạch cục bộ thu được ba trong số bốn  điều kiện tiên quyết của - Nghiên cứu planning để giải bài toán xác định lộ trình
Hình 5.2 Hình trên: Kế hoạch cục bộ thu được ba trong số bốn điều kiện tiên quyết của (Trang 93)
Hình 5.3 kế hoạch được mở rộng bằng cách chọn hai hành động Go - Nghiên cứu planning để giải bài toán xác định lộ trình
Hình 5.3 kế hoạch được mở rộng bằng cách chọn hai hành động Go (Trang 94)
Hình 5.3 kế hoạch được mở rộng bằng cách chọn hai hành động Go - Nghiên cứu planning để giải bài toán xác định lộ trình
Hình 5.3 kế hoạch được mở rộng bằng cách chọn hai hành động Go (Trang 94)
Hình 5.5 thể hiện một mâu thuẩn và cách giải quyết nó. - Nghiên cứu planning để giải bài toán xác định lộ trình
Hình 5.5 thể hiện một mâu thuẩn và cách giải quyết nó (Trang 95)
Hình 5.5 thể hiện một mâu thuẩn và cách giải quyết nó. - Nghiên cứu planning để giải bài toán xác định lộ trình
Hình 5.5 thể hiện một mâu thuẩn và cách giải quyết nó (Trang 95)
Hình 5.4. Kế hoạch có khuyết điểm là dẫn agent đến cửa hàng phần cứng và chợ - Nghiên cứu planning để giải bài toán xác định lộ trình
Hình 5.4. Kế hoạch có khuyết điểm là dẫn agent đến cửa hàng phần cứng và chợ (Trang 95)
được gọi là demotion (hình 5.5b) vàn ếu nó được đặt sau S2, nó được gọi là promotion (hình 5.5c). - Nghiên cứu planning để giải bài toán xác định lộ trình
c gọi là demotion (hình 5.5b) vàn ếu nó được đặt sau S2, nó được gọi là promotion (hình 5.5c) (Trang 96)
Hình 5.5 Bảo vệ liên kết nhân quả. Hình (a), bước S 3 huỷ điều kiện c được tạo nên bởi S 1 và được bảo vệ bởi causal link từ S 1 đến S 2 - Nghiên cứu planning để giải bài toán xác định lộ trình
Hình 5.5 Bảo vệ liên kết nhân quả. Hình (a), bước S 3 huỷ điều kiện c được tạo nên bởi S 1 và được bảo vệ bởi causal link từ S 1 đến S 2 (Trang 96)
Hình 5.6. Sự bảo vệ liên kết nhân quả trong kế hoạch đi siêu thị. Liên kết - Nghiên cứu planning để giải bài toán xác định lộ trình
Hình 5.6. Sự bảo vệ liên kết nhân quả trong kế hoạch đi siêu thị. Liên kết (Trang 97)
Hình 5.6 thể hiện kế hoạch cục bộ mới này. - Nghiên cứu planning để giải bài toán xác định lộ trình
Hình 5.6 thể hiện kế hoạch cục bộ mới này (Trang 97)
Hình 5.7 thể hiện giải pháp hoàn chỉnh, với những bước được vẽ lại để - Nghiên cứu planning để giải bài toán xác định lộ trình
Hình 5.7 thể hiện giải pháp hoàn chỉnh, với những bước được vẽ lại để (Trang 98)
Hình 5.7 thể hiện giải pháp hoàn chỉnh, với những bước  được vẽ lại để cho thấy các ràng buộc thứ tự trên chúng - Nghiên cứu planning để giải bài toán xác định lộ trình
Hình 5.7 thể hiện giải pháp hoàn chỉnh, với những bước được vẽ lại để cho thấy các ràng buộc thứ tự trên chúng (Trang 98)
Xây dựng và Trả tiền chủ thầu. Hình 6.1 mô tả các bước này. - Nghiên cứu planning để giải bài toán xác định lộ trình
y dựng và Trả tiền chủ thầu. Hình 6.1 mô tả các bước này (Trang 102)
Hình 6.1. Sự phân rã phân cấp của toán tử Xây nhà tạo thành kế hoạch thứ tự cục bộ - Nghiên cứu planning để giải bài toán xác định lộ trình
Hình 6.1. Sự phân rã phân cấp của toán tử Xây nhà tạo thành kế hoạch thứ tự cục bộ (Trang 102)
Trong hình 6.2 chúng ta thể hiện lược đồ chi tiết của sự phân rã một bước kế hoạch, trong ngữ cảnh kế hoạch lớn hơn - Nghiên cứu planning để giải bài toán xác định lộ trình
rong hình 6.2 chúng ta thể hiện lược đồ chi tiết của sự phân rã một bước kế hoạch, trong ngữ cảnh kế hoạch lớn hơn (Trang 107)
Hình 6.2. Sự phân rã chi tiết của một bước lập kế hoạch. - Nghiên cứu planning để giải bài toán xác định lộ trình
Hình 6.2. Sự phân rã chi tiết của một bước lập kế hoạch (Trang 107)
Một mô hình không gian tìm kiếm đơn giản sẽ giúp ta hiểu rõ sự ảnh hưởng của các thuộc tính đến việc tìm kiếm - Nghiên cứu planning để giải bài toán xác định lộ trình
t mô hình không gian tìm kiếm đơn giản sẽ giúp ta hiểu rõ sự ảnh hưởng của các thuộc tính đến việc tìm kiếm (Trang 109)
Hình 6.3. Các thuộc tính solution thuận và nghịch trong không gian kế hoạch (các kế hoạch trừu tượng  ở trên, các kế hoạch gốc  ở  dưới) - Nghiên cứu planning để giải bài toán xác định lộ trình
Hình 6.3. Các thuộc tính solution thuận và nghịch trong không gian kế hoạch (các kế hoạch trừu tượng ở trên, các kế hoạch gốc ở dưới) (Trang 109)
Hình 6.4. phần không gian tìm kiếm của phân rã phân cấp với độ sâu d= 3; nhân tố rẽ nhánh b - Nghiên cứu planning để giải bài toán xác định lộ trình
Hình 6.4. phần không gian tìm kiếm của phân rã phân cấp với độ sâu d= 3; nhân tố rẽ nhánh b (Trang 110)
Hình 6.5b thể hiện kế hoạch kết quả trừu tượng không nhất quán. Tuy nhiên, vẫn có thể phân rã kế hoạch không nhất quán này thành giải pháp nhất quán nếu có sẵn các phương pháp phân rãđúng.Ở hình 6.5c bước “Cho Lược” được phân rã bằng phương pháp “kế hoạch - Nghiên cứu planning để giải bài toán xác định lộ trình
Hình 6.5b thể hiện kế hoạch kết quả trừu tượng không nhất quán. Tuy nhiên, vẫn có thể phân rã kế hoạch không nhất quán này thành giải pháp nhất quán nếu có sẵn các phương pháp phân rãđúng.Ở hình 6.5c bước “Cho Lược” được phân rã bằng phương pháp “kế hoạch (Trang 112)
Hình 6.5b thể hiện kế hoạch kết quả trừu tượng không nhất quán. Tuy nhiên, vẫn có thể phân rã kế hoạch không nhất quán này thành giải pháp nhất quán nếu có sẵn các phương pháp phân rã đúng - Nghiên cứu planning để giải bài toán xác định lộ trình
Hình 6.5b thể hiện kế hoạch kết quả trừu tượng không nhất quán. Tuy nhiên, vẫn có thể phân rã kế hoạch không nhất quán này thành giải pháp nhất quán nếu có sẵn các phương pháp phân rã đúng (Trang 112)
Hình 6.6. Sự phân rã của bài toán sản xuất và bán hàng. Cách này không phù hợp - Nghiên cứu planning để giải bài toán xác định lộ trình
Hình 6.6. Sự phân rã của bài toán sản xuất và bán hàng. Cách này không phù hợp (Trang 113)
Như hình trên chiến lược sẽ dể dàng chọn hành động đi đến vị trí 1, vìd 1là ngắn nhất, bất chấp việc có thể bị kẹt đường… - Nghiên cứu planning để giải bài toán xác định lộ trình
h ư hình trên chiến lược sẽ dể dàng chọn hành động đi đến vị trí 1, vìd 1là ngắn nhất, bất chấp việc có thể bị kẹt đường… (Trang 118)

TỪ KHÓA LIÊN QUAN

TRÍCH ĐOẠN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w