chúng hoạt động rất có giới hạn trong môi trường luôn biến động. Chúng đưa ra quyết định dựa trên tình huống hiện tại, nhưng intentions và plans của chúng lại dựa trên mô hình đã được phát triển ở một thời gian xác định trong quá khứ vả sau đó được cập nhật rất ít. Và cấu trúc tương đối cứng nhắc của agent thảo luận đã vô tình làm tăng sự bất cập này. Do việc truyền thông tin từ intentions tới bộ lập kế hoạch, bộ lập lịch và bộ thực thi rất tốn thời gian, trong khi đó thì tình huống hiện tại đã thay đổi vào lúc thực thi planer. Các thuật toán Symbolic cho agent thảo luận thường được thiết kế để đạt
, »
được các kêt quả và có thê chứng minh được nên tính phức tạp cao. Việc phản ứng lại với kết quâ ở mức chấp nhận được đối với tình huống làm quen sẽ thích hợp hơn so với việc tìm ra các kế hoạch tối ưu trong môi trường luôn biến động. Trái lại, các agent thảo luận thường chú trọng đến việc chứng minh toán học của một kế hoạch hơn tính hiệu quả trong quá trình xử lý.
u 、 R执ic tỉw Agents
Việc xem xét một khái niệm mới đối lập với agent thảo luận dẫn tới việc ra đời khái niệm agent phản ứng. Nó đưa ra mô hình ký pháp bên trong về môi trường. Ngay cả khả năng thực hiện các quá trình lập luận phức tạp cũng được bỏ qua. Lý do của
f \
những hạn chê này năm
trong việc tạo ra các agent thông Hình 3.6 Kiến trúc agent phản ứng minh,
có khả năng thứ lỗi, tất cả những đặc tính bên trên và khả năng linh hoạt, không như agent thảo luận, agent phản ứng không chứa sự thông minh từ mô hình bên trong nhưng nó lấy từ môi trường. Tầm quan trọng của quá trình tương tác là tương đối cao. Sự thông minh tồn tại và phát triển thông qua sự tương tác liên tục của hệ thống.
Agent phản ứng không cần có cấu trúc phức tạp để hoạt động trong môi trường phức tạp. Nó có khả năng quan sát môi trường và nhận ra một sổ quy tắc đơn giản hoặc các phụ thuộc. Tri thức này được sử dụng để phát triển các mô đun có nhiệm vụ cụ thể có khả năng kiểm tra liên tục môi trường để xác định sự xuất hiện các tình huống cụ thể và để khởi tạo phản ứng trực tiếp khi tình huống đó xảy ra.
Các robot cổ điển là những ví dụ về agent phản ứng. Chúng sở hữu một số lượng bộ cảm ứng cho phép quan sát môi trường. Thông tin này được truyền cho các mô đun competence của robot.V í dụ mô đun competence có nhiệm vụ thay đổi hướng chuyển
Trần Thị M ai Thương, K11T1 73 Luận văn thạc sỹ
động của robot luôn luôn hoạt động khi sensor nhận biết được sự thay đổi của vật cản so với vị trí hiện tại của robot để tránh.
Tóm lại, sensor của agent phản ứng có nhiệm vụ thu thập thông tin về môi trường và nhận ra sự thay đổi của tình huống. Việc thiết kế các sensor như thế nào phụ thuộc rất lớn vào các đôi tượng do senser kiêm soát. Ví dụ, sensor ghi các thông tin từ con người có thê tập trung vào tôc độ và nhận dạng văn bản, trong khi đó các sensor kiêm soát các agent khác có thể sử dụng các thủ tục truyền thông đơn giản cho công việc của nó. Thông tin được thu thập bởi bộ cảm ứng được truyền cho competence module tương ứng. Việc truyền này thường được thực hiện ở dạng thô, nghĩa là không sử dụng ngôn ngữ truyền thông mức cao hoặc các biểu diễn kí pháp. Mồi competence module tương ứng, chịu trách nhiệm về một công việc được định nghĩa rõ ràng nhưng không quá
phức tạp. Một agent thông tin phải có các module để tìm kiếm các nguồn thông tin ,tập
hợp kêt quả tìm kiêm, và hiên thị kêt quả. Không có mô đun trung tâm, tât cả các thuộc tính được yêu cầu để thực hiện công việc đều nằm trong competence module, Mỗi competence module phải đưa ra mọi khả năng nó yêu cầu để xử lý công việc của nó, vì vậy agent phản ứng không đưa ra bất kỳ chức năng nào cỏ thể dùng chung. Mỗi competence module có một nhiệm vụ được xác định rõ ràng và cung cấp giải pháp được định nghĩa rõ ràng. Một agent không thể giải quýêt bất kỳ công việc nào khi không có competence module nào tồn tại. Trái lại agent thảo luận được định nghĩa dễ hiểu hơn. Các thành phần trung tâm của nó( bộ lập luận, bộ lập kế hoạch và bộ lập lịch) không được thiết kế cho những công việc cụ thể, mà tuỳ thuộc vào nội dung của cơ sở tri thức, được sử dụng cho một phạm vi các bài toán chung
Do các competence module có thể làm việc song song nên sự phụ thuộc lẫn nhau giữa các mô đun có thể xảy ra. Để giải quyết điều này, các module competence có thể truyền thông trực tiếp giữa hai mô đun với nhau hoặc với mô đun khác sử dụng môi trường của nó. Truyền thông trực tiếp là loại quan hệ 1-1 giữa hai thành phần, Truyền thông kiểu này dựa trên các cơ chế truyền thông đơn giản không sử dụng các ngôn ngữ phức tạp. Truyền thông trực tiếp có lợi ích là khả năng phản ứng nhanh, không cỏ mô đun trung gian giữa hai comptence module nghĩa là receving competence module chấp nhận và xử lý yêu cầu truyền thông mà không có độ trễ. Kiểu truyền thông qua môi trường thứ hai được nhận biết khi có một module gây nên sự thay đổi trong môi trường của nó và đến lượt nó lại bị kiểm soát bởi một module khác, module mà sau đó sẽ khởi tạo một đáp ứng. Mặc dù kiểu này chậm hơn truyền thông trực tiếp, nhưng nó cho phép phản ứng với các tình huống phức tạp hơn.
Kiến trúc “ decentralized” của agent phản ửng làm tăng khả năng thứ lỗi và sức mạnh của agent phản ứng. Vì khi một mô đun bị hỏng hoặc hoạt động không chính xác, thì
mô đun trung tâm trong agent thảo luận luôn luôn làm sụp đổ toàn bộ hệ thống.
Agent phản ứng không có khả năng lập kế hoạch. Mặc dù kế hoạch có thể được sử dụng để tối ưu hành vi của agent và mứa độ đạt mục tiêu, nhưng có những yếu tố đóng vai trò đặc biệt quan trọng trong các ứng dụng thực tế,những cái mâu thuẫn với việc xử lý các kế hoạch tối ưu. Ví dụ, một agent thường phải xử lý các thông tin không đầy đủ trên môi trường và mục tiêu của nó. Môi trường biến động thường xuyên và nguồn tài nguyên cho việc tạo ra kế hoạch tối ưu không phải bao giờ cũng sẵn có. Như vậy quá trình lập kế hoạch có thích hợp dưới các điều kiện như vậy?
Agent phản ứng có khả năng diễn tả các hành vi hướng mục tiêu. Mỗi competence module có các mục tiêu đơn giản nhất được định nghĩa bởi chức năng của chúng và không thể thay đổi. Nó không thể sử dụng cơ sở tri thức bên trong để tự phát sinh và theo đuổi các mục tiêu mới. Tuy nhiên nó vẫn có khả năng thực hiện các hoạt động hướng mục tiêu thông qua việc tương tác với môi trường, chứ không bằng cách ước
9
lượng hoặc lập kê hoạch tập trung.
Để kết hợp ưu điểm của hai loại agent này ta có khái niệm “ kién trúc lai or agent la i,,.
Nó bao gồm một thành phần phản ứng và một thành phần thảo luận. Thành phần phản ứng được sử dụng chủ yếu cho việc tương tác với môi trường, còn các hệ thống thảo luận(có mô hình ký pháp và khả năng lập luận phức tạp) tập trung vào việc lập kế hoạch và ra quyết định.Các hệ thống lai thường được thiết kế theo kiến trúc phân tầng với mức độ trừu tượng tăng dần. Các mức thấp hơn được tạo nên bởi các hệ thống phản ứng và được sử dụng cho việc thu thập các thông tin thô. Các thành phân thảo luận được sử dụng cho việc xác định các mục tiêu lâu dài và lập kế hoạch được sử đụng trong các mức cao hơn.
c) Các kiến trủc hiện hành
Rao/georgeff: BDI Agents.
Rao/georgeff đã phát triển một mô hình để cài dặt BDI-base agent. Nó định nghĩa logic cơ bản, các cơ sở lý thuyết của khái niệm BDI và giới thiệu về các ngữ nghĩa cũng như cài đặt thực tế hệ thống BDI cụ thể là định nghĩa bộ biên dịch BDI cụ thể.
Rao/georgeff đưa ra giả thuyết về hai thuộc tính của các agent dựa trên BDI và môi trường, đó là: tại bất kỳ thời điểm nào cũng có một miền khả năng mà môi trường của agent có thể thay đổi và một miền các hoạt động mà agent có thể tự thực hiện được. Vì vậy agent và môi trường tạo nên một hệ thống không xác định, cấu trúc phù hợp để mô tả các hệ thống như vậy là cấu trúc cây quyết định, ở đó mỗi nhánh sẽ biểu diễn một đường đi có thể thực thi, mỗi nứt có thể là một trạng thái môi trường và các chuyển
Trần Thị M ai Thương, K l 1T1 75 Luận văn thạc sỹ
dịch giữa hai nút có thể biểu diễn một hoạt động của agent hoặc một sự kiện của môi trường. Tuỳ thuộc vào chuyển
dịch là hoạt động của agent hoặc sự kiện môi trường mà ta có hai kiểu nút là nút lựa chọn( choice nodes) và nút cơ hội( chance nodes). Thuật ngữ choice thể hiện việc agent lựa chọn giữa các hoạt động khác nhau, trái lại
,
nút chance phản ánh tính chât không thây trước của môi trường và do đó không chịu tác dụng của agent.
Một đường dẫn cụ thể biểu diễn một mục tiêu của agent. Việc lựa chọn các hoạt động
liên q u a n đến một đường dẫn cung cấp các bước công việc cụ thể không do agent thực
hiện. Do tồn tại các chance nodes mà agent không thể tác động lên các nút liên quan đến các sự kiện sắp sảy ra vì, chúng hoàn toàn phụ thuộc vào môi trường. Vì vậy tác
giả đã sử dụng ngữ nghĩa về ‘‘The giới cỏ thề,,để loại bỏ các chance nodes từ cây quyết
định.
Phương pỉtảp: tạo ra một cây quyết định mới với mồi kết nổi mà chứa chance node (node 3). Nút tương ứng được loại bỏ và đường dẫn kết nối được với cha của chance node. Phương pháp này được lặp di lặp lại cho đến khi tất cả các chance node được loại bỏ. Điều này tạo ra một chuỗi các cây quyết định riêng biệt, mỗi cây phản ánh một
trạng thái tiềm tàng, nghĩa là một “ thé giới có thề,'
Mỗi “ posible world” được gắn với một giá trị cụ thể ( thông qua hàm đánh giá) thể hiện khả năng xảy ra một trạng thái (được biểu diễn bời cây quyết định), và các giá trị kết quả chỉ ra lợi nhuận của agent đối với mồi đường dẫn của cây. Nếu các hàm đánh giá được tạo ra từ các thông tin này, thì một agent có thể sử dụng các thành phần lập luận nó để đưa ra quyết định. Xác suất được gắn với “ posible world” sau đó được chuyển thành hàm belief-acccessibility và các giá trị kết quả được chuyển thành hàm desire- acccessibility Agent sẽ sử đụng các hàm này để lựa chọn các đường dẫn hoạt động có thể tốt nhất. Các đường dẫn này bản thân chúng được sử dụng để tạo nên hàm đánh giá thứ 3 là hàm intention-acccessibility.
Vậy mô hình về ‘Thế giới có thể” của Rao/georgeff bao gồm một số thế giới có thể khác nhau, mỗi cái được biểu diễn bằng một cây quyết định. Một chỉ số xác định nằm
trong thế giới có thể biểu diễn một tình huống. Một tập hợp thế giới B-acccessibility,
Hỉnh 3.7 Kiến trúc BDI Agent
thế giới mà một agent có thể lựa chọn, xem xét là có thể (belief), có thể mong mưôn(desire) và có thê yêu câu ( intention).
Rao/georgeff đã phát triển logic hình thức dựa trên mô hình này cho phép agent thực hiện lập luận và tạo ra intentions. Các ông cũng chứng minh ràng các hệ thống dựa trên BDI không phù hợp trong các lĩnh vực ửng dụng hướng thời gian thực, biến động (hay thay đổi) do tính phức tạp của chúng và hành vi runtime không xác định.
Bộ biên dịch BDI sử dụng 3 cấu trúc dữ liệu động ( một cho beliefs, một cho desires & intentions), một hàng đợi chứa tất cả các sự kiện xẩy ra. Bộ biên dịch có vòng lặp như sau:
Initialize-state 0 ; Repeat
Option: = option-geuerator (even- queue); Selected- options: = deliberate (options); Update- intentions (selected- options); ExecutlO;
Get- new- exteonal- eveuts(); Drop- successful- attitudes(); Drop im possible- attitudes(); End-repeat.
Với mỗi vòng lặp, bộ biên dịch đầu tiên kiểm tra có sự kiện mới trong hàng đợi sự kiện không? từ đó nó phát sinh ra chuồi các tuỳ chọn. Mỗi tuỳ chọn biểu diễn một mục
I f f
tiêu(goal) mà agent có thê cô găng đạt tới. Mục tiêu nào khả dụng tuỳ thuộc vào tình huống tương ứng. Bộ thảo luận sẽ lựa chọn tập con các mục tiêu mà đưa ra lợi ích lớn
t t \
nhát cho hệ thông sử dụng các nguôn tài nguyên hiện tại khả dụng. Tập các goal này được thêm vào intentions hiện hành, bởi vì hệ thống có ý định đạt tới các mục tiêu đã lựa chọn. Trong một số trường hợp xu hướng hiện hành có thể cần thay đổi do các thông tin mới. Sau đó hệ thống sẽ thực hiện các hoạt động chưa hoàn thành. Bộ biên
•9 ,
dịch sẽ kiêm tra môi trường liệu có xuât hiện các sự kiện mới và đặt các sự kiện đó vào trong hàng đợi sự kiện. Bước cuối cùng là loại bỏ tất cả các desices đã đạt được và inteutions đã dạt được cũng như các desires không thể thực hiện được và các intentions
叉 w
không thê dạt được khỏi các câu trúc dữ liệu thích hợp.
Trần Thị M ai Thương, K11T1 77 Luận văn thạc sỹ
Mặc dù bộ biên dịch BDI biểu diễn một bước phân biệt với logic BDI hthức,nhưng vẫn còn một số vấn đề cần bàn luận. Không có quyết định nào được đưa ra liên quan đến định dạng của bộ phát sinh mục tiêu và bộ thảo luận. Cụ thể, việc sử dụng các ứng dụng hướng đối tượng dặt ra nhu cầu cao về thời gian đáp ứng của các thành phần và yêu cầu có kiến trúc hiệu quả tương ứng. Do tính phức tạp, các cơ chế hình thức yêu
cầu phải thoả mãn các nhiệm vụ của bộ biên dịch BDI được sử dụng rất hạn chế.
Brooks: Kiến trúc gộp.
Là kiến trúc đại diện tốt nhất cho agent phản ứng. Ông đưa ra các giả thuyết: hành vi thông minh là sự kiện có thê xảy ra mà không có biêu diên tri thức rõ ràng và khả năng lập luận trừu tượng; sự thông minh tồn tại trong các hệ thống phức tạp, hay trước tiên là xảy ra cùng với tương tác của các agent riêng lẻ với môi trường của nó. Như vậy kiến trúc gộp được nhận biết bởi kiến trúc hành vi phân tán, thiếu biểu diễn rõ ràng, và không bị tác động của những modun phức tạp như bộ lập luận, bộ thảo luận hay bộ lập kế hoạch.
Một agent dựa trên kiến trúc gộp bao gồm một số các mô đun hướng nhiệm vụ,được sắp xếp có thứ bậc. Trái với các hệ thống A I và agent thảo luận, không có sự phân tích
又 〜
chức năng nào biêu diên ra, mà thay vào đỏ là sự phân chia công việc hướng hoạt động. Mỗi mô đun competence (khả năng) của kiến trúc gộp chịu trách nhiệm về một công việc cụ thể, chính xác hơn là chịu trách nhiệm về một mẫu hành vi rõ ràng của agent. Các moden được đặt ở cuối thấp hơn của kiến trúc chịu trách nhiệm về các công việc cơ bản, trái lại các mô đun ở mức cao hơn chịu trách nhiệm về các mẫu hành vi phức tạp. Thêm vào đó, mỗi mô đun competence có thể hoạt động một cách tự trị và các mô đun cao hơn tương tác một tập các công việc của các mô đun phụ thuộc.
Mỗi mô đun competence được miêu tả sử dụng ngôn ngữ gộp, nghĩa là dựa trên các