Mối quan hệ giữa sự phụ thuộc lẫn nhau của các hành động với các

Một phần của tài liệu Lập trình Game Agent (Trang 25)

chế điều phối

Với điều chỉnh tương hỗ, sự điều phối theo cơ chế này là không cần thiết đối với cả hai loại phụ thuộc flow và sharing bởi vì nó không cần điều phối các đầu ra cho các hoạt động này để phù hợp với các hoạt động khác ( những sự phụ thuộc kiểu flow và sharing yêu cầu các chuẩn của đầu vào và đầu ra). Do đó, để phù hợp bằng kinh nghiệm người ta thấy rằng điều phối theo cơ chế điều chỉnh tương hỗ chỉ phù hợp với sự phụ thuộc lẫn nhau của các hành động theo kiểu fit.

Các cơ chế điều phối theo kiểu chuẩn, kiểu trung gian, kiểu phản xạ không thể áp dụng cho sự phụ thuộc giữa các hoạt động kiểu fit bởi vì các cơ chế điều phối này các yêu cầu đầu vào cần được chuẩn hoá giữa các hoạt động liên tiếp nhau. Các cơ chế điều phối trên theo kiểu định ra trước các tài nguyên được chuyển từ công việc này đến công việc khác, hoặc xác định giới hanh của số lượng các đầu ra được tạo ra, như vậy hoạt động của chúng chỉ phù hợp với các hoạt động phụ thuộc lẫn nhau kiểu flow và sharing.

Điều phối theo cơ chế giám sát trực tiếp có thể được áp dụng cho cả 3 loại phụ thuộc. Các giám sát viên có thể trực tiếp điều khiển cho các đầu ra của chúng phù hợp với nhau, các luồng xử lý được mịn hoặc ấn định các nguồn tài nguyên cho các hoạt động nếu chúng bị dùng chung. Vì vậy, cơ chế giám sát trực tiếp là cơ chế điều phối được áp dụng rộng rãi nhất.

Tóm tắt các cơ chế điều phối ứng với những sự phụ thuộc lẫn nhau của các hành động:

Fit Flow Sharing Giám sát trực tiếp

Điều chỉnh tương hỗ

Giám sát trực tiếp Chuẩn hoá

Điều phối trung gian Điều phối phản xạ

Giám sát trực tiếp Chuẩn hoá

Điều phối trung gian Điều phối phản xạ

I.4.3.4. Một số điểm lưu ý

Các cơ chế: Điều chỉnh tương hỗ được thực hiện thông qua các tương tác ngang bằng, ngang cấp nhau. Giám sát trực tiếp sử dụng cách tiếp cận theo kiểu “chủ - tớ” (trong trường hợp lý tưởng không cho phép các tương tác ngang cấp). Một nhân vật trung gian hay các brokers điều chỉnh tương hỗ giữa các agent và có thể thực hiện ở nhiều cấp độ giám sát khác nhau. Điều phối phản xạ phụ thuộc vào sự thích hợp của các mẫu hành vi đối với từng tình huống.

Các nhóm điều phối và Cấu trúc tổ chức (coordinated Groups and Organization Structure)

 Điều khiển tương hỗ có thể thực hiện tốt trong các nhóm nhỏ nhưng số lượng kết nối thông tin và số lượng thông tin tăng nhanh theo kích thước.

 Đối với các nhóm lớn, để việc điều phối có hiệu quả ta nên chia thành các nhóm nhỏ hơn nếu hầu hết các thông tin có thể chuyến sang dạng biểu diễn ở các nhóm nhỏ hơn được.

 Điều phối một cách hiệu qủa đối với các nhóm nhỏ yêu cầu mỗi nhóm nhỏ có một điều phối viên, một giám sát viên, một nhà trung gian làm việc cùng nhau trong một hoặc nhiều nhóm điều phối.

 Mỗi nhóm điều phối cũng có thể được điều phối trong nó như những nhóm agent khác bởi các cơ chế như điều chỉnh qua lại hoặc giám sát trực tiếp, trung gian, hoặc các hành vi phản xạ.

 Nếu chỉ điều phối bằng cơ chế giám sát trực tiếp sẽ tạo ra một cây phân cấp các nhóm agent.

 Nếu chỉ điều phối bằng cơ chế điều chỉnh qua lại sẽ tạo ra một cây giao cấp các agent (không xuất hiện nhóm agent).

I.4.4. Điều phối theo mô hình của sự uỷ thác, thoả hiệp, thoả hiệp cộng đồng và học cộng đồng và học

I.4.4.1. Cơ sở của mô hình chung

 Phải có cấu trúc dễ dàng cho các agent tương tác với nhau một cách có dự đoán trước.

 Phải mềm dẻo để các agent có thể thao tác trong những môi trường động và có thể đối phó với những phần không liên kết của chúng và những khung nhìn không chính xác của cộng đồng.

 Các agent phải có đủ tri thức và khả năng lập luận để khai thác những cấu trúc và độ mềm dẻo sẵn có.

Những sự uỷ thác cung cấp cấu trúc cần thiết có những sự tương tác được đoán nhận trước, những sự thoả hiệp cung cấp sự mềm dẻo, linh động cần thiết để thao tác, thực hiện trong những môi trường động và những sự thoả hiệp cộng đồng cung cấp mức độ cần thiết cho việc hỗ trợ tương hỗ. Do đó:

Điều phối = Sự uỷ thác + Sự thoả hiệp + Sự thoả hiệp cộng đồng + Khả năng học

Những khẳng định ở trên được rút ra bằng những thử nghiệm phong phú về các tương tác cộng đồng xuất hiện như là kết quả của rất nhiều dạng mối quan hệ giữa các mục đích và sự phụ thuộc lẫn nhau của mục đích. Trong mỗi trường hợp đó, vai trò của sự uỷ thác, sự thoả hiệp, sự thoả hiệp cộng đồng lại càng nổi bật.

I.4.4.2. Phân tích mô hình

Hình 5: Cây tìm kiếm mục đích của Agent1 và Agent2.

Mô hình trên mô tả mẫu của tìm kiếm mục đích phân tán (distribute goal search) như một tập điều khiển. Trong hình vẽ, hành động của Agent1 và Agent2

lần lượt giải quyết các mục đích G1

0 và G2

0 được biểu diễn dưới dạng cây tìm kiếm AND/OR. Cấu trúc cây theo kiểu cổ điển này cũng biểu diễn sự phụ thuộc lẫn nhau giữa các mục đích bởi vì chúng là chìa khoá cho sự điều phối trong các hệ thống đa agent. Những nguồn tài nguyên cần thiết để đạt được các mục đích nhỏ nhất (các nút lá) cũng được thể hiện trong hình vẽ. Sự phụ thuộc lẫn nhau có thể được thể hiện giữa các mục đích mức cao có quan hệ họ hàng với nhau, ví dụ như G1

1 và G1

2 hoặc chúng có thể xa nhau trong cây phân cấp như G1

1,1 và G2

p,2. Một trường hợp nữa, G1

1 và G2

p được gọi là các mục đích tương tác nhau nếu G1

1,1 được sử dụng để giải quyết G2

p,2. Những sự phụ thuộc gián tiếp giữa các mục đích là những sự phụ thuộc liên quan đến tài nguyên (G1

m, 1, 2 và G2

p,2,2 cùng dùng chung tài nguyên là d1

Sự phụ thuộc lẫn nhau có thể chia thành hai loại yếu hoặc mạnh (weak or strong) và là một chiều hoặc hai chiều. Mục đích A gọi là phụ thuộc mạnh vào mục đích B nếu muốn thực hiện mục đích A thì nhất thiết phải thực hiện mục đích B. Ngược lại, mục đích A gọi là phụ thuộc yếu vào mục đích B nếu mục đích A thực hiện có thể không cần đến mục đích B (tuỳ chọn). Trong hình trên G1

1 phụ thuộc yếu vào G1

1, G1,2

m phụ thuộc mạnh vào G1

m,1. Sự phụ thuộc một chiều như G1

1,1G2

p,2 nghĩa là mục đích G 2

p,2 của agent 2 phụ thuộc vào mục đích G1

1,1 của agent 1 (có thể là phụ thuộc mạnh hoặc yếu) nhưng G1

1,1 không ảnh hưởng bởi G2

p,2. Sự phụ thuộc hai chiều như giữa G1

m,1 và G2

m,2 các mục đích đều ảnh hưởng đến nhau.

Các mục đích nối (joint goal) ví dụ như G1,2

m được coi là những hành động gắn liền với cộng đồng hoặc các mục tiêu mà một nhóm agent được quyết định phải thực hiện theo nhóm. Mục đích nối chính là sự liên kết giữa các hành động riêng lẻ của mỗi agent vào trong một mục đích chung làm tăng tính ảnh hưởng của mỗi agent lên cộng đồng agent. Ví dụ như G1,2

m là mục đích con của Agent1 và Agent2 và kết quả là Agent1 thực hiện G1

m,1 và Agent2 thực hiện G2

m,2 . Nhờ các mục đích nối, tất cả các thành viên trong một đội đều có ảnh hưởng đến cả nhóm. Yếu tố thứ hai nói lên tầm quan trọng của mục đích nối là nó phân biệt giữa các

mục đích giống nhau và song song. Ví dụ như cả x và y có mục đích là nấu mì ống do đó chúng có mục đích giống nhau, nhưng nếu cả hai agents đều có mục đích là ăn mì ống (x có mục đích là x ăn mì ống và y có mục đích y ăn mì ống) thì chúng lại có các mục đích song song nhau. Hai loại mục đích này khác nhau là: các mục đích giống nhau làm tăng các mục đích nối nếu hai agent quyết định làm chung trong một đội trong khi đó các mục đích song song lại tăng tính cạnh tranh và như vậy rõ ràng chúng không thể dẫn tới một hành động liên kết (hành động nối).

Toàn bộ cấu trúc mục tiêu không cần thiết phải cực kỳ tỉ mỉ để giải quyết bài toán từ đầu, nó có thể được xây dựng để giải quyết các tiến trình của một bài toán. Thực tế, xây dựng một đồ thị là một hoạt động xã hội rất phức tạp, liên quan đến

thương lượng, giả thuyết, giải pháp với các sự xung đột hoặc có thể được giải quyết tập trung bởi một agent. Sự xây dựng theo hướng từ trên - xuống với các mục đích ở mức cao, theo hướng từ dưới lên nếu được điều khiển bởi dữ liệu, hoặc hỗn hợp cả hai.

I.4.4.2.2. Điều phối trong việc tìm kiếm các mục đích phân tán.

Cách trình bày một hệ thống đa agent như một bài toán tìm kiếm các mục đích phân tán cho phép các hoạt động được định nghĩa một cách rõ ràng, bao gồm:

• Định nghĩa đồ thị mục đích (bao gồm nhận dạng và phân chia những sự phụ thuộc).

• Ấn định các vùng đặc biệt của đồ thị thích hợp với các agent.

• Điều khiển việc quyết định diện tích của đồ thị để khai thác.

• Thực hiện phân cấp mục đích.

• Đảm bảo việc thực thi trong không gian tìm kiếm là thành công.

Một số các hoạt động trong các hoạt động trên được thực hiện trong một sự tương hỗ, một số thực hiện riêng lẻ. Quyết định để chọn cách tiếp cận phù hợp cho mỗi pha là một vấn đề của thiết kế hệ thống. Nó sẽ phụ thuộc vào:

• Bản chất của lĩnh vực (trong các ứng dụng, các agent có các trình độ, kinh nghiệm khác nhau do đó việc phân định các mục đích cho mỗi agent là một công việc không đơn giản vì phụ thuộc vào khả năng hoàn thành công việc của mỗi agent).

• Dạng của các agent có trong cộng đồng (ví dụ với các agent tự chủ, tổng không gian tìm kiếm chính là hợp của các không gian tìm kiếm cục bộ và mỗi agent làm việc dựa trên các mục đích riêng của chúng).

• Yêu cầu các giải pháp đặc thù (để tăng tính đúng đắn của một kết quả quan trọng, các vùng tìm kiếm giống nhau trong không gian tìm kiếm có thể được ấn định một cách dư thừa với nhiều agent trong khi đó phải thoả mãn yêu cầu tối ưu trong việc sử dụng agent).

• Giả thiết rằng có những sự phụ thuộc lẫn nhau giữa các mục đích hoặc giữa các yêu cầu tài nguyên của các agent khác nhau, sự điều phối sẽ được yêu cầu nếu cộng đồng đó hoạt động trong một phương thức liên kết.

Bản chất của sự phụ thuộc xác định loại điều phối. Ví dụ nếu agent1 biết rằng G2

p,2,2 yêu cầu nguồn tài nguyên d1

j trước khi nó có thể bắt đầu (phụ thuộc mạnh, quan hệ một chiều) nên nó có thể quyết định thực hiện G1

m,1,2 (để dinh ra tài nguyên cần thiết) trước khi G1

m,1,1 nếu không có thêm thông tin nào khác tiêu biểu hơn để lựa chọn một trong hai. Thứ hai là, mối quan hệ giữa G1

m,1 và G2

m,2 có thể quy định cả hai hành động đều cần thực hiện đồng thời (phụ thuộc mạnh, quan hệ hai chiều) trong khi đó mỗi agent thực hiện lần lượt. Cuối cùng là, nếu agent1

chọn G1

1,1 như một phương thức để thoả mãn G1

1 kết quả của hành động này sẽ cung cấp thông tin giá trị (phụ thuộc yếu, quan hệ một chiều) thông tin này có thể giúp cho agent2 thực hiện G2

p,2. Biết được điều này, agent2 có thể bắt đầu với G2 p,1. Tiếp theo, ta xét đến các thành phần trong mô hình này:

I.4.4.2.3. Sự uỷ thác

Cụm từ “uỷ thác” nghĩa là một sự đảm bảo hoặc một sự hứa hẹn. Các agent có thể tạo ra sự đảm bảo cả về hành động và hiểu biết và những sự đảm bảo này có thể cả là quá khứ hoặc tương lai. Tuy nhiên với mục đích của sự điều phối, sự uỷ thác quan trọng nhất liên quan đến các hành động tương lai. Nếu một agent tự uỷ thác cho mình thực hiện một hành động đặc biệt thì phải cung cấp cho nó các tình huống không thay đổi, nó sẽ cố gắng thực hiện vai trò của mình. Mỗi agent sẽ quyết định thực hiện nhiệm vụ khi các ràng buộc của nó vẫn thoả mãn có đủ tài nguyên giành cho hoạt động của nó. Nếu một agent có nguồn tài nguyên vô hạn có thể cho bất cứ sự uỷ thác nào của nó thay đổi, định vị thì nó sẽ không có một ràng buộc nào. Tuy nhiên thực tế hầu hết nguồn tài nguyên là có hạn, bởi chúng bị ràng buộc bởi môi trường, một agent bị giới hạn trong một số lượng hoặc loại uỷ thác mà chúng có thể tạo ra. Trong trường hợp này, mỗi agent phải nhận thức được sự nhất quán với hiểu biết của nó. Sự uỷ thác cá nhân không được gây xung đột với các agent khác, ví dụ một agent không nên đảm bảo việc thực hiện hai

mục đích đồng thời nếu chúng đều yêu cầu một nguồn tài nguyên không chia sẻ. Nếu các hành động dự định của một agent được thực hiện trong một thể giới mà nó tin tưởng thì các trạng thái của công việc là đảm bảo.

Joint commitment (uỷ thác liên kết) có tất cả các tính chất của sự uỷ thác cá thể đã đề cập ở trên nhưng có thêm các điều kiện ràng buộc mà chúng liên quan đến nhiều hơn một agent. Điều này có nghĩa là trạng thái của sự uỷ thác liên kết là phân tán. Ví dụ trạng thái của sự uỷ thác liên kết G1,2

m là sự phân tán giữa agent1

trong quá trình xử lý G1

m,1 và agent2 trong quá trình xử lý G2

m,2. Một cách lý tưởng tất cả các thành viên trong nhóm đều truy cập một trạng thái nhận thức chung liên quan đến uỷ thác liên kết, khi đó chúng sẽ đồng thời có những kinh nghiệm và những hiểu biết giống nhau, và như vậy là có sự đồng bộ giữa các thành viên trong nhóm. Tuy niên do hoạt động của nhóm được thực hiện một cách riêng biệt và không phải toàn thể nhóm. Do đó sự chia sẻ trạng thái nhận thức là không thể trừ khi tất cả các agent sở hữu một cấu trúc đơn chung mà tất cả các bản ghi của sự hiểu biết của chúng về uỷ thác liên kết . Ví dụ như trong một nhóm tìm kiếm, nếu một agent thoả mãn mục tiêu của cả nhóm và tìm ra khoản mục cuối cùng và đó là agent duy nhất biết được uỷ thác liên kết đã được hoàn thành. Sau đó, agent này thông báo với các agent khác về thành quả của mình nghĩa là chúng chia sẻ thành quả chung, tuy nhiên trong khi đó những thành viên khác nhau dẽ có sự hiểu biết khác nhau về sự uỷ thác liên kết. Với tất cả các khía cạnh khác, sự khác nhau giữa hai loại uỷ thác chính là số lượng.

I.4.4.2.4. Sự thoả hiệp

Một agent hoàn thành sự uỷ thác của nó nếu được cung cấp những hoàn cảnh không thay đổi. Tuy nhiên, trong các kịch bản thực tế, các agent ở trong một môi trường thay đổi theo thời gian, do đó mỗi agent phải tự tiếp thu các thông tin mới, các agent khác lại cố gắng tương tác với nó, và cứ như vậy… Vì vậy trong rất nhiều trường hợp, những sự hiểu biết của một agent sẽ làm thay đổi giữa việc tạo ra một sự uỷ thác và nó thực tế thực hiện các quá trình, thời gian giữa hai sự kiện càng lớn càng có khả năng xuất hiện sự thay đổi.

CONVENTION: COHEN AND LEVESQUE MODEL

NHỮNG NGUYÊN NHÂN CHO VIỆC ƯỚC LƯỢNG LẠI SỰ UỶ

Một phần của tài liệu Lập trình Game Agent (Trang 25)

Tải bản đầy đủ (DOC)

(118 trang)
w