Chương 1: Chương này sẽ trình bày về tác tử, các loại tác tử cơ bản, môi trường tác nghiệp và hệ thống đa tác tử cũng như lợi ích của việc áp dụng hệ thống đa tác tử để mô phỏng giao th
Trang 1DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT
GAMA Gis & Agent based
Modelling Architecture
Mô hình kiến trúc dựa trên tác tử
và thông tin địa lý
GAML Gis & Agent based
Modelling Language
Ngôn ngữ mô hình dựa trên tác
tử và thông tin địa lý GIS Geographic Information
Systems Hệ thống thông tin địa lý MAS Multi-Agent System Hệ thống đa tác tử
PEAS
Performance measure, Environment, Actuators, Sensors
Độ đo thực hiện, Môi trường xung quanh, Bộ tác động, Bộ cảm nhận
Trang 2DANH MỤC CÁC BẢNG
Bảng 1.1 Bảng hành động của tác tử máy hút bụi trong hình 1.2 13
Bảng 1.2 Ví dụ các loại tác tử và môi trường tác nghiệp 16
Bảng 1.3 Liệt kê đặc tính một số kiểu môi trường 17
DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ Hình 1.1 Tác tử tương tác với môi trường xung quanh 12
thông qua bộ cảm nhận và bộ tác động 12
Hình 1.2 Một máy hút bụi với hai vị trí 13
Hình 1.3 Lược đồ mô tả tác tử phản xạ đơn 18
Hình 1.4 Lược đồ mô tả tác tử phản xạ dựa trên mô hình 18
Hình 1.5 Lược đồ mô tả tác tử dựa trên đích 19
Hình 1.6 Lược đồ mô tả tác tử dựa trên lợi ích 20
Hình 1.7 Mô hình chung của một tác tử có khả năng học 20
Hình 2.1 Giao diện khi khởi động GAMA v1.5 30
Hình 2.2 Các thành phần chính của GAMA 31
Hình 2.3 Cách xem thông tin agent 35
Hình 3.1 Các thành phần của mô phỏng 38
Hình 3.2 Vai trò và sự tương tác giữa các tác tử 39
Hình 3.3 Bản đồ hệ thống đường Hà Nội (hanoi_lines) 40
Hình 3.4 Bảng thuộc tính của bản đồ hanoi_lines 41
Hình 3.5 Bảng thuộc tính của bản đồ hanoi_point_all 41
Hình 3.6 Bản đồ khu dân cư ở Hà Nội 42
Hình 3.7 Môi trường của hệ thống 42
Trang 3Hình 3.8: Hành vi của tác tử xe buýt 43
Hình 3.9: Hành vi của tác tử Traveler 45
Hình 3.10 Giao diện chương trình trong chế độ thiết kế 48
Hình 3.11 Giao diện chương trình ở chế độ mô phỏng 49
Hình 3.12 Menu agent 49
Hình 3.13 Species Inspector 49
Hình 3.14 Một lát cắt quan sát tỉ lệ người đi bộ, đi ô tô, đi xe buýt 50
Hình 3.15 Một lát cắt bảng quan sát trạng thái của người 50
Trang 4MỤC LỤC
LỜI CAM ĐOAN 3
LỜI CẢM ƠN 4
DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT 5
DANH MỤC CÁC BẢNG 6
DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ 6
MỤC LỤC 8
MỞ ĐẦU 10
CHƯƠNG 1: TỔNG QUAN VỀ TÁC TỬ VÀ HỆ THỐNG ĐA TÁC TỬ 12
1.1 Giới thiệu về tác tử 12
1.1.1 Định nghĩa tác tử 12
1.1.2 Tác tử hợp lý 14
1.1.3 Môi trường tác nghiệp 15
1.1.4 Các kiểu tác tử cơ bản 17
1.1.5 Cơ sở tri thức của tác tử 21
1.2 Tổng quan về hệ thống đa tác tử 21
1.2.1 Khái niệm hệ thống đa tác tử 21
1.2.2 Lợi ích của việc áp dụng hệ thống MAS để mô phỏng giao thông 23
CHƯƠNG 2: MÔ PHỎNG GIAO THÔNG 25
VÀ NỀN TẢNG MÔ PHỎNG GAMA 25
2.1 Giới thiệu 25
2.2 Một số phần mềm mô phỏng giao thông 26
2.2.1 Phần mềm mô phỏng giao thông ARCADY, TRANSYT [16] 27
2.2.2 Mô phỏng giao thông với VISSIM [16] 27
2.3 Nền tảng mô phỏng Gama [17] 28
2.3.1 Giới thiệu 28
2.3.2 Tính năng của GAMA 31
Trang 52.3.3 Các công cụ GAMA hỗ trợ 32
CHƯƠNG 3: XÂY DỰNG MÔ HÌNH MÔ PHỎNG MẠNG XE BUÝT VÀ PHÂN TÍCH KẾT QUẢ 36
3.1 Một số đặc điểm của hệ thống xe buýt ở Việt Nam 36
3.1.1 Thực trạng 36
3.1.2 Cấu trúc tĩnh của mạng xe buýt 36
3.2 Lợi ích của việc mô phỏng mạng xe buýt 37
3.3 Các ý tưởng xây dựng hệ thống 38
3.3.1 Môi trường của hệ thống 39
3.3.2 Xây dựng tác tử đóng vai trò xe buýt (Bus agent) 43
3.3.3 Xây dựng tác tử đóng vai trò người tham gia giao thông (Traveler agent) 45 3.4 Thực nghiệm 47
3.4.1 Giới thiệu về phần mềm mô phỏng 47
3.4.2 Kết quả thử nghiệm 50
KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 52
TÀI LIỆU THAM KHẢO 53
Trang 6MỞ ĐẦU
Sự phát triển của hệ thống đường giao thông công cộng đòi hỏi phảiđáp ứng nhu cầu nâng cao chất lượng dịch vụ và kinh tế Tuy nhiên, do điều kiện về mặt pháp lý, tài chính, thời gian…nên rất khó, thậm chí là không thể làm các thí nghiệm trực tiếp để đưa ra giải pháp phát triển hệ thống giao thông công cộng Hơn nữa, với kích thước và sự phức tạp của hệ thống giao thông nên chúng ta không thể thiết lập mô hình lý thuyết cho hệ thống Vì vậy, mô phỏng là một giải pháp để phân tích và lập kế hoạch cho hệ thống giao thông công cộng
Đã có một loạt các công cụ giao thông từ các nghiên cứu khoa học để ứng dụng trong đào tạo, lập kế hoạch và mô phỏng Tuy nhiên các công cụ này thường tập trung vào vấn đề dự toán nhu cầu, rất ít các mô hình mô phỏng đưa
ra hành vi của người tham gia giao thông và hoạt động cụ thể của các phương tiện Luận văn này sẽ trình bày một công cụ mô phỏng mạng xe buýt dựa trên cách tiếp cận đa tác tử gồm những đặc trưng này và cho phép đánh giá mạng xe buýt theo không gian và thời gian
Việc áp dụng cách tiếp cận đa tác tử để mô phỏng giao thông là một cách tiếp cận linh hoạt để định nghĩa các hành vi tự trị Không có những ràng buộc trên mức độ mô hình, tức là một tác tử có thể mô tả một thực thể đơn giản như là một tập hợp các thực thể được liên kết Ví dụ, trong mô hình mạng xe buýt, tác
tử xe buýt đại diện cho phương tiện, người lái xe của nó và một tập các hành khách
Hơn nữa, hiện nay đã tồn tại một số kỹ thuật và nền tảng mô phỏng hướng tác tử như NetLogo, Repast, Gama…Luận văn sử dụng Gama làm nền tảng mô phỏng cho chương trình của mình vì so với NetLogo, Gama là chương trình mã nguồn mở; so với Repast, Gama hỗ trợ hoàn toàn về mặt soạn thảo
Luận văn đã sử dụng input làhệ thống các bản đồ dạng shapefile: Bao gồm bản đồ đường Hà Nội và bản đồ các trạm xe buýt ở Hà Nội Sau đó dùng phần mềm Qgis đểvẽ các trạm và tuyến xe buýt số 16 Từ những dữ liệu ban đầu này,
mô phỏng mô tả sử phát triển của một mạng lưới xe buýt Hoạt động của mạng lưới xe buýt là kết quả từ hành vi của các thực thể và sự tương tác giữa chúng Đây là mô phỏng ở mức vĩ mô cho phép người xem có thể quan sát sự di chuyển của xe buýt và người tham gia giao thông trên hệ thống đường Từ đó đưa ra những quyết định hợp lý
Trang 7Luận văn đƣợc trình bày theo hình thức từ trên xuống Bắt đầu mỗi phần đều đƣa ra những khái niệm cơ bản và qui định cho phần trình bày tiếp theo nhằm mục đích giúp dễ dàng trong khi đọc, dần dần đi sâu vào tìm hiễu rõ hơn những vấn đề liên quan
Cấu trúc của luận văn nhƣ sau:
Mở đầu
Chương 1: Chương này sẽ trình bày về tác tử, các loại tác tử cơ bản, môi
trường tác nghiệp và hệ thống đa tác tử cũng như lợi ích của việc áp dụng hệ thống đa tác tử để mô phỏng giao thông
Chương 2: Chương này sẽ giới thiệu về mô phỏng, một số phần mềm mô
phỏng hiện nay, đồng thời giới thiệu nền tảng mô phỏng Gama được sử dụng để
hỗ trợ cho việc xây dựng mô hình trong luận văn
Chương 3: Chương này sẽ trình bày cấu trúc của mạng xe buýt và lợi ích
của việc mô phỏng mạng xe buýt Cuối cùng, chương 3đi vào trình bày cách xây dựng mô hình trong luận văn và phân tích kết quả thu được
Kết luận: Phần này trình bày tổng hợp các kết quả thực hiện luận văn và
phương hướng nghiên cứu tiếp theo về các nội dung trong luận văn
Trang 8CHƯƠNG 1: TỔNG QUAN VỀ TÁC TỬ VÀ HỆ THỐNG ĐA TÁC TỬ
Chương này tìm hiểu về tác tử và hệ thống đa tác tử cũng như những lợi ích của việc áp dụng cách tiếp cận đa tác tử để mô phỏng giao thông Những hình vẽ và lý thuyết của chương này chủ yếu được lấy từ các tài liệu [2], [4], [7], [8], [11], [14]
1.1 Giới thiệu về tác tử
Tác tử là một khái niệm tương đối mới và hiện nay được rất nhiều các nhà nghiên cứu quan tâm Dưới đây luận văn sẽ trình bày một số khái niệm và đặc điểm của tác tử
1.1.1 Định nghĩa tác tử
Có rất nhiều định nghĩa về tác tử đã được đưa ra nhưng cho đến nay vẫn chưa có một khái niệm nào được coi là chung nhất cho tác tử Luận văn xin nêu
ra một định nghĩa được đưa ra bởi Russell S and Norvig P như sau:
“Tác tử là bất cứ cái gì (con người, người máy, software robots, các bộ
ổn nhiệt ,…) có khả năng cảm nhậnmôi trườngxung quanh (environment) nó thông qua bộcảm nhận (sensors) và hành động phù hợp theo môi trường đó thông qua bộtác động (actuators)”
Ví dụ tác tử con người có mắt, tai, mũi… là bộ cảm nhận và tay, chân, miệng… là bộ tác động; Tác tử Robot dùng camera, các bộ truy tìm tín hiệu hồng ngoại là bộ cảm nhận và các loại động cơ (motors) là bộ tác động.Ở đây ta chỉ xét các tác tử nhân tạo như robot, phần mềm máy tính…
Kiến trúc của tác tử được minh họa như sau:
Hình 1.1 Tác tử tương tác với môi trường xung quanh
thông qua bộ cảm nhận và bộ tác động
Trang 9Một cách khái quát, một tác tử có thể biểu diễn bằng một hàm tác tử: là hàm ánh xạ từ lịch sử nhận thức tới các hành động:
f: P* A
Ta dùng thuật ngữ nhận thức (percept) để chỉ tín hiệu tri giác nhận được của tác tử Mỗi chuỗi nhận thức của tác tử có tính lịch sử và ở mỗi thời điểm
tác tử chọn tác động phụ thuộc vào chuỗi nhận thức có được tới lúc đó Dựa trên
chuỗi nhận thức, tác tử chọn ứng xử được mô tả như là hàm tác tử (agent function) và có thể biểu diễn bởi bảng Bảng là đặc trưng ngoài của hàm tác tử
còn bên trong là một chương trình Cần phân biệt hàm tác tử(mô tả toán học) và chương trính cài đặt
Ví dụ thế giới (world)máy hút bụi hình 1.2 Máy có hai vị trí trong các
hình vuông A, B Máy nhận thức bẩn hay sạch và có thể chuyển động sang phải, sang trái, hút bụi hay không làm gì cả
Hình 1.2 Một máy hút bụi với hai vị trí
Bảng hành động của tác tử máy hút bụi
Bảng 1.1 Bảng hành động của tác tử máy hút bụi trong hình 1.2
Tùy theo phương thức xử lý mà ta có các loại tác tử khác nhau Ở đây, luận văn chỉ trình bày về tác tử hợp lý
Trang 101.1.2 Tác tử hợp lý
Tác tử hợp lý là tác tử cần phấn đấu để “làm đúng việc cần làm”, dựa trên những gì nó nhận thức (nhận biết) được và dựa trên các hành động mà nó có thể thực hiện Một hành động đúng (hợp lý) ở đây là hành động giúp cho tác tử đạt được thành công cao nhất đối với mục tiêu đặt ra
1.1.2.1 Đánh giá hiệu quả hoạt động của tác tử hợp lý
Ta đánh giá hiệu quả hoạt động của tác tử thông qua một độ đo thực hiện:
là tiêu chuẩn để đánh giá mức độ thành công trong hoạt động của một tác tử Khi một tác tử được thả vào một môi trường, nó phải tạo ra một chuỗi tác động phù hợp với các nhận thức mà nó tiếp nhận Tất nhiên không có một độ đo chung cho mọi tác tử Tuy nhiên ta cần có độ đo khách quan đặt ra cho người thiết kế mỗi tác tử
Ví dụ tiêu chí đánh giá hiệu quả hoạt động của một tác tử máy hút bụi có thể là: mức độ làm sạch, thời gian hút bụi, mức độ điện năng tiêu tốn, mức độ tiếng ồn gây ra,…
Cần thiết kế độ đo phù hợp với môi trường muốn có hơn là phù hợp với tác tử.Lựa chọn độ đo là vấn đề khó…
Trang 11 Chỉ có các tác động sang phải, trái , hút hoặc không làm gì
Tác tử nhận thức đúng vị trí của nó và biết có bụi hay không
* Tính quán thông, học và tự trị (omniscience, learning và autonomy)
Một tác tử quán thông biết được các kết cục hiện thời về tác động của nó
và cho được các tác động phù hợp Tuy vậy thực tế không có Ví dụ người qua đường
Do đó cần cực đại độ đo kỳ vọng chứ không phải cực đại thực
Một tác tử tự trị là một tác tử mà các hành động của nó được quyết định bởi chính kinh nghiệm của tác tử đó (cùng với khả năng học và thích nghi)
Trên đây là một số đặc điểm chung của tác tử nhưng chưa đầy đủ Để có thể mô tả được đầy đủ các đặc điểm của tác tử, ta phải đặt nó vào môi trường mà trong đó có sự tham gia của nhiều tác tử Trong mục tiếp theo, luận văn xin giới thiệu về môi trường tác nghiệp mà tác tử hoạt động trong đó
1.1.3 Môi trường tác nghiệp
Phần này sẽ đặc tả môi trường tác nghiệp (task environment) và trình bày các kiểu môi trường tác nghiệp Đây là bài toán mà tác tử cần giải
1.1.3.1 Đặc tả môi trường tác nghiệp
Để thiết kế một tác tử thông minh (hợp lý), trước tiên ta cần đặc tả độ đo thực hiện, môi trường xung quanh, bộ tác động và bộ cảm nhận(PEAS) càng đầy
Các bộ tác động (A)
Các bộ cảm nhận (S)
Tác tử lái
xe taxi
An toàn, nhanh, đúng luật giao thông, mức độ hài lòng của khách hàng, tối ưu lợi nhuận,…
Các con đường (phố), các phương tiện khác cùng tham gia giao thông, những người đi
bộ, các khách hàng, …
Bánh lái, chân
ga, phanh, đèn tín hiệu, còi
xe, …
Máy quay, đồng hồ tốc
độ, GPS, đồng
hồ đo khoảng cách quãng đường, các bộ cảm biến động cơ, … Tác tử
chuẩn đoán
Mức độ sức khỏe của bệnh
Bệnh nhân, bệnh viện, nhân viên y
Hiển thị trên màn hình các
Bàn phím để nhập các
Trang 12Loại tác tử Độ đo thực
hiện (P)
Môi trường xung quanh (E)
Các bộ tác động (A)
Các bộ cảm nhận (S)
y tế nhân, cực tiểu
hóa các chi phí, các việc kiện cáo, …
tế, … câu hỏi, các
xét nghiệm, các chuẩn đoán, các điều trị, các chỉ dẫn, …
thông tin về triệu chứng, các trả lời của bệnh nhân đối với các câu hỏi, …
Tác tử nhặt
đồ vật
Tỷ lệ bao nhiêu % các
đồ vật được đặt vào đúng các thùng…
Dây chuyền chuyển động trên
đó có các đồ vật, các thùng đựng…
Cánh tay và bàn tay được kết nối…
Máy quay, các
bộ cảm biến các góc độ (các hướng)…
Bảng 1.2 Ví dụ các loại tác tử và môi trường tác nghiệp
1.1.3.2 Các kiểu môi trường
Phạm vi của môi trường tác nghiệp khá rộng lớn Tuy nhiên chúng ta có thể phân loại chúng theo một số khía cạnh nhỏ Sau đây luận văn sẽ trình bày một số khía cạnh của môi trường tác nghiệp
Quan sát đầy đủ hay từng phần?
Tác tử có thể biết về trạng thái đầy đủ tại mỗi thời điểm hóặc quan sát từngphần do nhiễu, bộ cảm nhận không chính xác
Tất định hay ngẫu nhiên?
Nếu trạng thái tiếp theo của môi trường hoàn toàn được xác định nếu biết trạng thái và tác động hiện thời thì gọi là môi trường có tính tất định, còn lại là ngẫu nhiên Môi trường tất định được xác định mà không có tác động của tác tử khác gọi là môi trường chiến lược
Phân đoạn hay tuần tự?
Trong môi trường phân đoạn, các thí nghiệm với tác tử chia thành các đoạn thành phần.Trong mỗi đoạn này tác tử nhận thức và thực hiện tác động riêng rẽ, các đoạn sau không phụ thuộc vào đoạn trước
Trong môi trường tuần tự thì quyết định hiện thời có thể ảnh hưởng tới quyết định tương lai
Trang 13 Tĩnh hay động?
Môi trường biến đổi theo thời gian gọi là động Ngược lại, môi trường không thay đổi trong khi tác tử cân nhắc (xem nên đưa ra hành động nào) gọi là môi trường tĩnh Cũng với cách chia này, ta còn có khái niệm môi trường bán động (semi-dynamic) là môi trường mà khi thời gian trôi qua thì nó không thay đổi, nhưng hiệu quả hoạt động của tác tử thì thay đổi Ví dụ: các chương trình trò chơi có tính giờ
Rời rạc hay liên tục?
Trạng thái, thời gian tác động và nhận thức rời rạc hay liên tục: ví dụ chơi
cờ, lái xe
Tác tử đơn hay đa tác tử?
Một tác tử hoạt động độc lập (không phụ thuộc hay liên hệ với các tác tử khác) trong một môi trường gọi là tác tử đơn
Bảng dưới đây liệt kê một số kiểu môi trường đối với một số tác tử
Quan sát đầy
đủ?
Bảng 1.3 Liệt kê đặc tính một số kiểu môi trường
Kiểu của môi trường có ảnh hưởng quyết định đối với việc thiết kế tác tử Môi trường trong thực tế thường có các đặc điểm: Chỉ có thể quan sát được một phần, ngẫu nhiên, liên tiếp, thay đổi (động), liên tục và đa tác tử
1.1.4 Các kiểu tác tử cơ bản
Phần này sẽ phác họa 5 loại tác tử chính: Tác tử phản xạ đơn, tác tử phản
xạ dựa trên mô hình, tác tử dựa trên mục đích, tác tử dựa trên lợi ích và tác tử có khả năng học
Trang 141.1.4.1 Tác tử phản xạ đơn
Loại agent này hành động theo một qui tắc (luật) có điều kiện phù hợp với trạng thái hiện thời (của môi trường)
Hình 1.3 Lược đồ mô tả tác tử phản xạ đơn
1.1.4.2.Tác tử phản xạ dựa trên mô hình
Khi quan sát từng phần, cần kết hợp thông tin nhận thức hiệnthời với quá khứ, mỗi tác tử có thể có một trạng thái trong và cập nhật tri thức
Cập nhật trạng thái trong cóthể từ hai loại tri thức.Thứ nhất có thể cần thông tin độc lập với tác tử Thứ hai là thông tin về ảnh hưởng của tác động của tác tử tới môi trường
Hình 1.4 mô tả kiến trúc của tác tử dựa trên mô hình Khi xử lý thông tin
ta cần cân nhắc có cài đặt trong mạch logic hay cần đến lý thuyết khoa học đầy
đủ mà nó gọi là mô hình về thế giới thực Tác tử sử dụng mô hình gọi là tác tử dựa trên mô hình
Hình 1.4 Lược đồ mô tả tác tử phản xạ dựa trên mô hình
Trang 151.1.4.3 Tác tử dựa trên mục đích
Tri thức về trạng thái hiện thời chưa chắc đủ để quyết định hành vi Ví dụ tại ngã tư, quyết định của taxi tùy thuộc vào định đi đâu Nói cách khác ngoài trạng thái hiện thời, cần có thêm thông tin đích mô tả tình trạng mong muốn
Tác tử kết hợp thông tin này với thông tin về kết quả tác động có thể Tìm kiếm
và lập kế hoạch là lĩnh vực dành cho tìm chuỗi hành động để đạt được đích của
tác tử
Hình 1.5 Lược đồ mô tả tác tử dựa trên đích
1.1.4.4 Tác tử dựa trên lợi ích
Trong nhiều môi trường, thông tin về các mục tiêu không đủ để đánh giá hiệu quả của các hành động Ví dụ: có rất nhiều chuỗi các hành động cho phép taxi đi đến đích (tức là đạt đến mục tiêu) Nhưng chuỗi hành động nào nhanh hơn, an toàn hơn, đáng tin cậy hơn và có chi phí thấp hơn?
Vì vậy cần có sự đánh giá lợi ích đối với tác tử Hàm lợi ích ánh xạ từ chuỗi các trạng thái của môi trường tới một giá trị số thực (thể hiện mức lợi ích đối với tác tử) Chi tiết hóa đầy đủ một hàm lợi íchcho phép quyết định hợp lý trong haitrường hợp mục đích chưa đủ để có quyết định hợp lý sau:
1-Các mục đích xung khắc, hàm lợi ích sẽ cân bằng giữa chúng
2-Có nhiều đích cần đạt mà không cái nào chắc chắn Hàm lợi ích cho cách tiếp cận trong đó khả năng thành công được cho bởi trọng số thay cho đánh giá tầm quan trọng của đích
Trang 16Hình 1.6 Lược đồ mô tả tác tử dựa trên lợi ích
1.1.4.5 Tác tử có khả năng học
Khả năng học cho phép tác tử cải thiện hiệu quả hoạt động của nó Turing
có đề xuất một phương pháp nhanh là xây dựng các máy học và dạy chúng
Một tác tử có khả năng học có thể chia làm 4 thành phần:
Thành phần hành động (thực hiện): đảm nhiệm việc lựa chọn các hành động
Thành phần đánh giá (bình luận): Đánh giá hiệu quả hoạt động
Thành phần học: Giúp cải thiện hiệu quả hoạt động dựa trên các đánh giá
để thay đổi (cải thiện) thành phần hành động
Thành phần sản sinh kinh nghiệm: có nhiệm vụ đề xuất các hành động giúp sản sinh ra (dẫn đến) các kinh nghiệm mới
Hình 1.7 Mô hình chung của một tác tử có khả năng học
Quan trọng nhất là thành phần học chịu trách nhiệm cải tiến và thành phần thực hiện chịu trách nhiệm chọn tác động ngoài Thành phần thực hiện có
Trang 17thể xem là tác tử đã xét trước,nó lấy nhận thức và quyết định hành động Thành phần học dùng thông tin liên hệ ngược từ bộ bình luận để xác định xem cần cải tiến thế nào để bộ thực hiện hành động tốt hơn về sau.Thiết kế thành phần học phụ thuộc nhiềuvào thiết kế thành phần thực hiện.Cơ cấu học có thể xây dựng để cải tiến mọi thành phần của tác tử.Thành phần sản sinh kinh nghiệm chịu trách nhiệm gợi ý các tác động và dẫn tới các thực nghiệm nhiều thông tin và mới
1.1.5 Cơ sở tri thức của tác tử
Một cơ sở tri thức là một tập các mệnh đề được biểu diễn trong một ngôn ngữ hình thức, cung cấp tri thức cho một tác tử Tác tử khai thác cơ sở tri thức
mà nó sở hữu trong quá trình đưa ra các hành động
Các tác tử có thể được xem xét ở mức tri thức: Tác tử biết những gì? Các mục tiêu của tác tử là gì? Hay mức cài đặt hệ thống: Các cấu trúc dữ liệu trong
cơ sở tri thức? Các giải thuật sử dụng các tri thức này?
Tác tử cần có 4 khả năng chính:
Thu thập (cập nhật) các tri thức mới
Cập nhật việc biểu diễn (bên trong tác tử) đối với môi trường xung quanh
Suy diễn ra các thuộc tính ẩn của môi trường xung quanh
Suy luận để đưa ra các hành động hợp lý
1.2 Tổng quan về hệ thống đa tác tử
Phần trên đã giới thiệu một số đặc điểm chung nhất, tổng quan nhất về các tác tử Tuy nhiên do ứng dụng ngày càng phức tạp, khả năng giải quyết vấn đề của những tác tử riêng lẻ không đáp ứng được yêu cầu đặt ra hoặc tác tử trở lên quá phức tạp Trong trường hợp đó, hệ thống đa tác tử là một giải pháp thích hợp Phần này sẽ giới thiệu về hệ thống đa tác tử và lợi ích của việc áp dụng cách tiếp cận đa tác tử để mô phỏng giao thông
1.2.1 Khái niệm hệ thống đa tác tử
Một hệ thống đa tác tử, hay gọi tắt là MAS (Multi-Agent System), là một
hệ thống trong đó có sự có mặt của nhiều tác tử trong một môi trường và có sự tương tác lẫn nhau giữa chúng
Các tác tử có thể tương tác với nhau theo nhiều cách Các hành động đưa
ra của chúng có thể có tính cạnh tranh, xung đột với các tác tử khác Hoặc chúng
có thể hợp tác, phối hợp hành động để đạt được mục tiêu hay thậm chí có thể cùng lên kế hoạch hành động để đạt được mục tiêu chung nào đó Các tác tử có
Trang 18khả năng giao tiếp với các tác tử khác bằng cách truyền và nhận các thông điệp theo một giao thức nào đó Thậm chí các tác tử có thể nhận biết được các tác tử khác tiếp nhận được thông tin gì
Trong MAS, mỗi tác tử đều có một cái nhìn giới hạn, chúng không có thông tin đầy đủ về môi trường và các tác tử khác trong toàn bộ hệ thống Mỗi hành động của tác tử đều tác động tới một phần của môi trường và các tác tử khác trong một phạm vi nào đó Trong một MAS, các hành vi và thuộc tính của các tác tử là không đồng nhất
MAS có thể có tính tổ chức, tức là các tác tử có thể hoạt động trong một nhóm các tác tử nào đó, chúng có một số ràng buộc nào đó với nhau và các hoạt động của chúng nhằm dẫn đến một mục tiêu chung của nhóm Có nhiều loại mô
hình tổ chức trong MAS Với loại mô hình phân cấp, quyền ra quyết định hành
động thường nằm trong tay một tác tử đứng đầu ở mỗi cấp Ở mô hình tổ chức này, các tác tử thường tương tác với các tác tử khác trong cùng cấp hoặc với các
tác tử ở các cấp liền kề (trên và dưới) Một mô hình tổ chức khác là mô hình thị trường, trong đó có sự tồn tại của các tác tử đóng vai trò cung cấp sản phẩm
hoặc dịch vụ và các tác tử đóng vai trò có nhu cầu sử dụng sản phẩm dịch vụ
Một ví dụ điển hình về MAS chính là Internet Internet có thể được coi là một mạng lưới rộng lớn với mỗi nút của mạng lưới là một tác tử Các nút mạng này được thiết kế, thực thi bởi những người, tổ chức khác nhau, và hoạt động với những mục đích khác nhau Ngoài ra, hoạt động của chúng là không đồng
bộ Các nút mạng trao đổi thông tin với các nút mạng khác trong một phạm vi nào đó và theo một giao thức nào đó, …
Ngoài cách định nghĩa hệ thống MAS như ở trên, MAS còn có thể được định nghĩa theo cách dựa trên kiến trúc của tác tử được sử dụng: đó là sự tính toán và sự phản ứng Các tác tử tính toán nói chung là một đại biểu mang tính biểu tượng của môi trường và phối hợp với nhau nhờ giao thức truyền thông ở mức độ cao Ngược lại, các tác tử phản ứng không đại diện cho môi trường của
nó Chúng hành động theo nhận thức của mình, điều này là một hạn chế Các tác
tử phản ứng có thể hợp tác và giao tiếp thông qua sự tương tác của chúng với môi trường (gọi là giao tiếp gián tiếp) Kết quả là hệ thống phản ứng biểu diễn một vài hành vi thông minh, là kết quả của sự tương tác giữa tác tử và môi trường (ví dụ như tổ chức và hiện tượng xuất hiện) Mô hình trong luận văn là
mô phỏng mạng xe buýt phụ thuộc chủ yếu vào cách tiếp cận phản ứng Xe buýt
và hành khách được xem là các thực thể đơn phát triển trong một hệ thống rộng
Trang 19và phức tạp Tuy nhiên các thực thể này có khả năng nhận thức, sẽ được tích hợp những hành vi đơn giản trong một kiến trúc dựa trên phản ứng
1.2.2 Lợi ích của việc áp dụng hệ thống MAS để mô phỏng giao thông
Trong một hệ thống giao thông, hệ thống đường xá, các đèn giao thông, tín hiệu giao thông đóng vai trò môi trường Mỗi người tham gia giao thông trong đó đóng vai trò một tác tử Các tác tử này đưa ra hành động bằng cách di chuyển theo các cách khác nhau để đạt được một mục tiêu là đi đến một vị trí nào đó trong hệ thống đường xá Mỗi người tham gia giao thông đều có những thuộc tính riêng biệt phụ thuộc vào giới tính, tuổi tác, kinh nghiệm, … và do đó cách di chuyển của họ cũng là không đồng nhất Người tham gia giao thông tương tác với những người khác trong một phạm vi nào đó Họ có một số cách thức truyền thông điệp như bấm còi, bật sinh nhan để ra hiệu xin đường, … Chính vì vậy mà việc mô phỏng hệ thống giao thông dựa trên tác tử là một phương pháp rất thích hợp
Áp dụng cách tiếp cận đa tác tử để mô phỏng giao thông còn có những lợi ích sau [4,7,10]:
Thứ nhất: Là đã tồn tại một số kỹ thuật và nền tảng mô phỏng như Netlogo, Gama hoặc Swarm… để mô phỏng nhiều thực thể
Thứ hai: Mô hình tác tử là một cách tiếp cận linh hoạt để định nghĩa các hành vi tự trị Không có những ràng buộc trên mức độ mô hình, tức là một tác tử có thể mô tả một thực thể đơn giản như là một tập hợp các thực thể được liên kết Ví dụ, trong mô hình mạng xe buýt, tác tử xe buýt đại diện cho phương tiện, người lái xe của nó và một tập cách hành khách
Cuối cùng, hệ thống MAS phản ứng là một công cụ tốt để quan sát và nghiên cứu các hiện tượng xuất hiện, tập trung vào các mô hình tương tác giữa các thực thể Sự ùn tắc giao thông trong mạng lưới đô thị có thể dễ dàng mô tả theo cách này Trong mô hình giao thông của chúng tôi, hoạt động được định nghĩa ở cấp độ vi mô bởi các tác tử và sự tương tác giữa chúng, một số hiện tượng phức tạp có thể thu được ở mức độ toàn cục MAS đã từng thành công trong việc mô tả hệ thống giao thông Mục tiêu đầu tiên của hệ thống MAS trong việc mô phỏng giao thông là mô phỏng phương tiện giao thông để nghiên cứu động lực giao thông Một hướng khác của
hệ thống MAS trong mô phỏng giao thông là quan tâm nghiên cứu việc học và phối hợp trong trường hợp lựa chọn tuyến đường và lựa chọn mô hình Trong
Trang 20mô hình tác tử được đề xuất, chúng tôi quan tâm đến điểm đầu tiên trong hai quan điểm trên
Tóm lại, trong chương này, luận văn đã trình bầy những khái niệm cơ bản, đặc điểm về tác tử và hệ thống đa tác tử Chương này cũng đã nêu ra lợi ích của việc áp dụng cách tiếp cận đa tác tử để mô phỏng giao thông Đây là một phương pháp pháp tiên tiến trong lĩnh vực mô phỏng những hệ thống phức tạp trong thế giới thực, điều đó thể hiện qua những ứng dụng của nó trong thực tiễn
Ở chương tiếp theo, luận văn xin trình bầy về mô phỏng giao thông và nền tảng mô phỏng Gama Đây cũng là nền tảng mô phỏng được áp dụng trong luận văn
Trang 21CHƯƠNG 2: MÔ PHỎNG GIAO THÔNG
VÀ NỀN TẢNG MÔ PHỎNG GAMA 2.1 Giới thiệu
Cho tới nay, đã có khá nhiều khái niệm về mô phỏng Mặc dù cách định nghĩa khái niệm này là khác nhau, nhưng tất cả đều nói lên được rằng: mô phỏng là tái hiện động theo thời gian một phần của thế giới thực, mô phỏng đạt được nhờ xây dựng một mô hình tin học Với bài báo “ Mô phỏng giao thông trên xa lộ dựa trên những biến rời rạc” vào năm 1955 tại đại học California, Los Angeles, D.L Gerlough đã trở thành người đầu tiên khởi xướng việc sử dụng máy tính để mô phỏng giao thông Từ đó, mô phỏng tin học trở thành một công
cụ được sử dụng rộng rãi trong phân tích những vấn đề của giao thông vận tải Một loạt ứng dụng từ các nghiên cứu đó đã được áp dụng trong quy hoạch, đào tạo và trình diễn Mô phỏng giao thông là một trong những mô phỏng phức tạp,
ba vấn đề chính đặt ra trong một mô phỏng giao thông là: mô hình hóa hành vi
cá nhân của từng phương tiện tham gia giao thông, mô hình hóa sự tương tác giữa các phương tiện giao thông và sự tin cậy của kết quả mô phỏng
Con người có thể hiểu sâu hơn về một hiện tượng trong tự nhiên khi chúng được mô phỏng Mô phỏng giúp chúng ta có những cái nhìn khác nhau, ở những mức độ trừu tượng khác nhau về cùng một hiện tượng, qua đó chúng ta
có những hiểu biết sâu sắc hơn về hiện tượng được mô phỏng Chúng ta có thể
sử dụng mô phỏng để đưa ra các đánh giá, dự đoán về một kế hoạch trước khi thực hiện, kiểm chứng các dự án đã thực hiện, nghiên cứu các sự vật hiện tượng
và được sử dụng trong đào tạo
Có nhiều cách tiếp cận trong mô phỏng giao thông dựa trên mức độ chi tiết trong mô phỏng Hai cách tiếp cận nổi bật là vĩ mô và vi mô Cách tiếp cận
vĩ mô tập trung thể hiện dòng chảy giao thông, quan tâm tới vận tốc trung bình của các phương tiện, lưu lượng và mật độ của các phương tiện trên các tuyến đường Người ta dùng cách tiếp cận này để đưa ra các dự báo thời gian và địa điểm xảy ra tắc nghẽn giao thông Nhược điểm của cách tiếp cận này là không thể hiện được sự tương tác giữa các phương tiện tham gia giao thông Khác với
vĩ mô, vi mô tập trung mô phỏng đặc điểm riêng biệt và sự tương tác giữa các phương tiện tham gia giao thông Cách tiếp cận vi mô sử dụng các thuật toán, các quy tắc để thể hiện sự di chuyển và tương tác của các phương tiện giao thông như gia tốc, vận tốc, chuyển làn đường, vượt… Điểm khác nhau chính
Trang 22giữa hai cách tiếp cận là vi mô quan tâm chi tiết tới từng cá thể mô phỏng, còn
vĩ mô thì tập trung vào cái chung, không quan tâm từng phương tiện
Một số vấn đề chính trong mô phỏng giao thông: bước thời gian mô phỏng, sinh ngẫu nhiên các phương tiện tham gia vào mô phỏng, môi trường như các con đường ngã tư đèn giao thông, các phương tiện giao thông và các hành vi của các phương tiện này khi tham gia giao thông, đặc biệt là sự tương tác của những phương tiện này trong quá trình tham gia giao thông
Hiện nay, có nhiều công cụ mô phỏng giao thông ở mức vi mô, như Sumo, MatSim, MitSimLab, Aimsumm, CorSim, Paramics, SimTraffic, VisSim, TranSims…[3] Một số công cụ có khả năng mô phỏng giao thông của cả một thành phố lớn như MatSim đã mô phỏng giao thông ở Berlin và Zurich, nhưng công cụ này không đi sâu vào mô phỏng hành vi chi tiết của từng phương tiện giao thông Ngược lại, một số công cụ như MitSimLab có khả năng mô phỏng rất chi tiết những hành vi của từng phương tiện tham gia giao thông Xây dựng một công cụ mô phỏng luôn luôn phải cân nhắc giữa số lượng phương tiện mô phỏng và mức độ chi tiết mô phỏng hành vi của từng phương tiện [8]
Trong luận văn, để hình dung sự phát triển của mạng lưới xe buýt, chúng tôi chọn cách phát triển một mô hình mô phỏng giao thông lai Các phương tiện
đi lại, ngoại trừ xe buýt được mô phỏng vĩ mô còn xe buýt được mô phỏng vi
mô
2.2 Một số phần mềm mô phỏng giao thông
Tính đến nay, việc nghiên cứu xây dựng công cụ mô phỏng giao thông đã đạt được nhiều thành tựu, đã đóng góp phần nào vào sự phát triển của các hệ thống giao thông ở nhiều nước tiên tiến trên thế giới Tuy nhiên, rất khó có thể ứng dụng được những công cụ này để mô phỏng hệ thống giao thông ở Việt Nam do hệ thống giao thông của nước ta có nhiều điểm khác biệt Cơ sở hạ tầng giao thông còn kém, nhiều hệ thống đường xá chằng chịt trong một diện tích nhỏ, nhất là trong các đô thị Hầu hết các công cụ mô phỏng được xây dựng chỉ
mô phỏng các phương tiện đi trên đường là ô tô Trong khi đó, các phương tiện giao thông ở nước ta rất hỗn tạp, từ những phương tiện kích thước nhỏ như xe đạp, xe máy đến những phương tiện cỡ lớn như ô tô, xe tải, xe buýt, hay thậm chí là các phương tiện thô xơ Thêm vào đó sự thiếu ý thức chấp hành luật lệ giao thông của người lái xe càng làm cho hệ thống giao thông thêm hỗn độn Chính vì vậy mà nghiên cứu một hệ thống mô phỏng chi tiết giao thông của nước ta là rất cần thiết Đó là nguyên nhân thúc đẩy tôi nghiên cứu một hệ thống
Trang 23mô phỏng giao thông phù hợp với tình hình giao thông ở Việt Nam Nhưng trước khi trình bầy những những nghiên cứu và các kết quả đã đạt được, tôi xin được giới thiệu một số công cụ mô phỏng hệ thống giao thông của các nhà nghiên cứu trước đây
2.2.1 Phần mềm mô phỏng giao thông ARCADY, TRANSYT [16]
Đây là 2 phần mềm mô phỏng thiết kế giao thông các nút giao nhau, tối
ưu hóa tín hiệu giao thông
ARCADY được sử dụng để đánh giá sức chứa và sự trì hoãn ở vòng xuyến Nó có khả năng để dự báo thực tế tỷ lệ tai nạn giao thông, sức chứa và việc trì hoãn (cả hàng đợi và mặt hình học) cho hầu hết các kích cỡ khác nhau của vòng xuyến, sắp đặt từ nhiều nhánh với các cấp độ vòng xuyến được phân tách cho tới những vòng xuyến bên trong khu vực ngoại ô
TRANSYT là một chương trình máy tính quốc tế để thiết kế, mô hình và nghiên cứu có thứ tự những chỗ giao nhau riêng biệt cho tới cả mạng lưới phức tạp TRANSYT có thể nhanh chóng đánh giá được sự thực thi của một chỗ giao nhau riêng biệt cũng tạo ra sự tối ưu hóa thời gian cố định định lượng thời gian cho tín hiệu giao thông trong bất kỳ mạng lưới đường bộ mà lưu lượng giao thông cần biết đến, bao gồm cả tín hiệu ở đường vòng xuyến Phiên bản mới nhất (TRANSYT 14) có các tính năng đặc biệt để đánh giá các mối lối bị kiểm soát cô lập, và mạng lưới pha trộn tín hiệu và không có tiến hiệu cùng với vai trò truyền thống của nó TRANSYT xác định tối ưu thời gian cố định [16]
2.2.2 Mô phỏng giao thông với VISSIM [16]
Phần mềm VISSIM là phần mềm mô phỏng giao thông ở mức vi mô do công ty PTV (CHLB Đức) viết và được sử dụng phổ biến trên thế giới trong công tác qui hoạch giao thông vận tải các cấp và tổ chức giao thông tại các đô thị, khu phố, nút giao thông, nhà ga, sân bay, sân vận động…Đây là công cụ rất mạnh để mô hình dòng giao thông đa luồng, gồm xe ô tô, xe hàng, xe buýt, xe điện, xe trọng tải nặng, xe máy, xe đạp và người đi bộ Thông qua sự thực thi các thao tác đa luồng của VISSIM sẽ tối ưu xử lý phân luồng Nó là cấu trúc mạng mềm dẻo để cung cấp cho người dùng khả năng mô hình các đối tượng tham gia giao thông với những dạng địa hình khác nhau hoặc thao tác độc lập,
có thứ tự của người lái xe và khách bộ hành được bắt gặp trong một hệ thống giao thông
Trang 24VISSIM được sử dụng để phân tích mạng lưới của tất cả các kích cỡ khác nhau từ những nút giao thông tới toàn bộ khu vực đô thị Bên trong những mạng lưới giao thông này, VISSIM có khả năng mô hình tất cả đường cao tốc, phân loại linh hoạt từ xa lộ tới đường xe chạy VISSIM cũng ứng dụng cho giao thông công cộng, xe đạp và những tiện ích của người đi bộ
Những ứng dụng của VISSIM:VISSIM được sử dụng để mô phỏng điểm nóng
giao thông và giao thông công cộng Bao gồm:
Nghiên cứu xa lộ và hành lang đường
Nghiên cứu quy hoạch khu vực nhỏ
Quản lý chiến lược đường cao tốc
Nghiên cứu những điểm dừng của xe lửa, xe buýt
Đánh giá từng tín hiệu hiệu dừng của giao thông công cộng
Phân tích các điểm ngã tư đường sắt
Quản lý sơ đồ giao thông hiện tại và tương lai
Nghiên cứu giao thông trên mặt đất và đường trên không của sân bay
Nghiên cứu sự ảnh hưởng tới môi trường
Mô hình hóa khách bộ hành trong môi trường xây dựng kể cả quy hoạch sơ tán
Nghiên cứu hàng không về giao thông trên mặt đất và trên không Trên đây, luận văn đã trình bày một số phần mềm mô phỏng hiện nay, đã chỉ ra những cái mà các phần mềm này đã làm được Trước khi đi trình bày chi tiết về hệ thống mô phỏng giao thông mà tôi đã nghiên cứu và xây dựng, ở phần tiếp theo luận văn sẽ giới thiệu về nền tảng mô phỏng Gama, là nền tảng để phát triển ứng dụng trong luận văn
Trang 25bởi một nhóm các nhà nghiên cứu Pháp và Việt Nam dưới sự bảo trợ của đơn vị nghiên cứu quốc tế IRD / UPMC, UMMISCO từ năm 2007
Theo Patrick Taillandier, Alexis Drogoul, Duc An Vo et al: “GAMA còn là một nền tảng mô phỏng tích hợp dữ liệu thông tin địa lý, mô hình hướng tác tử
và kiểm soát đa qui mô”
GAMA là một phần mềm mã nguồn mở, phát triển trên nền tảng Eclipse dựa trên ngôn ngữ Java Kể từ khi ra đời đến nay, GAMA đã trải qua nhiều phiên bản GAMA v1.1, GAMA v1.3, GAMA v1.4 và hiện tại GAMA v1.5 cho nhiều hệ điều hành window 32 bits, window 64 bits, Linux 32 bits, Linux 64 bits, MacOSX 32 bits, MacOSX 64 bits Mỗi phiên bản của GAMA đều đi kèm sẵn một số mô hình và hướng dẫn cụ thể
GAMA là công cụ mô phỏng hỗ trợ 2 môi trường chính là môi trường lưới (grid) và môi trường thông tin địa lý (GIS)
GAMA dựa trên:
Một ngôn ngữ mô hình hóa (GAML) và một môi trường phát triển tích hợp cho phép lập mô hình, xây dựng mô hình nhanh chóng và hiệu quả
Một thư viện mở rộng của kiến trúc tác tử, và các chức năng thống
kê phân tích: các thông số thăm dò không gian và hiệu chỉnh các mô hình
Một khả năng tái nền tảng của mô phỏng
Một giao diện người sử dụng dựa trên nền tảng Eclipse, với việc vẽ
đồ họa linh hoạt
Hình 2.1 và hình 2.2 đã chỉ ra giao diện khởi động của GAMA và các thành phần chính của chương trình GAMA Mọi thông tin chi tiết về GAMA chúng ta có thể tìm hiểu qua trang http://code.google.com/p/gama-platform/