Bài viết phân tích dữ liệu dòng giao thông xe buýt để xây dựng mô hình dữ liệu xe buýt hướng thời gian. Dựa vào mô hình dữ liệu này, nhóm tác giả phát triển giải thuật tìm đường đi xe buýt theo thời gian thực. Cuối cùng, bằng kỹ thuật WebGL, kết quả tìm đường xe buýt sẽ được hiển thị trên nền bản đồ 3D.
NGHIÊN CỨU KHOA HỌC TRỰC QUAN HỐ KẾT QUẢ TÌM ĐƯỜNG ĐI XE BUÝT DỰA TRÊN DỮ LIỆU DÒNG GIAO THƠNG KHƠNG - THỜI GIAN* Hoàng Xn Lợc**, Dương Ngọc Hiếu**, Trần Văn Hoài***, Nguyễn Thanh Dũng**** TÓM TẮT Trực quan hóa khoa học trực quan hóa thơng tin lĩnh vực đa ngành tập trung phát triển thập kỷ gần Thời gian trước đây, trực quan hóa chủ yếu tập trung vào việc hiển thị giúp đánh giá kết mô Tuy nhiên, với liệu lớn ngày trực quan hố giao nhiệm vụ lớn hơn, giúp khám phá liệu để giúp nhà khoa học hiểu khái niệm, quan hệ trình bên liệu Tại Việt Nam chủ đề giao thông thành phố lớn thành phố Hồ Chí Minh, Hà Nội nhiều người quan tâm nhiều góc nhìn khác Trong năm gần đây, xe buýt dần trở thành phương tiện cơng cộng phổ biến yếu người dân Trong báo này, nhóm tác giả tập trung vào phân tích liệu dòng giao thơng xe bt để xây dựng mơ hình liệu xe bt hướng thời gian Dựa vào mơ hình liệu này, nhóm tác giả phát triển giải thuật tìm đường xe buýt theo thời gian thực Cuối cùng, kỹ thuật WebGL, kết tìm đường xe buýt hiển thị đồ 3D ABSTRACT Visualizing results of finding bus lines based on data of the space and time traffic flow Scientific visualization and information visualization are the interdisciplinary subfields that have attracted a great deal of attention in recent decades In earlier time, visualization mainly focused on displaying and this was an essential tool for supporting to evaluate the simulation results However, for bigger data, visualization has a greater mission to explore the data, concepts, relationships and processes within the data Vietnamese traffic issues in big cities such as Ho Chi Minh City, Hanoi Capital are paid attention a lot in many different aspects In a few years ago, the bus transport was quite popular and has gradually become the main transport of the Vietnamese people In this research, the authors focus on analyzing bus traffic data in order to build the time oriented bus data model Basing on the data model, the authors develop an algorithm to solve the shortest path problem of bus routing in real time Finally, by employing WebGL technology, the shortest path will be displayed visually on the 3D map * Nghiên cứu tài trợ ĐHQG TP.HCM khuôn khổ đề tài mã số C2014-20-07 ** ThS, Trường ĐH Bách Khoa - ĐHQG TP.HCM *** PGS.TS, Trường ĐH Bách Khoa - ĐHQG TP.HCM **** TS, Trường ĐH Văn Hiến SỐ 07 - THÁNG 05/2015 99 NGHIÊN CỨU KHOA HỌC Giới thiệu Trực quan hóa khoa học trực quan hóa thơng tin lĩnh vực đa ngành tập trung phát triển thập kỷ gần Thời gian trước đó, trực quan hóa chủ yếu tập trung vào việc hiển thị giúp đánh giá kết mô Tuy nhiên, với liệu lớn ngày nhiều lĩnh vực trực quan hố giao nhiệm vụ lớn hơn, giúp khám phá liệu để giúp nhà khoa học hiểu khái niệm, quan hệ trình bên liệu Trong xu đó, nhiều nhà khoa học đề xuất tách nhiệm vụ trực quan hoá hai nhánh khác trực quan hoá khoa học trực quan hố thơng tin để phân biệt việc trực quan hai nhóm liệu tương ứng liệu liên tục liệu rời rạc [9] Tại Việt Nam chủ đề giao thông thành phố lớn thành phố Hồ Chí Minh, Hà Nội nhiều người quan tâm nhiều góc nhìn khác Hiện có nhiều nhận định trái chiều giao thông Việt Nam, từ có nhiều sách chưa hợp lý Theo nhận định chung nhà khoa học nguyên nhân việc thiếu trầm trọng liệu giao thông thành phố lớn Việt Nam Ngồi việc thiếu cơng cụ phân tích liệu, ví dụ cơng cụ trực quan hoá liệu, nguyên nhân Trên giới, có nhiều nghiên cứu việc xây dựng công cụ trực quan hố liệu giao thơng Michael cộng kết hợp mơ hình nghiên cứu cũ 3-D đưa vào dòng liệu giao thơng thời gian thực [1] Tuy nhiên, có hai đại lượng dòng giao thơng tốc độ khối lượng di chuyển cung cấp điều hạn chế nhiều việc trực quan hóa Hơn nữa, tác giả trình bày hoạt hình lại phương tiện dựa hai đại lượng khơng mơ hình thật phương tiện vị trí chúng Nguyên mẫu chưa hướng đến việc phân tích trực quan mà đạt mức độ hoạt hình hóa sử dụng đồ hoạ máy tính Sử dụng phương cách hoạt hình gây nhiều bất tiện việc phân tích liệu dòng giao thơng nhà 100 SỐ 07 - THÁNG 05/2015 phân tích khó thấy yếu tố thời điểm khác lúc Như [6], công cụ trực quan cổ điển trở nên hiệu việc phân tích trực quan để làm rõ mối quan hệ đối tượng di chuyển, đại lượng mơ tả dòng giao thơng Nói cách khác, phương thức công cụ trực quan cổ điển khó giúp ích cho nhà quy hoạch Bên cạnh cơng trình [6] có nhiều công bố tương tự [7] Tuy nhiên, tất nghiên cứu đề áp dụng phương cách hiển thị 2-D, 3-D, 4-D hướng đến môi trường hoạt hình nhằm phục vụ mục tiêu hiển thị nhiều giúp cho phân tích dòng giao thơng Một khảo sát chi tiết trực quan hóa lĩnh vực quy hoạch thị có bao gồm liệu giao thơng trình bày [8] Trong tài liệu này, nhóm tác giả khảo sát tốt phương pháp trực quan hóa phục vụ cho quy hoạch mức quản lý vĩ mô Tuy nhiên, hướng nghiên cứu trực quan hóa dòng giao thơng chưa đề cập Tại Việt Nam, nói nghiên cứu nước trực quan hóa giao thơng gắn chặt với hệ thông tin địa lý Các nghiên cứu chủ yếu sử dụng cơng cụ có sẵn để trực quan hóa đại lượng lĩnh vực quản lý cụ thể đó, mà chưa đào sâu vào nghiên cứu cách trực quan hợp lý để phục vụ việc phân tích Tìm kiếm thư viện cơng trình nghiên cứu, Internet nhận thấy đa số nghiên cứu lãnh vực GIS Như phân tích trên, việc thiếu nhận định xác giao thơng Việt Nam thiếu liệu công cụ phân tích Tuy nhiên để giải tồn diện hai yếu tố hoàn cảnh tương đối khó khăn Tại thành phố Hồ Chí Minh, xe buýt dần trở thành phương tiện công cộng phổ biến yếu người dân Do nghiên cứu này, nhóm nghiên cứu tập trung phân tích liệu giao thơng xe bt để từ xây dựng mơ hình liệu tuyến xe bt theo thời gian Dựa vào mơ hình liệu theo thời gian trên, nhóm nghiên cứu triển khai tốn tìm đường xe buýt theo thời gian thực NGHIÊN CỨU KHOA HỌC Bài tốn tìm đường ngắn (shortest path) nghiên cứu nhiều năm có nhiều giải thuật giải cho trường hợp có điều kiện, ràng buộc kèm theo Trong đó, vấn đề tìm đường ngắn theo thời gian tạo nhiều thách thức với nhà nghiên cứu Cuối cùng, dựa vào cơng nghệ WebGL, kết tìm tuyến xe bt theo thời gian thực hiển thị trực quan đồ 3D Trong phần lại báo, nhóm nghiên cứu chia làm phần Phần giới thiệu liệu xe buýt mà nhóm sử dụng cho nghiên cứu mơ hình lưu trữ liệu giao thông xe buýt theo thời gian Phần nhóm giới thiệu giải thuật tìm đường xe buýt theo thời gian thực Phần nhóm giới thiệu số kết đạt Cuối số kết luận dự định nghiên cứu nhóm tương lai Phân tích liệu 2.1 Dữ liệu dòng giao thơng xe bt Dữ liệu dòng giao thơng xe bt thu thập thông qua thiết bị GPS gắn xe buýt Các thiết bị định thời để gửi tín hiệu máy chủ Dữ liệu thơ nhận đơn giản với dòng thơng tin sau: 53U1917,10.751246,106.7019,0.0,0.0,0,1,0, Wed Jun 04 00:00:19 ICT 2014 Dữ liệu cho biết thông tin bao gồm mã số quản lý thiết bị, tọa độ thiết bị thời điểm gửi tín hiệu Từ thơng tin biết vị trí thiết bị theo thời gian Hình thể đường vị trí thiết bị Ở đó, thời gian tín hiệu khơng nhau, có lúc thưa dày đặc Với số lượng lớn thiết bị GPS gắn cho xe buýt TP.HCM (khoảng 6000 thiết bị), ta có mạng lưới dày đặc đường xe buýt Như hình thể mạng lưới đường xe buýt khoảng thời gian từ đến Hình 1: Đường vị trí tín đồ 2D Hình 2: Đường xe buýt phủ khắp TP.HCM đồ 2D SỐ 07 - THÁNG 05/2015 101 NGHIÊN CỨU KHOA HỌC Các thiết bị trả số lượng lớn liệu, khoảng 2.5 triệu liệu ngày Tuy nhiên có số trường hợp liệu khơng dùng Khi tín hiệu gửi đặn thời gian lần gửi tín hiệu nhỏ thấy rõ đường phương tiện Từ tính tốn qng đường vận tốc phương tiện cách tương đối xác Nhưng thực tế nhiều trường hợp tín hiệu có thời gian ngắt quãng lớn Có nhiều nguyên nhân thiết bị hết lượng, tín hiệu bị mất, người điều khiển tắt thiết bị điều dẫn đến khó mà xác định đường xác xe buýt xác định vận tốc xe buýt Đối với liệu bị loại bỏ 2.2 Dữ liệu đồ tuyến xe buýt Từ liệu đồ xe buýt hay gọi mạng lưới xe buýt trung tâm điều hành công cộng Tp Hồ Chí Minh, nhóm thơng tin xe buýt thành thành phần sau: • Bản đồ xe buýt phủ 110 tuyến, tuyến có lượt lượt Trên tuyến xe buýt ta biết lộ trình tuyến, giá vé, lịch chạy • Có khoảng 4300 trạm dừng • Các trạm dừng nối với tuyến qua Sau hiểu rõ đồ xe buýt thành phố Hồ Chí Minh, ta quan sát đồ xe bt góc nhìn đồ thị nhằm định mơ hình lưu trữ máy tính: • Các đỉnh trạm xe bt • Các cạnh đường tuyến xe buýt qua trạm kế Mỗi cặp trạm kế có nhiều tuyến xe buýt qua, tuyến qua cặp trạm tạo thành cạnh đồ thị cạnh cạnh có hướng Mỗi cạnh có thơng tin qng đường thời gian Ngoài ra, trạm gần di chuyển qua lại cách Từ tạo thêm cạnh cho đồ thị xe buýt Việc thêm cạnh để phù hợp với thực tế xe bt • Có khoảng gần 10000 cạnh nối xe buýt khoảng 14000 cạnh nối trạm gần • Đây đồ thị thưa với số bậc trung bình 102 SỐ 07 - THÁNG 05/2015 2.6 Con số chưa tính tới cạnh nối trạm gần Nhóm nghiên cứu tiến hành lưu trữ liệu đồ xe buýt địa bàn Tp Hồ Chí Minh sở liệu quan hệ sử dụng hệ quản trị sở liệu SQL Server Cho đến bước này, ta có liệu dòng giao thơng liệu mạng lưới xe buýt tĩnh chưa có yếu tố thời gian động Vì việc cần làm ánh xạ liệu dòng giao thơng vào mạng lưới xe buýt tĩnh để có liệu mạng lưới xe buýt theo thời gian 2.3 Dữ liệu đồ tuyến xe buýt theo thời gian Trước tiên, liệu dòng giao thơng cho biết thơng tin phương tiện tới điểm A thời điểm t1 tới điểm B thời điểm t2 Như ta có khoảng thời gian di chuyển A B, chưa biết đường thực A B Như trình bày phần trước, ta quan tâm tới trường hợp mà (t2-t1) khoảng thời gian nhỏ ∆t xem đường từ A tới B đường thẳng Từ ta tính quãng đường A B công thức khoảng cách Euclide, vận tốc trung bình đoạn đường AB khoảng thời gian từ t1 đến t2 Với cách này, ta tính vận tốc cho tất cặp vị trí liên tục Tiếp theo việc quan trọng cần làm tính tốn để xây dựng liệu cho đồ thị xe buýt theo thời gian từ liệu tính tốn Ban đầu đồ thị xe buýt có thông tin liệu tĩnh ( , d, r), đoạn đường có chiều dài d trạm v1 v2 tuyến r, chưa cung cấp thông tin thời gian Nhóm nghiên cứu chia thời gian ngày thành khoảng thời gian nhỏ T liên tục Mỗi liệu tĩnh ( , d, r) với khoảng thời gian T có thơng tin vận tốc chi phí thời gian tương ứng Từ ta có liệu theo thời gian gian (, d, r, T, s , t) cho biết đoạn đường có chiều dài d trạm v1 v2 tuyến r khoảng thời gian T với vận tốc s chi phí thời gian để t Để tính vận tốc s chi phí thời gian t cho liệu, nhóm nghiên cứu dùng giải thuật sau: NGHIÊN CỨU KHOA HỌC Bước 1: Với liệu ( , d, r, T ) , đoạn đường có chiều dài d trạm v1 v2 tuyến r khoảng thời gian T Tìm tất đoạn AB khoảng thời gian từ t1 đến t2, cho: + AB gần với + [t1,t2] thuộc khoảng thời gian T Bước 2: Gán vận tốc đoạn đường vận tốc trung bình tất đoạn AB tìm Từ tính chi phí thời gian đoạn đường Bước 3: Nếu khơng tìm đoạn AB vận tốc giá trị vận tốc mặc định Ta sử dụng vận tốc trung bình tồn liệu dòng giao thơng Hình Mơ tả đoạn màu đỏ tính gần với đoạn đường Trong Bước 1, mục tiêu tìm đoạn AB gần với đoạn đường , đoạn AB tính gần với , tồn điểm vi thuộc mà khoảng cách từ vi tới trung điểm đoạn AB nhỏ giá trị ∆d cho trước Như hình mơ tả đoạn AB đoạn thẳng( màu đen đỏ), đoạn màu đỏ đoạn AB tính gần với Còn Bước đơn giản tính vận tốc trung bình tất đoạn AB tìm được, gán giá trị vận tốc cho đoạn đường Bước B3 dùng để xử lý cho đoạn đường khơng tìm đoạn AB gần nó, nên gán cho giá trị vận tốc trung bình dòng giao thơng Sau thực theo giải thuật này, nhóm nghiên cứu xây dựng dược liệu đồ thị xe buýt theo thời gian Trong phần sau, nhóm trình bày mơ hình đồ thị theo thời gian giải thuật tìm đường xe buýt theo thời gian Giải thuật tìm đường xe buýt theo thời gian thực Trong phần nhóm trình bày khái niệm liên quan, mơ tả tốn giải thuật để giải toán 3.1 Đồ thị phụ thuộc thời gian Đồ thị phụ thuộc thời gian (GT, E, V) (hoặc viết tắt GT) đề cập chi tiết [10], định nghĩa: • V= {vi} tập đỉnh đồ thị • E ⊆ V x V tập cạnh đồ thị • W tập hàm có giá trị dương • Với cạnh (vi, vj) ∈ E , có hàm wi,j (t)∈ W, với biến thời gian khoảng thời gian • Hàm độ trễ-cạnh (edge-delay function) wi,j (t) xác định thời gian để di chuyển từ đỉnh vi đến đỉnh vj xuất phát từ đỉnh vào thời điểm t 3.2 Bài tốn tìm đường ngắn với đồ thị phụ thuộc thời gian Định nghĩa: Bài tốn tìm đường ngắn với đồ thị phụ thuộc thời gian tìm đường có SỐ 07 - THÁNG 05/2015 103 NGHIÊN CỨU KHOA HỌC thời gian di chuyển nhỏ từ điểm bắt đầu đến điểm đích với thời điểm bắt đầu đồ thị phụ thuộc thời gian Thời gian di chuyển thời điểm đến điểm đích trừ thời điểm bắt đầu, gọi tắt toán TDSP (time-dependent shorsted path) Trong [10] đề cập tới toán TDSP tìm đường với thời gian di chuyển nhỏ thời điểm bắt đầu để cho vấn đề vận chuyển Còn đây, tìm đường với thời gian di chuyển nhỏ thời điểm biết trước Ở đỉnh có đại lượng: ~ (v ) kí hiệu cho thời gian đợi (waiting • w i time) đỉnh • arrive (vi) kí hiệu cho thời điểm đến đỉnh • depart (vi) kí hiệ u cho thời điểm xuất phát từ đỉnh Mối quan hệ ba đại lượng thể qua công thức sau: TDSP dựa đề xuất từ [11], giải thuật hoạt động đồ thị thỏa mãn giả định cạnh đồ thị có tính chất FIFO [10] [12] Tính FIFO: Một cạnh (vi , v j ) có tính FIFO wi , j (t ) ≤ t ∆ + wi , j (t + t ∆ ) với t ∆ ≥ t1 + wi , j (t1 ) ≤ t + wi , j (t ) với t ≥ t1 Tính chất khẳng định bắt đầu xuất phát cạnh trước khỏi cạnh trước Tính chất phù hợp với việc lưu thông đường xe chạy với tốc độ đường đó, phù hợp với phương tiện xe buýt, với kích thước lớn đường lại nhỏ địa bàn Tp.Hồ Chí Minh Đầu vào: Đơn đồ thị Điểm bắt đầu điểm cuối s,e; thời gian bắt đầu ts ~ Đầu ra: Đường p từ s đến e depart (vi ) = arrive(vi )+ w(vi ) fs = ts Cho đường Q.enque({fs,s}) , Q is a priority queue conp = (v1 , v )( v , v3 ) (v k −1 , v k ) taining pairs, {fi,vi}, ordered by fi in ascending order thời điểm bắt đầu arrive(v1 ) = t , While Q is not empty {fi ,vi} = Q.deque() arrive(v ) = depart (v1 ) + w1, (depart (v1 ) If vi is e, stop For each neighbors vk of vi arrive(v k ) = depart (v k −1 ) + wk −1,k (depart (v k −1 ) if vk is not visited fk = fi + wi,k(fi) g p (t ) = arrive(v k ) Q.enque({fk,vk}) label(vk)={fk,vi} elseif {fi+wi,k(fi),vi} is better label(vk) g p (t ) hàm thời gianpđến từ v1 tới v k theo fk = fi + wi,k(fi) đường p , với thời điểm bắt đầu t Từ ta Q.enque({fk,vk}) có hàm thời gian di chuyển theo đường p label(vk)={fk,vi} g p (t ) − t Mục tiêu tốn TDSP tìm end for * đường có thời gian di chuyển ngắn p : end while if e is visited g p* (t ) − t = {g p (t ) − t} {te,vp} = label(e) ~ (*) p,w t*=te-ts Do có thêm yếu tố thời gian nên khơng gian p=e nghiệm bán toán TDSP lớn nhiều so với while vp != s tốn tìm đường ngắn khơng có yếu tố thời p = vp.p gian Giải thuật sau dùng phương pháp gán nhãn {fi,vp} = label(vp) (labeling method) sử dụng để giải toán end while 104 SỐ 07 - THÁNG 05/2015 NGHIÊN CỨU KHOA HỌC p = s.p end if ~ (v ) tuyến, d i , j = , k i , j = , wi , j (t ) = w i thời gian đợi để chuyển sang tuyến Giải thuật dùng hàng đợi chứa cặp giá trị bao gồm đỉnh vi thời gian tới đỉnh fi từ đỉnh bắt đầu s Giải thuật kết thúc gặp đỉnh cuối e hàng đợi trống (khơng có nghiệm) Giải thuật thực việc tính tốn giá trị thời gian fk để tới đỉnh vk đưa cặp giá trị vào hàng đợi 3.3 Áp dụng cho tốn tìm đường xe buýt theo thời gian Như trình tốn tìm đường ngắn cho đồ thị phụ thuộc thời gian nói chung Còn tốn tìm đường xe bt theo thời gian mà nhóm muốn giải tìm đường xe buýt có thời gian di chuyển nhỏ từ điểm bắt đầu đến điểm đích với thời điểm bắt đầu đồ thị xe buýt theo thời gian thoả mãn ràng buộc (số lần chuyển tuyến, số tiền cần dùng, thời gian đợi) Khơng tính tổng quát, nghiên cứu báo sử dụng ràng buộc số lần chuyển tuyến, ràng buộc khác thể áp dụng tương tự Điểm khác biệt đồ thị xe buýt theo thời gian có số đặc điểm riêng có như: kết nối hệ thống tuyến xe buýt, di chuyển cách trạm gần nhau, tốn chi phí chuyển từ chuyến sang chuyến khác Dó đồ thị xe buýt theo thời gian có số đặc điểm khác sau: Với cạnh ( vi , v j ) ∈ E , di, j (vi ,, v j ) = wi , j (t ) 1 k nÕuchuyÓn tuyÕn k = i , j i, j lại cho bit mt cnh ú có phải cạnh chuyển tuyến (giá trị 1) hay khơng Có ba loại cạnh đơn đồ thị này: • Loại a: Cạnh kết nối tuyến xe, với d i , j quãng đường di chuyển, wi , j (t ) thời gian di chuyển, k i , j = • Loại b: Cạnh cho biết thông tin chuyển v j s • Loại c: Cạnh thể việc bộ, với d i , j quãng đường bộ, wi , j (t ) = w0 thời gian bộ, k i , j = Để giải tốn tìm đường xe bt theo thời gian với ràng buộc số lần chuyển tuyến, nhóm đề xuất giải thuật (gọi tắt D3) dựa phương pháp gán đa nhãn (multi-labeling method) sau: Giải thuật D3 có vài điểm đáng ý đỉnh gán nhiều nhãn, giải thuật có hai thao tác chọn nhãn có giá tốt nhãn có thời gian tốt Với nhãn ni={fi,ci,vi},nj = {fj,cj,vj}, nhãn ni tốt nhãn nj fi