1. Trang chủ
  2. » Kỹ Thuật - Công Nghệ

Gom cụm quỹ đạo đường đi dựa vào tốc độ và cải tiến bằng phương pháp rút trích đặc trưng dựa trên Histogram

4 50 0

Đang tải... (xem toàn văn)

THÔNG TIN TÀI LIỆU

Nội dung

Bài viết tập trung vào vấn đề gom cụm hành trình phương tiện có chung hành vi di chuyển. Ví dụ hành vi di chuyển của xe ô tô cá nhân thì khác xe buýt và cũng khác với xe taxi.

8 Journal of Transportation Science and Technology, Vol 29, Aug 2018 GOM CỤM QUỸ ĐẠO ĐƯỜNG ĐI DỰA VÀO TỐC ĐỘ VÀ CẢI TIẾN BẰNG PHƯƠNG PHÁP RÚT TRÍCH ĐẶC TRƯNG DỰA TRÊN HISTOGRAM CLUSTERING TRAJECTORIES BASED ON SPEED FEATURES AND AN IMPROVEMENT BY USING HISTOGRAM – BASED FEATURE EXTRACTION Nguyễn Công Hà, Lê Văn Quốc Anh Khoa CNTT, ĐH GTVT TP.HCM conghanguyen@gmail.com Tóm tắt: Gom cụm quỹ đạo từ liệu hành trình GPS để tìm nhóm hành trình tương tự nhau, từ lâu xem nhiệm vụ quan trọng để phán đoán luồng giao thơng chính, từ cho phép dự đốn vị trí hay hành vi di chuyển phương tiện giao thơng Đa số phương pháp có dùng đặc trưng gom cụm dựa không gian thời gian đặc trưng không phù hợp để phân loại hành vi di chuyển phương tiện Trong báo nhóm nghiên cứu tập trung vào vấn đề gom cụm hành trình phương tiện có chung hành vi di chuyển Ví dụ hành vi di chuyển xe tơ cá nhân khác xe buýt khác với xe taxi Giải pháp mà nhóm đưa chuyển đổi quỹ đạo thành chuỗi đặc trưng để mô tả hành vi chuyển động đối tượng áp dụng giải thuật gom cụm khơng gian đặc trưng Nhóm thực nghiệm liệu thực thu kết tốt giải pháp có Từ khóa: Dữ liệu hành trình GPS; khai thác liệu; phát hành vi di chuyển Chỉ số phân loại: 1.4 Abstract: Clustering trajectories from GPS data to find groups of similar trajectories is a crucial task for recognizing main traffic flows and then to predict next positions as well as moving behavior of vehicles Most existing approaches are based on features extracted from raw locations and times Such features are not suitable for classifying moving behaviors of vehicles In this paper, we focus on clustering trajectories of vehicles having the same moving behaviors For example, moving behaviors of cars is different from moving behaviors of buses or taxi Our proposed approach is transforming each trajectory to a sequence of features to model moving behaviors of an object and utilizing traditional clustering algorithms to groups trajectories We experiment on real datasets and obtain better results than existing approaches Keywords: GPS trajectory data; data mining; behavior detection Classification number: 1.4 Giới thiệu Ngày nay, phổ biến rộng khắp nhanh chóng thiết bị trang bị GPS hay dịch vụ dựa vị trí tạo khối lượng liệu hành trình lớn đối tượng chuyển động Trong phạm vi phương tiện giao thơng, kho liệu hành trình đáng giá cho việc khai thác thơng tin hữu ích, phát điểm ùn tắc hay luồng di chuyển mạng lưới giao thơng Trong báo này, nhóm nghiên cứu tập trung vào hướng phân tích liệu hành trình phương tiện dựa giải thuật gom cụm Việc khám phá cụm quỹ đạo không tiết lộ đặc điểm hành vi phương tiện chuyển động mà cao dự đoán hành trình, dự đốn bất thường hay đưa mẫu hành vi di chuyển Hiện có nhiều kỹ thuật gom cụm hành trình GPS đề xuất, chẳng hạn [1], [2], [3] Những giải pháp sử dụng biện pháp định để định nghĩa tính tương đồng quỹ đạo sau áp dụng vào thuật toán phân cụm cổ điển Mặc dù biện pháp nhóm quỹ đạo tương tự khu vực địa lý cố định khoảng thời gian, để gom quỹ đạo dựa hành vi di chuyển tương tự cần phải có giải pháp Với phương tiện giao thông, hành vi di chuyển loại phương tiện khác Ví dụ xe tơ cá nhân thường ghé địa điểm cố định (nhà, quan, trung tâm mua sắm,…), xe buýt thướng theo lộ trình ghé trạm cố TẠP CHÍ KHOA HỌC CƠNG NGHỆ GIAO THƠNG VẬN TẢI, SỐ 29-08/2018 định, lúc xe taxi số địa điểm ghé phong phú Trong báo này, nhóm đề xuất giải pháp trích xuất đặc trưng từ hành trình GPS để đưa vào giải thuật gom cụm hành vi di chuyển Ngồi giải pháp thơng thường dựa đặc trưng giá trị thống kê từ chuỗi tốc độ, nhóm đề xuất dùng kỹ thuật dựa histogram để trích xuất đặc trưng Nhóm thử nghiệm hai liệu thật Một liệu lấy từ kho liệu có tiếng UCI Machine Learning, với hành trình có gán nhãn Nhóm dùng liệu để đánh giá độ xác giải thuật nhận thấy giải pháp nhóm đề xuất cho kết tốt nhiều so với dùng giá trị thống kê làm đặc trưng Ngoài ra, nhóm dùng liệu thứ hai gắn với đường phố Việt Nam, để chứng tỏ tính hữu dụng áp dụng vào thành phố Việt Nam Các khái niệm cơng trình liên quan 2.1 Mơ hình hố liệu GPS Nhóm sử dụng khái niệm sau để mơ hình hố liệu hành trình GPS: - Toạ độ GPS: Được biểu diễn bốn , đó: id mã định danh đối tượng chuyển động (phương tiện giao thơng điện thoại có hỗ trợ GPS); lat vĩ độ, lon kinh độ; time thời gian ghi nhận vị trí đối tượng - GPS Log: Là tập hợp toạ độ GPS, có dạng {p , p , …p n }, với p i toạ độ GPS - Hành trình GPS: Là chuỗi gồm toạ độ GPS thu thập không ngắt quãng đối tượng chuyển động, có dạng p  p  … p n Dữ liệu đầu vào cho giải thuật gom cụm hành trình GPS trích xuất từ GPS Log, liệu thơ Kết quả, phần thực nghiệm trình bày 2.2 Tình hình nghiên cứu gần Các phương pháp gom cụm hành trình cổ điển áp dụng thuật toán gom cụm dựa khoảng cách dựa mật độ Do hành trình GPS thường có độ dài biến động nên thơng thường, hành trình tách thành hành trình sau gom nhóm hành trình cách sử dụng phương pháp gom cụm dựa mật độ [1] Ngoài ra, số kỹ thuật khác đề xuất kết hợp lấy mẫu với gom cụm dựa mật độ để xử lý nhiễu liệu quỹ đạo [2] Đối với nhóm giải pháp gom cụm dựa khoảng cách, giải pháp cố gắng định nghĩa độ đo khoảng cách độ đo tương tự hai hành trình dựa hàm tính khoảng cách có Eclidean hay DTW [3] Một số kỹ thuật định giới thiệu phép đo khoảng cách [4] Khác với phương pháp trên, nhóm khơng gom cụm liệu gốc mà biến đổi sang không gian đặc trưng Các giải thuật gom cụm thực thi không gian đặc trưng Nguồn liệu thực nghiệm Nguồn liệu thực nghiệm gồm có hai liệu Bộ liệu thứ lấy từ kho liệu UCI Machine Learning (https://archive.ics.uci.edu/ml/datasets/GPS+ Trajectories), thu thập từ ứng dụng Android gọi Go!Track Dữ liệu có 163 hành trình, thời gian thu thập liệu 29/02/2016 Mỗi hành trình có gán sẵn nhãn car_or_bus để phân biệt hành trình xe tô hay xe buýt Bộ liệu thứ hai hành trình di chuyển phương tiện Việt Nam cung cấp công ty OTS cung cấp giám sát dịch vụ hành trình xe tơ Số lượng xe giám sát hành trình nguồn liệu 411, khu vực Thành phố Hồ Chí Minh Thời gian thu thập liệu vòng tuần từ 01/06/2015 đến 07/06/2015 Khai thác thông tin hành vi di chuyển từ liệu GPS 4.1 Trích xuất hành vi di chuyển dựa giá trị thống kê Trước tiên nhóm sử dụng phương pháp trích xuất hành vi đối tượng cách sử dụng giá trị thống kê dựa tốc độ, tương tự giải pháp đề nghị W Tang cộng [2] Theo đó, chúng tơi lấy sáu định lượng {trung bình, lớn nhất, 75% định lượng, 50% định lượng, 25% định lượng, nhỏ nhất} để làm đặc trưng cho hành trình Một giải thuật gom cụm áp dụng không gian đặc trưng để gom cụm hành trình Để kiểm nghiệm độ xác, nhóm dùng liệu 10 Journal of Transportation Science and Technology, Vol 29, Aug 2018 có gán nhãn cố gắng phân thành cụm, số lượng cụm tương ứng với số lượng nhãn khác Vì biết trước số cụm nên nhóm chọn giải thuật K-MEANS để thử nghiệm Với liệu cho biết trước gồm hành trình xe tơ xe bt giới thiệu phần chúng tơi gom thành hai cụm đánh giá độ xác Kết độ xác 64% cho hai cụm khơng cao Xem xét hành trình bảng đồ thấy hành trình xe tơ xe bt gán nhầm vào cụm chúng chạy tuyến đường, minh họa hình Hình Kết K-Means tìm hành vi di chuyển Rõ ràng cách thực vừa khơng thích hợp cho việc phân loại hành trình dựa hành vi di chuyển Để cải tiến giải pháp này, nhóm đề xuất phương pháp trích xuất đặc trưng dùng Histogram 4.2 Cải tiến phương pháp trích xuất đặc trưng dựa vào Histogram Qua q trình thực nghiệm nhóm nhận gom cụm tốt có độ xác cao với đặc trưng dựa vào histogram thay giá trị thống kê mật độ Nhóm mơ hành vi di chuyển với ngưỡng 0, 5, 10, 15, 20, 25, 30, 40, 60, 100 (km/h) dùng ngưỡng xác định bin để tính histogram Histogram sau tính thành đặc trưng khơng gian chín chiều Tương tự phần trên, nhóm áp dụng giải thuật gom cụm K-MEANS khơng gian với số cụm thiết lập Độ xác phương pháp 96% Hình minh họa kết giải pháp này, với xe ô tô xe buýt chạy tuyến đường phân cụm Hình Kết gom cụm hành trình: Cluster gồm hành trình xe o tơ Cluster chứa hành trình xe buýt 4.3 Thực nghiệm phương pháp histogram vào liệu Việt Nam Phần nhóm áp dụng giải pháp đề xuất liệu GPS Việt Nam Đây liệu thứ hai giới thiệu mục Ngồi giải pháp gom cụm K-MEANS, nhóm cịn thử giải thuật gom cụm dựa mật độ DBSCAN Kết thực nghiệm hai giải thuật không khác nhiều, chất kỹ thuật trích xuất đặc trưng trước đưa vào giải thuật gom cụm Hình minh họa hành trình sau gom thành bốn cụm Với cụm xe cá nhân di chuyển với tuyến đường bên thành phố sử dụng đường quốc lộ Cụm số xe khách đường dài, tuyến đường di chuyển xa lộ trục đường nội Cụm số xe buýt, di chuyển tuyến cố định Đặc biệt cụm số di chuyển hầu hết tuyến đường, hành trình xe taxi Với phần thực nghiệm trên, phương pháp cho thấy ứng dụng tốt việc phân loại hành vi di chuyển phương tiện giao thơng Hình3 Thực nghiệm phương pháp Histogram vào liệu Việt Nam TẠP CHÍ KHOA HỌC CƠNG NGHỆ GIAO THÔNG VẬN TẢI, SỐ 29-08/2018 Kết luận hướng phát triển Trong báo nhóm đề xuất phương pháp cho gom cụm liệu hành trình GPS có tương tự hành vi di chuyển Hành vi di chuyển trích xuất từ khơng gian thời gian bất biến quỹ đạo với việc sử dụng tốc độ để theo dõi hành vi đối tượng Đề xuất cải tiến phương pháp Histogram đưa lại kết xác hiệu cao so với gom cụm dựa vào giá trị thống kê tốc độ Lời cảm ơn Nghiên cứu hỗ trợ từ nguồn kinh phí nghiên cứu khoa học Trường Đại học Giao thơng vận tải Thành phố Hồ Chí Minh (MS KH1705) Tài liệu tham khảo [1] J H Jae-Gil Lee and Kyu-Young Whang, “Trajectory Clustering: A Partition-and-Group Framework,” in SIGMOD’07, 2007, pp 593–604 11 [2] W Tang, D Pi, and Y He, “A density-based clustering algorithm with sampling for travel behavior analysis,” Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics), vol 9937 LNCS pp 231–239, 2016 [3] Z Li, J G Lee, X Li, and J Han, “Incremental clustering for trajectories,” in Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics), 2010, vol 5982 LNCS, no PART 2, pp 32–46 [4] G Yuan, P Sun, J Zhao, D Li, and C Wang, “A review of moving object trajectory clustering algorithms,” Artif Intell Rev., vol 47, no 1, pp 123–144, 2017 Ngày nhận bài: 29/6/2018 Ngày chuyển phản biện: 3/7/2018 Ngày hoàn thành sửa bài: 24/7/2018 Ngày chấp nhận đăng: 31/7/2018 ... loại hành trình dựa hành vi di chuyển Để cải tiến giải pháp này, nhóm đề xuất phương pháp trích xuất đặc trưng dùng Histogram 4.2 Cải tiến phương pháp trích xuất đặc trưng dựa vào Histogram Qua... hành trình sau gom nhóm hành trình cách sử dụng phương pháp gom cụm dựa mật độ [1] Ngoài ra, số kỹ thuật khác đề xuất kết hợp lấy mẫu với gom cụm dựa mật độ để xử lý nhiễu liệu quỹ đạo [2] Đối với... số địa đi? ??m ghé phong phú Trong báo này, nhóm đề xuất giải pháp trích xuất đặc trưng từ hành trình GPS để đưa vào giải thuật gom cụm hành vi di chuyển Ngồi giải pháp thơng thường dựa đặc trưng

Ngày đăng: 25/10/2020, 12:08

HÌNH ẢNH LIÊN QUAN

Hình 1. Kết quả K-Means tìm hành vi di chuyển. - Gom cụm quỹ đạo đường đi dựa vào tốc độ và cải tiến bằng phương pháp rút trích đặc trưng dựa trên Histogram
Hình 1. Kết quả K-Means tìm hành vi di chuyển (Trang 3)
Hình 2. Kết quả gom cụm hành trình: Cluster 1 gồm các hành trình của xe o tô và Cluster 2 chứa các  - Gom cụm quỹ đạo đường đi dựa vào tốc độ và cải tiến bằng phương pháp rút trích đặc trưng dựa trên Histogram
Hình 2. Kết quả gom cụm hành trình: Cluster 1 gồm các hành trình của xe o tô và Cluster 2 chứa các (Trang 3)
Hình 2 minh họa kết quả của giải pháp này, với các xe ô tô và xe buýt chạy cùng  tuy ến đường vẫn được phân cụm đúng. - Gom cụm quỹ đạo đường đi dựa vào tốc độ và cải tiến bằng phương pháp rút trích đặc trưng dựa trên Histogram
Hình 2 minh họa kết quả của giải pháp này, với các xe ô tô và xe buýt chạy cùng tuy ến đường vẫn được phân cụm đúng (Trang 3)

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w