1. Trang chủ
  2. » Luận Văn - Báo Cáo

Tóm tắt Luận văn Thạc sĩ Khoa học máy tính: Phân tích và mô phỏng tình trạng giao thông dựa vào khai phá dữ liệu của phương tiện vận tải

24 8 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 24
Dung lượng 0,94 MB

Nội dung

Luận văn này nêu phương pháp: (1) Phân vùng và phân cụm các cung đường di chuyển theo thời gian để tìm ra quy luật di chuyển của các phương tiện vận tải; (2) Mô phỏng luồng di chuyển của các phương tiện vận tải theo vùng; (3) Xếp hạng các khu vực đón, trả khách; (4) Dự đoán luồng giao thông trong các vùng; (5) Đưa ra gợi ý di chuyển cho tài xế dựa vào mật độ giao thông và kết quả xếp hạng của các vùng. Các bài toán này được thực hiện theo tiếp cận phân tích dữ liệu giao thông, cụ thể là phân tích dữ liệu hành trình thu nhận từ taxi theo thời gian thực và gần thời gian thực.

ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ TRỊNH BÁ Q PHÂN TÍCH VÀ MƠ PHỎNG TÌNH TRẠNG GIAO THÔNG DỰA VÀO KHAI PHÁ DỮ LIỆU CỦA PHƯƠNG TIỆN VẬN TẢI Chuyên ngành: Khoa học máy tính Mã số: 8480103.01 TÓM TẮT LUẬN VĂN THẠC SĨ NGÀNH CÔNG NGHỆ THÔNG TIN Hà Nội - 2018 Chương Khái quát toán khai phá liệu phương tiện vận tải Ngày nay, với phát triển mạnh mẽ vượt bậc Công nghệ thông tin, hạ tầng sở giao thông, việc đại hóa q trình khai thác, kiểm sốt phương tiện vận tải trọng triển khai sâu rộng Điều thúc đẩy gia tăng liệu phương tiện vận tải Các liệu đến từ thiết bị giám sát hành trình thiết bị kèm trình thực giải tốn nghiệp vụ Vì vậy, nhiều nhà khoa học nghiên cứu cơng nghệ, thuật tốn để giải toán khai phá liệu cách nhanh đáp ứng yêu cầu thực tế mà tổ chức hay doanh nghiệp đưa 1.1 Tổng quan liệu GPS GPS - Hệ thống định vị toàn cầu hệ thống xác định vị trí dựa vị trí vệ tinh nhân tạo, Bộ Quốc phòng Hoa Kỳ thiết kế, xây dựng, vận hành quản lý Trong thời điểm, tọa độ điểm mặt đất xác định xác định khoảng cách từ điểm đến ba vệ tinh GPS sử dụng nguyên tắc hướng thẳng tương đối hình học lượng giác học Mỗi vệ tinh liên tục phát truyền liệu quỹ đạo nó, đó, thiết bị GPS nhận liên tục truy cập liệu quỹ đạo xác từ vị trí tất vệ tinh Máy thu tính tốn khoảng cách từ vệ tinh, giao điểm mặt cầu có tâm vệ tinh, bán kính thời gian tín hiệu từ vệ tinh đến máy thu nhân vận tốc sóng điện từ toạ độ điểm cần định vị GPS gồm phần chính: Phần khơng gian, phần kiểm sốt phần sử dụng 1.2 Dữ liệu GPS từ phương tiện vận tải Dữ liệu định vị phương tiện vận tải thiết bị định vị ghi lại gửi máy chủ theo khoảng thời gian cố định Nếu phương tiện bật máy (ở trạng thái bật chìa khóa điện), liệu gửi lên 15 giây lần, ngược lại, trạng thái tắt máy, liệu gửi 30 giây lần 2 1.3 Các ứng dụng khai phá liệu phương tiện vận tải Luận văn tập trung vào mảng ứng dụng “Dịch vụ Giám sát điều khiển giao thông” – nhu cầu thiết để giải vấn đề tắc đường, quy hoạch thị với tốn cụ thể:      Phân vùng phân cụm cung đường di chuyển theo thời gian để tìm quy luật di chuyển phương tiện vận tải Mô luồng di chuyển phương tiện vận tải theo vùng Xếp hạng khu vực đón, trả khách Dự đốn luồng giao thơng vùng Đưa gợi ý di chuyển cho tài xế dựa vào mật độ giao thông kết xếp hạng vùng Chương Một số nghiên cứu phân tích, mơ tình trạng giao thơng Như đề cập chương 1, luận văn tập trung vào toán cụ thể sau:   Phân vùng phân cụm cung đường di chuyển theo thời gian để tìm quy luật di chuyển phương tiện vận tải: Cụ thể luận văn tiến hành phân tích liệu nhiều taxi ngày, khoảng thời gian định để tìm cụm (các cung đường chung), loại bỏ liệu nhiễu, cụm không đặc trưng, phục vụ cho tốn mơ luồng di chuyển, tìm đường chung, đường tối ưu phục vụ cho toán gợi ý di chuyển Phương pháp phân cụm thường chia thành[7]: không giám sát, giám sát, bán giám sát Luận văn lựa chọn phương pháp không giám sát, cụ thể mơ hình thuật tốn Trajectory clustering Jae-Gil Lee cộng [6] trình bày bên Mơ luồng di chuyển phương tiện vận tải theo vùng: Nhằm đạt mục tiêu khái qt hóa tăng hiệu tính tốn luận văn sử dụng tư tưởng chia vùng theo công trình Naoto[8] cách chia cung thời gian theo cơng trình Xiaomeng Wang cộng [15] đề xuất cách biểu diễn mật độ theo vận tốc    Xếp hạng khu vực đón, trả khách: Luận văn thực khái quát hóa khu vực đón, trả khách theo tư tưởng chia vùng cơng trình Naoto[8] cách chia cung thời gian cơng trình Xiaomeng Wang cộng [15] Dự đốn luồng giao thơng vùng: Luận văn thực dự đốn vùng đến theo cơng trình S´ebastien Gambs cộng [11, 12] với cách gán nhãn dựa xếp hạng mật độ, phục vụ cho toán gợi ý di chuyển Đưa gợi ý di chuyển cho tài xế dựa vào mật độ giao thông kết xếp hạng vùng: Dựa toán dự đoán luồng giao thơng xếp hạng đón khách, luận văn thực đưa gợi ý di chuyển cho tài xế, sử dụng cung đường phân cụm để gợi ý cung đường tốt 2.1 Thuật toán phân cụm TRACLUS Phân cụm là cách nhóm đối tượng liệu thành nhóm cho đối tượng nhóm gần đối tượng hai nhóm khác khác nhiều Đối với dự án, phân cụm tích hợp cho phép tìm hiểu quy luật quãng đường taxi Các quy luật đường taxi gồm có đoạn đường taxi dùng để di chuyển nhiều nhất, cụm quãng đường phân dựa khoảng cách thực tế Để giải hai toán luận văn sử dụng cơng trình Jae-Gil Lee cộng [6], thuật toán TRACLUS Để hiểu rõ thuật toán giả sử có qng đường Hình 3.1 Chúng ta nhìn rõ có đặc điểm chung, biểu diễn mũi tên hình chữ nhật Tuy vậy, nhóm quãng đường làm một, khám phá đặc điểm chung mà chúng di chuyển hướng khác nhau, bị số thơng tin q giá 4 Hình 2.1Mơ hình quãng đường chung Giải pháp phân chia quãng đường thành tập hợp phân đoạn đường sau nhóm phân đoạn đường Công việc khuôn khổ phân vùng cụm Mục tiêu việc phân vùng cụm khám phá quãng đường (phân đoạn đường) chung từ liễu quãng đường đầu vào Phương pháp phân vùng cụm gồm giai đoạn:   Bước phân vùng: Mỗi quãng đường tối ưu phân chia làm phân đoạn đường Các phân đoạn đường liệu đầu vào cho bước Bước phân cụm: phân đoạn đường giống nhóm vào cụm Trong báo này, thuật toán phân cụm dựa mật độ sử dụng Hình 2.2Ví dụ phân vùng cụm quãng đường 2.1.1 Phân vùng quãng đường Chúng ta muốn tìm điểm mà hành vi quãng đường thay đổi nhanh chóng, gọi điểm điểm đặc trưng Đối với TRi = p1 p2 p3…pleni, xác định tập hợp điểm đặc trưng {pc1, pc2, pc3,…,pcpari } (c1 < c2 < … < cpari) Mỗi điểm pi tương ứng với tọa độ gồm kinh độ vĩ độ (X Y tệp liệu đầu vào) Sau TRi phân vùng điểm đặc trưng, vùng biểu diễn phân đoạn đường Hình 2.3 miêu tả ví dụ qng đường cách phân đoạn Hình 2.3: Ví dụ quãng đường phân đoạn Việc phân chia tối ưu cần phải có hai tính chất sau: xác súc tích Tính xác có nghĩa khác quãng đường tập hợp phân đoạn đường nhỏ tốt Tính súc tích đồng nghĩa với số lượng phân đoạn tốt 2.1.2 Phân cụm Trong thuật toán TRACLUS, thuật toán phân cụm DBSCAN sử dụng Đối với thuật toán DBSCAN, cần xác định tham số: ε (tương ứng với khoảng cách nhỏ điểm để gọi điểm hàng xóm) minPts (tương ứng với số lượng điểm hàng xóm) Nε(L) gọi hàng xóm phân đoạn đường L ∈ D khoảng cách bán kính ε: Nε(Li) = {Lj∈ D | dist(Li, Lj ) ≤ ε} Phân đoạn đường Li∈ D gọi phân đoạn đường với điều kiệnεvà MinLns thỏa mãn |Nε(Li)| ≥ MinLns gọi ngoại bên không thõa mãn điều kiện 6 2.2 Mơ hình giao thơng dựa “pagerank” 2.2.1 Xếp hạng duyệt web Thuật toán PageRank thuật toán xếp hạng trang web sử dụng rộng rãi nhất, dựa giả thuyết trang web có liên kết quan trọng đến nó, liên kết đến trang khác trở nên quan trọng Do PageRank tính tốn backlink (liên kết đến trang đó) chia sẻ xếp hạng thơng qua liên kết: Một trang có xếp hạng cao tổng trang có liên kết đến cao[13] Thuật tốn tính toán dựa giả định:    Mỗi đường link tới trang web tính hỗ trợ làm tăng thêm giá trị Pagerank Giá trị Pagerank trang định nghĩa đệ quy phụ thuộc vào số lượng giá trị trang mà có link dẫn đến trang (incoming links) Một trang web có chứa nhiều link liên kết từ trang web có giá trị PageRank cao giá trị PageRank trang cao 𝑃𝑅(𝑢) = ∑ 𝑣∈𝐵(𝑢) 2.2.2 𝑃𝑅(𝑣) 𝑁𝑣 Damping factor PageRank Có khái niệm quan trọng PageRank gọi “damping factor” sử dụng trình chuyển thứ hạng Khái niệm sử dụng để tránh vấn đề đường cụt Khả nhảy PageRank đặc trưng hệ số “damping factor” (d) Hệ số thường đặt 0.85 Công thức trở thành: 𝑃𝑅(𝑢) = − 𝑑 + 𝑑 ∑ 𝑣∈𝐵(𝑢) 2.2.3 𝑃𝑅(𝑣) 𝑁𝑣 PageRank có trọng số Định nghĩa phía PageRank có giả định xếp hạng trang chia cho tất trang có liên kết Ví dụ trang A có bốn liên kết in-link đến từ bốn trang B, C, D E Theo công thức PageRank [13] trang bốn trang đóng góp cho A xếp hạng Tuy nhiên giả định không thực tế Những trang quan trọng hay phổ biến thường có tỷ lệ chia sẻ xếp hạng cao Nói cách khác xếp hạng chuyển đến trang web A từ trang khác phụ thuộc vào độ phổ biến liên kết (in-link out-link)[14] PageRank có trọng số định nghĩa sau: 𝑖𝑛 𝑜𝑢𝑡 𝑃𝑅(𝑢) = − 𝑑 + 𝑑 ∑ 𝑃𝑅(𝑣) 𝑊(𝑣,𝑢) 𝑊(𝑣,𝑢) 𝑣∈𝐵(𝑢) 2.2.4 Xếp hạng taxi Luận văn áp dụng tư tưởng PageRank có trọng số cho mơ hình giao thơng cách thay trình duyệt web trình di chuyển taxi [8] Có nghĩa taxi mang xếp hạng từ vùng M(i,j) đến vùng lân cận M(i’,j’) Hình 2.11 Hình 2.11 Xếp hạng taxi 2.3 Sử dụng xích Markov dự đốn điểm đến 2.3.1 Xích Markov Xích Markov trường hợp đặc biệt automat hữu hạn có trọng số Một xích Markov sử dụng giả định quan trọng thứ tự xích Markov bậc nhất: xác suất trạng thái cụ thể phụ thuộc vào trạng thái trước Thuộc tính Markov:𝑃(𝑞𝑖 |𝑞1 … 𝑞𝑖−1 ) = 𝑃(𝑞𝑖 |𝑞𝑖−1 ) Bởi aij biểu diễn xác suất p(qj|qi), luật xác suất yêu cầu giá trị tất cung từ trạng thái phải có tổng 1: 𝑛 ∑ 𝑎𝑖𝑗 = ∀𝑖 𝑗=1 2.3.2 Xích Markov di động (Mobility Markov Chain - MMC) Xích Markov di động (tên tiếng Anh Mobility Markov Chain, từ ký hiệu MMC) mơ hình hóa hành vi di chuyển người q trình ngẫu nhiên rời rạc Trong xác suất di chuyển đến trạng thái (Ở địa điểm) phụ thuộc vào trạng thái trước (địa điểm trước đó) phân bố xác suất trình chuyển đổi trạng thái [11,12] Chính xác MMC bao gồm:   Một tập hợp trạng thái P = {p1,…,pk}, trạng thái tương ứng với địa điểm có tần suát cao (Xếp hạng theo thứ tự giảm dần tầm quan trọng) Một tập hợp chuyển tiếp, ti, j, đại diện cho việc chuyển từ trạng thái pi sang trạng thái pj Một chuyển đổi từ trạng thái sang xảy người di chuyển từ trạng thái sang địa điểm không thường xuyên quay lại trạng thái 2.3.3 Sử dụng n-MMC để dự đốn điểm đến Để dự đoán điểm đến dựa n vị trí cuối cùng, ta sử dụng ma trận chuyển dịch có thay đổi, mà ma trận hàng đại diện cho n điểm đến cuối – thay đổi so với ma trận chuyển dịch nguyên hàng đại diện địa điểm cuối, cột đại diện cho điểm đích Để minh họa việc dự đoán điểm đến tiếp theo, sử dụng bảng hình 2.16 cho ma trận chuyển dịch biểu đồ 2-MMC 2-MMC bao gồm trạng thái khác nhau: “Home”(H), “Work”(W) “Leisure”(L) “Other”(O) Mục tiêu đoán điểm đến dựa điểm phía trước (ở n = 2) Ví dụ, địa điểm lúc trước H địa điểm W, dự đoán địa điểm Home (H) chuyển dịch chuyển từ trạng thái HW sang WH, cập nhật vị trí trước cho W vị trí thời cho H 9 Source/Dest HW HL HO WH LH OH OW H 1,00 1,00 0,64 0,00 0,00 0,00 1,00 W 0,00 0,00 0,34 0,84 0,50 1,00 0,00 L 0,00 0,00 0,00 0,08 0,00 0,00 0,00 O 0,00 0,00 0,00 0,08 0,50 0,00 0,00 Bảng 2.1 Ma trận chuyển dịch Chương Xây dựng hệ thống phân tích, mơ tình trạng giao thơng Với sở liệu cung cấp nguồn thu thập từ thiết bị giám sát hành trình gắn xe taxi từ ứng dụng gọi xe taxi, ta tiến hành xây dựng hệ thống qua bước tổng quan sau:       B1: Chia liệu thành tập ghi theo ngày (mỗi ngày tập ghi), chia phân biệt ngày thường ngày cuối tuần B2: Tiến hành chạy thuật toán phân cụm tập ghi theo ngày ta cụm cung đường di chuyển theo ngày (1), tiến hành chạy thuật toán phân cụm khung thời gian ta cụm cung đường di chuyển theo khung thời gian(2) B3: Chia vùng đồ Hà Nội thành vùng ta đồ thị vùng (3) B4: Dựa đồ thị vùng (3) cụm cung đường di chuyển theo khung thời gian, biểu diễn luồng di chuyển phương tiện vận tải theo thời gian B5: Dựa vào thuật tốn PageRank, với cách tính điểm ban đầu dựa vào: Số lượng xe; số lượng khách lên xe, xuống xe; vận tốc; ta tính xếp hạng khác cho vùng dựa vào PageRank, thu xếp hạng vùng (4) B6: Dựa vùng mật độ vùng tại/ vùng xếp hạng vùng với mô hình n-MMC [12], chọn điểm đến vùng lân cận, ta xác định vùng đến tiếp theo, vùng lựa chọn vùng có xác suất đến nhiều thời điểm (5)  10 B7: Dựa (5) đưa lựa chọn tốt cho tài xế, dựa (1) gợi ý cho tài xế cách di chuyển theo cung đường khác kết nối vùng 3.1 Các đề xuất 3.1.1 Đề xuất phân vùng đồ Hà Nội Để khái quát hóa liệu vận tải khu vực, ta tiến hành chia đồ hà nội thành (vùng), số cài đặt theo thông số:     3.1.2 - Kinh độ, vĩ độ điểm phía góc trái (điểm bắt đầu) Chiều dài, chiều rộng ô Số lượng ô theo chiều ngang Số lượng theo chiều dọc Cách tính xếp hạng cho PageRank có trọng số Dựa kết nghiên cứu Bin Jiang cộng [4] ta thấy rằng: liệu giao thông di chuyển phù hợp với mơ hình PageRank có trọng số đặc tính giao thơng khu vực gần khu vực phát triển, giao thơng thuận lợi có xu hướng phát triển (tương tự với tắc đường) nên ta chọn mơ hình PageRank có trọng số để biểu diễn liệu giao thơng tính xếp hạng cho vùng Dựa mơ hình PageRank có trọng số [14] ta thực thuật tốn PageRank có trọng số cho mục đích khác với in-link, out-link luồng di chuyển taxi:    Số lượng xe: Ta lấy giá trị khởi tạo số xe vùng bắt đầu chạy thuật toán Số lượng khách lên xe, xuống xe: Lấy giá trị khởi tạo số khách lên xe; xuống xe Vận tốc: Lấy giá trị khởi tạo vận tốc trung bình tồn ngày chia cho vận tốc trung bình vùng, phần cần xử lý để tránh vùng có vận tốc trung bình 3.1.3 11 Sử dụng mơ hình n-MMC với nhãn xếp hạng Dựa kết nghiên cứu S´ebastien Gambs cộng đặc tính liệu giao thông, ta nhận thấy:   Các luồng di chuyển giao thơng có quy luật, dựa vào địa điểm lúc trước người (một nhóm người) ta dự đốn điểm Dữ liệu giao thơng có tính lan truyền (một vùng tắc đường khiến vùng luồng di chuyển bị tắc) Ta tiến hành gán nhãn địa điểm người (một nhóm người) dựa vận tốc di chuyển (tắc – thấp – trung bình - cao) xếp hạng địa điểm (vùng) (thấp – trung bình – cao), cụ thể từ Bảng 2.1 ta tạo thành Bảng chi tiết sau: Source/Dest H thấp W cao L thấp O thấp H thấp W thấp 1,00 0,00 0,00 0,00 H cao L thấp 1,00 0,00 0,00 0,00 H trung bình O tắc 0,64 0,34 0,00 0,00 W cao H cao 0,00 0,84 0,08 0,08 L trung bình H trung bình 0,00 0,50 0,00 0,50 O cao H thấp 0,00 1,00 0,00 0,00 O thấp W cao 1,00 0,00 0,00 0,00 Bảng 3.1 Bảng ma trận chuyển dịch có thêm nhãn tốc độ di chuyển 3.2 Tổng quan hệ thống Hệ thống thiết kế sau 12 Hình 3.1 Hệ thống mô đưa gợi ý giao thông Với thành phần:     GPS data: Cơ sở liệu hệ thống, hệ thống luận văn sở liệu lưu trữ: o Dữ liệu tin GPS phương tiện (mỗi phương tiện phân biệt id phương tiện) o Dữ liệu cung di chuyển phân cụm thuật toán TraClus o Dữ liệu ma trận chuyển dịch qua tập huấn Tiền xử lý liệu GPS: Module xử lý liệu nhiễu (kinh độ, vĩ độ, vận tốc không hợp lý) Phân cụm sử dụng TrajectoryClustering: Module phân cụm sử dụng thuật toán TrajectoryClustering lưu trữ liệu phân cụm Xếp hạng vùng đón khách PageRank: Module sử dụng thuật toán PageRank để xếp hạng vùng theo tiêu chí khác  13 Xếp hạng gợi ý cung đường di chuyển: Hai module sử dụng mơ hình n-MMC để tập huấn gợi ý cung đường di chuyển dựa dự đoán luồng di chuyển, vận tốc 14 Chương Thử nghiệm đánh giá 4.1 Tổng quan liệu sử dụng đề tài 4.1.1 Định dạng liệu Dữ liệu sử dụng luận văn liệu từ nguồn sau: Dữ liệu thiết bị giám sát hành trình cơng ty TNHH Phát triển Cơng nghệ Điện tử Bình Anh với phương tiện xe taxi (các loại xe khác tương tự trạng thái có hàng, khơng hàng – có khách, khơng khách) liệu từ ứng dụng đặt xe, điều phối taxi tác giả luận văn xây dựng 4.1.2 Dữ liệu từ thiết bị GSHT cơng ty TNHHPTCNĐT Bình Anh Dữ liệu đầu vào từ thiết bị giám sát hành trình cơng ty TNHH Phát triển Cơng nghệ Điện tử Bình Anh lưu file text, với định dạng sau: Đường dẫn đến file text: \\\ dòng liệu có thơng tin sau (cách dấu phẩy): @00:00:17,105.862778,20.992922,0,0,131112,0,0,km(0),vbgt(0),mt() Trong đó: @: bắt đầu dịng tin 00:00:17: thời gian ngày: giờ: phút: giây 105.862778: Longitude: kinh độ 20.992922: Latitude: vĩ độ Số vị trí thứ status, thể trạng thái có khách hay khơng sau: - CĨ KHÁCH = Status & > ( phép AND bit ) - KHÔNG KHÁCH = Status & = ( phép AND bit ) Dữ liệu tư thiết bị giám sát hành trình cơng ty TNHH Phát triển Cơng nghệ Điện tử Bình Anh gồm 30 ngày, với số xe 100 xe, tổng dung lượng 1.33 GB 15 Dữ liệu từ ứng dụng đặt taxi, điều phối taxi 4.1.3 Dữ liệu đầu vào từ ứng dụng đặt taxi, điều phối taxi lưu CSDL MongoDB định dạng sau: { "userPost": "58573bb02714c9029a615c5c", "time": 1487138188, "lat": 21.0056755, "lng": 105.8010069, "state": 1, } Dữ liệu từ ứng dụng đặt xe taxi gồm 23 triệu ghi, chiếm dung lượng 3GB, nhiên liệu từ ứng dụng rời rạc nhiều nhiễu 4.1.4 Dữ liệu xử lý hệ thống Sau tiền xử lý liệu từ nguồn liệu, thu liệu đầu vào để chạy thuật toán phân cụm sau: liệu có cột là: vĩ độ (Y), kinh độ (X), ID (ID tương ứng với taxi), trạng thái khách hàng gồm có trạng thái: 1- khơng có khách, - trường đón khách, 3- có khách Vĩ độ (Y) 21.0300596 21.0300596 21.0301935 21.0301178 21.0287439 21.0296401 21.0671696 21.0671696 Kinh độ (X) 105.7889164 105.7889164 105.7859652 105.7896338 105.7889675 105.7913306 105.8348092 105.8348092 ID 0 0 0 Trạng thái khách hàng 3 1 1 Bảng 4.1 Dữ liệu đầu vào cho thuật toán phân cụm 16 Đầu sau phân cụm thuật toán TRACLUS Dữ liệu gồm điểm xuất phát (vĩ độ, kinh độ), điểm đích (vĩ độ, kinh độ), ID ID cụm Điểm xuất phát Điểm đích ID cụm Vĩ độ (Y) Kinh độ (X) Vĩ độ (Y) Kinh độ (X) 21.04617 105.790172 21.046049 105.781655 21.038296 105.791987 21.032248 105.790092 21.030695 105.784669 21.030111 105.788194 21.030111 105.788194 21.03984 105.790379 ID Bảng 4.2Ví dụ đầu vào cho bước xử lý kết 4.2 Lựa chọn công nghệ 4.2.1 Ngôn ngữ Nodejs Node.js phần mềm mã nguồn mở viết dựa ngôn ngữ JavaScript cho phép lập trình viên xây dựng ứng dụng chạy máy chủ Ban đầu, Node.js phát triển Ryan Dahl Phiên Node.js cho mắt vào năm 2009 Node.js chạy nhiều tảng khác Windows, Linux hay Mac OS Node.js phát triển sử dụng V8 Engine thư viện JavaScript Google phát triển để viết trình duyệt web Chrome Bản thân Node.js khơng phải ngơn ngữ lập trình mới, thay vào Node.js tảng mã nguồn mở (hay phần mềm mã nguồn mở) viết dựa ngôn ngữ JavaScript 4.2.2 Ngôn ngữ python Python ngơn ngữ lập trình phổ biến Được tạo Guido van Rossum vào năm 1991 Ngày nay, Python sử dụng nhiều mục đích, luận văn ngơn ngữ python sử dụng với mục đích phục vụ tính tốn khoa học 17 Hiện nay, với khả xử lý phép toán phức tạp mình, Python sử dụng nhiều việc phát triển Trí Tuệ Nhân Tạo nghiên cứu lĩnh vực Machine Learning 4.2.3 Cơ sở liệu Mongo MongoDB (bắt nguồn từ “humongous”) hệ sở liệu NoSQL mã nguồn mở Thay cho việc lưu trữ liệu vào bảng có quan hệ với truyền thống, MongoDB lưu liệu cấu trúc dạng giống với JSON(JavaScript Object Notation) gọi tên BSON Hình 3.2: – So sánh RDBMS MongoDB 4.3 Kết thu 4.3.1 Môi trường thử nghiệm Các thuật tốn mơ hình hệ thống xây dựng thử nghiệm máy tính có cấu sau: Máy server  •CPU: Intel(R) Xeon(R) CPU E3-1230 v5 @ 3.40GHz    18 RAM: GB GPU: Intel HD Graphic Hệ điều hành Centos     CPU: Intel® Core ™ i5 CPU M520 RAM: GB GPU: ATI mobility Radeaon HD 5730 Hệ điều hành Win7 Ultimate Máy client 4.3.2 Kết thử nghiệm Các quãng đường mà xe qua phân chia thành cụm quãng đường nhờ vào thuật toán TRACLUS Các cụm biểu diễn màu khác Hình 4.3 Nhờ vào view thấy qng đường có chung đặc tính (đặc điểm địa lý) gom chung vào cụm Điều cho phép phát hành vi hư quy luật di chuyển taxi Hình 4.1Kết thuật tốn TRACLUS liệu mẫu 19 Hình 4.2Hiển thị tuyến di chuyển số lượng khách tuyến Hình 4.8 Xếp hạng vùng thống kê Hình 4.3 Xếp hạng vùng PageRank có trọng số 20 Hình 4.4 Gợi ý đoạn đường di chuyển 4.3.3 Tính xác liệu dự đốn Sử dụng mơ hình chung cho tốn dự đốn hình 3.2 hai nguồn liệu mục 4.1 luận văn tiến hành dự đoán điểm đến mật độ điểm đến dựa tập liệu ta thu kết dự đoán xác điểm đến từ 70% - 85% với liệu từ thiết bị giám sát hành trình, 50 – 73% với liệu từ ứng dụng đặt xe taxi, xác điểm đến mật độ điểm đến từ 45% - 60% với hai liệu Với tham số hình 4.12: • Miss: Các điểm để dự đốn khơng nằm tập liệu huấn luyện • Incorrect: Dự đoán sai nhãn mật độ điểm đích • Correct cell: Dự đốn điểm đến, sai mật độ điểm đích • Correct: Đúng điểm đến mật độ Với cách tính sau: • Độ xác điểm đến mật độ = correct/tổng 21 • Độ xác điểm đến = (correct + correct cell)/tổng KẾT LUẬN Những vấn đề giải luận văn Luận văn tiến hành nghiên cứu giải toán Giám sát điều khiển giao thơng Bài tốn đánh giá có độ phức tạp cao có ứng dụng thực tiễn lớn Phương pháp giải luận văn tập trung vào phân cụm cung đường di chuyển, xếp hạng vùng giao thơng, dự đốn lưu lượng điểm đến, sở gợi ý cung đường di chuyển cho người tham gia giao thông Dựa nghiên cứu có, luận văn đề xuất số cách áp dụng, kết hợp nghiên cứu để giải tốn thực tiễn Luận văn xây dựng mơ hình nhằm giải tốn đặt thử nghiệm máy tính cá nhân Luận văn tiến hành xây dựng giao diện trực quan để hiển thị kết toán đặt Luận văn chạy hai liệu thực tế từ hai nguồn liệu khác có số kết định Định hướng nghiên cứu tương lai Tiến hành khắc phục tình trạng thiếu xác liệu thưa, đặc biệt liệu từ ứng dụng di động Tiến hành xây dựng hệ thống gợi ý theo hướng tiếp cận học tăng cường 22 TÀI LIỆU THAM KHẢO Tiếng Việt [1] Nguyễn Văn Tăng (2017) “Phát triển dịch vụ ứng dụng công nghệ GPS quản lý, giám sát, điều phối tối ưu hóa kế hoạch sử dụng phương tiện”, Bộ cơng thương - Chương trình quốc gia phát triển công nghệ cao đến năm 2020 [2] Viện Khoa học Công nghệ Giao thông (2016) “Dự thảo tiêu chuẩn quốc gia cho kiến trúc hệ thống giao thông thông minh its”, Bộ Khoa học Công nghệ Tiếng Anh [3] A A Markov (2006) “Classical Text in Translation An Example of Statistical Investigation of the Text Eugene Onegin Concerning the Connection of Samples in Chains”, Science in Context 19(4), pp 591–600 [4] Bin Jiang (2008) “Ranking Spaces for Predicting Human Movement in an Urban Environment”, Journal International Journal of Geographical Information Science Volume 23 Issue 7, July 2009 pp 823-837 [5] Daniel Jurafsky & James H Martin (2006) “Speech and Language Processing: An introduction to natural language processing, computational linguistics, and speech recognition”, Chapter [6] Jae-Gil Lee, Jiawei Han, Kyu-Young Whang (2007) “Trajectory clustering: a partition-and-group framework”, Proceedings of the 2007 ACM SIGMOD international conference on Management of data (SIGMOD '07) ACM, New York, NY, USA, pp 593-604 [7] Jiang Bian, Dayong Tian, Yuanyan Tang, Dacheng Tao (2018), “A survey on trajectory clustering analysis” [8] Naoto Mukai (2013) “PageRank-based Traffic Simulation Using Taxi Probe Data”, Procedia Computer Science, 2013 22: pp 1156-1163 [9] Raj Kishen Moloo, Varun Kumar Digumber (2011) “Low-Cost Mobile GPS Tracking Solution”, 2011 International Conference on Business Computing 23 and Global Informatization [10] Sameer Darekar, Atul Chikane, Rutujit Diwate, Amol Deshmukh, Prof Archana Shinde (2012) “Tracking System using GPS and GSM: Practical Approach”, IJSER journal [11] S´ebastien Gambs, Marc-Olivier Killijian, Miguel N´u˜nez del Prado Cortez (2011) “Show Me How You Move and I Will Tell You Who You Are”, transactions on data privacy (2011) pp 103–126 [12] S´ebastien Gambs, Marc-Olivier Killijian, Miguel N´u˜nez del Prado Cortez (2012) “Next Place Prediction using Mobility Markov Chains” K.4 COMPUTERS AND SOCIETY MPM '12 Proceedings of the First Workshop on Measurement, Privacy, and Mobility [13] Sergey Brin, Lawrence Page (1998) “The Anatomy of a Large-Scale Hypertextual Web Search Engine”, Computer Networks and ISDN Systems 30 pp 107–117 [14] Wenpu Xing, Ali Ghorbani (2004) “Weighted PageRank Algorith Proceedings of the Second Annual Conference on Communication Networks and Services Researchm” [15] Xiaomeng Wang, Ling Peng, Tianhe Chi, Mengzhu Li, Xiaojing Yao, Jing Shao (2015) “A Hidden Markov Model for Urban-Scale Traffic Estimation Using Floating Car Data”, PLoS ONE 10(12): e0145348 ... thống mô đưa gợi ý giao thông Với thành phần:     GPS data: Cơ sở liệu hệ thống, hệ thống luận văn sở liệu lưu trữ: o Dữ liệu tin GPS phương tiện (mỗi phương tiện phân biệt id phương tiện) o Dữ. .. quát toán khai phá liệu phương tiện vận tải Ngày nay, với phát triển mạnh mẽ vượt bậc Công nghệ thông tin, hạ tầng sở giao thông, việc đại hóa q trình khai thác, kiểm sốt phương tiện vận tải trọng... máy, liệu gửi 30 giây lần 2 1.3 Các ứng dụng khai phá liệu phương tiện vận tải Luận văn tập trung vào mảng ứng dụng “Dịch vụ Giám sát điều khiển giao thông? ?? – nhu cầu thiết để giải vấn đề tắc đường,

Ngày đăng: 26/04/2021, 01:15

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w