hệ thống phân tích nguy cơ tai nạn giao thông các khu vực trong thành phố

17 33 0
hệ thống phân tích nguy cơ tai nạn giao thông các khu vực trong thành phố

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

ĐẠI HỌC BÁCH KHOA HÀ NỘI VIỆN TOÁN ỨNG DỤNG VÀ TIN HỌC ====oOo==== BÁO CÁO MÔN HỆ HỖ TRỢ QUYẾT ĐỊNH ĐỀ TÀI: HỆ THỐNG PHÂN TÍCH NGUY CƠ TAI NẠN GIAO THÔNG CÁC KHU VỰC TRONG THÀNH PHỐ Giảng viên hướng dẫn: TS LÊ CHÍ NGỌC Sinh viên thực hiện: HOÀNG VĂN THÀNH MSSV: 20173586 Lớp: HTTTQL - K62 Hà Nội, 2020 Mục lục Trang Lời mở đầu Chương 1: Khảo sát, đánh giá Chương 2: Phân tích thiết kế hệ thống Chương 3: Thuật tốn, đánh giá mơ hình 10 Chương 4: Giao diện hệ thống 14 Kết luận 16 Tài liệu tham khảo 17 |P a g e Lời mở đầu Tai nạn giao thơng đường tốn nan giải làm đau đầu nhà quản lý quốc gia, khu vực Trong thời đại 4.0, ta áp dụng thành khoa học kĩ thuật đương thời việc hỗ trợ giảm thiểu nguy xảy tai nạn Bài báo cáo xin trình bày giải pháp giúp góp phần giải vấn đề thơng qua số mơ hình máy học đơn giản để phân tích liệu vụ tai nạn giao thông Bài báo cáo gồm phần: • • • • Chương 1: Khảo sát, đánh giá Chương 2: Phân tích thiết kế hệ thống Chương 3: Thuật tốn, đánh giá mơ hình Chương 4: Giao diện hệ thống Mặc dù cố gắng khó tránh khỏi sai sót Rất mong góp ý thày cơ, bạn bè Em xin cảm ơn thày Lê Chí Ngọc giúp đỡ em nhiều để hồn thành báo cáo môn học |P a g e Chương 1: Khảo sát đánh giá Khảo sát Tai nạn giao thơng đường ngun nhân gây tử vong toàn cầu, dẫn đến khoảng 1,25 triệu ca tử vong hàng năm Các quan vận tải toàn giới cố gắng thực chiến lược để giảm thiểu tai nạn cách đưa luật an tồn giao thơng khác Tuy nhiên, giảm thiểu tai nạn giao thông mục tiêu khó thực nhiều yếu tố mà khơng thể kiểm sốt hồn tồn luật Một phần xuất phát từ khó khăn việc dự đốn tai nạn giao thơng xảy đâu Mặc dù khó khăn, dự đốn khơng phải khơng thể Tai nạn giao thơng khơng xảy theo cách hồn tồn ngẫu nhiên Một số tài liệu khẳng định xác suất tai nạn giao thông bị ảnh hưởng vô số yếu tố đo lường Những yếu tố dễ dàng thấy tốc độ lái xe, tình trạng giao thơng, cấu trúc đường thời tiết Ta xây dựng hệ thống dựa vụ tai nạn trước để phân tích yếu tố trên, đưa dự báo nguy xảy tai tạn cho điểm ngày Từ đưa số giải pháp tăng cường quản lý hệ thống giao thông địa điểm nguy cao giúp giảm thiểu tai nạn xảy Khảo sát liệu Bộ liệu sử dụng cho toán liệu lấy từ Kaggle Bộ liệu chứa thông tin chi tiết khoảng 1,6 triệu vụ tai nạn giao thông xảy Anh khoảng thời gian từ năm 2005 đến 2014 Những chi tiết bao gồm địa điểm, thời gian, mức độ nghiêm trọng vụ tai nạn thời tiết số yếu tố sở hạ thầng giao thông Trong tốn này, tơi sử dụng phần liệu ghi lại vụ tai nạn từ năm 2010 tới 2014 để tránh bị ảnh hưởng nhiễu khủng hoảng kinh tế năm 2008 |P a g e Sau tiền xử lí liệu, ta liệu sau: Bộ liệu bao gồm 756 934 ghi với cột: • • • • • • • • Hour: xảy tai nạn Day_of_Year: ngày năm xảy tai nạn Day_of_Week: thứ tuần xảy tai nạn Year: năm sảy tai nạn Weather_Fine: thời điểm xảy tai nạn có thời tiết tốt Weather_Raining: thời điểm xảy tai nạn có mưa Weather_Fog: thời điểm xảy tai nạn có sương mù Weather_Other: điều kiện thời tiết khác Ta có biểu đồ mức độ tương quan cột: |P a g e Thật không may, liệu nói chứa mẫu "dương tính" nghĩa có ghi vụ tai nạn đặc điểm khác vụ tai nạn Bộ liệu không cung cấp mẫu "âm tính" Vì tơi muốn dự đốn khả xảy tai nạn, nên phải lấy mẫu âm tính Bằng phương pháp mơ tả Chương tạo tập liệu âm tính gộp lại với tập dương tính để xác định khả xảy tai nạn vị trí mà khơng làm thay đổi chất tốn(sẽ chứng minh Chương 3) Khi khám phá liệu, tơi phát có địa điểm thường xuyên xảy tai nạn Sau đó, tơi sử dụng thuật tốn Kmeans Clustering để nhóm vị trí thành cụm, gọi "điểm nóng tai nạn" Kết bước ta feature Cluster cho biết vụ tai nạn thuộc vào cụm Sau tơi phân tích thêm liệu phát xác suất xảy tai nạn có tương quan với số đặc tính, bao gồm ngày tuần, thời gian ngày địa điểm Sau xử lí xong tập liệu, tiến hành thử số thuật toán thấy Random Forest cho kết tốt |P a g e Chương 2: Phân tích thiết kế hệ thống Sơ đồ tổng quan hệ thống: Phần Client-side: • HTML: Là ngơn ngữ đánh dấu siêu văn xây dựng trang giao diện web mở tảng hay thiết bị có trình duyệt • CSS: Thành phần bổ trợ cho HTML để định dạng lại phần tử HTML đẹp • JavaScript: Là ngơn ngữ lập trình dạng script giúp cho phần tử giao diện web có chức tăng người dùng tương tác với Phần Server-side: • Python: Là ngơn ngữ lập trình dạng script phổ biến với ngắn gọn, tiện dụng, linh hoạt cộng đồng người dùng đơng đảo Có Framework lớn khoa học liệu hệ thống web • Django: Là Framework ngôn ngữ python giúp xây dựng hệ thống server lớn Thường dùng hệ thống thương mại Sơ đồ phân cấp chức |P a g e Sơ đồ luồng liệu 3.1 Sơ đồ luồng liệu mức ngữ cảnh 3.2 Sơ đồ luồng liệu mức đỉnh |P a g e |P a g e Chương 3: Thuật toán, đánh giá mơ hình 3.1 Tạo tập liệu âm tính Để xây dựng mơ hình phân lớp nhị phân dự báo xảy tai nạn hay không tai nạn, ta cần có tập mẫu hai lớp Các mẫu vụ tai nạn ta có Cịn tập mẫu lớp khơng xảy tai nạn ta sinh với số điều kiện định không trùng với liệu vụ tai nạn Tại đường khơng xảy tai nạn mẫu âm tính Như ta xây dựng tập mẫu âm tính lớn Nhưng dễ gây cân ta lấy nhiều Ý tưởng mẫu xảy tai nạn, ta thay đổi thơng tin ngày, giờ, vị trí Nếu thơng tin khơng trùng với vụ tai nạn khác ta có mẫu không xảy tai nạn Cụ thể, với vụ tai nạn xảy ra: • Hour: chọn khác ngẫu nhiên khoảng [0;23] mà kết thu khơng trùng với vụ tai nạn khác • Cluster: chọn cụm khác ngẫu nhiên mà kết thu khơng trùng với vụ tai nạn khác • Day_of_Year: chọn ngày khác ngẫu nhiên năm mà kết thu không trùng với vụ tai nạn khác Sau bước này, từ 700000 vụ tai nạn, ta sinh 1200000 mẫu âm tính Ta cần quan tâm tới vấn đề khác liệu việc thêm tập liệu âm tính tự tạo vào có làm thay đổi chất tốn dự báo tai nạn giao thơng mà ta cần làm hay không? Điều chứng minh phần đánh giá kết sau chạy xong mơ hình mục 3.3 10 | P a g e 3.2 Xây dựng mơ hình Random Forest Classifier Rừng ngẫu nhiên(Random Forest) thuật toán học tập có giám sát Nó sử dụng để phân loại hồi quy Nó thuật toán linh hoạt dễ sử dụng Một rừng ngẫu nhiên bao gồm nhiều định(Decision Tree) Người ta nói có nhiều cây, rừng mạnh Rừng ngẫu nhiên tạo định mẫu liệu chọn ngẫu nhiên, nhận dự đoán từ chọn giải pháp tốt phương thức bỏ phiếu Nó cung cấp số tốt tầm quan trọng tính 11 | P a g e Sau trộn mẫu dương tính với âm tính, ta cho mơ hình học từ tập liệu đạt số kết sau: • Accuracy: 0.999867 • Precision: 0.999815 • Recall: 0.999828 Kết phân loại tập test: Mức độ quan trọng thuộc tính: 3.3 Đánh giá kết 12 | P a g e Từ kết thu trên, ta thấy đặc trưng Hour, Day_of_Year, Cluster mà ta dùng để tạo liệu âm tính có mức độ quan trọng khơng cao, mơ hình thực học liệu tốn mà ta cần tìm học điều kiện mà ta sinh tập âm tính Kết mơ hình số Accuracy, Precision, Recall cao, kết luận mơ hình tin tưởng 13 | P a g e Chương 4: Giao diện hệ thống Giao diện đăng nhập Giao diện nhập liệu cho mơ hình Giao diện kết phân tích 14 | P a g e Giao diện nhập liệu vụ tai nạn 15 | P a g e Kết luận Trên giải pháp tơi cho tốn xác định nguy tai nạn giao thông Bằng mô hình đơn giản Random Forest Classifier kết hợp với Kmeans Clustering đem lại kết với độ tin cậy cao Tuy nhiên, số đặc trưng liệu cịn nhỏ nên mơ hình chưa thể khái qt tổng quan toán nên hạn chế khả thi triển khai thực tế Nên cần kết hợp thêm liệu nhiều bên liên quan để cải thiện độ hiệu hệ thống Mặt khác, mơ hình mang tính chất hỗ trợ, gợi ý cho nhà quản lý định Hệ thống khơng thể thay hồn tồn nhà quản lý việc định Các định phụ thuộc vào nhiều yếu tố trước thiên tai, dịch bệnh,v.v lại có ảnh hưởng lớn tới kết toán 16 | P a g e Tài liệu tham khảo • Machine Learning Cơ Bản - Vũ Hữu Tiệp • “Why Should I Trust You?” Explaining the Predictions of Any Classifier - Marco Tulio Ribeiro - Sameer Singh - Carlos Guestrin • Predicting Traffic Accidents Through Heterogeneous Urban Data: A Case Study - Zhuoning Yuan - Xun Zhou - Tianbao Yang 17 | P a g e ... xảy tai nạn Day_of_Year: ngày năm xảy tai nạn Day_of_Week: thứ tuần xảy tai nạn Year: năm sảy tai nạn Weather_Fine: thời điểm xảy tai nạn có thời tiết tốt Weather_Raining: thời điểm xảy tai nạn. .. giản để phân tích liệu vụ tai nạn giao thông Bài báo cáo gồm phần: • • • • Chương 1: Khảo sát, đánh giá Chương 2: Phân tích thiết kế hệ thống Chương 3: Thuật tốn, đánh giá mơ hình Chương 4: Giao. .. trạng giao thơng, cấu trúc đường thời tiết Ta xây dựng hệ thống dựa vụ tai nạn trước để phân tích yếu tố trên, đưa dự báo nguy xảy tai tạn cho điểm ngày Từ đưa số giải pháp tăng cường quản lý hệ thống

Ngày đăng: 29/07/2020, 20:33

Tài liệu cùng người dùng

Tài liệu liên quan