Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 14 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
14
Dung lượng
737,1 KB
Nội dung
TÌM HIỂU PHÂN LỚP DỮ LIỆU VÀ ỨNG DỤNG VÀO BÀI TOÁN DỰ BÁO TỘI PHẠM HỆ HỖ TRỢ QUYẾT ĐỊNH NGUYỄN HOÀNG NGÂN NGUYỄN HỒ DUY TRI NGUYỄN HỒ DUY TRÍ NỘI DUNG Bài toán dự báo tội phạm Các bước thực Phương pháp thực Demo BÀI TOÁN DỰ BÁO TỘI PHẠM Giới thiệu Kaggle BÀI TOÁN DỰ BÁO TỘI PHẠM Giới thiệu Kaggle BÀI TOÁN DỰ BÁO TỘI PHẠM Giới thiệu Kaggle Nguồn: Sunday Morning Insight: Why Kaggle Changes Everything http://nuit-blanche.blogspot.com/2014/08/sunday-morning-insight-why-kaggle.html BÀI TOÁN DỰ BÁO TỘI PHẠM Bài toán dự báo loại tội phạm thành phố San Francisco BÀI TOÁN DỰ BÁO TỘI PHẠM Dữ liệu tội phạm thành phố San Francisco Dates: thời điểm xảy (timestamp) Category: loại tội phạm, mục tiêu muốn dự đoán. Descript: mô tả chi tiết phạm tội. DayOfWeek: thứ PdDistrict: tên Văn phòng cảnh sát khu vực Resolution: giải pháp bắt tội phạm Address: địa nơi phạm tội X: kinh độ Y: vĩ độ CÁC BƯỚC THỰC HIỆN Tiến trình định Simon PHƯƠNG PHÁP THỰC HIỆN Các giải thuật phân lớp phổ biến: SVM NaiveBayes Decision Table … PHƯƠNG PHÁP THỰC HIỆN Cài đặt thực phần mềm Weka. Kích thước liệu: Tập huấn luyện: 20000 dòng Tập kiểm thử: 100 dòng Kết (độ xác): NaiveBayes: 30% Decision Table: 27.73 % 10 KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN Kết luận: -Nhóm tìm hiểu thuật toán: Naïve Bayes, Decision Table, Tree J48 (Cây C4.5) - Ứng dụng vào toán dự báo tội phạm đạt số kết định Hướng phát triển: -Xử lý tập liệu lớn -Sử dụng công cụ xử lý liệu lớn khác -Cải tiến thuật toán để nâng cao độ tin kết dự báo 11 TÀI LIỆU THAM KHẢO 1. Tom Mitchell, Machine Learning, McGraw-Hill Education, 1997. 2. https://www.kaggle.com/c/sf-crime - 06/08/2015 3. http://www.cs.waikato.ac.nz/ml/weka/documentation.html - 06/08/2015 4. Phuc Do, Unit_1_DSS_Introduction_handout, UIT, 2015. 12 DEMO 13 XIN CHÂN THÀNH CẢM ƠN THẦY VÀ CÁC BẠN ĐÃ LẮNG NGHE! 14 [...]...KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN Kết luận: -Nhóm đã tìm hiểu các thuật toán: Naïve Bayes, Decision Table, Tree J48 (Cây C4.5) - Ứng dụng vào bài toán dự báo tội phạm đạt được một số kết quả nhất định Hướng phát triển: -Xử lý tập dữ liệu lớn -Sử dụng các công cụ xử lý dữ liệu lớn khác nhau -Cải tiến thuật toán để nâng cao độ tin cây của kết quả dự báo 11 TÀI LIỆU THAM KHẢO 1 Tom Mitchell,... https://www.kaggle.com/c/sf-crime - 06/08/2015 3 http://www.cs.waikato.ac.nz/ml/weka/documentation.html - 06/08/2015 4 Phuc Do, Unit_1_DSS_Introduction_handout, UIT, 2015 12 DEMO 13 XIN CHÂN THÀNH CẢM ƠN THẦY VÀ CÁC BẠN ĐÃ LẮNG NGHE! 14 . TRÍ TÌM HIỂU PHÂN LỚP DỮ LIỆU VÀ ỨNG DỤNG VÀO BÀI TOÁN DỰ BÁO TỘI PHẠM Bài toán dự báo tội phạm Các bước thực hiện Phương pháp thực hiện Demo NỘI DUNG 2 Giới thiệu về Kaggle BÀI TOÁN. Everything http://nuit-blanche.blogspot.com/2014/08/sunday-morning-insight-why-kaggle.html Bài toán dự báo loại tội phạm tại thành phố San Francisco BÀI TOÁN DỰ BÁO TỘI PHẠM 6 Dữ liệu tội phạm tại thành phố San Francisco Dates: thời điểm xảy ra (timestamp) Category: loại tội phạm, . hiện Demo NỘI DUNG 2 Giới thiệu về Kaggle BÀI TOÁN DỰ BÁO TỘI PHẠM 3 Giới thiệu về Kaggle BÀI TOÁN DỰ BÁO TỘI PHẠM 4 Giới thiệu về Kaggle BÀI TOÁN DỰ BÁO TỘI PHẠM 5 Nguồn: Sunday Morning Insight: Why