Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 18 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
18
Dung lượng
1,02 MB
File đính kèm
code.rar
(7 MB)
Nội dung
TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI VIỆN TOÁN ỨNG DỤNG VÀ TIN HỌC HỆ HỖ TRỢ QUYẾT ĐỊNH ĐỀ TÀI DỰ ĐOÁN SỐ LƯỢNG XE ĐẠP CHO THUÊ Giảng viên hướng dẫn: TS LÊ CHÍ NGỌC Sinh viên thực hiện: Vũ Thị Yên MSSV: 20173605 Lớp: HTTTQL - K62 HÀ NỘI – 2020 MỤC LỤC LỜI MỞ ĐẦU CHƯƠNG 1: KHẢO SÁT ĐÁNH GIÁ 1.1 Khảo sát đánh giá toán 1.2 Khảo sát liệu CHƯƠNG 2: PHÂN TÍCH THIẾT KẾ HỆ THỐNG 2.1 Biểu đồ phân cấp chức 2.2 Biểu đồ luồng liệu 2.2.1 Biểu đồ luồng liệu mức ngữ cảnh 2.2.2 Biểu đồ luồng liệu mức đỉnh 2.2.3 Biểu đồ luồng liệu mức đỉnh chức xử lý liệu 10 2.2.4 Biểu đồ luồng liệu mức đỉnh chức xây dựng mô hình 10 2.2.5 Biểu đồ luồng liệu mức đỉnh chức dự báo 11 2.3 Sơ đồ thiết kế hệ thống 11 CHƯƠNG 3: THUẬT TỐN, ĐÁNH GIÁ MƠ HÌNH 12 3.1 Thuật toán giải toán 12 3.2 Xử lý, phân tích liệu 13 3.3 Đánh giá mơ hình 14 CHƯƠNG 4: GIAO DIỆN HỆ THỐNG 14 4.1 Màn hình dashboard 14 4.2 Màn hình dự báo 15 KẾT LUẬN 17 TÀI LIỆU THAM KHẢO 18 LỜI MỞ ĐẦU Trong thời kì 4.0 với phát triển vượt bậc khoa học công nghệ, để phục vụ tốt cho việc quản lý tài nguyên kiểm soát chặt chẽ tài ngun, để tránh lãng phí nguồn nhân lực việc phát triển công cụ hỗ trợ nhà quản lý thực cần thiết Với phát triển cơng nghệ thơng tin, việc mơ hình hóa thiết kế hệ thống phát triển nhanh chóng dễ dàng hơn, hệ thống hỗ trợ định đời góp phần cung cấp thơng tin cho nhà quản lý thuận tiện cho việc đưa định Bài báo cáo em xin trình bày đề tài dự đoán số lượng xe đạp cho thuê, hỗ trợ nhà quản lý định số lượng cung cấp xe thị trường để phục vụ khách hàng Nội dùng báo cáo gồm chương chính: • • • • Chương 1: Khảo sát đánh giá Chương 2: Phân tích thiết kế hệ thống Chương 3: Thuật tốn, đánh giá mơ hình Chương 4: Giao diện hệ thống Mặc dù em cố gắng hoàn thành đề tài hạn chế kinh nghiệm kiến thức nên khơng tránh khỏi nhiều thiếu sót cần khắc phục Vì vậy, em mong thầy bạn đóng góp ý kiến để em làm tốt sau Cuối cùng, em xin trân trọng cảm ơn thầy TS Lê Chí Ngọc tận tình hướng dẫn để em hồn thiện báo cáo CHƯƠNG 1: KHẢO SÁT ĐÁNH GIÁ 1.1 Khảo sát đánh giá toán Dịch vụ chia sẻ xe đạp hay cịn gọi chương trình chia sẻ xe đạp công cộng, dịch vụ xe đạp cung cấp để sử dụng chung cho cá nhân sở ngắn hạn với giá miễn phí Đây kiểu cho thuê xe đạp tự động, với hàng loạt ki ốt lắp đặt thành phố, người sử dụng tự trả tiền vào máy, lấy xe trả lại xe ki ốt Hiện tại, có khoảng 500 chương trình chia sẻ xe đạp khắp giới, bao gồm 500 nghìn xe đạp Hình 1: Dịch vụ chia sẻ xe đạp Dịch vụ chia sẻ xe đạp (bike-sharing) ghi nhận mức tăng trưởng khổng lồ Châu Á kể từ năm 2016 triển khai số thành phố Châu Âu từ năm 2017 Giao thông tắc nghẽn, ô nhiễm môi trường điều kiện thuận lợi để dịch vụ chia sẻ xe đạp phát triển Tuy nhiên, sau vài năm bùng nổ, dịch vụ trở thành toán gây đau đầu cho giới chức địa phương nhà quản lý nhiều quốc gia Với mức chi phí phù hợp với nhiều đối tượng người dùng, khách hàng cịn dễ dàng tìm thấy xe đạp vỉa hè hay công viên khiến dịch vụ trở nên phổ biến Việc tìm xe, mở khóa xe tốn cước phí thực thơng qua ứng dụng điện thoại Khi kết thúc, việc để xe bãi gần Thậm chí có hãng cịn khơng cần tới bãi để xe Xe đạp đặt địa điểm khắp thành phố nhờ kết nối qua GPS, khách hàng xác định vị trí thơng qua ứng dụng di động Chính ưu điểm lấy hay trả xe nơi tùy thích giúp startup gây ấn tượng với truyền thông giới, đặc biệt nước phương Tây Hình Một khu vực tập kết xe đạp bỏ dịch vụ chia sẻ xe đạp Trung Quốc Tốc độ phát triển nhanh dịch vụ chia sẻ xe đạp dẫn đến môi trường cạnh tranh khốc liệt thị trường lớn Trung Quốc, Rắc rối đến từ hãng đua mang đến dịch vụ mà đó, xe dễ sử dụng dễ thuê tốt, gây tình trạng hỗn loạn đô thị người sử dụng xe đạp đậu xe đâu Tình trạng dùng đâu vứt gây tổn thất không nhỏ cho công ty cho thuê xe giao thông công cộng Xe đạp nhiều hãng nằm rải rác vỉa hè, thường lấn chiếm đường dành cho người mục tiêu thường xuyên bị phá hoại thị trường Trung Quốc Bên cạnh đó, chất lượng xe đạp xuống cấp nhanh, hãng tung thị trường nhiều xe đến mức không đủ người để quản lý bảo dưỡng xe Ngồi tình trạng bị phá hoại, cịn xảy tình trạng trộm cắp xe đạp Sự việc diễn thường xuyên khiến nhiều khách hàng phàn nàn việc xe đạp sẵn họ cần di chuyển Tại Đức, sau thời gian hào hứng với dịch vụ chia sẻ xe đạp, người dân quyền địa phương thấy ngán ngẩm tình trạng xe để bừa bãi vỉa hè, gây mỹ quan đô thị Về giải pháp, Mỹ, thành phố New York ban hành kế hoạch thí điểm Một số đơn vị lựa chọn phép cung cấp lượng xe đạp giới hạn phố Do đó, với việc dự đốn số lượng nhu cầu thuê xe đạp hỗ trợ nhà quản lý cung cấp lượng xe đạp ngồi hợp lý, khơng gây mỹ quan thị, giảm tình trạng hư hại, cắp mà đảm bảo nhu cầu lại khách hàng 1.2 Khảo sát liệu Em sử dụng liệu từ trang web sau: - Dữ liệu lịch sử thuê xe theo Washington DC thu thập từ trang web https://www.kaggle.com/marklvl/input?select=hour.csv - Dữ liệu dự báo thời tiết thu thập từ trang web https://openweathermap.org/api - Dữ liệu ngày lễ Mỹ thu thập từ trang web https://dchr.dc.gov/page/holiday-schedules Từ liệu ta thu liệu lịch sử thuê xe theo thời tiết tương ứng : Hình 3: Dữ liệu thu thập Bộ liệu gồm 17 trường 17380 ghi: • Instant : Chỉ số ghi • Dteday: Ngày • Season: liệu mùa gồm giá trị tương ứng (1: mùa xuân, 2: mùa hạ, 3: mùa thu, 4: mùa đơng) • Yr: năm • Mnth: tháng • Hr: ngày ( từ đến 23 ) • Holiday: liệu ngày lễ gồm giá trị (1: có phải ngày lễ, 0: khơng phải ngày lễ) • Weekday: thứ tuần ( có giá trị từ đến 6, thứ 2: 0, thứ 3: 1,… chủ nhật : ) • Workingday: liệu ngày làm việc gồm giá trị (1: có phải ngày làm việc, 0: khơng phải ngày làm việc) • Weather: liệu tình hình • Weathersit: liệu tình hình thời tiết gồm giá trị (1: Quang đãng, mây, 2: Sương mù nhiều mây, 3: Mưa nhẹ tuyết nhẹ, 4: Mưa to tuyết lớn) • Temp : liệu nhiệt độ tính theo độ C, chuẩn hóa theo cơng thức: (t-tmin)/(tmax-tmin) • Atemp : liệu nhiệt độ cảm giác bình thường tính theo độ C, chuẩn hóa theo cơng thức: (t-tmin)/(tmax-tmin) • Hum: độ ẩm, giá trị chia cho giá trị lớn • Windspeed: tốc độ gió, giá trị chia cho giá trị lớn • Casual: liệu số lượng người th xe chưa đăng kí thẻ thành viên • Registered: liệu số lượng người thuê xe đăng kí thẻ thành viên • Cnt : liệu tổng số lượng người thuê xe CHƯƠNG 2: PHÂN TÍCH THIẾT KẾ HỆ THỐNG 2.1 Biểu đồ phân cấp chức Hình 4: Biểu đồ phân cấp chức 2.2 Biểu đồ luồng liệu 2.2.1 Biểu đồ luồng liệu mức ngữ cảnh Hình 5: Biểu đồ luồng liệu mức ngữ cảnh 2.2.2 Biểu đồ luồng liệu mức đỉnh Hình 6: Biểu đồ luồng liệu mức đỉnh 2.2.3 Biểu đồ luồng liệu mức đỉnh chức xử lý liệu Hình 7: Biểu đồ luồng liệu mức đỉnh chức xử lý liệu 2.2.4 Biểu đồ luồng liệu mức đỉnh chức xây dựng mơ hình Hình : Biểu đồ luồng liệu mức đỉnh chức xây dựng mơ hình 10 2.2.5 Biểu đồ luồng liệu mức đỉnh chức dự báo Hình : Biểu đồ luồng liệu mức đỉnh chức dự báo 2.3 Sơ đồ thiết kế hệ thống Hình 10: Sơ đồ thiết kế hệ thống 11 CHƯƠNG 3: THUẬT TỐN, ĐÁNH GIÁ MƠ HÌNH 3.1 Thuật toán giải toán Thuật toán sử dụng : Random Forest (Rừng ngẫu nhiên) - Là thuật toán học kết hợp (Ensemble Learning) - Random Forest tập hợp hàng trăm Decision Tree, Decision Tree tạo nên ngẫu nhiên từ việc tái chọn mẫu (chọn random phần data để xây dựng) random biến từ toàn biến trong data - Mỗi cho dự báo, tổng hợp lại phương pháp lấy trung bình dự đốn Hình 11: Mơ hình Random Forest 12 3.2 Xử lý, phân tích liệu Biểu đồ số lượng xe đạp cho thuê theo tháng: Hình 12: Số lượng xe đạp cho thuê trung bình theo tháng Biểu đồ số lượng xe đạp cho thuê trung bình theo mùa: Xử lý liệu: - Đưa số trường liệu dạng one-hot : season, mnth, hr, weathersit, weekday 13 - Loại bỏ số trường thông tin không cần thiết : dteday, casual, registered, yr số trường liệu ban đầu trước one-hot : season, mnth, hr, weathersit, weekday 3.3 Đánh giá mô hình Các tham số đánh giá mơ hình - MSE ( mean squared error ): Bình phương sai số MSE thấp tốt - Độ xác (accuracy) - Mean Absolute Error (MAE): trung bình giá trị tuyệt đối lỗi: - Đánh giá mức độ quan trọng biến mơ hình CHƯƠNG 4: GIAO DIỆN HỆ THỐNG 4.1 Màn hình dashboard 14 4.2 Màn hình dự báo 15 16 KẾT LUẬN Bài báo cáo em trình bày thực trạng phân tích cụ thể tốn , đưa mơ hình thiết kế hệ thống dựa theo phương pháp có cấu trúc, phục vụ cầu nhà quản lý, hỗ trợ nhà quản lý định số lượng xe đạp cung cấp thị trường tránh lãng phí tài nguyên giảm thiểu việc hỏng hóc, bảo dưỡng xe, giúp quản lý hiệu Trong mơ hình thuật tốn sử dụng thể kết dự báo mơ hình trực quan Tuy chưa thực hoàn thiện, hệ thống có tiềm phát triển lớn để phục vụ yêu cầu cao nhà quản lý Thông qua đây, ta thấy rõ ưu điểm hệ hỗ trợ định trình quản lý : tự động hóa thuật tốn máy học thơng minh, giảm thiểu tối đa q trình thực tay, tăng hiệu quản lý Tuy nhiên, phải ý hệ hỗ trợ định có tác dụng hỗ trợ việc định nhà quản lý, không tự động định thay cho nhà quản lý Vai trò người máy công ty tối quan trọng 17 TÀI LIỆU THAM KHẢO Breiman, Leo "Random forests." Machine learning 45.1 (2001): 5-32 https://www.stat.berkeley.edu/~breiman/randomforest2001.pdf Pedregosa, F and Varoquaux, G and Gramfort, A and Michel, V.and Thirion, B and Grisel, O and Blondel, M and Prettenhofer, P and Weiss, R and Dubourg, V and Vanderplas, J and Passos, A and Cournapeau, D and Brucher, M and Perrot, M and Duchesnay, E “Scikit-learn: Machine Learning in Python”, in Journal of Machine Learning Research 12 (2011): 2825-2830 https://scikitlearn.org/stable/modules/generated/sklearn.ensemble.Ra ndomForestRegressor.html 18 ... Biểu đồ số lượng xe đạp cho thuê theo tháng: Hình 12: Số lượng xe đạp cho thuê trung bình theo tháng Biểu đồ số lượng xe đạp cho thuê trung bình theo mùa: Xử lý liệu: - Đưa số trường liệu dạng one-hot... kế hoạch thí điểm Một số đơn vị lựa chọn phép cung cấp lượng xe đạp giới hạn phố Do đó, với việc dự đoán số lượng nhu cầu thuê xe đạp hỗ trợ nhà quản lý cung cấp lượng xe đạp ngồi hợp lý, khơng... cung cấp thông tin cho nhà quản lý thuận tiện cho việc đưa định Bài báo cáo em xin trình bày đề tài dự đốn số lượng xe đạp cho thuê, hỗ trợ nhà quản lý định số lượng cung cấp xe thị trường để phục