Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 25 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
25
Dung lượng
1,17 MB
Nội dung
TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI KHOA TOÁN ỨNG DỤNG VÀ TIN HỌC ĐỀ TÀI: DỰ ĐOÁN SỐ LƯỢNG NGƯỜI THUÊ XE ĐẠP Giảng viên hướng dẫn : LÊ CHÍ NGỌC Nhóm thực :7 Thành viên nhóm: Hoàng Ngọc Thạch - 20153466 Nguyễn Mậu Đồng - 20150972 HÀ NỘI - 11/2019 MỤC LỤC LỜI MỞ ĐẦU CHƯƠNG KHẢO SÁT ĐÁNH GIÁ 1.1 Khảo sát, đánh giá 1.2 Dữ liệu khảo sát CHƯƠNG PHÂN TÍCH THIẾT KẾ HỆ THỐNG 2.1 Biểu đồ phân cấp chức 2.2 Biểu đồ luồng liệu 2.2.1 Biểu đồ luồng liệu mức ngữ cảnh 2.2.2 Biểu đồ luồng liệu mức đỉnh 10 2.2.3 Biểu đồ luồng liệu mức đỉnh chức Xử lí liệu 11 2.2.4 Biểu đồ luồng liệu mức đỉnh chức Luyện mơ hình 11 2.2.5 Biểu đồ luồng liệu mức đỉnh chức Dự đoán 12 CHƯƠNG MƠ HÌNH GIẢI QUYẾT BÀI TỐN 13 3.1 Mơ hình hồi quy tuyến tính (Linear Regression) 13 3.2 Phân tích liệu 14 3.3 Xử lý liệu 16 3.4 Đánh giá mơ hình 18 CHƯƠNG DEMO CHƯƠNG TRÌNH 19 4.1 Code chương trình 19 4.2 Giao diện 23 KẾT LUẬN 24 TÀI LIỆU THAM KHẢO 25 LỜI MỞ ĐẦU Trong thời kì cơng nghệ 4.0, để phục vụ tốt công tác quy hoạch, quản lý tài nguyên lĩnh vực việc xây dựng công cụ mô hỗ trợ quản lý vô cần thiết Với phát triển cơng nghệ máy tính, việc mơ hình hóa phân tích hệ thống phát triển nhanh chóng, hệ hỗ trợ định đời áp dụng nhiều quy hoạch, quản lý Ở báo cáo em xin trình bày đề tài dự đốn số lượng người thuê xe đạp, hỗ trợ nhà quản lý định số lượng xe đạp cần cung cấp Báo cáo gồm chương chính: • Chương Khảo sát đánh giá • Chương Phân tích thiết kế hệ thống • Chương Mơ hình giải tốn • Chương Demo chương trình Em xin chân thành cảm ơn thầy Lê Chí Ngọc tận tình giúp đỡ để em hồn thành báo cáo CHƯƠNG KHẢO SÁT ĐÁNH GIÁ 1.1 Khảo sát, đánh giá Dịch vụ chia sẻ xe đạp (bike-sharing) ghi nhận mức tăng trưởng khổng lồ Châu Á kể từ năm 2016 triển khai số thành phố Châu Âu từ năm 2017 Giao thông tắc nghẽn, ô nhiễm môi trường điều kiện thuận lợi để dịch vụ chia sẻ xe đạp phát triển Tuy nhiên, sau vài năm bùng nổ, dịch vụ trở thành toán gây đau đầu cho giới chức địa phương nhà quản lý nhiều quốc gia [1] Hình Dịch vụ chia sẻ xe đạp Với mức chi phí phù hợp với nhiều đối tượng người dùng, khách hàng dễ dàng tìm thấy xe đạp vỉa hè hay công viên khiến dịch vụ trở nên phổ biến Việc tìm xe, mở khóa xe tốn cước phí thực thơng qua ứng dụng điện thoại Khi kết thúc, việc để xe bãi gần Thậm chí có hãng cịn khơng cần tới bãi để xe Xe đạp đặt địa điểm khắp thành phố nhờ kết nối qua GPS, khách hàng xác định vị trí thơng qua ứng dụng di động Chính ưu điểm lấy hay trả xe nơi tùy thích giúp startup gây ấn tượng với truyền thông giới, đặc biệt nước phương Tây [1] Hình Một khu vực tập kết xe đạp bỏ dịch vụ chia sẻ xe đạp Trung Quốc [1] Tốc độ phát triển nhanh dịch vụ chia sẻ xe đạp dẫn đến môi trường cạnh tranh khốc liệt thị trường lớn Trung Quốc, Rắc rối đến từ hãng đua mang đến dịch vụ mà đó, xe dễ sử dụng dễ thuê tốt, gây tình trạng hỗn loạn thị người sử dụng xe đạp đậu xe đâu Tình trạng dùng đâu vứt gây tổn thất không nhỏ cho công ty cho thuê xe giao thông công cộng Xe đạp nhiều hãng nằm rải rác vỉa hè, thường lấn chiếm đường dành cho người mục tiêu thường xuyên bị phá hoại thị trường Trung Quốc Bên cạnh đó, chất lượng xe đạp xuống cấp nhanh, hãng tung thị trường nhiều xe đến mức không đủ người để quản lý bảo dưỡng xe Ngồi tình trạng bị phá hoại, cịn xảy tình trạng trộm cắp xe đạp Sự việc diễn thường xuyên khiến nhiều khách hàng phàn nàn việc khơng có xe đạp sẵn họ cần di chuyển Tại Đức, sau thời gian hào hứng với dịch vụ chia sẻ xe đạp, người dân quyền địa phương thấy ngán ngẩm tình trạng xe để bừa bãi vỉa hè, gây mỹ quan đô thị [1] Về giải pháp, Mỹ, thành phố New York ban hành kế hoạch thí điểm Một số đơn vị lựa chọn phép cung cấp lượng xe đạp giới hạn phố Do đó, với việc dự đốn số lượng nhu cầu thuê xe đạp hỗ trợ nhà quản lý cung cấp lượng xe đạp hợp lý, không gây mỹ quan đô thị, giảm tình trạng hư hại, cắp mà đảm bảo nhu cầu lại khách hàng 1.2 Dữ liệu khảo sát Dữ liệu lịch sử thuê xe theo Washington DC thu thập từ trang web Capital Bikeshare https://www.capitalbikeshare.com/system-data Dữ liệu lịch sử thời tiết tương ứng thu thập từ trang web https://freemeteo.vn/ Dữ liệu ngày lễ Mỹ thu thập từ https://dchr.dc.gov/page/holiday-schedules Từ đó, ta liệu thời tiết số lượng người thuê xe đạp theo giờ: Hình Dữ liệu thu thập Bộ liệu bao gồm 12 trường liệu 10886 ghi: • Datetime: liệu ngày tháng • Season: liệu mùa gồm giá trị tương ứng (1: mùa xuân, 2: mùa hạ, 3: mùa thu, 4: mùa đơng) • Holiday: liệu ngày lễ gồm giá trị (1: có phải ngày lễ, 0: khơng phải ngày lễ) • Workingday: liệu ngày làm việc gồm giá trị (1: có phải ngày làm việc, 0: khơng phải ngày làm việc) • Weather: liệu tình hình thời tiết gồm giá trị (1: Quang đãng, mây, 2: Sương mù nhiều mây, 3: Mưa nhẹ tuyết nhẹ, 4: Mưa to tuyết lớn) • Temp: liệu nhiệt độ tính theo độ C • Atemp: liệu nhiệt độ tương đối tính theo độ C • Humidity: liệu độ ẩm • Windspeed: liệu tốc độ gió (Km/H) • Casual: liệu số lượng người thuê xe chưa đăng kí thẻ thành viên • Registered: liệu số lượng người thuê xe đăng kí thẻ thành viên • Count: liệu tổng số lượng người thuê xe CHƯƠNG PHÂN TÍCH THIẾT KẾ HỆ THỐNG 2.1 Biểu đồ phân cấp chức Dự đoán số người thuê xe đạp Xử lý liệu Dự đoán Load liệu Lấy liệu cần dự đốn Chuẩn hóa liệu Dự đốn kết Luyện mơ hình Luyện tham số Lưu liệu Hình Biểu đồ phân cấp chức 2.2 Biểu đồ luồng liệu 2.2.1 Biểu đồ luồng liệu mức ngữ cảnh Hình Biểu đồ luồng liệu mức ngữ cảnh 2.2.2 Biểu đồ luồng liệu mức đỉnh Hình Biểu đồ luồng liệu mức đỉnh 10 2.2.3 Biểu đồ luồng liệu mức đỉnh chức Xử lí liệu Hình Biểu đồ luồng liệu mức đỉnh chức xử lý liệu 2.2.4 Biểu đồ luồng liệu mức đỉnh chức Luyện mơ hình Hình Biểu đồ luồng liệu mức đỉnh chức luyện mơ hình 11 2.2.5 Biểu đồ luồng liệu mức đỉnh chức Dự đốn Hình Biểu đồ luồng liệu mức đỉnh chức dự đốn 12 CHƯƠNG MƠ HÌNH GIẢI QUYẾT BÀI TỐN 3.1 Mơ hình hồi quy tuyến tính (Linear Regression) Thuật tốn sử dụng để giải toán thuật toán máy học, hồi quy tuyến tính Đây thuật tốn Supervised learning hay cịn gọi học có giám sát Mơ hình thuật tốn hồi quy tuyến tính có dạng: Hình 10 Ví dụ Linear Regression [3] Trong đó, 𝑥 ∈ 𝑅 𝑘−1 vector biến đầu vào, 𝜃 ∈ 𝑅𝑘 vector trọng số tương ứng Thường 𝜃 gọi tham số mơ hình Giá trị tham số ước lượng cách sử dụng cặp giá trị (x, y) tập huấn luyện 𝜃0 gọi độ lệch (bias) nhằm giảm mức độ chênh lệch mơ hình thực tế Mục tiêu thuật toán cực tiểu giá trị hàm mát giá trị thực tế (y) giá trị dự đoán (𝑦̅) 13 3.2 Phân tích liệu Đối với thuật tốn máy học nói chung, từ dự liệu đủ lớn, máy học đặc trưng liệu Kiểu liệu trường liệu: Trường liệu Kiểu liệu datetime datetime season int holiday int workingday int weather int temp float atemp float humidity int windspeed float casual int registered int count int Hình 11 Kiểu liệu 14 Visualizing số lượng người thuê xe theo số trường: Hình 12 Số lượng người thuê theo tháng Hình 13 Số lượng người thuê trung bình theo mùa 15 Hình 14 Số lượng người thuê trung bình theo ngày tuần 3.3 Xử lý liệu Hình 15 Dữ liệu ban đầu 16 Chuyển trường liệu season weather dạng One-hot Hình 16 Dữ liệu sau chuyển đổi Sau chuyển, ta có thêm trường liệu loại bỏ trường liệu season weather cũ Tách trường liệu dạng datetime thành trường giờ, ngày tuần, tháng Hình 17 Dữ liệu sau tách Xóa trường liệu “casual” “registered”, ta cần dự đoán tổng số lượng người th xe đạp 17 3.4 Đánh giá mơ hình • Mean Absolute Error (MAE): trung bình giá trị tuyệt đối lỗi: • Mean Squared Error (MSE): trung bình bình phương lỗi: Để đánh giá mơ hình, ta xét tỷ lệ MAE (max(y) – min(y)), tức là: 𝑀𝐴𝐸 max (𝑦) − (y) Tỷ lệ coi tốt (chấp nhận được) nhỏ 10% 18 CHƯƠNG DEMO CHƯƠNG TRÌNH 4.1 Code chương trình Hình 18 Code lấy liệu từ trang dự báo thời tiết Hình 19 Code lấy liệu từ trang dự báo thời tiết 19 Hình 20 Code lấy liệu từ trang dự báo thời tiết Hình 21 Code chuẩn hóa liệu chạy mơ hình 20 Hình 22 Code chuẩn hóa liệu chạy mơ hình Hình 23 Code giao diện 21 Hình 24 Code giao diện Hình 25 Code giao diện 22 4.2 Giao diện Hình 26 Giao diện chương trình 23 KẾT LUẬN Phần mềm trình xây dựng, cần phải thêm số chức để tương tác tốt với người sử dụng Cần luyện thêm số mơ hình hồi quy khác để có so sánh mơ hình Cập nhật liệu thường xuyên để lựa chọn mô hình phù hợp từ cho kết dự đoán tốt 24 TÀI LIỆU THAM KHẢO Phương Nam, “Xe đạp dùng chung: Cơn sốt hạ nhiệt”, 2018 Vũ Hữu Tiệp, “Machine Learning bản”, 2018 Gareth James, Daniela Witten, Trevor Hastie, Robert Tibshirani, “An Introduction to Statistical Learning with Applications in R”, 2013 25 ... liệu 14 Visualizing số lượng người thuê xe theo số trường: Hình 12 Số lượng người thuê theo tháng Hình 13 Số lượng người thuê trung bình theo mùa 15 Hình 14 Số lượng người thuê trung bình theo... (Km/H) • Casual: liệu số lượng người thuê xe chưa đăng kí thẻ thành viên • Registered: liệu số lượng người thuê xe đăng kí thẻ thành viên • Count: liệu tổng số lượng người thuê xe CHƯƠNG PHÂN TÍCH... kế hoạch thí điểm Một số đơn vị lựa chọn phép cung cấp lượng xe đạp giới hạn phố Do đó, với việc dự đoán số lượng nhu cầu thuê xe đạp hỗ trợ nhà quản lý cung cấp lượng xe đạp ngồi hợp lý, khơng