1. Trang chủ
  2. » Luận Văn - Báo Cáo

Ứng dụng một số mô hình học máy dự đoán giá bất động sản tại hà nội

77 2 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

HỌC VIỆN NGÂN HÀNG KHOA HỆ THỐNG THÔNG TIN QUẢN LÝ -🙞🙜🕮🙞🙜 - KHÓA LUẬN TỐT NGHIỆP ỨNG DỤNG MỘT SỐ MƠ HÌNH HỌC MÁY DỰ ĐỐN GIÁ BẤT ĐỘNG SẢN TẠI HÀ NỘI Giáo viên hướng dẫn : TS.Đinh Trọng Hiếu Sinh viên thực : Trịnh Thị Thu Hòa Mã sinh viên : 21A4040034 Lớp : K21HTTTB Khóa : 21 Hệ : Đại học quy Hà Nội-2022 Tai ngay!!! Ban co the xoa dong chu nay!!! 17014129629551000000 HỌC VIỆN NGÂN HÀNG KHOA HỆ THỐNG THƠNG TIN QUẢN LÝ -🙞🙜🕮🙞🙜 - KHĨA LUẬN TỐT NGHIỆP ỨNG DỤNG MỘT SỐ MƠ HÌNH HỌC MÁY DỰ ĐOÁN GIÁ BẤT ĐỘNG SẢN TẠI HÀ NỘI Giáo viên hướng dẫn : TS.Đinh Trọng Hiếu Sinh viên thực : Trịnh Thị Thu Hòa Mã sinh viên : 21A4040034 Lớp : K21HTTTB Khóa : 21 Hệ : Đại học quy Hà Nội-2022 Khóa luận tốt nghiệp Ứng dụng số mơ hình học máy dự đốn giá bất động sản Hà Nội LỜI CAM ĐOAN Em xin cam đoan kết đạt khóa luận sản phẩm nghiên cứu, tìm hiểu riêng em Ngoài nội dung báo cáo trình bày từ cá nhân cịn tham khảo từ số tài liệu có liên quan đến đề tài Tất tài liệu có xuất xứ rõ ràng trích dẫn cách hợp pháp Em xin chịu toàn trách nhiệm hình thức kỷ luật theo nội quy, quy định nhà trường Hà nội, ngày 30 tháng 05 năm 2022 Sinh viên thực Trịnh Thị Thu Hoà Trịnh Thị Thu Hịa i Khóa luận tốt nghiệp Ứng dụng số mơ hình học máy dự đốn giá bất động sản Hà Nội LỜI CẢM ƠN Để hồn thành tốt khóa luận này, trước hết em xin gửi lời cảm ơn tới TS Đinh Trọng Hiếu, giảng viên khoa Hệ thống thông tin quản lý định hướng giúp đỡ em trình thực đề tài Đồng thời em gửi lời cảm ơn sâu sắc đến thầy cô Học viện Ngân hàng, đặc biệt thầy cô khoa Hệ thống thông tin quản lý Thầy cô truyền đạt kiến thức tạo điều kiện cho sinh viên hồn thành tốt chương trình học Bên cạnh đó, em tỏ lịng biết ơn chân thành đến công ty TNHH Phần Mềm BloomGoo tạo điều kiện cho em tiếp xúc học hỏi môi trường công việc thực tế Và em xin cảm ơn tất anh chị đồng nghiệp cơng ty hỗ trợ em nhiệt tình trình thực tập Em cố gắng nỗ lực để hồn thành tốt khóa luận Do thời gian lực cịn hạn chế nên khóa luận khơng thể tránh khỏi thiếu sót Em mong nhận đánh giá góp ý từ thầy Em xin chân thành cảm ơn! Trịnh Thị Thu Hòa ii Khóa luận tốt nghiệp Ứng dụng số mơ hình học máy dự đốn giá bất động sản Hà Nội MỤC LỤC LỜI CAM ĐOAN i LỜI CẢM ƠN ii MỤC LỤC iii DANH MỤC CÁC CHỮ VIẾT TẮT v DANH MỤC HÌNH ẢNH vi DANH MỤC BẢNG BIỂU vii LỜI MỞ ĐẦU CHƯƠNG 1: TỔNG QUAN VỀ CÁC PHƯƠNG PHÁP ĐỊNH GIÁ BẤT ĐỘNG SẢN 1.1 Khái quát thị trường bất động sản 1.1.1 Khái niệm bất động sản 1.1.2 Định nghĩa thị trường bất động sản 1.1.3 Lịch sử giai đoạn phát triển thị trường bất động sản 1.2 Các yếu tố ảnh hưởng đến giá bất động sản 1.3 Thẩm định giá bất động sản 1.3.1 Phương pháp thẩm định bất động sản truyền thống 1.3.2 Thẩm định bất động sản sử dụng học máy 14 1.4 Phạm vi phương pháp nghiên cứu 15 CHƯƠNG 2: CƠ SỞ LÝ THUYẾT CỦA MỘT SỐ PHƯƠNG PHÁP HỌC MÁY DỰ ĐOÁN GIÁ BẤT ĐỘNG SẢN 16 2.1 Sơ lược mơ hình hồi quy 16 2.1.1 Khái niệm 16 2.1.2 Ứng dụng mô hình hồi quy 16 2.2 Tổng quan thuật tốn hồi quy tuyến tính đơn giản 17 Trịnh Thị Thu Hòa iii Khóa luận tốt nghiệp Ứng dụng số mơ hình học máy dự đốn giá bất động sản Hà Nội 2.2.1 Khái quát 17 2.2.2 Mơ hình hồi quy tuyến tính đơn giản 17 2.3 Tổng quan thuật toán hồi quy tuyến tính bội 19 2.3.1 Khái quát 19 2.3.2 Mơ hình hồi quy 19 2.3.3 Vấn đề đa cộng tuyến mơ hình hồi quy tuyến tính bội 20 2.4 Tổng quan thuật toán hồi quy Ridge 22 2.4.1 Khái quát 22 2.4.2 Mơ hình hồi quy 22 2.5 Tổng quan thuật toán hồi quy vectơ hỗ trợ 24 2.5.1 Khái quát 24 2.5.2 Mơ hình hồi quy 24 CHƯƠNG 3: THỰC NGHIỆM VÀ ĐÁNH GIÁ MƠ HÌNH HỌC MÁY DỰ ĐOÁN GIÁ BẤT ĐỘNG SẢN NHÀ Ở TẠI HÀ NỘI 27 3.1 Môi trường công cụ tiến hành 27 3.2 Xây dựng mơ hình dự đốn giá bất động sản nhà 27 3.2.1 Thu thập liệu từ trang web đăng tin bất động sản 28 3.2.2 Tiền xử lý liệu 36 3.2.3 Huấn luyện mơ hình học máy dự đoán giá 44 3.3 Kết đánh giá mơ hình hồi quy dự đoán giá bất động sản nhà 52 KẾT LUẬN 56 PHỤ LỤC 59 Trịnh Thị Thu Hòa iv Khóa luận tốt nghiệp Ứng dụng số mơ hình học máy dự đốn giá bất động sản Hà Nội DANH MỤC CÁC CHỮ VIẾT TẮT STT Chữ viết tắt BĐS Bất động sản VN Việt Nam WTO OLS VIF RR SVM SVR API 10 MAE 11 MSE 12 RMSE 13 KNN Trịnh Thị Thu Hịa GIải thích World Trade Organization (Tổ chức thương mại giới) Ordinary Least Square (Bình phương nhỏ nhất) Variance Inflation Factors (Hệ số phóng đại phương sai) Ridge Regression (Hồi quy Ridge) Support Vector Machine (Máy vectơ hỗ trợ) Support Vector Regression (Hồi quy vectơ hỗ trợ) Application Programming Interface (Giao diện lập trình ứng dụng) Mean Absolute Error (Sai số trung bình tuyệt đối) Mean Squared Error (Sai số toàn phương trung bình) Root mean squared error (Lỗi trung bình bình phương) K-Nearest Neighbors v Khóa luận tốt nghiệp Ứng dụng số mơ hình học máy dự đốn giá bất động sản Hà Nội DANH MỤC HÌNH ẢNH Hình 1: Đa cộng tuyến biến độc lập 21 Hình 2: Tổn thất lề thiết đặt cho SVR 26 Hình 3: Quy trình xây dựng mơ hình dự đốn giá BĐS nhà 28 Hình 4: Ví dụ hai đăng tin hiển thị trường thông tin không giống 30 Hình 5: Thơng tin mơ tả chi tiết đăng tin rao bán bất động sản nhà 31 Hình 6: Nhập địa website Octoparse 32 Hình 7: Trích chọn liệu thơng tin mơ tả tin đăng bất động sản 32 Hình 8: Luồng thu thập liệu bất động sản nhà 33 Hình 9: Minh hoạ liệu BĐS nhà thu thập từ website đăng tin 35 Hình 10: Đổi địa thành long lat 36 Hình 11: Dữ liệu cột sau loại bỏ đơn vị tính 37 Hình 12: Dữ liệu cột sau thay ký hiệu đặc biệt 37 Hình 13: Kết sau chuyển đổi giá trị biến phân loại 38 Hình 14: Kết sau thay dấu số thập phân 39 Hình 15: Tỷ lệ phần trăm giá trị khuyết thiếu cột 40 Hình 16: Dataframe chứa cột sau thay giá trị khuyết thiếu 41 Hình 17: Kiểm tra số lượng giá trị khuyết thiếu sau xử lý KNNImputer 42 Hình 18: Đổi kiểu liệu trường 42 Hình 19: Kiểm tra giá trị ngoại lai biến định lượng 43 Hình 20: Biến định lượng sau loại bỏ giá trị ngoại lai 44 Trịnh Thị Thu Hịa vi Khóa luận tốt nghiệp Ứng dụng số mơ hình học máy dự đoán giá bất động sản Hà Nội DANH MỤC BẢNG BIỂU Bảng 1: Các trường thông tin thu thập từ website đăng tin BĐS 34 Bảng 2: Giá trị dạng số ứng với giá trị phân loại cột 38 Bảng 3: Chỉ số VIF biến độc lập tập liệu nhà ở, nhà mặt tiền 45 Bảng 4: Chỉ số VIF sau loại bỏ đa cộng tuyến 46 Bảng 5: Tham số hàm GridSearchCV 49 Bảng 6: Tham số mơ hình SVR tập liệu 50 Bảng 7: Chỉ số đánh giá mơ hình tập liệu 53 Bảng 8: Thời gian thực thi mơ hình liệu 53 Trịnh Thị Thu Hòa vii Khóa luận tốt nghiệp Ứng dụng số mơ hình học máy dự đốn giá bất động sản Hà Nội LỜI MỞ ĐẦU Thẩm định giá bất động sản có vai trị quan trọng việc giúp quan Nhà nước, doanh nghiệp, cá nhân đưa định liên quan đến việc mua bán, đầu tư, phát triển, quản lý, sở hữu, cho thuê, đánh thuế, bảo hiểm, cầm cố kinh doanh bất động sản (BĐS) Thẩm định giá trị bất động sản giúp thúc đẩy hoạt động kinh tế, qua tháo gỡ mâu thuẫn giá bên tham gia giao dịch thị trường, giảm thiểu rủi ro cho nhà đầu tư Các đối tượng tham gia giao dịch đặc biệt cá nhân, thường có xu hướng tìm kiếm thơng tin Internet nguồn liệu nhiều có BĐS giống hệt để so sánh gây thời gian, khơng tìm kết mong muốn Để thẩm định giá bất động sản thường thơng qua thẩm định viên, họ người có chuyên môn lĩnh vực thẩm định Hiện Việt Nam, chủ yếu định giá BĐS dựa phương pháp định giá truyền thống Việc đánh giá trở nên thiên vị chủ quan trình đánh giá chủ yếu dựa kỹ thuật chun mơn góc nhìn từ phía người thẩm định Do đó, xây dựng thuật tốn khả thi mơ hình tự động định giá bất động sản cách khách quan có ý nghĩa quan trọng bên tham gia giao dịch thị trường bất động sản Với lý tác giả lựa chọn đề tài cho khóa luận : “Ứng dụng số mơ hình học máy dự đốn giá bất động sản Hà Nội” Do thời gian nguồn lực có hạn, khóa luận thực dự đốn giá bất động sản nhà phạm vi thành phố Hà Nội Lợi bất động sản nhà tính sẵn có số lượng số liệu nhiều so với loại hình bất động sản khác Khóa luận thực xây dựng mơ hình dự đoán giá BĐS nhà dựa yếu tố ảnh hưởng đến giá nhà thu thập từ trang web đăng tin BĐS Trong mơ hình học máy, mơ hình hồi quy phù hợp với tốn việc đánh giá ảnh hưởng biến độc lập (yếu tố ảnh hưởng đến giá BĐS) đến biến phụ thuộc (giá BĐS) Vì vậy, khóa luận lựa chọn số mơ hình hồi quy điển hình để thực tốn gồm có mơ hình sau: hồi quy tuyến tính bội (Multiple Linear Regression), hồi quy Ridge (Ridge Regression), hồi quy vectơ hỗ trợ (Support Vector Regression) Các mơ hình Trịnh Thị Thu Hòa

Ngày đăng: 05/12/2023, 19:19

Xem thêm:

TÀI LIỆU CÙNG NGƯỜI DÙNG

  • Đang cập nhật ...

TÀI LIỆU LIÊN QUAN

w