Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 55 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
55
Dung lượng
3,65 MB
Nội dung
ĐẠI HỌC QUỐC GIA THÀNH PHỐ HỒ CHÍ MINH TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN KHOA CÔNG NGHỆ PHẦN MỀM ĐỒ ÁN Tìm hiểu Machine Learning ứng dụng vào việc dự đoán giá nhà đất TP Hồ Chí Minh Giảng viên hướng dẫn: Nguyễn Thị Thanh Trúc Sinh viên thực hiện: 19521896 - Mai Anh Nghĩa TP Hồ Chí Minh, ngày 13 tháng 12 năm 2022 LỜI CẢM ƠN Trong trình học tập, nghiên cứu phát triển đề tài “Tìm hiểu Machine Learning ứng dụng vào việc dự đoán giá nhà đất TP Hồ Chí Minh” em đã nhận được giúp đỡ, chỉ bảo nhiệt tình của Nguyễn Thị Thanh Trúc để hoàn thành đồ án Em xin chân thành gửi lời cảm ơn đến cô Nguyễn Thị Thanh Trúc – Giảng viên Khoa Công nghệ phần mềm, Trường Đại học Công nghệ thông tin, Đại học Q́c gia Thành phớ Hồ Chí Minh – giảng viên dạy hướng dẫn môn Đồ án 2, đã tận tình hướng dẫn giúp đỡ kiến thức, phương pháp cho chúng em śt q trình thực hoàn thành đồ án Mặc dù đã có nhiều cớ gắng śt q trình thực đề tài, song tránh khỏi những hạn chế, thiếu sót Chúng em mong rằng sẽ nhận được những đóng góp nhận xét chân thành từ cô để ngày hoàn thiện hơn nữa Em xin chân thành cảm ơn Thành phớ Hồ Chí Minh, ngày 13 tháng 12 năm 2022 LỜI NHẬN XÉT CỦA GIẢNG VIÊN …………………………………………………………………………………………… ……………………………………………………………………………………………… ……………………………………………………………………………………………… ………………………………………………………………… ………………………… ……………………………………………………………………………………………… ……………………………………… …………………………………………………… ……………………………………………………………………………………………… …………… ……………………………………………………………………………… ………………………………………………………………………………… ………… ……………………………………………………………………………………………… ……………………………………………………… …………………………………… ……………………………………………………………………………………………… …………………………… ……………………………………………………………… ……………………………………………………………………………………………… … ………………………………………………………………………………………… ……………………………………………………………………… …………………… ……………………………………………………………………………………………… …………………………………………… ……………………………………………… ……………………………………………………………………………………………… ………………… ………………………………………………………………………… ……………………………………………………………………………………… …… ……………………………………………………………………………………………… …………………………………………………………… ……………………………… ……………………………………………………………………………………………… ……………………………………………………………………………………………… Table of Contents CHƯƠNG TỔNG QUAN 1.1 GIỚI THIỆU CHUNG 1.2 CÁC NGHIÊN CỨU LIÊN QUAN ĐẾN ĐỀ TÀI 1.3 CÁC PHƯƠNG PHÁP VÀ MỤC TIÊU THỰC NGHIỆM 1.3.1 Các phương pháp 1.3.2 Mục tiêu CHƯƠNG CƠ SỞ LÝ THUYẾT VÀ CÔNG NGHỆ 2.1 ĐÔI NÉT VỀ MACHINE LEARNING 2.1.1 Khái niệm 2.1.2 Workflow Machine Learning 10 2.1.3 Các phương pháp Machine Learning 11 2.1.3.1 Supervised Learning – Học có giám sát 11 2.1.3.2 Unsupervised Learning – Học không giám sát 13 2.1.3.3 Semi-Supervised Learning – Học bán giám sát 14 2.1.3.4 Reinforcement Learning – Học tăng cường 15 2.1.4 Các thuật toán Machine Learning sẽ được sử dụng 16 2.1.4.1 Random Forest (Rừng ngẫu nhiên) 16 2.1.4.2 Linear Regression (Hồi quy tuyến tính) 19 2.1.4.3 Decision Tree (Cây quyết định) 21 2.1.4.4 Support Vector Regression (SVM) 22 2.2 CÁC CÔNG CỤ ĐƯỢC SỬ DỤNG TRONG BÀI TOÁN “DỰ ĐOÁN GIÁ NHÀ ĐẤT Ở TP HỒ CHÍ MINH” 24 2.2.1 Python 24 2.2.1.1 Ngôn ngữ Python 24 2.2.1.2 Thư viện Matplotlib 24 2.2.1.3 Thư viện Pandas 25 2.2.1.4 Thư viện NumPy 26 2.2.1.5 Thư viện Scikit-learn 27 2.2.1.6 Thư viện Seaborn 29 2.2.2 Selenium 29 2.2.3 Beautiful Soup 30 2.2.4 Google Colab 31 2.2.5 MySQL Workbench 31 2.2.6 Flask 31 CHƯƠNG 32 PHÂN TÍCH VÀ THIẾT KẾ 32 3.1 QUY TRÌNH ÁP DỤNG XÂY DỰNG BÀI TOÁN “DỰ ĐOÁN GIÁ NHÀ ĐẤT Ở TP HỒ CHÍ MINH” 32 3.1.1 Sơ đồ hoạt động của mơ hình 32 3.1.2 Giai đoạn Initial Plan 34 3.1.2.1 Các yếu tố ảnh hưởng đến giá nhà đất TP Hồ Chí Minh 34 3.1.2.2 Split Data thu thập được chia theo tỷ lệ ? 35 3.2 XÂY DỰNG DỰ ÁN “DỰ ĐOÁN GIÁ NHÀ ĐẤT Ở TP HỒ CHÍ MINH” 35 3.2.1 Giai đoạn Get Data 36 3.2.2 Giai đoạn Clean Data 38 3.2.2.1 Tổng quan dữ liệu 38 3.2.2.2 Làm sạch dữ liệu 40 3.2.2.3 Visualazation dữ liệu 42 3.2.3 Giai đoạn Train Model 45 3.2.4 Giai đoạn Test Data 46 3.2.5 Giai đoạn Improve 47 3.2.6 Giai đoạn Deploy 48 CHƯƠNG 53 KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 53 4.1 KẾT LUẬN 53 4.1.1 Kết đạt được 53 4.1.2 Đánh giá hệ thống 53 4.2 HƯỚNG PHÁT TRIỂN VÀ MỞ RỘNG 54 TÀI LIỆU THAM KHẢO 55 CHƯƠNG TỔNG QUAN 1.1 Giới thiệu chung Machine Learning những thuật ngữ mà chúng ta thường hay nghe đến lĩnh vực công nghệ thơng tin cụ thể hơn trí tuệ nhân tạo Thực chất đây lĩnh vực của trí tuệ nhân tạo, lĩnh vực quan trọng khoa học máy tính, được ứng dụng rộng rãi khắp lĩnh vực đời sống cách mạng công nghiệp 4.0 Hiện nay, Machine Learning tỏ hiệu quả, hơn hẳn người cụ thể lĩnh vực mà chúng được áp dụng Trong số đó không kể đến nhận dạng ảnh, chẩn đoán y khoa, dự báo thời tiết, … Bên cạnh Machine Learning, Deep Learning đã cho phép ứng dụng nhiếu vấn đề thực tế của máy học bằng cách mở rộng lĩnh vực tổng thể của AI Deep learning phá vỡ cách thức người làm việc bằng cách làm cho tất loại máy móc trợ giúp có thể thực được, gần hoặc giống hệt người Ngồi ra, phát triển xây dựng mơ hình dự đốn giá nhà Thành phớ Hồ Chí Minh chủ đề hot những năm gần đây, thời đại mà giá của BĐS ngày tăng vọt nên em nghĩ rằng nếu có thể ứng dụng Machine Learning vào việc dự đoán giá nhà sẽ có tính thực tiễn cao, mà nó có thể giúp cho mọi người có nhìn tổng quan có thể dễ dàng so sánh giá nhà đất giữa những vùng liên quan Vì vậy, nhận thấy được Machine Learning lĩnh vực ngày phổ biến, có tính ứng dụng cao rộng rãi với nhiều mặt sống Nhóm em đã quyết định chọn đề tài tìm hiểu Machine Learning ứng dụng vào việc dự đoán giá nhà đất TP Hồ Chí Minh 1.2 Các nghiên cứu liên quan đến đề tài Với nội dung của đề tài đồ án chúng em đã nghiên cứu, tập trung vào chủ đề tìm hiểu Machine Learning khía cạnh của bất động sản TP Hồ Chí Minh Ta sẽ sâu vào việc tìm hiểu thành phần của đối tượng bất động sản ví dụ như: chiều dài, chiều rộng, sớ tầng, sớ phịng ngủ, sớ nhà tắm, quận nào, Tiếp theo, ta sẽ tìm hiểu cách tiếp cận của Machine Learning áp dụng thế nào, từ đó có thể chọn phương pháp phù hợp cho việc dự đốn giá nhà đất, cụ thể đó tìm hiểu phương pháp hồi quy tuyến tính Tiếp theo, hướng nghiên cứu quan trọng đến đề tài nhân tố ảnh hưởng đến giá nhà đất Khi lấy dữ liệu giá nhà đất của đối tượng, có nhiều trường thuộc tính chỉ có sớ lại có ảnh hưởng đến giá nhà đất, tồn trường Khi tìm hiểu, em sẽ phân tích từng khía cạnh, thuộc tính để có thể chọn yếu tố ảnh hưởng đến giá nhà, từ đó có thể xây dựng mơ hình với độ xác cao Tiếp theo, tìm hiểu tất thuật toán mà Machine Learning sử dụng, thử từng phương pháp mà từ đó có thể cho đời mơ hình với độ xác cao nhất, bước bước quan trọng cần phải nắm rõ kĩ thuật để chọn loại tốt cho bước train model improve 1.3 Các phương pháp mục tiêu thực nghiệm 1.3.1 Các phương pháp Để hoàn thành đồ án báo cáo này, nhóm em đã tham khảo tài liệu hướng dẫn được tìm thấy internet trang hướng dẫn Đầu tiên, nhóm em tìm hiểu Machine Learning quy trình có dự án Machine Learning đó là: Get Data, Clean Data, Train Model, Test Model, Improve Sau đó, nhóm em sẽ tiến hành tìm hiểu nhân tố bất động sản ảnh hưởng đến giá nhà đất Rồi thực theo quy trình Machine Learning: lấy dữ liệu crawl được từ trang web alonhadat, thực làm sạch train model Google Colab tiến hành test với dữ liệu được chia theo tỉ lệ 9:1 Có nghĩa là, dữ liệu đã được làm sạch, em sẽ tiến hành chia dữ liệu random phần theo tỉ lệ 9:1 Phần nhiều sẽ được sử dụng để train model phần lại sẽ được dùng để test Bước cuối cùng, em sẽ improve model theo phương pháp khác nhau, đến model đưa kết với độ xác cao 1.3.2 Mục tiêu Mục tiêu của nhóm trước tìm hiểu lĩnh vực Machine Learning Từ đó áp dụng kiến thức thuật tốn, thư viện, cơng cụ, ngơn ngữ lập trình… để có thể giải qút toán dự đoán giá nhà đất Tiếp theo, mục tiêu tìm hiểu phương pháp để trực quan hố hệ thống, giúp người dùng dễ dàng sử dụng thông qua thao tác đơn giản nhập thông sớ dự đốn Qua đó, có thể phần điều chỉnh thông số phù hợp, có những bước xử lý dữ liệu đúng đắn để cải thiện đặc tính tớc độ độ xác của mơ hình nhóm đã chọn Trong tương lai, chúng em có mong muốn sẽ xây dựng hệ thống giúp người dùng có thể dự đốn giá nhà đất khơng chỉ khu vực TP Hồ Chí Minh mà cịn khu vực khác Hơn nữa, hi vọng hệ thống có thể cung cấp thông tin giá nhà đất theo thời gian thực data được lấy từ trang web train liên tục CHƯƠNG CƠ SỞ LÝ THUYẾT VÀ CƠNG NGHỆ 2.1 Đơi nét machine learning 2.1.1 Khái niệm Machine learning (ML) hay máy học nhánh của trí tuệ nhân tạo (AI), nó lĩnh vực nghiên cứu cho phép máy tính có khả cải thiện thân chúng dựa dữ liệu mẫu (training data) hoặc dựa vào kinh nghiệm (những đã được học) Machine learning có thể tự dự đoán hoặc đưa quyết định mà khơng cần được lập trình cụ thể Q trình học bắt đầu bằng quan sát hoặc dữ liệu Ví dụ, để tìm kiếm mẫu dữ liệu đưa quyết định tốt hơn tương lai dựa ví dụ mà chúng được cung cấp Mục đích cho phép máy tính tự động học mà không cần can thiệp hay trợ giúp của người điều chỉnh hành động tương ứng Deep Learning tập hợp của Machine Learning, có khả khác biệt sớ khía cạnh quan trọng so với Machine Learning nơng truyền thớng, cho phép máy tính giải qút loạt vấn đề phức tạp giải quyết được 2.1.2 Workflow Machine Learning Nhìn chung, Machine Learning có bước quan trọng sau: Data collection – thu thập dữ liệu: để máy tính có thể học được bạn cần có dữ liệu (dataset), bạn có thể tự thu thập chúng hoặc lấy dữ liệu đã được công bố trước đó Lưu ý bạn phải thu thập từ nguồn thớng, có vậy dữ liệu xác máy có thể học cách đúng đắng đạt hiệu cao hơn Preprocessing – tiền xử lý: bước dùng để chuẩn hóa dữ liệu, loại bỏ thuộc tính khơng cần thiết, gán nhãn dữ liệu, mã hóa sớ đặc trưng, trích xuất đặc trưng, rút gọn dữ liệu đảm bảo kết quả… Bước tốn thời gian tỉ lệ thuận với số lượng dữ liệu bạn có Bước thường chiếm hơn 70% tổng thời gian thực Training model – huấn luyện mơ hình: bước bước bạn huấn luyện cho mơ hình cho nó học dữ liệu bạn đã thu thập xử lý hai bước đầu Evaluating model – đánh giá mơ hình: sau đã huấn luyện mơ hình xong, chúng ta cần dùng độ đo để đánh giá mơ hình, tùy vào từng độ đo khác mà mơ hình 10 o “num_floors”, “num_bed_room”: đổi thành kiểu int o “squared_meter_area”: loại bỏ kí tự đơn vị mét vuông, đổi thành kiểu float o “length_meter”, “width_meter”: loại bỏ đơn vị mét, xóa bỏ những dòng chứa giá trị sai format (vd: 09.,5m), chuyển thành kiểu float o “price”: xóa bỏ những dòng chứa giá trị sai format, chuyển lại kiểu float chuyển đơn vị tính thành kiểu triệu đồng KẾT QUẢ VỀ BỘ DỮ LIỆU SAU KHI ĐƯỢC LÀM SẠCH Hình 18 Bộ liệu sau làm Bảng dữ liệu sau clean đã đúng định dạng có thể sử dụng Hình 19 Thơng tin liệu làm Giảm từ 20 000 dòng 13 951 dòng dữ liệu sạch 41 3.2.2.3 Visualazation liệu Sự phân bố cột liệu số liên tục: Hình 20 Biểu đồ phân bố thuộc tính số liên tục Nhận xét: Các biểu đồ cột cho thấy trường dữ liệu phân bố đơn giản, có tính tập trung phần đầu bảng (nhỏ nhất) Phân bố cột liệu phân loại: 42 Hình 21 Biểu đồ phân bố trường thuộc tính district 43 Hình 22 Biểu đồ phân bớ của trường thuộc tính type_of_housing 44 Hình 23 Biểu đồ phân bố trường thuộc tính legal_paper Nhận xét: District: phân bố đều, với phần đông hộ “Gị Vấp”, “huyện Củ Chi” Type_of_housing: hộ dữ liệu chủ yếu “Nhà mặt tiền”, “Nhà hẻm” Các loại hộ lại thấp, nên có thể ảnh hưởng đến kết mơ hình Legal_paper: hầu hết nhà có sổ hồng, bên cạnh đó tồn tại nhiều hộ chưa có giấy, người dùng sẽ đắn đo lựa chọn những nhà thế 3.2.3 Giai đoạn Train Model Nhóm tiến hành huấn luyện nhiều mơ hình tập dữ liệu training, sau đó tiến hành đánh giá độ giác mơ hình tập test Ći cùng chọn được mơ hình hiệu cho tập dữ liệu dựa accuracy Mơ hình tớt được chọn sẽ được thực GridSearch tập parameter mẫu để góp phần nâng cao độ xác ● Cách tiến hành: o Bước 1: Sử dụng khoảng quartile Q1-Q3 loại bỏ outlier, đưa dữ liệu dạng chuẩn giá trị nhiễu o Bước 2: Số hóa cột dữ liệu category thông qua Label Encoder, sử dụng Standard Scaler chuẩn hóa cột dữ liệu số liên tục o Bước 3: Phân chia dữ liệu train, test (8:2) o Bước 4: Tiến hành huấn luyện loại mơ hình: Random Forest, Linear Regression, Support Vector Regressor, Decision Tree o Bước 5: Đánh giá độ xác của mơ hình thơng qua R2_Score tập test, lựa chọn mơ hình có độ xác cao 45 o Bước 6: Thực gridsearch cho mô hình tớt với tập parameter mẫu mà nhóm tìm được, huấn luyện lại mơ hình với best_parameter tiến hành xem xét kết o Bước 7: Save mơ hình tớt có được thơng qua pickle để tái sử dụng dễ dàng gọi để kết hợp xây dựng web Hình 24 Sử dụng thuật tốn để xây dựng model 3.2.4 Giai đoạn Test Data Ở đây, nhóm em thực train model phương pháp đó là: Random Forest, Linear Regression, Support Vector Regression Decision Tree Sau đã train xong, ta sẽ tiến hành test mơ hình với dữ liệu test 46 Hình 25 Đánh giá loại thuật tốn BẢNG SO SÁNH SCORE GIỮA CÁC DEFAULT MODEL MƠ HÌNH LR RF DT SVR SCORE 0.7109 0.8944 0.8132 0.7882 ➔ Nhận xét: ● RF mơ hình tớt với tham số mặc định, ta chọn nó để tiến hành thực tuning nhiều tham số ● LR có accuracy thấp mơ hình đơn giả ● Mặc dù mơ hình có accuracy tương đối cao, để đưa vào sử dụng thực tế cần cải thiện thêm 3.2.5 Giai đoạn Improve Thực tuning GridSearch Parameter được sử dụng cho gridsearch: 47 {'n_estimators': [100,200,300,400,500], 'max_features': [ 'sqrt', 'log2'], 'max_depth': [10,20,30,40,50,60,70,80], 'min_samples_split': [1,2,3,4,5], 'min_samples_leaf': [1,2,3,4,5],} Best score: 0.8997 Best parameter: {'max_depth': 40, 'max_features': 'log2', 'min_samples_leaf': 1, 'min_samples_split': 2, 'n_estimators': 400} Nhận xét: Mặc dù accuracy cải thiện (89.4 lên 89.99) đã góp phần vào ý tưởng cải thiện mơ hình, Random Forest mơ hình phức tạp tớn nhiều thời gian huấn luyện, gây nhiều khó khăn việc thực tunning tham số tối ưu 3.2.6 Giai đoạn Deploy Nhóm sử dụng Web Framework Flask để xây dựng trang web, lý nhóm chọn Framework Flask nhẹ, dễ tiếp cận cho người bắt đầu tạo website nhỏ dễ mở rộng website phức tạp hơn 48 Bước đầu tiên để xây dựng trang web nhóm đã build template giao diện cho trang web của mình, giao diện web cho phép người dùng input vào những dữ liệu cần thiết cho model dự đoán bao gồm: quận, loại nhà, loại giấy tờ, diện tích, sớ tầng, sớ phịng, chiều dài, chiều rộng Ći cùng load model đã tạo từ pickle đánh giá mơ hình từ dữ liệu người dùng nhập xuất số tiền (đơn vị triệu đồng) Trang web được thiết kế với giao diện cơ bản, màu sắc diệu mắt, vị trí đặt tùy chọn kích cỡ tới ưu, có thể đem vào sử dụng thực tế Hình 26 Giao diện website dự đốn Thực so sánh giá dự đốn mơ hình dữ liệu thực tế: 49 Hình 27 Bộ liệu thực tế để test Với ví dụ đầu tiên em sẽ chọn BĐS từ dữ liệu thật để tiến hành dự đoán: chọn nhà hẻm quận có sổ đỏ/sổ hồng với thông số đó sớ tầng 2, phịng ngủ 2, diện tích 43m2, chiều dài 8m chiều rộng 5.2m 50 Hình 28 Kiểm tra lại với hệ thống dự đoán Sử dụng hệ thớng để dự đốn, giá nhà sẽ rơi vào 3.105.975 tỷ đồng Vậy sai số nhỏ so sánh với giá gốc của BĐS 3.1 tỷ đồng theo dữ liệu Tiếp tục thử nghiệm với giá trị khác 51 Với ví dụ thứ hai, sai sớ khơng q lớn với giá nhà đất quận 12 được dự đốn 6.745.75 tỷ đồng, so với giá gớc 6.7 tỷ đồng 52 CHƯƠNG KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 4.1 Kết luận 4.1.1 Kết đạt Sau thực đồ án với đề tài “Tìm hiểu Machine Learning minh hoạ với toán dự đoán giá nhà đất TP Hồ Chí Minh” em đã có thêm nhiều kiến thức lĩnh vực Machine Learning, biết thêm phương pháp sử dụng dự án Machine Learning Ngoài ra, em cịn biết được thuật tốn ML, loại thuật tốn tới ưu chỉ mang lại kết cao cho từng dạng đề khác Thứ hai, em có thêm kiến thức chu trình làm việc dự án Machine Learning Cụ thể em biết thêm cách crawl dữ liệu từ trang web, biết cách làm sạch dữ liệu hiệu quả, biết cách xây dựng mơ hình tới ưu Ngồi ra, em cịn có nhìn trực quan vấn đề bất động sản, cụ thể khu vực TP Hồ Chí Minh, mà giá BĐS phụ thuộc vào nhiều ́u tớ Ngồi ra, em đã xây dựng được hệ thớng dự đốn giá nhà TP Hồ Chí Minh, để demo cho q trình học máy Đó hệ thớng hồn chỉnh, mà có thể dự đoán giá trị nhà đất với độ xác cao (trên 90%) hệ thớng mang tính thực tiễn, ứng dụng cao sớng của chúng ta 4.1.2 Đánh giá hệ thống Ưu điểm Hệ thống có giao diện đơn giản, bố cục rõ ràng, trực quan, dễ tiếp cận, dễ sử dụng Hệ thớng dự đốn có tớc độ nhanh Thơng tin giá nhà trực quan, dễ nhìn dễ đọc giúp người sử dụng có thể tiếp cận 53 Bộ dữ liệu trực quan được crawl từ trang web thớng giúp tăng độ xác, thực tiễn ứng dụng cao Có thể hoạt động offline không cần kết nối Internet Có đầy đủ chức cơ của hệ thống dự đốn, với đầy đủ trường thuộc tính với dữ liệu khu vực TP Hồ Chí Minh Hỗ trợ UI thân thiện cho người dùng phản hồi cách nhanh chóng Nhược điểm Hệ thống cịn q trình cải thiện, để mang đến độ xác cao hơn cho người dùng Hệ thớng chỉ có những chức cơ bản, chưa được nâng cấp, mở rộng Bộ dữ liệu được crawl từ trước, nên khơng có tính cập nhật real-time Dữ liệu sớ trường cịn hạn chế nên hoạt động khơng thực tớt thực dự đốn vùng 4.2 Hướng phát triển mở rộng Xây dựng mơ hình với dữ liệu cập nhật real-time, giúp cho hệ thống mang đến những dự đốn với độ xác cao tại thời điểm được dự đốn Mở rộng thêm sớ chức gợi ý BĐS Có chức so sánh giá BĐS của khu vực khu vực kia, của BĐS cùng tầm giá khác quận 54 TÀI LIỆU THAM KHẢO [1] “Machine Learning: Dự đoán giá nhà đất” [Online] Available: https://viblo.asia/p/machine-learning-that-thu-vi-1-du-doan-gia-nha-datgAm5y91w5db [2] “Dự đoán giá nhà đất sử dụng ML” [Online] Available: https://123docz.net/document/9166195-do-an-tim-hieu-ve-machine-learning-va-ungdung-vao-tham-dinh-gia-ca.htm [3] “Mơ hình hồi quy tún tính tốn dự đoán giá bất động sản” [Online] Available: https://dothanhlong.org/mo-hinh-hoi-quy-ung-dung-trong-bai-toan-du-doan-gia-batdong-san-machine-learning-phan-2/ [4] “Tổng hợp yếu tố ảnh hưởng đến giá nhà” [Online] Available: https://smartland.vn/cac-yeu-to-anh-huong-den-gia-nha-o-chung-cu/ [5] “Top 10 thuật toán Machine Learning cho người học” [Online] Available: https://www.tma.vn/Hoi-dap/Cam-nang-nghe-nghiep/Top-10-Thuat-toan-MachineLearning-danh-cho-nguoi-moi-hoc/41477 [6] “Mua bán nhà đất, bất động sản tại Hồ Chí Minh” [Online] Available: https://alonhadat.com.vn/nha-dat/can-ban/nha-dat/2/ho-chi-minh.html [7] “Phân tích giá nhà đất chia sẻ dữ liệu” [Online] Available: https://miai.vn/2020/08/10/nghich-phan-tich-gia-nha-dat-va-chia-se-du-lieu-440000tin-ban-nha-2020/ 55 ... tố ảnh hưởng đến giá nhà đất TP Hồ Chí Minh 34 3.1.2.2 Split Data thu thập được chia theo tỷ lệ ? 35 3.2 XÂY DỰNG DỰ ÁN “DỰ ĐOÁN GIÁ NHÀ ĐẤT Ở TP HỒ CHÍ MINH? ?? ... tài tìm hiểu Machine Learning ứng dụng vào việc dự đoán giá nhà đất TP Hồ Chí Minh 1.2 Các nghiên cứu liên quan đến đề tài Với nội dung của đề tài đồ án chúng em đã nghiên cứu, tập trung vào. .. CẢM ƠN Trong trình học tập, nghiên cứu phát triển đề tài ? ?Tìm hiểu Machine Learning ứng dụng vào việc dự đoán giá nhà đất TP Hồ Chí Minh? ?? em đã nhận được giúp đỡ, chỉ bảo nhiệt tình của