1. Trang chủ
  2. » Giáo Dục - Đào Tạo

Học phần trí tuệ nhân tạo trong kinh doanh Đề tài Ứng dụng ai xây dựng mô hình dự Đoán giá nhà cho thuê tại hà nội

65 0 0
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Ứng Dụng Ai Xây Dựng Mô Hình Dự Đoán Giá Nhà Cho Thuê Tại Hà Nội
Tác giả Hoàng Lê Na, Lê Đức Minh, Đỗ Ngọc Anh, Nguyễn Thanh Thảo, Nguyễn Thị Ngọc Mai, Vũ Thị Thu Thủy
Người hướng dẫn TS. Bùi Thị Hồng Nhung
Trường học Học viện ngân hàng
Chuyên ngành Công nghệ thông tin & kinh tế số
Thể loại bài thi học kỳ
Năm xuất bản 2024
Thành phố Hà Nội
Định dạng
Số trang 65
Dung lượng 2,52 MB

Cấu trúc

  • PHẦN 1: GIỚI THIỆU CHUNG VỀ BÀI TOÁN (7)
    • 1. Thực trạng giá thuê nhà trọ tại Hà Nội hiện nay (7)
    • 2. Đơn vị sử dụng và lý do chọn đề tài (8)
      • 2.1. Đơn vị sử dụng (8)
      • 2.2. Lý do chọn đề tài (8)
    • 3. Mục tiêu của bài toán (8)
  • PHẦN 2: PHÂN TÍCH, XÁC ĐỊNH THUỘC TÍNH DỮ LIỆU CẦN THU THẬP (10)
    • 1. Thuộc tính dữ liệu cần thu thập (10)
      • 1.1. Thuộc tính mô tả (10)
      • 1.2. Thuộc tính dự đoán (13)
    • 2. Kiểu dữ liệu (13)
    • 3. Cách thu thập dữ liệu (13)
  • PHẦN 3: TỔNG QUAN VỀ THUẬT TOÁN SỬ DỤNG (15)
    • 1. Phương pháp học máy - học có giám sát (15)
      • 1.1. Định nghĩa (15)
      • 1.2. Ưu và nhược điểm của phương pháp (16)
    • 2. Thuật toán Cây quyết định (16)
      • 2.1. Tổng quan (16)
      • 2.2. Ưu và nhược điểm của thuật toán (17)
  • PHẦN 4: MÃ LỆNH CHƯƠNG TRÌNH (19)
    • 1. Đọc và tiền xử lý dữ liệu (19)
      • 1.1. Khai báo các thư viện sử dụng (19)
      • 1.2. Đọc file dữ liệu (19)
      • 1.3. Mô tả tập dữ liệu (19)
    • 2. Các biểu đồ mối quan hệ giữa các thuộc tính (22)
      • 2.1. Một số biểu đồ cơ bản (22)
      • 2.2. Các biểu đồ nâng cao (28)
    • 3. Xây dựng mô hình (36)
    • 4. Sử dụng mô hình (39)
    • 5. Cách thức áp dụng mô hình (39)
      • 5.1. Sử dụng mô hình trong phạm vi nhỏ như lớp học, trường học (39)
      • 5.2. Giới thiệu với họ hàng, người thân, những người có người thân là sinh viên, những người lao động làm việc tại Hà Nội có nhu cầu tìm nhà thuê (40)
  • PHẦN 5: CẢI TIẾN MÔ HÌNH (41)
    • 1. Cải tiến mô hình (41)
      • 1.1. Thay đổi tỷ lệ tập train, test và max_depth khi khai báo cây quyết định (41)
      • 1.2. Mô hình thay đổi số lượng thuộc tính (56)
    • 2. So sánh mô hình thực nghiệm (60)
    • 3. Dự đoán giá nhà thuê tại Hà Nội với Test_size= 0,15, Max_depth = (60)
    • 4. Đánh giá mô hình (61)
    • 5. Ứng dụng mô hình trong thực tiễn (62)
  • KẾT LUẬN (64)
  • TÀI LIỆU THAM KHẢO (65)

Nội dung

Bài luận này sẽ giới thiệu về việc xây dựng mô hình Python dự đoán giá nhà trọ dựa trên các yếu tố quan trọng như vị trí, tiện ích, hệ thống phòng cháy chữa cháy, diện tích và nhiều yếu

GIỚI THIỆU CHUNG VỀ BÀI TOÁN

Thực trạng giá thuê nhà trọ tại Hà Nội hiện nay

Giá thuê nhà tại Hà Nội hiện nay có sự phân hóa rõ rệt theo từng khu vực và loại hình, với mức giá cao và có xu hướng tăng Nhà nguyên căn có giá thuê từ 7 đến 55 triệu đồng/tháng, đặc biệt tại các khu vực trung tâm như Ba Đình và Hoàn Kiếm Căn hộ chung cư dao động từ 4 đến 30 triệu đồng/tháng, tùy thuộc vào diện tích và tiện nghi, trong khi các căn hộ mini hay studio thường có giá cao hơn Phòng trọ có giá từ 1 đến 8 triệu đồng/tháng, với mức giá cao hơn ở các khu vực trung tâm Các khu vực ngoại thành như Hà Đông và Hoàng Mai có giá thuê thấp hơn, từ 1,5 đến 5,8 triệu đồng/tháng Nhà mặt phố và văn phòng tại Hà Nội có giá thuê rất cao.

25 đến 160 triệu đồng/tháng, đặc biệt tại các khu vực kinh doanh sầm uất, với giá thuê mặt bằng văn phòng dao động từ 680.000 đến 1.200.000 đồng/m²/tháng.

Giá thuê nhà tại Hà Nội hiện nay chịu ảnh hưởng lớn từ vị trí và loại hình nhà ở, bên cạnh đó, tình trạng khan hiếm nguồn cung căn hộ, đặc biệt ở các khu vực trung tâm, cũng là một yếu tố quan trọng.

Sự khan hiếm nhà ở đã làm tăng nhu cầu thuê, dẫn đến cạnh tranh giá giữa người thuê và người cho thuê Hệ quả là giá thuê nhà tại các khu vực trung tâm tăng cao, trong khi giá thuê ở các khu vực ngoại thành vẫn duy trì ở mức thấp hơn.

Để giảm bớt tình trạng khan hiếm nhà ở, chính quyền thành phố Hà Nội đang khuyến khích đầu tư vào các dự án bất động sản mới, đặc biệt là các dự án quy mô lớn Những dự án này không chỉ tập trung vào xây dựng căn hộ chung cư mà còn phát triển các khu đô thị mới với tiện ích và cơ sở hạ tầng hiện đại Các chính sách hỗ trợ như cấp phép nhanh chóng, ưu đãi thuế và hỗ trợ tài chính cho nhà đầu tư cũng đóng vai trò quan trọng trong việc tăng cường nguồn cung nhà ở Những biện pháp này giúp giảm giá thuê nhà và tạo điều kiện cho người dân tiếp cận căn hộ chất lượng cao với mức giá hợp lý.

Khi thuê nhà tại Hà Nội, người thuê cần xác định rõ mục đích sử dụng như ở, kinh doanh hay làm văn phòng, cùng với khả năng tài chính của mình Trước khi ký hợp đồng, nên kiểm tra kỹ lưỡng các điều khoản và thỏa thuận giá cả hợp lý để tránh những rủi ro không mong muốn.

Đơn vị sử dụng và lý do chọn đề tài

Sinh viên và người lao động tại Hà Nội đang tìm kiếm nhà trọ có thể tham khảo các tổ chức nghiên cứu về thị trường bất động sản trong khu vực Những thông tin này sẽ giúp họ đưa ra quyết định thuê nhà hợp lý và phù hợp với nhu cầu sống của mình.

2.2 Lý do chọn đề tài

Nhu cầu về nhà ở, đặc biệt là nhà trọ tại Hà Nội, luôn cao do đây là thủ đô và trung tâm kinh tế của Việt Nam, thu hút nhiều người từ các tỉnh thành khác Giá nhà trọ tại Hà Nội thường xuyên biến động theo thời điểm, khu vực và chất lượng phòng, gây khó khăn cho người thuê trong việc cân đối tài chính và lựa chọn chỗ ở phù hợp Đề tài “Dự đoán giá nhà trọ tại Hà Nội” có ý nghĩa thực tiễn cao, giúp người thuê chủ động tìm kiếm chỗ ở phù hợp với khả năng tài chính, tránh bị ép giá Dựa trên số liệu thống kê và phân tích thị trường, việc dự đoán giá nhà trọ có thể đưa ra những dự đoán chính xác về biến động giá trong tương lai, từ đó hỗ trợ việc quản lý chính sách giá nhà trọ hiệu quả hơn và giúp người dân tìm kiếm nhà ở phù hợp cũng như đầu tư vào thị trường này.

Mục tiêu của bài toán

Bài toán: Dự đoán giá nhà trọ tại Hà Nội Các thông tin thu thập để phân tích được bao gồm:

 CocosovatchatPCCC: Có cơ sở vật chất phòng cháy chữa cháy

Mục tiêu: Từ những dữ liệu thu thập được từ những người đi thuê nhà trọ trong thực tế tại Hà

Mô hình dự đoán giá nhà cho thuê ở Hà Nội sử dụng thuật toán cây quyết định (Decision Tree) để cung cấp kết quả chính xác Sau nhiều lần xây dựng và kiểm tra, bài toán đã được thử nghiệm bằng nhiều phương pháp khác nhau nhằm nâng cao độ chính xác Điều này giúp sinh viên và người đi làm có thể dự đoán giá thuê một cách tối ưu nhất tại Hà Nội.

PHÂN TÍCH, XÁC ĐỊNH THUỘC TÍNH DỮ LIỆU CẦN THU THẬP

Thuộc tính dữ liệu cần thu thập

Bài toán này tập trung vào các thuộc tính mô tả như diện tích, vị trí, hình thức, tiện ích, chất lượng, cơ sở vật chất phòng cháy chữa cháy và việc có chung chủ sở hữu.

Diện tích là yếu tố quan trọng ảnh hưởng đến giá thuê phòng trọ ở Hà Nội, bên cạnh vị trí, tiện nghi và chất lượng nhà ở Thông thường, phòng trọ có diện tích lớn hơn sẽ có giá thuê cao hơn, do không gian rộng rãi và thoải mái hơn, phù hợp cho gia đình hoặc nhóm bạn Tuy nhiên, với sự gia tăng dân số và đô thị hóa, diện tích đất ở tại Hà Nội ngày càng bị thu hẹp, dẫn đến tình trạng chật chội không chỉ ở nhà trọ mà còn ở nhà ở của người dân Đối với sinh viên, diện tích phòng trọ thường chỉ từ 2m² đến 5m², do đó họ mong muốn có không gian đủ rộng để sinh hoạt hàng ngày Theo khảo sát, diện tích phòng trọ rộng có thể cho phép nhiều người ở chung, từ đó giảm thiểu chi phí thuê, trở thành tiêu chí quan trọng khi sinh viên chọn thuê nhà trọ.

Theo thuyết vị thế - chất lượng của Hoàng Hữu Phê và Wakely, giá trị nhà ở được hình thành từ hai yếu tố chính: vị thế xã hội và chất lượng nhà ở Trong đó, vị thế xã hội là yếu tố quan trọng nhất ảnh hưởng đến quyết định thuê nhà, chỉ sau giá cả Vị trí chỗ ở được xác định rõ ràng trong khu vực, và sinh viên thường ưu tiên những vị trí thuận tiện như gần trạm xe buýt, trường học, chợ, bệnh viện, trung tâm dạy thêm và cửa hàng tiện lợi Những vị trí này không chỉ giúp sinh viên dễ dàng di chuyển đến trường hay nơi làm thêm mà còn đảm bảo điều kiện sinh hoạt và cuộc sống hàng ngày Theo Kauko (2006, 2007), yếu tố vị trí của căn nhà có tầm quan trọng vượt trội so với chính bản thân căn nhà.

Theo nghiên cứu của Duyên, C., Hằng, B., Kiên, H T., & Ngọc, N T (2023), phần lớn sinh viên (39,8%) chọn ở phòng trọ riêng biệt với bếp và nhà vệ sinh riêng, không cùng nhà với chủ nhà Ký túc xá có tỷ lệ thấp nhất, trong khi nhà đất có phòng trọ riêng biệt và nhà vệ sinh chung chiếm 16,45% Nhà tập thể và chung cư lần lượt chiếm 19,41% và 3,95% Số người sống chung trong các loại hình không quá cao, ngoại trừ ký túc xá với trung bình 9,8 người trên diện tích 26,7m², mặc dù chi phí thấp nhất Dự đoán rằng, nhà ở chung cư có giá thuê cao nhất trong các hình thức khảo sát nếu các yếu tố khác không thay đổi.

Hiện nay, phòng trọ cho thuê được trang bị đầy đủ tiện ích để đáp ứng nhu cầu đa dạng của người thuê Hầu hết các phòng đều có nội thất như giường, tủ quần áo, bàn làm việc và ghế, mang lại sự tiện lợi cho người không muốn đầu tư thêm Ngoài ra, phòng trọ hiện đại còn có máy lạnh và quạt trần, giúp duy trì không gian thoáng mát quanh năm Hệ thống wifi tốc độ cao miễn phí cũng được cung cấp, phục vụ nhu cầu học tập, làm việc và giải trí trực tuyến của người thuê.

Phòng trọ được trang bị nhà vệ sinh riêng với vòi sen, bồn rửa mặt và toilet hiện đại, mang lại không gian sinh hoạt cá nhân tiện lợi và sạch sẽ cho người thuê Nhiều phòng trọ cao cấp còn có khu vực bếp riêng hoặc bếp chung đầy đủ dụng cụ nấu nướng, tủ lạnh và lò vi sóng, đáp ứng nhu cầu nấu nướng Hệ thống an ninh tại các khu nhà trọ được chú trọng với camera giám sát 24/7 và bảo vệ, đảm bảo an toàn cho cư dân.

Các tiện ích phụ như dịch vụ dọn phòng định kỳ, bãi đậu xe rộng rãi cho xe máy và ô tô, cùng không gian sinh hoạt chung như sân vườn, phòng gym, và khu vực BBQ, không chỉ nâng cao chất lượng cuộc sống của người thuê mà còn tạo ra môi trường sống thoải mái, tiện nghi và an toàn.

Chất lượng phòng trọ cho thuê hiện nay đã được cải thiện đáng kể để đáp ứng nhu cầu cao của người thuê Hầu hết các phòng trọ được thiết kế hiện đại, thông thoáng, với ánh sáng tự nhiên và không gian rộng rãi Vật liệu xây dựng cao cấp như sàn gỗ, gạch men, cửa sổ cách âm và cửa ra vào chắc chắn được sử dụng để đảm bảo độ bền và tính thẩm mỹ.

Các phòng trọ hiện đại thường được trang bị nội thất và thiết bị điện tử cao cấp như máy lạnh, quạt trần và đèn LED tiết kiệm năng lượng Nhà vệ sinh trong phòng được thiết kế hiện đại với vòi sen, bồn rửa mặt và bồn cầu chất lượng cao, mang lại sự thoải mái và tiện nghi cho người sử dụng Nhiều phòng trọ còn có hệ thống cách âm tốt, đảm bảo sự yên tĩnh và riêng tư cho người thuê.

Chất lượng dịch vụ tại các khu nhà trọ đã được nâng cao nhờ vào đội ngũ quản lý chuyên nghiệp, luôn hỗ trợ người thuê giải quyết các vấn đề phát sinh Hệ thống an ninh được cải thiện với camera giám sát và bảo vệ 24/7, mang lại cảm giác an toàn tuyệt đối cho cư dân Nhiều khu nhà trọ còn cung cấp dịch vụ bảo trì và sửa chữa kịp thời, đảm bảo các thiết bị và tiện ích trong phòng hoạt động hiệu quả.

Môi trường sống được chú trọng với không gian xanh, vệ sinh sạch sẽ và hệ thống xử lý rác thải hiệu quả, góp phần nâng cao chất lượng cuộc sống và tạo ra môi trường sống lành mạnh, bền vững cho người thuê Chất lượng phòng trọ hiện nay mang đến cho người thuê một không gian sống tiện nghi, an toàn và thoải mái, đáp ứng đầy đủ nhu cầu sinh hoạt hàng ngày.

1.1.6 Cơ sở vật chất phòng cháy chữa cháy

Theo các báo cáo gần đây, chính quyền Hà Nội đã tăng cường kiểm tra và yêu cầu cải thiện tiêu chuẩn phòng cháy chữa cháy cho các tòa nhà chung cư và nhà trọ sau một số vụ hỏa hoạn lớn Điều này có thể làm tăng chi phí cho chủ nhà, từ đó ảnh hưởng đến giá thuê nhà trọ.

Một nghiên cứu tại Hà Nội cho thấy an toàn phòng cháy chữa cháy là yếu tố quan trọng hàng đầu trong quyết định chọn nhà của sinh viên thuê Điều này không chỉ phản ánh sự quan tâm đến an toàn mà còn ảnh hưởng đến giá cả và sự lựa chọn của người thuê.

Thuê trọ chung chủ thường gặp vấn đề về quyền riêng tư, khi mà người thuê có thể bị hạn chế trong không gian riêng tư của mình Điều này dẫn đến việc giá thuê có thể thấp hơn so với việc thuê một căn hộ hoặc nhà riêng không có chủ nhà ở cùng Tóm lại, việc sống chung với chủ nhà có thể làm giảm giá thuê do sự hạn chế về quyền riêng tư.

Dự đoán giá nhà trọ tại Hà Nội (Giá thuê của từng khách khác nhau tại khu vực khác nhau).

Kiểu dữ liệu

Dữ liệu sử dụng trong bài ở các dạng sau:

Kiểu dữ liệu float64 trong Python được sử dụng để biểu diễn các số thực dưới dạng thập phân, cho phép tính toán chính xác các giá trị không phải số nguyên, như diện tích.

Kiểu object là một kiểu dữ liệu định danh, bao gồm một tập hợp các biến và các phương thức hoạt động trên các biến đó, chẳng hạn như hình thức và vị trí.

Cách thu thập dữ liệu

Dữ liệu khảo sát về giá thuê phòng trọ tại Hà Nội được nhóm nghiên cứu tổng hợp từ Google Form và các nguồn uy tín Tổng cộng có 117 dòng dữ liệu, tương ứng với 116 người đi thuê, được lưu dưới tên “Giá thuê phòng trọ tại Hà Nội.csv” Hình ảnh minh họa cho một phần số liệu khảo sát và câu trả lời về vị trí phòng trọ cũng được cung cấp từ nhóm tác giả.

Theo khảo sát, 38,8% và 36,4% người tham gia cho biết họ sinh sống ở khu vực Ngõ nhỏ và Trung tâm thành phố Điều này phù hợp với đối tượng khảo sát chủ yếu là sinh viên và người lao động tại Hà Nội.

TỔNG QUAN VỀ THUẬT TOÁN SỬ DỤNG

Phương pháp học máy - học có giám sát

Học máy, theo Wikipedia, là một lĩnh vực của trí tuệ nhân tạo, nghiên cứu và phát triển các kỹ thuật giúp hệ thống tự động học từ dữ liệu để giải quyết các vấn đề cụ thể Andriy Burkov định nghĩa học máy là một lĩnh vực của khoa học máy tính, tập trung vào việc xây dựng các thuật toán dựa trên tập dữ liệu mẫu của các hiện tượng Các mẫu dữ liệu này có thể đến từ tự nhiên, do con người tạo ra hoặc là kết quả từ các thuật toán khác.

Học máy là quá trình sử dụng các mô hình thống kê để ghi nhớ và tổng quát hóa sự phân bố của dữ liệu, nhằm đưa ra dự đoán cho những trường hợp chưa được biết đến Trong đó, học có giám sát là phương pháp sử dụng dữ liệu đã được gán nhãn để suy luận mối quan hệ giữa đầu vào và đầu ra Dữ liệu huấn luyện, bao gồm các cặp đầu vào-đầu ra, giúp mô hình học hỏi và đưa ra dự đoán cho những đầu vào mới chưa gặp.

The goal is to identify the relationship between input and output Several supervised machine learning algorithms are relevant to this process, including Logistic Regression, K-Nearest Neighbors (KNN), Linear Regression, Neural Networks, and Similarity Learning.

1.2 Ưu và nhược điểm của phương pháp Ưu điểm:

 Có thể xác định xu hướng và khuôn mẫu dữ liệu mà con người có thể bỏ qua.

Sau khi được thiết lập, hệ thống có thể hoạt động tự động mà không cần sự can thiệp của con người Chẳng hạn, trong lĩnh vực phần mềm an ninh, các phương pháp học máy có khả năng giám sát liên tục và phát hiện các điểm bất thường trong lưu lượng mạng mà không cần dữ liệu đầu vào từ quản trị viên.

 Kết quả của máy học có thể chính xác hơn theo thời gian.

 Có thể xử lý nhiều định dạng dữ liệu trong môi trường dữ liệu linh hoạt, khối lượng lớn và phức tạp.

 Quá trình đào tạo ban đầu tốn kém và cần nhiều thời gian Khó có thể triển khai nếu không có đủ dữ liệu.

 Là quy trình nặng về điện toán yêu cầu đầu tư lúc đầu nếu phần cứng được thiết lập ngay trong tổ chức.

 Diễn giải chính xác kết quả và loại bỏ tính không chắc chắn mà không có chuyên gia hỗ trợ có thể là thách thức lớn.

Thuật toán Cây quyết định

Cây quyết định (Decision Tree) là một công cụ phân lớp mạnh mẽ, sử dụng cấu trúc cây phân cấp để phân loại các đối tượng dựa trên các quy tắc Các thuộc tính của đối tượng có thể thuộc nhiều kiểu dữ liệu khác nhau như Nhị phân, Định danh, Thứ tự và Số lượng, nhưng thuộc tính phân lớp phải là Binary hoặc Ordinal Khi có dữ liệu về các đối tượng cùng với lớp của chúng, cây quyết định sẽ tạo ra các quy tắc để dự đoán lớp cho các dữ liệu chưa biết.

Cây quyết định là một công cụ quan trọng trong nghiên cứu hoạt động và phân tích quyết định, giúp xác định các chiến lược khả thi nhất để đạt được mục tiêu Ngoài ra, nó cũng được sử dụng rộng rãi trong lĩnh vực máy học.

Cây quyết định bao gồm ba phần chính: node gốc (root node), các node lá (leaf nodes) và các nhánh (branches) Node gốc là điểm khởi đầu của cây, chứa câu hỏi hoặc tiêu chí cần trả lời Các nhánh biểu thị kết quả của các kiểm tra trên nút, với mỗi câu hỏi ở node đầu tiên yêu cầu phản hồi "yes" hoặc "no", dẫn đến các node con tương ứng cho từng phản hồi Thuật toán cây quyết định nổi bật với tính đơn giản và phổ biến, mang lại nhiều lợi ích trong việc phân tích và ra quyết định.

 Mô hình sinh ra các quy tắc dễ hiểu cho người đọc, tạo ra bộ luật với mỗi nhánh lá là một luật của cây.

 Dữ liệu đầu vào có thể là dữ liệu missing, không cần chuẩn hóa hoặc tạo biến giả.

 Có thể làm việc với cả dữ liệu số và dữ liệu phân loại

 Có thể xác thực mô hình bằng cách sử dụng các kiểm tra thống kê.

 Có khả năng làm việc với dữ liệu lớn.

Mô hình Cây Quyết Định rất nhạy cảm với dữ liệu người dùng, vì một sự thay đổi nhỏ trong bộ dữ liệu có thể dẫn đến sự thay đổi hoàn toàn trong cấu trúc của mô hình.

Việc giải quyết các vấn đề có dữ liệu phụ thuộc thời gian liên tục gặp nhiều khó khăn, đặc biệt là khi có quá nhiều lớp chi phí tính toán trong quá trình xây dựng mô hình cây quyết định Điều này dễ dẫn đến việc xảy ra lỗi trong quá trình phân tích và ra quyết định.

 Chúng thường tương đối không chính xác Nhiều công cụ dự đoán khác hoạt động tốt hơn với dữ liệu tương tự.

MÃ LỆNH CHƯƠNG TRÌNH

Đọc và tiền xử lý dữ liệu

1.1 Khai báo các thư viện sử dụng

1.3 Mô tả tập dữ liệu

Nhận xét: Trong bản ghi có 116 dữ liệu với giá trị trung bình khoảng 30,65; Độ lệch chuẩn là 14,12;

Diện tích bé nhất là 12m 2 ;

Diện tích lớn nhất là 100m 2

Tên thuộc tính Kiểu dữ liệu Giá trị minh hoạ

Vị trí object Khu do thi, Ngo nho,

Hình thức object Nha dat, chung cu,

Tiện ích object Co, khong

Chất lượng object Kha, Tot,

Cơ sở vật chất phòng cháy chữa cháy object Co, Khong

Chung chủ object Co, Khong

Giá nhà object Tren 5 trieu, từ 1 đến 2 trieu,

Các biểu đồ mối quan hệ giữa các thuộc tính

2.1 Một số biểu đồ cơ bản

2.1.1 Biểu đồ thể hiện mối quan hệ giữa giá nhà và diện tích

Nhận xét về giá thuê nhà, diện tích từ 40m2 trở lên có mức giá từ 3 triệu đồng, chủ yếu trên 5 triệu đồng Đối với diện tích từ 20-40m2, giá thuê dao động từ 2-3 triệu đồng, trong khi diện tích dưới 20m2 thường có giá dưới 2 triệu đồng Điều này cho thấy, diện tích lớn hơn sẽ dẫn đến giá thuê cao hơn và ngược lại.

2.1.2 Biểu đồ thể hiện mối quan hệ giữa giá nhà với hình thức

Biểu đồ cho thấy mối quan hệ giữa hình thức nhà ở và diện tích cho thấy nhà thuê tập thể và nhà đất có diện tích lớn nhất, trên 70m2, trong khi chung cư và các loại nhà khác có diện tích hẹp hơn, dưới 60m2 Do đó, nhà đất và nhà tập thể là lựa chọn phù hợp cho những ai cần không gian sống rộng rãi.

2.1.3 Biểu đồ thể hiện mô tả sự phân bổ diện tích nhà

Biểu đồ cho thấy diện tích nhà cho thuê chủ yếu tập trung từ 35m² đến dưới 55m², phù hợp cho 2-3 người Tuy nhiên, có 4 giá trị ngoại lai nằm trong khoảng từ 60m² đến 100m², cho thấy xu hướng của nhóm từ 3-5 người thuê nhà nguyên căn.

2.1.4 Biểu đồ thể hiện mối quan hệ giữa chung chủ và giá nhà

Bước 1: Chuyển dữ liệu từ dạng object về dạng số

Bước 2: Lọc dữ liệu và xây dựng biểu đồ

Biểu đồ 1: Biểu đồ thể hiện mối quan hệ giữa có chung chủ và giá nhà

Khoảng 75% số nhà có chung chủ có giá thuê dao động từ 1 triệu đến 3 triệu, cho thấy xu hướng giá thuê thấp hơn so với các nhà không chung chủ Dữ liệu cho thấy nửa dưới giá thuê thấp hơn nửa trên, cho thấy sự lệch về phía giá cao hơn Điều này chỉ ra rằng những nhà cho thuê có chung chủ thường có mức giá thuê từ 1 triệu đến 3 triệu, do hạn chế quyền riêng tư hơn so với những nhà cho thuê không chung chủ.

Biểu đồ 2: Biểu đồ thể hiện mối quan hệ giữa không chung chủ và giá nhà

Theo nhận xét, 75% số nhà có chung chủ có giá giao động từ 1 đến 3 triệu, trong khi phần lớn những nhà không chung chủ thường có giá thuê cao hơn, từ 3 triệu đến trên 5 triệu Điều này cho thấy rằng nhà cho thuê không chung chủ thường mang lại sự thoải mái và riêng tư hơn, dẫn đến xu hướng giá thuê cao hơn so với những nhà có chung chủ.

2.2 Các biểu đồ nâng cao

2.2.1 Biểu đồ thể hiện mối quan hệ giữa diện tích và chất lượng nhà.

Theo biểu đồ, nhà có chất lượng trung bình thường có diện tích nhỏ hơn 25m², trong khi nhà chất lượng khá có diện tích từ 15m² đến 50m² Ngược lại, nhà chất lượng tốt có diện tích lớn nhất, lên đến 100m² Điều này cho thấy rằng chất lượng nhà càng cao thì diện tích phòng càng lớn.

2.2.2 Biểu đồ thể hiện mối quan hệ giữa hình thức (nhà đất, chung cư), chất lượng và giá nhà

Bước 1: Đổi dữ liệu từ định dạng về dạng số

Bước 2: Tách dữ liệu thành 2 bảng theo 2 hình thức

Bước 3: Xây dựng biểu đồ

Nhận xét: Từ đồ thị ta thấy:

Nhà đất chất lượng tốt thường có diện tích lớn, lên đến 100m², trong khi nhà đất chất lượng khá có diện tích nhỏ hơn, dưới 38m² Đối với nhà đất có chất lượng trung bình, diện tích thường nhỏ nhất, khoảng dưới 25m².

Chung cư: Tương tự như nhà đất, chung cư có chất lượng tốt thường có diện tích lớn (lên đến

Chung cư có diện tích 60m² thường đạt chất lượng khá, trong khi đó, những căn hộ có diện tích dưới 50m² thường có chất lượng khá hơn Đối với các chung cư chất lượng trung bình, diện tích thường nhỏ hơn, khoảng dưới 25m².

Nhà đất và chung cư có mối liên hệ chặt chẽ giữa chất lượng và diện tích; cụ thể, chất lượng càng tốt thì diện tích càng lớn, trong khi chất lượng thấp thường đi kèm với diện tích nhỏ hơn.

2.2.3 Biểu đồ minh hoạ mối quan hệ giữa tiện ích, vị trí và giá nhà

Bước 1: Tách dữ liệu ban đầu thành các bảng con theo các tiêu chí

Bước 2: Xây dựng biểu đồ

Chú thích giá nhà Chú thích vị trí

0: 1 đến 2 triệu 0: Khu đô thị

Các vị trí nhà có giá trên 5 triệu thường được trang bị nhiều tiện ích như nhà để xe, bể bơi và phòng gym chất lượng cao Ngược lại, những khu vực ngoại ô với giá dưới 1 triệu và trung tâm thành phố có giá không quá 2 triệu thường thiếu các tiện ích do hạ tầng cơ sở còn nhiều hạn chế.

2.2.4 Biểu đồ minh hoạ sự phân bố giá nhà của phòng trọ có phòng trọ có vị trí trung tâm thành phố

Bước 1: Tách dữ liệu những phòng trọ ở trung tâm thành phố

Bước 2: Xây dựng biểu đồ

Giá nhà trọ tại trung tâm thành phố đang ở mức cao, với 50% số nhà trọ khảo sát có giá từ 3 triệu đến 5 triệu đồng Đặc biệt, 28,3% nhà trọ có giá trên 5 triệu, cho thấy vị trí trung tâm thành phố có mức thuê cao hơn so với các khu vực khác nhờ gần các trường đại học, đường lớn và giao thông thuận tiện Trong khi đó, chỉ có 6,5% nhà trọ có giá từ 1 triệu đến 2 triệu và 15,2% có giá từ 2 triệu đến 3 triệu.

2.2.5 Biểu đồ thể hiện tỷ lệ phần trăm hình thức phòng trọ có giá thuê từ 2 đến 3 triệu

Bước 1: Thống kê các phòng trọ có giá từ 2 - 3 triệu

Bước 2: Xây dựng biểu đồ

Nhận xét: Với mức giá 2-3 triệu, tỷ lệ nhà thuê dưới hình thức nhà đất là lớn nhất với 55,9%, thứ

2 là nhà tập thể với 29,4% Chung cư là hình thức nhà trọ đứng thứ 3 trong mức giá này và 2,9% còn lại là thuộc các hình thức nhà trọ khác.

Xây dựng mô hình

Bước 1: Đổi dữ liệu từ dạng chữ (object) sang dạng số:

Bước 2: Xây dựng thuộc tính mô tả X và thuộc tính dự đoán y

Bước 3: Chia bộ dữ liệu thành 2 tập train và test với 80% train, 20% test

Bước 4: Khai báo mô hình cây và thực thi mô hình

Bước 5: Xác định ma trận nhầm lẫn

Trong bài toán này, ma trận nhầm lẫn được xác định là:

Lớp thực tế Lớp dự đoán bởi mô hình

1 triệu - 2 triệu 2 triệu - 3 triệu 3 triệu - 5 triệu Trên 5 triệu

Bước 6: Độ chính xác của mô hình Độ chính xác của mô hình khá cao với 58,34%

Sử dụng mô hình

Diện tích nhà là 30m², nằm trong ngõ nhỏ, thuộc hình thức nhà đất Nhà có chất lượng khá, nhưng không có tiện ích và không được trang bị cơ sở vật chất phòng cháy chữa cháy Ngoài ra, nhà cũng không có chung chủ.

→ Dự đoán: Giá nhà thuê từ 2 triệu - 3 triệu

Diện tích căn nhà là 60m², tọa lạc tại vị trí trung tâm, thuộc hình thức nhà tập thể Căn nhà có chất lượng trung bình và không trang bị cơ sở vật chất phòng cháy chữa cháy Ngoài ra, căn nhà cũng có chung chủ.

→ Dự đoán: Giá nhà thuê từ 3 triệu - 5 triệu

Cách thức áp dụng mô hình

5.1 Sử dụng mô hình trong phạm vi nhỏ như lớp học, trường học

Việc tìm nhà cho thuê tại Hà Nội là nhu cầu thiết yếu, đặc biệt đối với sinh viên, người lao động trẻ và các gia đình mới chuyển đến Nhiều người gặp khó khăn trong việc tìm kiếm căn nhà phù hợp với nhu cầu và khả năng tài chính Tại Học viện Ngân hàng, sinh viên lớp K24CLC-TCA cũng đang đối mặt với vấn đề này Do đó, mô hình AI dự đoán giá nhà cho thuê có thể hỗ trợ sinh viên tìm kiếm căn nhà ưng ý Mô hình này nên được quảng bá trên các trang mạng xã hội của lớp và trường để tiếp cận gần hơn với sinh viên.

5.2 Giới thiệu với họ hàng, người thân, những người có người thân là sinh viên, những người lao động làm việc tại Hà Nội có nhu cầu tìm nhà thuê

Giới thiệu trực tiếp mô hình đến với người quen là cách dễ nhất để quảng cáo và áp dụng mô hình, đặc biệt là một mô hình mới.

CẢI TIẾN MÔ HÌNH

Cải tiến mô hình

1.1 Thay đổi tỷ lệ tập train, test và max_depth khi khai báo cây quyết định

Thống kê các lần chạy thử

Lần chạy thử Độ chính xác

Khi thay đổi các tham số Test_size và Max_depth, độ chính xác của mô hình cũng sẽ biến động từ 33,33% đến 72,22% Cụ thể, với Test_size = 0,2 và Max_depth = 4, mô hình đạt độ chính xác thấp nhất là 33,33%, trong khi với Test_size = 0,2 và Max_depth = 4, mô hình có độ chính xác cao nhất là 72,22%.

Lần 1: Test_size = 0,2; Max_depth = 3

Lần 2: Test_size = 0,2; Max_depth = 4

Lần 3: Test_size = 0,2; Max_depth = 6

Lần 4: Test_size= 0,15; Max_depth = 3

Lần 5: Test_size = 0,15; Max_depth = 4

Lần 6: Test_size = 0,15; Max_depth = 5

Lần 7: Test_size = 0,25; Max_depth = 3

Lần 8: Test_size = 0,25; Max_depth = 4

Lần 9: Test_size = 0,25; Max_depth = 5

Lần 10: Test_size = 0,3; Max_depth = 3

Lần 11: Test_size = 0,3; Max_depth = 4

Lần 12: Test_size = 0,3; Max_depth = 5

Lần 13: Test_size = 0,35; Max_depth = 3

Lần 14: Test_size = 0,35; Max_depth = 4

1.2 Mô hình thay đổi số lượng thuộc tính

1.2.1 Đánh giá mức độ quan trọng của mỗi thuộc tính

Các thuộc tính Hình thức, Có tiện ích, Chất lượng, Có cơ sở vật chất PCCC, Có chung chủ là 5 thuộc tính quan trọng nhất

1.2.2 Xây dựng mô hình với 5 thuộc tính mô tả

Lần chạy thử Độ chính xác

So sánh mô hình thực nghiệm

Trong 2 kịch bản thay đổi là thay đổi test_size, max_depth và bớt các thuộc tính mô tả là

Khi so sánh kịch bản thay đổi test_size và Max_depth với kịch bản thay đổi thuộc tính mô tả, "Dientich" và "Vitri" cho thấy độ chính xác cao hơn Cụ thể, với test_size = 0,15 và Max_depth = 3, mô hình đạt độ chính xác 72,22%, chứng minh khả năng ứng dụng trong việc dự đoán giá nhà thuê tại Hà Nội dựa trên các thuộc tính mô tả khác.

Dự đoán giá nhà thuê tại Hà Nội với Test_size= 0,15, Max_depth =

Diện tích căn hộ là 19m², nằm trong khu đô thị với hình thức chung cư Căn hộ có tiện ích đầy đủ và chất lượng nhà ở mức trung bình Tuy nhiên, không có cơ sở vật chất phòng cháy chữa cháy và không chung chủ.

Diện tích căn hộ là 30m², nằm ở vị trí ngoại ô, thuộc hình thức nhà tập thể Căn hộ không có tiện ích đi kèm, chất lượng nhà ở mức khá Cơ sở vật chất phòng cháy chữa cháy được trang bị đầy đủ, và căn hộ không có chung chủ.

Đánh giá mô hình

Mô hình dự đoán giá nhà cho thuê tại Hà Nội được thiết kế đơn giản và dễ sử dụng, với khả năng xử lý thông tin nhanh chóng và cho kết quả chính xác, phù hợp cho sinh viên và người đi làm có nhu cầu thuê nhà Tuy nhiên, mô hình còn hạn chế về lượng dữ liệu (chỉ 116 mẫu) và sự đa dạng, chủ yếu đến từ sinh viên, dẫn đến việc chưa thể phân tích đầy đủ ảnh hưởng của từng thuộc tính đến giá thuê Ngoài ra, mô hình thiếu một số yếu tố mô tả như số người ở và dịch vụ xung quanh, do đó cần được nghiên cứu và bổ sung thêm thuộc tính để nâng cao độ chính xác trước khi áp dụng thực tế.

Ứng dụng mô hình trong thực tiễn

Việc xây dựng mô hình dự đoán giá nhà cho thuê tại Hà Nội mang lại nhiều lợi ích thiết thực Mô hình này giúp chủ nhà xác định giá cho thuê hợp lý, tối ưu hóa lợi nhuận và giá trị thực của căn nhà Đồng thời, các nhà đầu tư bất động sản có thể đưa ra quyết định đầu tư thông minh hơn bằng cách đánh giá tiềm năng lợi nhuận của các căn nhà trên thị trường, từ đó lựa chọn khu vực có tiềm năng phát triển cao Ngoài ra, mô hình còn hỗ trợ các nhà quản lý tòa nhà trong việc quản lý tài sản hiệu quả hơn.

Mô hình dự đoán giá nhà cho thuê giúp các nhà quản lý đưa ra quyết định cho thuê hợp lý và tối ưu hóa tài sản Nó hỗ trợ cá nhân tìm kiếm nhà cho thuê phù hợp với nhu cầu và điều kiện tài chính Việc xây dựng mô hình này tại Hà Nội mang lại lợi ích cho các bên liên quan, góp phần phát triển thị trường bất động sản địa phương Chuyên viên tư vấn bất động sản có thể cung cấp thông tin chính xác về giá thuê, từ đó đưa ra khuyến nghị phù hợp cho khách hàng Đồng thời, mô hình cũng hỗ trợ các nhà nghiên cứu phân tích thị trường bất động sản hiệu quả hơn, giúp dự đoán tình hình thị trường và xây dựng chính sách phát triển khoa học Các nhà quản lý vốn đầu tư có thể đánh giá rủi ro và đưa ra quyết định đầu tư hợp lý nhờ vào mô hình này.

Việc phát triển một mô hình dự đoán giá nhà cho thuê tại Hà Nội sẽ mang lại lợi ích thiết thực cho các bên liên quan, đồng thời góp phần vào sự phát triển bền vững của thị trường bất động sản địa phương.

Ngày đăng: 10/12/2024, 15:47

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
[2] TAPIT (2017), “Machine learning decision tree (cây quyết định)”, https://tapit.vn/machine- learning-decision-treecay-quyet-dinh/#google_vignette Sách, tạp chí
Tiêu đề: Machine learning decision tree (cây quyết định)
Tác giả: TAPIT
Năm: 2017
[3] “Học máy có giám sát và Học máy không giám sát”, Thegioimaychu.vn, https://thegioimaychu.vn/blog/ai-hpc/hoc-may-co-giam-sat-va-hoc-may-khong-giam-sat-p470/ Sách, tạp chí
Tiêu đề: Học máy có giám sát và Học máy không giám sát
[1] Slide môn học Trí tuệ nhân tạo trong kinh doanh, Khoa Hệ thống thông tin quản lý Học viện Ngân hàng Khác
[4] Kauko, T. (2007). An analysis of housing location attributes in the inner city of Budapest, Hungary, using expert judgements. International Journal of Strategic Property Management, 11(4), 209-225 Khác
[5] Nguyễn, Q. H., & Nguyễn, T. L. (2020). Nghiên cứu hành vi thuê nhà trọ của sinh viên Trường Đại học công nghiệp Hà Nội Khác
[6] Duyên, C., Hằng, B., Kiên, H. T., & Ngọc, N. T. Các yếu tố ảnh hưởng lựa chọn cư trú của sinh viên: Nghiên cứu trường hợp tại Trường Đại học Công Nghiệp TP.HCM Khác

TÀI LIỆU CÙNG NGƯỜI DÙNG

  • Đang cập nhật ...

TÀI LIỆU LIÊN QUAN

w