Giá trị loss này càng thấp chứng tỏ mơ hình càng đúng ý chun gia. Qua tính tốn, đánh giá với 55 mẫu dữ liệu BĐS mà chuyên gia đã đánh giá, ta có bảng giá trị loss như sau:
Dữ liệu gốc Dữ liệu qua K-SOM Dữ liệu qua simple model 7,821,343 5,956,106 39,090,718
Bảng 7.10: Giá trị loss của các tập dữ liệu trước và sau khi dùng mơ hình so với dữ liệu từchuyên gia chuyên gia
Dựa vào loss trong bảng ta có thể thấy mơ hình sử dụng K-SOM có loss thấp nhất, cụ thể: Giá trị loss của mơ hình K-SOM chỉ bằng khoảng 76% giá trị loss của dữ liệu gốc trước khi cập nhật và bằng 15% giá trị loss của mơ hình đơn giản. Do đó, ta có thể kết luận: Mơ hình K-SOM trong luận văn này giúp cập nhật giá BĐS đúng với ý chuyên gia hơn giá trước đó, và hiệu quả hơn cách sử dụng mơ hình cập nhật giá đơn giản qua khoảng cách vật lý rất nhiều.
8
TỔNG KẾT
Trong chương này, tơi xin trình bày các cơng việc đã thực hiện, các khó khăn gặp phải, các kết quả thu được trong quá trình thực hiện đề cương luận văn và hướng phát triển trong tương lai cho luận văn
Mục lục
8.1 Các cơng việc đã hồn thành . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
8.2 Các kết quả thu được . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
8.3 Các khó khăn gặp phải . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
8.1 Các cơng việc đã hồn thành
• Sử dụng nhiều kỹ thuật để lọc nhiễu từ tập dữ liệu về bất động sản được cho. • Đề xuất công thức về khoảng cách (đô tương quan) giữa các căn nhà.
• Dựa vào các cơng thức này, tiến hành huấn luyện giải thuật di truyền nhằm học được các tham số phù hợp cho công thức dựa trên tập gán nhãn của chun gia.
• Từ cơng thức khoảng cách đã qua GA, sử dụng mơ hình K-SOM để có được một bản đồ về độ tương quan giữa các căn bất động sản.
• Đề xuất cơng thức cập nhật giá nhà dựa trên các kết quả có được từ mơ hình K-SOM. • Phát triển cơng thức giá nhà dựa theo các yêu cầu của chuyên gia.
• Hồn thành giao diện cho chuyên gia đánh giá mức độ tương quan các BĐS, giao diện về mức độ tương quan giữa các BĐS, giao diện cho chuyên gia cập nhật giá.
8.2 Các kết quả thu được
• Với tri thức của chuyên gia về mức độ tương quan giữa các BĐS, dựa vào giải thuật GA và mơ hình K-SOM giúp cho người dùng có thể dễ dàng xác định mức độ tương quan giữa các BĐS bất kỳ trên tập dữ liệu.
• Thay vì người dùng cập nhật giá thủ công cho từng căn nhà hoặc cho một bán kính nhất định, nhờ vào độ tương quan được xác định bởi giải thuật GA và mơ hình KSOM, người dùng chỉ cần cập nhật một BĐS gốc, các BĐS khác đều sẽ được cập nhật lại giá dựa theo mức độ tương quan giữa các BĐS với nhau.
• Hệ thống có tính thích ứng tốt mang lại độ chính xác cao nhờ có thể phát triển cơng thức về độ tương quan cũng như giá các BĐS để mang lại kết quả tốt hơn.
8.3 Các khó khăn gặp phải
• Tập dữ liệu về BĐS cịn chưa thiếu chính xác nên cần nhiều thời gian để lọc đi các BĐS chưa đúng.
• Vì tập dữ liệu có sự sai sót, dẫn đến khi sử dụng giải thuật GA hay mơ hình K-SOM cịn có nhiều điểm chưa hợp lý.
• Các cơng thức khoảng cách chúng tôi đã đề xuất là thử chạy rất nhiều. Tuy nhiên, có thể có các cơng thức khác mạnh hơn, cho kết quả tối ưu hơn.
8.4 Hướng phát triển trong tương lai
• Cơng thức cập nhật giá cần được trao đổi kỹ hơn với các chuyên gia để thống nhất được tính nhất quán khi cập nhật giá tự động cho các BĐS.
[1] Đ. M. Hải,Mạng nơ-ron nhân tạo - neural networks. [Online]. Available: https : / / dominhhai.github.io/vi/2018/04/nn-intro/.
[2] DeepAI,What is a feed forward neural network?[Online]. Available:https://deepai. org/machine-learning-glossary-and-terms/feed-forward-neural-network. [3] Wikipedia, Artificial neural network. [Online]. Available:https : / / en . wikipedia .
org/wiki/Artificial_neural_network.
[4] ——,Competitive learning. [Online]. Available:https://en.wikipedia.org/wiki/ Competitive_learning.
[5] ——,Dbscan. [Online]. Available:https://en.wikipedia.org/wiki/DBSCAN. [6] ——,Python. [Online]. Available:https://vi.wikipedia.org/wiki/Python_(ng%
C3%B4n_ng%E1%BB%AF_l%E1%BA%ADp_tr%C3%ACnh).
[7] ——,Javascript. [Online]. Available:https://vi.wikipedia.org/wiki/JavaScript. [8] ——,Flask. [Online]. Available:https://en.wikipedia.org/wiki/Flask_(web_
framework).
[9] P. Visualization,Folium. [Online]. Available:http://python-visualization.github. io/folium/.
[10] PosgreSQL,Posgresql. [Online]. Available:https://www.postgresql.org. [11] Docker,Docker. [Online]. Available:https://www.docker.com.
[12] MongoDB,Mongodb. [Online]. Available:https://www.mongodb.com. [13] Pandas,Pandas. [Online]. Available:https://pandas.pydata.org/. [14] Selenium,Selenium. [Online]. Available:https://www.selenium.dev. [15] Redis,Redis. [Online]. Available:https://redis.io.
[16] Wikipedia, Self-organizingmap. [Online]. Available: https : / / en . wikipedia . org / wiki/Self-organizing_map.
[17] T. Kohonen, “The self-organizing map,”Proceedings of the IEEE, vol. 78, no. 9, pp. 1464–
[18] L. Smith,What is a genetic algorithm?[Online]. Available:https://www.generativedesign. org /02 - deeper - dive / 02 - 04 _ genetic - algorithms / 02 - 04 - 01 _ what - is- a -
genetic-algorithm.
[19] A. Singh, A. Sharma, and G. Dubey, “Big data analytics predicting real estate prices,”
International Journal of System Assurance Engineering and Management, vol. 11, no. 2,
pp. 208–219, Jul. 2020, ISSN: 0976-4348. DOI: 10 . 1007 / s13198 - 020 - 00946 - 3. [Online]. Available:https://doi.org/10.1007/s13198-020-00946-3.
[20] V. Del Giudice, P. De Paola, and F. Forte, “Using genetic algorithms for real estate ap- praisals,”Buildings, vol. 7, no. 2, 2017,ISSN: 2075-5309.DOI:10.3390/buildings7020031. [Online]. Available:https://www.mdpi.com/2075-5309/7/2/31.
[21] B. Park and J. K. Bae, “Using machine learning algorithms for housing price prediction: The case of fairfax county, virginia housing data,” Expert Systems with Applications,
vol. 42, no. 6, pp. 2928–2934, 2015, ISSN: 0957-4174. DOI:https://doi.org/10. 1016/j.eswa.2014.11.040. [Online]. Available:https://www.sciencedirect. com/science/article/pii/S0957417414007325.
[22] V. Kontrimas and A. Verikas, “The mass appraisal of the real estate by computational intelligence,” Applied Soft Computing, vol. 11, no. 1, pp. 443–448, 2011, ISSN: 1568-
4946. DOI:https://doi.org/10.1016/j.asoc.2009.12.003. [Online]. Available: https://www.sciencedirect.com/science/article/pii/S1568494609002579.