Giải thích về biểu đồ:
• Mũi tên 1: Dữ liệu ở "DB 1" có được từ API "Crawl data API" và q trình này được đóng gói bằng Docker.
• DB 1: Chứa thơng tin các BĐS được lưu trữ trên PostgreSQL Docker.
• Mũi tên 2: Dữ liệu từ "DB 1" này tôi dùng để tiền xử lý trước khi huấn luyện bằng mơ hình K-SOM.
• Preprocess data: Lọc ra các trường dữ liệu (fields) cần thiết cũng như truy vấn (query) dữ liệu chỉ trong mỗi thành phố Hồ Chí Minh. Cơng nghệ được sử dụng: thư viện Pandas của ngôn ngữ Python, thao tác trên nền tảng Google Colaboratory.
• Mũi tên 3: Dữ liệu sau khi tiền xử lý sẽ được đưa vào mơ hình GA để huấn luyện. • GA Model: Dữ liệu sau khi tiền xử lý sẽ được đưa vào mơ hình GA để huấn luyện. • Mũi tên 10: Sau khi có cơng thức khoảng cách luận lý phù hợp từ GA Model, tiến hành
• K-SOM Model: Với đầu vào là dữ liệu các BĐS, đầu ra là bản đồ K-SOM. • Mũi tên 4: Bản đồ K-SOM này được lưu lại vào DB 2.
• DB 2: Cơ sở dữ liệu này với khởi tạo ban đầu là lưu lại bản đồ K-SOM được huấn luyện. Với các lần sau, "DB 2" sẽ được cập nhật chỉ thông qua việc người dùng (các chuyên gia) đánh giá, chỉnh sửa.
• Web UI: Giao diện bản đồ được hiển thị, các chuyên gia vào đánh giá. Lúc này dữ liệu các chuyên gia đánh giá sẽ được lưu vào "DB 2" qua "Mũi tên 8". Cùng lúc đó "Web UI" sẽ gửi yêu cầu qua "Mũi tên 5" đên API là "Generate map API". API sẽ nhận dữ liệu qua của "DB 2" qua "mũi tên 6", từ đó tạo ra bản đồ và trả về kết quả qua "mũi tên 7"
5.2 Chức năng 1: Xem, gán nhãn tương quan giữa các bất động sản
Với chức năng này, để người dùng xem được mức độ tương quan giữa các BĐS, các chuyên gia đã gán nhãn về mức độ tương quan giữa một số BĐS thông qua bản đồ giao diện mà chúng tôi tạo ra. Dữ liệu được gán nhãn này thông qua giải thuật GA và giải thuật lan truyền K-SOM để cập nhật độ tương quan cho tất cả các BĐS cịn lại.
5.2.1 Sơ đồ tình huống
Dưới đây là sơ đồ tình huống sử dụng (use-case) bản đồ giao diện cho việc đánh giá tương quan các BĐS: