29
Hình ảnh đặc trưng một số thuộc tính (sự phân phối kết
hợp giữa các từ).
Kết quả thực nghiệm
30
Kết quả bắt cặp so sánh mức độ tương đồng giữa các hồ sơ khảo sát được bằng quan sát và khi
thực hiện trên hệ thống.
Kết quả thực nghiệm
31
Hình ảnh so sánh mức độ tương đồng giữa các hồ sơ
Kết quả thực nghiệm
32
Nhận xét:
• Xét thấy trên toàn bộ quá trình thử nghiệm, sai số trung bình khi so sánh giữa quan sát thực tế và hệ thống xử lý là khoảng 8%.
• Tỉ lệ phần trăm của tập dữ liệu toàn thể thu thập được có thể chấp nhận khoảng 90% so với thực tế. Trừ sai số tỉ lệ tương đồng khi quan sát, ta thấy độ chính xác của hệ thống đạt khoảng 85% đến 90%
Nhận xét
33
Luận văn đã đề xuất mô hình xây dựng và biểu diễn profile người sử dụng theo một cấu trúc. Xây dựng giải pháp đánh giá mức độ tương đồng giữa các profile.
Việc thu thập hồ sơ cá nhân là tĩnh, biểu diễn thông tin hồ sơ dưới dạng vector bao gồm các vector con.
Xây dựng các đặc trưng thuộc tính hồ sơ dựa trên các nghiên cứu về phân tích chủ đề ẩn (LDA).
Kết hợp độ đo tương đồng Cosine với phân tích chủ đề ẩn giúp hạn chế trường hợp liên quan đến ngữ nghĩa.
Kết luận
34
Hạn chế:
• Thông tin profile thu được từ mạng xã hội Facebook có nhiều thông tin ảo, do đó quá trình học máy cho tập dữ liệu bao phủ miền ứng dụng chưa thật sự đạt mức tốt nhất.
• Nhiều profile còn hạn chế thông tin cả về lượng lẫn về chất dẫn đến khi so sánh không thể có kết luận như mong muốn.
Hạn chế
35
Mở rộng so sánh mức độ tương đồng giữa các profile không những với thông tin dạng text mà cho cả thông tin dạng hình ảnh.
Cập nhật động thông tin hồ sơ cá nhân để đáp ứng lại những thông tin thay đổi theo thời gian của hồ sơ.
Cải tiến quy trình xử lý để hệ thống được tối ưu nhất.