Qua nghiên cứu tìm hiểu một số mô hình cấu trúc profile như đã trình bày ở chương 2. Tác giả rút ra một số kết luận như sau:
Trong các cấu trúc hồ sơ cá nhân, chúng ta thấy có nhiều cấu trúc hồ sơ cá nhân được đề xuất cho những miền ứng dụng cụ thể. Tuy vậy, trong một ứng dụng cụ thể nếu áp dụng máy móc cấu trúc hồ sơ cá nhân tổng quát của một miền tương ứng sẽ không tránh khỏi tình trạng có những đặc trưng không cần thiết. Việc lưu trữ, xử lý các thông tin dư thừa làm hao tốn tài nguyên hệ thống trong quá trình hỗ trợ thích nghi người dùng.
Mặc khác, hiện nay vẫn chưa có nghiên cứu nào đề cập đến các phương pháp chọn ra những thuộc tính hữu ích nhất, ngoài kinh nghiệm của các chuyên gia. Các thuộc tính còn được chọn theo kinh nghiệm nên còn mang tính chủ quan cao. Do vậy, bài toán đặt ra là cần tinh chỉnh cấu trúc tổng quát để tạo ra cấu trúc hồ sơ cá nhân mới phù hợp với những hệ thống cụ thể.
Do đó, tác giả đề xuất một mô hình cấu trúc profile để phù hợp với so sánh mức độ tương đồng giữa các profile trên mạng xã hội như sau:
Hình 3.3: Cấu trúc profile tác giả đề xuất
Interested In: thông tin về mối quan tâm của user trên môi trường mạng xã hội, nó phản ảnh mối quan tâm của user.
Status/ Comments: chứa thông tin về những hoạt động của user trên mạng xã hội, user thường bình luận về những gì, user thường đăng những bài gì. History by year: thông tin về những hoạt động trong quá khứ của user, user
đã từng trải qua những công việc/ công tác chuyên môn/ những khóa đào tạo/ v.v nào? Thông tin này góp phần phản ánh nền giáo dục và công việc của user.
Religious views: thông tin cho biết về tôn giáo, quan điểm về tôn giáo của user, góp phần làm giàu thêm sự tương đồng giữa các profile.
Hometown/ Current Location: thông tin về quê quán và nơi ở hiện tại của user, thông tin góp phần vào xác định sự tương đồng về vùng miền, về nhiều yếu tố khác liên quan đến các vùng địa lý.
Profile Hometown Religious views Current Location Favourite Quotations Birthday Gender Relationship Status Employers Status/ Comments History by year Interested In University
University/ Employers: thông tin về ngành học và trường đại học user được học; thông tin về công việc hiện tại của user; các thông tin này góp phần làm giàu cho mức độ tương đồng giữa các profile.
Relationship Status/ Gender: thông tin về tình trạng hôn nhân và giới tính của user, thông tin góp phần làm giàu cho mức độ tương đồng giữa các profile.
Birthday: thông tin cho biết lứa tuổi của user.
Như vậy với mỗi profile chúng tôi biểu diễn với 12 thông tin liên quan, đó cũng là các khía cạnh để so sánh mức độ tương đồng giữa các profile. Mỗi profile được biểu diễn thành một vector profile trong đó từng thành phần của vector profile là một vector con tương ứng các thông tin cần so khớp. Chi tiết quá trình xử lý dữ liệu profile trên máy tính như sau: