Thành phần xác định vai trò trong mạng xã hội

Một phần của tài liệu Tiểu luận Môn Trí tuệ nhân tạo nâng cao Áp dụng công nghệ dữ liệu lớn vào việc thu thập thông tin đối tượng kiểm toán trên các phương tiện xã hội (Trang 38 - 39)

Nhằm mục đích xác định những cá nhân đóng vai trò quan trọng trong các sự kiện, hệ thống xây dựng một thành phần phát hiện vai trò trong mạng xã hội. Theo Vanesa [TS12]

định nghĩa vai trò xã hội (social role) là một tập hợp các đặc trưng thể hiện hành vi của

một cá nhân và sự tương tác của họ với những người khác trong ngữ cảnh xã hội. Ví dụ:

Vai trò Chuyên gia (Expert), Người trả lời (Answer people), Người dùng bình thường

(Normal user) trong mạng Usernet [NK04]

Có nhiều phương pháp phát hiện vai trò của người dùng trong mạng xã hội, tuy nhiên được phân loại thành ba hướng tiếp cận sau:

- Hướng tiếp cận thống kê:

Dựa trên các tham số thống kê từ mạng xã hội về người dùng trong các sự kiện

để đánh giá sự “tích cực” của họ. Ưu điểm của phương pháp này là nguồn dữ

liệu sẵn, chi phí tính toán thấp.

- Hướng tiếp cận học máy không giám sát

Dựa trên các đặc trưng của người dùng, sự tương tác của họ trong mạng xã hội để gom cụm những người dùng có những thuộc tính gần giống nhau vào các nhóm vai trò khác nhau hoặc tính toán trọng số để xếp hạng sự ảnh hưởng của họ đối với người khác. Ví dụ: Nghiên cứu về xác định nhóm người dùng chính (key users) dựa trên phương pháp PageRank của Heidemann [HKP10] hoặc phân cụm người dùng của Vanesa và đồng nghiệp [TS12] năm 2012. Ưu điểm của phương pháp này là thi hành đơn giản tuy nhiên đòi hỏi phải có dữ liệu tương đối đầy đủ về người dùng và các mối quan hệ trong mạng xã hội.

- Hướng tiếp cận học máy giám sát

Dựa trên một số đặc trưng của người dùng như hành vi, các thông tin cơ bạn, số kết nối … xây dựng các mô hình phân lớp xác định xem tầm quan trọng hoặc ảnh hưởng của người dùng trong mạng liên kết. Ví dụ: Mô hình phát hiện ra các tài khoản gửi tin nhắn rác (Spammer) của Gianluca [SKV10] và Xin Jin [JLLH11]. Ưu điểm của hướng tiếp cận này là khai được các thông tin hữu ích từ mạng xã hội nhưng việc thu thập được dữ liệu đầy đủ và liên quan là rào cản lớn khi áp dụng vào miền dữ liệu tiếng Việt.

Thông qua tìm hiểu về bài toán xác định vai trò trong mạng xã hội và tính chất của dữ liệu mạng xã hội tại Việt Nam, chúng tôi cũng tiến hành cài đặt thành phần xác định vai trò của các tài khoản tham gia vào các sự kiện xuất hiện trong hệ thống dựa theo hướng tiếp cận thống kê. Vai trò của một tài khoản thể hiện bằng số lần tham gia vào sự kiện hoặc các page như gửi bài viết hoặc like hay ý kiến, danh sách thống kê vai trò của tài khoản đối với từng sự kiện và page sẽ được đưa ra trên giao diện cho nhà quản lý theo dõi.

35

Một phần của tài liệu Tiểu luận Môn Trí tuệ nhân tạo nâng cao Áp dụng công nghệ dữ liệu lớn vào việc thu thập thông tin đối tượng kiểm toán trên các phương tiện xã hội (Trang 38 - 39)

Tải bản đầy đủ (PDF)

(39 trang)