Kiến trúc chung

Hình 8 – Kiến trúc chung của hệ thống DIZZIE

Hệ thống DIZZIE sẽ truy vấn các thông điệp của Twitter bằng các Twitter API và một danh sách các từ khóa được định nghĩa trước. Những thông điệp này sẽ được đưa

TWITTER Nhận diện các hành vi

Phân cụm theo thời gian và theo khu vực địa lý

Phân tích bất thường ở từng khu vực địa lý

Hiển thị lên giao diện bản đồ

Cảnh báo mức độ bất thường của các hành vi

DIZZIE

Download các thông điệp của Twitter

vào component nhận diện hành vi người dùng. Component này hoạt động dựa vào các bộ phân lớp để xác định một thông điệp có hoặc không liên quan đến hành vi tương ứng. Sau khi đã thu được các thông điệp liên quan đến các hành vi cần giám sát, hệ thống sẽ sử dụng các Twitter API kết hợp với Google API để rút trích thông tin về vị trí của người dùng và thời gian đưa lên của các thông điệp. Với các thông điệp về các hành vi cùng với thông tin thời gian và địa lý, hệ thống sẽ tiến hành phân cụm các thông điệp theo từng hành vi, khu vực và thời gian. Với mỗi cụm, sau đó, hệ thống sẽ phân tích sự bất thường tại của các hành vi dựa trên thuật toán C2 [24]. Cuối cùng, với những hành vi bất thường tại từng khu vực địa lý, hệ thống sẽ hiển thị lên một giao diện bản đồ trực quan thể hiện mức độ bất thường của các hành vi.

Với sự phản ánh tức thời của người dùng trên mạng xã hội ảo về thế giới thật, hệ thống phát hiện bất thường này có thể cung cấp thông tin cho người dùng nói chung và các nhà chăm sóc sức khỏe những dấu hiệu sớm về dịch bệnh. Nhờ đó có khả năng phát hiện sớm và làm giảm tác hại của bệnh dịch.

Tuy nhiên, việc phát hiện các hành vi trên mạng xã hội sử dụng các kỹ thuật máy học, thông tin trên mạng xã hội nhiều nhưng độ nhiễu và không đáng tin cậy bằng kênh thông tin khác như các tổ chức giám sát sức khỏe của chính phủ.

Đặc điểm của mạng xã hội Twitter

So sánh giữa các đặc trưng khác nhau