Phương pháp đề xuất

Một phần của tài liệu Phân tích và trực quan hóa chuỗi sự kiện dạng hệ thống lifeflow (Trang 28 - 30)

Tương tự cách định nghĩa sự kiện của các nghiên cứu trước đây, sự kiện là một tập các thuộc tính:

e = {a1, a2, a3, …, an} (3.1) Trong hệ thống VnLoc, sự kiện được định nghĩa là tập

19

e = {n, c, t, p, s, l, a}. Với

n: tên sự kiện.  c: loại sự kiện,

t: thời gian xảy ra sự kiện.  p: địa điểm xảy ra sự kiện.  s: nguồn đưa tin.

l: liên kết đến nguồn tin.  a: tĩm tắt sự kiện.

Ví dụ mơ tả một sự kiện trong VnLoc.

e = {Dập được “bà hỏa” nhờ ở gần cơ sở bán bình chữa cháy,

hỏa hoạn,

Tue Sep 11 11:00:00 GMT+07:00 2012,

quán café trên đường Nguyễn Thị Minh Khai- TP đà Nẵng, Người Lao Động,

http://nld.com.vn/2012091103235648p0c1002/dap-duoc-ba-hoa-nho-o-gan- co-so-ban-binh-chua-chay.htm

Một quán cà phê đang trong quá trình sửa chữa bị chập điện và suýt bị “bà hỏa” thiêu trụi nếu khơng nhờ cĩ cơ sở bán bình chữa cháy nằm bên cạnh} Với định nghĩa về sự kiện như trên của nhĩm thực hiện hệ thống VnLoc, thì chúng tơi định nghĩa một chuỗi sự kiện là 1 bộ ba S = {s, ts, te }, trong đĩ s = {e1, e2, …, en} với e1 là sự kiện khởi đầu và en là sự kiện kết thúc tính tới thời điểm đang xét, tslà thời gian xảy ra sự kiện khởi đầu e1, te là thời gian xảy ra sự kiện kết thúc en.

Như đã nĩi đến trong chương 1, mỗi phương pháp giải quyết bài tốn nhận dạng chuỗi sự kiện đều cĩ những ưu nhược điểm riêng tùy thuộc vào đặc điểm của dữ liệu, đặc trưng của ngơn ngữ, mục tiêu phát triển… Trên nền tảng hệ thống theo dõi tin tức trực tuyến VnLoc, tin tức cập nhật đã được phát hiện và trích xuất với độ chính xác cao (trên 90%) và sự tham khảo ý kiến về đặc trưng của miền dữ liệu Tiếng Việt, nhĩm chúng tơi đã quyết định chọn phương pháp sử dụng độ đo tương đồng để tiến hành thực nghiệm. Bước đầu đã mang lại kết quả tương đối khả quan.

20

Một phần của tài liệu Phân tích và trực quan hóa chuỗi sự kiện dạng hệ thống lifeflow (Trang 28 - 30)