.21 Đồ thị tri thức gồm ba bài viết với các thực thể quan hệ

Một phần của tài liệu Giải pháp lưu trữ số lượng lớn các thực thể quan hệ trích xuất từ các bài báo mạng (Trang 52 - 54)

Dựa vào kết quả thực nghiệm ở Chương 3, mục 3.3.1 cho thấy mơ hình thứ tư là mơ hình dữ liệu tối ưu.

Ngồi ra thuộc tính của node trong model thứ tư sẽ được đánh index để tăng tốc độ truy vấn. Tôi lựa chọn đánh index trên property: name. Bởi vì khi thực hiện truy vấn thực thể (bao gồm: Location, Country, Person, Event, Agreement) thì thuộc tính này thường sử dụng. Riêng thực thể News truy vấn thường sử dụng property link nên index khơng đánh trên thuộc tính name mà đánh trên thuộc tính link. Trong thực thể, index được đánh cho properties như ở – Bảng 6 bên dưới đây.

Bảng 2. 4. Thuộc tính của node được đánh index

Label - Nhãn Thuộc tính đánh index

Person | Event | Location | Country | Agreement name

41

2.4 Hệ thống lưu trữ thực thể quan hệ

Trong phần này tôi xây dựng hệ thống lưu trữ thực thể quan hệ theo mơ hình đã chọn. Hệ thống đề xuất dưới đây đáp ứng được khả năng cung cấp, sử dụng service API cho người dùng. Ngồi ra hệ thống cịn dễ dàng mở rộng và có khả năng chịu lỗi.

2.4.1 Kiến trúc hệ thống

Xây dựng hệ thống lưu trữ thực thể quan hệ theo mơ hình đã chọn yêu cầu số lượng lưu trữ được phải lớn, khả năng trả lời phản hồi nhanh, đáp ứng nhiều yêu cầu truy vấn đồng thời và nhiều câu truy vấn phức tạp liên quan tới báo cáo, thống kê dữ liệu, … Các bước xây dựng cần dựa theo biểu đồ thu thập dữ liệu từ các nguồn tin tức trong bài báo mạng [7]. Ngồi ra phải có khả năng mở rộng khi yêu cầu xử lý tăng cao có thể tăng thêm các máy chủ vật lý để đảm bảo hiệu năng, tính sẵn sàng dùng. Bên dưới là hình mơ tả kiến trúc hệ thống – Hình 2.22 bên dưới.

42

Một phần của tài liệu Giải pháp lưu trữ số lượng lớn các thực thể quan hệ trích xuất từ các bài báo mạng (Trang 52 - 54)

Tải bản đầy đủ (PDF)

(86 trang)