-Giao diện chính của hệ thống CNE, như Hình 4.1, bao gồm các thành phần sau:
- Thanh menu: gồm các menu: Task, Utilities, Tools, Help. Menu Tasks bao gồm những chức năng quan trọng như mô tả trong Bảng 4.1.
- đỉnh đang chọn trên đồ thị.
- Khung nội dung chính: dùng để biểu diễn trực quan đồ thị.
- Thanh trạng thái: dùng để thơng báo tình trạng hiện tại của ứng dụng.
-Sau đây làng bảng mô tả các chức năng của menu Tasks:
- Bảng 4.1 - Các chức năng của menu Tasks.
-
STT - Chức năng - Mô tả
-
1
- Find papers - Tìm các bài báo theo: tên tác giả,
tiêu đề và
năm xuất bản.
-
2
- Load the whole graph - Tải toàn bộ cơ sở dữ liệu đồ thị từ OrientDb
vào GraphX.
-
3
- Load a part of the graph
- Tải một phần cơ sở dữ liệu đồ thị từ OrientDb vào GraphX.
-
4
- Visualize the whole graph
Chức
năng này chỉ nên dùng khi đồ thị nhỏ21.
-
5
- Visualize a part of the graph
- Biểu diễn trực quan một phần đồ
thị. Chức
năng này nên dùng khi đồ thị lớn.
-
6
- Calculate PageRank - Tính PageRank cho các đỉnh trên đồ thị.
Đây là công việc tốn nhiều thời gian xử lý.
-
7
- Find the influence of a paper
- Tìm tầm ảnh hưởng của một bài báo.
-
8
- Find the most influential
paper
- Tìm bài báo có tầm ảnh hưởng nhiều nhất. - 9 - Find the connected - component of a paper
- Tìm thành phần liên thơng chứa một bài
báo.
-
10
- Find the propagation of a
paper over time
- Tìm sự lan tỏa của một bài báo theo thời
gian.
21Đồ thị lớn hay nhỏ mang tính chất tương đối và phụ thuộc vào cấu hình hệ thống. Đối với máy thử nghiệm (CPU
4.1.2. Giao diện của chức năng “Find papers”
-
- -
- Hình 4.2 — Giao diện của chức năng “Findpapers”.
-
-
- Hình 4.3 - Giao diện của chức năng “Visualize the whole graph ”.
-Chức năng “Find papers” dùng để tìm các bài báo theo: tên tác giả, tiêu đề và năm
xuất bản. Giao diện của chức năng “Find papers” như hình Hình 4.2. Khung nội dung chính trình bày danh sách các bài báo tìm được. Cuối thanh trạng thái có những nút
7 7
- 78 -
-thể hiện sự lan tỏa của bài báo theo thời gian. Các đỉnh có cùng năm
xuất bản nằm trên
cùng một cột.
4.2. Thực nghiệm
-Trong phần này tơi sẽ trình bày cách triển khai hệ thống thực nghiệm và kết quả thực nghiệm một số chức năng chính của hệ thống Citation Network Explorer (CNE). Việc thực nghiệm nhằm đo đạc thời gian xử lý22 của các chức năng trên các đồ thị với độ lớn khác nhau. Độ lớn đồ thị được xác định dựa vào số cạnh và số đỉnh của đồ thị. Thời gian xử lý được tính bằng giây. Các chức năng được tiến hành thực nghiệm bao gồm:
- loadGraph: đọc cơ sở dữ liệu đồ thị từ OrientDb, chuyển thành đồ thị
GraphX trong Apache Spark Cluster.
- calculatePageRank: tính PageRank cho các đỉnh trên đồ thị.
- findConnectedComponent: tìm thành phần liên thông trong đồ thị chứa
một bài báo.
- findPropagation: tìm sự lan tỏa của một bài báo theo thời gian.
- visualizeGraph: thực hiện việc biểu diễn trực quan đồ thị.
4.2.1. Kiến trúc của hệ thống thực nghiệm
-Kiến trúc của hệ thống thực nghiệm như trong Hình 4.5, gồm sáu node:
- Một node làm Client.
- Một node làm Web Server.
- Một node làm OrientDb Server.
- Ba node còn tại tạo thành Apache Spark Cluster gồm: một Driver Node và hai Worker Node.
- Hệ thống thực nghiệm được hiện thực bằng ba máy tính:
- Một máy làm Client, Web Server, OrientDb Server và Driver Node.
- Hai máy làm Worker Node.
22Ở đây không đo đạc sự tiêu thụ bộ nhớ do hệ thống CNE là hệ thống xử lý phân tán trên Apache Spark Cluster.
- 79 -
-Các máy tính thực nghiệm có cấu hình như sau:
- - Processor: Intel(R) Core™ Ì7-3630QM CPU @ 2.40 GHz 2.40 GHz. - RAM: 8 GB.
- Hard Disk: 500 GB.
-
-