5 KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN
1.1 Lược đồ tổ chức luận án
minh tính đúng đắn, hiệu quả thơng qua các thực nghiệm sử dụng những bộ dữ liệu được cộng đồng nghiên cứu thường sử dụng và đánh giá, so sánh với những cơng cụ tương tự.
• Chương 4 trình bày một số kết quả nghiên cứu về việc tính các độ đo trung tâm của đồ thị theo định hướng song song hoá kết hợp sử dụng cấu trúc dữ liệu đồ thị phù hợp. Hai giải pháp tính độ trung tâm gần và độ trung tâm trung gian đã được chúng tơi trình bày trong chương này. Các kết quả thực nghiệm minh chứng việc cải thiện hiệu năng của hai giải pháp đề xuất trong luận án thông qua đánh giá, so sánh với một số bộ công cụ tương tự cũng được tiến hành và trình bày cụ thể trong chương này.
• Chương 5 tóm lược lại các đóng góp chính của luận án và một số hướng phát triển trong tương lai.
CƠ SỞ LÝ THUYẾT
Trong chương này, luận án sẽ chú trọng trình bày những khái niệm lý thuyết cơ bản liên quan đến luận án, cụ thể là lý thuyết đồ thị, các phương pháp biểu diễn đồ thị cũng như các phép toán cơ bản trên đồ thị. Một số những khái niệm cơ bản liên quan đến tính tốn song song cũng sẽ được trình bày trong luận án này.
2.1 Lý thuyết đồ thị
2.1.1 Khái niệm
Đồ thị là một cấu trúc dữ liệu linh hoạt, được thể hiện dưới dạng một tập các đỉnh (vertices) và các cạnh (edges), hay được gọi với thuật ngữ khác là tập các nút (nodes) và các quan hệ kết nối giữa chúng với nhau (relationships) [103][108]. Đồ thị cho phép biểu diễn các thực thể dưới dạng các đỉnh và các cách thức mà các thực thể đó liên quan đến nhau dưới dạng các mối quan hệ. Cấu trúc dễ hình tượng và đa mục đích này cho phép chúng ta có thể mơ hình hóa tất cả các loại bài toán khác nhau, từ việc xây dựng tên lửa vũ trụ, đến một hệ thống đường, từ chuỗi cung cấp hoặc nguồn gốc thực phẩm, đến lịch sử y tế của người dân, và hơn thế nữa [48].
Định nghĩa 2.1. Trong lý thuyết đồ thị, một đồ thị G, ký hiệu G= (V, E), được cấu thành từ một tập các đỉnh V và một tập các cạnh E liên kết các đỉnh với E ={(vi, vj)|vi, vj ∈V}. Số lượng phần tử các đỉnh |V| và các cạnh |E| được ký hiệu lần lượt là n và m.
Đồ thị rất hữu ích trong việc phân tích và hiểu được sự đa dạng của các tập dữ liệu khoa học, dữ liệu của chính phủ, dữ liệu xã hội... Kỹ thuật quản lý dữ liệu theo mơ hình quan hệ đã khiến chúng ta đi chệch ra khỏi miền ngôn ngữ tự nhiên, trước tiên bằng việc cố gắng biểu diễn thế giới thực dưới dạng một mơ hình logic, rồi sau đó lại gắn nó vào một mơ hình vật lý. Những phép biến đổi này chỉ ra sự bất hòa ngữ nghĩa giữa khái niệm của chúng ta về thế giới thực và thể hiện của cơ sở dữ liệu về thế giới đó. Với lý thuyết đồ thị, khoảng cách này co lại đáng kể khi cho phép thể hiện trực quan giữa mơ hình dữ liệu và mơ hình
vật lý trong thế giới thực. Chẳng hạn, dữ liệu của mạng xã hội Twitter dễ dàng được biểu thị dưới dạng đồ thị như minh hoạ ở Hình 2.1. Các quan hệ giữa các thành viên được thể hiện bởi mối quan hệ "theo dõi - follow" lẫn nhau. Các mối quan hệ này thể hiện bối cảnh ngữ nghĩa: cụ thể trong ví dụ này là Billy theo dõi Harry còn Harry theo dõi Billy và Ruth. Ruth và Harry cũng theo dõi nhau, nhưng Billy không thể hiện sự quan tâm đến các hoạt động của Ruth.