2. Phương pháp xây dựng ontology kiểm thử bán tự động
2.2.2. Tạo đồ thị khía cạnh
Trong phần này, tác giả đề cập đến một ý tưởng và thuật toán cho phép tạo ra một ontology đơn giản một cách tự động với các mô tả đã được tạo ra và có thể sử dụng luôn được với Protege. Phương pháp dựa trên việc xây dựng đồ thị cho các khái niệm tìm được, sau đó thực hiện giản lược đồ thị để tìm ra những khái niệm và các quan hệ giữa các khái niệm quan trọng nhất.
Đồ thị là tập các nút với cấu trúc đơn giản gồm:
Các bước thực hiện của thuật toán như sau:
- Đầu tiên chúng ta tìm toàn bộ các mục liên quan đến khía cạnh, sau đó đồ thị được tạo ra. Hai nút được nối với nhau nếu chúng có quan hệ giữa các Khái niệm.
- Sau đó đồ thị được giản lược bằng cách bỏ nút (gộp các nút đồng nghĩa) và bỏ cạnh (bỏ những quan hệ không cần thiết với giả thiết là các quan hệ đều có tính bắc cầu).
- Cuối cùng là tạo ra một ontology với định dạng OWL.
53
- cond_term_1(string term, string pattern): bool – kiểm tra xem mẫu có nằm trong khái niệm.
- cond_term_2(string term, string pattern): bool – kiểm tra xem mẫu có nằm ở đầu của khái niệm không.
- cond_term_3(string term, string pattern): bool – kiểm tra xem mẫu có ở cuối của khái niệm.
- cond_def_1(string definition, string pattern, int n): bool – kiểm tra xem mẫu có nằm ở đầu của khái niệm, bỏ qua không quá n từ.
- cond_def_2(string definition, string ref_pattern, string pattern): bool – kiểm tra xem mẫu có ở đầu khái niệm, và tương ứng với mẫu ref_pattern (ví dụ,
ref_pattern = “see <word_list>”)
- cond_def_3(string definition, string ref_pattern, string pattern): bool – kiểm tra mẫu có ở cuối của định nghĩa, và tương ứng với mẫu ref_pattern (ví dụ,
ref_pattern = “see <word_list>”)
Cụ thể các bước của thuật toán được thực hiện như sau:
- Tìm các nút: thực hiện duyệt qua tất cả các mục tương ứng với khía cạnh, với mỗi mục thuật toán kiểm tra xem Khái niệm của mục có nằm trong khía cạnh đang xét không, hoặc khía cạnh có nằm trong phần định nghĩa của mục không (bỏ qua không quá N từ), hoặc khía cạnh có nằm trong phần Đồng nghĩa của mục không, hoặc khía cạnh có nằm trong phần tham khảo thêm của mục không. Chỉ cần 1 trong 4 điều kiện trên được thoả mãn, thuật toán ghi nhận mục như là một nút mới. Kết quả của thuật toán phụ thuộc vào tham số N. N =1 sẽ cho kết quả rất tốt, thuật toán trả về rất nhiều mục với rất ít mục không liên quan. Tác giả sử dụng N=4, để trả về nhiều mục hơn, nhưng sẽ có rủi ro khi thực hiện lựa chọn cả các mục không liên quan.
54
- Tìm các cạnh và tạo đồ thị: Nút đầu tiên và là nút chính (nút khía cạnh) trong đồ thị là nút tương ứng với khía cạnh. Với mỗi mục trong tập mục được chọn, chúng tôi tạo 1 nút và nối nó với nút chính (như nút con).
Sau đó thực hiện tìm và tạo các cạnh giữa tất cả các nút mà không phải là nút chính. Mối quan hệ giữa các nút sẽ được định nghĩa nếu bất kỳ điều kiện nào (được định nghĩa ở trên) được thoả mãn. Sau bước này, thu được 1 đồ thị giả, bao gồm nút chính là gốc và các nút con ở mức 2. Rất nhiều mối quan hệ tồn tại giữa các nút ở mức 2.
- Chuyển đổi đồ thị: 2 bước tiếp theo trong hướng tiếp cận đó là chuyển đổi đồ thị giả thành đồ thị thật bằng cách cắt bỏ nút và cạnh. Việc cắt bỏ nút được thực hiện thông qua việc tìm các từ đồng nghĩa và loại bỏ các từ này khỏi danh sách nút.
Việc loại bỏ bớt cạnh được thực hiện bằng việc kiểm tra xem 2 đầu của cạnh có liên hệ gián tiếp với nhau không. Nếu có thì xoá bỏ cạnh.
55
Sau khi thực hiện qua các bước, đồ thị thu được chính là đồ thị thật.