Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 132 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
132
Dung lượng
1,32 MB
Nội dung
ĐẠI HỌC HUẾ TRƯỜNG ĐẠI HỌC KHOA HỌC NGUYỄN VĂN TRUNG MỘT SỐ PHƯƠNG PHÁP XỬ LÝ TRI THỨC KHÔNG NHẤT QUÁN TRONG ONTOLOGY LUẬN ÁN TIẾN SĨ KHOA HỌC MÁY TÍNH HUẾ - NĂM 2018 ĐẠI HỌC HUẾ TRƯỜNG ĐẠI HỌC KHOA HỌC NGUYỄN VĂN TRUNG MỘT SỐ PHƯƠNG PHÁP XỬ LÝ TRI THỨC KHÔNG NHẤT QUÁN TRONG ONTOLOGY CHUYÊN NGÀNH: KHOA HỌC MÁY TÍNH MÃ SỐ: 62.48.01.01 LUẬN ÁN TIẾN SĨ KHOA HỌC MÁY TÍNH Người hướng dẫn khoa học: PGS TS HOÀNG HỮU HẠNH HUẾ - NĂM 2018 LỜI CAM ĐOAN Tôi xin cam đoan cơng trình nghiên cứu tơi thực hướng dẫn PGS TS Hoàng Hữu Hạnh Những nội dung cơng trình cơng bố chung với tác giả khác đồng ý đồng tác giả đưa vào luận án Các số liệu kết nghiên cứu trình bày luận án trung thực, khách quan chưa công bố tác giả cơng trình khác Nghiên cứu sinh Nguyễn Văn Trung i LỜI CẢM ƠN Luận án thực hoàn thành Khoa Công nghệ Thông tin, Trường Đại học Khoa học, Đại học Huế Trong suốt trình học tập thực luận án, nhận nhiều quan tâm, động viên, giúp đỡ thầy giáo hướng dẫn, thầy cô giáo Khoa Công nghệ Thơng tin, Phịng Đào tạo Sau đại học Ban giám hiệu Trường Đại học Khoa học Tôi xin bày tỏ lòng biết ơn sâu sắc đến PGS TS Hồng Hữu Hạnh người thầy tận tình hướng dẫn, động viên truyền đạt kinh nghiệm quý báu nghiên cứu khoa học để tơi hồn thành luận án Tôi xin chân thành cảm ơn quý thầy cô giáo Khoa Công nghệ Thông tin tạo điều kiện thuận lợi công tác để tơi hồn thành cơng việc nghiên cứu Tơi xin cảm ơn q thầy cán Phòng Đào tạo Sau đại học, Ban giám hiệu Trường Đại học Khoa học giúp đỡ việc hồn thành kế hoạch học tập Tơi xin trân trọng cảm ơn quý thầy cô giáo Hội đồng Khoa học Khoa Công nghệ Thông tin đọc đưa góp ý xác đáng cho luận án Tôi xin trân trọng cảm ơn quý thầy cô giáo anh chị đồng nghiệp Khoa Công nghệ Thông tin giúp đỡ, chia sẻ q trình cơng tác, học tập, nghiên cứu thực luận án Cuối xin cảm ơn người thân gia đình ln ủng hộ, chia sẻ khó khăn suốt q trình học tập, nghiên cứu thực luận án Nghiên cứu sinh Nguyễn Văn Trung ii MỤC LỤC Lời cam đoan i Lời cảm ơn ii Mục lục iii Danh mục từ viết tắt, thuật ngữ v Danh mục ký hiệu vi Danh mục bảng, biểu vii Danh mục hình vẽ viii Mở đầu Chương TỔNG QUAN VỀ XỬ LÝ TRI THỨC KHÔNG NHẤT 1.1 1.2 QUÁN TRONG ONTOLOGY Ontology tri thức không quán Khung lập luận với ontology không quán sử dụng chiến lược phát 9 triển tuyến tính tập tiên đề diễn giải 1.2.1 Các khái niệm 1.2.2 Hàm chọn 1.2.3 Phép suy luận không chuẩn sử dụng hàm chọn đơn điệu 1.2.4 Phép suy luận không chuẩn sử dụng hàm chọn dựa liên 15 15 19 20 quan cú pháp Các nghiên cứu liên quan đến khung lập luận với ontology không 23 1.2.5 quán sử dụng chiến lược mở rộng tuyến tính tập tiên đề diễn giải Xử lý tri thức không qn q trình tích hợp ontology theo 28 phương pháp đồng thuận 1.3.1 Hồ sơ xung đột 1.3.2 Sự không quán tri thức 1.3.3 Hàm đồng thuận 1.3.4 Các nghiên cứu liên quan xử lý không quán tri thức 32 32 33 40 q trình tích hợp ontology phương pháp đồng thuận 1.4 Tiểu kết Chương Chương SUY LUẬN VỚI ONTOLOGY KHÔNG NHẤT QUÁN SỬ 44 46 1.3 DỤNG HÀM CHỌN DỰA TRÊN ĐỘ LIÊN QUAN NGỮ 2.1 NGHĨA Khoảng cách ngữ nghĩa hai khái niệm ontology iii 47 48 2.2 Khoảng cách ngữ nghĩa hai biểu thức khái niệm theo ontology tham 2.3 2.4 chiếu Khoảng cách ngữ nghĩa hai tiên đề theo ontology tham chiếu Suy luận với ontology không quán sử dụng hàm chọn dựa khoảng cách ngữ nghĩa 2.5 Thực nghiệm đánh giá kết 2.6 Tiểu kết Chương Chương XỬ LÝ XUNG ĐỘT MỨC KHÁI 53 55 NIỆM TRONG QUÁ 61 67 71 TRÌNH TÍCH HỢP ONTOLOGY Mơ hình tích hợp tri thức dựa lý thuyết đồng thuận Các mức xung đột trình tích hợp ontology Xử lý xung đột mức khái niệm q trình tích hợp ontology Vấn đề xây dựng hàm đánh giá khoảng cách cho miền giá trị 72 72 75 78 thuộc tính 3.4.1 Hàm đánh giá khoảng cách hai biểu thức khái niệm 3.4.2 Hàm đánh giá khoảng cách hai khoảng liệu 3.5 Tiểu kết Chương Chương XỬ LÝ XUNG ĐỘT MỨC TIÊN ĐỀ TRONG Q TRÌNH 85 85 86 93 TÍCH HỢP ONTOLOGY Mơ hình xử lý xung đột tri thức cấp độ cú pháp 4.1.1 Bài tốn tìm đồng thuận công thức hội tiêu chuẩn 94 95 cho đồng thuận 4.1.2 Phân tích tiêu chuẩn đồng thuận 4.1.3 Thuật toán xác định đồng thuận 4.2 Xử lý xung đột mức tiên đề trình tích hợp ontology 4.3 Tiểu kết Chương KẾT LUẬN DANH MỤC CÁC CƠNG TRÌNH CỦA TÁC GIẢ LIÊN QUAN ĐẾN 98 100 109 115 119 120 LUẬN ÁN TÀI LIỆU THAM KHẢO 122 123 3.1 3.2 3.3 3.4 4.1 iv DANH MỤC TỪ VIẾT TẮT, THUẬT NGỮ Từ viết tắt, thuật ngữ ODP Diễn giải Over-determined Processing Quy trình xử lý xác định OWL Ontology Web Language Ngôn ngữ ontology dùng cho Web W3C World Wide Web Consortium Tổ chức tiêu chuẩn quốc tế World Wide Web Conflict profile Hồ sơ xung đột Consensus theory Lý thuyết đồng thuận Data property Thuộc tính liệu Domain Miền xác định (của thuộc tính) Object property Thuộc tính đối tượng Open World Assumption Giả thiết giới mở Range Miền giá trị (của thuộc tính) Semantic wiki Wiki ngữ nghĩa v DANH MỤC KÝ HIỆU Ký hiệu Diễn giải ý nghĩa O Ontology Σ Ontology không quán Σ ,Σ Ontology quán với tiên đề chọn từ ontology không quán khác |≈ Phép suy luận không chuẩn |≈Syn Phép suy luận không chuẩn sử dụng hàm chọn dựa độ liên quan cú pháp |≈O Phép suy luận không chuẩn sử dụng hàm chọn dựa khoảng cách ngữ nghĩa ontology tham chiếu O R, S Các tên vai trị, thuộc tính A, B Các tên cá thể DPO (C) Tập khái niệm cha trực tiếp khái niệm ontology DCO (C) Tập khái niệm trực tiếp khái niệm ontology LCPO (C, D) Tập khái niệm cha chung tối thiểu hai khái niệm ontology C, D Các tên khái niệm CE , CE Các biểu thức khái niệm DR1 , DR2 Các khoảng liệu DT Kiểu liệu U Tập vũ trụ X, Y Các hồ sơ xung đột P1a , P1b Các tiêu chuẩn cho hàm quán T1 , T2 Các tiêu chuẩn cho tri thức tích hợp H1 , H2 Các tiêu chuẩn cho công thức hội vi DANH MỤC BẢNG, BIỂU Bảng 1.1 Tính thoả tiêu chuẩn số hàm quán thông dụng 40 Bảng 2.1 Các tiên đề biểu thức khái niệm Bảng 2.2 Các tiên đề thuộc tính đối tượng Bảng 2.3 Các tiên đề thuộc tính liệu, định nghĩa kiểu liệu, khoá 58 59 biểu thức khái niệm, phát biểu kiện Bảng 2.4 Các ontology thực nghiệm Bảng 2.5 So sánh theo số lượng kết xác định truy Bảng 2.6 So sánh phát triển tập tiên đề diễn giải 60 68 69 69 Bảng 3.1 Cấu trúc khái niệm Course ontology 91 vấn Bảng 4.1 Ví dụ cơng thức hội tác tử mơ tả tính chất thuộc tính hasSpouse 96 Bảng 4.2 Trạng thái tri thức tác tử cho toán minh hoạ 114 vii DANH MỤC HÌNH VẼ Hình 1.1 Hình 1.2 Hình 1.3 Hình 1.4 Hình 1.5 Truy vấn với ontology không quán Chiến lược mở rộng tuyến tính [21] Sơ đồ áp dụng hàm đồng thuận Trích dẫn ontology tham chiếu OREF −T REE Trích dẫn ontology chuyên gia 13 21 43 44 45 Hình 2.1 Cây phân cấp khái niệm minh hoạ Hình 2.2 Ontology tham chiếu O 50 65 viii Như vậy: y∈X = y∈Xz card((x+ ∪ {z}) card(L) y+) card((x+ ∪ {z}) card(L) y+) card(x+ = y∈Xz card(x+ = y∈X = y∈X y∈Xz y+) − card(L) y+) card(L) + + card((x+ ∪ {z}) card(L) y+) card(x+ y + ) + card(L) + y∈Xz + −f (z) + n − f + (z) card(L) card(x+ y + ) n − 2.f + (z) + card(L) card(L) Do đó: d∧ ((x+ ∪ {z}, x− ), X) = y∈X = y∈X card((x+ ∪ {z}) card(L) y+) card(x− y − ) + card(L) card(x+ y + ) n − 2.f + (z) card(x− y − ) ( + )+ card(L) card(L) card(L) n − 2.f + (z) =d∧ (x, X) + card(L) n việc bổ sung z vào x+ n không làm tăng tổng khoảng cách x đến hồ sơ X Ngược lại, f + (z) < việc bổ sung z vào x+ làm tăng tổng khoảng cách x đến hồ sơ X Nói Như vậy, n − 2.f + (z) ≤ 0, hay f + (z) ≥ cách khác, (i) (ii) chứng minh Trở lại việc chứng minh (a) Có thể thấy rằng, xuất phát từ tập hợp z∈ n , ta loại bỏ bớt phần thuộc tập hợp này, bổ sung thêm phần tử Z+ trình thành lập thành phần khẳng định Z+ | f + (z) >= đồng thuận Nói cách khác, thành phần khẳng định đồng thuận Do (a) (đpcm) Nhận xét tiêu chuẩn đồng thuận Trong mục này, luận án phân tích mối liên quan tiêu chuẩn đồng thuận, thể qua định lý 4.1, 4.2, 4.3 4.4 Có điểm lưu ý rằng, 108 mối liên quan có cách xây dựng khoảng cách hai tập hợp ký hiệu Định nghĩa 4.4 Trên thực tế, để đánh giá khoảng cách hai tập hợp, người ta sử dụng tiếp cận khác [45]: η(X1 , X2 ) = card(X1 X2 ) , card(X1 ∪ X2 (4.9) Cách đánh giá khoảng cách hai tập hợp cơng thức (4.9) có ưu điểm không phụ thuộc vào lực lượng tập literal Tuy nhiên áp dụng cách tiếp cận để tính khoảng cách hai cấu trúc hội tốn tìm đồng thuận hồ sơ cấu trúc hội trở nên phức tạp: Định lý 4.4 khơng cịn nữa! Ngồi ra, cơng trình [45] tác giả Nguyễn Ngọc Thành toán tìm đồng thuận H5 trường hợp toán thuộc lớp NP-đầy đủ! Phần sau đây, luận án trình thuật tốn hiệu để xây dựng đồng thuận cho hồ sơ công thức hội nhờ tận dụng đặc trưng có nhờ Định nghĩa 4.4 4.1.3 Thuật toán xác định đồng thuận Dựa vào tính chất tiêu chuẩn phân tích Tiểu mục 4.1.2, phần trình bày cách xây dựng đồng thuận x∗ = (x∗ + , x∗ − ) hồ sơ xung đột X ∈ (Conj(L)) theo chiến lược ưu tiên tiêu chuẩn với thứ tự sau: H5 , H4 , H1 , H2 , H3 H6 Định lý 4.2 cho thấy điều kiện định nghĩa tiêu chuẩn H5 quan trọng, nói chung đồng thuận thoả tiêu chuẩn thoả tiêu chuẩn H1 H2 Ngoài ra, theo Định lý 4.3, việc xác định thành phần dương âm đồng thuận thực cách độc lập Vì thế, việc tính tốn cơng thức hội tối ưu (x∗ + , x∗ − ) ∈ C(X) mà X = {xi = (xi + , xi − ) ∈ Conj(L) | i = 1, 2, , n} chia làm việc nhỏ tương tự nhau: xác định thành phần dương đồng thuận xác định thành phần âm đồng thuận: + η(x∗ + , x+ ) = x∈X η(x , x+ ) | x ⊆ L x∈X 109 − η(x∗ − , x− ) = x∈X η(x , x− ) | x ⊆ L x∈X Định lý 4.4 cách tìm thành phần này, nhiên, định lý lại khơng đảm bảo đồng thuận tìm thoả tiêu chuẩn H4 Trên sở phân tích này, luận án đề xuất thuật toán xác định đồng thuận Ý tưởng thuật tốn sau: • Trước hết, xác định tập hợp Z+ Z− gồm tương ứng literal âm literal dương có cơng thức hội thuộc hồ sơ xung đột X • Với literal z Z+ Z− thống kê tần số xuất thành phần dương thành phần âm cơng thức hội thuộc hồ sơ X • Nếu có literal Z+ Z− xuất bán tồn đồng thuận thoả tiêu chuẩn P5 cho hồ sơ xung đột Gọi đồng thuận x∗ , x∗ + chứa literal xuất bán thành phần dương công thức hội thuộc hồ sơ X Tương tự, thành phần âm đồng thuận, x∗ − chứa literal xuất bán thành phần âm cơng thức hội thuộc X Tuy nhiên, có trường hợp mà literal xuất hai thành phần x∗ + x∗ − (do literal xuất bán thành phần dương âm công thức hội thuộc hồ sơ X) Để đảm bảo đồng thuận x∗ quán (thoả tiêu chuẩn P4), phải loại literal khỏi x∗ + x∗ − Giả sử z ∈ x∗ + ∩ x∗ − Bằng cách xem xét d+ = d∧ (x∗ + \ {z}, x∗ − ), X d− = d∧ (x∗ + , x∗ − \ {z}), X , d+ > d− loại z khỏi thành phần dương x∗ Trong trường hợp ngược lại, z bị loại khỏi thành phần âm x∗ Đồng thuận thu thoả tiêu chuẩn H5 (do thoả tiêu chuẩn H1 , H2 ), H4 H6 • Trong trường hợp khơng có literal xuất bán hai thành phần âm dương cơng thức hội ưu tiên tìm đồng thuận thoả tiêu chuẩn H3 hồ sơ xung đột: − Nếu Z+ ∩ Z− = ∅ x∗ = (Z+ , Z−) đồng thuận H3 hồ sơ 110 − Ngược lại, đồng thuận hồ sơ xung đột công thức chọn từ X có tổng khoảng cách đến công thức khác đạt cực tiểu Các ý tưởng thể Thuật toán 4.1: Thuật toán 4.1: Xác định đồng thuận từ hồ sơ gồm công thức hội Đầu vào: Hồ sơ xung đột X ∈ (Conj(L)), X = (xi + , xi − ) | i = 1, 2, , n; n ∈ N∗ , xi + ∩ xi − = ∅ ∀i = 1, 2, , n Đầu ra: Đồng thuận x∗ ∈ Conj(L) thoả nhiều tiêu chuẩn tập hợp {H1 , H2 , H3 , H4 , H5 , H6 } begin x+ ; Z− := Z+ := x∈X x− ; x∈X foreach z ∈ Z+ f + (z) := card{x ∈ X | x+ z}; foreach z ∈ Z− Bước Bước f − (z) := card{x ∈ X | x− z}; n x∗ + := {z ∈ Z+ | f + (z) ≥ }; n − ∗ − − x := {z ∈ Z | f (z) ≥ }; + − ∗ ∗ if (x ∪ x = ∅) then foreach z ∈ x∗ + ∩ x∗ − if d∧ (x∗ + \ {z}, x∗ − ), X < d∧ (x∗ + , x∗ − \ {z}), X then x∗ + := x∗ + \ {z}; else x∗ − := x∗ − \ {z}; else if (Z+ ∩ Z− = ∅) then Bước x∗ := (Z+ , Z− ); else Bước x∗ := x1 ; for i := to n if d∧ (x∗ , X) > d∧ (x, X) then x∗ := xi 111 Chứng minh tính thuật toán Theo cách hoạt động Thuật tốn 4.1, bắt đầu tìm đồng thuận thoả tiêu chuẩn H5 (phần (a)) Sau đó: (i) Nếu hai thành phần dương âm đồng thuận H5 rỗng, thuật tốn ưu tiên xét tìm đồng thuận thoả tiêu chuẩn H3 (phần (c)) hồ sơ X quán Trong trường hợp hồ sơ không quán, theo phần (d), chọn từ hồ sơ X phần tử có tổng khoảng cách đến phần tử lại hồ sơ cực tiểu Đồng thuận trường hợp luôn thoả tiêu chuẩn H4 (do xi công thức hội thoả xi + ∩ xi − = ∅, ∀i = 1, 2, , n, theo giả thiết) (ii) Nếu phần (a) xác định hai thành phần, phần dương âm đồng thuận khác rỗng, phải tìm cách làm mịn hai thành phần để đảm bảo tiêu chuẩn H4 thoả, đồng thời đảm bảo tổng khoảng cách từ đồng thuận đến phần tử hồ sơ cực tiểu Ngoài ra, tất trường hợp xử lý thuộc hai nhánh phân tích (i) (ii) trên, xây dựng x∗ + (tương ứng, x∗ − ) từ phần tử thuộc Z+ (tương ứng, Z− ) Vì đồng thuận ln ln thoả tiêu chuẩn H2 Đồng thuận luôn thoả tiêu chuẩn H1 xây dựng từ đồng thuận thoả tiêu chuẩn H5 , sau đó, phần tử bị loại phần tử có tần số xuất n Độ phức tạp Thuật toán 4.1 Với n lực lượng hồ sơ X, m = max card( x∈X x− ) Các x+ ), card( x∈X bước thuật tốn có độ phức tạp sau: • Bước khởi tạo: thống kê tần số xuất literal thành phần công thức hội hồ sơ Độ phức tạp thủ tục O(m.n.m) = O(n.m2 ) • Bước dùng để tạo tập hợp khởi đầu cho x∗ + , x∗ − dựa tần số xuất literal Độ phức tạp bước O(m) • Trong Bước 2, với literal chung z x∗ + x∗ − , so sánh 112 khoảng cách với X loại bỏ z hai thành phần để tìm thành phần tốt Độ phức tạp bước O(m.n.m2 ) = O(n.m3 ) • Bước kiểm tra giao hai tập hợp Z+ , Z− , có độ phức tạp O(m2 ) • Bước tính khoảng cách công thức hội x với hồ sơ xung đột X (để tìm cơng thức hội đạt cực tiểu khoảng cách đến X) Độ phức tạp bước O(n.n.m2 ) = O(n2 m2 ) Sau bước khởi tạo Bước 1, thuật toán thực ba bước: Bước Bước Bước Độ phức tạp thuật toán tương ứng cho ba trường hợp là: • O(max{n.m2 , m, n.m3 }) = O(n.m3 ) • O(max{n.m2 , m, m2 }) = O(n.m2 ) • O(max{n.m2 , m, n2 m2 }) = O(n2 m2 ) Như vậy, độ phức tạp thuật toán O(max{n.m3 , n.m2 , n2 m2 }) Nếu m < n độ phức tạp thuật toán O(n2 m2 ) Trong trường hợp cịn lại, độ phức tạp thuật tốn O(n.m3 ) Ví dụ minh hoạ cho Thuật tốn 4.1 Sử dụng ký hiệu L = {t1 , t2 , t3 , t4 } để biểu diễn tính chất thuộc tính hasSpouse Ví dụ 4.1, tác tử a1 , a2 , , a6 đưa ý kiến dạng công thức hội Bảng 4.2 bên Chúng ta áp dụng Thuật tốn 4.1 để tìm tri thức đồng thuận từ ý kiến tác tử Hồ sơ X thành lập gồm công thức hội sau: X = ({t1 , t3 , t4 }, {t2 }), ∗ ({t1 }, {t3 , t4 }), ({t1 }, {t3 }), ({t3 }, {t1 }), ({t3}, ∅) Sau bước (a) thuật tốn, có: x∗ + = {t1 , t3 } x∗ − = {t3 , t4 } Do x∗ + ∪ x∗ − = ∅ nên tìm cách loại literal chung hai thành phần đồng thuận (theo bước (b)): Với x∗ + ∩ x∗ − = {t3 }, ta xét hai tổng khoảng cách sau đây: d∧ ({t1 }, {t3 , t4 }), X d∧ ({t1 , t3 }, {t4 }), X 113 Bảng 4.2: Trạng thái tri thức tác tử cho toán minh hoạ Tác tử Trạng thái tri thức a1 t1 ∧ ¬t2 ∧ t3 ∧ t4 a2 t1 ∧ ¬t3 ∧ ¬t4 a3 t1 ∧ ¬t3 a4 t1 ∧ ¬t3 ∧ ¬t4 a5 ¬t1 ∧ t3 ∧ ¬t4 a6 t3 Với ý card(L) = 4, ta tính: d∧ ({t1 }, {t3 , t4 }), ({t1 , t3 , t4 }, {t2 }) card({t1 } {t1 , t3 , t4 }) card({t3 , t4 } = + 4 = Tương tự, • d∧ ({t1 }, {t3 , t4 }), ({t1 }, {t3 , t4 }) = • d∧ ({t1 }, {t3 , t4 }), ({t1 }, {t3 }) = • d∧ ({t1 }, {t3 , t4 }), ({t3 }, {t1 , t4 }) = • d∧ ({t1 }, {t3 , t4 }), ({t3 }, ∅) = 8 • d∧ ({t1 , t3 }, {t4 }), ({t1 , t3 , t4 }, {t2 }) = • d∧ ({t1 , t3 }, {t4 }), ({t1 }, {t3 , t4 }) = • d∧ ({t1 , t3 }, {t4 }), ({t1 }, {t3 }) = • d∧ ({t1 , t3 }, {t4 }), ({t3 }, {t1 , t4 }) = • d∧ ({t1 , t3 }, {t4 }), ({t3 }, ∅) = 8 Như vậy: 114 {t2 }) 4 15 +2∗0+ + + = 8 8 2 13 • d∧ ({t1 , t3 }, {t4 }), X = + ∗ + + + = 8 8 8 13 15 Do d∧ ({t1 , t3 }, {t4 }), X = < = d∧ ({t1 }, {t3 , t4 }), X nên ta định loại 8 t3 khỏi x∗ − • d∧ ({t1 }, {t3 , t4 }), X = Cuối cùng, đồng thuận hồ sơ X ({t1 , t3 }, {t4 }), t1 ∧ t3 ∧ ¬t4 4.2 Xử lý xung đột mức tiên đề q trình tích hợp ontology Một ontology xem xét tập tiên đề biểu diễn tri thức lĩnh vực cụ thể Nếu dùng literal để biểu diễn tiên đề ontology, tri thức ontology biểu diễn dạng công thức hội literal Chính vậy, khơng qn tập tiên đề ontology biểu diễn hồ sơ xung đột công thức hội literal Với nhận xét này, toán xử lý xung đột mức tiên đề q trình tích hợp ontology giải dựa kết Mục 4.1 Xét n (n ∈ N∗ ) ontology O1 , O2 , , On , ontology Oi (i = 1, 2, , n) biểu diễn bốn Ci , Ii , Ri , Zi , với: • Ci tập khái niệm ontology Oi • Ii tập cá thể ontology Oi • Ri tập mối quan hệ ontology Oi • Zi = {z1i , z2i , , zni i } tập tiên đề ontology Oi , gồm ni tiên đề Ontology Oi (i = 1, 2, , n) thể trạng thái tri thức biểu diễn công thức z1i ∧ z2i ∧ · · · ∧ zni i Việc tích hợp n ontology O1 , O2 , , On hiểu tìm tập tiên đề đại diện cho n tập tiên đề Z1 , Z2 , , Zn Gọi Z := {t1 , t2 , , tm } (m ∈ N∗ ) tập literal cho tiên đề ontology Oi (i = 1, 2, , n) biểu diễn dạng literal phủ định literal Z: ∀α ∈ Zi (i = 1, 2, , n), ∃t ∈ Z : (t ≡ α) ∨ (¬t ≡ α) Với tập hợp Z này, xem ontology Oi trạng thái tri thức biểu diễn công thức hội xi ∈ Conj(Z) với xi ≡ z1i ∧z2i ∧· · ·∧zni i Như vậy, với n ontology O1 , O2 , , On lập hồ sơ 115 X = {x1 , x2 , , xn } xi ≡ z1i ∧ z2i ∧ · · · ∧ zni i Đồng thuận x∗ hồ sơ X xác định Thuật toán 4.1 tập tiên đề tốt mặt cú pháp từ ontology cho Tuy nhiên, x∗ khơng qn mặt ngữ nghĩa Đối với trường hợp này, khắc phục chọn Z1 , Z2 , , Zn tập tiên đề sai khác so với x∗ (tập tiên đề có tổng khoảng cách đến x∗ đạt cực tiểu) Từ phân tích nêu trên, luận án đề xuất Thuật toán 4.2 xác định đồng thuận mặt cú pháp tập tiên đề Z1 , Z2 , , Zn Ý tưởng thuật tốn sau: • Xây dựng tập literal Z cho tập tiên đề ontology biểu diễn dạng cơng thức hội Conj(Z) • Với tập tiên đề Zi , (i = 1, 2, , n), cho bổ sung α ∈ L α hệ logic tập tiên đề Zi (nghĩa là, α suy từ tập hợp tiên đề Zi ) Tương tự vậy, bổ sung ¬α vào tập tiên đề Zi ¬α hệ logic tập tiên đề Zi Việc bổ sung tiên đề α ¬α vào tập Zi để đảm bảo tính tần suất xuất thực tiên đề tiềm ẩn ontology Điều quan trọng thuật tốn xác định đồng thuận (Thuật tốn 4.1) có xét đến tần suất xuất literal công thức hội thuộc hồ sơ xung đột Chẳng hạn, β ∧ γ ⇒ α xem tập tiên đề {β, γ} có chứa tiên đề α • Thành lập hồ sơ xung đột X ∈ Conj(Z) từ n tập tiên đề ontology O1 , O2 , , On : X = {Z1 , Z2 , , Zn } • Sử dụng Thuật toán 4.1 để xây dựng đồng thuận x∗ hồ sơ X Nếu x∗ quán kết luận x∗ tập tiên đề tốt nhất, ngược lại, tìm Zi (i = 1, 2, , n) cho tập tiên đề có khoảng cách nhỏ đến x∗ kết luận tập tiên đề tốt 116 Nội dung thuật tốn trình bày cụ thể sau: Thuật tốn 4.2: Xác định tập tiên đề đồng thuận ontology Đầu vào: Ontology O1 , O2 , , On với tập tiên đề Z1 , Z2 , , Zn (n ∈ N∗ ) Đầu ra: Tập tiên đề x∗ đại diện tốt cho tập tiên đề ontology O1 , O2 , , On begin Bước Z := ∅; foreach Oi ∈ {O1 , O2 , , On } foreach α ∈ Zi needAdd := true; foreach z ∈ Z if (z ≡ α) or (¬z ≡ α) then needAdd := f alse; break; if (needAdd = true) then Z := Z ∪ {α}; Bước foreach Oi ∈ {O1 , O2 , , On } foreach z ∈ Z \ Zi if (Zi |= z) then Zi := Zi ∪ {z}; if (Zi |= ¬z) then Zi := Zi ∪ {¬z}; Bước Lập hồ sơ xung đột X := {x1 , x2 , , xn } với xi ∈ Conj(Z) biểu diễn trạng thái tri thức tương ứng tập tiên đề Zi ontology Oi ; Bước Xác định x∗ đồng thuận hồ sơ xung đột X theo Thuật toán 4.1; Bước if (x∗ quán) then Z∗ := x∗ ; else Z∗ := Z1 ; foreach Z ∈ {Z2 , Z3 , , Zn } if η(x∗ , Z ) < η(x∗ , Z∗ ) then Z∗ := Z ; 117 Chúng ta phân tích độ phức tạp Thuật tốn 4.2 Gọi: • m = card(Z) số lượng literal dùng để biểu diễn tiên đề ontology đầu vào; • O(f (m)) độ phức tạp thuật tốn lập luận với ontology có chứa m tiên đề Độ phức tạp bước thuật tốn xác định sau: • Bước dùng để xác định tập hợp Z, tập cực tiểu literal mà dùng để biểu diễn tiên đề ontology Oi (i = 1, 2, , n) Độ phức tạp bước O(n.m2 ) • Trong Bước 2, với ontology Oi , xem xét bổ sung tiên đề z ∈ Z z hệ logic tập tiên đề Zi (kiểm tra xem z suy từ tập hợp tiên đề Zi hay không) Độ phức tạp bước O n.m.f (m) • Bước lập hồ sơ xung đột X có độ phức tạp O(n) • Bước xác định đồng thuận hồ sơ công thức hội X với n công thức hội sử dụng m literal cách sử dụng Thuật toán 4.1 Độ phức tạp bước O max{n.m3 , n2 m2 } • Bước thuật tốn kiểm tra qn x∗ tìm Nếu x∗ khơng qn, thuật tốn phải duyệt qua n tập tiên đề để tìm tập tiên đề có tổng khoảng cách đến tập tiên đề lại đạt cực tiểu − Độ phức tạp thủ tục kiểm tra quán tập tiên đề tương ứng với x∗ O(f (m)) − Độ phức tạp thủ tục tìm tập tiên đề có khoảng cách cực tiểu đến tập tiên đề cịn lại O(n.m2 ) Do đó, độ phức tạp Bước O(max{f (m), n.m2 }) Các bước nêu thuật toán thực Do độ phức tạp thuật tốn là: O max n.m2 , n.m.f (m), n, n.m3 , n2 m2 , f (m), n.m2 = O max n.m.f (m), n.m3 , n2 m2 118 Độ phức tạp thuật tốn lập luận ontology có m tiên đề (chẳng hạn HermiT [55], Pellet [56]) lớn so với O(m2 ) Do độ phức tạp thuật tốn viết lại thành O max{n.m.f (m), n2 m2 } : Nếu f (m) < n.m độ phức tạp thuật toán O(n2 m2 ), ngược lại thuật tốn có độ phức tạp O(n.m.f (m)) 4.3 Tiểu kết Chương Trong chương này, luận án trình bày mơ hình xác định đồng thuận tri thức biểu diễn dạng hội literal Sau định nghĩa khoảng cách hai tập hợp (là tập tập ký hiệu L cho trước), luận án phân tích tính chất chứng minh số định lý thể mối quan hệ tiêu chuẩn xác định đồng thuận hồ sơ cơng thức hội Trên sở luận án đề xuất thuật toán xác định đồng thuận hồ sơ cơng thức hội Từ mơ hình xác định đồng thuận tri thức biểu diễn dạng hội literal , luận án đề xuất phương pháp xử lý xung đột cấp độ cú pháp q trình tích hợp ontology Phương pháp áp dụng để hỗ trợ xác định phiên tốt từ đóng góp tác tử phân tán trình xây dựng ontology dạng cộng tác [61] Kết chương trình bày Hội thảo Artificial Intelligence in Theory and Practice IV (2015) [CT4] đăng tạp chí Khoa học Đại học Huế (2015) [CT3] 119 KẾT LUẬN Kết luận Ontology thành phần quan trọng tảng ứng dụng web ngữ nghĩa Đặc trưng mở rộng, tái sử dụng ontology mặt giúp hệ thống trao đổi chia sẻ tri thức, mặt khác tiềm ẩn khả làm xuất tri thức không quán Xử lý tri thức khơng qn nói chung xử lý tri thức khơng qn ontology nói riêng tốn phức tạp khoa học máy tính Hai tình điển hình xử lý tri thức không quán ontology là: (1) xác định kết có nghĩa truy vấn với ontology khơng qn, (2) tích hợp ontology khơng qn đến từ nhiều nguồn độc lập Luận án đề xuất phương án giải cho hai tình nêu Các kết luận án tóm tắt sau: 1) Xây dựng hàm chọn sO Sem dựa khoảng cách ngữ nghĩa theo ontology tham chiếu áp dụng hàm chọn vào khung lập luận với ontology không quán Kết thực nghiệm việc áp dụng hàm chọn sO Sem vào khung lập luận với ontology không quán giúp trả nhiều kết xác định so với hàm chọn cơng bố trước Trong q trình xây dựng hàm chọn, Luận án trình bày phương pháp quy hoạch động để tính khoảng cách ngữ nghĩa theo ontology tham chiếu hai biểu thức khái niệm, đồng thời phân loại trình bày cách xác định tập biểu thức khái niệm tiên đề ontology OWL – ngôn ngữ ontology thông dụng chuẩn hoá tổ chức W3C [CT6] 2) Xây dựng phương pháp đồng thuận để xử lý xung đột mức khái niệm q trình tích hợp ontology Cấu trúc khái niệm đồng thuận xác định với danh sách thuộc tính miền giá trị thuộc tính tương ứng Luận án đề xuất thuật tốn chứng minh tính thoả tiêu chuẩn đồng thuận xây dựng thuật toán Luận án trình bày 120 phương pháp xây dựng hàm đánh giá khoảng cách cho miền giá trị thuộc tính kiểu liệu thuộc tính đối tượng ontology OWL [CT1, CT2, CT5] 3) Xây dựng phương pháp đồng thuận để xử lý xung đột cấp độ cú pháp q trình tích hợp tri thức Luận án đề xuất sử dụng phương pháp tính khoảng cách hai tập ký hiệu, khoảng cách hai cấu trúc hội literal chứng minh số mối quan hệ tiêu chuẩn đồng thuận dựa theo khoảng cách Trên sở đó, luận án đề xuất thuật toán xác định đồng thuận hồ sơ xung đột gồm cấu trúc hội Bằng cách áp dụng thuật tốn tìm đồng thuận hồ sơ xung đột gồm cấu trúc hội literal , luận án đề xuất phương án để xử lý xung đột mức tiên đề trình tích hợp ontology [CT3, CT4] Những vấn đề cần tiếp tục nghiên cứu Kết luận án mở rộng theo hướng sau đây: • Nghiên cứu thêm dạng truy vấn khác với ontology không quán, đặc biệt truy vấn SPARQL với ontology OWL khơng qn • Xét thêm mối quan hệ literal trình xử lý xung đột cấp độ cú pháp • Đề xuất khung xử lý xung đột tri thức ontology Khung xử lý áp dụng chiến lược khác cho tác vụ khác với ontology: tích hợp, truy vấn, tiến hố ontology 121 DANH MỤC CÁC CƠNG TRÌNH CỦA TÁC GIẢ LIÊN QUAN ĐẾN LUẬN ÁN CT1 Nguyễn Văn Trung, Phan Bá Trí, Hồng Hữu Hạnh Tích hợp ontology với tiếp cận lý thuyết đồng thuận Tạp chí Tin học Điều khiển học T.30, S.3 (2014), 239-252 CT2 Trung Van Nguyen, Hanh Huu Hoang A Consensus-based Method for Solving Conceptlevel Conflict in Ontology Integration, In Proceeding of 6th International Conference on Computational Collective Intelligence Technologies and Applications, Seoul, Korea, 2014, LNCS 8733, Springer (2014) p414-423 CT3 Nguyễn Văn Trung, Hoàng Hữu Hạnh Một phương pháp xử lý không quán tri thức mức cú pháp Tạp chí Khoa học Đại học Huế, T.106, S.7 (2015), 241-251 CT4 Trung Van Nguyen, Jason J Jung, Hanh Huu Hoang A Novel Approach for Resolving Knowledge Inconsistency on Ontology Syntactic Level In Proceeding of Artificial Intelligence in Theory and Practice IV (IFIP Advances in Information and Communication Technology), Springer (2015) p39-49 CT5 Trung Van Nguyen, Hanh Huu Hoang A Consensus-Based Method for Solving ConceptLevel Conflict in Ontology Integration Transactions of Computational Collective Intelligence XXII, LNCS 9655, Springer (2016) p106-124 CT6 Nguyễn Văn Trung, Hoàng Hữu Hạnh Một phương pháp truy vấn ontology không quán sử dụng độ liên quan ngữ nghĩa Tạp chí Khoa học Cơng nghệ Trường Đại học Khoa học, Đại học Huế, T.9 S.1 (2017), 51-62 122 ... luận án ontology, tri thức không quán ontology, phương pháp xử lý tri thức không quán ontology Trên sở phân tích động lực nghiên cứu, luận án xác định mục tiêu xử lý tri thức không quán ontology. .. Các phương pháp xử lý tri thức khơng qn ontology phân làm hai nhóm: (1) nhóm phương pháp chấp nhận tồn tri thức không quán ontology, (2) nhóm phương pháp tìm cách loại bỏ tri thức khơng quán. .. TỔNG QUAN VỀ XỬ LÝ TRI THỨC KHÔNG NHẤT 1.1 1.2 QUÁN TRONG ONTOLOGY Ontology tri thức không quán Khung lập luận với ontology không quán sử dụng chiến lược phát 9 tri? ??n tuyến tính