Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 121 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
121
Dung lượng
1,02 MB
Nội dung
ĐẠI HỌC HUẾ TRƯỜNG ĐẠI HỌC KHOA HỌC TRẦN THANH LƯƠNG HỌC KHÁI NIỆM CHO CÁC HỆ THỐNG THÔNG TIN DỰA TRÊN LOGIC MÔ TẢ LUẬN ÁN TIẾN SĨ MÁY TÍNH HUẾ, NĂM 2015 ĐẠI HỌC HUẾ TRƯỜNG ĐẠI HỌC KHOA HỌC TRẦN THANH LƯƠNG HỌC KHÁI NIỆM CHO CÁC HỆ THỐNG THÔNG TIN DỰA TRÊN LOGIC MÔ TẢ CHUYÊN NGÀNH: KHOA HỌC MÁY TÍNH Mà SỐ: 62.48.01.01 LUẬN ÁN TIẾN SĨ MÁY TÍNH Người hướng dẫn khoa học: PGS TSKH NGUYỄN ANH LINH TS HOÀNG THỊ LAN GIAO HUẾ, NĂM 2015 LỜI CAM ĐOAN Tôi xin cam đoan cơng trình nghiên cứu tơi thực hướng dẫn PGS TSKH Nguyễn Anh Linh TS Hoàng Thị Lan Giao Những nội dung cơng trình cơng bố chung với tác giả khác đồng ý đồng tác giả đưa vào luận án Các số liệu kết nghiên cứu trình bày luận án trung thực, khách quan chưa công bố tác giả cơng trình khác Nghiên cứu sinh Trần Thanh Lương i LỜI CẢM ƠN Luận án thực hoàn thành Khoa Công nghệ Thông tin, Trường Đại học Khoa học, Đại học Huế Trong suốt trình học tập, nhận quan tâm, giúp đỡ thầy giáo, cô giáo hướng dẫn, thầy cô giáo Ban chủ nhiệm Khoa Cơng nghệ Thơng tin, Phịng Đào tạo Sau đại học Ban giám hiệu Trường Đại học Khoa học Tơi xin bày tỏ lịng biết ơn sâu sắc đến PGS TSKH Nguyễn Anh Linh TS Hoàng Thị Lan Giao, người Thầy tận tình hướng dẫn, động viên truyền đạt kinh nghiệm quý báu nghiên cứu khoa học để hồn thành luận án Tơi xin chân thành cảm ơn Quý thầy cô giáo Ban chủ nhiệm Khoa Công nghệ Thông tin tạo điều kiện thuận lợi cơng tác để tơi có đủ thời gian cho cơng việc nghiên cứu Tơi xin cảm ơn Q thầy cán Phịng Đào tạo Sau Đại học, Ban giám hiệu Trường Đại học Khoa học giúp đỡ tơi việc hồn thành kế hoạch học tập Tôi xin trân trọng cảm ơn GS TSKH Andrzej Szalas, PGS TS Hà Quang Thụy, PGS TSKH Nguyễn Hùng Sơn giúp đỡ đóng góp nhiều ý kiến q báu q trình nghiên cứu cơng bố cơng trình khoa học Tơi xin trân trọng cảm ơn PGS TS Lê Mạnh Thạnh đọc đưa góp ý cho luận án Tôi xin cảm ơn Quý thầy cô giáo anh chị đồng nghiệp Khoa Công nghệ Thông tin giúp đỡ, chia sẻ q trình cơng tác, học tập, nghiên cứu thực luận án Tơi xin cảm ơn bạn bè động viên đặc biệt người thân gia đình ln ln quan tâm, ủng hộ tạo điều kiện thuận lợi cho tơi hồn thành luận án Nghiên cứu sinh Trần Thanh Lương ii MỤC LỤC Lời cam đoan Lời cảm ơn Mục lục Danh mục từ viết tắt Danh mục ký hiệu Danh mục bảng, biểu Danh mục hình vẽ Mở đầu Chương Logic mô tả sở tri thức 1.1 Tổng quan logic mô tả 1.1.1 Giới thiệu 1.1.2 Ngôn ngữ logic mô tả ALC 1.1.3 Biểu diễn tri thức 1.1.4 Khả biểu diễn 1.1.5 Logic mô tả tên gọi 1.2 Cú pháp ngữ nghĩa logic mô tả 1.2.1 Logic mô tả ALC reg 1.2.2 Ngôn ngữ logic mô tả LΣ,Φ 1.3 Các dạng chuẩn 1.3.1 Dạng chuẩn phủ định khái niệm 1.3.2 Dạng chuẩn lưu trữ khái niệm 1.3.3 Dạng chuẩn nghịch đảo vai trò 1.4 Cơ sở tri thức logic mô tả 1.4.1 Bộ tiên đề vai trò 1.4.2 Bộ tiên đề thuật ngữ 1.4.3 Bộ khẳng định cá thể 1.4.4 Cơ sở tri thức mơ hình sở tri thức 1.5 Suy luận logic mô tả 1.5.1 Giới thiệu 1.5.2 Các thuật toán suy luận Tiểu kết Chương Chương Mô hai chiều logic mơ tả tính bất 2.1 Giới thiệu 2.2 Mô hai chiều 2.2.1 Khái niệm iii biến i ii iii v vi vii viii 7 11 13 16 17 17 18 21 21 22 23 24 24 25 25 26 29 29 30 32 33 33 34 34 2.2.2 Quan hệ tương tự hai chiều quan hệ tương đương 2.3 Tính bất biến mơ hai chiều 2.3.1 Quan hệ mô hai chiều với khái niệm vai trò 2.3.2 Tính bất biến khái niệm 2.3.3 Tính bất biến sở tri thức 2.4 Tính chất Hennessy-Milner mơ hai chiều 2.5 Tự mô hai chiều Tiểu kết Chương Chương Học khái niệm cho hệ thống thông tin logic mô tả 3.1 Hệ thống thông tin 3.1.1 Hệ thống thông tin truyền thống 3.1.2 Hệ thống thông tin dựa logic mô tả 3.2 Học khái niệm logic mô tả với Ngữ cảnh (3) 3.2.1 Giới thiệu toán 3.2.2 Bộ chọn 3.2.3 Tính đơn giản khái niệm 3.2.4 Độ đo dựa entropy 3.2.5 Thuật tốn học khái niệm logic mơ tả với Ngữ cảnh (3) 3.3 Ví dụ minh họa 3.4 Kết thực nghiệm Tiểu kết Chương Chương Học khái niệm cho sở tri thức logic mô tả 4.1 Giới thiệu 4.2 Phân hoạch miền diễn dịch 4.3 Học khái niệm logic mô tả với Ngữ cảnh (1) 4.3.1 Thuật toán BBCL 4.3.2 Thuật toán dual-BBCL 4.3.3 Tính đắn thuật toán BBCL 4.3.4 Ví dụ minh họa 4.4 Học khái niệm logic mô tả với Ngữ cảnh (2) 4.4.1 Thuật toán BBCL2 4.4.2 Tính đắn thuật toán BBCL2 4.4.3 Ví dụ minh họa Tiểu kết Chương Kết luận Danh mục cơng trình tác giả Tài liệu tham khảo iv 40 42 42 47 48 50 54 56 57 57 57 58 61 61 63 68 70 71 74 80 84 86 86 88 91 91 94 94 95 98 98 100 101 103 104 106 107 DANH MỤC TỪ VIẾT TẮT Từ viết tắt ABox Diễn giải Assertion Box Bộ khẳng định cá thể BBCL Bisimulation-Based Concept Learning Học khái niệm dựa mô hai chiều CWA Close World Assumption Giả thiết giới đóng LCS Least Common Subsumers Bao hàm chung nhỏ OWA Open World Assumption Giả thiết giới mở OWL Web Ontology Language Ngôn ngữ Web Ontology PAC Probably Approximately Correct Khả học xác RBox Role Box Bộ tiên đề vai trò TBox Terminology Box Bộ tiên đề thuật ngữ W3C World Wide Web Consortium Tổ chức tiêu chuẩn quốc tế World Wide Web v DANH MỤC CÁC KÝ HIỆU Ký hiệu Diễn giải ý nghĩa A, B Các thuộc tính/tên khái niệm C, D Các khái niệm r, s Các tên vai trò đối tượng R, S Các vai trò đối tượng a, b Các cá thể c, d Các phần tử thuộc miền giá trị σ, % Các vai trò liệu range(A) Miền giá trị thuộc tính A range(σ) Miền giá trị vai trò liệu σ † Σ, Σ Các tập ký tự logic mô tả ΣI , Σ†I ΣC , Σ†C ΣA , Σ†A ΣdA , Σ†dA ΣnA , Σ†nA ΣoR , Σ†oR ΣdR , Σ†dR † Các tập tên cá thể Φ, Φ Các tập đặc trưng logic mô tả ∼Σ† ,Φ† ,I Quan hệ LΣ† ,Φ† -tự mô hai chiều lớn Các tập tên khái niệm Các tập thuộc tính Các tập thuộc tính rời rạc Các tập thuộc tính số Các tập tên vai trò đối tượng Các tập vai trò liệu diễn dịch I ≡Σ† ,Φ† ,I Quan hệ LΣ† ,Φ† -tương đương diễn dịch I Ref Khẳng định vai trò phản xạ Irr Khẳng định vai trị khơng phản xạ Sym Khẳng định vai trò đối xứng Tra Khẳng định vai trị bắc cầu Dis Khẳng định vai trị khơng giao R Bộ tiên đề vai trò T Bộ tiên đề thuật ngữ A Bộ khẳng định cá thể KB Cơ sở tri thức logic mô tả vi DANH MỤC BẢNG, BIỂU Bảng 3.1 Kết ước lượng tập liệu WebKB, PokerHand Family với 100 khái niệm ngẫu nhiên logic mô tả ALCIQ Bảng 3.2 Kết ước lượng tập liệu Family với khái niệm phổ biến 81 logic mô tả ALCI Bảng 3.3 Kết ước lượng tập liệu Poker Hand với tập đối tượng 82 logic mô tả ALCQ 83 vii DANH MỤC HÌNH VẼ Hình 1.1 Hình 1.2 Hình 1.3 Hình 1.4 Diễn dịch logic mô tả Kiến trúc hệ sở tri thức logic mô tả Diễn dịch vai trò phức khái niệm phức Một minh họa cho sở tri thức Ví dụ 1.9 11 21 27 Hình 2.1 Các diễn dịch I I LΣ,Φ Ví dụ 1.10 42 Hình 3.1 Hình 3.2 Hình 3.3 Hình 3.4 Hình 3.5 Hình 3.6 60 76 77 78 79 79 Một minh họa cho sở tri thức Ví dụ 3.2 Q trình làm mịn phân hoạch Ví dụ 3.5 Quá trình làm mịn phân hoạch Ví dụ 3.6 Hệ thống thông tin tương ứng với sở tri thức Ví dụ 3.7 Quá trình làm mịn phân hoạch sử dụng chọn đơn giản Quá trình làm mịn phân hoạch sử dụng chọn đơn giản mở rộng Hình 4.1 Quá trình làm mịn phân hoạch Ví dụ 4.1 Hình 4.2 Q trình làm mịn phân hoạch Ví dụ 4.2 viii 90 91 (Year < 2008) u (Year < 2007) u ∃cited_by.((Year ≥ 2008) u (Year ≥ 2010)), C9 ≡ (Year < 2008) u (Year < 2007) u¬∃cited_by.((Year ≥ 2008)u(Year ≥ 2010)) (Xem q trình phân hoạch Ví dụ 4.2) Vì Y4 ⊆ E + nên ta tiến hành xem xét C4 ≡ (Year < 2008) u (Year ≥ 2007) Vì KB |= ¬C4 (a) với a ∈ E − nên ta thêm C4 vào C Do đó, ta có C = {C4 } Vì Y8 ⊆ E + nên ta tiến hành xem xét C8 ≡ (Year < 2008) u (Year < 2007) u ∃cited_by.((Year ≥ 2008) u (Year ≥ 2010)) Vì KB |= ¬C8 (a) với F a ∈ E − C8 không bị bao hàm C dựa KB nên ta thêm C8 vào C F Do đó, ta có C = {C4 , C8 } C ≡ C4 t C8 F F Vì KB |= ( C)(a) với a ∈ E + ta có C ≡ C ≡ [(Year < 2008) u (Year ≥ 2007)] t [(Year < 2008) u (Year < 2007) u ∃cited_by.((Year ≥ 2008) u (Year ≥ 2010))] Chuẩn hóa khái niệm C ta C ≡ (Year < 2008) u [(Year ≥ 2007) t ∃cited_by.(Year ≥ 2010)] Đơn giản khái niệm C ta kết trả Crs ≡ (Year < 2008) u ∃cited_by.(Year ≥ 2010) Khái niệm Crs thỏa mãn điều kiện KB |= Crs (a) với a ∈ E + KB |= ¬Crs với a ∈ E − Ví dụ 4.6 Chúng ta xem xét thuật toán dual-BBCL Ví dụ 4.5 hai tập E + E − hoán đổi cho Nghĩa E + = {P1 , P2 , P3 , P5 } E − = {P4 , P6 } Thuật toán dual-BBCL thực ba bước Ví dụ 4.5 bước sau: Vì Y6 ⊆ E + nên ta tiến hành xem xét C6 ≡ (Year ≥ 2008) u (Year ≥ 2010) Vì KB |= ¬C6 (a) với a ∈ E − nên ta thêm C6 vào C Do đó, ta có C = {C6 } Vì Y7 ⊆ E + nên ta tiến hành xem xét C7 ≡ (Year ≥ 2008) u (Year < F 2010) Vì KB |= ¬C7 (a) với a ∈ E − C7 không bị bao hàm C dựa F KB nên ta thêm C7 vào C Do đó, ta có C = {C6 , C7 } C ≡ C6 t C7 Vì Y9 ⊆ E + nên ta tiến hành xem xét C9 ≡ (Year < 2008) u (Year < 2007) u ¬∃cited_by.((Year ≥ 2008) u (Year ≥ 2010)) Vì KB |= ¬C9 (a) với F a ∈ E − C9 không bị bao hàm C dựa KB nên ta thêm C9 vào C F Do đó, ta có C = {C6 , C7 , C9 } C ≡ C6 t C7 t C9 F F Vì KB |= ( C)(a) với a ∈ E + ta có C ≡ C ≡ [(Year ≥ 2008) u (Year ≥ 2010)] t [(Year ≥ 2008) u (Year < 2010)] t [(Year < 2008) u (Year < 2007) u 97 ¬∃cited_by.((Year ≥ 2008) u (Year ≥ 2010))] Chuẩn hóa đơn giản khái niệm C ta kết trả Crs ≡ (Year ≥ 2008) t ¬∃cited_by.(Year ≥ 2010) Nếu muốn lấy kết Ví dụ 4.5 lấy phủ định khái niệm Crs kết trả ¬Crs ≡ ¬[(Year ≥ 2008) t ¬∃cited_by.(Year ≥ 2010)] ≡ (Year < 2008) u ∃cited_by.(Year ≥ 2010) 4.4 Học khái niệm logic mô tả với Ngữ cảnh (2) 4.4.1 Thuật toán BBCL2 Bài toán học khái niệm cho sở tri thức logic mô tả với Ngữ cảnh (2) tương tự toán học khái niệm cho sở tri thức với Ngữ cảnh (1) Điểm khác điều kiện thứ hai thay điều kiện yếu Cụ thể, khái niệm C thỏa mãn điều kiện sau: • KB |= C(a) với a ∈ E + , • KB 6|= C(a), với a ∈ E − E + chứa mẫu dương E − chứa mẫu âm khái niệm C Chúng đề xuất Thuật toán BBCL2 để giải toán học khái niệm cho sở tri thức logic mơ tả với Ngữ cảnh (2) Thuật tốn dựa Thuật toán dual-BBCL với ý tưởng sử dụng mơ hình KB mơ hai chiều mơ hình để tìm kiếm khái niệm C Tương tự Thuật toán BBCL, Hàm partition sử dụng để làm mịn phân hoạch {∆I } diễn dịch I mơ hình KB nhằm đạt phân hoạch quán với tập đối tượng cần học E = hE + , E − i cho trước Thuật toán BBCL2 tiến hành xây dựng tập E0− mở rộng cho E0− phủ lúc nhiều cá thể E − , tập C gồm phần khái niệm D cho KB |= D(a) với a ∈ E + tập C0 gồm khái niệm để trợ giúp cho việc xây dựng tập C Khi khái niệm D không thỏa mãn điều kiện KB |= D(a) với a ∈ E + khái niệm ứng viên “tốt” khái niệm D đưa vào C0 Sau này, cần thiết, khái niệm C0 lấy ra, thực phép hợp kiểm tra xem có thỏa mãn điều kiện để thêm vào C hay không Như vậy, trình học ln có: d • KB |= ( C)(a) với a ∈ E + , 98 Thuật toán 4.2: BBCL2 - Học khái niệm logic mô tả với Ngữ cảnh (2) Input : KB, Σ† , Φ† , E = hE + , E − i, k Output: Khái niệm C cho: • KB |= C(a) với a ∈ E + , • KB 6|= C(a) for all a ∈ E − C := ∅; C0 := ∅; E0− := ∅; while not (too hard to extend C) (E0− 6= E − ) Xây dựng mơ hình hữu hạn (tiếp theo) I KB I = I|k0 với I mơ hình vô hạn KB; Y :=partition (I, Σ† , Φ† , E); foreach Yij ∈ Y cho ∃a ∈ E −: aI ∈ Yij ∀a ∈ E +: aI 6∈ Yij /* phân hoạch ∆I theo Hàm partition */ if (KB |= ¬Cij (a) với a ∈ E + ) then d if (KB 6|= ( C v ¬Cij )) then C := C ∪ {¬Cij }; E0− := E0− ∪ {a ∈ E − | aI ∈ Yij }; else 10 C0 := C0 ∪ {¬Cij }; 11 12 13 14 15 while not (too hard to extend C) (E0− 6= E − ) D := D1 t D2 t · · · t Dl , với D1 , D2 , , Dl chọn ngẫu nhiên từ C0 ; if (KB |= D(a) với a ∈ E + ) then d d if (KB 6|= ( C) v D) (∃a ∈ E − \ E0− : KB 6|= ( C u D)(a)) then 16 C := C ∪ {D}; 17 d E0− := E0− ∪ {a | a ∈ E − \ E0− , KB 6|= ( C)(a)}; 18 19 20 if (E0− = E − ) then foreach (D ∈ C) d if (KB 6|= (C \ {D})(a) với a ∈ E − ) then C := C \ {D}; 21 d 22 C := 23 return Crs := simplify (C); 24 25 C; /* rút gọn khái niệm C */ else return failure; 99 d • KB 6|= ( C)(a) với a ∈ E0− d Thuật toán mở rộng C cho KB 6|= ( C)(a) với lúc nhiều a ∈ E − Như vậy, mở rộng C đồng nghĩa với việc mở rộng E0− Khi E0− = E − thuật toán trả d khái niệm C sau thực việc chuẩn hóa đơn giản hóa Tương tự thuật toán BBCL, điều kiện “not (too hard to extend C)” Bước 12 thuật toán BBCL2 khác Điều kiện Bước phụ thuộc vào kết làm mịn phân hoạch miền diễn dịch I, điều kiện Bước 12 phụ thuộc vào việc chọn ngẫu nhiên khái niệm từ tập C0 Việc xây dựng diễn dịch I mơ hình KB Bước thuật toán thực thuật toán BBCL Chúng ta nhận thấy rằng, khái niệm ¬Cij thêm vào C aI ∈ (¬Cij )I với a ∈ E + Đây điều kiện tốt để hy vọng KB |= ¬Cij (a) với a ∈ E + BBCL sử dụng thuật toán tableaux logic mô tả cụ thể (thông qua suy luận)để tiến hành kiểm tra xem KB |= ¬Cij (a) có thỏa mãn với a ∈ E + hay khơng Nếu điều thỏa mãn, ¬Cij thêm vào tập C Ngược lại, ¬Cij thêm vào tập C0 với hy vọng sau sử dụng q trình lấy hợp số khái niệm C0 Nghĩa là, khái niệm D ∈ C0 không thỏa mãn KB |= D(a) với a ∈ E + , lấy hợp nhóm khái niệm D1 , D2 , , Dl C0 KB |= (D1 t D2 t t Dl )(a) với a ∈ E + Do đó, q trình mở rộng C gặp khó khăn cách sử dụng Cij (là khái niệm đặc trưng tương ứng khối Yij phân hoạch Y đạt thông qua việc phân hoạch miền mơ hình KB), chuyển sang lấy hợp khái niệm C0 để xem xét bổ sung vào tập C Tương tự thuật toán BBCL, Hàm simplify để rút gọn khái niệm Bước 24 thực thơng qua chuẩn hóa khái niệm, sau tiến hành đo độ giống khái niệm gộp chúng lại với theo luật De Morgan luật chuyển đổi tương đương khác 4.4.2 Tính đắn thuật tốn BBCL2 Mệnh đề 4.2 (Tính đắn thuật toán BBCL2) Thuật toán BBCL2 đắn Nghĩa là, thuật toán BBCL2 trả khái niệm Crs Crs lời giải tốn học khái niệm cho sở tri thức logic mô tả với Ngữ cảnh (2) Chứng minh Giả sử Crs khái niệm kết thuật toán BBCL2 C khái d niệm C Bước 22 Vì Crs thu từ khái niệm C thơng qua phép biến đổi 100 bảo tồn tính tương đương khái niệm nên cần chứng minh hai khẳng định sau: • KB |= C(a) với a ∈ E + , • KB 6|= C(a) với a ∈ E − Đầu tiên chứng minh KB |= C(a) với a ∈ E + Ta thấy tập khái niệm C mở rộng Bước 16 Một khái niệm D thêm vào C KB |= D(a) với a ∈ E + Đặt n = #C sau loại bỏ khái niệm D khỏi C Bước 21 Rõ ràng, ta thấy tập C chứa khái niệm Di , ≤ i ≤ n, cho KB |= Di (a) với a ∈ E + Do đó, KB |= (D1 u D2 u · · · u Dn )(a) với a ∈ E + Nói cách khác, KB |= C(a) với a ∈ E + Bây chứng minh KB 6|= C(a) với a ∈ E − Ta thấy trình mở rộng thu hẹp tập C Bước 8, 16 21 đảm bảo KB 6|= C(a) với a ∈ E0− (khởi đầu E0− = ∅) Thật vậy, Bước 8, thuật toán xem xét khái niệm Cij mà Yij chứa aI với a ∈ E − không chứa aI với a ∈ E + Rõ ràng, KB |= ¬Cij (a) với a ∈ E + KB 6|= ¬Cij (a) với a ∈ E − mà aI ∈ Yij Do đó, thêm ¬Cij vào C thêm tất a ∈ E − thỏa mãn d aI ∈ Yij vào E0− ta có KB 6|= C(a) với a ∈ E0− Tại Bước 16 21, với lập luận tương tự thêm khái niệm vào C loại bỏ khái niệm khỏi C, ta ln d d có KB 6|= C(a) với a ∈ E0− Khi E0− = E − ta có KB 6|= C(a) với a ∈ E − Nói cách khác, KB 6|= C(a) với a ∈ E − Như kết luận thuật tốn BBCL2 khơng kết thúc với kết thất bại khái niệm trả Crs lời giải toán học khái niệm cho sở tri thức logic mô tả với Ngữ cảnh (2) 4.4.3 Ví dụ minh họa Sau xem xét ví dụ minh họa cho Thuật toán BBCL2 để học khái niệm cho sở tri thức logic mô tả với Ngữ cảnh (2) sử dụng ngơn ngữ khác Ví dụ 4.7 Xét sở tri thức KB 00 = hR, T , A00 i cho Ví dụ 1.9 E = hE + , E − i, Σ† , Φ† cho Ví dụ 4.3 (E + = {P4 , P6 }, E − = {P1 , P2 , P3 , P5 }, Σ† = {Awarded , cited_by} Φ† = ∅) Đặt KB = hR, T , Ai với A = A00 ∪ {Ad (a) | a ∈ E + } ∪ {¬Ad (a) | a ∈ E − } Ví dụ khác với Ví dụ 4.3 điểm A00 sử dụng 101 thay A0 thuật tốn BBCL2 sử dụng thay thuật tốn BBCL Thuật tốn BBCL2 thực ba bước giống Ví dụ 4.3 (có bổ sung thêm E0− := ∅) bước sau: Vì Y3 ⊆ E − nên ta tiến hành xem xét C3 ≡ ¬Awarded Vì KB |= ¬C3 (a) với a ∈ E + nên ta thêm ¬C3 vào C thêm phần tử Y3 vào E0− Do đó, ta có C = {C3 } E0− = {P2 , P3 , P5 } Vì Y5 ⊆ E − nên ta tiến hành xem xét C5 ≡ Awarded u ¬∃cited_by.> Vì d KB |= ¬C5 (a) với a ∈ E + C không bị bao hàm C5 dựa KB nên ta thêm ¬C5 vào C Do đó, ta có C = {¬C3 , ¬C5 } E0− = {P1 , P2 , P3 , P5 } d Vì E0− = E − nên ta có C ≡ C ≡ ¬¬Awarded u ¬(Awarded u ¬∃cited_by.>) Rút gọn khái niệm C ta kết trả Crs ≡ Awarded u ∃cited_by.> Ví dụ 4.8 Cho KB00 , E, Φ† Ví dụ 4.7 thay đổi Σ† = {cited_by, Year } Ví dụ khác với Ví dụ 4.5 điểm A00 sử dụng thay A0 thuật tốn BBCL2 sử dụng thay thuật toán BBCL Thuật toán BBCL2 thực ba bước đầu giống Ví dụ 4.5 (có bổ sung thêm E0− := ∅) bước sau: Vì Y6 ⊆ E − nên ta tiến hành xem xét C6 ≡ (Year ≥ 2008) u (Year ≥ 2010) Vì KB |= ¬C6 (a) với a ∈ E + nên ta thêm ¬C6 vào C thêm tất phần tử Y6 vào E0− Do đó, ta có C = {¬C6 } E0− = {P1 } Vì Y7 ⊆ E − nên ta tiến hành xem xét C7 ≡ (Year ≥ 2008) u (Year < d 2010) Vì KB |= ¬C7 (a) với a ∈ E + C khơng bị bao hàm ¬C7 dựa KB nên ta thêm ¬C7 vào C thêm phần tử Y7 E0− Do đó, ta có C = {¬C6 , ¬C7 } E0− = {P1 , P2 , P3 } Vì Y9 ⊆ E − nên ta tiến hành xem xét C9 ≡ (Year < 2008) u (Year < 2007) u ¬∃cited_by.((Year ≥ 2008) u (Year ≥ 2010)) Vì KB |= ¬C9 (a) với d a ∈ E + C khơng bị bao hàm ¬C9 dựa KB nên ta thêm ¬C9 vào C thêm phân tử Y9 vào E0− Do đó, ta có C = {¬C6 , ¬C7 , ¬C9 } E0− = {P1 , P2 , P3 , P5 } Vì E0− = E − nên ta có C ≡ d C ≡ ¬((Year ≥ 2008) u (Year ≥ 2010)) u ¬((Year ≥ 2008) u (Year < 2010)) u ¬((Year < 2008) u (Year < 2007) u ¬∃cited_by.((Year ≥ 2008) u (Year ≥ 2010))) Rút gọn C ta kết trả Crs ≡ (Year < 2008) u [(Year ≥ 2007) t ∃cited_by.(Year ≥ 2010)] Sự khác KB 00 = hR, T , A00 i KB = hR, T , A0 i giải thích Ví dụ 1.9 102 Thơng qua ví dụ minh họa cho thuật tốn BBCL BBCL2, nhận thấy sở tri thức sử dụng thuật tốn BBCL2 cần điều kiện ràng buộc so với sở tri thức sử dụng thuật toán BBCL.4 Mặc dầu vậy, thuật toán BBCL2 đạt hiệu tương tự thuật toán BBCL Ghi 4.1 (Độ phức tạp thuật toán BBCL BBCL2) Học khái niệm cho sở tri thức logic mô tả với Ngữ cảnh (1) Ngữ cảnh (2) liên quan chặt chẽ với vấn đề suy luận tự động logic mô tả Đối với vấn đề suy luận tự động, độ phức tạp tốn ExpTime-khó logic mô tả ALC Một cách tổng qt, tốn kiểm tra tính thỏa logic mơ tả thường ExpTime-đầy đủ Thuật toán BBCL BBCL2 sử dụng vịng lặp tuyến tính có giới hạn lực lượng C0 ứng với toán suy luận Do đó, hai thuật tốn có độ phức tạp hàm mũ (xét theo kích thước KB, E + E − với giả thiết Σ† cố định) Tiểu kết Chương Chương trình bày phương pháp làm mịn phân hoạch miền diễn dịch logic mô tả sở Thuật tốn 3.1 Tiếp đó, chúng tơi đề xuất thuật toán BBCL, dual-BBCL BBCL2 để giải hai toán học khái niệm cho sở tri thức logic mô tả với Ngữ cảnh (1) Ngữ cảnh (2) Ý tưởng thuật tốn sử dụng mơ hình sở tri thức kết hợp với mô hai chiều mơ hình (để mơ hình hóa tính khơng phân biệt được) định (để phân lớp liệu) cho việc tìm kiếm khái niệm kết Tính thuật tốn BBCL BBCL2 chứng minh thông qua bổ đề tương ứng Các thuật tốn áp dụng cho lớp lớn logic mô tả mở rộng ALC Σ,Φ có tính chất mơ hình hữu hạn nửa hữu hạn, Φ ⊆ {I, F, N , Q, O, U, Self} Lớp logic chứa nhiều logic mơ tả hữu ích, chẳng hạn SHIQ (logic làm sở cho OWL) SROIQ (logic làm sở cho OWL 2) sử dụng nhiều ứng dụng Web ngữ nghĩa Chẳng hạn khẳng định (¬∃cited_by.>)(P1 ) (∀cited_by.{P2 , P3 , P4 })(P5 ) (trong A0 - dùng cho BBCL) để nói lên P1 khơng trích dẫn ấn phẩm P5 trích dẫn ấn phẩm P2 , P3 P4 103 KẾT LUẬN Kết luận Logic mô tả ngày khẳng định vai trò quan trọng hệ thống biểu diễn suy luận tri thức Kể từ logic mô tả xem tảng ngôn ngữ OWL (một ngôn ngữ sử dụng để mơ hình hóa hệ thống ngữ nghĩa ontology theo khuyến nghị W3C), logic mô tả nhiều nhà khoa học quan tâm nghiên cứu Đối với hệ thống ngữ nghĩa, việc tìm kiếm khái niệm phù hợp, xây dựng định nghĩa cho khái niệm để đặc tả hệ thống vấn đề đặt cách tự nhiên Học khái niệm logic mô tả giải pháp để tìm kiếm xây dựng định nghĩa cho khái niệm Với mục đích đó, luận án tập trung nghiên cứu toán học khái niệm logic mô tả sử dụng ngữ cảnh khác Kết nghiên cứu luận án tóm tắt sau: Xây dựng ngơn ngữ logic mô tả LΣ,Φ dựa ngôn ngữ ALC reg với tập đặc trưng mở rộng gồm I, O, N , Q, F, U, Self Ngồi ngơn ngữ xây dựng cho phép sử dụng thuộc tính (bao gồm thuộc tính rời rạc liên tục) phần tử ngôn ngữ nhằm mô tả hệ thống thông tin phù hợp với thực tế Thông qua ngôn ngữ LΣ,Φ , luận án xây dựng mô hai chiều lớp logic mở rộng nghiên cứu Các định lý, bổ đề, hệ liên quan đến mô hai chiều tính bất biến mơ hai chiều phát triển chứng minh lớp logic mở rộng Thông qua tính đầy đủ chọn bản, luận án xây dựng thuật toán học khái niệm cho hệ thống thông tin logic mô tả với Ngữ cảnh (3) Ngoài chọn bản, chọn đơn giản, luận án đề xuất sử dụng chọn mở rộng nhằm làm cho trình học thực tốt Các chiến lược tìm kiếm đề xuất dựa vào gia lượng thông tin tính đơn giản khái niệm Dựa vào mơ hai chiều, thuật tốn phân hoạch miền mơ hình sở tri thức để xây dựng thuật toán BBCL, dual-BBCL, BBCL2 nhằm giải toán học khái niệm cho sở tri thức logic mô tả với Ngữ cảnh (1) Ngữ cảnh (2) 104 Những vấn đề cần tiếp tục nghiên cứu Từ kết đạt luận án, vấn đề đặt cần quan tâm nghiên cứu thời gian tới sau: Xây dựng chiến lược học khác thông qua độ đo việc định khối nên phân hoạch trước So sánh chiến lược học với Xây dựng module học khái niệm logic mô tả với ngữ cảnh khác API cho phép tích hợp vào hệ thống khác Nghiên cứu thuật tốn học nửa giám sát, học khơng giám sát, học theo xác suất cho cở sở tri thức logic mô tả Nghiên cứu khả học xác khái niệm cho logic mơ tả khác 105 DANH MỤC CÁC CƠNG TRÌNH CỦA TÁC GIẢ T.-L Tran, Q.-T Ha, T.-L.-G Hoang, L A Nguyen, H S Nguyen, and A Szalas Concept learning for description logic-based information systems In Proceedings of the 2012 Fourth International Conference on Knowledge and Systems Engineering, KSE’2012, pages 65–73 IEEE Computer Society, 2012 (ISBN: 978-1-4673-2171-6) Q.-T Ha, T.-L.-G Hoang, L A Nguyen, H S Nguyen, A Szalas, and T.-L Tran A bisimulation-based method of concept learning for knowledge bases in description logics In Proceedings of the Third Symposium on Information and Communication Technology, SoICT’2012, pages 241–249 ACM, 2012 (ISBN: 978-1-4503-1232-5) Trần Thanh Lương, Hoàng Thị Lan Giao Áp dụng độ đo entropy để phân hoạch khối cho hệ thống thông tin dựa logic mô tả Kỷ yếu Hội thảo quốc gia lần thứ XV: Một số vấn đề chọn lọc Công nghệ Thông tin Truyền thông, trang 11–18, Nhà xuất Khoa học Kỹ thuật, 2013 T.-L Tran, Q.-T Ha, T.-L.-G Hoang, L A Nguyen, and H S Nguyen Bisimulationbased concept learning in description logics In Proceedings of CS&P’2013, pages 421– 433 CEURWS.org, 2013 (ISBN: 978-83-62582-42-6) T.-L Tran, L A Nguyen, and T.-L.-G Hoang A domain partitioning method for bisimulationbased concept learning in description logics In Proceedings of ICCSAMA’2014, volume 282 of Advances in Intelligent Systems and Computing, pages 297–312 Springer International Publishing, 2014 (ISBN: 978-3-319-06569-4) T.-L Tran, Q.-T Ha, T.-L.-G Hoang, L A Nguyen, and H S Nguyen Bisimulationbased concept learning in description logics Fundamenta Informaticae, Vol 133, No 2-3, pages 287–303, 2014 (ISSN: 0169-2968) T.-L Tran and T.-L.-G Hoang Entropy-based measures for partitioning the domain of an interpretation in description logics Journal of Science, Hue University, Vol 98, No 8, pages 97–101, 2014 (ISSN: 1859-1388) T.-L Tran, L A Nguyen, and T.-L.-G Hoang Bisimulation-based concept learning for information systems in description logics Vietnam Journal of Computer Science, Vol 2, pages 149–167, 2015 (ISSN: 2196-8888 (print version); ISSN: 2196-8896 (electronic version)) 106 TÀI LIỆU THAM KHẢO [1] S Abiteboul, R Hull, and V Vianu Foundations of Databases Addison-Wesley, 1995 [2] F Baader, D Calvanese, D L McGuinness, D Nardi, and P F Patel-Schneider, editors The Description Logic Handbook: Theory, Implementation, and Applications Cambridge University Press, 2010 [3] F Baader and U Sattler An overview of tableau algorithms for description logics Studia Logica, 69(1):5–40, 2001 [4] L Badea and S.-H Nienhuys-Cheng A refinement operator for description logics In Proceedings of the 10th International Conference on Inductive Logic Programming, ILP’2000, pages 40–59 Springer-Verlag, 2000 [5] P Blackburn, M de Rijke, and Y Venema Modal Logic Number 53 in Cambridge Tracts in Theoretical Computer Science Cambridge University Press, 2001 [6] P Blackburn, J van Benthem, and F Wolter Handbook of Modal Logic Elsevier Science, 2006 [7] R J Brachman and J G Schmolze An overview of the KL-one knowledge representation system Cognitive Science, 9(2):171–216, 1986 [8] R Cattral, F Oppacher, and D Deugo Evolutionary data mining with automatic rule generalization, 2002 [9] L Chang, F Lin, and Z Shi A dynamic description logic for representation and reasoning about actions In Z Zhang and J Siekmann, editors, Knowledge Science, Engineering and Management, volume 4798 of Lecture Notes in Computer Science, pages 115–127 Springer Berlin Heidelberg, 2007 [10] W W Cohen, A Borgida, and H Hirsh Computing least common subsumers in description logics In Proceedings of AAAI, pages 754–760 The MIT Press, 1992 [11] W W Cohen and H Hirsh Learning the Classic description logic: Theoretical and experimental results In Proceedings of KR’1994, pages 121–133, 1994 [12] A R Divroodi, Q.-T Ha, L A Nguyen, and H S Nguyen On C-learnability in description logics In Proceedings of ICCCI’2012 (1), volume 7653 of LNCS, pages 230–238 Springer, 2012 107 [13] A R Divroodi and L A Nguyen On bisimulations for description logics In Proceedings of CS&P’2011, pages 99–110, 2011 [14] A R Divroodi and L A Nguyen On bisimulations for description logics Inf Sci., 295:465–493, 2015 [15] N Fanizzi, C d’Amato, and F Esposito DL-FOIL concept learning in description logics In Proceedings of ILP’2008, LNCS, pages 107–121 Springer-Verlag, 2008 [16] N Fanizzi, C d’Amato, and F Esposito Towards the induction of terminological decision trees In Proceedings of the 2010 ACM Symposium on Applied Computing, SAC’2010, pages 1423–1427 ACM, 2010 [17] N Fanizzi, S Ferilli, L Iannone, I Palmisano, and G Semeraro Downward refinement in the ALN description logic In Proceedings of HIS’2004, pages 68–73 IEEE Computer Society, 2004 [18] M J Fischer and R E Ladner Propositional dynamic logic of regular programs Journal of Computer and System Sciences, 18(2):194–211, 1979 [19] M Frazier and L Pitt Classic learning Machine Learning, 25(2-3):151–193, 1996 [20] G D Giacomo and M Lenzerini Boosting the correspondence between description logics and propositional dynamic logics In In Proceedings of AAAI’94, pages 205–212 AAAI Press, 1994 [21] M R Hacene, M Huchard, A Napoli, and P Valtchev Relational concept analysis: mining concept lattices from multi-relational data Ann Math Artif Intell., 67(1):81– 108, 2013 [22] M Hennessy and R Milner Algebraic laws for nondeterminism and concurrency Journal of the ACM, 32(1):137–161, 1985 [23] B Hollunder Hybrid inferences in kl-one-based knowledge representation systems In H Marburger, editor, GWAI-90 14th German Workshop on Artificial Intelligence, volume 251 of Informatik-Fachberichte, pages 38–47 Springer Berlin Heidelberg, 1990 [24] B Hollunder and F Baader Qualifying number restrictions in concept languages Technical report, 1991 [25] I Horrocks OWL: A description logic based ontology language In Proceedings of CP’2005, LNCS, pages 5–8 Springer Berlin Heidelberg, 2005 [26] I Horrocks, O Kutz, and U Sattler The even more irresistible SROIQ In KR, pages 57–67 AAAI Press, 2006 108 [27] I Horrocks, P F Patel-Schneider, D L Mcguinness, and C A Welty OWL: a description logic based ontology language for the semantic web In The Description Logic Handbook: Theory, Implementation, and Applications, pages 458–486 Cambridge University Press, 2007 [28] I Horrocks and U Sattler A description logic with transitive and inverse roles and role hierarchies J Log Comput., 9(3):385–410, 1999 [29] I Horrocks and U Sattler A tableau decision procedure for SHOIQ J Autom Reasoning, 39(3):249–276, 2007 [30] I Horrocks, U Sattler, and S Tobies Practical reasoning for very expressive description logics Logic Journal of the IGPL, 8(3):239–263, 2000 [31] I Horrocks, U Sattler, and S Tobies Reasoning with individuals for the description logic SHIQ In Proceedings CADE-17, volume 2000 of LNCS, pages 482–496 SpringerVerlag, 2000 [32] L Iannone, I Palmisano, and N Fanizzi An algorithm based on counterfactuals for concept learning in the semantic web Applied Intelligence, 26(2):139–159, 2007 [33] P Lambrix and P Larocchia Learning composite concepts In Proceedings of DL’1998, 1998 [34] J Lehmann Concept learning in description logics Master’s thesis, Dresden University of Technology, Germany, 2006 [35] J Lehmann and P Hitzler A refinement operator based learning algorithm for the ALC description logic In Proceedings of ILP’2007, pages 147–160 Springer-Verlag, 2008 [36] J Lehmann and P Hitzler Concept learning in description logics using refinement operators Machine Learning, 78(1-2):203–250, 2010 [37] M Minsky A framework for representing knowledge Artificial intelligence memo, 1974 [38] L A Nguyen An efficient tableau prover using global caching for the description logic ALC Fundam Inform., 93(1-3):273–288, 2009 [39] L A Nguyen A cut-free ExpTime tableau decision procedure for the description logic SHI In Proceedings of ICCCI’2011 (1), volume 6922 of LNCS, pages 572–581 Springer, 2011 [40] L A Nguyen A cut-free exptime tableau decision procedure for the description logic SHI In Proceedings of ICCCI’2011, volume 6922 of LNCS, pages 572–581 SpringerVerlag, 2011 109 [41] L A Nguyen Cut-free exptime tableaux for checking satisfiability of a knowledge base in the description logic ALCI In Proceedings of ISMIS’2011, volume 6804 of LNCS, pages 465–475 Springer-Verlag, 2011 [42] L A Nguyen A tableau method with optimal complexity for deciding the description logic SHIQ In Proceedings of ICCSAMA’2013 (1), volume 479 of Studies in Computational Intelligence, pages 331–342 Springer, 2013 [43] L A Nguyen and A Szalas Tableaux with global caching for checking satisfiability of a knowledge base in the description logic SH In N T Nguyen and R Kowalczyk, editors, Transactions on Computational Collective Intelligence, volume 1, pages 21–38 Springer-Verlag, 2010 [44] L A Nguyen and A Szalas Logic-based roughification In Rough Sets and Intelligent Systems (1), pages 517–543 Springer, 2013 [45] D Park Concurrency and automata on infinite sequences In Proceedings of the 5th GI-Conference on Theoretical Computer Science, pages 167–183 Springer-Verlag, 1981 [46] Z Pawlak Information systems theoretical foundations Information Systems, 6(3):205– 218, 1981 [47] Z Pawlak Rough Sets: Theoretical Aspects of Reasoning About Data Kluwer Academic Publishers, 1992 [48] Z Pawlak and A Skowron Rudiments of rough sets Inf Sci., 177(1):3–27, 2007 [49] M R Quillian Word concepts: a theory and simulation of some basic semantic capabilities Behavioral Science, 12(5):410–430, 1967 [50] J R Quinlan Induction of decision trees Machine Learning, 1(1):81–106, 1986 [51] J R Quinlan Learning logical definitions from relations Mach Learn., 5(3):239–266, 1990 [52] S Rudolph Foundations of description logics In Reasoning Web Semantic Technologies for the Web of Data, volume 6848 of Lecture Notes in Computer Science, pages 76–136 Springer Berlin Heidelberg, 2011 [53] U Sattler Description logic reasoner http://www.cs.man.ac.uk/~sattler/ reasoners.html, 2014 [Online; accessed 18-October-2014] [54] K Schild A correspondence theory for terminological logics: Preliminary report In Proceedings of the 12th International Joint Conference on Artificial Intelligence - Volume 1, IJCAI’91, pages 466–471 Morgan Kaufmann Publishers Inc., 1991 110 [55] M Schmidt-Schaubß and G Smolka Attributive concept descriptions with complements Artif Intell., 48(1):1–26, 1991 [56] J G Schmolze and T A Lipkis Classification in the KL-one knowledge representation system In A Bundy, editor, Proceedings of IJCAI’1983, pages 330–332 William Kaufmann, 1983 [57] P Sen, G M Namata, M Bilgic, L Getoor, B Gallagher, and T Eliassi-Rad Collective classification in network data AI Magazine, 29(3):93–106, 2008 [58] J van Benthem Modal Logic and Classical Logic Indices Monographs in philosophical logic and formal linguistics Bibliopolis, 1983 [59] J van Benthem Correspondence theory In D Gabbay and F Guenthner, editors, Handbook of Philosophical Logic, volume 165 of Synthese Library, pages 167–247 Springer Netherlands, 1984 [60] J van Benthem Correspondence theory In D M Gabbay and F Guenthner, editors, Handbook of Philosophical Logic, volume 3, pages 325–408 Springer-Science, second edition, 2001 [61] J van Benthem Modal Logic for Open Minds Center for the Study of Language and Inf, 2010 [62] E Zolin Complexity of reasoning in description logics http://www.cs.man.ac.uk/ ~ezolin/dl/, 2014 [Online; accessed 18-October-2014] 111