Mệnh đề 4.2 (Tính đúng đắn của thuật toán BBCL2). Thuật toán BBCL2 là đúng đắn. Nghĩa là, nếu thuật toán BBCL2 trả về một khái niệm Crs thì Crs là một lời giải của bài toán học khái niệm cho cơ sở tri thức trong logic mô tả với Ngữ cảnh (2).
Chứng minh. Giả sử Crs là khái niệm kết quả của thuật toán BBCL2 và C là khái niệm d
C trong Bước 22. Vì Crs thu được từ khái niệm C thông qua phép biến đổi bảo toàn tính tương đương của khái niệm nên chúng ta chỉ cần chứng minh hai khẳng định sau:
• KB |=C(a) với mọia∈E+, và • KB 6|=C(a) với mọia∈E−.
Đầu tiên chúng ta chứng minh KB |=C(a)với mọi a∈E+. Ta thấy rằng tập các khái niệm C chỉ được mở rộng tại các Bước 8 và 16. Một khái niệmD được thêm vào
C khi KB |=D(a) với mọi a ∈E+. Đặt n = #C sau khi đã loại bỏ những khái niệm
D khỏiCở Bước 21. Rõ ràng, ta thấy tập Cchỉ chứa những khái niệmDi,1≤i≤n, sao cho KB |=Di(a) với mọi a ∈E+. Do đó, KB |= (D1 uD2 u · · · uDn)(a) với mọi
a ∈E+. Nói cách khác, KB |=C(a) với mọia∈E+.
Bây giờ chúng ta chứng minhKB 6|=C(a)với mọia∈E−. Ta thấy rằng quá trình mở rộng cũng như thu hẹp tập C tại các Bước 8, 16 và 21 luôn đảm bảo được rằng KB 6|=C(a) với mọi a∈E0− (khởi đầu E0− =∅). Thật vậy, tại Bước 8, thuật toán chỉ xem xét những khái niệm Cij mà Yij chứa các aI với a ∈ E− và không chứa aI nào với a ∈ E+. Rõ ràng, nếu KB |=¬Cij(a) với mọi a ∈ E+ thì KB 6|=¬Cij(a) với mọi
a ∈E− mà aI ∈ Yij. Do đó, khi thêm ¬Cij vào C và thêm tất cả a ∈ E− thỏa mãn
aI ∈Yij vào E0− ta có KB 6|=dC(a) với mọia∈E0−. Tại Bước 16 và 21, với lập luận tương tự khi thêm các khái niệm vào C và loại bỏ các khái niệm ra khỏi C, ta luôn có KB 6|=d
C(a)với mọi a∈E0−. Khi E0−=E− ta có KB 6|=d
C(a) với mọia ∈E−. Nói cách khác, KB 6|=C(a)với mọi a∈E−.
Như vậy chúng ta kết luận rằng nếu thuật toán BBCL2 không kết thúc với kết quả thất bại thì khái niệm trả về Crs là một lời giải của bài toán học khái niệm cho
cơ sở tri thức trong logic mô tả với Ngữ cảnh (2).
4.4.3. Ví dụ minh họa
Sau đây chúng ta xem xét các ví dụ minh họa cho Thuật toán BBCL2 để học khái niệm cho cơ sở tri thức trong logic mô tả với Ngữ cảnh (2) sử dụng các ngôn ngữ con khác nhau.
Ví dụ 4.7. Xét cơ sở tri thức KB00 =hR,T,A0
0inhư đã cho trong Ví dụ 1.9 và E = hE+, E−i, Σ†, Φ† như đã cho trong Ví dụ 4.3 (E+ = {P4,P6}, E− ={P1,P2,P3,P5}, Σ† = {Awarded,cited_by} và Φ† = ∅). Đặt KB = hR,T,Aivới A = A0
0 ∪ {Ad(a) |
a ∈E+} ∪ {¬Ad(a)|a∈E−}. Ví dụ này khác với Ví dụ 4.3 ở điểmA0
0 được sử dụng thay vìA03 và thuật toán BBCL2 được sử dụng thay vì thuật toán BBCL. Thuật toán BBCL2 thực hiện ba bước đầu tiên giống như Ví dụ 4.3 (có bổ sung thêm E0− :=∅) và các bước tiếp theo như sau:
4. Vì Y3 ⊆E− nên ta tiến hành xem xét đối vớiC3 ≡ ¬Awarded. Vì KB |=¬C3(a) với mọi a∈E+ nên ta thêm¬C3 vàoCvà thêm các phần tử củaY3 vàoE0−. Do 3Sự khác nhau giữaKB00=hR,T,A0
đó, ta có C={C3}và E0− ={P2,P3,P5}.
5. Vì Y5 ⊆E− nên ta tiến hành xem xét đối vớiC5 ≡Awardedu ¬∃cited_by.>. Vì KB |= ¬C5(a) với mọi a ∈ E+ và d
C không bị bao hàm bởi C5 dựa trên KB nên ta thêm ¬C5 vàoC. Do đó, ta cóC={¬C3,¬C5}vàE0− ={P1,P2,P3,P5}. 6. Vì E0− =E− nên ta có C ≡d
C ≡ ¬¬Awarded u ¬(Awarded u ¬∃cited_by.>). Rút gọn khái niệm C ta được kết quả trả về là Crs ≡Awarded u ∃cited_by.>.
Ví dụ 4.8. Cho KB00, E, Φ† như trong Ví dụ 4.7 và thay đổi Σ†={cited_by,Year}. Ví dụ này khác với Ví dụ 4.5 ở điểmA0
0 được sử dụng thay vìA0 và thuật toán BBCL2 được sử dụng thay vì thuật toán BBCL. Thuật toán BBCL2 thực hiện ba bước đầu giống như Ví dụ 4.5 (có bổ sung thêm E0−:=∅) và các bước tiếp theo như sau:
4. Vì Y6 ⊆ E− nên ta tiến hành xem xét đối với C6 ≡ (Year ≥ 2008)u(Year ≥ 2010). Vì KB |=¬C6(a) với mọi a∈E+ nên ta thêm ¬C6 vàoC và thêm tất cả các phần tử của Y6 vào E0−. Do đó, ta có C={¬C6}và E0− ={P1}.
5. Vì Y7 ⊆ E− nên ta tiến hành xem xét đối với C7 ≡ (Year ≥ 2008)u(Year <
2010). Vì KB |=¬C7(a) với mọi a∈E+ và dC không bị bao hàm bởi ¬C7 dựa trên KB nên ta thêm ¬C7 vào C và thêm các phần tử của Y7 và E0−. Do đó, ta có C={¬C6,¬C7} và E0− ={P1,P2,P3}.
6. Vì Y9 ⊆ E− nên ta tiến hành xem xét đối với C9 ≡ (Year < 2008)u(Year <
2007)u ¬∃cited_by.((Year ≥2008)u(Year ≥2010)). Vì KB |=¬C9(a)với mọi
a ∈ E+ và dC không bị bao hàm bởi ¬C9 dựa trên KB nên ta thêm ¬C9 vào
C và thêm các phân tử của Y9 vào E0−. Do đó, ta có C = {¬C6,¬C7,¬C9} và
E0− ={P1,P2,P3,P5}.
7. Vì E0− = E− nên ta có C ≡ d
C ≡ ¬((Year ≥ 2008)u (Year ≥ 2010))u ¬((Year ≥ 2008)u (Year < 2010))u ¬((Year < 2008) u (Year < 2007) u ¬∃cited_by.((Year ≥ 2008)u(Year ≥ 2010))). Rút gọn C ta được kết quả trả về là Crs≡(Year <2008)u[(Year ≥2007)t ∃cited_by.(Year ≥2010)].
Thông qua các ví dụ minh họa cho các thuật toán BBCL và BBCL2, chúng ta nhận thấy rằng cơ sở tri thức sử dụng trong thuật toán BBCL2 cần ít điều kiện ràng buộc hơn so với cơ sở tri thức sử dụng trong thuật toán BBCL.4 Mặc dầu vậy, thuật toán BBCL2 vẫn đạt được hiệu quả tương tự như thuật toán BBCL.
4Chẳng hạn như khẳng định(¬∃cited_by.>)(P1)và(∀cited_by.{P2, P3, P4})(P5)(trongA0- được dùng cho BBCL) để nói lên rằng P1 không được trích dẫn bởi bất kỳ ấn phẩm nào và P5 chỉ được trích dẫn bởi các ấn phẩmP2,P3 vàP4.
Ghi chú 4.1 (Độ phức tạp của thuật toán BBCL và BBCL2). Học khái niệm cho cơ sở tri thức trong logic mô tả với Ngữ cảnh (1) và Ngữ cảnh (2) liên quan chặt chẽ với vấn đề suy luận tự động trong logic mô tả. Đối với vấn đề suy luận tự động, độ phức tạp của bài toán này là ExpTime-khó ngay cả đối với logic mô tả cơ bản ALC. Một cách tổng quát, bài toán kiểm tra tính thỏa trong logic mô tả thường là ExpTime-đầy đủ. Thuật toán BBCL và BBCL2 sử dụng một vòng lặp tuyến tính có giới hạn là lực lượng của C0 ứng với mỗi bài toán suy luận. Do đó, hai thuật toán này có độ phức tạp là hàm mũ (xét theo kích thước của KB, E+ và E− với giả thiết là Σ† cố định).
Tiểu kết Chương 4
Chương này đã trình bày phương pháp làm mịn phân hoạch miền của diễn dịch trong logic mô tả trên cơ sở của Thuật toán 3.1. Tiếp đó, chúng tôi đề xuất các thuật toán BBCL, dual-BBCL và BBCL2 để giải quyết hai bài toán học khái niệm cho cơ sở tri thức trong logic mô tả với Ngữ cảnh (1) và Ngữ cảnh (2). Ý tưởng chính của các thuật toán này là sử dụng các mô hình của cơ sở tri thức kết hợp với mô phỏng hai chiều trong các mô hình đó (để mô hình hóa tính không phân biệt được) và cây quyết định (để phân lớp dữ liệu) cho việc tìm kiếm khái niệm kết quả. Tính đúng của các thuật toán BBCL và BBCL2 cũng được chứng minh thông qua các bổ đề tương ứng. Các thuật toán này có thể áp dụng cho một lớp lớn các logic mô tả là mở rộng của ALCΣ,Φ có tính chất mô hình hữu hạn hoặc nửa hữu hạn, trong đó Φ ⊆ {I,F,N,Q,O,U,Self}. Lớp các logic này chứa nhiều logic mô tả rất hữu ích, chẳng hạn như SHIQ (logic làm cơ sở cho OWL) và SROIQ (logic làm cơ sở cho OWL 2) được sử dụng trong nhiều ứng dụng của Web ngữ nghĩa.
KẾT LUẬN
Kết luận
Logic mô tả ngày càng khẳng định được vai trò quan trọng trong các hệ thống biểu diễn và suy luận tri thức. Kể từ khi logic mô tả được xem là nền tảng của ngôn ngữ OWL (một ngôn ngữ được sử dụng để mô hình hóa các hệ thống ngữ nghĩa và ontology theo khuyến nghị của W3C), logic mô tả đã được nhiều nhà khoa học quan tâm nghiên cứu. Đối với các hệ thống ngữ nghĩa, việc tìm kiếm các khái niệm phù hợp, xây dựng những định nghĩa cho các khái niệm đó để đặc tả hệ thống là một vấn đề được đặt ra một cách tự nhiên. Học khái niệm trong logic mô tả là một trong những giải pháp để tìm kiếm và xây dựng định nghĩa cho các khái niệm. Với mục đích đó, luận án tập trung nghiên cứu bài toán học khái niệm trong logic mô tả sử dụng các ngữ cảnh khác nhau. Kết quả nghiên cứu của luận án có thể được tóm tắt như sau:
1. Xây dựng ngôn ngữ logic mô tảLΣ,Φ dựa trên ngôn ngữ ALCreg với tập các đặc trưng mở rộng gồm I, O, N, Q, F, U, Self. Ngoài ra ngôn ngữ được xây dựng còn cho phép sử dụng các thuộc tính (bao gồm thuộc tính rời rạc và liên tục) như là các phần tử cơ bản của ngôn ngữ nhằm mô tả các hệ thống thông tin phù hợp với thực tế hơn.
2. Thông qua ngôn ngữ LΣ,Φ, luận án đã xây dựng mô phỏng hai chiều trên lớp các logic mở rộng đang nghiên cứu. Các định lý, bổ đề, hệ quả liên quan đến mô phỏng hai chiều và tính bất biến đối với mô phỏng hai chiều cũng được phát triển và chứng minh trên lớp các logic mở rộng này.
3. Thông qua tính đầy đủ của bộ chọn cơ bản, luận án đã xây dựng thuật toán học khái niệm cho hệ thống thông tin trong logic mô tả với Ngữ cảnh (3). Ngoài các bộ chọn cơ bản, bộ chọn đơn giản, luận án còn đề xuất sử dụng các bộ chọn mở rộng nhằm làm cho quá trình học được thực hiện tốt hơn. Các chiến lược tìm kiếm cũng được đề xuất dựa vào gia lượng thông tin và tính đơn giản của khái niệm.
4. Dựa vào mô phỏng hai chiều, thuật toán phân hoạch miền của mô hình của cơ sở tri thức để xây dựng thuật toán BBCL, dual-BBCL, BBCL2 nhằm giải quyết các bài toán học khái niệm cho cơ sở tri thức trong logic mô tả với Ngữ cảnh (1) và Ngữ cảnh (2).
Những vấn đề cần tiếp tục nghiên cứu
Từ những kết quả đạt được trong luận án, các vấn đề đặt ra cần quan tâm nghiên cứu trong thời gian tới như sau:
1. Xây dựng các chiến lược học khác nhau thông qua các độ đo trong việc quyết định khối nào nên phân hoạch trước. So sánh các chiến lược học với nhau. 2. Xây dựng các module học khái niệm trong logic mô tả với các ngữ cảnh khác
nhau như là một API cho phép tích hợp vào các hệ thống khác.
3. Nghiên cứu các thuật toán học nửa giám sát, học không giám sát, học theo xác suất cho các cở sở tri thức trong logic mô tả.
DANH MỤC CÁC CÔNG TRÌNH CỦA TÁC GIẢ
1. T.-L. Tran, Q.-T. Ha, T.-L.-G. Hoang, L. A. Nguyen, H. S. Nguyen, and A. Sza las. Concept learning for description logic-based information systems. In Proceedings of the 2012 Fourth International Conference on Knowledge and Systems Engineering, KSE’2012, pages 65–73. IEEE Computer Society, 2012. (ISBN: 978-1-4673-2171-6) 2. Q.-T. Ha, T.-L.-G. Hoang, L. A. Nguyen, H. S. Nguyen, A. Sza las, and T.-L. Tran.
A bisimulation-based method of concept learning for knowledge bases in description logics. In Proceedings of the Third Symposium on Information and Communication Technology, SoICT’2012, pages 241–249. ACM, 2012. (ISBN: 978-1-4503-1232-5) 3. Trần Thanh Lương, Hoàng Thị Lan Giao. Áp dụng độ đo entropy để phân hoạch khối
cho các hệ thống thông tin dựa trên logic mô tả. Kỷ yếu Hội thảo quốc gia lần thứ XV: Một số vấn đề chọn lọc của Công nghệ Thông tin và Truyền thông, trang 11–18, Nhà xuất bản Khoa học và Kỹ thuật, 2013.
4. T.-L. Tran, Q.-T. Ha, T.-L.-G. Hoang, L. A. Nguyen, and H. S. Nguyen. Bisimulation- based concept learning in description logics. InProceedings of CS&P’2013, pages 421– 433. CEURWS.org, 2013. (ISBN: 978-83-62582-42-6)
5. T.-L. Tran, L. A. Nguyen, and T.-L.-G. Hoang. A domain partitioning method for bisimulationbased concept learning in description logics. InProceedings of ICCSAMA’2014, volume 282 of Advances in Intelligent Systems and Computing, pages 297–312. Springer International Publishing, 2014. (ISBN: 978-3-319-06569-4)
6. T.-L. Tran, Q.-T. Ha, T.-L.-G. Hoang, L. A. Nguyen, and H. S. Nguyen. Bisimulation- based concept learning in description logics. Fundamenta Informaticae, Vol. 133, No. 2-3, pages 287–303, 2014. (ISSN: 0169-2968)
7. T.-L. Tran and T.-L.-G. Hoang. Entropy-based measures for partitioning the domain of an interpretation in description logics. Journal of Science, Hue University, Vol. 98, No. 8, pages 97–101, 2014. (ISSN: 1859-1388)
8. T.-L. Tran, L. A. Nguyen, and T.-L.-G. Hoang. Bisimulation-based concept learning for information systems in description logics. Vietnam Journal of Computer Science, Vol. 2, pages 149–167, 2015. (ISSN: 2196-8888 (print version); ISSN: 2196-8896 (elec- tronic version))
TÀI LIỆU THAM KHẢO
[1] S. Abiteboul, R. Hull, and V. Vianu. Foundations of Databases. Addison-Wesley, 1995. [2] F. Baader, D. Calvanese, D. L. McGuinness, D. Nardi, and P. F. Patel-Schneider, edi- tors.The Description Logic Handbook: Theory, Implementation, and Applications. Cam- bridge University Press, 2010.
[3] F. Baader and U. Sattler. An overview of tableau algorithms for description logics. Studia Logica, 69(1):5–40, 2001.
[4] L. Badea and S.-H. Nienhuys-Cheng. A refinement operator for description logics. In Proceedings of the 10th International Conference on Inductive Logic Programming, ILP’2000, pages 40–59. Springer-Verlag, 2000.
[5] P. Blackburn, M. de Rijke, and Y. Venema. Modal Logic. Number 53 in Cambridge Tracts in Theoretical Computer Science. Cambridge University Press, 2001.
[6] P. Blackburn, J. van Benthem, and F. Wolter. Handbook of Modal Logic. Elsevier Science, 2006.
[7] R. J. Brachman and J. G. Schmolze. An overview of the KL-oneknowledge represen- tation system. Cognitive Science, 9(2):171–216, 1986.
[8] R. Cattral, F. Oppacher, and D. Deugo. Evolutionary data mining with automatic rule generalization, 2002.
[9] L. Chang, F. Lin, and Z. Shi. A dynamic description logic for representation and reasoning about actions. In Z. Zhang and J. Siekmann, editors, Knowledge Science, Engineering and Management, volume 4798 ofLecture Notes in Computer Science, pages 115–127. Springer Berlin Heidelberg, 2007.
[10] W. W. Cohen, A. Borgida, and H. Hirsh. Computing least common subsumers in description logics. InProceedings of AAAI, pages 754–760. The MIT Press, 1992. [11] W. W. Cohen and H. Hirsh. Learning the Classic description logic: Theoretical and
experimental results. InProceedings of KR’1994, pages 121–133, 1994.
[12] A. R. Divroodi, Q.-T. Ha, L. A. Nguyen, and H. S. Nguyen. On C-learnability in description logics. In Proceedings of ICCCI’2012 (1), volume 7653 of LNCS, pages 230–238. Springer, 2012.
[13] A. R. Divroodi and L. A. Nguyen. On bisimulations for description logics. InProceedings of CS&P’2011, pages 99–110, 2011.
[14] A. R. Divroodi and L. A. Nguyen. On bisimulations for description logics. Inf. Sci., 295:465–493, 2015.
[15] N. Fanizzi, C. d’Amato, and F. Esposito. DL-FOIL concept learning in description logics. InProceedings of ILP’2008, LNCS, pages 107–121. Springer-Verlag, 2008. [16] N. Fanizzi, C. d’Amato, and F. Esposito. Towards the induction of terminological
decision trees. In Proceedings of the 2010 ACM Symposium on Applied Computing, SAC’2010, pages 1423–1427. ACM, 2010.
[17] N. Fanizzi, S. Ferilli, L. Iannone, I. Palmisano, and G. Semeraro. Downward refinement in theALN description logic. InProceedings of HIS’2004, pages 68–73. IEEE Computer Society, 2004.
[18] M. J. Fischer and R. E. Ladner. Propositional dynamic logic of regular programs. Journal of Computer and System Sciences, 18(2):194–211, 1979.
[19] M. Frazier and L. Pitt. Classic learning. Machine Learning, 25(2-3):151–193, 1996. [20] G. D. Giacomo and M. Lenzerini. Boosting the correspondence between description
logics and propositional dynamic logics. InIn Proceedings of AAAI’94, pages 205–212. AAAI Press, 1994.
[21] M. R. Hacene, M. Huchard, A. Napoli, and P. Valtchev. Relational concept analysis: mining concept lattices from multi-relational data. Ann. Math. Artif. Intell., 67(1):81– 108, 2013.
[22] M. Hennessy and R. Milner. Algebraic laws for nondeterminism and concurrency. Jour- nal of the ACM, 32(1):137–161, 1985.
[23] B. Hollunder. Hybrid inferences in kl-one-based knowledge representation systems. In H. Marburger, editor, GWAI-90 14th German Workshop on Artificial Intelligence,