1.2. GIỚI THIỆU CHUNG VỀ HỌC ONTOLOGY
1.2.3. Liên hệ nghiên cứu của luận án vào các khung nhìn khái quát về học
• Các thuật toán khai phá luật kết hợp được sử dụng để phát hiện mối liên kết thú vị giữa các từ.
• Các thuật toán phân cụm phân cấp được sử dụng để phân cụm từ.
• Các thuật toán phân lớp (ví dụ, SVM, Naive Bayes, kNN, v.v.) được sử dụng để phân lớp một khái niệm mới vào một hệ thống thứ bậc hiện có.
• Các thuật toán lập trình logic quy nạp được sử dụng để phát hiện khái niệm mới từ dữ liệu mở rộng.
• Các thuật toán phân cụm khái niệm (ví dụ phân cụm mờ FCA) được dùng để học khái niệm và phân cấp khái niệm.
1.2.3. Liên hệ nghiên cứu của luận án vào các khung nhìn khái quát về học ontology ontology
Các mô hình học ontology trong luận án có nội dung thuộc vào lớp các kỹ thuật Xử lý văn bản, Trích xuất thuật ngữ, Gán nhãn khái niệm như được diễn giải như sau:
• Luận án sử dụng các kỹ thuật xử lý văn bản, trích xuất thuật ngữ và
gán nhãn thuật ngữ trong một mô hình tích hợp hai kho ngữ liệu biểu hiện y sinh. Tiếp đó, một mô hình học ontology nhận diện thực thể biểu hiện y sinh dựa trên học máy Maximum Entropy- Beam Search được tạo ra, một mặt, để phục vụ việc đánh giá hiệu năng kết quả tích hợp hai kho ngữ liệu, và mặt khác, để sử dụng để nhận diện các thực thể biểu hiện ý sinh mới từ các tài liệu PubMed trong tương lại.
• Luận án sử dụng độ đo khoảng cách Google như một độ đo khoảng cách/tương tự trong các kỹ thuật xử lý văn bản trong một mô hình học ontology tích hợp các khái niệm và thuộc tính từ hai ontology.
• Luận án sử dụng các kỹ thuật xử lý văn bản, trích xuất thuật ngữ và một mô hình học máy với một tập thuật ngữ dầu khí tiếng Việt cho trước (tập dữ liệu dương) vào kho ngữ liệu Wikipedia dầu khí tiếng Việt (tập dữ liệu không nhãn) để trích xuất được một tập các thuật ngữ dầu khí tiếng Việt mới từ Wikipedia dầu khí tiếng Việt.