1. Trang chủ
  2. » Luận Văn - Báo Cáo

Nghiên cứu phương pháp tìm kiếm ngữ nghĩa sử dụng Ontology và ứng dụng xây dựng hệ thống tra cứu tìm kiếm văn bản mẫu bệnh

112 78 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Cấu trúc

  • RDF (Resource Description Framework)

  • DAML+OIL (DARPA Agent Markup Language + Ontology Inference Layer)

  • OWL (Ontology Web Language)

  • Giai đoạn 1 - Chuẩn bị

  • a) Tiêu chuẩn thiết kế

  • b) Thiết kế lõi ontology

  • Giai đoạn 2 – Phát triển ban đầu

  • Giai đoạn 3 – Phát triển và nâng cấp

  • TF-IDF trích rút thông tin văn bản

  • Sử dụng NER trong trích rút thông tin văn bản

  • Giới thiệu về tìm kiếm ngữ nghĩa

  • Các công trình nghiên cứu về tìm kiếm ngữ nghĩa

  • Tìm kiếm đa diện

  • * Tư tưởng chính của thuật toán Apriori

  • * Thuật toán Apriori

  • Apriori (T, ) {

  • Dt {c  Ck | c  t}

  • Lk {c  Ck | count|c| }

    • * Độ phức tạp thuật toán

    • * Thuật toán ASO-Apriori dựa trên 02 nguyên tắc sau:

    • * Tư tưởng chính của thuật toán ASO-Apriori

    • * Thuật toán ASO-Apriori

  • ASO-Apriori-GenFrequentSymptom (T, I, ) {

    • * Độ phức tạp thuật toán ASO-Apriori-GenFrequentSymptom

    • a) Gợi ý từ khóa tìm kiếm

    • b) Gợi ý từ khóa liên quan

Nội dung

MỞ ĐẦU 1. Tính cấp thiết của đề tài luận án Sự bùng nổ lượng thông tin người dùng Internet, cũng như sự phát triển của dữ liệu lớn (Big data) đưa đến một cơ hội mới và cũng là một thách thức cho bài toán tìm kiếm thông tin. Khi tìm kiếm thông tin, người dùng có nhu cầu muốn có kết quả chính xác, nhiều thông tin nhất liên quan đến các từ khóa đầu vào. Người dùng cũng cần được máy tính hỗ trợ đưa ra các từ khóa, thông tin liên quan để tiếp tục quá trình tìm kiếm, do họ chưa thực rõ nội dung tìm kiếm. Ví dụ, khi làm việc với hệ thống hỗ trợ tìm kiếm thông tin bệnh, ban đầu người sử dụng chỉ có một vài triệu chứng bệnh ban đầu và muốn biết xem những triệu chứng đó là của bệnh gì, họ cần hệ thống khuyến nghị các triệu chứng bệnh liên quan để chọn và xác nhận, dần dần làm rõ quá trình tìm kiếm cho đến khi tìm được câu trả lời cuối cùng. Cách tìm kiếm thông tin phổ biến hiện nay là tìm kiếm những tài liệu trong số các tài liệu đã lưu trong cơ sở dữ liệu (CSDL), các tài liệu này có nội dung phù hợp với nhu cầu thông tin cần tìm kiếm. Hiện nay, các hệ thống tìm kiếm văn bản phần lớn vẫn dựa trên cách sử dụng từ khóa. Khi đó người dùng phải diễn đạt nội dung mình cần tìm kiếm dưới dạng các từ khoá tổng quát nhất và phải đảm bảo mối quan hệ ngữ nghĩa giữa các từ khóa (cụm từ khoá) với nội dung cần tìm. Do vậy, vấn đề khó khăn đối với người dùng khi tìm kiếm thông tin dựa trên từ khóa là ở khả năng họ mô tả thông tin cần tìm dưới dạng các từ khóa một cách chính xác nhất và chuyển nhu cầu tìm kiếm này thành dạng thức truy vấn, phù hợp với hệ thống. Đặc biệt,khi người dùng ít kinh nghiệm hoặc không thể đặc tả đúng từ khóa có liên quan đến nội dung cần tìm kiếm. Nếu người dùng không hiểu về chuyên môn họ rất khó tìm được các tài liệu mong muốn. Điều này sẽ được thể hiện rất rõ khi người dùng tìm kiếm bệnh dựa trên các triệu chứng ban đầu chưa được biểu đạt rõ ràng. Hiện nay, các trang tìm kiếm thông tin về bệnh chủ yếu mới dừng ở chế độ tra cứu tuần tự, từng mục triệu chứng cần tra cứu. Người dùng phải tự đọc nhiều kết quả tìm kiếm để tìm được thông tin cần tham khảo. Làm như vậy sẽ mất rất nhiều thời gian, hiệu quả đem lại không cao và thường kém chính xác. Đây chính là lý do cơ bản làm cho các hệ thống tìm kiếm hiện nay trả về kết quả không hoàn toàn đáp ứng các yêu cầu đặt ra của người sử dụng không chuyên. Các hệ thống tìm kiếm thông tin hiện tại còn tiếp cận theo kỹ thuật tìm kiếm đa diện, với điều kiện thông tin văn bản đã được lưu trữ theo phân lớp đa diện (facets) [5]. Ưu điểm của hệ thống tìm kiếm đa diện là cho phép người dùng dễ dàng chọn lựa các thuộc tính cùng với các giá trị mong muốn để dễ đi đến kết quả tìm kiếm cuối cùng. Tuy nhiên, các facets thường phải được thiết kế trước, phải xác định các giá trị cụ thể của các thuộc tính. Điều này hạn chế sự mềm dẻo trong tìm kiếm, chỉ phù hợp với các trang thông tin giải trí, thương mại điện tử. Cách tiếp cận tìm kiếm tương tác (Interactive search) [4], [91], [105], [109] đòi hỏi hệ thống phải tương tác với người dùng thiết kế dần dần kết quả tìm kiếm tương ứng, phù hợp với ý định tìm kiếm của người dùng. Kỹ thuật này được dùng nhiều trong tìm kiếm hình ảnh [105] nhằm lọc hình ảnh, có sự phản hồi qua lại với người dùng. Tuy nhiên, sự tương tác vẫn phụ thuộc vào kiến thức chuyên môn sử dụng kinh nghiệm và trực giác của người dùng để hướng dẫn quá trình tìm kiếm. Tiếp cận tìm kiếm ngữ nghĩa (Semantic search) ) [36], [38], [75] cho phép tăng độ chính xác việc trích lọc thông tin, bằng cách nắm được ý định tìm kiếm của người dùng, cũng như ngữ cảnh để từ khóa được đặt trong không gian dữ liệu tìm kiếm: Nghiên cứu cấu trúc câu truy vấn [75], [77], phân tích phiên giao dịch 15], [33], [38], phân tích ý định của người dùng sau các lần nhấn chuột [33], [59] và phân nhóm ngữ nghĩa trong hệ thống hỏi đáp cộng đồng [30]. Tuy nhiên, việc xây dựng một hệ thống tìm kiếm ngữ nghĩa cho đến nay vẫn còn là bài toán khó,do nhiều vấn đề vẫn chưa có lời giải tối ưu [2], [4]. Ngoài ra, việc xây dựng sẵn cơ sở tri thức miền ứng dụng gặp nhiều khó khăn,tốn chi phí xây dựng và duy trì, cần can thiệp của người quản trị, phụ thuộc vào tri thức chuyên gia miền ứng dụng, phụ thuộc vào ngôn ngữ [5], [6]. Luận án nghiên cứu kết hợp các kỹ thuật tìm kiếm ngữ nghĩa để hỗ trợ người dùng xác định dần dần câu truy vấn mong muốn. Đề tài “Nghiên cứu phương pháp tìm kiếm ngữ nghĩa sử dụng Ontology và ứng dụng xây dựng hệ thống tra cứu, tìm kiếm văn bản mẫu bệnh” của luận án sẽ khai thác, tích hợp các ontology được thiết kế xây dựng nhằm biểu thị tri thức chuyên gia trong lĩnh vực bệnh học, được làm giàu thông tin với các luật kết hợp để hướng người dùng dần dần hình thành câu truy vấn. Cách tiếp cận này sẽ tạo ra cách tìm kiếm ngữ nghĩa có tương tác giữa người dùng và hệ thống tìm kiếm. Để xây dựng được hệ thống tìm kiếm ngữ nghĩa có tương tác, các vấn đề liên quan được luận án nghiên cứu,bao gồm: xây dựng ontology bệnh, trích rút đặc trưng đối tượng văn bản (dưới dạng các bộ ba triples thông tin thực thể), và xác định các luật kết hợp gắn với thuộc tính của ontology bệnh để có thể ứng dụng thử nghiệm trong hệ thống tìm kiếm ngữ nghĩa có tương tác thông tin bệnh. 2. Mục tiêu của đề tài luận án Mục tiêu chung Nghiên cứu các phương pháp xây dựng hệ thống tìm kiếm ngữ nghĩa có tương tác và ứng dụng trong Hệ thống tìm kiếm ngữ nghĩa có tương tác thông tin bệnh. Mục tiêu cụ thể - Nghiên cứu phương pháp thu thập thông tin và tri thức trong tìm kiếm ngữ nghĩa; - Nghiên cứu phương pháp xây dựng, tổ chức lưu trữ, quản lý và khai thác sử dụng tri thức dưới dạng ontology;

1 HỌC VIỆN KỸ THUẬT QUÂN SỰ NGUYỄN HỒNG SƠN NGHIÊN CỨU PHƯƠNG PHÁP TÌM KIẾM NGỮ NGHĨA SỬ DỤNG ONTOLOGY VÀ ỨNG DỤNG XÂY DỰNG HỆ THỐNG TRA CỨU, TÌM KIẾM VĂN BẢN MẪU BỆNH LUẬN ÁN TIẾN SĨ HÀ NỘI –2020 MỤC LỤC Trang LỜI CAM ĐOAN LỜI CẢM ƠN MỤC LỤC .3 DANH MỤC CÁC HÌNH VẼ, SƠ ĐỒ DANH MỤC CÁC BẢNG BIỂU DANH MỤC THUẬT NGỮ CHUYÊN NGÀNH DANH MỤC CHỮ VIẾT TẮT 10 MỞ ĐẦU 11 Tính cấp thiết đề tài luận án 11 Mục tiêu đề tài luận án 13 Đối tượng phạm vi nghiên cứu đề tài luận án 14 Nội dung nghiên cứu đề tài luận án 14 Phương pháp nghiên cứu đề tài luận án .14 Những điểm đề tài luận án 15 Ý nghĩa khoa học thực tiễn đề tài luận án 15 Cấu trúc luận án 16 CHƯƠNG KIẾN THỨC CƠ SỞ 19 1.1 Ontology 19 1.1.1 Khái niệm Ontology .19 1.1.2 Ứng dụng Ontology 20 1.1.3 Các ngôn ngữ Ontology 21 1.1.4 Tiến trình xây dựng ontology 22 1.2 Trích rút thơng tin từ văn 25 1.2.1 Trích rút đặc trưng phổ biến 26 1.2.2 Trích rút quan hệ ngữ nghĩa văn .29 1.3 Các mô hình tìm kiếm 30 1.3.1 Tìm kiếm tương tác .30 1.3.2 Tìm kiếm ngữ nghĩa 31 1.4 Luật kết hợp 34 1.4.1 Giới thiệu .34 1.4.2 Thuật toán Apriori 36 1.5 Kết chương .38 CHƯƠNG TÌM KIẾM NGỮ NGHĨA DỰA TRÊN NỘI DUNG VĂN BẢN 39 2.1 Trích rút triple dựa mơ hình ngữ pháp 39 2.1.1 Trích rút triple 39 2.1.2 Quy trình trích rút thơng tin văn 44 2.1.3 Đánh giá .44 2.2 Tìm kiếm đa diện liệu văn 46 2.2.1 Xây dựng tham chiếu định hướng xử lý nhập nhằng sử dụng Wikipedia 47 2.2.2 Xây dựng khơng gian tìm kiếm ngữ nghĩa sử dụng tham chiếu định hướng xử lý nhập nhằng .50 2.2.3 Đánh giá kết trích rút liệu định hướng lý nhập nhằng từ Wikipedia Disambiguation .52 2.3 Phương pháp cá nhân hóa facet tìm kiếm đa diện 53 2.4 Kết chương .55 CHƯƠNG TÌM KIẾM NGỮ NGHĨA CĨ TƯƠNG TÁC 57 3.1 Sử dụng luật kết hợp tìm kiếm ngữ nghĩa thơng tin bệnh .57 3.2 Luật kết hợp Ontology bệnh (ASO - Associate rules in Disease Ontology) 61 3.3 Đánh giá 70 3.3.1 Đánh giá độ xác độ bao phủ 70 3.3.2 Kết 71 3.4 Kết chương .72 CHƯƠNG XÂY DỰNG HỆ THỐNG TRA CỨU, TÌM KIẾM NGỮ NGHĨA THÔNG TIN BỆNH 73 4.1 Tổng quan hệ thống tìm kiếm ngữ nghĩa thơng tin bệnh 73 4.2 Xây dựng Ontology bệnh .73 4.2.1 Lựa chọn Disease Ontology 73 4.2.2 Dịch tự động Google Translation 75 4.2.3 Tinh chỉnh bán tự động 77 4.2.4 Chỉnh sửa công tác Ontology bệnh 80 4.3 Thu thập liệu 81 4.4 Xây dựng phương pháp tìm kiếm ngữ nghĩa có tương tác điều hướng luồng tìm kiếm .83 4.5 Xây dựng hệ thống 84 4.5.1 Cấu trúc sở liệu (Disease Schema 84 4.5.2 Khung tìm kiếm 86 4.6 Kết chương .89 KẾT LUẬN VÀ CÁC NGHIÊN CỨU TIẾP THEO .91 Kết luận .91 Các nghiên cứu 92 DANH MỤC CÁC CƠNG TRÌNH KHOA HỌC ĐÃ CƠNG BỐ CỦA TÁC GIẢ CĨ LIÊN QUAN ĐẾN LUẬN ÁN 93 TÀI LIỆU THAM KHẢO 94 PHỤ LỤC 108 DANH MỤC CÁC HÌNH VẼ, SƠ ĐỒ Tran Hình 1.1 Q trình trích rút thực thể văn khơng cấu trúc [2] 28 Hình 1.2 Ví dụ tìm kiếm đa diện giải thích khái niệm liên quan [CNET faceted search] 34 Hình 2.1 Mơ hình cú pháp (Syntax Model) – phần .41 Hình 2.2 Mơ hình cú pháp (Syntax Model) – phần .42 Hình 2.3 Các bước xử lý câu 43 Hình 2.4 Số ba trích rút xác tổng số ba trích rút .45 Hình 2.5 Trang liệu định hướng xử lý nhập nhằng từ Java Wikipedia Disambiguation .49 Hình 2.6 Phân loại facet từ Java theo Wikipedia Disambiguation 49 [CTLA5] 49 Hình 2.7 Q trình xây dựng khơng gian tìm kiếm ngữ nghĩa 50 [CTLA5] 50 Hình 2.8 Sơ đồ kết tìm kiếm dự kiến 51 Hình 3.1 Hộp tìm kiếm .58 Hình 3.2 Hộp tìm kiếm hệ thống tìm kiếm ngữ nghĩa có tương tác 60 Hình 3.3 Danh sách triệu chứng ẩn hệ thống gợi ý .60 Hình 3.4 Kết ban đầu gợi ý triệu chứng ẩn 61 Hình 3.5 Kết sau người dùng tương tác 61 Hình 3.7 Quan hệ subclass Ontology bệnh 70 Hình 3.8 So sánh Apriori ASO-Apriori 71 Hình 4.1 Hệ thống tìm kiếm ngữ nghĩa thơng tin bệnh 73 Hình 4.2 Cấu trúc DO 75 Hình 4.3 Sử dụng Google Translate 76 Hình 4.4 Google Translate dịch chưa xác cụm từ “abdominal pain” “stomach pain” 77 Hình 4.5 Lưu đồ bước xây dựng ontology bệnh phiên tiếng Việt 77 Hình 4.6 Tài liệu ICD-10 song ngữ Việt - Anh 78 Hình 4.7 Một ví dụ xác định triệu chứng bệnh 79 Hình 4.8 Một phần Ontology bệnh 79 Hình 4.9 Miêu tả thơng tin số thuộc tính file exel liệu 82 Hình 4.10 Hơn 3.000 bệnh thu thập từ sở y tế 83 Hình 4.11 Hệ thống gợi ý từ khóa .84 Hình 4.12 Cấu trúc sở liệu bệnh 85 Hình 4.13 Autocomplete khung tìm kiếm .86 Hình 4.14 Gợi ý từ khóa liên quan khung tìm kiếm 87 Hình 4.15 Hiển thị kết tìm kiếm bệnh 89 Hình PL1.1 Mơ tả bệnh 108 Hình PL1.2 Giải phẩu bệnh .109 Hình PL1.3 Dịch tễ học 109 Hình PL1.4 Yếu tố nguy 110 Hình PL1.5 Bệnh sử 110 Hình PL1.6 Lâm sàng - cận lâm sàng .111 Hình PL1.7 Chuẩn đốn 111 Hình PL1.8 Điều trị 112 Hình PL2.1 Xét nghiệm 112 Hình PL2.2 Khái niệm bệnh, có đầy đủ thơng tin ngun nhân, triệu chứng, lưu trú, vật gây bệnh 113 Hình PL2.3 Các sở liệu bệnh khác tham chiếu 113 DANH MỤC CÁC BẢNG BIỂU Trang Bảng 2.1 Bảng mẫu sử dụng động từ tiếng Anh [17] .39 Bảng 2.2 Mẫu liệu trích rút ứng với facet Places từ Java 52 Bảng 2.3 So sánh tài liệu/facet trích xuất với liệu chuẩn 53 Bảng 2.4 Kết thử nghiệm cá nhân hố tìm kiếm đa diện .55 Bảng 3.1 Dữ liệu DiseaseRule 59 Bảng 3.2 Các mối quan hệ Ontology bệnh 65 Bảng 4.1 Thông tin sở liệu .85 DANH MỤC THUẬT NGỮ CHUYÊN NGÀNH Ký hiệu Diễn giải Semantic search Tìm kiếm ngữ nghĩa Interactive search Tìm kiếm tương tác Faceted search Tìm kiếm đa diện Search click graph Tìm kiếm cách nhấn chuột chọn lựa biểu đồ Large - scale context embedded vocabulary tree Cây từ vựng ngữ cảnh nhúng cỡ lớn Ontology Bản thể học DANH MỤC CHỮ VIẾT TẮT Chữ viết tắt Tên đầy đủ DO (Disease Ontology) Ontology bệnh DD (Disease Database) Cơ sở liệu bệnh TF (Term frequency) Tần suất xuất từ IDF (Inverse document frequency) Tần suất tài liệu ngược NER (Name Entity Recoginition) Nhận diện thực thể định danh OpenIE (Open Information Extraction) Khai thác thông tin mở IE (Information Extraction) Trích rút thơng tin IR (Information Retrieval) Truy xuất thông tin CSTT-PLB Cơ sở tri thức phân loại bệnh YHTT Y học thường thức OWL (Web Ontology Language) Ngôn ngữ ontology web XML (Extensible Markup Language) Ngôn ngữ đánh dấu văn mở rộng W3C (World Wide Web Consortium) Hiệp hội web toàn cầu ICD (International Statistical Classification of Diseases and Related Health Problems) Phân loại thống kê quốc tế bệnh vấn đề sức khỏe liên quan CSDL Cơ sở liệu 10 MỞ ĐẦU Tính cấp thiết đề tài luận án Sự bùng nổ lượng thông tin người dùng Internet, phát triển liệu lớn (Big data) đưa đến hội thách thức cho tốn tìm kiếm thơng tin Khi tìm kiếm thơng tin, người dùng có nhu cầu muốn có kết xác, nhiều thơng tin liên quan đến từ khóa đầu vào Người dùng cần máy tính hỗ trợ đưa từ khóa, thơng tin liên quan để tiếp tục trình tìm kiếm, họ chưa thực rõ nội dung tìm kiếm Ví dụ, làm việc với hệ thống hỗ trợ tìm kiếm thơng tin bệnh, ban đầu người sử dụng có vài triệu chứng bệnh ban đầu muốn biết xem triệu chứng bệnh gì, họ cần hệ thống khuyến nghị triệu chứng bệnh liên quan để chọn xác nhận, làm rõ trình tìm kiếm tìm câu trả lời cuối Cách tìm kiếm thơng tin phổ biến tìm kiếm tài liệu số tài liệu đã lưu sở liệu (CSDL), tài liệu có nội dung phù hợp với nhu cầu thơng tin cần tìm kiếm Hiện nay, hệ thống tìm kiếm văn phần lớn dựa cách sử dụng từ khóa Khi người dùng phải diễn đạt nội dung cần tìm kiếm dạng từ khoá tổng quát phải đảm bảo mối quan hệ ngữ nghĩa từ khóa (cụm từ khố) với nội dung cần tìm Do vậy, vấn đề khó khăn người dùng tìm kiếm thơng tin dựa từ khóa khả họ mơ tả thơng tin cần tìm dạng từ khóa cách xác chuyển nhu cầu tìm kiếm thành dạng thức truy vấn, phù hợp với hệ thống Đặc biệt,khi người dùng kinh nghiệm khơng thể đặc tả từ khóa có liên quan đến nội dung cần tìm kiếm Nếu người dùng khơng hiểu chun mơn họ khó tìm tài liệu mong muốn Điều thể rõ người dùng tìm kiếm bệnh dựa triệu chứng ban đầu chưa biểu đạt rõ ràng Hiện nay, trang tìm 98 [44] Henrik Eriksso, The semantic-document approach to combining documents and ontologies, International Journal of HumanComputer Studies Volume 65, Issue 7, July 2007, Pages 624-639 [45] Henriksen, A.D and A.J Traynor, A practical R&D projectselection scoring tool IEEE Transactions on Engineering Management, 1999 46(2): p.158-170 [46] Ho Chung Wu, Robert Wing Pong Luk, Kam Fai Wong, and Kui Lam Kwok 2008 Interpreting TF-IDF term weights as making relevance decisions ACM Trans Inf Syst 26, 3, Article 13 (June 2008), 37 pages DOI=http://dx.doi.org/10.1145/1361684.1361686 [47] Holsapple C.W (2002), K.D Joshi, Collaborative Approach in Ontology Design, Communications of the ACM, 45, 42 – 47 [48] Homma, Y., et al., A Hierarchical Neural Network for Information Extraction of Product Attribute and Condition Sentences OKBQA 2016, 2016: p 21 [49] Hung, C and S Wermter, Neural network based document clustering using wordnet ontologies International Journal of Hybrid Intelligent Systems, 2004 1(3, 4): p 127-142 [50] Huynh, A.L., H.S Nguyen, and T.H Duong, Triple Extraction Using Lexical Pattern-based Syntax Model, in Advanced Computational Methods for Knowledge Engineering 2016, Springer p 265-279 [51] Huynh, M.C., P.D.T Le, and T.H Duong, Improved Vector Space Model TF/IDF Using Lexical Relations International Journal of Advanced Computer Research, 2015 5(21): p 334 [52] Jacso, P., Columns and News-Internet Insights-Thoughts About Federated Searching-Peter Jacso discusses the consolidated 99 retrieval of results in response to a query sent to several databases Information Today, 2004 21(9): p 17-27 [53] Jan Paralic and Ivan Kostial, Ontology-based Information Retrieval, Proc of the 14th International Conference on Information and Intelligent systems, IIS 2003, p 23-28 [54] Jaynes, E.T., Bayesian methods: General background, 1986 [55] Kalchbrenner, N., E Grefenstette, and P Blunsom, A convolutional neural network for modelling sentences arXiv preprint arXiv:1404.2188, 2014 [56] Karapiperis, S and D Apostolou, Consensus building in collaborative ontology engineering processes Journal of Universal Knowledge Management, 2006 1(3): p 199-216 [57] Kim, J.-T and D.I Moldovan,Acquisition of semantic patterns for information extraction from corpora in Artificial Intelligence for Applications, 1993, Proceedings, Ninth Conference on 1993, IEEE [58] Konys Agnieszka Ontology-Based Approaches to Big Data Analytics International Multi-Conference on Advanced Computer Systems, ACS 2016, pp 355-365 [59] Lamma E., F Riguzzi, and S Storari, Exploiting Association and Correlation Rules-Parameters for Improving the K2 Algorithm in ECAI, 2004 [60] Lawrence, Steve, et al,Face recognition: A convolutional neural-network approach IEEE transactions on neural networks 8.1 (1997): 98-113 [61] Leskovec, J., M Grobelnik, and N Milic-Frayling,Learning substructures of document semantic graphs summarization in LinkKDD Workshop, 2004 for document 100 [62] Lin, C.-Y Automatic question generation from queries in Workshop on the question generation shared task, 2008 [63] Loni, B., et al Bayesian Personalized Ranking with Multi-Channel User Feedback in Proceedings of the 10th ACM Conference on Recommender Systems, 2016 ACM [64] Lytvyn, V., et al., Classification Methods of Text Documents Using Ontology Based Approach, in Advances in Intelligent Systems and Computing 2017, Springer p 229-240 [65] M A Bramer, Knowledge Discovery and Data Mining, Institution of Electrical Engineers Stevenage, ISBN:0-85296-767-5, UK ©1999 [66] Ma, J., et al., An ontology-based text-mining method to cluster proposals for research project selection IEEE Transactions on Systems, Man, and Cybernetics-Part A: Systems and Humans, 2012 42(3): p 784-790 [67] McDonald, G.C., Applications of subset selection procedures and Bayesian ranking methods in analysis of traffic fatality data Wiley Interdisciplinary Reviews: Computational Statistics, 2016, 8(6): p.222-237 [68] Michael C Daconta, Leo J Obrst and Kevin T Smith (2003),The Semantic Web: A Guide to the Future of XML, Web Services, and Knowledge Management, John Wiley & Sons Inc [69] Milias-Argeitis, A., et al., Elucidation of Genetic Interactions in the Yeast GATA-Factor Network Using Bayesian Model Selection PLoS Comput Biol, 2016 12(3): p e1004784 [70] Mohammad Hossein Namaki, Yinghui Wu, Qi Song, Peng Lin, and Tingjian Ge 2017 Discovering Graph Temporal Association Rules 101 In Proceedings of the 2017 ACM on Conference on Information and Knowledge Management (CIKM '17) ACM, New York, NY, USA, 1697-1706 DOI: https://doi.org/10.1145/3132847.3133014 [71] Nadeau, D and S Sekine, A survey of named entity recognition and classification Lingvisticae Investigationes, 2007 30(1): p 3-26 [72] Noy, N.F and D.L McGuinness, Ontology development 101: A guide to creating your first ontology 2001, Stanford knowledge systems laboratory technical report KSL-01-05 and Stanford medical informatics technical report SMI-2001-0880, Stanford, CA [73] Ontology triệu chứng http://bioportal.bioontology.org/ontologies/SYMP? p=classes&conceptid=http%3A%2F%2Fpurl.obolibrary.org%2Fobo %2FSYMP_0000375 [74] Pan, W., et al., Adaptive Bayesian personalized ranking for heterogeneous implicit feedbacks Knowledge-Based Systems, 2015 73: p 173-180 [75] Patil, N., A.S Patil, and B Pawar, Survey of Named Entity Recognition Systems with respect to Indian and Foreign Languages International Journal of Computer Applications, 2016 134(16) [76] Ranga Chandra Gudivadaa, Xiaoyan A Qua, Jing Chena, Anil G Jeggab, Eric K Neumannd, Bruce J Aronow, Identifying diseasecausal genes using Semantic Web-based representation of integrated genomic and phenomic knowledge, Journal of Biomedical Informatics, Volume 41, Issue 5, October 2008, Pages 717–729 [77] Recknagel, Friedrich, et al Artificial neural network approach for modelling and prediction of algal blooms Ecological Modelling 96.1 (1997): 11-28 102 [78] Ricardo Usbeck, Michael Röder, Peter Haase, Artem Kozlov, Muhammad Saleem, Axel-Cyrille, Ngonga Ngomo Requirements to Modern Semantic Search Engine International Conference on Knowledge Engineering and the Semantic Web KESW 2016: Knowledge Engineering and Semantic Web, pp 328-343 [79] Riloff, E Automatically generating extraction patterns from untagged text in Proceedings of Thenational conference on AI, 1996 [80] Rose, D.E and D Levinson Understanding user goals in web search in Proceedings of the 13th international conference on World Wide Web, 2004 ACM [81] Ruiz, P.P., B.K Foguem, and B Grabot, Generating knowledge in maintenance from Experience Feedback Knowledge-Based Systems, 2014, 68: p.4-20 [82] Salton, G and C Buckley, Term-weighting approaches in automatic text retrieval Information processing & management, 1988, 24(5), p.513-523 [83] Schmitz, M., et al Open language learning for information extraction in Proceedings of the 2012 Joint Conference on Empirical Methods in Natural Language Processing and Computational Natural Language Learning 2012 Association for Computational Linguistics [84] Sharma, Sujeet Kumar, et al Predicting mobile banking adoption: A neural network approach Journal of Enterprise Information Management 29.1, 2016 103 [85] Soderland, S., Learning information extraction rules for semistructured and free text Machine learning, 1999 34(1-3): p 233272 [86] Suchanek, F.M., G Kasneci, and G Weikum Yago: a core of semantic knowledge in Proceedings of the 16th international conference on World Wide Web, 2007, ACM [87] Suresh Pokharel, Mohamed Ahmed Sherif,Jens Lehmann Ontology Based Data Access and Integration for Improving the Effectiveness of Farming in Nepal WI-IAT '14 Proceedings of the 2014 IEEE/WIC/ACM International Joint Conferences on Web Intelligence (WI) and Intelligent Agent Technologies (IAT) – Vol.02, P.319-326 [88] T.H Duong, G S Jo, J.J Jung, and N.T Nguyen, Complexity Analysis of Ontology Integration Methodologies: A Comparative Study, Journal of Universal Computer Science, vol 15, no 4, 2009, pp.877-897 [89] T.H Duong, N.T Nguyen, and G S Jo, A Hybrid Method for Integrating Multiple Ontologies, Cybernetics and Systems, vol 40, no 2, 2009, pp.123-145 [90] T.H Duong, Jo G.S, Collaborative Ontology Building by Reaching Consensus among Participants Information-An International Interdisciplinary Journal, 2010, 1557-1569 [91] T.H Duong, Nguyen N.T., Jo G.S,Constructing and Mining: A Semantic-Based Academic Social Network Journal of Intelligent & Fuzzy Systems21(3), 2010, 197-207 104 [92] T.H Duong, Jo G.S., Enhancing performance and accuracy of ontology integration by propagating priorly matchable concepts, Neurocomputing, 88(1), 2012, pp 3-12 [93] T.H Duong, Ngoc Thanh Nguyen, Cuong Duc Nguyen, Thi Phuong Trang Nguyen, Ali Selamat: Trust-Based Consensus for Collaborative Ontology Building Cybernetics and Systems 45(2), 2014, 146-164 [94] Tang, D., B Qin, and T Liu Document modeling with gated recurrent neural network for sentiment classification in Proceedings of the 2015 Conference on Empirical Methods in Natural Language Processing, 2015 [95] Thomee, B and M.S Lew, Interactive search in image retrieval: a survey International Journal of Multimedia Information Retrieval, 2012 1(2): p 71-86 [96] Tian Q., et al., An organizational decision support system for effective R&D project selection Decision Support Systems, 2005, 39(3): p 403-413 [97] Trappey AJ, Trappey CV, Chiang TA, Huang YH Ontology-based neural network for patent knowledge management in design collaboration International Journal of Production Research, 2013 Apr 1;51(7):1992-2005 [98] Utama, R., J Piekarewicz, and H B Prosper,Nuclear mass predictions for the crustal composition of neutron stars: A Bayesian neural network approach Physical Review C 93.1: 014311, 2016 [99] Vogrinčič S, Bosnić Z Ontology-based multi-label classification of economic articles Computer Science and Information Systems, 2011, 8(1):101-19 105 [100] Wang, H and W.H Huang, Bayesian ranking responses in multipleresponse questions Journal of the Royal Statistical Society: Series A (Statistics in Society), 2014 177(1): p 191-208 [101] Wang, H., D Dou, and D Lowd Ontology-Based Deep Restricted Boltzmann Machine in International Conference on Database and Expert Systems Applications, 2016 Springer [102] Willner A, Giatili M, Grosso P, Papagianni C, Morsey M, Baldin I Using Semantic Web Technologies to Query and Manage Information within Federated Cyber-Infrastructures Data, 2017; 2(3):21 [103] Xavier, C.C., V.L.S de Lima, and M Souza, Open information extraction based on lexical semantics Journal of the Brazilian Computer Society, 2015 21(1): p.1 [104] Xiao, S., et al., Bayesian Networks-based Association Rules and Knowledge Reuse in Maintenance Decision-Making of Industrial Product-Service Systems Procedia CIRP, 2016 47: p 198-203 [105] Yan Guo, Minxi Wang, Xin Li, (2017),Application of an improved Apriori algorithm in a mobile e-commerce recommendation system, Industrial Management & Data Systems, Vol 117 Issue: 2, pp.287303, https://doi.org/10.1108/IMDS-03-2016-0094 [106] Yang Chen, Xiaofeng Ren, Guo-Qiang Zhangz and Rong Xuz, Ontology-guided Approach to Retrieving Disease Manifestation Images for Health Image Base Construction, 2012 IEEE Second Conference on Healthcare Informatics, Imaging and Systems Biology [107] Yang, Z., et al Hierarchical attention networks for document classification in Proceedings of the 2016 Conference of the North 106 American Chapter of the Association for Computational Linguistics: Human Language Technologies, 2016 [108] Yun-tao, Z., Ling, G & Yong-cheng, W J Zheijang An improved TF-IDF approach for text classification Journal of Zhejiang University-SCIENCE, August 2005, Volume 6, Issue 1, pp 49–55 [109] Zhang, C., et al AdaWIRL: A Novel Bayesian Ranking Approach for Personal Big-Hit Paper Prediction in International Conference on Web-Age Information Management 2016 Springer [110] Zhang, N., et al., TapTell: Interactive visual search for mobile task recommendation Journal of Visual Communication and Image Representation, 2015 29: p 114-124 [111] Zhang, Q and Y Song, Moment Matching Based Conjugacy Approximation for Bayesian Ranking and Selection arXiv preprint arXiv:1610.09400, 2016 [112] Zhou, S., S Zhang, and G Karypis, Advanced Data Mining and Applications, 8th International Conference, ADMA 2012, Nanjing, China, December 15-18, 2012, Proceedings Vol 7713 2012: Springer Science & Business Media ******************** 107 PHỤ LỤC CÁC HÌNH ẢNH CỦA HỆ THỐNG TƯƠNG TÁC NGỮ NGHĨA TRONG TRA CỨU/TÌM KIẾM THÔNG TIN BỆNH * Phụ lục 1:Ontology bệnh – Bệnh “Lao kế” Các hình sau (Hình PL1.1 đến Hình PL1.8) thể ví dụ bệnh “Lao kế” Hình PL1.1 Mơ tả bệnh Giải phẫu bệnh: 108 Hình PL1.2 Giải phẩu bệnh Hình PL1.3 Dịch tễ học 109 Hình PL1.4 Yếu tố nguy Hình PL1.5 Bệnh sử 110 Hình PL1.6 Lâm sàng - cận lâm sàng Hình PL1.7 Chuẩn đốn 111 Hình PL1.8 Điều trị * Phụ lục 2:Ontology DO phiên tiếng Việt - Bệnh “Bệnh nấm da chân” từ DO phiên tiếng Việt tinh chỉnh Bệnh “Bệnh nấm da chân” từ Ontology DO phiên tiếng Việt đã tinh chỉnh (Hình PL2.1 đến Hình PL2.4) Hình PL2.1 Xét nghiệm 112 Hình PL2.2 Khái niệm bệnh, có đầy đủ thông tin nguyên nhân, triệu chứng, lưu trú, vật gây bệnh Hình PL2.3 Các sở liệu bệnh khác tham chiếu Hình PL2.4 Tên bệnh tương đồng thường dùng ... thuật tìm kiếm ngữ nghĩa để hỗ trợ người dùng xác định câu truy vấn mong muốn Đề tài Nghiên cứu phương pháp tìm kiếm ngữ nghĩa sử dụng Ontology ứng dụng xây dựng hệ thống tra cứu, tìm kiếm văn mẫu. .. lý thuyết xây dựng ontology; Phương pháp xây dựng làm giàu Ontology bệnh tiếng Việt; 14 Phương pháp xây dựng hệ thống kiếm ngữ nghĩa có tương tác áp dụng xây dựng hệ thống tìm kiếm ngữ nghĩa có... tiêu chung Nghiên cứu phương pháp xây dựng hệ thống tìm kiếm ngữ nghĩa có tương tác ứng dụng Hệ thống tìm kiếm ngữ nghĩa có tương tác thông tin bệnh Mục tiêu cụ thể - Nghiên cứu phương pháp thu

Ngày đăng: 06/05/2020, 08:34

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w