1. Trang chủ
  2. » Luận Văn - Báo Cáo

Luận án tiến sĩ nghiên cứu phương pháp tìm kiếm ngữ nghĩa sử dụng ontology và ứng dụng xây dựng hệ thống tra cứu tìm kiếm văn bản mẫu bệnh

115 1 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Nội dung

BỘ QUỐC PHÒNG HỌC VIỆN KỸ THUẬT QUÂN SỰ NGUYỄN HỒNG SƠN NGHIÊN CỨU PHƯƠNG PHÁP TÌM KIẾM NGỮ NGHĨA SỬ DỤNG ONTOLOGY VÀ ỨNG DỤNG XÂY DỰNG HỆ THỐNG TRA CỨU, TÌM KIẾM VĂN BẢN MẪU BỆNH LUẬN ÁN TIẾN SĨ HÀ NỘI BỘ QUỐC PHÒNG HỌC VIỆN KỸ THUẬT QUÂN SỰ NGUYỄN HỒNG SƠN NGHIÊN CỨU PHƯƠNG PHÁP TÌM KIẾM NGỮ NGHĨA SỬ DỤNG ONTOLOGY VÀ ỨNG DỤNG XÂY DỰNG HỆ THỐNG TRA CỨU, TÌM KIẾM VĂN BẢN MẪU BỆNH Chuyên ngành: Cơ sở toán học cho tin học Mã số: 46 01 10 LUẬN ÁN TIẾN SĨ NGƯỜI HƯỚNG DẪN KHOA HỌC: TS Dương Trọng Hải TS Hoa Tất Thắng HÀ NỘI LỜI CAM ĐOAN Tôi xin cam đoan luận án cơng trình nghiên cứu tác giả thực hướng dẫn tập thể cán hướng dẫn Luận án có sử dụng thơng tin trích dẫn từ nhiều nguồn tham khảo khác nhau, thơng tin trích dẫn ghi rõ nguồn gốc Các số liệu thực nghiệm, kết nghiên cứu trình bày luận án hồn tồn trung thực, chưa cơng bố tác giả hay cơng trình khác Nghiên cứu sinh Nguyễn Hồng Sơn LỜI CẢM ƠN Luận án hồn thành Bộ mơn Hệ thống thông tin thuộc Khoa Công nghệ thông tin - Học viện Kỹ thuật Quân với hướng dẫn khoa học TS Dương Trọng Hải TS Hoa Tất Thắng Tác giả xin bày tỏ lòng biết ơn sâu sắc đến thầy tận tình hướng dẫn, động viên tạo điều kiện tốt cho NCS hồn thành luận án Trong suốt q trình làm luận án, tác giả ln nhận động viên, giúp đỡ góp ý tận tình thầy cô Bộ môn Hệ thống thông tin thầy cô Học viện Kỹ thuật Qn Bên cạnh NCS cịn tạo điều kiện hỗ trợ anh chị chuyên viên Phòng Đào tạo Sau đại học Học viện Kỹ thuật Quân Tác giả xin chân thành cảm ơn giúp đỡ q báu NCS ln hỗ trợ, tạo điều kiện Phịng Đào tạo, Phịng Tổ chức- Hành lãnh đạo Trường Đại học Luật, Đại học Huế; thầy cô, đồng nghiệp nơi công tác Tác giả xin bày tỏ lịng biết ơn đến thầy cơ, đồng nghiệp quý Phòng Ban Trường Đại họcLuật, Đại học Huế Trong trình làm luận án, NCS nhận giúp đỡ, đóng góp ý kiến từ nhiều nhà khoa học PGS.TS Trần Nguyên Ngọc, PGS.TS Bùi Thu Lâm, PGS.TS Ngô Thành Long, TS Tống Minh Đức, TS Nguyễn Văn Giang, TS Nguyễn Mạnh Hùng, PGS.TS Nguyễn Long Giang, PGS.TS Đoàn Văn Ban, PGS.TS Đặng Văn Đức, PGS.TS Nguyễn Ngọc Hóa nhiều cá nhân khác Tác giả xin chân thành cảm ơn giúp đỡ quí báu nhà khoa học, cá nhân Để hồn thành luận án mình, NCS nhận hỗ trợ vô to lớn gia đình, NCS xin phép dành lời cảm ơn đặc biệt cho gia đình MỤC LỤC Trang LỜI CAM ĐOAN .1 LỜI CẢM ƠN .2 MỤC LỤC DANH MỤC CÁC HÌNH VẼ, SƠ ĐỒ .6 DANH MỤC CÁC BẢNG BIỂU DANH MỤC THUẬT NGỮ CHUYÊN NGÀNH DANH MỤC CHỮ VIẾT TẮT .10 MỞ ĐẦU 11 Tính cấp thiết đề tài luận án 11 Mục tiêu đề tài luận án 13 Đối tượng phạm vi nghiên cứu đề tài luận án 14 Nội dung nghiên cứu đề tài luận án 14 Phương pháp nghiên cứu đề tài luận án .14 Những điểm đề tài luận án 15 Ý nghĩa khoa học thực tiễn đề tài luận án 15 Cấu trúc luận án 16 CHƯƠNG KIẾN THỨC CƠ SỞ 19 1.1 Ontology 19 1.1.1 Khái niệm Ontology .19 1.1.2 Ứng dụng Ontology 20 1.1.3 Các ngôn ngữ Ontology 21 1.1.4 Tiến trình xây dựng ontology 22 1.2 Trích rút thơng tin từ văn 25 1.2.1 Trích rút đặc trưng phổ biến 26 1.2.2 Trích rút quan hệ ngữ nghĩa văn .29 1.3 Các mơ hình tìm kiếm 30 1.3.1 Tìm kiếm tương tác .30 1.3.2 Tìm kiếm ngữ nghĩa 31 1.4 Luật kết hợp 34 1.4.1 Giới thiệu .34 1.4.2 Thuật toán Apriori 36 1.5 Kết chương .38 CHƯƠNG TÌM KIẾM NGỮ NGHĨA DỰA TRÊN NỘI DUNG VĂN BẢN 39 2.1 Trích rút triple dựa mơ hình ngữ pháp 39 2.1.1 Trích rút triple 39 2.1.2 Quy trình trích rút thơng tin văn 44 2.1.3 Đánh giá .44 2.2 Tìm kiếm đa diện liệu văn 46 2.2.1 Xây dựng tham chiếu định hướng xử lý nhập nhằng sử dụng Wikipedia 47 2.2.2 Xây dựng khơng gian tìm kiếm ngữ nghĩa sử dụng tham chiếu định hướng xử lý nhập nhằng .50 2.2.3 Đánh giá kết trích rút liệu định hướng lý nhập nhằng từ Wikipedia Disambiguation .52 2.3 Phương pháp cá nhân hóa facet tìm kiếm đa diện 53 2.4 Kết chương .55 CHƯƠNG TÌM KIẾM NGỮ NGHĨA CÓ TƯƠNG TÁC .57 3.1 Sử dụng luật kết hợp tìm kiếm ngữ nghĩa thơng tin bệnh .57 3.2 Luật kết hợp Ontology bệnh (ASO - Associate rules in Disease Ontology) .61 3.3 Đánh giá 70 3.3.1 Đánh giá độ xác độ bao phủ 70 3.3.2 Kết 71 3.4 Kết chương .72 CHƯƠNG XÂY DỰNG HỆ THỐNG TRA CỨU, TÌM KIẾM NGỮ NGHĨA THƠNG TIN BỆNH 73 4.1 Tổng quan hệ thống tìm kiếm ngữ nghĩa thông tin bệnh .73 4.2 Xây dựng Ontology bệnh .73 4.2.1 Lựa chọn Disease Ontology 73 4.2.2 Dịch tự động Google Translation 75 4.2.3 Tinh chỉnh bán tự động 77 4.2.4 Chỉnh sửa công tác Ontology bệnh 80 4.3 Thu thập liệu 81 4.4 Xây dựng phương pháp tìm kiếm ngữ nghĩa có tương tác điều hướng luồng tìm kiếm .83 4.5 Xây dựng hệ thống 84 4.5.1 Cấu trúc sở liệu (Disease Schema 84 4.5.2 Khung tìm kiếm 86 4.6 Kết chương .89 KẾT LUẬN VÀ CÁC NGHIÊN CỨU TIẾP THEO 91 Kết luận .91 Các nghiên cứu 92 DANH MỤC CÁC CƠNG TRÌNH KHOA HỌC ĐÃ CƠNG BỐ CỦA TÁC GIẢ CĨ LIÊN QUAN ĐẾN LUẬN ÁN 93 TÀI LIỆU THAM KHẢO .94 PHỤ LỤC 108 DANH MỤC CÁC HÌNH VẼ, SƠ ĐỒ Trang Hình 1.1 Q trình trích rút thực thể văn khơng cấu trúc [2] 28 Hình 1.2 Ví dụ tìm kiếm đa diện giải thích khái niệm liên quan [CNET faceted search] 34 Hình 2.1 Mơ hình cú pháp (Syntax Model) – phần 41 Hình 2.2 Mơ hình cú pháp (Syntax Model) – phần 42 Hình 2.3 Các bước xử lý câu 43 Hình 2.4 Số ba trích rút xác tổng số ba trích rút 45 Hình 2.5 Trang liệu định hướng xử lý nhập nhằng từ Java Wikipedia Disambiguation 49 Hình 2.6 Phân loại facet từ Java theo Wikipedia Disambiguation 49 [CTLA5] 49 Hình 2.7 Q trình xây dựng khơng gian tìm kiếm ngữ nghĩa 50 [CTLA5] 50 Hình 2.8 Sơ đồ kết tìm kiếm dự kiến .51 Hình 3.1 Hộp tìm kiếm 58 Hình 3.2 Hộp tìm kiếm hệ thống tìm kiếm ngữ nghĩa có tương tác 60 Hình 3.3 Danh sách triệu chứng ẩn hệ thống gợi ý 60 Hình 3.4 Kết ban đầu gợi ý triệu chứng ẩn 61 Hình 3.5 Kết sau người dùng tương tác 61 Hình 3.7 Quan hệ subclass Ontology bệnh 70 Hình 3.8 So sánh Apriori ASO-Apriori 71 Hình 4.1 Hệ thống tìm kiếm ngữ nghĩa thơng tin bệnh .73 Hình 4.2 Cấu trúc DO 75 Hình 4.3 Sử dụng Google Translate 76 Hình 4.4 Google Translate dịch chưa xác cụm từ “abdominal pain” “stomach pain” 77 Hình 4.5 Lưu đồ bước xây dựng ontology bệnh phiên tiếng Việt 77 Hình 4.6 Tài liệu ICD-10 song ngữ Việt - Anh .78 Hình 4.7 Một ví dụ xác định triệu chứng bệnh 79 Hình 4.8 Một phần Ontology bệnh 79 Hình 4.9 Miêu tả thơng tin số thuộc tính file exel liệu 82 Hình 4.10 Hơn 3.000 bệnh thu thập từ sở y tế 83 Hình 4.11 Hệ thống gợi ý từ khóa 84 Hình 4.12 Cấu trúc sở liệu bệnh 85 Hình 4.13 Autocomplete khung tìm kiếm 86 Hình 4.14 Gợi ý từ khóa liên quan khung tìm kiếm 87 Hình 4.15 Hiển thị kết tìm kiếm bệnh 89 Hình PL1.1 Mơ tả bệnh 108 Hình PL1.2 Giải phẩu bệnh 109 Hình PL1.3 Dịch tễ học 109 Hình PL1.4 Yếu tố nguy 110 Hình PL1.5 Bệnh sử 110 Hình PL1.6 Lâm sàng - cận lâm sàng 111 Hình PL1.7 Chuẩn đốn .111 Hình PL1.8 Điều trị .112 Hình PL2.1 Xét nghiệm 112 Hình PL2.2 Khái niệm bệnh, có đầy đủ thơng tin nguyên nhân, triệu chứng, lưu trú, vật gây bệnh 113 Hình PL2.3 Các sở liệu bệnh khác tham chiếu 113 DANH MỤC CÁC BẢNG BIỂU Trang Bảng 2.1 Bảng mẫu sử dụng động từ tiếng Anh [17] .39 Bảng 2.2 Mẫu liệu trích rút ứng với facet Places từ Java 52 Bảng 2.3 So sánh tài liệu/facet trích xuất với liệu chuẩn .53 Bảng 2.4 Kết thử nghiệm cá nhân hố tìm kiếm đa diện .55 Bảng 3.1 Dữ liệu DiseaseRule 59 Bảng 3.2 Các mối quan hệ Ontology bệnh 65 Bảng 4.1 Thông tin sở liệu 85

Ngày đăng: 26/06/2023, 19:12

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w