luận văn thạc sĩ ứng dụng mã nguồn mở elasticsearch vào hệ thống tìm kiếm danh bạ y tế hiệu quả

98 8 0
luận văn thạc sĩ ứng dụng mã nguồn mở elasticsearch vào hệ thống tìm kiếm danh bạ y tế hiệu quả

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

NGUYỄN VĂN THÌN BỘ GIÁO DỤC VÀ ĐÀO TẠO VIỆN HÀN LÂM KHOA HỌC VÀ CÔNG NGHỆ VN HỌC VIỆN KHOA HỌC VÀ CƠNG NGHỆ Nguyễn Văn Thìn HỆ THỐNG THÔNG TIN ỨNG DỤNG MÃ NGUỒN MỞ ELASTICSEARCH VÀO HỆ THỐNG TÌM KIẾM DANH BẠ Y TẾ HIỆU QUẢ LUẬN VĂN THẠC SĨ NGÀNH MÁY TÍNH 2021 Thành phố Hồ Chí Minh - 2021 BỘ GIÁO DỤC VÀ ĐÀO TẠO VIỆN HÀN LÂM KHOA HỌC VÀ CÔNG NGHỆ VN HỌC VIỆN KHOA HỌC VÀ CƠNG NGHỆ Nguyễn Văn Thìn ỨNG DỤNG MÃ NGUỒN MỞ ELASTICSEARCH VÀO HỆ THỐNG TÌM KIẾM DANH BẠ Y TẾ HIỆU QUẢ Chuyên ngành : Hệ Thống Thông Tin Mã số : 8480104 LUẬN VĂN THẠC SĨ NGÀNH MÁY TÍNH NGƯỜI HƯỚNG DẪN KHOA HỌC: TS TRẦN TRỌNG TỒN Thành phố Hồ Chí Minh – 2021 i LỜI CAM ĐOAN Tôi cam đoan luận văn “Ứng dụng mã nguồn mở ElasticSearch vào hệ thống tìm kiếm danh bạ y tế hiệu quả” cơng trình nghiên cứu riêng hướng dẫn Thầy TS Trần Trọng Tồn Sự gần gũi nhiệt tình hướng dẫn thầy nguồn động lực lớn suốt thời gian thực Các số liệu, kết nêu luận văn trung thực chưa công bố cơng trình khác Thành phố Hồ Chí Minh, ngày tháng năm 2021 Học viên thực Nguyễn Văn Thìn ii LỜI CẢM ƠN Tơi xin gửi lời cảm ơn sâu sắc đến thầy TS Trần Trọng Toàn tận tình hướng dẫn giúp đỡ tơi suốt trình thực luận văn Cảm ơn quý thầy cô Khoa Công Nghệ Thông Tin Viễn Thông, Thầy Cô Học Viện Khoa học Công Nghệ, quý thầy cô tham gia giảng dạy truyền đạt kiến thức cho thân suốt khóa học 2018 – 2020 Cho phép tơi gửi lời cảm ơn tới bạn, đồng nghiệp thường xuyên quan tâm, giúp đỡ, chia kinh nghiệm suốt thời gian học tập, nghiên cứu Học viện suốt q trình thực luận văn Tơi xin bày tỏ biết ơn sâu sắc đến cha, mẹ, vợ, người thân gia đình ln bên tơi, động viên, dành cho tơi tốt đẹp suốt trình thực luận văn Cuối xin chân thành cảm ơn Công ty Cổ phần MediHub tạo điều kiện giúp thực tốt luận văn Trân trọng cảm ơn! iii MỤC LỤC LỜI CAM ĐOAN i LỜI CẢM ƠN .ii MỤC LỤC iii DANH MỤC VIẾT TẮT iv DANH MỤC CÁC BẢNG vi DANH MỤC CÁC HÌNH MINH HỌA vii MỞ ĐẦU CHƯƠNG - TỔNG QUAN VỀ HỆ THỐNG TÌM KIẾM THÔNG TIN 1.1 Khái niệm tìm kiếm thơng tin 1.2 Khái niệm hệ thống tìm kiếm thơng tin 1.2.1 Khái niệm hệ thống tìm kiếm thông tin 1.2.2 Các phận cấu thành hệ thống tìm kiếm thơng tin CHƯƠNG - GIỚI THIỆU BÀI TỐN VÀ LỰA CHỌN CƠNG NGHỆ 2.1 Giới thiệu toán 2.2 Phương pháp giải 2.3 Tổng quan ElasticSearch 10 2.3.1 Khái niệm ElasticSearch 10 2.3.2 Các khái niệm cần biết ElasticSearch 13 2.3.3 Analyzers mơ hình truy hồi thông tin ElasticSearch 21 2.3.4 Query DSL (domain- Specific Language) ElasticSearch 29 2.3.5 Mô hình truy hồi thơng tin ElasticSearch 36 CHƯƠNG THỰC NGHIỆM XÂY DỰNG WEBSITE TÌM KIẾM DANH BẠ Y TẾ 45 3.1 Phân tích 45 3.2 Thiết kế 46 3.3 Cài đặt 55 3.4 Giao diện 55 iv 3.4.1 Giao diện cho người sử dụng 55 3.4.2 Giao diện cho người quản trị 64 3.5 Đánh giá thử nghiệm 66 3.5.1 Mơ hình kiến trúc ứng dụng thử nghiệm 66 3.5.2 Kịch kết 67 3.5.3 Đánh giá kết nghiên cứu 70 CHƯƠNG KẾT LUẬN 72 DANH MỤC TÀI LIỆU THAM KHẢO 73 v DANH MỤC CÁC THUẬT NGỮ, CHỮ VIẾT TẮT CNTT Công nghệ thông tin CSDL Cơ sở liệu Server Máy chủ Document Tài liệu Index Chỉ mục ES ElasticSearch EHR Hồ sơ sức khỏe điện tử IR Information Retrieval Shard Phân đoạn Query Truy vấn DSL domain- Specific Language URL Địa website Term Từ khóa tìm kiếm Boost Tăng cường API Application Programming Interface RESTful API Một tiêu chuẩn việc thiết kế API row Dòng table bảng Unicast thuật ngữ sử dụng mạng máy tính để mơ tả cách thức truyền tin gửi từ điểm đến điểm khác link Liên kết vi DANH MỤC CÁC BẢNG Bảng 1: Số liệu mapping từ khóa 53 Bảng 2: Kịch tìm kiếm 68 vii DANH MỤC CÁC HÌNH MINH HỌA Hình 1: Lịch sử hình thành cơng ty ElasticSearch 10 Hình 2: Các tập đồn sử dụng ElasticSearch 11 Hình 3: Các đối thủ ElasticSearch 11 Hình 4: Bảng so sánh dịch vụ 12 Hình 5: Hệ thống phân tán ElasticSearch 13 Hình 6: Các khái niệm cần biết ElasticSearch 13 Hình 7: Index ElasticSearch 14 Hình 8: Sharding Index 15 Hình 9: Primary Shard Replica Shard 15 Hình 10: trình chuyển liệu 17 Hình 11: Cluster ElasticSearch 18 Hình 12: Ví dụ sơ đồ sở liệu Mapping 19 Hình 13: Analyzer ElasticSearch 21 Hình 14: Kết tìm kiếm Match all query 30 Hình 15: Kết Match query 30 Hình 16: Kết Match query thêm and 31 Hình 17: Kết Match phrase query 31 Hình 18: Kết Match Phrase Prefix Query 32 Hình 19: Kết Multi Match Query 32 Hình 20: Query có parameters 33 Hình 21: Query với format ngày 33 Hình 22: Wildcard Query 34 Hình 23: Bool Query 34 Hình 24: Fuzzy Query 36 Hình 25: B25M 38 Hình 26: BM25 tiệm cận 40 Hình 27: BM25 với độ dài trung bình 41 Hình 28: Mơ hình tìm kiếm văn tiếng Việt 46 Hình 29: lược đồ Analyzer 47 Hình 30: lược đồ sở liệu Danh bạ y tế 53 Hình 31: Mơ hình cho người sử dụng 54 Hình 32: giao diện gợi ý nhập từ khóa 56 Hình 33: kết tìm kiếm có dấu 56 Hình 34: kết tìm kiếm tiếng Việt khơng dấu 57 viii Hình 35: Kết tìm kiếm 58 Hình 36: Kết theo định vị 59 Hình 37: Tìm kiếm theo chuyên khoa 61 Hình 38 thơng tin chi tiết 61 Hình 39: thông tin đồ theo địa Profile 62 Hình 40: nút lưu profile 62 Hình 41: hỏi đáp 63 Hình 42: Thơng tin lưu, thích 63 Hình 43: Trang quản trị Admin 64 Hình 44: Cập nhật liệu 65 Hình 45: Quản trị tài khoản 65 Hình 46 Kiến trúc Mơ hình thử nghiệm 67 ... NGHỆ VN HỌC VIỆN KHOA HỌC VÀ CƠNG NGHỆ Nguyễn Văn Thìn ỨNG DỤNG MÃ NGUỒN MỞ ELASTICSEARCH VÀO HỆ THỐNG TÌM KIẾM DANH BẠ Y TẾ HIỆU QUẢ Chuyên ngành : Hệ Thống Thông Tin Mã số : 8480104 LUẬN VĂN... phần mở đầu, việc tạo hệ thống tìm kiếm thơng tin lĩnh vực y tế để đáp ứng nhu cầu tìm kiếm người dùng Bài toán: ? ?Ứng dụng mã nguồn mở ElasticSearch vào hệ thống tìm kiếm danh bạ y tế hiệu quả? ??... Khái niệm hệ thống tìm kiếm thơng tin 1.2.1 Khái niệm hệ thống tìm kiếm thơng tin [7] Theo Kowalski [8] định nghĩa hệ thống tìm kiếm thơng tin sau: ? ?Hệ thống truy tìm thơng tin hệ thống có khả

Ngày đăng: 03/08/2021, 11:26

Tài liệu cùng người dùng

Tài liệu liên quan