Trang 1 PHONESAVAT SITTHIPHONG NGHIÊN CỨU PHÂN TÍCH VĂN BẢN TEXT ANALYSIS VÀ ỨNG DỤNG TRONG PHÂN TÍCH DỮ LIỆU BỆNH ÁN ĐIỆN TỬ LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH Trang 2 ĐẠI HỌC THÁI NGU
ĐẠI HỌC THÁI NGUYÊN TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG PHONESAVAT SITTHIPHONG NGHIÊN CỨU PHÂN TÍCH VĂN BẢN (TEXT ANALYSIS) VÀ ỨNG DỤNG TRONG PHÂN TÍCH DỮ LIỆU BỆNH ÁN ĐIỆN TỬ LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH THÁI NGUYÊN – 2023 ii ĐẠI HỌC THÁI NGUYÊN TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG PHONESAVAT SITTHIPHONG NGHIÊN CỨU PHÂN TÍCH VĂN BẢN (TEXT ANALYSIS) VÀ ỨNG DỤNG TRONG PHÂN TÍCH DỮ LIỆU BỆNH ÁN ĐIỆN TỬ CHUYÊN NGÀNH: KHOA HỌC MÁY TÍNH Mã số: 8480101 LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH Hướng dẫn khoa học: TS Nguyễn Hải Minh THÁI NGUYÊN - 2023 i LỜI CAM ĐOAN Họ và tên học viên: Phonesavat SITTHIPHONG Lớp cao học: CK20A Trường Đại học Công nghệ thông tin và Truyền thông- Đại học Thái Nguyên Chuyên ngành: Khoa học máy tính Giáo viên hướng dẫn khoa học: TS Nguyễn Hải Minh Tên đề tài luận văn: Nghiên cứu phân tích văn bản (Text Analysis) và ứng dụng trong phân tích dữ liệu bệnh án điện tử Em xin cam đoan nội dung được trình bày trong bản luận văn này là kết quả tìm hiểu và nghiên cứu của riêng em trong quá trình nghiên cứu đề tài dưới sự hướng dẫn và giúp đỡ của thầy giáo TS Nguyễn Hải Minh Em xin cam đoan rằng mọi sự giúp đỡ cho việc thực hiện luận văn này đã được cảm ơn và các thông tin trích dẫn trong luận văn đã được chỉ rõ nguồn gốc Học viên thực hiện Phonesavat SITTHIPHONG ii LỜI CẢM ƠN Trước hết, em xin bày tỏ lòng biết ơn tới thầy giáo hướng dẫn TS Nguyễn Hải Minh người đã hết lòng giúp đỡ, hướng dẫn và tạo điều kiện thuận lợi cho em trong suốt quá trình học tập và hoàn thiện luận văn tốt nghiệp Em xin bày tỏ lòng biết ơn đến tất cả các thầy cô giáo đã giảng dạy và truyền thụ kiến thức quý báu cho em trong quá trình học tập tại Trường Đại học Công nghệ thông tin và Truyền thông- Đại học Thái Nguyên Xin trân trọng cảm ơn các thầy cô trong Hội đồng chấm luận văn đã cho em những đóng góp quý báu để hoàn chỉnh luận văn Em xin gửi lời cảm ơn chân thành đến tất cả các anh ở phòng Công nhệ Thông tin tại bệnh viện Đa khoa Trung ương – Thái Nguyên đã giúp đỡ em và cho em vào thu thập thông tin để góp phần vào đề tài luận văn của em Em xin gửi lời cảm ơn chân thành đến gia đình, bạn bè, các anh/chị cùng lớp cao học K20A vì đã luôn động viên, quan tâm giúp đỡ em trong quá trình học tập và thực hiện luận văn Em xin trân trọng cảm ơn ! Học viên thực hiện Phonesavat SITTHIPHONG iii MỤC LỤC LỜI CAM ĐOAN i LỜI CẢM ƠN ii MỤC LỤC iii DANH SÁCH BẢNG vi DANH SÁCH HÌNH vii DANH SÁCH CÁC TỪ VIẾT TẮT ix MỞ ĐẦU 10 CHƯƠNG 1 CƠ SỞ LÝ THUYẾT 13 1.1.Text mining 13 1.1.1 Khai phá dữ liệu (KPDL) (Data Mining) 13 1.1.2 Khai phá dữ liệu văn bản (Text Mining) [3] 15 1.1.3 Text Analysis khác gì so với Text Mining và Text Analytics 18 1.2.Khái niệm về phân tích văn bản (Text Analysis)[4] 19 1.2.1 Phân tích là gì ? 19 1.2.2 Phân tích văn bản (Text Analysis) 19 1.2.3 Phân tích dữ liệu văn bản (Data Analysis)[5] 20 1.2.4 Tại sao phân tích văn bản lại quan trọng 20 1.2.5 Vai trò của phương pháp phân tích 21 1.2.6 Đặc điểm của phương pháp phân tích 23 1.2.7 Quy tắc của phương pháp phân tích 24 1.2.8 Những giai đoạn phân tích văn bản 24 1.3.Các kỹ thuật phân tích dữ liệu 27 1.3.1 Kỹ thuật phân tích văn bản (Text Analysis)[4] 27 1.3.2 Kỹ thuật phân tích thống kê (Statical Analysis) 30 iv 1.3.3 Kỹ thuật phân tích chẩn đoán (Diagnostic Analysis) 31 1.3.4 Kỹ thuật phân tích dự đoán (Predictive Analysis) 33 1.3.5 Kỹ thuật phân tích đề xuất (Prescriptive Analysis) 33 1.4 Tổng kết chương 33 CHƯƠNG 2 HỆ THÔNG TIN BỆNH VIỆN (HIS), CÁC ỨNG DỤNG TRONG BỆNH VIỆN VÀ QUY TRÌNH PHẦN DỮ LIỆU BỆNH .34 2.1 Các hệ thống ứng dụng CNTT trong bệnh viện 34 2.1.1 Hệ thống thông tin bệnh viện - Hospital Information System (HIS) [10] 34 2.1.2 Hệ thống lưu trữ và truyền hình ảnh Picture Archiving and Communication System (PACS) 35 2.1.3 Hệ thống thông tin chẩn đoán hình ảnh - Radiology Information System (RIS) 36 2.1.4 Hệ thống quản lý thông tin phòng xét nghiệm - Laboratory Information System (LIS) 36 2.2 Hồ sơ bệnh án điện tử 37 2.2.1 Khái niệm của hồ sơ bệnh án điện tử [8] 37 2.3 Quy trình phân tích dữ liệu 41 2.3.1 Đặt câu hỏi 41 2.3.2 Làm sạch dữ liệu 42 2.3.3 Bỏ qua những dữ liệu vô ích 43 2.3.4 Trực quan hoá dữ liệu 43 2.3.5 Diễn giải dữ liệu 43 2.4 Tổng kết chương .44 v CHƯƠNG 3 PHÂN TÍCH DỮ LIỆU BỆNH ÁN VÀ KẾT QUẢ THỰC NGHIỆM 45 3.1 Thu thập thông tin tại BV Đa khoa Trung ương 45 3.2 Dữ liệu bệnh án điện tử tại bệnh viện Đa khoa Trung ương 46 3.2.1 Dữ liệu bệnh nhân đi khám bệnh 47 3.2.2 Dữ liệu bệnh nhân nội trú 47 3.3 Phương pháp phân tích dữ liệu bệnh án điệu tử 48 3.4 Công cụ phân tích dữ liệu phần mềm Power BI 49 3.4.1 Power BI Desktop: 50 3.4.2 Chức năng vượt trội của Power BI Desktop 50 3.4.3 Điểm mạnh của Power BI Desktop 51 3.4.4 Nguồn dữ liệu của Power BI Desktop 52 3.5 Ứng dụng phân tích dữ liệu thu thập tại bệnh viện Đa khoa Trung ương 52 3.5.1 Kết nối với nguồn dữ liệu 52 3.5.2 Cải thiện mô hình dữ liệu 53 3.5.3 Tạo trực quan hóa báo cáo 57 3.5.4 Kết quả tổng thể phân tích dữ liệu bệnh án điện tử 67 3.6 Tổng kết Chương 67 3.7 Kết luận 68 TÀI LIỆU THAM KHẢO .69 vi DANH SÁCH BẢNG Bảng 3.1: dữ liệu bệnh nhân đi khám 47 Bảng 3.2: dữ liệu bệnh nhân nội trú 48 vii DANH SÁCH HÌNH Hình 1.1 Quá trình phát hiện trí thức trong CSDL 14 Hình 1.2 Mô hình khai phá dữ liệu văn bản 15 Hình 1.3 Mô hình kỹ thuật phân tích thống kê (Statical Analysis) 31 Hình 1.4 Mô hình kỹ thuật chẩn đoán .31 Hình 1.5 Mô hình chẩn đoán bệnh trong y tế 32 Hình 2.1 Mô hình Hệ thống thông tin bệnh viện (HIS) 35 Hình 2.2 Hồ sơ đăng ký khám bệnh của BV Đa kha Trung ương 38 Hình 3.1 Phần cứng tại BN Đa khoa Trung ương 46 Hình 3.2 Bộ công cụ Data-visualization của Power BI 49 Hình 3.3 Phần mềm Power BI 49 Hình 3.4 Kết nối nguồn dữ liệu Excel .52 Hình 3.5 Lựa chọn dữ liệu 53 Hình 3.6 Hiển thị dưới dạng tả dữ liệu vòa phần mềm 53 Hình 3.7 Xem dữ liệu hoặc Model dữ liệu 54 Hình 3.8 Quản lý mối quan hệ 54 Hình 3.9 Tạo mối quan hệ khác 55 Hình 3.10 Chọn cột để tạo quan hệ 2 bảng khám bệnh và nội trú 55 Hình 3.11 Tạo ra mối quan hệ 2 bảng khám bệnh và nội trú 56 Hình 3.12 Thêm chỉ số vào bảng khám bệnh 56 Hình 3.13 Nhập công thức tính toán vào bảng khám bệnh .56 Hình 3.14 Nhập công thức tính toán vào bảng khám bệnh .57 Hình 3.15 Tạo đề bài trực quan hóa báo cáo 57 viii Hình 3.16 Cài đặt kích cỡ, kiểu chữ và vị trí 57 Hình 3.17 Hiển thị đề bài báo cáo 58 Hình 3.18 Hiển thị tạo biểu đồ Slicer 58 Hình 3.19 Tạo trực quan hóa Slicer tên Tỉnh/Thành phố 58 Hình 3.20 Hiển thị tạo bàn đồ Map 59 Hình 3.21 Hiển thị tạo trực quan hóa Map tên Tỉnh/Thành phố .59 Hình 3.22 Hiển thị kết quả tạo biểu đồ Slicer và bàn đồ Map 59 Hình 3.23 Hiển thị tạo biểu đồ Cột 60 Hình 3.24 Hiển thị tạo trực quan hóa Cột 60 Hình 3.25 Hiển thị kết quả tạo biểu đồ Cột 61 Hình 3.26 Hiển thị tạo Pie Chat 61 Hình 3.27 Hiển thị tạoTrực quan hóa Chẩn đoán và Tổng số bệnh nhân .62 Hình 3.28 Hiển thị kết quả biểu đồ Pie Chat 62 Hình 3.29 Hiển thị tạo Pie Chat 63 Hình 3.30 Hiển thị tạoTrực quan hóa Giới tính và Tổng số bệnh nhân 63 Hình 3.31 Hiển thị kết quả biểu đồ Pie Chat bệnh nhân theo giới tính 64 Hình 3.32 Hiển thị tạo Pie Chat 64 Hình 3.33 Hiển thị tạo Trực quan hóa Dân tộc và Tổng số bệnh nhân 65 Hình 3.34 Hiển thị kết quả biểu đồ Pie Chat bệnh nhân theo dân tộc 65 Hình 3.35 Hiển thị tạo Pie Chat 66 Hình 3.36 Hiểnn thị tạoTrực quan hóa nghề nghiệp và Tổng số bệnh nhân 66 Hình 3.37 Hiển thị kết quả biểu đồ Bar Chart bệnh nhân theo nghề nghiệp 67 Hình 3.38 Hiển thị tổng thể phân tích dữ liệu bệnh án điện tử 67