Data warehousing and business intelligence báo cáo bài tập lớn đề tài healthcare

44 3 0
Data warehousing and business intelligence báo cáo bài tập lớn đề tài healthcare

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI VIỆN TOÁN ỨNG DỤNG VÀ TIN HỌC Data Warehousing and Business Intelligence BÁO CÁO BÀI TẬP LỚN Đề tài: Healthcare Giảng viên hướng dẫn: ThS Nguyễn Danh Tú Nhóm sinh viên: Ngơ Quốc Cường (Nhóm trưởng) - 20185436 Nguyễn Ngọc Diệp - 20185440 Phạm Văn Hiếu - 20185353 Nguyễn Tiến Vĩ - 20185426 Trần Văn Hoàng - 20185451 HÀ NỘI – 2022 i NHẬN XÉT CỦA GIẢNG VIÊN Mục tiêu (a) (b) (c) Nội dung (a) (b) (c) Đánh giá kết đạt (a) (b) (c) Hà Nội, tháng 07 năm 2022 Giảng viên ThS Nguyễn Danh Tú ii Lời cảm ơn Chúng em xin gửi lời cảm ơn chân thành kính trọng tới Thạc sĩ Nguyễn Danh Tú, người tận tình giảng dạy học phần Kho liệu Kinh doanh thơng minh, giúp nhóm em có nhìn tổng quan học phần hoàn thành báo cáo Do kiến thức cịn hạn hẹp nên khơng tránh khỏi thiếu sót cách hiểu, lỗi trình bày Chúng em mong nhận đóng góp ý kiến từ thầy để báo cáo đạt kết tốt Chúng em xin chân thành cảm ơn! Hà Nội, tháng 07 năm 2022 Nhóm trưởng Ngơ Quốc Cường iii Mục lục Danh sách hình vẽ Danh sách bảng Chương Mở đầu Chương Tổng quan Datawarehouse 2.1 Khái niệm kho liệu 2.1.1 Lịch sử 2.1.2 Khái niệm 2.2 Tiến trình phát triển kho liệu 2.3 Kiến trúc kho liệu 2.4 Xây dựng kho liệu 2.4.1 Dự án DW 2.4.2 ETL liệu Chương Tổng quan BI 11 3.1 Khái niệm BI 11 3.2 Các thành phần 11 3.3 Vai trò BI với doanh nghiệp 12 3.4 Power BI 14 Chương Ứng dụng phân tích liệu y tế 4.1 16 Khảo sát 16 4.1.1 Quy trình nghiệp vụ 16 4.1.2 Tổng quan liệu 19 4.1.3 Yêu cầu phân tích 20 iv 4.1.4 4.2 4.3 Khám phá liệu 21 Phân tích thiết kế hệ thống 24 4.2.1 Kiến trúc Datawarhouse 24 4.2.2 ETL liệu 24 4.2.3 Dimensions & Fact 26 4.2.4 Mơ hình OLTP 31 4.2.5 Mơ hình OLAP 33 Xây dựng phân tích Dashboard 34 Chương Tổng kết 39 Đánh giá thành viên Họ tên nhóm trưởng Ngơ Quốc Cường Lớp K63 - Hệ thống thơng tin quản lý Nhóm 12 Phần việc Giữ liên Đóng góp Sẵn sàng Đóng góp giao lạc tốt ý kiến giúp đỡ chung Ngô Quốc Cường 5 5 Nguyễn Ngọc Diệp 5 5 Phạm Văn Hiếu 5 Nguyễn Tiến Vĩ 5 Trần Văn Hoàng 5 3,5 Họ tên Danh sách hình vẽ 2.1 Tiến trình phát triển Datawarehouse 2.2 Kiến trúc Datawarehouse đầy đủ 3.1 Giao diện Power BI 14 4.1 Chi tiêu chăm sóc sức khỏe theo tỷ trọng kinh tế 17 4.2 Các hãng bảo hiểm y tế tư nhân lớn Hoa Kỳ 18 4.3 Xếp hạng hàng bảo hiểm Hoa Kỳ theo doanh thu 18 4.4 Hiển thị góc liệu 19 4.5 Số lượng bệnh nhân theo nhóm tuổi 21 4.6 Số lượng bệnh nhân theo giới tính 21 4.7 Số lượng bệnh nhân theo chủng tộc 22 4.8 Số lượng bệnh nhân theo tình trạng nguy kịch 22 4.9 Số lượng bệnh nhân đến sở y tế 23 4.10 Tỷ trọng hình thức tốn viện phí mà bệnh nhân chọn lựa 23 4.11 Kiến trúc Datawarehouse 24 4.12 Một vài cột liệu không cần thiết 24 4.13 Giá trị null khơng có ý nghĩa 25 4.14 Kiểu đơn vị tiền tệ 25 4.15 Một góc liệu sau ETL 25 4.16 Mơ hình logic 26 4.17 Các sở y tế 27 4.18 Các hình thức nhập viện 27 4.19 Các nhóm tuổi người bệnh 28 4.20 Các mức độ nghiêm trọng bệnh tật 28 4.21 Các hình thức phẫu thuật 28 4.22 Các mức nguy kịch 29 4.23 Các hình thức điều trị sau xuất viện 29 4.24 Các loại hình tốn viện phí 30 4.25 Các loại bệnh 30 4.26 Mơ hình OLTP 32 4.27 Mơ hình OLAP 33 4.28 Tổng chi phí, tổng viện phí chưa khấu trừ viện phí chưa khấu trừ trung bình 34 4.29 Bản đồ khu vực thu nhiều tiền viện phí 34 4.30 Tỷ lệ viện phí theo hình thức chi trả 35 4.31 Top sở y tế có doanh thu cao 36 4.32 Tỷ trọng viện phí theo nhóm tuổi 36 4.33 Doanh thu theo vùng dịch vụ 37 4.34 Chi phí điều trị cho loại bệnh 37 4.35 Doanh thu theo tình trạng nhập viện 38 Danh sách bảng 4.1 Tên ý nghĩa trường liệu 20 Chương Mở đầu Bài báo cáo lĩnh vực chăm sóc sức khỏe, cụ thể phân tích chi phí điều trị nội trú tiểu bang Hoa Kỳ Từ đó, cung cấp cho nhà hoạch định chiến lược hàng bảo hiểm y tế hàng đầu Hoa Kỳ nhiều thông tin hữu ích để phát triển chiến lược tiếp thị, hướng tới đối tượng khách hàng phù hợp, góp phần thúc đẩy doanh thu Datawarehouse & Business Itelligence (Kho liệu kinh doanh thông minh) cách mà doanh nghiệp khai thác tận dụng liệu lĩnh vực để thu nhiều thông tin chi tiết hoạt động Doanh nghiệp triển khai kho liệu hợp để tập trung thông tin từ số hệ thống cốt lõi, mở rộng sang liệu thị trường tích hợp khả trực quan hóa, cung cấp tầm nhìn bao qt nhằm phân tích dự đốn tự động hóa hoạt động kinh doanh 25 • Emergency Department Indicator: định cấp cứu Xóa giá trị null dịng trống: Hình 4.13: Giá trị null khơng có ý nghĩa Định dạng lại kiểu liệu: Định dạng lại đơn vị tiền tệ cho hai cột liệu liên quan tới chi phí Total Charges Total Cost Hình 4.14: Kiểu đơn vị tiền tệ Dữ liệu sau ETL 2.505.873 dòng 25 cột Hình 4.15: Một góc liệu sau ETL 26 4.2.3 Dimensions & Fact Hình 4.16: Mơ hình logic 27 Dimension sở y tế: Hình 4.17: Các sở y tế Dimension hình thức nhập viện: Hình 4.18: Các hình thức nhập viện Dimension nhóm tuổi: 28 Hình 4.19: Các nhóm tuổi người bệnh Dimension mức độ nghiêm trọng: Hình 4.20: Các mức độ nghiêm trọng bệnh tật Dimension hình thức phẫu thuật: Hình 4.21: Các hình thức phẫu thuật 29 Dimension mức độ nguy hiểm tính mạng: Hình 4.22: Các mức nguy kịch Dimension điều trị sau xuất viện: Hình 4.23: Các hình thức điều trị sau xuất viện 30 Dimension hình thức chi trả: Hình 4.24: Các loại hình tốn viện phí Dimension loại bệnh: Hình 4.25: Các loại bệnh 31 4.2.4 Mơ hình OLTP Mơ hình OLTP bao gồm bảng, chứa khóa chính, khóa ngoại liên kết bảng Chi tiết bảng sau: • Các bảng sở y tế, bao gồm bảng Facility, Hospital County Hospital Service Area • Các bảng loại bệnh, bao gồm bảng Diagnosis Detail, Diagnosis Group, Diagnosis Category • Các bảng chứa thông tin bệnh nhân, bao gồm Age Group, Race, Admission, Patient Disposition, Severity, Medical Surgical Risk • Bảng hình thức tốn viện phí bệnh nhân: Payment • Bảng ghi chép ca điều trị nội trú: Patient Record • Bảng ghi chép chi tiết hóa đơn viện phí làm thủ tục xuất viện: Patient Charges 32 Hình 4.26: Mơ hình OLTP 33 4.2.5 Mơ hình OLAP Mơ hình OLAP thiết kế với Fact Charges Bảng Fact Charges liên kết với chiều liệu bao gồm: Dim Facility, Dim Age Group, Dim Admission, Dim Patient Disposition, Dim Diagnosis, Dim Severity, Dim Surgical Dim Payment Hình 4.27: Mơ hình OLAP 34 4.3 Xây dựng phân tích Dashboard Hình 4.28: Tổng chi phí, tổng viện phí chưa khấu trừ viện phí chưa khấu trừ trung bình Năm 2012, Tiểu bang New York, bệnh nhân trung bình nhận hóa đơn viện phí 21.330 la Tổng viện phí hóa đơn tổng chi phí sau khấu trừ bảo hiểm bệnh nhân New York 3,85 tỷ la 1,82 tỷ la Hình 4.29: Bản đồ khu vực thu nhiều tiền viện phí Các quận trung tâm tiểu bang nơi mà sở y tế thu nhiều viện phí 35 Hình 4.30: Tỷ lệ viện phí theo hình thức chi trả Khơng có bất ngờ Medicare Medicad, hai chương trình bảo hiểm y tế nhà nước dành cho đối tượng yếu thế, chương trình bảo hiểm Hiệp hội Chữ thập xanh Khiên xanh chiếm tỷ lệ vượt trội, 47,17%, 18,73% 13,21% Ngoài chương trình bảo hiểm nhà nước, bảo hiểm mua tư nhân chiếm tỷ lệ hẳn loại hình chi trả khác Hoa Kỳ nước có y tế tiên tiến bậc giới lại hệ thống chăm sóc sức khỏe tồn dân Điều buộc người Mỹ cần mua bảo hiểm y tế khơng muốn phá sản hóa đơn viện phí khổng lồ 36 Hình 4.31: Top sở y tế có doanh thu cao Dẫn đầu Trung tâm y tế chung Buffalo Như đề cập phần khám phá liệu, trung tâm y tế nơi thu hút nhiều bệnh nhân ghé điều trị Hình 4.32: Tỷ trọng viện phí theo nhóm tuổi Nhóm tuổi từ 50-69 nhóm tuổi già từ 70 trở lên nhóm người cho dịch vụ chăm sóc sức khỏe nhiều Quận Erie, với người láng giềng phía Bắc Quận Niagara, tạo nên vùng đô thị Thác Buffalo-Niagara, lớn thứ hai Tiểu bang New York sau Thành phố New York Có lẽ điều mà hai quận trở thành hai vòng dịch vụ y tế dẫn đầu doanh thu tồn tiểu bang 37 Hình 4.33: Doanh thu theo vùng dịch vụ Hình 4.34: Chi phí điều trị cho loại bệnh 38 Hai bệnh hiểm nghèo nhiễm trùng máu viêm xương khớp "ngốn" nhiều chi phí điều trị người dân New York Hình 4.35: Doanh thu theo tình trạng nhập viện Rõ ràng, nhập viện tình trạng cấp cứu, viện phí mà gia đình bệnh nhân phải trả không nhỏ 39 Chương Tổng kết Thơng qua tập lớn nhóm chúng em học tập làm được: • Nằm kiến thức học phần, lý thuyết lẫn thực hành • Nâng cao kĩ làm việc nhóm • Có khoảng thời gian lý thú nghiên cứu, tìm hiểu ngành chăm sóc sức khỏe quốc gia phát triển Hoa Kỳ ... chuyển đổi, tích hợp làm phong phú liệu lớn (big data) Dữ liệu nhập để làm báo cáo dashboard • Chế độ xem modeling: Chia mơ hình liệu phức tạp theo lĩnh vực chủ đề thành sơ đồ riêng biệt Chọn nhiều... nghiệp, tập đồn • Bảo hiểm tự mua từ hãng bảo hiểm tư nhân 18 Hình 4.2: Các hãng bảo hiểm y tế tư nhân lớn Hoa Kỳ Hình 4.3: Xếp hạng hàng bảo hiểm Hoa Kỳ theo doanh thu Các phân tích báo cáo tập. .. trúc Datawarhouse Hình 4.11: Kiến trúc Datawarehouse Mơ hình kiến trúc Datawarehouse lớp Datasource file csv.Dữ liệu đưa vào vùng staging để tiền xử lý Sau tiền xử lý, có liệu i đưa vào Datawarehouse

Ngày đăng: 10/08/2022, 05:25

Tài liệu cùng người dùng

Tài liệu liên quan