Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 27 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
27
Dung lượng
209,02 KB
Nội dung
HỌC VIỆN CƠNG NGHỆ BƯU CHÍNH VIỄN THƠNG - LÃ THÚY HÀ TÓM TẮT LUẬN VĂN THẠC SĨ KỸ THUẬT HỌC VIỆN CƠNG NGHỆ BƯU CHÍNH VIỄN THƠNG - LÃ THÚY HÀ ĐỀ TÀI KHAI PHÁ DỮ LIỆU PHÁT HIỆN GIAN LẬN TRONG BẢO HIỂM Y TẾ CHUYÊN NGÀNH :TRUYỀN DỮ LIỆU VÀ MẠNG MÁY TÍNH MÃ SỐ: 60.48.15 TĨM TẮT LUẬN VĂN THẠC SĨ KỸ THUẬT NGƯỜI HƯỚNG DẪN KHOA HỌC: TS NGUYỄN DUY PHƯƠNG HÀ NỘI, 2012 Luận văn hồn thành tại: HỌC VIỆN CƠNG NGHỆ BƯU CHÍNH VIỄN THƠNG Người hướng dẫn khoa học: Tiến sỹ Nguyễn Duy Phương Phản biện 1: …………………………………………………… Phản biện 2: …………………………………………… …… Luận văn bảo vệ trước Hội đồng chấm luận văn thạc sĩ Học viện Cơng nghệ Bưu Viễn thơng Vào lúc: ngày tháng năm Có thể tìm hiểu luận văn tại: - Thư viện Học viện Cơng nghệ Bưu Viễn thơng MỞ ĐẦU Bảo hiểm xã hội có Bảo hiểm y tế sách lớn Đảng Nhà nước với mục tiêu lớn an sinh xã hội, đảm bảo ổn định xã hội, hỗ trợ chi trả chi phí khám chữa bệnh phần chi phí cho người dân Trong chăm sóc sức khỏe y tế nay, lạm dụng gian lận y tế ngày gia tăng khơng gánh nặng cho xã hội, tổ chức y tế mà người dân tham gia BHYT, người trả phần chi Do phát gian lận y tế trở nên quan trọng Việc phát gian lận y tế nói chung bảo hiểm y tế nói riêng chủ đề quan tâm nghiên cứu đòi h ỏi cấp bách Phát gian lận hiểu xác định gian lận cách nhanh xảy Hiện khơng có phương pháp phát gian lận thật hoàn hảo kỹ thuật gian lận ln thay đổi, phát sinh hình thức gian lận phương pháp phát gian lận biết đến sử dụng Một yêu cầu khai phá liệu lựa chọn nhiều để phát lạm dụng gian lận nhiều lĩnh v ực khác tài ngân hàng, bảo hiểm tơ, viễn thơng, chứng khốn bảo hiểm y tế Từ lý xu hư ớng tất yếu, Luận văn chọn đề tài: “Khai phá liệu phát gian lận bảo hiểm y tế” Mục tiêu luận văn: Tìm hiểu vấn đề gian lận y tế (bảo hiểm y tế), loại gian lận, phương pháp phát gian lận sâu vào nghiên cứu phương pháp sử dụng kỹ thuật khai phá liệu để phát hành vi gian lận cách tự động dựa dấu hiệu bất thường so với liệu khứ Đối tượng nghiên cứu: - Các loại gian lận số phương pháp phát gian lận - Kỹ thuật khai phá liệu - Nghiên cứu tốn cụ thể với quản lý chi phí khám chữa bệnh sở y tế kỹ thuật khai phá liệu tổng chi phí bệnh nhân sử dụng phương pháp định Phương pháp nghiên cứu: - Nghiên cứu thực tiễn công tác quản lý chi phí khám chữa bệnh sở y tế - Nghiên cứu tài liệu, báo cáo nước nước ngồi có liên quan sử dụng kỹ thuật khai phá liệu để phát gian lận lĩnh vực y tế - Tiến hành cài đặt thử nghiệm CHƯƠNG I: TỔNG QUAN VỀ GIAN LẬN BẢO HIỂM Y TẾ 1.1 Giới thiệu chung bảo hiểm y tế Việt Nam Theo Luật Bảo hiểm y tế, Chính phủ thống quản lý nhà nư ớc bảo hiểm y tế Trong trách nhiệm Bộ ngành liên quan gồm: Bộ Y tế giao quản lý nhà nước, thực sách lĩnh vực y tế, Bộ Tài phối hợp với Bộ Y tế, xây dựng sách, pháp luật tài liên quan đến bảo hiểm y tế, tra, kiểm tra việc thực quy định pháp luật chế độ tài bảo hiểm y tế, quỹ bảo hiểm y tế Bảo hiểm y tế hình thức bảo hiểm áp dụng lĩnh v ực chăm sóc sức khỏe, khơng mục đích lợi nhuận, Nhà nước tổ chức thực đối tượng tham gia với nguyên tắc: - Chia sẻ rủi ro người tham gia bảo hiểm y tế, - Mức hưởng bảo hiểm y tế theo mức độ bệnh tật, nhóm đối tượng phạm vi quyền lợi người tham gia bảo hiểm y tế - Chi phí khám bệnh, chữa bệnh bảo hiểm y tế quỹ bảo hiểm y tế người tham gia bảo hiểm y tế chi trả 1.1.1 Cơ cấu tổ chức quản lý bảo hiểm y tế Bảo hiểm xã hội Việt Nam Bảo hiểm xã hội Việt Nam quan thuộc phủ thực thi sách an sinh xã hội Nhà nước ban hành có lĩnh v ực bảo hiểm y tế Bảo hiểm xã hội Việt Nam cấu ngành dọc từ Trung ương đến địa phương Các bệnh viện thuộc tuyến Trung ương Bảo hiểm xã hội Việt Nam quản lý, sở khám chữa bệnh tuyến tỉnh, thành phố trực thuộc Trung ương tỉnh, thành phố quản lý 1.1.2 Chức năng, nhiệm vụ quan Bảo hiểm xã hội y tế: a Giám định bảo hiểm y tế b Thanh tốn chi phí khám bệnh, chữa bệnh bảo hiểm y tế 1.2 Hiện trạng gian lận bảo hiểm y tế Gian lận chăm sóc sức khỏe- lĩnh vực y tế lừa bịp cố ý làm sai lệch thực người thực thể dẫn đến tổn thất tài cho sở khám chữa bệnh dọanh nghiệp tham gia lĩnh vực bảo hiểm y tế Lạm dụng y tế tạo hai nhà cung cấp thực tiễn khơng phù hợp với mức tài chung, dịch vụ, kinh doanh y tế đưa chi phí khơng cần thiết bồi hồn dịch vụ khơng cần dịch vụ khơng đáp ứng tiêu chuẩn chuyên nghiệp công nhận chăm sóc sức khỏe 1.2.2 Các hình thức gian lận bảo hiểm y tế Có nhiều hình thức gian lận lạm dụng gian lận y tế Dưới liệt kê hình thức chủ yếu: a Gian lận y tế từ nhà cung cấp chăm sóc y tế, sở khám chữa bệnh, nhân viên y tế b Gian lận y tế nhà cung cấp trang thiết bị, thuốc điều trị 10 c Gian lận từ người tham gia thụ hưởng bảo hiểm: giả mạo giấy tờ, cho người khác mượn giấy tờ liên quan khám chữa bệnh 1.2.3 Nguy gian lận bảo hiểm y tế Việt Nam Tình trạng lạm dụng quỹ BHYT không xuất Việt Nam mà nước có lịch sử phát triển BHYT 100 năm Pháp, Đức t ồn với nhiều hình thức khác Tuy nhiên, Việt Nam, tình trạng lạm dụng BHYT ngày nhiều với đủ “tiểu xảo” từ nhiều đối tượng Thực tế tình hình lạm dụng gian lận bảo hiểm y tế Việt Nam diễn hàng ngày sở KCB với biểu mn hình vạn trạng từ đối tượng đến phương thức lạm dụng, chưa có cơng cụ hữu hiệu sách rõ ràng việc kiểm soát phát gian lận 1.3 Phòng chống phát gian lận y tế 1.3.1 Định nghĩa: Phòng chống gian lận biện pháp tránh gian lận, phát gian lận từ xuất 13 xây dựng véctơ đánh giá mạng Neural Ngoài việc xác định cách sử dụng công cụ phân tích thống kê dựa trên: Tổng số tiền hóa đơn Tổng số bệnh nhân Tổng số lượng bệnh nhân truy cập Số tiền tốn trung bình cho bệnh nhân Mỗi bệnh nhân bình truy cập vào số điện thoại Các xét nghiệm y tế trung bình cho bệnh nhân 14 CHƯƠNG II CÁC PHƯƠNG PHÁP KHAI PHÁ DỮ LIỆU ỨNG DỤNG TRONG PHÁT HIỆN GIAN LẬN 2.1 Phát tri thức khai phá liệu ? Phát tri thức sở liệu qui trình nhận biết mẫu mơ hình liệu với tính năng: hợp thức, mới, khả ích, hiểu Còn khai thác liệu bước qui trình phát tri thức gồm thuật toán khai thác liệu chuyên dùng số qui định hiệu tính tốn chấp nhận để tìm mẫu mơ hình liệu 2.2 Quá trình phát tri thức từ sở liệu Bước thứ tìm hiểu lĩnh v ực ứng dụng hình thành toán Bước thứ hai thu thập xử lý thơ, cịn gọi tiền xử lý liệu nhằm loại bỏ nhiễu, xử lý việc thiếu liệu, biến đổi liệu rút gọn liệu cần thiết Bước thứ ba khai phá liệu, hay nói cách khác trích mẫu mơ hình ẩn liệu 15 Bước thứ tư hiểu tri thức tìm được, đặc biệt làm sáng tỏ mô tả dự đốn 2.3 Q trình khai phá liệu Khai phá liệu tập hợp kỹ thuật sử dụng để tự động khai thác tìm mối quan hệ lẫn liệu tập hợp liệu khổng lồ phức tạp, đồng thời tìm mẫu tiềm ẩn tập liệu 2.4 Các phương pháp khai phá liệu 2.4.1 Phương pháp suy diễn quy nạp Phương pháp suy diễn: Rút thông tin kết logic từ thông tin nằm sở liệu dựa quan hệ liệu Phương pháp quy nạp: Các thông tin suy từ sở liệu phương pháp tự tìm kiếm, tạo mẫu sinh tri thức không bắt đầu với tri thức biết trước 2.4.2 Phân nhóm phân đoạn Là kỹ thuật phân chia liệu cho phần nhóm giống theo tiêu chuẩn 16 4.3 Cây định Cây định là cấu trúc định có dạng Phương pháp học định sử dụng cho hàm phân loại từ tập liệu huấn luyện 2.4.5 Mạng Neural Việc xây dựng mơ hình mạng Neural dựa hệ thống thần kinh người sử dụng nhiều nút nối với thành mạng lưới Tín hiệu truyền từ sang nút khác tùy thuộc vào mức tín hiệu chế xử lý nút 2.4.6 Giải thuật di truyền Thuật toán di truyền dựa ẩn dụ sinh học áp dụng quy luật chọn lọc tự nhiên Thuật tốn di truyền gồm có bốn quy luật lai ghép, đột biến, sinh sản chọn lọc tự nhiên 17 CHƯƠNG III : KHAI PHÁ DỮ LIỆU BẰNG CÂY QUYẾT ĐỊNH 3.1 Một số khái niệm định: Cây định cấu trúc định có dạng Cây định phương pháp học máy tiêu biểu ứng dụng phân loại dự đốn Cấu trúc dạng gồm: • Gốc: node • Node trong: biểu diễn kiểm tra thuộc tính đơn (hình chữ nhật) • Nhánh: biểu diễn kết kiểm tra node (mũi tên) • Node lá: biểu diễn lớp hay phân phối lớp (hình trịn) 3.1.1 Ưu điểm định : - Khả sinh quy tắc hiểu - Khả thực thi lĩnh v ực hướng quy tắc - Dễ dàng tính tốn phân lớp - Khả xử lý với thuộc tính liên tục thuộc tính rời rạc 18 - Thể rõ ràng thuộc tính tốt 3.1.2 Điểm yếu định - Dễ xảy lỗi có q nhiều lớp - Chi phí tính tốn đắt để đào tạo 3.2 Các phương pháp xây dựng định Quá trình xây dựng định gồm hai giai đoạn: • Giai đoạn thứ phát triển định: • Giai đoạn thứ hai cắt, tỉa bớt cành nhánh định Trong trình xây dựng định việc lựa chọn thuộc tính tốt nút yêu cầu quan trọng Do phương pháp xây dựng định khác thuật toán xây dựng phép kiểm tra thuộc tính nút phân loại với mục đích tạo tập có độ đồng cao 3.2.1 Thuật toán ID3: Thuật toán xây dựng ID3 sử dụng Entropy (HS) làm mức đo độ đồng tập liệu Trên sở entropy, thuật tốn tính độ tăng thơng tin (IG) mức 19 tăng độ đồng nhất, từ xác định thuộc tính tốt nút Thuật tốn ID3 có khuynh hướng lựa chọn định đơn giản có nút, nút tương ứng có độ tăng thông tin lớn xếp gần gốc 3.2.2 Thuật toán C4.5 Thuật toán C4.5 thuật tốn cải tiến thuật tốn ID3 C4.5 cịn chứa kỹ thuật cho phép biểu diễn lại định dạng danh sách thứ tự luật if-then (một dạng quy tắc phân lớp dễ hiểu) Thuật tốn sử dụng tỷ lệ chia nhỏ tiêu chí để đối phó với liệu huấn luyện gồm trường hợp với mục đích đưa kết Một phương pháp để giải vấn đề cách sử dụng thông tin chia tách SliptInformtion P(S,A) Gain Ratio(S,A) để phạt thuộc tính nhiều giá trị 3.2.3 Thuật toán CART: Chỉ số Gini sử dụng thuật toán CART Trái ngược với độ đo Gain, số Gini độ đo tính “khơng suốt” tập liệu 3.2.4 Thuật tốn CHAID: 20 Thuật toán CHAID kiểm tra thống kê sử dụng phụ thuộc vào kiểu thuộc tính mục tiêu 3.4.1.2 Quá vừa liệu (data overfitting) Quá vừa liệu (data overfitting) vấn đề thường gặp học máy, điều ảnh hưởng đến độ xác kỹ thuật học máy Có hai hướng giải pháp để hạn chế vừa liệu cho định: - Dừng định sớm trước đủ phức tạp để phân loại mẫu huấn luyện - Xây dựng đầy đủ, sau cắt tỉa để có đơn giản Phương pháp sử dụng thực tế 3.4.1.3 Cơ chế riêng xử lý giá trị thiếu Giá trị thiếu thuộc tính tượng phổ biến liệu, lỗi nhập ghi vào sở liệu, giá trị thuộc tính đánh giá khơng cần thiết trường hợp cụ thể 3.4.1.4 Chuyển đổi từ định sang luật: Giai đoạn chuyển dổi từ định sang luật bao gồm bước: 21 • Cắt tỉa • Lựa chọn • Sắp xếp • Ước lượng, đánh giá 3.4.2 Phương pháp cắt tỉa Phương pháp cắt tỉa luật thuật toán C4.5 sau: • Xây dựng định cho phép phân loại tối đa tập huấn luyện • Biến đổi thành luật suy diễn cho nhánh từ gốc đến tương ứng với luật • Tỉa luật cách bỏ bớt điều kiện thành phần sau bỏ độ xác tăng lên • Sắp xếp luật đư ợc tỉa theo độ xác tập kiểm tra Sử dụng luật theo thứ tự để phân loại ví dụ 22 CHƯƠNG IV: XÂY DỰNG VÀ CÀI ĐẶT BÀI TOÁN Bảo hiểm y tế tiến tới mục tiêu thực lộ trình bảo hiểm y tế tồn dân thời hạn vào năm 2015, bên cạnh chủ động xây dựng kế hoạch hoạt động cụ thể, chặt chẽ để đảm bảo quyền lợi cho người bệnh tham gia khám chữa bệnh thẻ BHYT Theo đó, vi ệc tăng cường giám sát quy trình thực dịch vụ y tế loại vật tư tiêu hao, thuốc s dụng đảm bảo chất lượng theo quy định chống lạm dụng quỹ BHYT yêu cầu cần thiết đặc biệt lộ trình tăng giá dịch vụ y tế Bộ Y tế ban hành Trong luận văn xét phạm vi toán dựa dịch vụ y tế bệnh nhân nội trú, cụ thể chi phí có khả bị lạm dụng cao tiền xét nghiệm, tiền chuẩn đốn hình ảnh, tiền thuốc số yếu tố ảnh hưởng đến chi phí khám chữa bệnh Trong tiến trình trên, thơng tinđ ầu vào chi tiết chi phí khám chữa bệnh bệnh nhân, thông tin chung bệnh nhân kho liệu lưu trữ trích chọn xử lý 23 Dữ liệu trích chọn: Căn vào phân tích đánh giá mức chi phí dựa liệu Bệnh viện Đức Giang năm 2011 xét mã bệnh đau tức vùng ngực (từ I10-I69) Dữ liệu trích chọn gồm: trường liệu, gồm ID mã bệnh nhân, trường lựa chọn chi phí bệnh nhân nằm nội trú bệnh viện yếu tố ảnh hưởng đến chi phí độ tuổi bệnh nhân (được tính đơn vị nghìn đ ồng), tình trạng điều trị người bệnh Cụ thể: Bảng liệu huấn luyện gồm trường 43 mẫu Các trường gồm chi phí: Tiền xét nghiệm, tiền chuẩn đốn hình ảnh, tiền thuốc tổng chi phí, yếu tố ảnh hưởng đến chi phí độ tuổi, số bệnh đợt bệnh nhân phải điều trị tình trạng bệnh nhân nằm viện (có cấp cứu hay khơng) Dữ liệu kiếm tra: Từ liệu lưu trữ ta trích chọn xử lý trường để phù hợp với Bảng liệu huấn luyện Ví dụ: Ta xét 236 trường hợp đợt điều trị Trong 24 trường gian lận gán ‘No’ Việc đánh giá mơ hình dựa kết đánh giá liệu kiểm tra 4.1.2 Cơng nghệ sử dụng: Chương trình đư ợc viết ngôn ngữ C++, sở liệu Microsoft Access (hoặc sử dụng DBMS truy cập ODBC) ODBC máy chủ cài đặt máy Trong chương trình có s dụng số module mã nguồn mở 4.3 Thử nghiệm đánh giá 4.3.1 Phương pháp thử nghiệm Trên sở phân tích đánh giá trênãđrút yếu tố, chi phí liên quan ảnh hưởng đến tổng chi phí khám chữa bệnh để xây dựng bảng liệu huấn luyện Dữ liệu thử nghiệm lấy từ kho liệu Bệnh viện sau qua bư ớc định dạng, xử lý theo yêu cầu tên trường, thuộc tính tập liệu bảng huấn luyện Dữ liệu thử nghiệm đưa vào chương trình sau xây dựng định tạo xong tập luật Chương 25 trình thống kê số lượng ghi nghi ngờ có khả gian lận đưa ghi 4.3.2 Dữ liệu thử nghiệm: Tập liệu thử nghiệm tập liệu nhỏ với 236 ghi lấy từ kho liệu Dữ liệu thử nghiệm trích chọn mã bệnh xử lý phù hợp với liệu tập huấn luyện tên trường thuộc tính liệu 4.3.3 Kết thử nghiệm: Sau liệu kiểm tra đưa vào chương trình, vào định xây dựng tập luật phát sinh sau hoàn thành vi ệc cắt tỉa Kết thu sau đưa liệu kiểm tra vào, chương trình phát 6/243 ghi bị lỗi đưa danh sách ghi 4.3.4 Đánh giá kế t thử nghiệm Với số ghi đưa vào 243 sau kiểm tra phát trường hợp với tỷ lệ (2,5%) có dấu hiệu gian lận 26 KẾT LUẬN Luận văn đạt số kết sau: - Nghiên cứu vấn đề gian lận ĩlnh v ực bảo hiểm y tế, biện pháp phòng chống gian lận y tế; tìm hiểu tình hình phịng chống gian lận y tế giới áp dụng mô hình cho Việt Nam - Tìm hiểu phương pháp phát gian lận: Hiện có nhiều phương pháp phát gian lận kỹ thuật sử dụng như: học máy, khai phá liệu,… hay mô hình thơng kê - Khai phá liệu kỹ thuật áp dụng rộng rãi nhiều lĩnh v ực nói chung phát gian lận nói riêng - Luận văn ti ến hành cài đặt phương pháp định thuật toán C4.5 để pháp gian lận lĩnh vực BHYT dựa việc khảo sát, đánh giá từ nguồn liệu thực tế Bệnh viện Đức Giang năm 2011 mã bệnh đau tức vùng ngực 27 HƯỚNG NGHIÊN CỨU TIẾP THEO Triển khai, áp dụng phương pháp phát gian lận đư ợc nghiên cứu kể vào thực tế quan Bảo hiểm xã hội, góp phần phát hiện, giảm thiểu trường hợp gian lận, lạm dụng quỹ BHXH đảm bảo quyền lợi người dân tham gia BHYT khám chữa bệnh Xây dựng mở rộng phạm vi phát gian lận quỹ BHXH không mã bệnh mà áp dụng bệnh thông thường có khả dễ bị lạm dụng Đi sâu nghiên cứu chi tiết xét nghiệm, phương pháp chuẩn đốn hình ảnh thuốc chun biệt, đặc thù áp dụng cho loại bệnh riêng biệt So sách phương pháp, thuật tốn khác tìm phương pháp hi ệu cho việc phát gian lận bảo hiểm y tế để áp dụng vào thực tiễn ... kiểm sốt phát gian lận 1.3 Phịng chống phát gian lận y tế 1.3.1 Định nghĩa: Phòng chống gian lận biện pháp tránh gian lận, phát gian lận từ xuất 11 Phát gian lận xác định gian lận nhanh x? ?y 1.3.2... quan Bảo hiểm xã hội y tế: a Giám định bảo hiểm y tế b Thanh tốn chi phí khám bệnh, chữa bệnh bảo hiểm y tế 9 1.2 Hiện trạng gian lận bảo hiểm y tế Gian lận chăm sóc sức khỏe- lĩnh vực y tế lừa... hàng, bảo hiểm tơ, viễn thơng, chứng khốn bảo hiểm y tế Từ lý xu hư ớng tất y? ??u, Luận văn chọn đề tài: ? ?Khai phá liệu phát gian lận bảo hiểm y tế? ?? Mục tiêu luận văn: Tìm hiểu vấn đề gian lận y tế