1. Trang chủ
  2. » Luận Văn - Báo Cáo

Nghiên cứu một số thuật toán khai phá luật kết hợp và thử nghiệm ứng dụng vào khai phá cơ sở dữ liệu bảo hiểm y tế tại bảo hiểm xã hội Bắc Giang

90 853 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 90
Dung lượng 1,32 MB

Nội dung

[...]... kết hợp, khai phá dữ liệu dựa vào luật kết hợp, đồng thời trình b y một số thuật toán liên quan đến luật kết hợp 2.1 Luật kết hợp Từ khi đƣợc giới thiệu vào năm 1993, bài toán khai thác luật kết hợp nhận đƣợc rất nhiều sự quan tâm của các nhà khoa học Ng y nay việc khai thác luật kết hợp vẫn là một trong những phƣơng pháp khai thác mẫu phổ biến nhất trong việc khám phá tri thức và khai thác dữ liệu Một. .. của m y tính và thƣơng mại điện tử, ng y nay có rất nhiều cơ sở dữ liệu giao tác Khai phá dữ liệu trên cơ sở dữ liệu giao tác tập trung vào khai phá luật kết hợp, tìm mối tƣơng quan giữa những mục dữ liệu của bản ghi giao dịch Nghiên cứu sâu về cơ sở dữ liệu giao tác đƣợc mô tả chi tiết ở phần sau 1.4.1.4 Cơ sở dữ liệu không gian Cơ sở dữ liệu không gian bao gồm hai phần: Phần thứ nhất là dữ liệu quan... tâm Học liệu http://www.lrc-tnu.edu.vn/ 21 1.4.1 Các loại dữ liệu đƣợc khai phá Dựa vào những kiểu dữ liệu mà kỹ thuật khai phá áp dụng, có thể chia dữ liệu thành các loại khác nhau 1.4.1.1 Cơ sở dữ liệu quan hệ Đến nay, hầu hết dữ liệu đƣợc lƣu giữ dƣới dạng cơ sở dữ liệu quan hệ Cơ sở dữ liệu quan hệ là một nguồn tài nguyên lớn nhất chứa những đối tƣợng mà chúng ta cần khai phá Cơ sở dữ liệu quan... đòi hỏi khai phá dữ liệu phải có các giải pháp, các kỹ thuật để có thể áp dụng đƣợc, nhận ra đƣợc các mối quan hệ n y trong quá trình khai phá dữ liệu OLAM (Online Analytical Mining): là sự tích hợp giữa cơ sở dữ liệu, kho dữ liệu và khai thác dữ liệu một số hệ cơ sở dữ liệu nhƣ Oracle, MS SQL Server đã tích hợp tính năng x y dựng kho dữ liệu và phân tích trực tuyến (OLAP) Những tính năng n y đƣợc hỗ... không phụ thuộc vào phần cứng Bên cạnh những nghiên cứu về những biến thể của luật kết hợp, các nhà nghiên cứu còn chú trọng đề xuất những thuật toán nhằm tăng tốc quá trình tìm kiếm tập phổ biến từ cơ sở dữ liệu Ngoài ra, còn có một số hƣớng nghiên cứu khác về khai thác luật kết hợp nhƣ: Khai thác luật kết hợp trực tuyến, khai thác luật kết hợp đƣợc kết nối trực tuyến đến các kho dữ liệu đa chiều (Multidimensional... phá luật kết hợp: Có thể diễn đạt một bài toán khai phá luật kết hợp nhƣ sau: Cho một tập các item I, một cơ sở dữ liệu giao dịch D, ngƣỡng support tối thiểu minsup, ngƣỡng confidence tối thiểu minconf, tìm tất cả các luật kết hợp X Y trên D sao cho: support(X Y) minsup và confidence(X Y) minconf Ý nghĩa luật kết hợp: Luật kết hợp là một lĩnh vực quan trọng trong khai thác dữ liệu Luật kết hợp giúp... Học liệu http://www.lrc-tnu.edu.vn/ 22 1.4.1.5 Cơ sở dữ liệu có y u tố thời gian Giống nhƣ cơ sở dữ liệu không gian, cơ sở dữ liệu có y u tố thời gian bao gồm hai phần: Phần thứ nhất là dữ liệu quan hệ hay giao tác, phần thứ hai là thông tin về thời gian xuất hiện dữ liệu ở phần thứ nhất Những luật kết hợp có y u tố thời gian có nhiều thông tin hơn những luật kết hợp cơ bản Ví dụ, từ luật kết hợp cơ. .. chung để tìm ra các tập hay các nhóm, loại mô tả dữ liệu Các nhóm có thể tách nhau hoặc phân cấp - Luật kết hợp: Luật kết hợp là dạng luật biểu diễn tri thức ở dạng khá đơn giản Mục tiêu của phƣơng pháp n y là phát hiện và đƣa ra các mối liên hệ giữa các giá trị dữ liệu trong cơ sở dữ liệu Mẫu đầu của giải thuật khai phá dữ liệu là tập luật kết hợp tìm đƣợc Ví dụ về luật kết hợp: Một cửa hàng bán văn phòng... kèm và ngƣời sử dụng phải mua nếu cần sử dụng Các nhà nghiên cứu trong lĩnh vực cơ sở dữ liệu còn muốn thêm sự tích hợp giữa cơ sở dữ liệu, kho dữ liệu, và khai thác dữ liệu Khám phá đƣợc nhiều tri thức khác nhau từ các kiểu dữ liệu khác nhau Tính chính xác và hiệu quả, khả năng mở rộng và tích hợp, xử lý dữ liệu bị nhiễu không đ y đủ và tính có ích của tri thức đƣợc khám phá Vấn đề song song hóa và. .. lớn dữ liệu cần đƣợc xử lý Các tổ chức doanh nghiệp quy mô vừa có thể có từ hàng hàng trăm Megabyte đến vài Gigabyte dữ liệu thu thập đƣợc Các ứng dụng khai phá dữ liệu thƣờng thực hiện phân tích dữ liệu khá phức tạp, mất nhiều thời gian trong toàn bộ CSDL Vì v y, tìm một thuật toán nhanh và hiệu quả để xử lý khối lƣợng dữ liệu lớn là một thách thức lớn Chƣơng n y trình b y cơ sở lý thuyết của luật kết .

Ngày đăng: 19/07/2014, 22:33

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
[1] Hoàng Kiếm - Đỗ Phúc (2005), Giáo trình khai phá dữ liệu - Trung tâm nghiên cứu phát triển công nghệ thông tin, Đại học Quốc gia thành phố Hồ Chí Minh Sách, tạp chí
Tiêu đề: Giáo trình khai phá dữ liệu
Tác giả: Hoàng Kiếm - Đỗ Phúc
Năm: 2005
[2] Lê Thanh Tùng (2010), Nghiên cứu một số thuật toán khai thác luật kết hợp và thử nghiệm ứng dụng vào khai phá CSDL về phương tiện vận tải đường thủy nội địa. Luận văn Thạc sỹ, Học viện Kỹ thuật quân sự Sách, tạp chí
Tiêu đề: Nghiên cứu một số thuật toán khai thác luật kết hợp và thử nghiệm ứng dụng vào khai phá CSDL về phương tiện vận tải đường thủy nội địa
Tác giả: Lê Thanh Tùng
Năm: 2010
[3] Phùng Văn Việt (2012), Tìm hiểu một số vấn đề về khai phá dữ liệu và thử nghiệm khai phá cơ sở dữ liệu hàng hóa vận chuyển tại công ty STC. Luận văn Thạc sỹ, Trường ĐH Công nghệ, Đại học Quốc gia HN [4] Quốc hội khóa XII, kỳ họp thứ tƣ số 25/2008/QH12 NGÀY 14THÁNG 11 NĂM 2008, Luật Bảo hiểm Y tế Sách, tạp chí
Tiêu đề: Tìm hiểu một số vấn đề về khai phá dữ liệu và thử nghiệm khai phá cơ sở dữ liệu hàng hóa vận chuyển tại công ty STC". Luận văn Thạc sỹ, Trường ĐH Công nghệ, Đại học Quốc gia HN [4] Quốc hội khóa XII, kỳ họp thứ tƣ số 25/2008/QH12 NGÀY 14 THÁNG 11 NĂM 2008
Tác giả: Phùng Văn Việt
Năm: 2012
[5] Tổng giám đốc Bảo hiểm xã hội Việt Nam Quyết định số: 82/QĐ- BHXH ngày 20 tháng 01 năm 2010, ban hành quy định về tổ chức thực hiện hợp đồng khám chữa bệnh, giám định chi trả chi phí khám, chữa bệnh, quản lý và sử dụng quỹ bảo hiểm y tế.Tiếng Anh Sách, tạp chí
Tiêu đề: ban hành quy định về tổ chức thực hiện hợp đồng khám chữa bệnh, giám định chi trả chi phí khám, chữa bệnh, quản lý và sử dụng quỹ bảo hiểm y tế
[7] Cai, C.H., Fu, A.W.-C., Cheng, C.H., Kwong, W.W. (1998), Mining Association Rules with Weighted Items. In Proceedings of Intl.Database Engineering and Applications Symposium (IDEAS 1998), Cardiff, Wales, UK, July 1998, pp. 68–77 Sách, tạp chí
Tiêu đề: Proceedings of Intl. "Database Engineering and Applications Symposium (IDEAS 1998)
Tác giả: Cai, C.H., Fu, A.W.-C., Cheng, C.H., Kwong, W.W
Năm: 1998
[8] Han J. (2004), “Mining Frequent Patterns without Candidate Generation: A Frequent-Pattern Tree Approach, Data Mining and Knowledge Discovery, Vol. 8, pp. 53–87 Sách, tạp chí
Tiêu đề: Mining Frequent Patterns without Candidate Generation: A Frequent-Pattern Tree Approach, "Data Mining and Knowledge Discovery
Tác giả: Han J
Năm: 2004
[9] Han, J., Cheng, H., Xin, D., and Yan, X. (2007), Frequent pattern mining: current status and future directions. Data Mining and Knowledge Discovery, vol. 15, pp. 55–86 Sách, tạp chí
Tiêu đề: Data Mining and Knowledge Discovery
Tác giả: Han, J., Cheng, H., Xin, D., and Yan, X
Năm: 2007

HÌNH ẢNH LIÊN QUAN

Hình 1.1. Quy trình phát hiện tri thức - Nghiên cứu một số thuật toán khai phá luật kết hợp và thử nghiệm ứng dụng vào khai phá cơ sở dữ liệu bảo hiểm y tế tại bảo hiểm xã hội Bắc Giang
Hình 1.1. Quy trình phát hiện tri thức (Trang 9)
Bảng 1.1. So sánh các nhiệm vụ phát hiện tri thức - Nghiên cứu một số thuật toán khai phá luật kết hợp và thử nghiệm ứng dụng vào khai phá cơ sở dữ liệu bảo hiểm y tế tại bảo hiểm xã hội Bắc Giang
Bảng 1.1. So sánh các nhiệm vụ phát hiện tri thức (Trang 16)
Hình 2.1. Dàn cho tập I = {1,2,3,4} - Nghiên cứu một số thuật toán khai phá luật kết hợp và thử nghiệm ứng dụng vào khai phá cơ sở dữ liệu bảo hiểm y tế tại bảo hiểm xã hội Bắc Giang
Hình 2.1. Dàn cho tập I = {1,2,3,4} (Trang 36)
Hình 2.2. Cây cho tập I = {1, 2, 3, 4} - Nghiên cứu một số thuật toán khai phá luật kết hợp và thử nghiệm ứng dụng vào khai phá cơ sở dữ liệu bảo hiểm y tế tại bảo hiểm xã hội Bắc Giang
Hình 2.2. Cây cho tập I = {1, 2, 3, 4} (Trang 37)
Hình 2.3. Hệ thống hóa các giải thuật - Nghiên cứu một số thuật toán khai phá luật kết hợp và thử nghiệm ứng dụng vào khai phá cơ sở dữ liệu bảo hiểm y tế tại bảo hiểm xã hội Bắc Giang
Hình 2.3. Hệ thống hóa các giải thuật (Trang 39)
Hình 2.4. Ví dụ thuật toán Apriori - Nghiên cứu một số thuật toán khai phá luật kết hợp và thử nghiệm ứng dụng vào khai phá cơ sở dữ liệu bảo hiểm y tế tại bảo hiểm xã hội Bắc Giang
Hình 2.4. Ví dụ thuật toán Apriori (Trang 45)
Bảng 1. Các thuộc tính trong bảng dữ liệu bc79_80_a - Nghiên cứu một số thuật toán khai phá luật kết hợp và thử nghiệm ứng dụng vào khai phá cơ sở dữ liệu bảo hiểm y tế tại bảo hiểm xã hội Bắc Giang
Bảng 1. Các thuộc tính trong bảng dữ liệu bc79_80_a (Trang 66)
Bảng 3. Dữ liệu đã đƣợc chuẩn hóa - Nghiên cứu một số thuật toán khai phá luật kết hợp và thử nghiệm ứng dụng vào khai phá cơ sở dữ liệu bảo hiểm y tế tại bảo hiểm xã hội Bắc Giang
Bảng 3. Dữ liệu đã đƣợc chuẩn hóa (Trang 67)
Bảng 4. Kết quả minh họa chạy thuật toán Apriori. - Nghiên cứu một số thuật toán khai phá luật kết hợp và thử nghiệm ứng dụng vào khai phá cơ sở dữ liệu bảo hiểm y tế tại bảo hiểm xã hội Bắc Giang
Bảng 4. Kết quả minh họa chạy thuật toán Apriori (Trang 70)
Hình 3. Chạy thuật toán Apriori  3.3.3. Mã nguồn của chương trình. - Nghiên cứu một số thuật toán khai phá luật kết hợp và thử nghiệm ứng dụng vào khai phá cơ sở dữ liệu bảo hiểm y tế tại bảo hiểm xã hội Bắc Giang
Hình 3. Chạy thuật toán Apriori 3.3.3. Mã nguồn của chương trình (Trang 77)

TỪ KHÓA LIÊN QUAN

TRÍCH ĐOẠN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w