Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 77 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
77
Dung lượng
1,82 MB
Nội dung
ĐẠI HỌC THÁI NGUYÊN TRƯỜNG ĐẠI HỌC CNTT & TT -*** - Hoàng Thị Phượng Khai phá luật kết hợp mờ ứng dụng Luận văn Thạc sĩ khoa học máy tính Thái Ngun - 2011 Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc-tnu.edu.vn Đại học Thái Nguyên Trường đại học CNTT & TT -*** - Hoàng Thị Phượng Khai phá luật kết hợp mờ ứng dụng Chuyên ngành: Khoa học máy tính Mã số: 60.48.01 Luận văn Thạc sĩ khoa học máy tính Người hướng dẫn khoa học: PGS TS Đồn Văn Ban Thái Ngun - 2011 Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc-tnu.edu.vn i LỜI CAM ĐOAN Tơi xin cam đoan, cơng trình nghiên cứu riêng tôi, dƣới hƣớng dẫn PGS TS Đoàn Văn Ban Tất nguồn tài liệu tham khảo đƣợc dùng có xuất xứ rõ ràng, đƣợc trích dẫn hợp pháp Tơi xin chịu trách nhiệm chịu hình thức kỉ luật theo quy định cho lời cam đoan Thái Nguyên, 9/2011 Hồng Thị Phƣợng Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc-tnu.edu.vn ii MỤC LỤC Trang phụ bìa LỜI CẢM ƠN LỜI CAM ĐOAN i MỤC LỤC ii CÁC KÝ HIỆU VIẾT TẮT iv DANH MỤC CÁC BẢNG v DANH MỤC CÁC HÌNH VẼ vi MỞ ĐẦU .1 CHƢƠNG I TỔNG QUAN VỀ KHAI PHÁ DỮ LIỆU 1.1 Khai phá liệu phát tri thức .4 1.1.1 Khai phá liệu .4 1.1.2 Các bƣớc q trình phát tri thức 1.1.3 Khái niệm khai phá liệu 1.1.4 Kiến trúc hệ thống khai thác liệu 1.2 Ứng dụng khai phá liệu 10 1.2.1 Ƣu khai phá liệu 10 1.2.2 Ứng dụng khai phá liệu .10 1.3 Hƣớng tiếp cận kỹ thuật khai phá liệu 11 1.3.1 Một số hƣớng tiếp cận khai phá liệu 11 1.3.2 Các phƣơng pháp khai phá liệu (data mining) 11 1.4 Khai phá luật kết hợp sở liệu 12 1.4.1 Luật kết hợp 12 1.4.2 Một số hƣớng tiếp cận khai phá luật kết hợp 13 1.5 Phát biểu toán khai phá luật kết hợp 15 1.5.1 Các khái niệm .15 1.5.2 Phát biểu toán luật kết hợp .18 1.6 Thuật toán Apriori khai phá luật kết hợp .19 1.7 Luật kết hợp có thuộc tính số 22 1.7.1 Luật kết hợp có thuộc tính số thuộc tính hạng mục .22 1.7.2 Các phƣơng pháp rời rạc hóa 23 1.8 Kết luận chƣơng 25 CHƢƠNG II KHAI PHÁ LUẬT KẾT HỢP MỜ 27 2.1 Khái niệm tập mờ (Fuzzy set) 27 Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc-tnu.edu.vn iii 2.1.1 Sơ lƣợc tập mờ 27 2.1.2 Định nghĩa tập mờ 27 2.1.3 Định nghĩa hàm thuộc 28 2.1.4 Các phép toán tập mờ 29 2.2 Khái niệm tập mờ lĩnh vực khai phá liệu 31 2.3 Áp dụng tập mờ để rời rạc hóa ƣu điểm .31 2.4 Luật kết hợp mờ .34 2.5 Thuật tốn khai phá luật kết hợp mờ có thuộc tính số đƣợc đánh trọng số (David L Olson) 36 2.5.1 Giới thiệu thuật toán .36 2.5.2 Chi tiết thuật toán 36 2.6 Thuật toán khai phá luật kết hợp mờ có thuộc tính số (F- APACS) 39 2.6.1 Giới thiệu thuật toán .39 2.6.2 Những khái niệm .42 2.6.3 Thuật toán F-APACS .46 2.6.4 Xác định luật có ích 48 2.6.5 Đo độ tin cậy luật kết hợp 49 2.7 Kết luận chƣơng II 51 CHƢƠNG III CÀI ĐẶT THUẬT TOÁN F -APACS TRÊN CƠ SỞ DỮ LIỆU CƢỚC ĐIỆN THOẠI .51 3.1 Đặt vấn đề 51 3.1.1 Phát gian lận (fraud detection) 52 3.1.2 Các ứng dụng quản lý chăm sóc khách hàng .52 3.1.3 Các ứng dụng phát cô lập lỗi hệ thống mạng viễn thông (Network fault isolation) 54 3.2 Các liệu viễn thơng .54 3.3 Cài đặt thuật toán sở liệu cƣớc điện thoại 55 3.4 Kết cài đặt thuật toán 58 3.5 Kết luận chƣơng III 65 KẾT LUẬN .66 TÀI LIỆU THAM KHẢO 67 Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc-tnu.edu.vn iv CÁC KÝ HIỆU VIẾT TẮT Tên viết tắt CSDL Tên đầy đủ Cơ sở liệu DL Dữ liệu DM Data Mining (Khai phá liệu) KDD Knowledge discovery in database (Phát tri thức sở liệu) KPDL Khai phá liệu Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc-tnu.edu.vn v DANH MỤC CÁC BẢNG Bảng 1.1 Ví dụ CSDL dạng giao dịch 15 Bảng 1.2 CSDL giao dịch với độ hỗ trợ 16 Bảng 1.3 Tính độ hỗ trợ độ tin cậy 17 Bảng 1.4 Các tập phổ biến 18 Bảng 1.5 Luật kết hợp sinh từ tập phổ biến ADE 19 Bảng 1.6 Cơ sở liệu chi tiết gọi điện thoại 22 Bảng 1.7 Rời rạc hóa thuộc tính số rời rạc hữu hạn thuộc tính hạng mục 24 Bảng 1.8 Rời rạc hóa thuộc tính thời gian đàm thoại (TGĐT) 24 Bảng 2.1 Cơ sở liệu 10 gọi 35 Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc-tnu.edu.vn vi DANH MỤC CÁC HÌNH VẼ Hình 1.1 Q trình khai phá tri thức Hình 1.2 Kiến trúc điển hình hệ thống khai phá liệu Hình 2.1 Đồ thị hàm thuộc thuộc tính Thời gian đàm thoại 32 Hình 2.2 Các bƣớc thuật tốn tìm luật kết hợp từ liệu số 41 Hình 2.3 Đồ thị xác định mức độ thuộc thuộc tính j 45 Hình 3.1 Nguồn liệu cƣớc điện thoại 56 Hình 3.2 Các bƣớc tiến hành khai phá liệu cƣớc điện thoại 57 Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc-tnu.edu.vn MỞ ĐẦU Dữ liệu ngày nhiều đa dạng phức tạp Trong thời đại ngày nay, thời đại kinh tế tri thức đòi hỏi hoạt động ngƣời phải dựa thông tin tri thức Những thông tin tiềm ẩn kho liệu Để khai phá thông tin hữu ích từ nguồn liệu to lớn cách hiệu cần công cụ kỹ thuật thích hợp Theo đánh giá IBM, phƣơng pháp khai phá thông tin truyền thống thu đƣợc 80% thông tin từ sở liệu, phần cịn lại bao gồm thơng tin khái qt, thơng tin có tính quy luật cịn tiềm ẩn sở liệu Lƣợng thông tin nhỏ nhƣng thông tin cốt lõi cần thiết cho tiến trình định Vì vậy, phải tìm cách để phân tích liệu tự động, để phân loại liệu tự động, để tổng hợp liệu tự động, để phát mô tả xu hƣớng tự động, để cảnh báo dị thƣờng tự động Đây lĩnh vực động thú vị cộng đồng nghiên cứu sở liệu (CSDL) Việc tự động phân tích tìm kiếm thơng tin tiềm ẩn có giá trị, chƣa đƣợc phát hiện, thực trình phát tri thức sở liệu (Knowledge Discovery in Database KDD) Khai phá liệu (KPDL) chủ đề thu hút nhiều quan tâm nhà khoa học lẫn ngƣời làm quản lý KPDL trở thành hƣớng nghiên cứu lĩnh vực khoa học máy tính cơng nghệ tri thức Hàng loạt nghiên cứu, đề xuất đời đƣợc thử nghiệm ứng dụng thành công vào đời sống Thành công KPDL kết hợp kỹ thuật từ lĩnh khác nhƣ học máy, trí tuệ nhân tạo, lý thuyết thông tin, xác suất thống kê, tính tốn hiệu cao Các tốn chủ yếu KPDL phân lớp/dự đoán (classification/prediction), phân cụm (clustering), khai phá luật kết hợp (association Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc-tnu.edu.vn rules mining), khai phá chuỗi (sequence mining), Lĩnh vực điểm hội tụ giao thoa nhiều lĩnh vực khác Với kết hợp nhiều thành tựu nghiên cứu lĩnh vực khác, KPDL có đƣợc tồn diện đầy đủ cách tìm kiếm xử lý thông tin cách tiên tiến, hiệu KPDL đƣợc ứng dụng thành công vào thƣơng mại, tài & thị trƣờng chứng khốn, sinh học, y học, giáo dục, viễn thông, Khai phá luật kết hợp kỹ thuật quan trọng KPDL đƣợc đề xuất vào năm 1993 phát triển mạnh mẽ năm gần Trong thời kỳ đầu khai phá luật kết hợp đơn giản khai phá diện mẫu A dẫn đến xuất mẫu B Sau luật kết hợp đƣợc khai phá quan hệ có tính số lƣợng mẫu Những nghiên cứu luật kết hợp gần tập trung xây dựng thuật toán khai phá luật kết hợp mới, hiệu cải tiến, phát triển thuật toán hiệu từ thuật tốn có Ý tƣởng liên kết luật kết hợp với lý thuyết tập mờ xuất từ vài năm trƣớc Ý tƣởng ban đầu xuất phát từ nỗ lực để xử lý thuộc tính số CSDL, việc phân chia giá trị số vào tập rõ dẫn đến việc đánh giá cao thấp giá trị gần biên Tập mờ khắc phục vấn đề cách cho phép phần tử thuộc vào tập khác Lý thuyết tập mờ cung cấp công cụ cần thiết để thực tính tốn cấu trúc liệu khác Việc sử dụng logic mờ mơ hình quan hệ cung cấp cách hiệu để xử lý liệu số với thơng tin khơng xác, không chắn không đầy đủ Lý thuyết tập mờ ngày đƣợc sử dụng nhiều thƣờng xuyên hệ thống thơng minh mối quan hệ với cách lập luận ngƣời Một số nghiên cứu chứng minh đƣợc hiệu suất vƣợt trội logic mờ KPDL kho liệu Ý thức đƣợc lĩnh vực nghiên cứu có nhiều triển vọng, tơi Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc-tnu.edu.vn 55 Mỗi gọi khách hàng mạng viễn thông phát sinh mẫu tin chi tiết gọi Các mẫu tin bao gồm thông tin đặc tả thuộc tính quan trọng gọi nhƣ: số gọi, số bị gọi, thời gian bắt đầu thời gian đàm thoại Thông thƣờng liệu chi tiết gọi không đƣợc sử dụng trực tiếp cho ứng dụng KPDL mà thƣờng kết hợp với thông tin cá nhân khách hàng để tổng qt hóa thành thơng tin hành vi sử dụng điện thoại khách hàng Dữ liệu trạng thái mạng ( network data ) Mạng viễn thơng có cấu hình phức tạp, đƣợc cấu trúc hàng ngàn thiết bị viễn thông kết nối với Các thông điệp trạng thái (status message) thiết bị phải đƣợc lƣu trữ thành kho liệu trạng thái mạng (network data) chúng đƣợc phân tích theo trình tự để hỗ trợ chức quản lý mạng Mỗi thơng điệp trạng thái phải bao gồm thời gian phát sinh thông tin mã hóa lỗi hay trạng thái thiết bị Dữ liệu khách hàng ( customer data ) Các thông tin khách hàng đƣợc lƣu trữ để dùng cho ứng dụng nhƣ tính cƣớc, tiếp thị Thông tin khách hàng bao gồm số điện thoại, họ tên, địa thuộc tính quan trọng khác nhƣ q trình tốn nợ, q trình sử dụng dịch vụ, thu nhập Thông thƣờng liệu khách hàng phải đƣợc kết hợp với liệu khác, (ví dụ nhƣ liệu chi tiết gọi) sử dụng kỹ thuật KPDL 3.3 Cài đặt thuật toán sở liệu cƣớc điện thoại 3.3.1 Nguồn liệu cƣớc điện thoại Hiện tại, q trình tính cƣớc dịch vụ viễn thơng toàn tỉnh đƣợc thực tập trung trung tâm Hàng tuần tổng đài truyền máy chủ số lƣợng lớn ghi chi tiết gọi (Call Detail Records - viết tắt CDR‟s) Các thông tin CDR‟s cho biết cách sử dụng dịch vụ khách hàng chất lƣợng dịch vụ công ty viễn thông cung cấp Cuộc gọi bắt đầu tính cƣớc máy chủ gọi đƣợc kết nối với máy bị gọi kết thúc hai máy chủ gọi máy bị gọi ngừng liên lạc Sau kết thúc gọi Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc-tnu.edu.vn 56 số liệu chi tiết liên quan đến gọi đƣợc lƣu tổng đài theo dạng tệp tin theo định dạng tuỳ thuộc vào loại tổng đài Các số liệu đƣợc lƣu lại sau truyền cho trung tâm Tại trung tâm số liệu loại tổng đài truyền đƣợc chuyển khuôn dạng số liệu để tính cƣớc 3.3.2 Các bƣớc xây dựng hệ thống khai phá liệu cƣớc điện thoại Chi tiết gọi Khách hàng danh bạ Tập tập mờ hàm thuộc Tích hợp loại cƣớc Cơ sở liệu ban đầu (Cơ sở liệu gốc) Số hóa Trung tâm Học liệu – ĐHTN CƠ SỞ DỮ LIỆU MỜ Tiến hành mờ hóa liệu http://www.lrc-tnu.edu.vn 57 Thực khai phá liệu cƣớc điện thoại gồm bƣớc sau: + Chọn nguồn liệu cần khai phá liệu chi tiết gọi tập tin danh sách khách hàng + Xây dựng hệ mờ gồm tập mờ hàm thuộc để ánh xạ liệu cƣớc ban đầu sang liệu mờ, chọn lọc thuộc tính cần thiết tập tin cần khai phá liệu, thuộc tính gắn với hàm thuộc tƣơng ứng + Tiến hành mờ hóa liệu gốc chuyển sang liệu mờ + Tiến hành khai phá liệu mờ thuật tốn F-APACS 3.3.3 Mơ tả cấu trúc liệu Cấu trúc bảng liệu khách hàng Tên trƣờng Mô tả Kiểu liệu Makhachhang Mã khách hàng nvarchar(10) Tenkhachhang Tên khách hàng nvarchar(30) Sodienthoai Số điện thoại nvarchar(15) Diachikhachhang Địa khách hàng nvarchar(50) Sohopdong Số hợp đồng nvarchar(10) Nhom Nhóm (Đối tƣợng khách hàng) nvarchar(20) STT Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc-tnu.edu.vn 58 Cấu trúc bảng liệu chi tiết gọi Tên trƣờng Mô tả Kiểu liệu Makhachhang Mã khách hàng nvarchar(10) Somaychu Số máy chủ gọi nvarchar(15) Somaykhach Số máy bị gọi nvarchar(15) Ngaygoi Ngày gọi Date Thoidiembatdau Giờ bắt đầu gọi Time Thoigiandamthoai Thời gian đàm thoại Time Loaicuoc Loại cƣớc nvarchar(15) Giacuoc Giá cƣớc float STT Mơ hình quan hệ 3.3.4 Mơi trƣờng cài đặt Chƣơng trình đƣợc cài đặt môi trƣờng ứng dụng sau: - Hệ điều hành Windows 9x/ XP/ 2007 - Ngôn ngữ sử dụng: C# - Môi trƣờng cài đặt: Microsoft Visual Studio 2008 - Hệ quản trị sở liệu: SQL Server 2008 3.4 Kết cài đặt thuật tốn Form chƣơng trình Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc-tnu.edu.vn 59 Chƣơng trình có chức sau: - Xem liệu sở liệu - Hiển thị vùng mờ hóa theo thuộc tính - Hiển thị mức độ thuộc theo thuộc tính - Hiển thị tập mục phổ biến tiềm - Hiển thị danh sách luật tìm đƣợc Xem liệu sở liệu Menu Xem liệu có chức sau: - Xem liệu bảng cách chọn bảng danh sách (list) gồm có bảng: Khachhang Chitiet - Nhập liệu vào bảng nhờ menu Bảng khách hàng Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc-tnu.edu.vn 60 Bảng chi tiết gọi Hiển thị vùng mờ hóa Tại Form ta xem vùng mờ miền giá trị hai thuộc tính Thoidiembatdau (thời điểm bắt đầu) Thoigiandamthoai (thời gian đàm thoại) bảng chi tiết gọi Ở đây, sử dụng kỹ thuật phân cụm k-means chất thuộc tính để tìm tập mờ phân miền giá trị thuộc tính Hiển thị vùng mờ hóa theo thuộc tính Thoidiembatdau Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc-tnu.edu.vn 61 Hiển thị vùng mờ hóa theo thuộc tính Thoigiandamthoai Hiển thị mức độ thuộc Sau có tập mờ miền giá trị ta tính mức độ thuộc cho thuộc tính có giá trị mờ theo hàm thuộc đƣợc đƣa thuật tốn Tức mờ hóa thuộc tính nhƣ: Thoidiembatdau, Thoigiandamthoai thuộc tính hạng mục nhƣ: Nhom, Loaicuoc Mức độ thuộc thuộc tính Thoidiembatdau Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc-tnu.edu.vn 62 Mức độ thuộc thuộc tính Thoigiandamthoai Mức độ thuộc thuộc tính Nhom Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc-tnu.edu.vn 63 Mức độ thuộc thuộc tính Loaicuoc Hiển thị mục phổ biến tiềm Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc-tnu.edu.vn 64 Để có đƣợc tập mục phổ biến tiềm trƣớc tiên tìm tập thuộc phổ biến dựa vào độ hỗ trợ chúng (với độ hỗ trợ lớn ngƣỡng cho trƣớc) Sau đó, tính thơng tin tƣơng hỗ chuẩn để kiểm tra xem tập thuộc tính phổ biến vừa tìm có phải thuộc tính phổ biến tiềm không Các tập mục phổ biến tiềm tìm đƣợc tập mục để sinh luật kết hợp Hiển thị danh sách luật Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc-tnu.edu.vn 65 Từ tập mục phổ biến tiềm ta xây dựng luật kết hợp Sau tìm luật có ích dựa sai phân điều chỉnh 3.5 Kết luận chƣơng III Chƣơng trình bày nội dung sau: - Ứng dụng kỹ thuật khai phá liệu lĩnh vực chăm sóc khách hàng ngành viễn thông - Dựa nguồn liệu cƣớc điện thoại cài đặt thuật toán F-APACS để khai phá luật kết hợp mờ Sử dụng phƣơng pháp sinh luật mà không cần đến ngƣỡng minsup minconf Ngồi thuật tốn sử dụng sai phân điều chỉnh cho việc tìm kiếm tính thú vị thuộc tính để tạo Chƣơng trình cài đặt thuật toán với giao diện thân thiện dễ dùng, tốc độ thực thuật toán nhanh CSDL lớn Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc-tnu.edu.vn 66 KẾT LUẬN Nhƣ trình bày phần mở đầu trình phát tri thức kết hợp nhiều thành tựu nghiên cứu lĩnh vực đời sống xã hội nhƣ lý thuyết tập mờ, hệ chuyên gia, trí tuệ nhân tạo, q trình tìm tri thức “tiềm ẩn” khơng biết trƣớc Tiềm có lợi từ CSDL lớn mà khai phá liệu đƣợc coi giai đoạn quan trọng trình Kết đạt đƣợc: - Luận văn trình bày tổng quan KPDL phát tri thức CSDL Giới thiệu chi tiết toán khai phá luật kết hợp thuật tốn kinh điển Apriori - Trình bày khai phá luật kết hợp mờ, dạng luật kết hợp gần gũi tự nhiên với ngƣời sử dụng Luận văn khai thác số thuật toán khai phá luật kết hợp mờ nhƣ: thuật toán khai phá luật kết hợp mờ đƣợc đánh trọng số David L.Olson, thuật toán F-APACS K.C.C Chan and W-H Au - Viết chƣơng trình C# cài đặt thuật tốn F-APACS tìm luật kết hợp mờ CSDL cƣớc điện thoại hệ quản trị SQL 2008 Ở thuật tốn khơng phải cung cấp giá trị ngƣỡng minsup minconf – ngƣỡng thƣờng khó xác định để tìm đƣợc luật kết hợp phù hợp nhƣ thuật toán khác Thuật toán sử dụng trọng số đo độ chắn giống nhƣ thông tin tƣơng hỗ lý thuyết thông tin để giới hạn khơng gian tìm kiếm tạo tập mục phổ biến tiềm Hơn có khả tạo luật có ích nhờ sai phân điều chỉnh Hƣớng phát triển đề tài: Luận văn nghiên cứu hai thuật toán khai phá luật kết hợp mờ là: Thuật tốn khai phá luật kết hợp mờ đƣợc đánh trọng số David L Olson, thuật toán F-APACS K.C.C Chan and W-H Au Song cài đặt đƣợc thuật toán F-APACS, thời gian tới cài đặt thêm thuật toán khai phá luật kết hợp mờ đƣợc đánh trọng số David L Olson Sau đánh giá hai thuật toán để đƣa ƣu điểm giúp ngƣời sử dụng lựa chọn thuật toán phù hợp cho ứng dụng Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc-tnu.edu.vn 67 TÀI LIỆU THAM KHẢO Tiếng Việt Nguyễn Thanh Thủy (2001), Khai phá liệu, Nhà xuất Kỹ thuật ứng dụng Hà Quang Thụy, Phan Xn Hiếu, Đồn Sơn, Nguyễn Trí Thành, Nguyễn Thu Trang, Nguyễn Cẩm Tú (2009), Giáo trình khai phá liệu Web, Nhà xuất giáo dục Việt Nam Bùi Cơng Cƣờng, Nguyễn Dỗn Phƣớc (2001), “Hệ mờ, mạng nơron & ứng dụng”, NXB Khoa học Kỹ thuật Tài liệu Tiếng Anh Fayyad, Piatetsky-Shapiro, Smyth (1996), From Data Mining to Knowledge Discovery: An Overiew In Fayyad, Piatetsky-Shapiro, Smyth, Uthurusamy, Advances in Knowledge Discovery and Data Mining, AAAI Press/ The MIT Press, Menlo Park, CA Alan Rea (1995), Data Mining – An Introduction The Parallel Computer Centre, Nor of The Queen‟s University of Belfast Boris Kovalerchuk and Evgenii Vityaev (2001) Data Mining in Finance: Advances in Relational and Hybrid Methods Kluwer Academic Publishers, Boston, Dordrecht - London Jiawei Han and Micheline Kamber (2006), Data Mining: Concepts and Techniques, University of Illinois, Morgan Kaufmann R.Agrawal, T.Imielinski, and A.Swami (1993), “Mining association rules between sets of items in large databases,” in Proc Of the 1993 ACM SIGMOD Conference R.Agrawal and R.Srikant (1998), “Mining quantitative association rules in large relationals tables” 10 R.Agrawal, R.Srikant (1994), “Fast Algorithms for Mining Association Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc-tnu.edu.vn 68 Rules”, In Proc of the 20th International Conference on Very Large Databases, Santiago, Chile 11 Rakesh Agrawal, John Shafer (1996), “Parallel mining of association rules: Design, implementation and experience”, Research Report RJ 10004, IBM Almaden Research Center, San Jose, California 12 D.L.Olson, Yanhong Li (2007), “Mining Fuzzy Weighted Association Rules”, Proceedings of the 40th Hawaii International Conference on System Sciences 13 Gyenesei A (2000), “Mining weighted association rules for fuzzy quantitative items”, TUCS Technical Report No 346 14 D.B.Skilicorn (1999), “Strategies for Parallel Data Mining”, External Technical Report 15 Attila Gyenesei (2000), “A Fuzzy Approach for Mining Quantitative Association Rules”, Turku Centre for Computer Science, TUCS Technical Reports 16 Chan Man Kuok, Ada Fu and Man Hon Wong (1998), “Mining Fuzzy Association Rules in Databases” Department of Computer Science and Engineering, The Chinese University of Hong Kong, Shatin, New Territories, Hong Kong 17 Ramakrishnan Srikant, Rakesh Agrawal (1995), “Mining Quantitative Association Rules in Large Relational Tables”, IBM Almaden Research Center, San Jose, CA 95120 18 L.Zadeh (1965), “Fuzzy Sets”, Tournal of Information and Control 19 M.Delgado and A.Gonzaler (1993), “An inductive learning procedire to identify fuzzy systems”, Fuzzy Sets and Systems 20 P Bosc and O Pivert (2001), “On some fuzzy extensions of association rules”, Proceedings of IFSA-NAFIPS, Piscataway, NJ, IEEE Press Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc-tnu.edu.vn 69 21 C Kuok, A Fu and H Wong (1998), “Mining fuzzy association rules in databases”, ACM SIGMOD Record 22 R Laner, F.E Petry and M.A Cobb (2003), “Fuzzy set approaches to spatial data mining of association rules”, Transactions in GIS 23 A Maeda, H Ashida, Y.Taniguchi, and Y Takahashi, “Data Mining System using Fuzzy Rule Induction,” in Proc of 1995 IEEE Int’l Conf on Fuzzy Systems, Yokohama, Japan, Mar 1995, pp 45-46 24 K.C.C Chan, and A.K.C Wong, “A Statistical Technique for Extracting Classificatory Knowledge from Databases,” in [14], pp 107-123 25 K.C.C.Chan, and W.-H.Au, “An Effective Algorithm for Mining Interesting Quantitative Association Rules,” in Proc of the 12th ACM Symp on Applied Computing (SAC’97), San Jose, CA, Feb 1997 26 S Lotfi, M.H Sadreddini (2009), “Mining Fuzzy Association Rules Using Mutual Information”, Proceedings of the International MultiConference of Engineers and Computer Scientists 2009 Vol I, IMECS, Hong Kong 27 K.C.C Chan, and A.K.C Wong, “APACS: A System for the Automatic Analysis and Classification of Conceptual Patterns,” Computational Intelligence, vol 6, pp 119-131, 1990 28 Shannon C, “A mathematical theory of communication, i and ii” Bell Syst Tech J 27: 379-423, 623-656, July, October 1948 29 T.P Hong, C.S Kuo and S.C Chi (1999), “Mining association rules from quantitative data”, Intell Data Anal 30 Mangalampalli, A.Pudi (2008), “Fuzzy Logic-based Pre-processing for Fuzzy Association Rule Mining”, Technical Report IIIT/TR/2008/127, International Institute of Information Technology Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc-tnu.edu.vn ... luật kết hợp 13 1.5 Phát biểu toán khai phá luật kết hợp 15 1.5.1 Các khái niệm .15 1.5.2 Phát biểu toán luật kết hợp .18 1.6 Thuật toán Apriori khai phá luật kết hợp. .. số thuật toán khai phá luật kết hợp mờ nhƣ: thuật toán khai phá luật kết hợp mờ đƣợc đánh trọng số David L Olson, thuật toán F-APACS Keith C.C Chan Wai-Ho-Au khai phá luật kết mờ hiệu Chƣơng... học quan hệ - Khai phá liệu văn - Mạng neuron - Thuật giải di truyền 1.4 Khai phá luật kết hợp sở liệu 1.4.1 Luật kết hợp Khai phá luật kết hợp kỹ thuật quan trọng KPDL đƣợc đời phát triển mạnh