Một số vấn đề liên quan đến lý thuyết tập thô

109 16 0
Một số vấn đề liên quan đến lý thuyết tập thô

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

ĐẠI HỌC QUỐC GIA HÀ NỘI TRƢỜNG ĐẠI HỌC CÔNG NGHỆ Đỗ Thị Mai Hƣờng MỘT SỐ VẤN ĐỀ LIÊN QUAN ĐẾN LÝ THUYẾT TẬP THƠ Chun ngành: Cơng nghệ thông tin Mã số: 1.01.10 LUẬN VĂN THẠC SĨ NGƢỜI HƢỚNG DẪN KHOA HỌC: PGS.TS VŨ ĐỨC THI Hà nội – 2007 -1- LỜI CẢM ƠN Để hồn thành tốt luận văn này, em có động viên, giúp đỡ nhiều người Trước tiên, em xin bày tỏ lịng kính trọng biết ơn sâu sắc tới PGS.TS Vũ Đức Thi, người hướng dẫn, giúp đỡ tạo điều kiện cho em suốt trình làm luận văn Em xin cảm ơn TS Hà Quang Thụy cho em lời khuyên quý báu giai đoạn đầu trình làm luận văn Em xin chân thành cảm ơn Thầy Khoa Công nghệ thông tin - Đại học Công nghệ - Đại học Quốc gia Hà nội, Thầy Viện Công nghệ thông tin giảng dạy, truyền đạt kiến thức cho em suốt trình học tập nghiên cứu trường Cuối cùng, xin cảm ơn gia đình, bạn bè đồng nghiệp Khoa Công nghệ thông tin, Học viện Kỹ thuật Quân động viện, tạo điều kiện để tơi hồn thành q trình học tập hồn thành tốt luận văn Hà Nội, tháng 01 năm 2007 NGƢỜI THỰC HIỆN Đỗ Thị Mai Hường -2- MỤC LỤC BẢNG CÁC KÍ HIỆU VIẾT TẮT DANH SÁCH CÁC BẢNG DANH SÁCH CÁC HÌNH VẼ MỞ ĐẦU CHƢƠNG TỔNG QUAN VỀ KHÁM PHÁ TRI THỨC VÀ LÝ THUYẾT TẬP THÔ 10 1.1 Khám phá tri thức Error! Bookmark not defined 1.1.1 Định nghĩa khám phá tri thức 10 1.1.2 Các bước trình khám phá tri thức 11 1.1.3 Khai phá liệu 12 1.1.4 Các tốn khai phá liệu 14 1.1.5 Một số kỹ thuật khai phá liệu 16 1.2 Lý thuyết tập thô 19 1.2.1 Hệ thông tin 19 1.2.2 Hệ định 20 1.2.3 Quan hệ không phân biệt hệ thông tin .21 1.2.4 Tập xấp xỉ trên, xấp xỉ miền biên 23 1.2.5 Tập thuộc tính rút gọn tập thuộc tính nhân 28 1.2.6 Ma trận phân biệt hàm phân biệt 30 1.2.7 Hàm thành viên thô 33 1.2.8 Sự phụ thuộc thuộc tính 34 1.3 Kết luận chƣơng 34 CHƢƠNG QUÁ TRÌNH KHÁM PHÁ TRI THỨC THEO CÁCH TIẾP CẬN TẬP THÔ 36 2.1 Sự rời rạc hố dựa tập thơ lập luận logic 36 2.1.1 Khái niệm tập nhát cắt, nhát cắt bảng định 36 2.1.2 Vấn đề rời rạc hóa 38 2.2 Lựa chọn thuộc tính dựa tập thơ với phƣơng pháp đánh giá kinh nghiệm …… 48 2.3 Một số phƣơng pháp khác xây dựng tập thuộc tính rút gọn 52 -3- 2.3.1 Lo 2.3.2 Ch 2.3.3 Ch 2.3.4 Ch 2.3.5 Cá 2.3.6 Rú 2.3.7 Ch 2.4Quá trình khám phá luật bảng định 2.4.1 Lu 2.4.2 Ha 2.4.3 Kh 2.4.4 Th 2.4.5 Th 2.4.6 Tiê 2.4.7 Mộ 2.5Khám phá mẫu hệ thông tin 2.6Kết luận chƣơng CHƢƠNG ỨNG DỤNG LÝ THUYẾT TẬP THÔ TRONG BÀI TOÁN TƢ VẤN THI ĐẠI HỌC 3.1Bộ công cụ Rosetta 3.1.1 Gi 3.1.2 Cá 3.2Ứng dụng lý thuyết tập thơ tốn Tƣ v 3.2.1 Mơ 3.2.2 Tậ 3.2.3 Qu 3.3Kết luận chƣơng KẾT LUẬN TÀI LIỆU THAM KHẢO Ký hiệu, viết tắt KDD RS A A, B D a Va U Pa RED CORE card (X) hay ||X|| -5- DANH SÁCH CÁC BẢNG Bảng1.1: Ví dụ học cho khái niệm chơi tennis Bảng 1.2: Một ví dụ hệ thơng tin Bảng 1.3: Ví dụ bảng định TuyenSinh * Bảng 2.1: Bảng thông tin A xây dựng từ A Bảng 2.2: Bảng thông tin mô tả đối tượng Bảng 2.3: Trạng thái khởi tạo Bảng 2.4: Các bảng thông tin tương ứng với việc chọn thuộc tính a, c, d Bảng 3.1: Tiêu chí chọn trường thi đại học Bảng 3.2: Danh mục môn thi khối thi đại học Bảng 3.3: Dữ liệu nhát cắt Bảng 3.4: Dữ liệu sau rời rạc hóa Bảng 3.5: Dữ liệu thu sau sinh luật Bảng 3.6: Dữ liệu luật sau xử lý -6- DANH SÁCH CÁC HÌNH VẼ Hình 1.1: Mơ hình mơ tả q trình khám phá tri thức Hình 1.2: Mơ tả định cho khái niệm chơi tennis Hình 1.3 : Xấp xỉ tập thí sinh cần xem xét thi đại học Hình 2.1: Một họ phân hoạch định nghĩa tập nhát cắt Hình 2.2: Q trình rời rạc hóa Hình 2.3 : Giá trị đối tượng biểu diễn đồ thị Hình 2.4: Các nhát cắt đồ thị Hình 2.5: Các điểm cắt thuộc tính a Hình 2.6: Tập nhát cắt tối thiểu Hình 3.1: Sơ đồ trình sinh luật Hình 3.2 : Sơ đồ thuật tốn sinh liệu ngẫu nhiên Hình 3.3: Mơ hình quan hệ sở liệu TuyenSinh Hình 3.4: Giao diện nhập thơng tin dự đốn kết Hình 3.5: Giao diện hiển thị kết dự đốn cho trường đại học Hình 3.6: Giao diện hiển thị kết dự đoán cho nhiều trường đại học -7- MỞ ĐẦU Cùng với phát triển Công nghệ thông tin, khám phá tri thức sở dƣ liệu lớn lĩnh vực đƣợc nhiều nhà nguyên cứu ứng dụng tin học đặc biệt quan tâm Khám phá tri thức sở liệu q trình tìm thơng tin mới, thơng tin hữu ích, tiềm ẩn sở liệu Quá trình phát tri thức gồm nhiều giai đoạn, giai đoạn khai phá liệu quan trọng Đây giai đoạn tìm thơng tin sở liệu Q trình phát tri thức tiếp thu, sử dụng phát triển thành tựu nhiều lĩnh vực nghiên cứu ứng dụng tin học trƣớc nhƣ: lý thuyết nhận dạng, hệ chuyên gia, trí tuệ nhân tạo, thống kê, v.v Khám phá tri thức sử dụng nhiều thuật toán khám phá tri thức nhƣ: Sử dụng định, phƣơng pháp thống kê, mạng neural, thuật tốn di truyền, lý thuyết tập thơ Trong thập niên gần đây, lý thuyết tập thô liên tục phát triển, thu hút ngày nhiều nhóm nghiên cứu ngƣời quan tâm đến phƣơng pháp luận Lý thuyết tập thô đƣợc bắt nguồn Zdzislaw Pawlak nhƣ kết trình nghiên cứu lâu dài thuộc tính logic hệ thông tin Lý thuyết tập thô đƣợc xây dựng tảng toán học vững giúp cung cấp cơng cụ hữu ích để giải toán phân lớp liệu khai phá luật, Với đặc tính xử lý đƣợc liệu mơ hồ, không chắn tập thô tỏ hữu ích việc giải tốn thực tế Cụ thể, lý thuyết tập thơ liệu đƣợc biểu diễn thông qua hệ thông tin, hay bảng định; ý tƣởng việc phân tích liệu theo tiếp cận tập thơ xuất phát từ khái niệm xấp xỉ tập, quan hệ không phân biệt đƣợc Từ bảng liệu lớn với liệu dƣ thừa, khơng hồn hảo, liệu liên tục, hay liệu biểu diễn dƣới dạng ký hiệu, lý thuyết tập thô cho phép khám phá tri thức từ loại liệu nhƣ nhằm phát quy luật tiềm ẩn từ khối -8- liệu Tri thức đƣợc biểu diễn dƣới dạng luật, mẫu mô tả mối quan hệ bị che dấu liệu Trong lý thuyết tập thô, chất lƣợng thông tin đƣợc đo cách sử dụng khái niệm tập xấp xỉ xấp xỉ duới Ngƣời ta tìm đƣợc tập thuộc tính nhỏ nhằm loại bỏ thơng tin dƣ thừa, không cần thiết mà giữ đƣợc ý nghĩa Sau đó, dựa vào tập thuộc tính nhỏ ngƣời ta tìm quy luật chung mẫu để biểu diễn liệu Lý thuyết tập thơ đóng vai trị quan trọng trí tuệ nhân tạo ngành khoa học khác liên quan đến nhận thức, đặc biệt lĩnh vực máy học, thu nhận tri thức, phân tích định, phát khám phá tri thức từ sở liệu, hệ chuyên gia, hệ hỗ trợ định, lập luận dựa quy nạp nhận dạng Một số ứng dụng cụ thể lý thuyết tập thô đƣợc phát triển vài năm gần lĩnh vực nhƣ y học, dƣợc học, ngân hàng, tài chính, phân tích thị trƣờng Tiếp cận tập thơ đóng vai trị quan trọng nhiều ứng dụng kỹ thuật nhƣ máy chuẩn đoán, khoa học vật liệu,… Sự công bố lý thuyết tạo điều kiện phát triển nhiều ứng dụng [19,21] Một số ứng dụng tập thơ trí tuệ nhân tạo phân tích khám phá tri thức từ liệu [25] Với ƣu điểm nhƣ lý thuyết tập thô, dành thời gian để nghiên cứu tìm hiểu phƣơng pháp luận Luận văn sâu vào tìm hiểu ý tƣởng sở tốn học lý thuyết tập thơ Thơng qua tìm hiểu khai thác công cụ ROSETTA (đƣợc xây dựng Aleksander Ohrn cộng thuộc nhóm nghiên cứu tri thức thuộc khoa Khoa học máy tính thơng tin trƣờng Đại học Norwegian, Trondheim, Na-uy nhóm Logic thuộc ĐHTH Warsaw, Ba-lan), luận văn đƣa số đề xuất ứng dụng thử nghiệm lý thuyết tập thô vào việc hỗ trợ định chọn trƣờng thi phù hợp với khả cho em học sinh trƣớc kỳ thi tuyển sinh đại học Luận văn đƣợc trình bày gồm có ba chƣơng:  Chƣơng 1: Giới thiệu tổng quan khám phá tri thức, toán khai phá liệu kỹ thuật khai phá liệu Giới thiệu khái niệm lý -9- thuyết tập thô nhƣ: hệ thông tin, bảng định, khái niệm không phân biệt đƣợc, tập xỉ trên, tập xỉ dƣới miền biên, ma trận phân biệt, rút gọn, v.v Nội dung chƣơng đƣợc tổng hợp từ tài liệu [5,6,7,8,9,10,15,12,18]  Chƣơng 2: Trình bày trình khám phá tri thức theo cách tiếp cận tập thô phƣơng pháp sử dụng trình khai phá liệu Chẳng hạn nhƣ rời rạc hóa liệu theo phƣơng pháp lập luận logic, rút gọn thuộc tính theo phƣơng pháp Heuristic, v.v Nội dung chƣơng đƣợc tổng hợp từ tài liệu [6,7,10,15,12,18,19,24]  Chƣơng 3: Từ kết nghiên cứu trình bày chƣơng chƣơng hai, thơng qua công cụ ROSETTA [11], đề xuất ứng dụng lý thuyết tập thơ vào thực tế tốn tƣ vấn thi đại học -82- Đối với thí sinh ta cần sinh ngẫu nhiêu điểm trung bình chung mơn học tốn, lý, hóa Căn vào thực tế để có khả dự thi đại học khối A học sinh phải có điểm trung bình mơn tự nhiên >=5.0, điểm trung bình mơn đƣợc sinh ngẫu nhiên dải [5.0, 10.0] Việc sinh điểm trung bình ngẫu nhiên đƣợc thực thông qua việc sử dụng hàm RAND() ngôn ngữ lập trình T-SQL cho phép sinh số ngẫu nhiễn đoạn [0,1] Khi có đƣợc điểm trung bình chung mơn: DTB_Toan, DTB_Ly, DTB_Hoa, kết thi thí sinh đƣợc xác định tổng điểm trung bình (Total) mơn so với mức ngƣỡng (Threshold) đề (căn vào điểm đỗ năm trƣớc) Nếu Total>= Threshold khả thi đỗ thí sinh 90%, trƣợt 10% Ngƣợc lại, Total < Threshold khả thi đỗ thi sinh 5%, trƣợt 95% Bƣớc 2: Sử dụng công cụ Rosetta để rời rạc hóa liệu demo đƣợc phát sinh bƣớc Dữ liệu đƣợc rời rạc hóa thơng qua nhát cắt từ file chứa thông tin nhát cắt File chứa thông tin nhát cắt đƣợc định nghĩa nhƣ sau: nhatcat.txt Bảng 3.3: Dữ liệu nhát cắt -83- Trong đó, giá trị bên trái 0,1,2 tƣơng ứng định dạng thuộc tính cần rời rạc hóa dtb_toan, dtb_ly dtb_hoa Giá trị bên phải tập nhát cắt, nhƣ ta chia thành khoảng tƣơng ứng với nhát cắt 5,5.5,6,6.5,7,7.5,8,8.5,9,9.5 [*,5), [5,5.5), [5.5,6), [6,6.5), [6.5,7), [7,7.5), [7.5,8], [8,8.5), [8.5,9), [9,9.5), [9.5,*) Dữ liệu sau rời rạc hóa là: Bảng 3.4: Dữ liệu sau rời rạc hóa Bƣớc 3: Sử dụng thuật toán rút gọn Johnson thu đƣợc tập rút gọn sau: {dtb_toan, dtb_ly, dtb_hoa, pt, quanhuyen, dh} Bƣớc 4: Từ tập rút gọn, tiến hành sinh luật, thu đƣợc kết sau: -84- Bảng 3.5: Dữ liệu thu sau sinh luật Bƣớc 5: Sử dụng luật xây dựng ứng dụng Bƣớc 5.1: Cập nhật liệu luật từ Rosetta vào bảng DulieuLuat sở liệu Tuyensinh MS SQL Server Bảng DulieuLuat có cấu trúc nhƣ sau: STT Tên trƣờng Toan1 Toan2 Ly1 Ly2 Hoa1 Hoa2 PTTH QuanHuyen Daihoc 10 Trungtuyen 11 DoDo -85- Các luật sau xử lý đƣợc insert vào bảng Dulieuluat có dạng nhƣ sau: Bảng 3.6: Dữ liệu luật sau xử lý Dựa vào giá trị cột TrungTuyen DoDo ta biết kết thi tuyển sinh đại học Đỗ,Trƣợt, Đỗ Trƣợt với tỉ lệ rõ ràng Ví dụ, bảng ghi thứ 10599 tỉ lệ Trƣợt 80%, Đỗ 20% Còn ghi 10600 tỉ lệ Đỗ 100% Bƣớc 5.2: Xây dựng ứng dụng dự đoán kết thi đại học sở sử dụng bảng DulieuLuat Cấu trúc liệu CSDL TuyenSinh: -86- Hình 3.3: Mơ hình quan hệ sở liệu TuyenSinh Ứng dụng Website dự đoán kết thi đại học đƣợc xây dựng ngơn ngữ lập trình Web ASP.Net Chức dự đoán kết thi tuyển sinh đại học chƣơng trình có giao diện nhƣ sau: -87- Hình 3.4: Giao diện nhập thơng tin dự đốn kết - Thí sinh nhập vào thơng số: (DTB_Toan, DTB_Ly, DTB_Hoa, Tên trƣờng phổ thông, Tên quận/huyện, Tên trƣờng đại học) => Chƣơng trình đƣa kết dự đốn đỗ trƣợt Chẳng hạn, thí sinh nhập vào thơng số điểm tốn:9, điểm lý: 7.8, điểm hóa:8.8, trƣờng PTTH chuyên ngữ, quận huyện Cầu Giấy, trƣờng đại học Xây dựng hệ thống đƣa kết sau: Hình 3.5: Giao diện hiển thị kết dự đoán cho trường đại học Với thơng số này, thí sinh thi trƣờng Đại học Bách khoa tỉ lệ trúng tuyển 100% - Thí sinh nhập vào thơng số: (DTB_Toan, DTB_Ly, DTB_Hoa, Tên trƣờng phổ thông, Tên quận/huyện) => Chƣơng trình đƣa dự đốn đỗ trƣợt theo danh sách trƣờng đại học có liệu hệ thống -88- Chẳng hạn, thí sinh nhập vào thơng số điểm tốn:9, điểm lý: 8, điểm hóa:8, trƣờng PTTH chuyên ngữ, quận huyện Cầu Giấy hệ thống đƣa kết sau: Hình 3.6: Giao diện hiển thị kết dự đốn cho nhiều trường đại học Với thơng số này, thí sinh thi trƣờng Đại học Xây dựng Đại học Kinh tế tỉ lệ trúng tuyển 100%, cịn thi Bách khoa khả Đỗ 50% khả Trƣợt 50% Kết luận chƣơng Phân tích tốn dự đốn kết thi đại học sở lý thuyết tập thơ Xây dựng thuật tốn sinh liệu ngẫu nhiên thí sinh Sử dụng cơng cụ Rosetta để rời rạc hóa số liệu, tính tốn rút gọn sinh luật Sử dụng luật sinh độ xác luật làm sở để xây dựng hệ thống hỗ trợ dự đoán kết thi đại học cho học sinh trƣớc kỳ thi tuyển sinh đại học -89- KẾT LUẬN Các kết đạt luận văn Qua trình nghiên cứu tìm hiểu tài liệu tham khảo khám phá tri thức, đặc biệt khám phá tri thức theo cách tiếp cận tập thô Luận văn thực đƣợc kết sau: - Giới thiệu tổng quan khám phá tri thức, khai phá liệu Trong khai phá liệu giai đoạn quan trọng trình khám phá tri thức nhằm tìm luật tiềm ẩn sở liệu Luận văn có đề cập đến số phƣơng pháp khai phá liệu thƣờng đƣợc sử dụng nhƣ khai phá luật kết hợp, thuật toán di truyền, - Trình bày cách tổng quan lý thuyết tập thô Các khái niệm lý thuyết tập thơ, q trình khám phá tri thức theo cách tiếp cận tập thơ thuật tốn thƣờng đƣợc sử dụng trình khám phá tri thức theo cách tiếp cận lý thuyết Cùng với ứng dụng mạnh mẽ lý thuyết tập thô vào tốn lĩnh vực trí tuệ nhân tạo,…lý thuyết tập thô trở thành công cụ hữu ích bổ sung cho kỹ thuật khám phá tri thức từ sở liệu lớn - Luận văn áp dụng lý thuyết tập thơ vào tốn dự đoán kết thi tuyển sinh đại học, liệu phục vụ cho việc khám phá tri thức liệu đƣợc sinh ngẫu nhiên cho trƣờng phổ thông trung học Thông qua cơng cụ Rosetta liệu đƣợc rời rạc hóa, cụ thể tiến hành rời rạc hóa điểm trung bình tốn, điểm trung bình lý, điểm trung bình hóa thành khoảng nhỏ Sau đó, thơng qua Rosetta tính tốn rút gọn sinh luật - Luận văn đề xuất ứng dụng hỗ trợ dự đoán kết thi tuyển sinh đại học Ứng dụng có tính thực tiễn cao đáp ứng nhu cầu cấp thiết đối tƣợng học sinh phổ thông trung học trƣớc kỳ thi tuyển sinh đại học Chỉ cần thông tin đơn giản trƣớc kỳ thi nhƣ điểm trung bình trung cuối năm học môn thi -90- đại học, trƣờng phổ thông quận huyện tƣơng ứng trƣờng phổ thông này, hệ thống đƣa danh sách trƣờng đại học mà học sinh thi với khả đỗ trƣợt rõ ràng Dựa vào đó, học sinh có thêm lựa chọn xác việc chọn lựa trƣờng đại học để thi tuyển Hướng phát triển tương lai - Hoàn thiện WebSite dự đoán kết thi đại học - Tiếp tục nghiên cứu sâu rộng lý thuyết tập thô phƣơng pháp luận lý thuyết Tìm hiểu mẫu phát mẫu theo cách tiếp cận tập thô - Khai thác hiệu cơng cụ ROSETTA tốn thực tế -91- TÀI LIỆU THAM KHẢO Tiếng Việt Việt Anh, Lƣơng Nga (2005), “Hơn 500.000 thí sinh dự thi đại học đợt 1”, Báo điện tử, VnExpress http://vnexpress.net/Vietnam/Xahoi/2005/07/3B9DFE60/ [1] [2] Kiều Oanh (2006), “Tuyển sinh 2007: điểm mới”, Báo điện tử VietNamNet http://www3.vietnamnet.vn/giaoduc/tuyensinh/tintuc-sukien/2007/01/651963/ [3] TS Lê Đình Tƣ (2005), “Vì tỉ lệ thi trƣợt Việt nam cao giới”, Tạp chí Tri thức trẻ Trung tâm tin học Bộ Giáo dục Đào tạo (2006), Thống kê kết thi đại học năm 2006, http://ts.edu.net.vn/index.php [4] Tiếng Anh [5] Alan Rea (1995), Data Mining-An Introduction, The Parallel Computer Centre, The Queen’s University of Belfast [6] Andrzej Skowron, Ning Zong (2000) Rough Sets in KDD Tutorial Notes [7] Andrzej Skowron (2000) , “Rough sets and Boolean Reasoning” [8] C.J.Matheus and P.K.Chan and G.Piatetsky-Shapiro (1993), System for knowledge discovery in database, Ieee Trans On Knowledge and Data Engineering, vol 5, pp 903-913, 1993 [9] Jiawei Han and Micheline Kamber (2001): Data mining: Concepts and Techniques Academic Press 2001 [10] Jan Komorowski, Lech Polkowski, Andrzej Skowron (2000) Rough sets: A tutorial [11] Jan Komorowski, Aleksander Ohrn, Andrzej Skowron (2003) A Software System for Rough Data Analysis [12] Jerzy W Grzymala-Busse (2004) Three Approaches to Missing Attribute Values- A Rough Set Perspective Department of Electrical Engineering and -92- Computer Science University of Kansas, Lawrence, KS 66045, USA and Institute of Computer Science Polish Academy of Sciences, 01-237 Warsaw, Poland, November 1-4, 2004 [13] Ho Tu Bao, Introduction to Knowledge Discovery and Data Mining, National Center for Natural Science and Technology [14] Mehmed Kantardzic (2003), Data Mining: Concepts, Models, Methods, and Algorithms, John Wiley & Sons, Copyright 2003 The Institute of Electrical and Electronics Engineers, Inc [15] Ning Zhong, Juzhen Dong (2001), “Using Rough Sets with Heuristics for Feature Selection”, Journal of Intelligent Information Systems, 16, 199–214, Kluwer Academic Publishers Manufactured in The Netherlands [16] Nguyen Sinh Hoa, Nguyen Hung Son (1996), “Some Efficent Algorithms For Rough Set Methods”", Proceedings IPMU’96 (Information Processing and Management under Uncertainty), Granada, Spain, 1451– 1456 [17] Nguyen, S H., (2003), "On The Decision Table With Maximal Number Of Reducts", Electronic Notes in Theoretical Computer Science 82 (No.4) [18] Pawlak, Z., (2000), "Rough Sets And Their Applications", Computational Intelligence In Theory And Practice, Springer-Verlag, 73-91 [19] Pawlak, Z (1991), Rough Sets: Theoretical Aspects of Reasoning About Data Kluwer Academic Publishers, Dordrecht [20] Son H.Nguyen & Andrzej Skowron (1997), “Quantization of Real Value attributes” [21] of Slowinski, R (ed 1992.) Intelligent Decision Support: Handbook Applications and Advances of the Rough Sets Theory Kluwer Academic Publishers, Dordrecht [22] W.J Frawley and G.Piatetsky-Shapiro and C.J.Matheus (1992), Knowledge discovery in databases – an overview, Ai Magazine, vol 13, 1992 [23] Wojciech P Ziarko (Ed., 1994) Rough Sets, Fuzzy Sets and Knowledge Discovery Proceedings of the International Workshop on Rough Sets and -93- Knowledge Discovery (RSKD'93), Banff, Alberta, Canada, 12-15 October 1993 Springer-Verlag [24] Yiyu Yao, Yan Zhao, Jue Wang (2005) “On Reduct Construction Algorithms” [25] Ziarko, W (1991), The Discovery, Analysis and Representation of Data Dependencies in Databases In Piatesky-Shapiro, G and Frawley, W.J (eds.) Knowledge Discovery in Databases, AAAI Press/MIT Press, 1991, pp 177-195 ... truyền, lý thuyết tập mờ, lý thuyết tập thô, v.v Lý thuyết tập thô công cụ đƣợc nhiều nhà khoa học nghiên cứu sử dụng trình khám phá tri thức từ liệu Các khái niệm tảng lý thuyết tập thô hệ thông... tốn di truyền, lý thuyết tập thơ Trong thập niên gần đây, lý thuyết tập thô liên tục phát triển, thu hút ngày nhiều nhóm nghiên cứu ngƣời quan tâm đến phƣơng pháp luận Lý thuyết tập thô đƣợc bắt... tƣợng khác 1.2.3 Quan hệ không phân biệt đƣợc hệ thông tin Một sở tốn học lý thuyết tập thơ quan hệ không phân biệt đƣợc (quan hệ tƣơng đƣơng) hệ thông tin Cho U tập đối tƣợng, quan hệ nhị phân

Ngày đăng: 11/11/2020, 21:52

Tài liệu cùng người dùng

Tài liệu liên quan