Chương 3 này đó trỡnh bày việc ứng dụng lý thuyết tập thụ vào việc quy nạp cỏc quy tắc quyết định phõn lớp từ tập cỏc vớ dụ học được biểu diễn dưới dạng bảng quyết định. Cỏc thuật toỏn nghiờn cứu thuộc ba loại:
Số húa bởi Trung tõm Học liệu – Đại học Thỏi Nguyờn http://www.lrc-tnu.edu.vn/
Thuật toỏn quy nạp bộ quy tắc tối thiểu,
Thuật toỏn quy nạp vột cạn bộ tất cả cỏc quy tắc,
Thuật toỏn quy nạp bộ cỏc quy tắc thỏa món yờu cầu.
Cỏc bộ quy tắc quy nạp được bởi cỏc thuật toỏn trờn cú thể được sử dụng vào những mục đớch khỏc nhau. Bộ quy tắc tối tiểu thường được sử dụng vào việc giải quyết nhiệm vụ phõn lớp (gỏn nhón lớp cho cỏc đối tượng mới), cũn cỏc bộ quy tắc vột cạn và thỏa món yờu cầu thường hướng tới việc thực hiện cỏc vấn đề phỏt hiện tri thức (cỏc quy luật tiềm ẩn trong dữ liệu).
Số húa bởi Trung tõm Học liệu – Đại học Thỏi Nguyờn http://www.lrc-tnu.edu.vn/
KẾT LUẬN
Phõn lớp là nhiệm vụ vụ cựng quan trọng, con người thường phải đối mặt trong mọi lĩnh vực của đời sống. Nghiờn cứu cỏc phương phỏp phõn lớp vỡ thế từ lõu đó trở thành lĩnh vực khoa học thu hỳt sự quan tõm của nhiều nhà nghiờn cứu.
Lý thuyết tập thụ, do Z. Pawlak đề xuất vào những năm đầu thập niờn tỏm mươi thế kỷ hai mươi, là một cụng cụ toỏn học nhằm xử lý dữ liệu mơ hồ, khụng chắc chắn trong khai phỏ dữ liệu. Cỏc nghiờn cứu gần đõy cho thấy Lý thuyết tập thụ cú thể được coi là cơ sở lý thuyết để giải quyết hiệu quả một số vấn đề quan trọng trong khai phỏ dữ liệu, học mỏy, trớ tuệ nhõn tạo.
Luận văn này trỡnh bày những nghiờn cứu về ứng dụng lý thuyết tập thụ vào việc quy nạp cỏc quy tắc quyết định (phõn lớp) từ tập cỏc vớ dụ học được biểu diễn dưới dạng bảng quyết định.
Hiện nay, đó cú một số thuật toỏn quy nạp quy tắc phõn lớp sử dụng lý thuyết tập thụ được đề xuất. Người ta phõn cỏc thuật toỏn này thành ba loại:
Thuật toỏn quy nạp bộ quy tắc tối thiểu,
Thuật toỏn quy nạp vột cạn bộ tất cả cỏc quy tắc,
Thuật toỏn quy nạp bộ cỏc quy tắc thỏa món yờu cầu.
Trong luận văn này, học viờn đó tập trung nghiờn cứu ba thuật toỏn tiờu biểu đại diện cho ba loại thuật toỏn trờn. Cỏc thuật toỏn được minh họa bằng vớ dụ cụ thể. Tớnh hữu ớch của cỏc thuật toỏn và cỏc bộ quy tắc được tạo ra bởi chỳng trong việc xõy dựng cỏc hệ thống phõn loại hoặc trong việc thực hiện cỏc nhiệm vụ khỏm phỏ tri thức cũng đó được thảo luận.
Để đảm bảo tớnh khoa học, cơ sở lý thuyết vững chắc cho việc nghiờn cứu nhiệm vụ chớnh của đề tài, học viờn cũng đó thực hiện một nghiờn cứu tổng quan về khai phỏ dữ liệu và bài toỏn phõn lớp (nội dung Chương 1); cơ
Số húa bởi Trung tõm Học liệu – Đại học Thỏi Nguyờn http://www.lrc-tnu.edu.vn/
sở lý thuyết tập thụ, bao gồm cỏc khỏi niệm, kết quả cơ bản (Nội dung Chương 2).
Trong thời gian tới, học viờn dự định ỏp dụng cỏc thuật toỏn quy nạp quy tắc phõn lớp đó nghiờn cứu được vào việc giải quyết một bài toỏn phõn lớp thực tế.
Vỡ thời gian nghiờn cứu cú hạn nờn luận văn khụng trỏnh khỏi những sai sút nhất định, rất mong được sự đúng gúp ý kiến của cỏc thày trong hội đồng và độc giả để luận văn được hoàn thiện hơn.
Số húa bởi Trung tõm Học liệu – Đại học Thỏi Nguyờn http://www.lrc-tnu.edu.vn/
TÀI LIỆU THAM KHẢO
[1] Andrzej Skowron, Ning Zong (2000), Rought Sets in KDD, Tutorial Notes. [2] Grzymala-Busse J. W., LERS - a system for learning from examples
based on rough sets. In R. Slowớnski, (ed.) Intel ligent Decision Support, Kluwer Academic Publishers, 1992, 3-18.
[3] Jan Komorowski, Zdzislaw Pawlak, Lech Polkowski, Andrzej Skowron (1999), Rough Sets: A Tutorial.
[4] Jiawei Han, Michline Kamber (2001), Data Mining: Concepts and Techniques, Morgan Kaupmann Publishers.
[5] Jiye Li and Nick Cercone (2006). Introducing A Rule Importance Measure. Technical Report, School of Computer Science, University of Waterloo, Canada.
[6] Mienko R., Stefanowski J., Toumi K., Vanderpooten D., Discovery- Oriented Induction of Decision Rules. Cahier du Lamsade no. 141, Paris Dauphine, Septembre 1996.
[7] Pawlak Z. (1991), Rough Sets - Theoritical Aspects of Reasoning about Data, Kluwer Academic Publishers, Dordrecht.
[8] Pawlak Z., Skowron A., A rough set approach for decision rules generation, ICS Research Report, 23/93 Warsaw University of Technology, 1993.
[9] Skowron A., Extracting Laws from Decision Tables. Computational Intelligence: An International Journal 11 (2), 1995, pp. 371-388. [10] Skowron A., Boolean reasoning for decision rules generation.
In Komorowski J., Ras Z. (eds), Methodologies for Intelligent Systems, LNAI 689, Springer-Verlag, Berlin, 1993, pp. 295-305.
[11] Slowinski R., Stefanowski J., Rough classiffication with valued closeness relation. In Diday E. (ed). New Approaches in Classication
Số húa bởi Trung tõm Học liệu – Đại học Thỏi Nguyờn http://www.lrc-tnu.edu.vn/
and Data Analysis, Studies in Classiffication, Data Analysis and Knowledge Organisation, Springer Verlag, 1994, 482-489.
[12] Stefanowski J., On rough set based approaches to induction of deci- sion rules, in Polkowski L., Skowron A. (eds.), Rough Sets in Data Mining and Knowledge Discovery, Physica-Verlag, 1998, 500–530. [13] Stefanowski J., Classification support based on the rough sets.
Foundations of Computing and Decision Sciences, vol 18, no, 3-4. 1993, 371-380.
[14] Stefanowski J., Vanderpooten D., A general two stage approach to rule induction from examples. In W. Ziarko, editor, Rough Sets, Fuzzy Sets and Knowledge Discovery, Springer-Verlag, 1994, pp. 317-325. [15] Torgeir R. Hvidsten, A tutorial-based guide to the ROSETTA system:
A Rough Set Toolkit for Analysis of Data.