- Giai đoạn 4: Đánh giá độ chính xác của phân lớp.
3. Hướng phát triển.
Các giải thuật khai phá luật kết hợp mới chỉ chú trọng việc sinh luật một cách chính xác nhất có thể, tối ưu về thời gian và tiêu hao tài nguyên tuy nhiên điều này còn phụ thuộc rất lớn vào nguồn dữ liệu đầu vào, trong thực tế khi thu thập xây dựng cơ sở dữ liệu còn xảy ra tình trạng dữ liệu bị khuyết thiếu do thất lạc hồ sơ, dữ liệu chưa chuẩn hóa còn trùng lặp mới được giải quyết một cách sơ bộ làm ảnh hưởng đến hiệu quả của giải thuật, nên trong thời gian tới để hoàn thiện nghiên cứa em cần phải làm tốt công tác tiền xử lý dữ liệu, chuẩn hóa dữ liệu.
Khi tìm hiểu và thực nghiệm giải thuật CPAR-GR dù đã có nhiều biện pháp xử lý nhưng đôi khi còn xảy ra luật kết hợp sinh ra có vế điều kiện còn một thuộc tính, điều này có thể do tính quy luật của dữ liệu chưa cao, cần phải nghiên cứu sâu và kỹ lưỡng hơn để khắc phục làm sao có một bộ luật chất lượng cao nhất, khách quan nhất. Thu thập nhiều hơn nữa nguồn dữ liệu thuộc các lĩnh vực khác nhau nhằm thử nghiệm tính khách quan của giải thuật, đảm bảo cho ứng dụng tạo ra các luật đáng tin cậy và ứng dụng thân thiện với người dùng để được sử dụng rộng rãi tại các cơ sở
TÀI LIỆU THAM KHẢO
[1] V. T. N. Châu, “Luật kết hợp,” trong Giáo trình khai phá dữ liệu, Đại học Quốc gia Tp. Hồ Chí Minh, 2012, p. 11.
[2] X. Yin, J. Han và Jiawei, trong CPAR: Classification based on Predictive Association Rules, Proc. 3rd SIAM International Conference on Data Mining,
2003, pp. 331-335.
[3] R. Agrawal, T. Imielinski và A. Swami, “Minning association rules between sets of items i large databases,” trong In ACM SIGMOD Intil C@ Managenment
of Data, 1993.
[4] M. H. Dunham, Y. Xiao, L. Gruenwald và Z. Hossain, A Survey of Association rules, Department of Computer Science and Engineering Southerm Methodist University Dallas, 2003.
[5] A. M. SaidA, D. P. D. D. DominicB và D. A. B. Abdullah, “A Comparative Study of FP-growth Variations,” trong IJCSNS International Journal of Computer Science and Network Security, VOL.9 No.5, 2009, pp. 266-271.
[6] W. Li, CMAR: Accurate and efficient classification based on multiple-class association rule, MSc thesis, Simon Fraser University, 2001, pp. 369-376. [7] B. Liu, W. Hsu and Y. Ma, "Integrating Classification and Association Rule
Mining," in Proceedings of the International Conference on Knowledge Discovery and Data Mining, New York, NY: AAAI Pres, 1998, pp. 80-86.
[8] X. Yin and J. Han, "CPAR: Classification based on predictive association rule," in Proceedings of the SIAM International Conference on Data Mining, San
Francisco, CA: SIAM Press, 2003, pp. 369-376.
[9] F. Thabtah, P. Cowling and Y. Peng, "MCAR: Multi-class classification based on association rule approach," in Proceeding of the 3rd IEEE International Conference on Computer Systems and Applications, Cairo, Egypt, 2005, pp. 1-
[10] J. Quinlan, C4.5: Programs for Machine Learning, San Mateo: CA: Morgan Kaufmann, 1993.
[11] J. Quinlan and Cameron-Jones, "FOIL: A midterm report," in Proceedings of the European Conference on Machine Learning, Vienna, Austria: Springer
Verlag, 2006, pp. 3-20.
[12] R. Bhaskaran, "Chapter 3: Integration of Association rules and classification," in An integration of association rules and classification an empirical analysis, TAMILNADU, INDIA, MADURAI KAMARAJ UNIVERSITY, 2010, pp. 37- 39.
[13] T. Zhonghua và Q. Liao, “A New Class Based Associative Classification Algorithm,” trong IAENG International Journal of Applied Mathematics, Vol.36: Issue 2, IJAM_36_2_3, 2007.
[14] B. H. Nayef, Classifying Brain Dataset Using Classification Based Association Rules (CBA), Iraq: International Journal of Computer Science Trends and Technology (IJCST) – Volume 5 Issue 4, 2017.
[15] J. R. Quinlan và R. M. Cameron-Jones, “FOIL: A midterm report,” Vienna, Austria, trong Proc. 1993 European Conf. Machine Learning, 1993, p. pp. 3– 20.
[16] M. NANDHINI và S. N. SIVANANDAM, An improved predictive association rule based classifier using gain ratio and T-test for health care data diagnosis, Tamil Nadu,India: Sadhan Indian Academy of Sciences, 2015.
[17] P.-L. Viet, Classification based on Small Key Itemsets, International Journal of Computational Intelligence Research., Vol.5 No.1, 2009, pp. 22-30.
[18] S. Yohji, M. Kudo và A. Nakamura, Classification Based on Consistent Itemset Rules, Transactions on Machine Learning and Data Mining Vol. 1, No. 1, 2008, pp. 17-30.
[19] J. Alwidian, B. Hammo và N. Obeid, FCBA: Fast Classification Based on Association Rules Algorithm, International Journal of Computer Science and Network Security, VOL.16 No.12, 2016, pp. 117-127.
[20] N. Kaoungku, K. Suksut, R. Chanklan, K. Kerdprasop và N. Kerdprasop, Data Classification Based on Feature Selection with Association Rule Mining, Hong Kong: International MultiConference of Engineers and Computer Scientists , 2017.
[21] S. Sulova, Association Rule Mining for Improvement of IT Project Management, TEM Journal. Volume 7, Issue 4, 2018, pp. 717-722.
[22] Y. Li, J. Wang, L. Duan, T. Bai, X. Wang, Y. Zhang và G. Qin, Association Rule-Based Feature Mining for Automated Fault Diagnosis of Rolling Bearing, Hindawi, 2019.
[23] "Machine Learning Repository," University of California, [Online]. Available: https://archive.ics.uci.edu/ml/index.php.
PHỤ LỤC 1. Phụ lục 1: Diễn giải thông tin học sinh. 1. Phụ lục 1: Diễn giải thông tin học sinh.
STT Thông tin 1 2 3 4 5
1 Giới tính Nữ Nam