7. Bố cục của luận văn
3.4.3 Thực thi mô hình
Nhiệm vụ chính của tác vụ này là sử dụng mô hình SVM để đưa ra dự đoán có tàu - thuyền hay không có tàu - thuyền trên hình ảnh. Trong “Thực thi mô hình” chỉ có 1 mục chính:
Hình 3.17. Các thành phần trong Dự đoán tàu thuyền
Chọn Thực thi mô hình > Dự đoán tàu thuyền
Giao diện chính của tác vụ Dự đoán tàu thuyền:
Các thành phần chính:
- Chọn ảnh: Người dùng chọn hình ảnh cần dự đoán có tàu thuyền hay không. - Chọn mô hình: Người dùng chọn mô hình SVM
- Chọn csv vị trí: Người dùng chọn tệp csv chứa giá trị các vị trí quan trọng trong tập thuộc tính của các hình ảnh.
- Hiển thị lưới: Màn hình sẽ hiện ra các ô lưới với kích thước bằng với kích thước của hình ảnh được sử dụng để huấn luyện mô hình SVM.
- Hiển thị thuộc tính: Màn hình sẽ hiện ra một bảng dữ liệu chứa thông tin của hình ảnh. Bảng dữ liệu gồm n hàng và m cột. Trong đó: n là số lượng hình ảnh có trong thư mục mà người dùng chọn, m là số lượng thuộc tính ứng với mỗi hình ảnh.
- Dự đoán nhãn: Sử dụng mô hình SVM đã có để đưa ra dự đoán có tàu hay không có tàu trên hình ảnh.
- Thông tin dự đoán: Hiển thị thông tin “Có tàu” nếu mô hình dự đoán trên hình ảnh có tàu - thuyền hoặc hiển thị thông tin “Không có tàu” nếu mô hình dự đoán trên hình ảnh không có tàu - thuyền.
- Trở về màn hình chính: Khi nhấn vào nút này, màn hình tiền xử lý dữ liệu sẽ đóng lại và màn hình chính (mục 3.2) sẽ hiện ra.
Trên màn hình hiện ra, người dùng thực hiện chọn các tệp và hình ảnh cần thiết: - Chọn ảnh: Chọn hình ảnh mà người dùng muốn xác định trên ảnh đó có tàu
thuyền hay không.
- Chọn mô hình: Chọn mô hình SVM được lưu ở phần Huấn luyện mô hình.
- Chọn csv vị trí: Chọn tệp csv chứa thông tin vị trí của các thuộc tính quan trọng được tạo ra tại phần Rút gọn thuộc tính.
Sau khi nhập đầy đủ 3 thông tin trên, 3 nút sẽ được bật trên màn hình:
- Hiển thị lưới: Hình ảnh sẽ được chia thành các ô lưới với độ dài mỗi ô bằng với kích thước hình ảnh được sử dụng để huấn luyện mô hình svm.
- Hiển thị thuộc tính: Một cửa sổ sẽ hiện ra, trên cửa sổ này hiển thị một bảng các thuộc tính của hình ảnh mà người dùng chọn để dự đoán.
- Dự đoán nhãn: Khi người dùng nhấn vào nút này, chương trình sẽ sử dụng mô hình SVM để đưa ra dự đoán có tàu hay không có tàu trên mỗi ô lưới của hình ảnh ban đầu. Chương trình dừng lại khi phát hiện ô lưới nào đó được dự đoán là có tàu - thuyền và đưa ra thông báo là “Có tàu”. Ngược lại, nếu tất cả các ô
lưới đều được dự đoán là không có tàu - thuyền thì chương trình sẽ đưa ra thông báo là “Không có tàu” tại mục Thông tin dự đoán
Hình 3.19. Dự đoán tàu thuyền
Tập dữ liệu kiểm thử gồm 400 hình ảnh, trong đó có 200 ảnh có tàu và 200 ảnh không có tàu. Kết quả chạy thực nghiệm thu được độ chính xác phân lớp 82.5% trên bộ kiểm thử.
CHƯƠNG 4: KẾT LUẬN A. Các kết quả đạt được của Luận văn
Trong luận văn này tôi đã tìm hiểu một số kiến thức tổng quan về bài toán rút gọn thuộc tính từ bảng quyết định không đầy đủ theo hướng tiếp cận kết hợp filter- wrapper nhằm giảm thiểu số lượng thuộc tính, từ đó giảm độ phức tạp của mô hình phân lớp.
Kết quả chính của luận văn bao gồm:
1. Tìm hiểu cách xây dựng độ đo khoảng cách và thuật toán theo tiếp cận filter- wapper tìm tập rút gọn của bảng quyểt định không đầy đủ sử dụng độ đo khoảng cách. 2. Cài đặt, thử nghiệm thuật toán ứng dụng vào bài toán phát hiện tàu, thuyền từ ảnh vệ tinh.
B. Định hướng nghiên cứu tiếp theo:
1. Triển khai thuật toán vào việc giải quyết các bài toán trong thực tiễn khác, đặc biệt các bài toán có dữ liệu với số thuộc tính lớn (high dimention data) trong lĩnh vực khác nhau như dữ liệu gen trong tin sinh học…
2. Tiếp tục nghiên cứu, đề xuất các phương án để giảm thiểu thời gian thực hiện thuật toán dựa trên các mô hình tập thô khác phù hợp với lớp bài toán trong thực tiễn.
TÀI LIỆU THAM KHẢO
[1] Guyon, Isabelle; Elisseeff, André, “An Introduction to Variable and Feature Selection”, Journal of Machine Learning Research, pp. 1157-1182, 2003.
[2] H. Liu, L. Yu, “Toward integrating feature selection algorithms for
classification and clustering”, IEEE Transactions on knowledge and data
engineering, 17(4), pp. 491-502, 2005.
[3] Z. Pawlak, Rough sets: Theoretical Aspects of Reasoning about Data, Kluwer Academic Publisher, London, 1991.
[4] M. Kryszkiewicz (1998), “Rough set approach to incomplete information systems”, Information Science, Vol. 112, pp. 39-49.
[5] D.X. Peng, X.D. Hong, “Research on Heuristic Knowledge Reduction Algorithm for Incomplete Decision Table”, IEEE International Conference
on Internet Technology and Applications, 2010.
[6] J. Hu, K. Wang, H. Yu, “Attribute Reduction on Distributed Incomplete Decision Information System”, IJCRS 2017, pp 289-305, 2017.
[7] Y.H. Qian, J.Y. Liang, W. Pedrycz, C.Y. Dang, “An efficient accelerator for attribute reduction from incomplete data in rough set framework”, Pattern Recognition 44, pp. 1658-1670, 2011.
[8] Z.Q. Meng, Z.Z. Shi, “A fast approach to attribute reduction in incomplete decision systems with tolerance relation-based rough sets”, Information Sciences, Vol. 179, pp. 2774-2793, 2009.
[9] Z.Y. Xu, J.H. Zhou, C.G. Zhang, “A Quick Attribute Reduction Algorithm Based on Incomplete Decision Table”, Information Computing and Applications, 2013.
[10] F.M. Ma, T.F. Zhang, “Generalized binary discernibility matrix for attribute reduction in incomplete information systems”, The Journal of China Universities of Posts and Telecommunications, Volume 24, Issue 4, pp. 57-75, 2017.
[11] H.S. Zou, C.S. Zhang, “Efficient Algorithm for Knowledge Reduction in Incomplete Information System”, Journal of Computational Information Systems 8: 6, pp. 2531–2538, 2012.
[12] H.X. Li, X.H. Zhou, M.M. Zhu, “A Heuristic Reduction Algorithm in IIS Based on Binary Matrix”, RSKT, pp. 143-150, 2010.
[13] J. Zhou, E. Xu, Y.H. Li, Z. Wang, Z.X. Liu, X.Y. Bai , “A New Attribute Reduction Algorithm Dealing With The Incomplete Information System”,
2009 International Conference on Cyber-Enabled Distributed Computing and Knowledge Discovery, 2009.
[14] Vu Van Dinh, Nguyen Long Giang, Duc Thi Vu, Generalized Discernibility Function based Attribute Reduction in Incomplete Decision Systems, Serdica Journal of Computing 7 (2013), Institute of Mathematics and Informatics, Bulgarian Academy of Sciences, No 4, 2013, pp. 375-388.
[15] W.D. Tan, E. Xu, F. Shi, Y.C. Ren, L.J. Fan, “A Novel Method of Attribute Reduction for Incomplete Information System”, IEEE International Conference on Innovative Computing and Communication, pp. 352-354, 2010.
[16] Z.Y. Xu, B. Yang, W.H. Shu, "Efficient Algorithm for Attribute Reduction
of Incomplete Information Systems Based on Assignment Matrix”, Fuzzy
Information and Engineering, Volume 2, 2009.
[17] D. Yue, Z. Xu, C.D. Mei, W.Y. Mei, “Analysis of Attribute Reduction of Incomplete Decision Table Based on Information Entropy”, 8th International Conference on Intelligent Computation Technology and Automation (ICICTA), 2015.
[18] H. Zhao, K.Y. Qin, “Mixed feature selection in incomplete decision table”
Knowledge-Based Systems, Volume 57, pp. 181-190, 2014.
[19] Nguyễn Bá Quảng, Nguyễn Long Giang, Trần Thanh Đại, Nguyễn Ngọc Cương, “Phương pháp Filter-Wrapper rút gọn thuộc tính trong bảng quyết định không đầy đủ sử dụng khoảng cách”, Kỷ yếu Hội thảo quốc gia lần thứ XXII: Một số vấn đề chọn lọc của Công nghệ thông tin và truyền thông, Thái Bình, 28-29/06/2019, Tr. 246-252.
[20] J.H. Dai, W.T. Wang, H.W. Tian, L. Liu, “Attribute selection based on a new conditional entropy for incomplete decision systems”, Knowledge- Based Systems, Volume 39, pp. 207-213, 2013.
[21] L. Sun, J.C. Xu, Y. Tian, “Feature selection using rough entropy-based uncertainty measures in incomplete decision systems”, Knowledge-Based
[22] W.B. Qian, W.H. Shu, “Mutual information criterion for feature selection from incomplete data”, Neurocomputing, Volume 168, pp. 210-220, 2015. [23] Y. Tao, H.C. Zhao, “Entropy based attribute reduction approach
for incomplete decision table”, 20th International Conference on Information Fusion (Fusion), pp. 1-8, 2017.
[24] Sai Prasad P.S.V.S, Raghavendra Rao Chillarige, Novel Granular Framework for Attribute Reduction in Incomplete Decision Systems, Multi- disciplinary Trends in Artificial In Artificial Intelligence, 2012.
[25] X. Guo, Y.Z. Xiang, L. Shu, “An Information Quantity-Based Uncertainty Measure to Incomplete Numerical Systems”, International Conference on Fuzzy Information & Engineering, pp. 23-29, 2019.
[26] Xu E, Y.Q. Yang, Y.C. Ren, “A New Method of Attribute Reduction Based On Information Quantity in An Incomplete System”, JOURNAL OF SOFTWARE, VOL. 7, NO. 8, pp. 1881-1888, 2012.
[27] Long Giang Nguyen, Hung Son Nguyen, “Metric Based Attribute Reduction in Incomplete Decision Tables”, Proceedings of 14th International Conference, Rough Sets, Fuzzy Sets, Data Mining, and Granular Computing, RSFDGrC 2013, Halifax, NS, Canada, Lecture Notes in Computer Science, SpingerLink, Vol. 8170, pp. 99-110, 2013.
[28] Vu Van Dinh, Vu Duc Thi, Ngo Quoc Tao, Nguyen Long Giang, “Partition Distance Based Attribute Reduction in Incomplete Decision Tables”, Journal on Information Communications Technology, Research and Development on Information & Communications Technology, Vol. V-2, No. 14(34), pp. 23- 32, 12-2015.
[29] W.H. Shu, W.B. Qian, “A fast approach to attribute reduction from perspective of attribute measures in incomplete decision systems”,
Knowledge-Based Systems, V.72, pp. 60-71, 2014.
[30] X.P. Dai, D.H. Xiong, “Research on Heuristic Knowledge Reduction Algorithm for Incomplete Decision Table”, IEEE 2010 International Conference on Internet Technology and Applications, pp. 1-3, 2010.
[31] X.J. Xie, X. L. Qin, “A novel incremental attribute reduction approach for dynamic incomplete decision systems”, International Journal of Approximate Reasoning 93, pp. 443-462, 2018.
[32] Vũ Văn Định, “Rút gọn thuộc tính trong bảng quyết định không đầy đủ theo tiếp cận tập thô dung sai”, Luận án Tiến sĩ Toán học, Viện Công nghệ thông tin, 2016.
[33] Nguyễn Văn Thiện, “Một số phương pháp kết hợp trong rút gọn thuộc tính theo tiếp cận tập thô mờ”, Luận án Tiến sĩ Máy tính, Học viện Khoa học và Công nghệ, 2018.
[34] Nguyễn Văn Thiện, Nguyễn Long Giang, Nguyễn Như Sơn, “Phương pháp gia tăng rút gọn thuộc tính trong bảng quyết định sử dụng khoảng cách mờ”,
Hội thảo Quốc gia lần thứ XXI - Một số vấn đề chọn lọc của CNTT và TT,
Thanh Hóa, 27-28/07/2018, Tr. 296- 302.
[35] Long Giang Nguyen, Thien Nguyen, Nhu Son Nguyen , “Fuzzy Partition Distance based Attribute Reduction in Decision Tables”, IJCRS 2018: International Joint Conference on Rough Sets 2018, LNCS, Vol. 11103, Springer Link, 2018, pp. 614-627.
[36] The UCI machine learning repository.
http://archive.ics.uci.edu/ml/datasets.html.
[37] J.C. Xu, L. Sun, “Knowledge Entropy and Feature Selection in Incomplete Decision Systems,” Applied Mathematics & Information Sciences, vol. 7, no. 2, pp. 829-837, 2013.
[38] Z.Q. Meng, Z.Z. Shi, “Extended rough set-based attribute reduction in inconsistent incomplete decision systems”, Information Sciences, Volume 204, pp. 44-69, 2012.
[39] Y.H. Qian, J.Y. Liang, D.Y. Li, F. Wang, N.N. Ma, “Approximation reduction in inconsistent incomplete decision tables”, Knowledge-Based Systems, Volume 23, Issue 5, pp. 427-433, 2010.
[40] Nguyen Long Giang, Vu Van Dinh, Relationships Among the Concepts of Reduct in Incomplete Decision Tables, Frontiers in Artificial Intelligence and Applications (FAIA), Volume 252: Advanced Methods and Technologies for Agent and Multi-Agent Systems, IOS Press, 2013, pp. 417-426.
[41] Cao Chinh Nghia, Demetrovics Janos, Nguyen Long Giang, Vu Duc Thi, “About a fuzzy distance between two fuzzy partitions and attribute reduction
problem”, Cybernetics and Information Technologies, Vol 16, No 4, pp. 13-
[42] C.Z. Wang, Y. Qi, Q. He, Attribute reduction using distance-based fuzzy rough sets, 2015 International Conference on Machine Learning and
Cybernetics , IEEE, 2015.
[43] C.Z. Wang, Y.Huang, M.W. Shao, X.D.Fan, Fuzzy rough set-based attribute reduction using distance measures, Knowledge-Based Systems, Volume 164, 15 January 2019, pp. 205-212.
[44] J.Y. Liang, R. Li, Y. H. Qian, “Distance: A more comprehensible perspective for measures in rough set theory”, Knowledge-Based Systems,
Volume 27, pp. 126-136, 2012.
[45] Long Giang Nguyen, “Metric Based Attribute Reduction in Decision Tables”, Federated Conference on Computer Science and Information System (FEDCSIS), Wroclaw, Poland,IEEE, pp. 311-316, 2012.