Đối với những loại quả có nhiều nét tương đồng lẫn nhau, kết quả nhận dạng của ứng dụng còn đôi lúc bị nhầm lẫn, đặc biệt trong các trường hợp ảnh được chụp theo góc nhìn chưa tốt dẫn đến ảnh không thể hiện được các đặc trưng riêng của quả. Những sai sót này là không thể tránh khỏi vì trong nhiều trường hợp, mắt người cũng không dễ dàng phân biệt được chúng nếu chỉ dựa vào một hình ảnh chụp mà không có sự hỗ trợ của các giác quan khác như khứu giác hay vị giác.
Hình 4.5: Kết quả nhận dạng với loại quả không được huấn luyện
Trong trường hợp như hình trên, khi ta yêu cầu hệ thống nhận dạng quả bòn bon, do bòn bon không có trong danh sách 40 quả được huấn luyện nhận dạng nên kết quả trả về là loại quả có sự tương đồng cao nhất, quả nhãn.
Ngoài ra, kết quả thực nghiệm thu được cho thấy hệ thống nhận dạng đạt được kết quả tương đối chuẩn xác với các trường hợp hình ảnh quả trong ảnh đầu vào bị che khuất một phần, điều kiện ánh sáng không thực sự tốt cũng như các trường hợp ảnh bị biến dạng nhẹ. Đây chính là các khó khăn đối với bài toán nhận dạng vật thể nói chung mà ta đã đề cập tới trong phần mở đầu của luận văn, lý giải cho điều này là do trong quá trình thu thập ảnh ban đầu cũng như sinh ảnh tự động từ các ảnh gốc, mô hình nhận dạng đã được huấn luyện để nhận ra các trường hợp tương tự. Khả năng dự đoán mạnh mẽ này đã giúp cho các phương pháp Học sâu, đặc biệt là mạng huấn luyện no ron tích chập CNN trở thành giải pháp mạnh mẽ nhất trong lĩnh vực nhận dạng ảnh bây giờ.
Chương 5. Kết luận
Luận văn đã nghiên cứu, tìm hiểu bài toán tự động nhận dạng và phân loại hoa quả trong ảnh màu, và thực hiện phát triển, cài đặt phương án giải quyết cho bài toán dựa trên sự thống kê các hướng tiếp cận đã được công bố qua rất nhiều bài báo, công trình khoa học trên thế giới. Các kết quả chính mà luận văn đã đạt được, tương ứng với các mục tiêu đề ra ban đầu như sau:
- Hoàn thiện xây dựng bộ cơ sở dữ liệu ảnh phục vụ huấn luyện nhận dạng cho 40 loại hoa quả phổ biến ở nước ta, với số lượng ảnh gốc trung bình cho mỗi loại quả là từ 500-1000 ảnh.
- Thống kê các đặc trưng thường được sử dụng để huấn luyện bộ nhận dạng hoa quả trong các phương pháp Học máy truyền thống, bao gồm các đặc trưng về màu sắc, hình dạng và kết cấu. Từ đó làm cơ sở xây dựng một mạng nơ-ron nhân tạo truyền thống và so sánh kết quả với một mạng nơ-ron tích chập thuộc nhóm phương pháp Học sâu.
- Cài đặt và tinh chỉnh một mạng nơ-ron tích chập đã được huấn luyện trước, ứng dụng vào bài toán nhận dạng hoa quả. Đồng thời xây dựng hệ thống tự động nhận dạng hoa quả Fruit Recognition System với ứng dụng client trên điện thoại thông minh. Thực nghiệm với bộ dữ liệu test và trong thực tế đã cho kết quả khá tốt, nguyên nhân chính là do phạm vi số lượng hoa quả để nhận dạng đã được hạn chế chỉ còn 40 loại – một con số rất khiêm tốn so với số lượng hoa quả ở Việt Nam nói riêng và cả thế giới nói chung. Hệ thống tự động nhận dạng hoa quả còn cần rất nhiều cải thiện, đặc biệt là về khả năng mở rộng phạm vi loại hoa quả cũng như kích thước, chất lượng của bộ CSDL ảnh huấn luyện. Trong tương lai, để có thể cải thiện độ chính xác của mô hình nhận dạng, tôi đề xuất cài đặt thử nghiệm và đánh giá các loại mô hình mạng Học sâu đã được huấn luyện trước, đặc biệt là các mạng đã đạt được kết quả cao trong cuộc thi Nhận dạng ảnh quy mô lớn do ImageNet tổ chức thường niên như: ZF Net (2013), VGG Net (2014), GoogleNet và Microsoft ResNet (2015)…
[3] Andrej Karpathy. CS231n Convolutional Neural Networks for Visual Recognition - Image Classification. http://cs231n.github.io/classification/
[4] Sadrnia, H., Rajabipour, A., Jafary, A., Javadi, A., & Mostofi, Y. (2007). Classification and analysis of fruit shapes in long type watermelon using image processing. Int J Agric Biol, 9(1), 68–70.
[5] Fu, L., Sun, S., Li, R., & Wang, S. (2016). Classification of kiwifruit grades based on fruit shape using a single camera. Sensors (Switzerland), 16(7), 1–14.
[6] Seng, W. C., & Mirisaee, S. H. (2009). A new method for fruits recognition system.
Proceedings of the 2009 International Conference on Electrical Engineering and Informatics, ICEEI 2009, 1, 130–134.
[7] Arivazhagan, S., Shebiah, R. N., Nidhyanandhan, S. S., & Ganesan, L. (2010). Fruit Recognition using Color and Texture Features. Information Sciences, 1(2), 90–94.
[8] Zhang, Y., & Wu, L. (2012). Classification of fruits using computer vision and a multiclass support vector machine. Sensors (Switzerland), 12(9), 12489–12505. [9] Naskar, S. (2015). A Fruit Recognition Technique using Multiple Features and
Artificial Neural Network, 116(20), 23–28.
[10] GilPress. (2016). Visually Linking AI, Machine Learning, Deep Learning, Big Data and Data Science | What’s The Big Data?
https://whatsthebigdata.com/2016/10/17/visually-linking-ai-machine-learning- deep-learning-big-data-and-data-science/
[11] Lee, H., Grosse, R., Ranganath, R., & Ng, A. Y. (2009). Convolutional deep belief networks for scalable unsupervised learning of hierarchical representations.
Proceedings of the 26th Annual International Conference on Machine Learning - ICML ’09, 1–8.
[12] Huew Engineering. (2015). Introduction to Convolution Neural Networks – Huew Engineering. https://engineering.huew.co/introduction-to-convolution-neural- networks-18981d1cd09a
[13] Dumoulin, V., & Visin, F. (2016). A guide to convolution arithmetic for deep learning.
[14] Samer, C. H., Rishi, K., & Rowen. (2015). Image Recognition Using Convolutional Neural Networks. Cadence Whitepaper, 1–12.
[15] Andrej Karpathy. (n.d.). CS231n Convolutional Neural Networks for Visual Recognition - Transfer Learning. http://cs231n.github.io/transfer-learning/
[16] Yosinski, J., Clune, J., Bengio, Y., & Lipson, H. (2014). How transferable are features in deep neural networks? Advances in Neural Information Processing Systems 27 (Proceedings of NIPS), 27, 1–9.
[17] Jimmie Goode. (2015). Classifying images in the Oxford 102 flower dataset with CNNs – Jimmie Goode. http://jimgoo.com/flower-power/
[18] Russakovsky, O., Deng, J., Su, H., Krause, J., Satheesh, S., Ma, S., Fei-Fei, L. (2015). ImageNet Large Scale Visual Recognition Challenge. International Journal of Computer Vision, 115(3), 211–252.
[19] ImageNet Large Scale Visual Recognition Competition 2012 (ILSVRC2012). http://image-net.org/challenges/LSVRC/2012/results.html
[20] Krizhevsky, A., Sutskever, I., & Geoffrey E., H. (2012). ImageNet Classification with Deep Convolutional Neural Networks. Advances in Neural Information Processing Systems 25 (NIPS2012), 1–9.
[21] Jia, Y., Shelhamer, E., Donahue, J., Karayev, S., Long, J., Girshick, R., Darrell, T. (2014). Caffe: Convolutional Architecture for Fast Feature Embedding. http://arxiv.org/abs/1408.5093
[22] Welcome — Theano 0.9.0 documentation.
http://deeplearning.net/software/theano/
[23] Torch | Tutorials for learning Torch. http://torch.ch/docs/tutorials.html [24] TensorFlow. https://www.tensorflow.org/
[25] Andrej Karpathy. (n.d.). CS231n Convolutional Neural Networks for Visual Recognition - Visualizing what ConvNets learn. http://cs231n.github.io/understanding-cnn/