Sử dụng mạng CNN
106
Hình 4.16: Nhận diện ảnh tĩnh sử dụng mạng CNN (2)
107 Sử dụng mạng LeNet
Hình 4.18: Nhận diện ảnh tĩnh sử dụng mạng LeNet (1)
108
Hình 4.20: Ảnh tĩnh sử dụng mạng LeNet (3)
Sử dụng mạng AlexNet
109
Hình 4.22: Nhận diện ảnh tĩnh sử dụng mạng AlexNet (2)
Hình 4.23: Nhận diện ảnh tĩnh sử dụng mạng AlexNet(3)
Nhận xét: Với các chữ số 0, 3, 4, 5, 6, 8, 9 thì cả ba mạng đều nhận diện chính xác. Đối với các số còn lại thì do các số đều có nhiều đặc điểm tương tự nhau nên vẫn có sự nhầm lẫn đặc biệt là số 7
110
Nhận diện trực tiếp từ camera
Sử dụng CNN
Hình 4.24: Chụp ảnh từ camera và chuyển ảnh đen trắng dùng CNN
111
Hình 4.26: Kết quả nhận diện dùng mạng CNN (2)
Sử dụng mạng LeNet
112
Hình 4.28: Kết quả nhận diện dùng mạng LeNet (1)
113 Sử dụng mạng AlexNet
Hình 4.30: Chụp ảnh từ camera và chuyển ảnh đen trắng dùng AlexNet
114
Hình 4.32: Kết quả nhận diện dùng mạng AlexNet (2)
Nhận xét: Hệ thống nhận diện khá chính xác tất cả các số từ 0 đến 9 tốt hơn kết quả nhận diện ảnh tĩnh do khi sử dụng camera có thể có các bước hiệu chỉnh camera để cho ảnh rõ nét nhất và ít nhiễu nên kết quả cao hơn, tuy nhiên số 7 vẫn khó nhận dạng đối với mạng Alex và LeNet.
115
Sử dụng bảng vẽ trực tiếp
Hình 4.33: Bảng khi chưa vẽ số
116
Hình 4.35: Kết quả bảng vẽ sử dụng LeNet
117
Nhận xét: kết quả khá chính xác vì vẽ trực tiếp trên nền đen và ảnh không có nhiễu không cần qua nhiều bước xử lý ảnh
So sánh kết quả
Bảng 4.1: Bảng so sánh tỷ lệ nhận dạng của 3 mạng
Train accuracy Test accuracy
CNN 99,56% 95,85%
LeNet 98,74% 96,45%
AlexNet 99.30% 96,95%
- Ta có thể thấy mạng LeNet và AlexNet có tỷ lệ nhận diện khá cao và tương đương nhau còn CNN thấp hơn vì cấu trúc mạng đơn giản hơn
- Train các mạng trên tập thư viện Mnist chỉ có khỏang 70000 mẫu nên tỷ lệ chính xác khá cao
- Mạng CNN train model có tỷ lệ nhận dạng cao hơn so với hai mạng khác là do mạng đã quá quen thuộc với tập dữ liệu train, nên khi chuyển sang chạy trên tập dữ liệu test thì tỷ lệ nhận dạng lại kém đi so với hai mạng kia.