Nhóm đã cố gang trong việc tự tao dựng một bộ dữ liệu đa dang cácphân cấp và các nhóm phân loại côn trùng với số lượng dir liệu được t6 chức tương đôi lớn... Các dữ liệu không có sự liên
Brachypelma . -c xrxrsrrrtrrirtrirtkiirtiiriiriiririirrririr 37 4.2.17 MaratfusS ecieieHrririiiiiriiiririiirirrirrrrrrrre 38 4.2.18 2c o aẽ
Phân loại: o Kingdom: Animalia o Phylum: Arthropoda o Subphylum: Chelicerata o Class: Arachnida o Order: Araneae o Infraorder: Mygalomorphae o Family: Theraphosidae o Genus: Brachypelma o Simon, 1891
Phân bố: o Phân bô của các Loài tarantula chân đỏ.
37 emilia klaasi hamorii baumgarteni boehmei auratum albiceps smithi œ Do
Phân loại: o Kingdom: Animalia o Phylum: Arthropoda o Subphylum: Chelicerata o Class: Arachnida o Order: Araneae
38 ©_ Infraorder: Araneomorphae o Family: Salticidae o Subfamily: Salticinae o Genus: Maratus o Karsch, 1878[1]
Phân bố : o Phần lớn các loài được tim thấy ở Uc và Wale Có 1 loài được tìm thay ở Trung Quốc
Phan loai: o Kingdom: Animalia o Phylum: Arthropoda o Subphylum: Chelicerata o Class: Arachnida o Order: Araneae o Infraorder: Araneomorphae o Family: Sparassidae o Bertkau, 1872
39 o Hơn một nghìn loài Sparassidae xuất hiện ở hầu hết các khu vực từ ôn đới đến nhiệt đới ấm áp trên thế giới, bao gồm phần lớn Australasia , Châu Phi , Châu Á , và Châu Mỹ. o Có 15 Loài được phát hiện ở khu vực châu Á nói chung.
Phân loại: o Kingdom: Animalia o Phylum: Arthropoda o Class: Insecta o Order: Lepidoptera o Family: Pieridae o Genus: Pieris o Species: P rapae
Phân bố: o_ Loài này có phạm vi tự nhiên trên khắp châu Au, châu A và Bắc Phi. o Hinh sau miêu tả lịch sử phát hiện va nơi phat triên của loài nay ở các khu vực trên thê giới.
Hình 28 : Nơi phát triển của P.rapae
P.SIEA HH HH HH ườn 41 “V5 Nhi
Scirpophaga incertuÌaS -. ceecrrerrrirtrrrrrriirtrrirrrrirrrrirrrrrree 49 4.2.30 Caelifera ôHH HH Hy 50 4.3 Đánh giá các bộ dữ liệu thu thập -c-c-eeerierrrrrrrrerrrkrr 51 4.3.1 _ Đánh giá các dữ liệu đã thu thập từ các nguồn
Phan loai: o Kingdom: Animalia o Phylum: Arthropoda o Class: Insecta o Order: Lepidoptera
49 o Family: Crambidae o Genus: Scirpophaga o Species: S incertulas
Phân bố: o Được tim thấy ở Afghanistan, Nepal, đông bắc An Độ, Sri Lanka,
Bangladesh, Burma, Việt Nam, Thái Lan, Malaysia, Singapore,
Sumatra, Java, Borneo, Sumba, Sulawesi, Philippines, Dai Loan, Trung
Phan loai: o Kingdom: Animalia o Phylum: Arthropoda o Subphylum: Hexapoda o Class: Insecta o Order: Orthoptera o Subordo: Caelifera
Phân bố : o Phân bộ Caelifera chủ yêu phân bổ ở khu vực nhiệt đới nhưng phần lớn các siêu họ thì phân bổ rộng khắp thé giới.
4.3 Đánh giá các bộ dữ liệu thu thập
4.3.1 Đánh giá các dữ liệu đã thu thập từ các nguồn
Theo đánh giá từ việc xem xét các bộ dữ liệu đã thu thập trước đó thì việc xây dựng bộ dữ liệu mới dựa trên các bộ đã tìm thấy là hoàn toàn cần thiết.
Nhận xét về các bộ dữ liệu trước đó: Thiếu sự đa dạng về Bộ côn trùng.
Trường hợp : o Bộ dữ liệu YIKES! Spiders -15 Species Classification o Bộ dữ liệu Butterfly Image Classification 50 species
Cả 2 bộ dữ liệu trên đa dang về hình ảnh các loài bướm và nhện nhưng đều thuộc cùng một Bộ côn trùng như bướm thuộc về Bộ Lepidoptera và nhện thuộc về Bộ Araneae Điều đó dẫn đến đưa loài thuộc Bộ côn trùng khác sẽ không thé nhận diện được, ví dụ : Kiến thuộc Bộ Hymenoptera, Chuén Chuôn thuộc Bộ Odonata, o_ Thiếu thông tin về danh pháp hoặc tên côn trùng.
Bộ dữ liệu 25insects chứa dữ liệu da dạng về các loài côn trùng nhưng phân tán không theo một Bộ một côn trùng cụ thé, các loài trong bộ dữ liệu thuộc nhiều bộ côn trùng khác nhau và không chứa tên cũng như danh pháp khoa học của các loài nên cần chỉnh và gán nhãn danh pháp cho các loài. o_ Bộ dữ liệu đa dạng nhưng thông tin không được đầy đủ ngoài ra còn khá phân tán chưa cụ thể trong việc phân loại loài.
Trong các bộ Ants & Bees và Insects Recognition khắc phục được thông tin của các bộ dữ liệu bên trên do có thêm các loài như : chuồn chuồn, ong, kiến, bo rùa Tuy nhiên đây chỉ là hình ảnh chung chung của các phân lớp côn trùng ở cấp cao như từ
Họ côn trùng đến Bộ côn trùng không ở mức phân loại Loài côn trùng.
Xét bộ dữ liệu Insects Recognition: o Về hình ảnh nhận diện của chuôn chuon là hình ảnh của nhiêu loài khác nhau không cụ thé một loài nhất định điều này dẫn đến chỉ có thể nhận diện côn
Can thiết trong việc xây dựng bộ dữ liệu mới
4.3.2 Cần thiết trong việc xây dựng bộ dữ liệu mới:
Nhận diện Bộ côn trùng đa dạng hơn Băng việc kết hợp các bộ dữ liệu với nhau ta có thê nhận biết các côn trùng thuộc các bộ đa dạng như: Bướm, Hình nhện, Chuồn
Tang tính chính xác kha năng nhận diện côn trùng trong bộ dữ liệu mới : Mô hình có thể nhận biệt cụ thé hình ảnh một số loài Tuy một số bộ dữ liệu có mức phân loại chi ở Bộ không có mức phân loại côn trùng thấp hơn mức Bộ nhưng lại chứa hình ảnh nhận diện mà các bộ dữ liệu khác không có : Insects Recognition chứa hình ảnh của
Bộ Chuồn Chuén, Ants & Bees chứa hình ảnh của Kiến, Animals Detection Images
Dataset chứa hình anh của Rét Tuy không thé nhận biết cụ thé loài kiến gi hay loài chuôn chuôn gì nhưng van có kha năng nhận biét là côn trùng gi.
Bộ dữ liệu sẽ có thê phát triển lên mức phân loại danh pháp khoa học ở mức cao hơn cho việc cải tiễn khả năng nhận diện và phân loại côn trùng Một số bộ dit liệu đã phân loại rõ ràng côn trùng ở các mức như : Lớp, Bộ, Họ, Chi Điều này có thể giúp bộ dữ liệu gán thêm các nhãn phân loại côn trùng thuộc các phân lớp ở mức cao hơn chứ không chỉ giới hạn ở mức phân biệt là Loài gì.
Phương pháp tạo dựng bộ dữ liệu -<c-cccsekieiiierie 52 1 Cơ sở xây dựng bộ dữ liệu . -ccccceeceveereerrseerreerrerrrr 52 2 Quy trình xây dựng bộ dữ liệu mớii -c-cce<ceereeexex 53 3 tin c0 00177 5
4.4.1 Cơ sở xây dựng bộ dữ liệu
Nhóm ban đầu thực hiện thu thập và tìm kiếm 30 loại côn trùng với các cấp phân loại khác nhau Các dữ liệu còn rời rac chưa được tô chức lại và không có sự liên kết. Đối tượng thu thập là các loài côn trùng phân bố ở khu vực nước Việt Nam Tuy nhiên trong quá trình thu thập nhóm đã mở rộng phạm vi bao gồm : các nước giáp ranh, khu vực Đông Nam A, khu vực châu A Một số côn trùng tuy không phân bố tại khu vực châu Á nhưng có họ hàng năm trong khu vực Thông tin của 30 loại trên
52 được thu thập từ nhiêu nguôn khác nhau cùng với khâu đôi chiêu nhiêu lân giữa hình ảnh với thông tin được tìm thấy.
Co sở thực hiện tô hợp là: thông tin phân loại của côn trùng Sau khi thu thập thông tin của 30 loại côn trùng, nhóm thực hiện xem xét từng cấp phân loại sau đó gom nhóm lại các loại côn trùng nào thuộc chung một nhóm và chung một cấp phân loại sinh học Điều đáng lưu ý là phải đối chiếu cần thận dé tránh việc bó trí loại côn trùng vào nhằm cấp Bởi trong 30 loại thì dữ liệu một số loại thuộc phân cấp sinh học lại cao hơn các loại khác nhưng lại thuộc chung một nhóm thuộc cấp cao hơn.
Ví dụ: Họ Bồ Củi (cấp Họ) cấp cao hơn Chi Amara (cấp Chi) Tuy nhiên ca 2 lại thuộc cùng một Bộ Coleoptera (cấp Bộ)
4.4.2 Quy trình xây dựng bộ dữ liệu mới
Bước 1: Đọc thông tin cấp phân loại của các loại trong 30 loại côn trùng Tại đây ta lay thông tin phân loại của 3 loại côn trùng dé đối chiếu gồm: Grass Spider, Brown Recluse Spider, Kiến.
3 Grass Spider 4 Brown Recluse Spider
Kingdom: Animalia Phylum: Arthropoda Phylum: Arthropoda Subphylum: Chelicerata
Subphylum: Chelicerata Class: Arachnida Class: Arachnida Order: Araneae
Giới (regnum) Animalia Ngành (phylum) Arthropoda Phan nganh (subphylum) Hexapoda Lớp (class) Insecta
Phan lớp (subclass) Pterygota Phan thứ lớp (infraclass) Neoptera Liên bộ (superordo) Endopferygota
Bộ (ordo) Hymenoptera Phân bộ (subordo) Apocrita Liên ho (superfamilia) Vespoidea
Hình 3 1 Các loại côn trùng đối chiều
Bước 2: Đôi chiêu các câp phân loại giữa các loại từ câp cao xuông câp thâp đê tìm ra cấp chung thấp nhất giữa các loại. o Xét2 loại Grass Spider và Kiến ta thay cấp phân loại chung thấp nhất là Ngành
(cùng thuộc Arthropoda) Nhưng do bộ dữ liệu cấp cao nhất là Lớp nên sẽ không gom nhóm 2 loại trên.
Khong thuc hién gom nhóm do
Cùng cấp Phylum (Ngành) cấp phân loại
: Arthropoda o Xét 2 loại Grass Spider và Brown Recluse Spider ta thấy cấp phân loại chung thấp nhất là Infra Order-Phân ngành (cùng thuộc Araneomorphae) Do tính chat phân loại nên 2 loại déu sẽ cùng thuộc vào | nhóm của các cap cao hơn.
Trong trường hợp này, 2 loại đều cùng thuộc: o Order: Araneae o Class: Arachnida
Phân loại : oo Kingdom: Animalia
Animalia Phylum: Arthropoda Arthropoda Subphylum: Chelicerata oxosceles
Thuc hién gom nhóm do cấp
Cùng cấp Class (Lớp) : phân loại trong
Sau khi dữ liệu đã được tô chức theo từng nhóm sinh học, nhóm thực hiện gán nhãn dữ liệu thủ công bang cách dùng tên những nhóm sinh học tao thành một tệp va lưu trữ dữ liệu tương ứng ở những nhóm đó.
Thống kê số liệu các nhóm dữ liệu .ccc-c -ccvecceccccvvveesrcrrrvee 55 1 Bộ dữ liệu ban đầu -ccececreetrerrirrtririrtrkirirtrrerrrrrkrree 55 2 _ Bộ dữ liệu tổng hợp từ 30 nhóm dữ liệu ban đầu
4.5.1 Bộ dữ liệu ban đầu
Số liệu các nhãn trong bộ dir liệu 30 loại côn trùng ban đầu
Số thứ tự Tên côn trùng Số lượng dữ liệu
Bang 1 Bộ dữ liệu ban dau 4.5.2 Bộ dữ liệu tổng hợp từ 30 nhóm dữ liệu ban đầu Bảng thống kê tóm tắt số liệu:
Cấp phân Loại Số lượng nhãn của mỗi cấp
Class 3 Order 8 SubOrder và InfraOrder | 4
Bảng 2 Số liệu tóm tắt
Tên Class | Số lượng loài trong danh sách 30 loài | Tổng số flle dữ liệu
Bang 3 Bộ dit liệu Class (chưa bổ sung)
Số lượng cụ thể về dữ liệu của từng Lớp
Tên Class Tên côn trùng Số lượng dữ liệu
Bảng 4 Dữ liệu Class chỉ tiết
Tén Order Số lượng loài trong danh sách 30 loài | Tổng số file dữ liệu
Bang 5 Bộ dữ liệu Order (chưa bồ sung)
Số lượng cụ thể của từng Order Tên Order Tên côn trùng Số lượng dữ liệu
Bang 6 Bộ dữ liệu Order chỉ tiết
3 Các SubOrder và InfraOrder: Có 4 InfraOrder
Tên SubOrder/ Số lượng loài trong danh sách :
Tông sô file dữ liệu InfraOrder 30 loài
Bang 7 Bộ dữ liệu Infra Order (chưa bồ sung)
Số lượng cụ thể của từng Infra Order
Tên SubOrder/ | Tên côn trùng Số lượng dữ liệu
Bảng 8 Dữ liệu Infra Order chỉ tiết
Family Culicidae Family Theraphosidae Family Sparassidae
Số lượng loài trong danh sách 30 Tên Family loài Tống số file dữ liệu
Số lượng cụ thé của từng Family
Bang 9 Dữ liệu Family (chưa bồ sung)
Tên Family Tên côn trùng Số lượng dữ liệu
Bảng 10 Dữ liệu Family chỉ tiết
2 Genus Latrodectus (Nhện góa phụ)
3 Genus Acanthoscurria (Tarantula đầu gối trang)
5 Genus Brachypelma (Tarantula đầu gối đỏ)
Tén Genus Tên côn trùng Số lượng dữ liệu
Bảng 11 Dữ liệu Genus (chưa bố sung)
1 Species L reclusa (Nhén nâu an dat)
2 Species P rapae (bướm bap cải trang)
3 Species P sita (bướm hồ hạt đẻ)
6 Species P.aegeus (bướm đuôi én)
7 Species I leuconoe (bướm diéu giấy)
Tên Species | Số lượng file dữ liệu
L reclusa 145 P.rapae 97 P.sita 95 H.bolina 116 D.plexippus | 85 P.aegeus 86 Lleuconoe 97 Amara aenea | 213 R.ferrugineus | 860 C.medinalis | 1115 S.incertulas 504
4.5.3 Bộ dữ liệu được bỗ sung thêm
Dữ liệu thống kê bao gồm số liệu đã tổng hợp, sắp xếp từ 30 loài được chọn ở Option
1 và các Family cùng Order mới được thu thập thêm vào.
Các cấp phân lớp chính : Class, Order, Sub/InfraOrder, Family, Genus
Cấp phân Loại Số lượng nhãn của mỗi cấp
Bảng 13 Dữ liệu thông kê sơ bộ (có Species) Thống kê chỉ tiết:
Cấp phân loại Số lượng nhãn trong 1 cấp
Bang 14 Dữ liệu bố sung (tóm tắt)
Số lượng cụ thé mỗi cấp dựa theo cấp thấp hơn gần nhất.
Số lượng dữ liệu ảnh: 26814.
Tên Class Số lượng Order của Class Tổng số file dữ liệu
Bang 15 Số lượng anh chi tiết của Class
Số lượng cụ thể từng Class:
Tên Lớp Tên côn trùng Số lượng dữ liệu
Bang 16 Dữ liệu Class (đã bổ sung)
Số lượng dữ liệu ảnh: 25463.
Tên Order Số lượng Family của Order | Tổng số file dữ liệu
Opiliones 0 102 Scutigeromorpha 1 162 Blattodea 2 296 Mantodea 2 308 Ephemeroptera 0 102 Phasmatodea 0 101
Bang 17 Dữ liệu Order (đã bô sung)
Số lượng dữ liệu ảnh: 10092.
Tên Sub/InfraOrder Tổng số file dữ liệu
Bang 18 Dữ liệu Infra Order (đã bồ sung)
Số lượng dữ liệu ảnh: 17092.
Tên Family Số lượng các Genus của Family | Tổng số file dữ liệu
Theridiidae 102 Thomisidae 101 Zodariidae 101 Buthidae 101 Hormuridae 91
Bang 19 Dữ liệu Family (đã bồ sung)
Số lượng dữ liệu anh 3024
Tên Genus Tổng số file dữ liệu
Deinopis 125 Amara 2206 Maratus 162 Acanthoscurria 131 Latrodectus 127 Agelenopsis 141
Bang 20 Dữ liệu Genus (đã bồ sung)
Bộ dữ liệu đã sắp xếp
THUC NGHIEM VÀ KET LUẬN
CNN with SIFT CNN ResNet50 VGG-16
Bang 21 Kết quả các độ do của Class
CNN with SIFT CNN ResNet50 VGG-16
Bảng 22 Kết qua các độ đo của Order
CNN with SIFT CNN ResNet50 | VGG-16
Bảng 23 Kết qua các độ đo của Infra Order
CNN with SIFT CNN ResNet50 VGG-16
Bang 24 Kết quả các độ do của Family
Bang 25 Kết quả các độ do của Genus
VGG-16 đạt khả năng dự đoán tương đối ôn định đối với những cấp phân loại chênh lệch dữ liệu lớn khi những nhãn huấn luyện được cung cấp đủ data. label: Ar label:
1/1 [ icted label True labe Predict resuit: True Predicte
True labe Culicidae (Fami Predicted label: Culicidae Predict ult: True
(Fami. ryllotalpidae (Family) rue lab 1 ted labe
Theo kết quả thực nghiệm tai các cấp mat cân bang lớn như Order, Family thì các nhãn dự đoán đúng như: Scorpiones, Araneae, Diptera, Culicidae, Orthoptera đều được cung cấp một số lượng lớn ảnh dé huấn luyện Theo thống kê thì nhãn ít data nhất là Scorpiones chỉ với 559 ảnh.
Tuy nhiên, đôi với các cap mat cân băng lớn thì với những ảnh được cung cap quá ít data, VGG-16 dự đoán sai hoàn toàn Ngoài ra các nhãn dự đoán cũng không có nhiều
Xét các trường hợp như các nhãn : Corduliidae, Buthidae, Blaberidae, Blattodea chi có trung bình khoảng hơn 100 ảnh dùng huấn luyện.
Với các cấp phân loại ít mất cân bằng nhưng cũng với tình trạng data huấn luyện ít thì VGG-16 vẫn có thé nhận diện đúng nhưng sẽ có nhằm lẫn.
True label: Deinopis icted label: Deinopi
Predicted label: Araneae ( i it: True
True labe orphae (Infra Order} d ygalomorphae (Infra Order)
Predicted label: Caelifera (Infra Order)
True label: Araneae abel: Arachnida Predicted la ed label:
Predict result: True : a (cl dicted label: Arachnida (Cla t result: True
True label: Carabidae (Famil icted label: E ridae (Family)
Các nhãn Deinopis, Acanthoscurria ở câp Genus ít mât cân băng data, các nhãn đêu chỉ có khoảng 130 ảnh đê huân luyện nhưng đêu có thê nhận diện chính xác Trường hợp nhãn Amara bị nhận diện sai.
Mô hình VGG- 16 hiện tại xử lí overfit và ảnh môi trường mờ còn chưa được hiệu quả
Xét 2 anh: anh một loài nhện (anh trái) và bo que (anh phải) Nhìn mắt thường ta thấy điểm tương đồng về hình dáng của 2 loài trên Dựa trên đặc tính đó nhóm đã sử dụng anh của 2 loài dé kiểm tra trường hợp overfit, có thé thay VGG-16 đã nhằm lẫn anh bọ que và gán vào Class Arachnida thay vì Insecta.
Xét anh của Class Chilopoda (Rét), với anh rét trên thân cây (ảnh trái) và ảnh rết trên nên trăng (ảnh phải) Ta thấy ảnh rết trên thân cây khó nhận diện băng mắt thường, hình ảnh rết trên thân cây hòa vào môi trường làm khó nhận diện hơn ảnh của rết trên nên trăng.
Theo những đánh giá trên có thé thay VGG-16 có thể nhận diện ảnh tốt hơn nếu dat được các điêu kiện: ít chênh lệch data giữa các nhãn và ảnh không bị mờ.
Nhóm thử nghiệm và thành công với ảnh của một loài bướm bat ky Hoa tiết của loại bướm này chưa từng xuất hiện trong data huấn luyện, là hình ảnh của một loài bướm năm ngoài data của nhóm Nhãn phân loại của loài bướm được dự đoán đúng toàn
Hiệu quả nhận diện của ResNet50 không đạt hiệu qua cao như VGG-16 Theo như kết quả thì bên cạnh việc bị ảnh hưởng bởi chênh lệch dữ liệu thì ResNet50 cần nhận vào một lượng đữ liệu nhất định thì mới đạt hiệu quả huấn luyện Không như VGG-
16 nếu như sự chênh lệch data không quá lớn thì vẫn có thé cho ra kết qua dự đoán đúng với số data huấn luyện ít.
True label: Buthidae (Family) Predicted label: Gryllotalpidae (Family) Predict result: False
1/1 [=======s======sms=mmrmr=mr====m] - 05 7ims/step True label: Scorpiones (Order)
Predicted label: Orthoptera (Order) Predict result: False
True label: Arachnida (Class) Predicted label: Insecta (Class) Predict result: False
True label: Culicidae (Family) Predicted label: Culicidae (Family) Predict result: True
True label: Diptera (Order) Predicted label: Diptera (Order) Predict result: True
True label: Insecta (Class) Predicted label: Insecta (Class) Predict result: True
Xét ảnh bo cạp (bên trái) và ảnh muỗi (bên phải), ta thấy so với VGG-16 thì ResNet đã dự đoán sai nhãn Order của bọ cạp Xem đến phần số lượng data thì Order Scorpiones có 559 ảnh và Order Diptera có 690 ảnh So sánh về mặt số lượng thì VGG-16 cần ít anh dé huấn luyện hơn ResNet50.
] - 8s 73ms/step True label: Maratus (Genus)
True label: Theraphosidae (Family) True label: Arachnida (Class)
Predicted label: Theraphosidae (Family) Predicted label: Arachnida (Class)
Predict result: True Predict result: True 1/1 - 8s 76ms/step
True label: Mygalomorphae (Infra Order) Predicted label: Mygalomorphae (Infra Order) Predict result: True
1/1 True label: Araneae (Order) Predicted label: Araneae (Order) Predict result: True
1/1 [ True label: Arachnida (Class) Predicted label: Arachnida (Class) Predict result: True
True label: Araneae (Order) Predicted label: Araneae (Order) Predict result: True
B ~ = ơ | II i l II II l l I i] II II l II II II | i i 1 H i tl I I l II II ' 8s 68ms/step
] - 8s 79ms/step True label: Arachnida (Class)
Predicted label: Arachnida (Class) Predict result: True
Xét thay tat cả các Genus nhện đều bị dự đoán sai So với mô hình VGG-16 cùng một số lượng dữ liệu và cấp Genus là cấp ít mất cân bằng dữ liệu nhưng hiệu quả mô hình ResNet50 kém hơn, mô hình cần nhiều ảnh hơn so với VGG-16.
ResNet50 cũng dự đoán anh mờ kém tương tự như VGG-16.
True label: Chilopoda (Class) Predicted label: Insecta (Class) Predict result: False
Xét ảnh của Class Chilopoda (Rét), với ảnh rét trên thân cây (ảnh trái) và ảnh rết trên nền trăng (ảnh phải) Ta thấy ảnh rết trên thân cây khó nhận diện bằng mắt thường, hình ảnh rết trên thân cây hòa vào môi trường làm khó nhận diện hơn ảnh của rết trên nền trắng Cùng số lượng ảnh nhưng với ảnh rõ nét và không rõ nét cũng ảnh hưởng đến khả năng nhận diện của ResNet50.
Tuy nhiên khả năng xử lý overfit của ResNet cao hơn so với VGG-16 Khi được truyền một lượng dir liệu lớn thi mô hình ResNet không xuất hiện tình trạng overfit.
1/1 [==============================] - @s 93ms/step True label: Insecta (Class)
Predicted label: Insecta (Class) Predict result: True
Ta thay hình ảnh bọ que đã được nhận diện đúng vào Class ma không bị nhằm lẫn như trường hợp VGG-16.
Dựa theo các thử nghiệm trên thì ResNet có thé nhận diện tốt nếu đạt các yêu cầu về đữ liệu: đủ số lượng data huấn luyện, ảnh rõ nét.
True label: Nymphalidae (Family) Predicted label: Nymphalidae (Family) Predict result: True
1/1 [==============================] - @s 76ms/step True label: Lepidoptera (Order)
Predicted label: Lepidoptera (Order) Predict result: True
4/1 [===-=======E==============-==== ] - 8s 81ms/step True label: Insecta (Class)
Predicted label: Insecta (Class) Predict result: True
Cùng dự đoán một ảnh tương tự như của VGG-16, nhãn của anh dap ứng các điều kiện nên dự đoán đúng toàn bộ các nhãn.
5.3.3 CNN với trích xuất SIFT