1. Trang chủ
  2. » Luận Văn - Báo Cáo

Khóa luận tốt nghiệp Công nghệ thông tin: Phân loại ảnh côn trùng thuộc nhiều cấp phân loại sinh học

89 0 0
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Phân loại ảnh côn trùng thuộc nhiều cấp phân loại sinh học
Tác giả Nguyen Minh Cuong, Pham Thanh Quang
Người hướng dẫn TS. Do Trong Hop, ThS. Ta Thu Thuy
Trường học Đại học Quốc gia TP. Hồ Chí Minh
Chuyên ngành Công nghệ thông tin
Thể loại Khóa luận tốt nghiệp
Năm xuất bản 2023
Thành phố TP. Hồ Chí Minh
Định dạng
Số trang 89
Dung lượng 57,02 MB

Cấu trúc

  • 4.2.15. Deinopis co mẽ ẽ ẽẽ (0)
  • 4.2.16. Brachypelma.........................................-----c--xrxrsrrrtrrirtrirtkiirtiiriiriiririirrririr 37 4.2.17. MaratfusS..................................................ecieieHrririiiiiriiiririiirirrirrrrrrrre 38 4.2.18. 2c o aẽ (36)
  • 42.20. P.SIEA............................ HH HH HH ườn 41 “V5 Nhi (40)
    • 4.2.24. I.ÌeUCOHOG...................................+cc<S.hEHHHHH HH ri 45 4.2.25, AMAA a©I€a..................................-----x+ckk HH HH HH rờt 46 4.2.26. _ R.ferrUBẽn€US................................cccekkhHHHH HH Hy 47 4.2.27. _ Cnaphalocrocis medinaÌiS..................................---c---ccccxserxeerreeerreerrierreerrrrrr 48 4.2.28. =vo he (0)
    • 4.2.29. Scirpophaga incertuÌaS.............................-.----ceecrrerrrirtrrrrrriirtrrirrrrirrrrirrrrrree 49 4.2.30. Caelifera....................................... ôHH HH Hy 50 4.3. Đánh giá các bộ dữ liệu thu thập..........................................-------c-c-eeerierrrrrrrrerrrkrr 51 4.3.1. _ Đánh giá các dữ liệu đã thu thập từ các nguồn (48)
    • 4.3.2. Can thiết trong việc xây dựng bộ dữ liệu mới (0)
  • 4.4. Phương pháp tạo dựng bộ dữ liệu........................................-----<c-cccsekieiiierie 52 1. Cơ sở xây dựng bộ dữ liệu.........................................---ccccceeceveereerrseerreerrerrrr 52 2. Quy trình xây dựng bộ dữ liệu mớii.....................................-----c-cce<ceereeexex 53 3. tin c0 00177 5 (51)
  • 4.5. Thống kê số liệu các nhóm dữ liệu ....................................--.ccc-c---ccvecceccccvvveesrcrrrvee 55 1. Bộ dữ liệu ban đầu......................................---ccececreetrerrirrtririrtrkirirtrrerrrrrkrree 55 2. _ Bộ dữ liệu tổng hợp từ 30 nhóm dữ liệu ban đầu (54)

Nội dung

Nhóm đã cố gang trong việc tự tao dựng một bộ dữ liệu đa dang cácphân cấp và các nhóm phân loại côn trùng với số lượng dir liệu được t6 chức tương đôi lớn... Các dữ liệu không có sự liên

Brachypelma . -c xrxrsrrrtrrirtrirtkiirtiiriiriiririirrririr 37 4.2.17 MaratfusS ecieieHrririiiiiriiiririiirirrirrrrrrrre 38 4.2.18 2c o aẽ

Phân loại: o Kingdom: Animalia o Phylum: Arthropoda o Subphylum: Chelicerata o Class: Arachnida o Order: Araneae o Infraorder: Mygalomorphae o Family: Theraphosidae o Genus: Brachypelma o Simon, 1891

Phân bố: o Phân bô của các Loài tarantula chân đỏ.

37 emilia klaasi hamorii baumgarteni boehmei auratum albiceps smithi œ Do

Phân loại: o Kingdom: Animalia o Phylum: Arthropoda o Subphylum: Chelicerata o Class: Arachnida o Order: Araneae

38 ©_ Infraorder: Araneomorphae o Family: Salticidae o Subfamily: Salticinae o Genus: Maratus o Karsch, 1878[1]

Phân bố : o Phần lớn các loài được tim thấy ở Uc và Wale Có 1 loài được tìm thay ở Trung Quốc

Phan loai: o Kingdom: Animalia o Phylum: Arthropoda o Subphylum: Chelicerata o Class: Arachnida o Order: Araneae o Infraorder: Araneomorphae o Family: Sparassidae o Bertkau, 1872

39 o Hơn một nghìn loài Sparassidae xuất hiện ở hầu hết các khu vực từ ôn đới đến nhiệt đới ấm áp trên thế giới, bao gồm phần lớn Australasia , Châu Phi , Châu Á , và Châu Mỹ. o Có 15 Loài được phát hiện ở khu vực châu Á nói chung.

Phân loại: o Kingdom: Animalia o Phylum: Arthropoda o Class: Insecta o Order: Lepidoptera o Family: Pieridae o Genus: Pieris o Species: P rapae

Phân bố: o_ Loài này có phạm vi tự nhiên trên khắp châu Au, châu A và Bắc Phi. o Hinh sau miêu tả lịch sử phát hiện va nơi phat triên của loài nay ở các khu vực trên thê giới.

Hình 28 : Nơi phát triển của P.rapae

P.SIEA HH HH HH ườn 41 “V5 Nhi

Scirpophaga incertuÌaS -. ceecrrerrrirtrrrrrriirtrrirrrrirrrrirrrrrree 49 4.2.30 Caelifera ôHH HH Hy 50 4.3 Đánh giá các bộ dữ liệu thu thập -c-c-eeerierrrrrrrrerrrkrr 51 4.3.1 _ Đánh giá các dữ liệu đã thu thập từ các nguồn

Phan loai: o Kingdom: Animalia o Phylum: Arthropoda o Class: Insecta o Order: Lepidoptera

49 o Family: Crambidae o Genus: Scirpophaga o Species: S incertulas

Phân bố: o Được tim thấy ở Afghanistan, Nepal, đông bắc An Độ, Sri Lanka,

Bangladesh, Burma, Việt Nam, Thái Lan, Malaysia, Singapore,

Sumatra, Java, Borneo, Sumba, Sulawesi, Philippines, Dai Loan, Trung

Phan loai: o Kingdom: Animalia o Phylum: Arthropoda o Subphylum: Hexapoda o Class: Insecta o Order: Orthoptera o Subordo: Caelifera

Phân bố : o Phân bộ Caelifera chủ yêu phân bổ ở khu vực nhiệt đới nhưng phần lớn các siêu họ thì phân bổ rộng khắp thé giới.

4.3 Đánh giá các bộ dữ liệu thu thập

4.3.1 Đánh giá các dữ liệu đã thu thập từ các nguồn

Theo đánh giá từ việc xem xét các bộ dữ liệu đã thu thập trước đó thì việc xây dựng bộ dữ liệu mới dựa trên các bộ đã tìm thấy là hoàn toàn cần thiết.

Nhận xét về các bộ dữ liệu trước đó: Thiếu sự đa dạng về Bộ côn trùng.

Trường hợp : o Bộ dữ liệu YIKES! Spiders -15 Species Classification o Bộ dữ liệu Butterfly Image Classification 50 species

Cả 2 bộ dữ liệu trên đa dang về hình ảnh các loài bướm và nhện nhưng đều thuộc cùng một Bộ côn trùng như bướm thuộc về Bộ Lepidoptera và nhện thuộc về Bộ Araneae Điều đó dẫn đến đưa loài thuộc Bộ côn trùng khác sẽ không thé nhận diện được, ví dụ : Kiến thuộc Bộ Hymenoptera, Chuén Chuôn thuộc Bộ Odonata, o_ Thiếu thông tin về danh pháp hoặc tên côn trùng.

Bộ dữ liệu 25insects chứa dữ liệu da dạng về các loài côn trùng nhưng phân tán không theo một Bộ một côn trùng cụ thé, các loài trong bộ dữ liệu thuộc nhiều bộ côn trùng khác nhau và không chứa tên cũng như danh pháp khoa học của các loài nên cần chỉnh và gán nhãn danh pháp cho các loài. o_ Bộ dữ liệu đa dạng nhưng thông tin không được đầy đủ ngoài ra còn khá phân tán chưa cụ thể trong việc phân loại loài.

Trong các bộ Ants & Bees và Insects Recognition khắc phục được thông tin của các bộ dữ liệu bên trên do có thêm các loài như : chuồn chuồn, ong, kiến, bo rùa Tuy nhiên đây chỉ là hình ảnh chung chung của các phân lớp côn trùng ở cấp cao như từ

Họ côn trùng đến Bộ côn trùng không ở mức phân loại Loài côn trùng.

Xét bộ dữ liệu Insects Recognition: o Về hình ảnh nhận diện của chuôn chuon là hình ảnh của nhiêu loài khác nhau không cụ thé một loài nhất định điều này dẫn đến chỉ có thể nhận diện côn

Can thiết trong việc xây dựng bộ dữ liệu mới

4.3.2 Cần thiết trong việc xây dựng bộ dữ liệu mới:

Nhận diện Bộ côn trùng đa dạng hơn Băng việc kết hợp các bộ dữ liệu với nhau ta có thê nhận biết các côn trùng thuộc các bộ đa dạng như: Bướm, Hình nhện, Chuồn

Tang tính chính xác kha năng nhận diện côn trùng trong bộ dữ liệu mới : Mô hình có thể nhận biệt cụ thé hình ảnh một số loài Tuy một số bộ dữ liệu có mức phân loại chi ở Bộ không có mức phân loại côn trùng thấp hơn mức Bộ nhưng lại chứa hình ảnh nhận diện mà các bộ dữ liệu khác không có : Insects Recognition chứa hình ảnh của

Bộ Chuồn Chuén, Ants & Bees chứa hình ảnh của Kiến, Animals Detection Images

Dataset chứa hình anh của Rét Tuy không thé nhận biết cụ thé loài kiến gi hay loài chuôn chuôn gì nhưng van có kha năng nhận biét là côn trùng gi.

Bộ dữ liệu sẽ có thê phát triển lên mức phân loại danh pháp khoa học ở mức cao hơn cho việc cải tiễn khả năng nhận diện và phân loại côn trùng Một số bộ dit liệu đã phân loại rõ ràng côn trùng ở các mức như : Lớp, Bộ, Họ, Chi Điều này có thể giúp bộ dữ liệu gán thêm các nhãn phân loại côn trùng thuộc các phân lớp ở mức cao hơn chứ không chỉ giới hạn ở mức phân biệt là Loài gì.

Phương pháp tạo dựng bộ dữ liệu -<c-cccsekieiiierie 52 1 Cơ sở xây dựng bộ dữ liệu . -ccccceeceveereerrseerreerrerrrr 52 2 Quy trình xây dựng bộ dữ liệu mớii -c-cce<ceereeexex 53 3 tin c0 00177 5

4.4.1 Cơ sở xây dựng bộ dữ liệu

Nhóm ban đầu thực hiện thu thập và tìm kiếm 30 loại côn trùng với các cấp phân loại khác nhau Các dữ liệu còn rời rac chưa được tô chức lại và không có sự liên kết. Đối tượng thu thập là các loài côn trùng phân bố ở khu vực nước Việt Nam Tuy nhiên trong quá trình thu thập nhóm đã mở rộng phạm vi bao gồm : các nước giáp ranh, khu vực Đông Nam A, khu vực châu A Một số côn trùng tuy không phân bố tại khu vực châu Á nhưng có họ hàng năm trong khu vực Thông tin của 30 loại trên

52 được thu thập từ nhiêu nguôn khác nhau cùng với khâu đôi chiêu nhiêu lân giữa hình ảnh với thông tin được tìm thấy.

Co sở thực hiện tô hợp là: thông tin phân loại của côn trùng Sau khi thu thập thông tin của 30 loại côn trùng, nhóm thực hiện xem xét từng cấp phân loại sau đó gom nhóm lại các loại côn trùng nào thuộc chung một nhóm và chung một cấp phân loại sinh học Điều đáng lưu ý là phải đối chiếu cần thận dé tránh việc bó trí loại côn trùng vào nhằm cấp Bởi trong 30 loại thì dữ liệu một số loại thuộc phân cấp sinh học lại cao hơn các loại khác nhưng lại thuộc chung một nhóm thuộc cấp cao hơn.

Ví dụ: Họ Bồ Củi (cấp Họ) cấp cao hơn Chi Amara (cấp Chi) Tuy nhiên ca 2 lại thuộc cùng một Bộ Coleoptera (cấp Bộ)

4.4.2 Quy trình xây dựng bộ dữ liệu mới

Bước 1: Đọc thông tin cấp phân loại của các loại trong 30 loại côn trùng Tại đây ta lay thông tin phân loại của 3 loại côn trùng dé đối chiếu gồm: Grass Spider, Brown Recluse Spider, Kiến.

3 Grass Spider 4 Brown Recluse Spider

Kingdom: Animalia Phylum: Arthropoda Phylum: Arthropoda Subphylum: Chelicerata

Subphylum: Chelicerata Class: Arachnida Class: Arachnida Order: Araneae

Giới (regnum) Animalia Ngành (phylum) Arthropoda Phan nganh (subphylum) Hexapoda Lớp (class) Insecta

Phan lớp (subclass) Pterygota Phan thứ lớp (infraclass) Neoptera Liên bộ (superordo) Endopferygota

Bộ (ordo) Hymenoptera Phân bộ (subordo) Apocrita Liên ho (superfamilia) Vespoidea

Hình 3 1 Các loại côn trùng đối chiều

Bước 2: Đôi chiêu các câp phân loại giữa các loại từ câp cao xuông câp thâp đê tìm ra cấp chung thấp nhất giữa các loại. o Xét2 loại Grass Spider và Kiến ta thay cấp phân loại chung thấp nhất là Ngành

(cùng thuộc Arthropoda) Nhưng do bộ dữ liệu cấp cao nhất là Lớp nên sẽ không gom nhóm 2 loại trên.

Khong thuc hién gom nhóm do

Cùng cấp Phylum (Ngành) cấp phân loại

: Arthropoda o Xét 2 loại Grass Spider và Brown Recluse Spider ta thấy cấp phân loại chung thấp nhất là Infra Order-Phân ngành (cùng thuộc Araneomorphae) Do tính chat phân loại nên 2 loại déu sẽ cùng thuộc vào | nhóm của các cap cao hơn.

Trong trường hợp này, 2 loại đều cùng thuộc: o Order: Araneae o Class: Arachnida

Phân loại : oo Kingdom: Animalia

Animalia Phylum: Arthropoda Arthropoda Subphylum: Chelicerata oxosceles

Thuc hién gom nhóm do cấp

Cùng cấp Class (Lớp) : phân loại trong

Sau khi dữ liệu đã được tô chức theo từng nhóm sinh học, nhóm thực hiện gán nhãn dữ liệu thủ công bang cách dùng tên những nhóm sinh học tao thành một tệp va lưu trữ dữ liệu tương ứng ở những nhóm đó.

Thống kê số liệu các nhóm dữ liệu .ccc-c -ccvecceccccvvveesrcrrrvee 55 1 Bộ dữ liệu ban đầu -ccececreetrerrirrtririrtrkirirtrrerrrrrkrree 55 2 _ Bộ dữ liệu tổng hợp từ 30 nhóm dữ liệu ban đầu

4.5.1 Bộ dữ liệu ban đầu

Số liệu các nhãn trong bộ dir liệu 30 loại côn trùng ban đầu

Số thứ tự Tên côn trùng Số lượng dữ liệu

Bang 1 Bộ dữ liệu ban dau 4.5.2 Bộ dữ liệu tổng hợp từ 30 nhóm dữ liệu ban đầu Bảng thống kê tóm tắt số liệu:

Cấp phân Loại Số lượng nhãn của mỗi cấp

Class 3 Order 8 SubOrder và InfraOrder | 4

Bảng 2 Số liệu tóm tắt

Tên Class | Số lượng loài trong danh sách 30 loài | Tổng số flle dữ liệu

Bang 3 Bộ dit liệu Class (chưa bổ sung)

Số lượng cụ thể về dữ liệu của từng Lớp

Tên Class Tên côn trùng Số lượng dữ liệu

Bảng 4 Dữ liệu Class chỉ tiết

Tén Order Số lượng loài trong danh sách 30 loài | Tổng số file dữ liệu

Bang 5 Bộ dữ liệu Order (chưa bồ sung)

Số lượng cụ thể của từng Order Tên Order Tên côn trùng Số lượng dữ liệu

Bang 6 Bộ dữ liệu Order chỉ tiết

3 Các SubOrder và InfraOrder: Có 4 InfraOrder

Tên SubOrder/ Số lượng loài trong danh sách :

Tông sô file dữ liệu InfraOrder 30 loài

Bang 7 Bộ dữ liệu Infra Order (chưa bồ sung)

Số lượng cụ thể của từng Infra Order

Tên SubOrder/ | Tên côn trùng Số lượng dữ liệu

Bảng 8 Dữ liệu Infra Order chỉ tiết

Family Culicidae Family Theraphosidae Family Sparassidae

Số lượng loài trong danh sách 30 Tên Family loài Tống số file dữ liệu

Số lượng cụ thé của từng Family

Bang 9 Dữ liệu Family (chưa bồ sung)

Tên Family Tên côn trùng Số lượng dữ liệu

Bảng 10 Dữ liệu Family chỉ tiết

2 Genus Latrodectus (Nhện góa phụ)

3 Genus Acanthoscurria (Tarantula đầu gối trang)

5 Genus Brachypelma (Tarantula đầu gối đỏ)

Tén Genus Tên côn trùng Số lượng dữ liệu

Bảng 11 Dữ liệu Genus (chưa bố sung)

1 Species L reclusa (Nhén nâu an dat)

2 Species P rapae (bướm bap cải trang)

3 Species P sita (bướm hồ hạt đẻ)

6 Species P.aegeus (bướm đuôi én)

7 Species I leuconoe (bướm diéu giấy)

Tên Species | Số lượng file dữ liệu

L reclusa 145 P.rapae 97 P.sita 95 H.bolina 116 D.plexippus | 85 P.aegeus 86 Lleuconoe 97 Amara aenea | 213 R.ferrugineus | 860 C.medinalis | 1115 S.incertulas 504

4.5.3 Bộ dữ liệu được bỗ sung thêm

Dữ liệu thống kê bao gồm số liệu đã tổng hợp, sắp xếp từ 30 loài được chọn ở Option

1 và các Family cùng Order mới được thu thập thêm vào.

Các cấp phân lớp chính : Class, Order, Sub/InfraOrder, Family, Genus

Cấp phân Loại Số lượng nhãn của mỗi cấp

Bảng 13 Dữ liệu thông kê sơ bộ (có Species) Thống kê chỉ tiết:

Cấp phân loại Số lượng nhãn trong 1 cấp

Bang 14 Dữ liệu bố sung (tóm tắt)

Số lượng cụ thé mỗi cấp dựa theo cấp thấp hơn gần nhất.

Số lượng dữ liệu ảnh: 26814.

Tên Class Số lượng Order của Class Tổng số file dữ liệu

Bang 15 Số lượng anh chi tiết của Class

Số lượng cụ thể từng Class:

Tên Lớp Tên côn trùng Số lượng dữ liệu

Bang 16 Dữ liệu Class (đã bổ sung)

Số lượng dữ liệu ảnh: 25463.

Tên Order Số lượng Family của Order | Tổng số file dữ liệu

Opiliones 0 102 Scutigeromorpha 1 162 Blattodea 2 296 Mantodea 2 308 Ephemeroptera 0 102 Phasmatodea 0 101

Bang 17 Dữ liệu Order (đã bô sung)

Số lượng dữ liệu ảnh: 10092.

Tên Sub/InfraOrder Tổng số file dữ liệu

Bang 18 Dữ liệu Infra Order (đã bồ sung)

Số lượng dữ liệu ảnh: 17092.

Tên Family Số lượng các Genus của Family | Tổng số file dữ liệu

Theridiidae 102 Thomisidae 101 Zodariidae 101 Buthidae 101 Hormuridae 91

Bang 19 Dữ liệu Family (đã bồ sung)

Số lượng dữ liệu anh 3024

Tên Genus Tổng số file dữ liệu

Deinopis 125 Amara 2206 Maratus 162 Acanthoscurria 131 Latrodectus 127 Agelenopsis 141

Bang 20 Dữ liệu Genus (đã bồ sung)

Bộ dữ liệu đã sắp xếp

THUC NGHIEM VÀ KET LUẬN

CNN with SIFT CNN ResNet50 VGG-16

Bang 21 Kết quả các độ do của Class

CNN with SIFT CNN ResNet50 VGG-16

Bảng 22 Kết qua các độ đo của Order

CNN with SIFT CNN ResNet50 | VGG-16

Bảng 23 Kết qua các độ đo của Infra Order

CNN with SIFT CNN ResNet50 VGG-16

Bang 24 Kết quả các độ do của Family

Bang 25 Kết quả các độ do của Genus

VGG-16 đạt khả năng dự đoán tương đối ôn định đối với những cấp phân loại chênh lệch dữ liệu lớn khi những nhãn huấn luyện được cung cấp đủ data. label: Ar label:

1/1 [ icted label True labe Predict resuit: True Predicte

True labe Culicidae (Fami Predicted label: Culicidae Predict ult: True

(Fami. ryllotalpidae (Family) rue lab 1 ted labe

Theo kết quả thực nghiệm tai các cấp mat cân bang lớn như Order, Family thì các nhãn dự đoán đúng như: Scorpiones, Araneae, Diptera, Culicidae, Orthoptera đều được cung cấp một số lượng lớn ảnh dé huấn luyện Theo thống kê thì nhãn ít data nhất là Scorpiones chỉ với 559 ảnh.

Tuy nhiên, đôi với các cap mat cân băng lớn thì với những ảnh được cung cap quá ít data, VGG-16 dự đoán sai hoàn toàn Ngoài ra các nhãn dự đoán cũng không có nhiều

Xét các trường hợp như các nhãn : Corduliidae, Buthidae, Blaberidae, Blattodea chi có trung bình khoảng hơn 100 ảnh dùng huấn luyện.

Với các cấp phân loại ít mất cân bằng nhưng cũng với tình trạng data huấn luyện ít thì VGG-16 vẫn có thé nhận diện đúng nhưng sẽ có nhằm lẫn.

True label: Deinopis icted label: Deinopi

Predicted label: Araneae ( i it: True

True labe orphae (Infra Order} d ygalomorphae (Infra Order)

Predicted label: Caelifera (Infra Order)

True label: Araneae abel: Arachnida Predicted la ed label:

Predict result: True : a (cl dicted label: Arachnida (Cla t result: True

True label: Carabidae (Famil icted label: E ridae (Family)

Các nhãn Deinopis, Acanthoscurria ở câp Genus ít mât cân băng data, các nhãn đêu chỉ có khoảng 130 ảnh đê huân luyện nhưng đêu có thê nhận diện chính xác Trường hợp nhãn Amara bị nhận diện sai.

Mô hình VGG- 16 hiện tại xử lí overfit và ảnh môi trường mờ còn chưa được hiệu quả

Xét 2 anh: anh một loài nhện (anh trái) và bo que (anh phải) Nhìn mắt thường ta thấy điểm tương đồng về hình dáng của 2 loài trên Dựa trên đặc tính đó nhóm đã sử dụng anh của 2 loài dé kiểm tra trường hợp overfit, có thé thay VGG-16 đã nhằm lẫn anh bọ que và gán vào Class Arachnida thay vì Insecta.

Xét anh của Class Chilopoda (Rét), với anh rét trên thân cây (ảnh trái) và ảnh rết trên nên trăng (ảnh phải) Ta thấy ảnh rết trên thân cây khó nhận diện băng mắt thường, hình ảnh rết trên thân cây hòa vào môi trường làm khó nhận diện hơn ảnh của rết trên nên trăng.

Theo những đánh giá trên có thé thay VGG-16 có thể nhận diện ảnh tốt hơn nếu dat được các điêu kiện: ít chênh lệch data giữa các nhãn và ảnh không bị mờ.

Nhóm thử nghiệm và thành công với ảnh của một loài bướm bat ky Hoa tiết của loại bướm này chưa từng xuất hiện trong data huấn luyện, là hình ảnh của một loài bướm năm ngoài data của nhóm Nhãn phân loại của loài bướm được dự đoán đúng toàn

Hiệu quả nhận diện của ResNet50 không đạt hiệu qua cao như VGG-16 Theo như kết quả thì bên cạnh việc bị ảnh hưởng bởi chênh lệch dữ liệu thì ResNet50 cần nhận vào một lượng đữ liệu nhất định thì mới đạt hiệu quả huấn luyện Không như VGG-

16 nếu như sự chênh lệch data không quá lớn thì vẫn có thé cho ra kết qua dự đoán đúng với số data huấn luyện ít.

True label: Buthidae (Family) Predicted label: Gryllotalpidae (Family) Predict result: False

1/1 [=======s======sms=mmrmr=mr====m] - 05 7ims/step True label: Scorpiones (Order)

Predicted label: Orthoptera (Order) Predict result: False

True label: Arachnida (Class) Predicted label: Insecta (Class) Predict result: False

True label: Culicidae (Family) Predicted label: Culicidae (Family) Predict result: True

True label: Diptera (Order) Predicted label: Diptera (Order) Predict result: True

True label: Insecta (Class) Predicted label: Insecta (Class) Predict result: True

Xét ảnh bo cạp (bên trái) và ảnh muỗi (bên phải), ta thấy so với VGG-16 thì ResNet đã dự đoán sai nhãn Order của bọ cạp Xem đến phần số lượng data thì Order Scorpiones có 559 ảnh và Order Diptera có 690 ảnh So sánh về mặt số lượng thì VGG-16 cần ít anh dé huấn luyện hơn ResNet50.

] - 8s 73ms/step True label: Maratus (Genus)

True label: Theraphosidae (Family) True label: Arachnida (Class)

Predicted label: Theraphosidae (Family) Predicted label: Arachnida (Class)

Predict result: True Predict result: True 1/1 - 8s 76ms/step

True label: Mygalomorphae (Infra Order) Predicted label: Mygalomorphae (Infra Order) Predict result: True

1/1 True label: Araneae (Order) Predicted label: Araneae (Order) Predict result: True

1/1 [ True label: Arachnida (Class) Predicted label: Arachnida (Class) Predict result: True

True label: Araneae (Order) Predicted label: Araneae (Order) Predict result: True

B ~ = ơ | II i l II II l l I i] II II l II II II | i i 1 H i tl I I l II II ' 8s 68ms/step

] - 8s 79ms/step True label: Arachnida (Class)

Predicted label: Arachnida (Class) Predict result: True

Xét thay tat cả các Genus nhện đều bị dự đoán sai So với mô hình VGG-16 cùng một số lượng dữ liệu và cấp Genus là cấp ít mất cân bằng dữ liệu nhưng hiệu quả mô hình ResNet50 kém hơn, mô hình cần nhiều ảnh hơn so với VGG-16.

ResNet50 cũng dự đoán anh mờ kém tương tự như VGG-16.

True label: Chilopoda (Class) Predicted label: Insecta (Class) Predict result: False

Xét ảnh của Class Chilopoda (Rét), với ảnh rét trên thân cây (ảnh trái) và ảnh rết trên nền trăng (ảnh phải) Ta thấy ảnh rết trên thân cây khó nhận diện bằng mắt thường, hình ảnh rết trên thân cây hòa vào môi trường làm khó nhận diện hơn ảnh của rết trên nền trắng Cùng số lượng ảnh nhưng với ảnh rõ nét và không rõ nét cũng ảnh hưởng đến khả năng nhận diện của ResNet50.

Tuy nhiên khả năng xử lý overfit của ResNet cao hơn so với VGG-16 Khi được truyền một lượng dir liệu lớn thi mô hình ResNet không xuất hiện tình trạng overfit.

1/1 [==============================] - @s 93ms/step True label: Insecta (Class)

Predicted label: Insecta (Class) Predict result: True

Ta thay hình ảnh bọ que đã được nhận diện đúng vào Class ma không bị nhằm lẫn như trường hợp VGG-16.

Dựa theo các thử nghiệm trên thì ResNet có thé nhận diện tốt nếu đạt các yêu cầu về đữ liệu: đủ số lượng data huấn luyện, ảnh rõ nét.

True label: Nymphalidae (Family) Predicted label: Nymphalidae (Family) Predict result: True

1/1 [==============================] - @s 76ms/step True label: Lepidoptera (Order)

Predicted label: Lepidoptera (Order) Predict result: True

4/1 [===-=======E==============-==== ] - 8s 81ms/step True label: Insecta (Class)

Predicted label: Insecta (Class) Predict result: True

Cùng dự đoán một ảnh tương tự như của VGG-16, nhãn của anh dap ứng các điều kiện nên dự đoán đúng toàn bộ các nhãn.

5.3.3 CNN với trích xuất SIFT

Ngày đăng: 02/10/2024, 03:52

HÌNH ẢNH LIÊN QUAN

Hình 29 : Ảnh P.sita.......................--22c:  22v tt ng gia 4I Hình 30 : Ảnh H.bolina......................--.----  222cc tt He 42 Hình 31 : Ảnh D.plexippus ...c..ccccccscsssesssesssesssessssssessssessessscasecssscsssssecsssessesseessecsseess 43 Hình - Khóa luận tốt nghiệp Công nghệ thông tin: Phân loại ảnh côn trùng thuộc nhiều cấp phân loại sinh học
Hình 29 Ảnh P.sita.......................--22c: 22v tt ng gia 4I Hình 30 : Ảnh H.bolina......................--.---- 222cc tt He 42 Hình 31 : Ảnh D.plexippus ...c..ccccccscsssesssesssesssessssssessssessessscasecssscsssssecsssessesseessecsseess 43 Hình (Trang 8)
Hình 1 : Phân cấp sinh học cơ ban Trong sinh học, các loài sinh vat được phân bố và đưa vào các cấp bậc khác nhau như - Khóa luận tốt nghiệp Công nghệ thông tin: Phân loại ảnh côn trùng thuộc nhiều cấp phân loại sinh học
Hình 1 Phân cấp sinh học cơ ban Trong sinh học, các loài sinh vat được phân bố và đưa vào các cấp bậc khác nhau như (Trang 17)
Hình 4: Nơi phan bố của Gryllotalpidae - Khóa luận tốt nghiệp Công nghệ thông tin: Phân loại ảnh côn trùng thuộc nhiều cấp phân loại sinh học
Hình 4 Nơi phan bố của Gryllotalpidae (Trang 23)
Hình 5 : Ảnh Elateridae - Khóa luận tốt nghiệp Công nghệ thông tin: Phân loại ảnh côn trùng thuộc nhiều cấp phân loại sinh học
Hình 5 Ảnh Elateridae (Trang 24)
Hình 8 : Nơi phân bố của L.reclusa - Khóa luận tốt nghiệp Công nghệ thông tin: Phân loại ảnh côn trùng thuộc nhiều cấp phân loại sinh học
Hình 8 Nơi phân bố của L.reclusa (Trang 26)
Hình 10 : Ảnh Formicidae - Khóa luận tốt nghiệp Công nghệ thông tin: Phân loại ảnh côn trùng thuộc nhiều cấp phân loại sinh học
Hình 10 Ảnh Formicidae (Trang 27)
Hình 13 : Nơi phân bố của Apidae - Khóa luận tốt nghiệp Công nghệ thông tin: Phân loại ảnh côn trùng thuộc nhiều cấp phân loại sinh học
Hình 13 Nơi phân bố của Apidae (Trang 29)
Hình 12: Ảnh Apidae - Khóa luận tốt nghiệp Công nghệ thông tin: Phân loại ảnh côn trùng thuộc nhiều cấp phân loại sinh học
Hình 12 Ảnh Apidae (Trang 29)
Hình 17 : Nơi phân bố của Scorpiones - Khóa luận tốt nghiệp Công nghệ thông tin: Phân loại ảnh côn trùng thuộc nhiều cấp phân loại sinh học
Hình 17 Nơi phân bố của Scorpiones (Trang 32)
Hình 20 : Ảnh Acanthoscurria - Khóa luận tốt nghiệp Công nghệ thông tin: Phân loại ảnh côn trùng thuộc nhiều cấp phân loại sinh học
Hình 20 Ảnh Acanthoscurria (Trang 34)
Hình 21 : Nơi phân bố của Acanthoscurria - Khóa luận tốt nghiệp Công nghệ thông tin: Phân loại ảnh côn trùng thuộc nhiều cấp phân loại sinh học
Hình 21 Nơi phân bố của Acanthoscurria (Trang 35)
Hình 24: Ảnh Brachypelma - Khóa luận tốt nghiệp Công nghệ thông tin: Phân loại ảnh côn trùng thuộc nhiều cấp phân loại sinh học
Hình 24 Ảnh Brachypelma (Trang 37)
Hình 27 : Ảnh P.rapae - Khóa luận tốt nghiệp Công nghệ thông tin: Phân loại ảnh côn trùng thuộc nhiều cấp phân loại sinh học
Hình 27 Ảnh P.rapae (Trang 39)
Hình 28 : Nơi phát triển của P.rapae - Khóa luận tốt nghiệp Công nghệ thông tin: Phân loại ảnh côn trùng thuộc nhiều cấp phân loại sinh học
Hình 28 Nơi phát triển của P.rapae (Trang 40)
Hình 32 : Nơi phân bố D.plexippus - Khóa luận tốt nghiệp Công nghệ thông tin: Phân loại ảnh côn trùng thuộc nhiều cấp phân loại sinh học
Hình 32 Nơi phân bố D.plexippus (Trang 43)
Hình 34 : Noi phân bố P.aegeus - Khóa luận tốt nghiệp Công nghệ thông tin: Phân loại ảnh côn trùng thuộc nhiều cấp phân loại sinh học
Hình 34 Noi phân bố P.aegeus (Trang 44)
Hình 36 : Nơi phân bố của I. leuconoe - Khóa luận tốt nghiệp Công nghệ thông tin: Phân loại ảnh côn trùng thuộc nhiều cấp phân loại sinh học
Hình 36 Nơi phân bố của I. leuconoe (Trang 45)
Hình 40 : Ảnh Scaritinae - Khóa luận tốt nghiệp Công nghệ thông tin: Phân loại ảnh côn trùng thuộc nhiều cấp phân loại sinh học
Hình 40 Ảnh Scaritinae (Trang 48)
Hình 3. 1 Các loại côn trùng đối chiều - Khóa luận tốt nghiệp Công nghệ thông tin: Phân loại ảnh côn trùng thuộc nhiều cấp phân loại sinh học
Hình 3. 1 Các loại côn trùng đối chiều (Trang 52)
Bảng 2 Số liệu tóm tắt - Khóa luận tốt nghiệp Công nghệ thông tin: Phân loại ảnh côn trùng thuộc nhiều cấp phân loại sinh học
Bảng 2 Số liệu tóm tắt (Trang 56)
Bảng 4 Dữ liệu Class chỉ tiết - Khóa luận tốt nghiệp Công nghệ thông tin: Phân loại ảnh côn trùng thuộc nhiều cấp phân loại sinh học
Bảng 4 Dữ liệu Class chỉ tiết (Trang 57)
Bảng 8 Dữ liệu Infra Order chỉ tiết - Khóa luận tốt nghiệp Công nghệ thông tin: Phân loại ảnh côn trùng thuộc nhiều cấp phân loại sinh học
Bảng 8 Dữ liệu Infra Order chỉ tiết (Trang 61)
Bảng 10 Dữ liệu Family chỉ tiết - Khóa luận tốt nghiệp Công nghệ thông tin: Phân loại ảnh côn trùng thuộc nhiều cấp phân loại sinh học
Bảng 10 Dữ liệu Family chỉ tiết (Trang 63)
Bảng 11 Dữ liệu Genus (chưa bố sung) - Khóa luận tốt nghiệp Công nghệ thông tin: Phân loại ảnh côn trùng thuộc nhiều cấp phân loại sinh học
Bảng 11 Dữ liệu Genus (chưa bố sung) (Trang 63)
Bảng 13 Dữ liệu thông kê sơ bộ (có Species) Thống kê chỉ tiết: - Khóa luận tốt nghiệp Công nghệ thông tin: Phân loại ảnh côn trùng thuộc nhiều cấp phân loại sinh học
Bảng 13 Dữ liệu thông kê sơ bộ (có Species) Thống kê chỉ tiết: (Trang 65)
Bảng 22 Kết qua các độ đo của Order - Khóa luận tốt nghiệp Công nghệ thông tin: Phân loại ảnh côn trùng thuộc nhiều cấp phân loại sinh học
Bảng 22 Kết qua các độ đo của Order (Trang 72)
Bảng 23 Kết qua các độ đo của Infra Order - Khóa luận tốt nghiệp Công nghệ thông tin: Phân loại ảnh côn trùng thuộc nhiều cấp phân loại sinh học
Bảng 23 Kết qua các độ đo của Infra Order (Trang 73)

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN