Nghiên cứu và phát triển hệ thống nhận dạng cây dựa trên hình Ảnh trên thiết bị di Động

Trên cơ sở đó, một phương pháp nhận dạng dựa trên sự khai thác thông tin của chi, loài và họ đã được đề xuất và thử nghiệm trên CSDL về các loài thực vật ở Việt Nam.. Phương pháp này đượ

PHẦ N M Ở ĐẦ U

Đặ t v ấn đề

Thực vật đóng vai trò quan trọng trong hệ sinh thái và đời sống con người, nhưng nhận thức về tầm quan trọng này vẫn còn hạn chế Hoạt động hàng ngày của con người là một trong những nguyên nhân chính dẫn đến sự suy giảm đa dạng sinh học Để khắc phục tình trạng này, nâng cao hiểu biết về động thực vật là điều kiện tiên quyết Sự phát triển công nghệ, đặc biệt là thiết bị di động thông minh và kỹ thuật xử lý hình ảnh, đã mở ra khả năng xây dựng hệ thống nhận dạng cây tự động Trong những năm gần đây, nghiên cứu về nhận dạng cây dựa trên hình ảnh đã thu hút sự quan tâm lớn, dẫn đến sự ra đời của các ứng dụng và diễn đàn chuyên về thực vật Các nền tảng này giúp thu thập dữ liệu phong phú với chi phí thấp, góp phần nâng cao nhận thức về bảo tồn thiên nhiên.

Các bước xây dựng hệ thống nhận dạng cây dựa trên hình ảnh trên thiết bị di động bao gồm: đầu vào là ảnh của các bộ phận cây, với mục đích tiền xử lý ảnh nhằm nâng cao chất lượng ảnh để thu được các đặc trưng tốt Bước tiền xử lý này rất quan trọng vì nó tăng xác suất đạt kết quả mong muốn và thường bao gồm nâng cao chất lượng, chuẩn hóa và phân đoạn ảnh Trích chọn đặc trưng là quá trình rút ra thông tin quan trọng từ ảnh, giúp giảm kích thước dữ liệu trong khi vẫn giữ lại các đặc trưng có khả năng phân biệt cao Đây được coi là một trong những bước quan trọng nhất trong hệ thống nhận dạng, với độ chính xác cao hơn khi sử dụng các đặc trưng phù hợp Các đặc trưng có thể là thủ công hoặc học sâu, trong đó các đặc trưng học sâu đã cho thấy khả năng nhận dạng chính xác hơn trong điều kiện tự nhiên phức tạp Tuy nhiên, nhận dạng cây vẫn là một thách thức do số lớp lớn, sự tương tự giữa các lớp và độ đa dạng cao trong cùng một lớp.

Các loài thực vật trong cùng một chi và họ thường có những đặc điểm tương tự, điều này giúp việc xác định chi của các loài trở nên dễ dàng hơn, giảm không gian tìm kiếm và nâng cao hiệu quả nhận dạng Đề tài luận văn tập trung vào việc khai thác thông tin đồng thời từ các chi và loài trong hệ thống nhận dạng cây tự động thông qua hình ảnh.

M ụ c tiêu, ph ạm vi và đối tượ ng nghiên c ứ u c ủa đề tài

1.2.1 Mục tiêu của đề tài

Mục tiêu của nghiên cứu là phát triển phương pháp nhận dạng tự động cây từ hình ảnh, sau đó tích hợp vào ứng dụng di động để người dùng có thể dễ dàng nhận diện và truy xuất thông tin về các loại cây.

1.2.2 Phạm vi và đối tượng của đề tài

Đề tài "Nghiên cứu và phát triển hệ thống nhận dạng cây dựa trên hình ảnh trên thiết bị di động" tập trung vào việc xây dựng một hệ thống tự động nhận dạng cây trên điện thoại thông minh Hệ thống này sẽ sử dụng hình ảnh các loài cây và áp dụng các thuật toán trong lĩnh vực thị giác máy tính và học máy để phân loại và nhận dạng cây từ hình ảnh đầu vào Đối tượng sử dụng hệ thống bao gồm những người yêu thích cây cối, như nông dân, kiến trúc sư, nhân viên công viên, sinh viên thực vật học, và bất kỳ ai muốn tìm hiểu về cây mà họ gặp trong cuộc sống hàng ngày Hệ thống sẽ cung cấp thông tin về loại cây, đặc điểm sinh học và môi trường sống của chúng.

Các đóng góp chính trong đề tài

Nhận dạng cây dựa trên hình ảnh đang thu hút sự chú ý của cộng đồng nghiên cứu, nhờ vào sự phát triển của công nghệ thu thập và lưu trữ hình ảnh cùng với các thuật toán nhận dạng trong lĩnh vực thị giác máy tính Mặc dù đã có nhiều nghiên cứu và hệ thống thực tế được triển khai, sự chấp nhận của người dùng đối với các hệ thống này vẫn còn hạn chế do hiệu quả nhận dạng chưa đáp ứng kỳ vọng Trong phân loại thực vật, các loài cùng chi hoặc họ thường có đặc điểm hình thái tương tự, vì vậy thông tin về chi, họ có thể được sử dụng để cải thiện khả năng phân loại Luận văn này nhằm nâng cao hiệu quả nhận dạng bằng cách kết hợp thông tin phân loại thực vật, với phương pháp đã được thử nghiệm trên cơ sở dữ liệu các loài thực vật tại Việt Nam và được tích hợp vào hệ thống nhận dạng cây trên thiết bị di động.

B ố c ụ c c ủ a lu ận văn

Luận văn được trình bày trong 4 chương Trong đó:

Chương 1: Phần mởđầu: Trình bày vềcách đặt vấn đề, nêu lên mục tiêu, phạm vi, đối tượng nghiên cứu và các đóng góp chính của trong đề tài

Chương 2: Các mạng nơ ron nhân tạo và ứng dụng trong nhận dạng cây từ hình ảnh: Trình bày về tổng quan chung về mạng nơ ron nhân tạo, các kỹ thuật nhận dạng cây dựa trên hình ảnh và kết luận chương

Chương 3: Phương pháp nhận dạng cây cho phép khai thác đồng thời thông tin về họ, chi và loài: Trình bày về một số kiến thức cơ sở, hàm mất mát phân cấp thích ứng đề xuất, mô hình cơ sở dựa trên mạng ResNet-50 và kết luận chương

Chương 4: Thử nghiệm: Trình bày về CSDL, kết quả thử nghiệm, tích hợp hệ thống nhận dạng cây trên thiết bịdi động và kết luận chương

TỔ NG QUAN V Ề NH Ậ N D Ạ NG CÂY T Ừ HÌNH Ả NH

T ổ ng quan chung v ề m ạng nơ ron nhân tạ o

Mạng neuron nhân tạo là mô hình tính toán lấy cảm hứng từ cấu trúc não người, được ứng dụng rộng rãi trong nhận dạng hình ảnh, xử lý ngôn ngữ tự nhiên và tự động lái xe Trong lĩnh vực tài chính, mạng nơ ron hỗ trợ giao dịch thuật toán, dự báo chuỗi thời gian, phân loại chứng khoán, mô hình rủi ro tín dụng và xây dựng chỉ số độc quyền cũng như công cụ phát sinh giá cả.

Dưới đây là một sốđặc điểm quan trọng của mạng neuron nhân tạo:

Mạng nơ ron được cấu trúc gồm nhiều lớp xếp chồng lên nhau, bao gồm ba lớp chính: lớp đầu vào, lớp ẩn và lớp đầu ra Mỗi lớp chứa một số neuron, và các neuron trong lớp trước kết nối với các neuron trong lớp tiếp theo, tạo thành một mạng lưới phức tạp để xử lý thông tin.

Trọng số và bias là hai yếu tố quan trọng trong mạng nơ-ron, với trọng số điều chỉnh độ quan trọng của tín hiệu đầu vào và bias điều chỉnh giá trị đầu ra của mỗi neuron Cả hai tham số này cần được tối ưu hóa trong quá trình huấn luyện để cải thiện hiệu suất của mô hình.

Hàm kích hoạt là một thành phần quan trọng trong mạng nơ-ron, được áp dụng sau mỗi nơ-ron để giới hạn giá trị đầu ra Nó quyết định xem nơ-ron có được kích hoạt hay không, ảnh hưởng đến khả năng xử lý thông tin của mạng.

Mạng neuron được huấn luyện bằng cách cung cấp dữ liệu đầu vào cùng với giá trị đầu ra mong muốn để điều chỉnh trọng số và bias Quá trình này sử dụng các thuật toán tối ưu hóa, chẳng hạn như Gradient Descent và các biến thể của nó, nhằm cải thiện hiệu suất của mạng.

Học có giám sát và học không giám sát là hai phương pháp chính trong đào tạo mạng nơ ron Trong học có giám sát, mạng nơ ron được huấn luyện trên dữ liệu có nhãn nhằm tối ưu hóa hàm mất mát Ngược lại, học không giám sát sử dụng mạng nơ ron để khám phá cấu trúc hoặc biểu diễn dữ liệu mà không cần đến nhãn.

Mạng nơ ron đa lớp và mạng nơ ron sâu bao gồm nhiều lớp ẩn, giúp mô hình học hỏi và nhận diện các mối quan hệ phức tạp trong dữ liệu một cách hiệu quả.

2.1.1 Các phương pháp tối ưu hàm mất mát

Gradient descent là thuật toán tối ưu hóa nhằm tìm cực tiểu hoặc cực đại của một hàm số Phương pháp này điều chỉnh các tham số của mô hình máy học thông qua các đạo hàm riêng Ý tưởng chính là di chuyển dọc theo đường dốc của hàm số để xác định điểm cực tiểu hoặc cực đại, bắt đầu từ một vị trí bất kỳ và cập nhật vị trí dựa trên đạo hàm tại điểm đó.

Thuật toán này cho phép di chuyển ngược lại với độ dốc của hàm số, giúp tiến gần hơn đến điểm cực tiểu.

Để tối ưu hóa hàm số một biến 𝑓𝑓 ∶ ℝ → ℝ, chúng ta cần áp dụng một thuật toán nhằm đưa điểm 𝑥𝑥 𝑡𝑡, được tìm thấy sau vòng lặp thứ t, tiến gần hơn đến điểm cực tiểu địa phương 𝑥𝑥 ∗ Mục tiêu là cải thiện độ chính xác của điểm 𝑥𝑥 𝑡𝑡 qua từng vòng lặp, giúp đạt được giá trị tối ưu của hàm số.

Ta có các quan sát như sau :

Nếu đạo hàm của hàm số tại 𝑥𝑥𝑡𝑡 là dương (𝑓𝑓 ′ (𝑥𝑥𝑡𝑡) > 0) thì 𝑥𝑥𝑡𝑡 nằm về bên phải so với

Để đạt được điểm tiếp theo \( x_{t+1} \) gần với \( x^* \) hơn, cần di chuyển \( x_t \) sang bên trái, tức là về phía âm Điều này có nghĩa là chúng ta cần điều chỉnh \( x_t \) theo hướng ngược lại với đạo hàm.

∆ là một đại lượng ngược dấu với đạo hàm 𝑓𝑓 ′ (𝑥𝑥 𝑡𝑡 )

𝑥𝑥 𝑡𝑡 càng xa 𝑥𝑥 ∗ về bên phải thì 𝑓𝑓 ′ (𝑥𝑥 𝑡𝑡 ) càng lớn (và ngược lại) Một cách tự nhiên nhất, ta chọn lượng di chuyển ∆ tỉ lệ thuận với −𝑓𝑓 ′ (𝑥𝑥 𝑡𝑡 )

Từ hai quan sát trên ta có công thức tổng quát như sau:

Trong đó 𝜂𝜂 là một đại lượng được gọi là tốc độ học (learning rate) Dấu trừ thể hiện việc 𝑥𝑥𝑡𝑡 cần đi ngược với đạo hàm 𝑓𝑓 ′ (𝑥𝑥𝑡𝑡)

2.1.1.2 Thuật toán Stochastic Gradient Descent

Thuật toán gradient descent còn có một biến thể khác là stochastic gradient descent

Các bước thực của thuật toán Stochastic Gradient Descent như sau:

- Bước 1: Khởi tạo giá trịban đầu của x, thường là ngẫu nhiên hoặc dựa trên kiến thức chuyên gia

Lặp lại các bước cho đến khi đạt được điều kiện dừng, chẳng hạn như số lần lặp tối đa hoặc sự hội tụ của giá trị hàm mục tiêu.

- Bước 3: Chọn một mẫu dữ liệu ngẫu nhiên từ tập dữ liệu huấn luyện, ký hiệu là (x i , y i ), với x i là vector đặc trưng và y i là nhãn tương ứng

Bước 4 trong quá trình tính toán là xác định gradient của hàm mục tiêu tại điểm dữ liệu cụ thể Gradient của hàm \( f(x) \) tại điểm \( x_i \) được ký hiệu là \( \nabla f(x_i) \) Đây là vector đạo hàm riêng của hàm \( f(x) \) theo từng tham số trong vector \( x \) Nếu vector \( x \) có \( n \) tham số, thì gradient \( \nabla f(x_i) \) sẽ là một vector có \( n \) chiều.

- Bước 5: Cập nhật x bằng công thức sau:

Tỷ lệ học (α) là một tham số quan trọng trong thuật toán học máy, quyết định kích thước bước cập nhật Thông thường, tỷ lệ học được chọn là một số dương nhỏ và có thể được điều chỉnh trong suốt quá trình huấn luyện.

(2) ∇ f x ( ) i là biểu diễn gradient của hàm mất mát (loss function) f x ( ) i theo các tham số x của mô hình

- Bước 6: Quay lại Bước 3 và tiếp tục lặp cho đến khi đạt được điều kiện dừng

Thuật toán Stochastic Gradient Descent (SGD) có tốc độ tính toán nhanh chóng vì chỉ tính gradient trên một điểm dữ liệu trong mỗi lần lặp Tuy nhiên, điều này cũng có thể dẫn đến sự không ổn định trong quá trình tối ưu hóa do độ biến động ngẫu nhiên của gradient Dù vậy, SGD vẫn được ưa chuộng trong việc huấn luyện các mô hình lớn và phức tạp, đặc biệt khi Batch Gradient Descent không khả thi do yêu cầu tính toán toàn bộ tập dữ liệu huấn luyện.

2.1.1.3 So sánh thuật toán Gradient Descent và Stochastic Gradient Descent

Bảng 2.1 Sự khác nhau giữa SGD và GD

Các k ỹ thu ậ t nh ậ n d ạ ng cây d ự a trên hình ả nh

2.2.1 Giới thiệu về phân loại thực vật học

Phân loại thực vật học là lĩnh vực khoa học nghiên cứu cách sắp xếp các loài thực vật thành nhóm dựa trên những đặc điểm chung Vai trò của phân loại thực vật học rất quan trọng trong việc nghiên cứu, bảo tồn và khai thác các nguồn tài nguyên thực vật.

Phân loại thực vật học là một lĩnh vực nghiên cứu chuyên sâu về việc phân nhóm các loài thực vật dựa trên những đặc điểm chung Hệ thống phân loại phổ biến nhất hiện nay là hệ thống Linnaean, được phát triển bởi nhà tự nhiên học Carl Linnaeus người Thụy Điển.

Hệ thống phân loại Linnaean phân loại thực vật dựa trên các đặc điểm hình thái và giải phẫu Các loài thực vật được nhóm lại theo những đặc điểm chung, tạo thành các bậc phân loại khác nhau.

Hệ thống phân loại Linnaean bao gồm 7 bậc phân loại, từ cao xuống thấp là: [65]

- Đại giới (domain): là bậc phân loại cao nhất, bao gồm tất cả các sinh vật sống

- Giới (kingdom): là bậc phân loại thứ hai, bao gồm các nhóm sinh vật có chung các đặc điểm cơ bản nhất

- Ngành (phylum): là bậc phân loại thứ ba, bao gồm các nhóm sinh vật có chung các đặc điểm về cấu trúc và chức năng.

- Lớp (class): là bậc phân loại thứtư, bao gồm các nhóm sinh vật có chung các đặc điểm về hình thái và sinh thái

- Bộ (order): là bậc phân loại thứnăm, bao gồm các nhóm sinh vật có chung các đặc điểm về hình thái và giải phẫu

- Họ (family): là bậc phân loại thứ sáu, bao gồm các nhóm sinh vật có chung các đặc điểm về hình thái, sinh thái và giải phẫu

- Chi (genus): là bậc phân loại thứ bảy, bao gồm các nhóm sinh vật có chung các đặc điểm về hình thái, sinh thái, giải phẫu và sinh lý

Loài (species) là bậc phân loại cuối cùng trong hệ thống phân loại sinh vật, bao gồm các nhóm sinh vật có chung các đặc điểm về hình thái, sinh thái, giải phẫu, sinh lý và di truyền.

Tên khoa học của thực vật bao gồm hai phần: tên chi, viết hoa chữ cái đầu tiên, và tên loài, viết thường.

Ví dụ, tên khoa học của cây chuối là Musa paradisiaca Tên chi là Musa và tên loài là paradisiaca

Hệ thống phân loại Linnaean, mặc dù đã trải qua nhiều lần sửa đổi kể từ khi ra đời, vẫn giữ vị trí là hệ thống phân loại phổ biến nhất cho các sinh vật sống hiện nay.

Bảng 2.4 Hệ thống phân loại Linnaean cho loài Bách xanh

Bậc phân loại Thông tin

Loài Calocedrus macrolepis (thường gọi

Hình 2.1 Phân cấp của các loài trong thực vật

2.2.2 Giới thiệu các bộ phận của cây

Trong việc nhận dạng cây tự động, các bộ phận của cây được sắp xếp theo mức độ sử dụng, trong đó lá là bộ phận phổ biến nhất Lá thường tồn tại quanh năm, có số lượng lớn và dễ thu thập, đồng thời có cấu trúc phẳng Một nghiên cứu tổng quan đã chỉ ra rằng trong số 120 bài báo về nhận dạng cây, có đến 107 nghiên cứu tập trung vào bộ phận lá, trong khi chỉ có 15 nghiên cứu xem xét các bộ phận khác như hoa, quả và toàn bộ cây Hầu hết các nghiên cứu sử dụng lá trên nền đơn giản (leafscan), với chỉ 12 nghiên cứu sử dụng ảnh lá trên nền phức tạp Một số cơ sở dữ liệu ảnh lá nền đơn giản như Flavia, ICL và Swedish đã cho thấy rằng lá nền đơn giản thường mang lại kết quả tốt nhất so với các bộ phận khác.

Có hai loại lá chính là lá đơn và lá kép, như được minh họa trong Hình 2.4 Tuy nhiên, việc sử dụng lá để nhận diện cây gặp một số thách thức, bởi vì lá của cùng một loài cây có thể khác nhau đáng kể do ảnh hưởng của điều kiện thời tiết và từng giai đoạn sinh trưởng.

Hình 2.2 trình bày một số loại lá tiêu biểu: a, b) lá đơn giản và phức tạp của loài Acer pseudoplatanus L; c) lá đơn của loài Cercis siliquastrum L; d) lá kép của loài Sorbus aucuparia.

Hoa: bộ phận thường dùng tiếp theo sau lá là hoa vì khảnăng phân biệt loài cao

Hoa có tính bền vững và ít bị ảnh hưởng bởi thời tiết, với hai loại chính là hoa đơn và cụm hoa Theo các nhà thực vật học, ảnh hoa là nguồn đáng tin cậy để nhận dạng cây, với kết quả nhận dạng tốt hơn so với các bộ phận khác trong điều kiện nền phức tạp Từ ảnh hoa, có thể trích xuất nhiều đặc tính như màu sắc, tính đối xứng, số cánh hoa và kích thước Tuy nhiên, việc làm việc với hoa gặp một số thách thức, như thời gian tồn tại ngắn của hoa và sự biến đổi về màu sắc, hình dạng 3D giữa các cây cùng loài.

Hình 2.3 Miêu tả một số kiểu cụm hoa (cấu trúc của hoa trên cây, cách chúng kết nối với nhau và trên cây) [10].

Ngoài lá và hoa, các bộ phận như quả, thân, cành và ảnh toàn bộ cây cũng đóng vai trò quan trọng trong việc nhận dạng cây, mặc dù nghiên cứu về chúng vẫn còn hạn chế do những thách thức liên quan Ảnh thân chủ yếu thể hiện đặc trưng kết cấu và có sự khác biệt rõ rệt ở các độ tuổi khác nhau, điều này tạo ra khó khăn trong việc nhận dạng chỉ dựa vào thân cây Các ảnh cành thường có sự kết hợp với nhiều bộ phận khác như lá và hoa, trong khi ảnh toàn bộ cây thường được chụp từ xa, làm tăng độ phức tạp trong việc nhận diện.

Hình 2.4 Sự đa dạng của thân ở các giai đoạn sinh trưởng khác nhau của loài Crataegus monogyna Jacq

Hình 2.5 Một vài ví dụ của ảnh cành

Hình 2.6 Ảnh toàn bộ của loài Acer pseudoplatanus L

Kết luận, lá và hoa là hai bộ phận chủ yếu được sử dụng trong việc nhận dạng cây qua hình ảnh Ngoài lá và hoa, các bộ phận khác như thân, cành và toàn bộ cây cũng đóng vai trò quan trọng trong quá trình này Tuy nhiên, việc sử dụng một bộ phận cụ thể để nhận diện cây là rất phổ biến.

Để nhận dạng cây, phương pháp truyền thống thường gặp hạn chế, do đó hiện nay, người ta thường kết hợp các bộ phận khác nhau như lá và hoa nhằm nâng cao hiệu quả trong việc nhận diện cây.

2.2.1 Mô hình tổng quát nhận dạng cây dựa trên hình ảnh

Nhiều phương pháp nhận dạng cây từ hình ảnh đã được đề xuất, tất cả đều tuân theo mô hình chung như mô tả trong hình 2.7 Quá trình nhận dạng cây bao gồm ba bước chính: tiền xử lý, trích chọn đặc trưng và phân lớp/dự đoán.

Nhận dạng cây dựa trên hình ảnh bắt đầu với việc sử dụng ảnh của các bộ phận cây làm đầu vào Quá trình tiền xử lý ảnh nhằm nâng cao chất lượng ảnh, giúp thu được các đặc trưng tốt cho các bước tiếp theo Đây là bước quan trọng trong hệ thống nhận dạng cây vì nó tăng xác suất đạt được kết quả đầu ra mong muốn Các nhiệm vụ trong bước này thường bao gồm nâng cao chất lượng ảnh, chuẩn hóa ảnh và phân đoạn ảnh.

K ế t lu ận chương

Trong chương này, tác giả trình bày khái quát về mạng nơ ron nhân tạo, bao gồm định nghĩa, đặc điểm, kiến trúc và phương pháp huấn luyện Tác giả giới thiệu về perceptrons, các phương pháp tối ưu hàm mất mát và hàm kích hoạt Ngoài ra, chương còn đề cập đến các kỹ thuật nhận dạng cây dựa trên hình ảnh, mô hình tổng quát nhận dạng cây, kỹ thuật tiền xử lý ảnh và các lựa chọn đặc trưng.

PHƯƠNG PHÁP NHẬ N D Ạ NG CÂY CHO PHÉP KHAI THÁC ĐỒ NG TH Ờ I THÔNG TIN V Ề CHI VÀ LOÀI

Gi ớ i thi ệ u chung

Trong bài viết này, tác giả sẽ phân tích và trình bày phương pháp nhận dạng cây thông qua việc kết hợp các kỹ thuật hiện đại trong công nghệ thông tin và sinh học Nội dung sẽ bao gồm các kiến thức cơ bản về các hàm mất mát phổ biến, đồng thời giới thiệu một hàm mất mát mới do tác giả đề xuất.

3.1.1 Một số kiến thức cơ sở

Mất mát softmax phân cấp (HSL) tổ chức lớp đầu ra của mạng nơ ron theo cấu trúc phân cấp, tương thích với hệ thống nhãn Thay vì xử lý các lớp đầu ra một cách độc lập, HSL sắp xếp chúng theo dạng cây, với mỗi nút đại diện cho một danh mục cụ thể Trong cấu hình này, lớp kết nối đầy đủ (FC) tuân theo kiểu “Thêm nút gốc”, kết hợp tất cả các nút gốc trong cấu trúc phân cấp.

Hàm mất mát softmax phân cấp tổ chức lớp đầu ra của mạng nơ-ron theo cách phân cấp, giúp giảm độ phức tạp tính toán và tài nguyên khi thực hiện các tác vụ phân loại đa lớp với số lượng lớp lớn.

Cách tiếp cận phân cấp chia cây phân cấp thành các nhóm nhỏ hơn, giúp tối ưu hóa quá trình tính toán xác suất cho từng lớp Việc áp dụng hàm mất mát softmax phân cấp làm cho việc tính toán các xác suất trở nên hiệu quả hơn.

Phân cấp softmax giúp giảm số lượng lớp cần tính toán trong một tập hợp lớn, tối ưu hóa hiệu suất tính toán bằng cách không cần phải tính xác suất cho mỗi lớp riêng lẻ.

Phân cấp softmax giúp giảm thiểu vấn đề tài nguyên khi số lượng lớp lớn, bởi vì việc lưu trữ và tính toán các ma trận liên quan đến softmax trở nên tốn kém.

Cấu trúc phân cấp tự nhiên trong dữ liệu có thể được tận dụng để nâng cao hiệu suất học trong một số tác vụ Việc thích nghi với cấu trúc này giúp tối ưu hóa quá trình học tập và cải thiện kết quả.

Trong HSL, cây nhị phân nhiều lớp được áp dụng, trong đó xác suất của một nút được tính bằng cách nhân các xác suất từ gốc đến nút tương ứng Phương pháp từ trên xuống này đảm bảo rằng xác suất của nút cha ảnh hưởng trực tiếp đến xác suất của nút con, theo quy tắc tích Do đó, nếu dữ liệu có những đặc điểm chung gây khó khăn trong việc phân biệt các nhãn cấp cao nhất, thì hiệu suất của các nhãn cấp lá có thể bị ảnh hưởng bởi việc truyền xác suất.

Hãy xem xét một hệ thống phân cấp ví dụ cho một “chó” với các cấp độ sau: họ

“Canidae”, chi “Canis” và loài “C familiaris.” Trong bối cảnh này, chúng ta có thể tính xác suất tuyệt đối của nút “C familiaris.” như sau:

C familiaris C familiaris canis Canis canidae Canidae

Nghiên cứu đã chỉ ra rằng HSL được áp dụng như một hàm mất mát trong nhiều công trình nghiên cứu [62] Kỹ thuật này mang lại hiệu quả cao trong các hệ thống nhãn phân cấp lớn, nhờ vào khả năng cải thiện quy trình đào tạo và suy luận.

Hàm mất mát Taxonomic (TAX)

Trong nghiên cứu [63], các tác giả đã giới thiệu một hàm mất mát phân loại đặc biệt nhằm nhận diện thực vật Phương pháp này sử dụng lớp kết nối đầy đủ (FC) theo cấu trúc “Nhãn cấp độ lá” Hàm mất mát phân loại được áp dụng và đánh giá trên bộ dữ liệu PlantClef2015.

Để tính toán xác suất của chi và họ, các tác giả đã áp dụng phương pháp tổng hợp xác suất từ các nút con tương ứng Sau khi xác định được xác suất chi và xác suất họ, họ đã sử dụng hàm softmax riêng biệt ở ba cấp độ: loài, chi và họ Cuối cùng, hàm mất mát được tính toán là sự kết hợp của ba mất mát Entropy chéo, có thể được biểu diễn bằng một phương trình cụ thể.

Trong nghiên cứu này, các tác giả đã đánh giá hàm mất mát trên nhiều kiến trúc mạng khác nhau Kết quả cho thấy rằng hàm mất mát phân loại đề xuất đã cải thiện độ chính xác so với hàm mất mát entropy chéo thông thường, với mức tăng lần lượt là 2,23%, 1,34% và 1,08% ở cấp độ loài, chi và họ Những phát hiện này chứng minh hiệu quả của hàm mất mát mới trong việc nâng cao hiệu suất phân loại ở các cấp độ khác nhau.

3.1.2 Hàm mất mát phân cấp thích ứngđề xuất

Hàm mất mát phân cấp thích ứng (AHL) là một công cụ quan trọng trong việc huấn luyện mô hình với các nhãn đa cấu trúc AHL bao gồm ba hàm mất mát thành phần, giúp cải thiện hiệu suất của mô hình trong các tác vụ phân loại phức tạp.

- Hàm mất mát En-trô-py chéo của loài

- Hàm mất mát giữa nút cha mẹ và nút con

- Hàm mất mát anh chị em

Hình 3.1 Đề xuất mất mát phân cấp thích ứng để nhận dạng thực vật

Mất mát En-trô-py chéo của loài đầu tiên là một phương pháp mất mát trong học máy, tập trung vào các lớp lá của cây quyết định, như loài Nó đo lường sự khác biệt giữa xác suất dự đoán và nhãn thực của mỗi lớp lá một cách độc lập, khuyến khích phân loại chính xác ở cấp độ chi tiết nhất trong hệ thống phân cấp, đây cũng là mức mất mát quan trọng nhất.

Mất mát thứ hai, được gọi là mất mát cha-con, xem xét các mối quan hệ phân cấp giữa các lớp trong hệ thống Hàm này kết hợp các mất mát entropy chéo ở nhiều cấp độ, bao gồm họ, chi và loài Bằng cách tối ưu hóa đồng thời các dự đoán cho các nút cha và con, nó đảm bảo tính nhất quán và hợp lý trong cấu trúc phân cấp.

Mất mát cha-con L parent child − trong AHL có thểđược biểu thị bằng công thức sau:

1 2 3 3.3 parent child species Genus Family

Mô hình cơ sở d ự a trên m ạ ng ResNet-50

Phương pháp trích chọn đặc trưng sử dụng mạng resnet cụ thể mạng restnet50

Mạng ResNet-50 là một kiến trúc mạng nơ-ron sâu (deep neural network architecture) thuộc họ ResNet (Residual Network) [61]

ResNet-50 được phát triển nhằm khắc phục vấn đề mất thông tin (vanishing gradient) trong các mạng nơ-ron sâu Mạng ResNet áp dụng khái niệm dư, giúp cải thiện khả năng học tập của mạng, cho phép nó nắm bắt các biểu diễn phức tạp một cách hiệu quả.

The ResNet-50 architecture consists of 50 convolutional layers, incorporating convolution, batch normalization, and activation layers, culminating in a fully connected layer for image classification This network employs basic blocks and bottleneck blocks to form its structural design.

Hình 3.2 Kiến trúc mạng ResNet-50 [61]

Kiến trúc chi tiết của ResNet-50 là như sau :

- Đầu vào: Hình ảnh có kích thước cốđịnh (thường là 224x224x3)

(1) Convolution với 64 bộ lọc kích thước 7x7, bước nhảy (stride) là 2

(4) Max Pooling với kích thước cửa sổ3x3 và bước nhảy là 2

- Convolutional Block 2: Cấu trúc của các building blocks lặp lại 3 lần:

(1) Convolution với 64 bộ lọc kích thước 1x1

(9) Đối với khối đầu tiên của block 2, độ dày của bộ lọc đầu tiên là 64, nhưng từ khối thứ hai trởđi, độ dày của bộ lọc đầu tiên là 256

- Convolutional Block 3: Cấu trúc của các building blocks lặp lại 4 lần Mỗi block có cấu trúc giống như Convolutional Block 2.

Lớp fully connected trong mạng ResNet-50 có số lượng node tương ứng với số lớp đầu ra của bài toán phân loại Cụ thể, trong ResNet-50 gốc, lớp này có 1000 node, phù hợp với 1000 lớp đối tượng mà hệ thống có khả năng phân loại.

(1) Được sử dụng để tính xác suất của các lớp đối tượng và chọn lớp đối tượng có xác suất cao nhất

Các layer từ khi bắt đầu kết nối đến khi quá trình kết thúc được gọi là một khối phần dư Khối phần dư bao gồm hai phần chính: phần đầu tiên là đường kết nối ngắt và phần thứ hai là các lớp tích chập.

Hình 3.4 Quá trình kết nối tắt [61]

- Quá trình kết nối tắt: Truyền thông tin ban đầu của đầu vào đến đầu ra của khối dư (residual block)

- Các khối phần dư là khối mang tính đặc trưng của Resnet vì khối này có một vài lợi ích như sau:

(1) Tránh m ất thông tin : Trong mạng nơ-ron sâu, việc xây dựng một mô hình với nhiều tầng có thể gặp phải vấn đề mất thông tin

Hiện tượng vanishing gradient hoặc mất kết nối có thể gây khó khăn cho quá trình học của mô hình Các quá trình kết nối giúp khắc phục vấn đề này bằng cách cho phép thông tin truyền trực tiếp từ lớp đầu vào đến lớp đầu ra thông qua các đường kết nối ngắn Điều này không chỉ giúp mô hình dễ dàng tiếp thu thông tin mới mà còn đảm bảo rằng các thông tin quan trọng không bị mất trong quá trình lan truyền ngược.

Hỗ trợ huấn luyện mạng sâu thông qua các kết nối tắt giúp cải thiện hiệu quả trong quá trình huấn luyện mạng nơ-ron Khi thông tin từ các lớp trước được truyền qua các đường kết nối ngắn, gradient của hàm mất mát có thể dễ dàng được truyền ngược trở lại để cập nhật trọng số Điều này không chỉ giảm thiểu quá trình lan truyền ngược mà còn tránh mất gradient, từ đó tăng tốc quá trình huấn luyện mạng.

Cải thiện khả năng học đại diện tại các tầng sâu là một yếu tố quan trọng trong việc tối ưu hóa mô hình Các kết nối tắt cho phép mô hình học các đặc trưng phức tạp hơn bằng cách truyền trực tiếp thông tin từ các tầng trước đó đến các tầng sau mà không bị biến đổi nhiều Nhờ vào các kết nối ngắn này, mạng nơ-ron có thể phát triển các biểu diễn sâu hơn và nâng cao khả năng mô hình hóa các đặc trưng phức tạp.

Giảm khối lượng tính toán trong quá trình huấn luyện là một lợi ích quan trọng của các kết nối tắt Thay vì tính toán toàn bộ các lớp từ đầu đến cuối, mạng chỉ cần tập trung vào các kết nối ngắn để cập nhật thông tin từ các lớp trước Điều này không chỉ tăng tốc độ huấn luyện mà còn giảm thiểu tài nguyên tính toán cần thiết.

Mạng ResNet-50 là một công cụ mạnh mẽ cho bài toán phân loại cây, cho phép khai thác thông tin về chi và loài một cách hiệu quả Việc sử dụng ResNet-50 giúp mô hình học được các đặc trưng chi tiết, từ đó nâng cao độ chính xác trong phân loại Đây là lý do chính để lựa chọn mạng ResNet-50 cho hệ thống phân loại cây, đảm bảo tính chính xác và hiệu quả cao.

Mạng ResNet-50 có khả năng học các đặc trưng chi tiết của hình ảnh nhờ vào các lớp tích chập và khối phần dư, cho phép nhận diện các đặc điểm nhỏ như hình dáng và cấu trúc của các phần tử trong hình ảnh cây Điều này góp phần nâng cao khả năng phân loại cây theo các chi khác nhau.

Mạng ResNet-50 với cấu trúc sâu và nhiều khối convolution cùng residual blocks cho phép xử lý thông tin đa tầng từ hình ảnh cây Mạng có khả năng tự động học các đặc trưng tổng thể như hình dáng cây, cũng như các chi tiết như lá, nhánh và hoa Nhờ đó, ResNet-50 cung cấp thông tin phong phú về các đặc điểm của cây, hỗ trợ hiệu quả trong việc phân loại cây theo loài.

Mạng ResNet-50 sử dụng đường nối tắt để truyền thông tin trực tiếp từ đầu vào đến đầu ra của các khối phần dư, giúp cải thiện hiệu quả truyền thông tin Việc này ngăn chặn hiện tượng mất mát thông tin và suy giảm chất lượng trong quá trình xử lý.

Các đường nối tắt trong mạng sâu giúp cải thiện hiệu suất bằng cách cho phép mạng tập trung vào việc học các đặc trưng quan trọng Điều này giúp truyền thông tin nhanh chóng, từ đó nâng cao khả năng phân loại cây dựa trên cả thông tin chi và loài.

ResNet-50 là một trong những mô hình mạng nơ-ron sâu hàng đầu trong nhận dạng hình ảnh, nổi bật với hiệu suất đáng kể Với kiến trúc sâu và khả năng học các đặc trưng chi tiết, ResNet-50 đạt độ chính xác cao trong phân loại cây.

Trong luận văn này, mạng RestNet-50 được huấn luyện lại từđầu dựa trên dữ liệu được trình bày ởchương tiếp theo.

Trong chương này, tác giả đã trình bày những kiến thức cơ bản về các hàm mất mát phân cấp, bao gồm hàm mất mát Taxonomic và các hàm mất mát phân cấp thích ứng Đồng thời, tác giả cũng giới thiệu mô hình cơ sở ResNet-50.

THỬ NGHI Ệ M

Cơ sở d ữ li ệ u

Cơ sở dữ liệu trong luận văn này được thu thập từ đề tài Khoa học và Công nghệ cấp Tỉnh của Sở Khoa học và Công nghệ Phú Thọ, mang tên "Nghiên cứu ứng dụng trí tuệ nhân tạo xây dựng phần mềm truy xuất thông tin và quản lý tài nguyên thực vật tại tỉnh Phú Thọ" (mã số 13/ĐT-KHCN.PT/2021), do Đại học Lâm nghiệp chủ trì và phối hợp với Đại học Bách Khoa Hà Nội (Vietforest) Cơ sở dữ liệu này bao gồm hơn 156 loài thực vật có giá trị tại tỉnh Phú Thọ, với thông tin lưu trữ chi tiết cho từng loài.

- Đặc điểm sinh học và sinh thái học

Bảng 4.1: Thông tin của loài “Chòi mòi núi”

Tên gọi Chòi mòi núi

Họ Họ ba mảnh vỏ

Tên khoa học Antidesma montanum Blume Đặc điểm hình thái Cây gỗ nhỏ thường xanh cao 7-10m

Thân nhẵn, cành cây khúc khuỷu Vỏ dày màu nâu xám, hay nâu đen nứt dọc, bong mủn Cành non có lông sau nhẵn

Lá đơn mọc cách, có lá kèm sớm rụng, hình trái xoan với đầu nhọn và đuôi tù, mép nguyên, dày và nhẵn, dài từ 6-11cm và rộng 2-5cm, có 7 đôi gân phụ và cuống dài 1-2cm Hoa đơn tính khác gốc, hoa tự đực bông đuôi sóc mọc cụm ở kẽ lá gần đầu cành, trong khi hoa tự cái ngắn hơn ở kẽ lá phía dưới Hoa có 4 cánh đài và không có cánh tràng; hoa đực có 4 nhị, còn hoa cái có bầu thượng với 2-3 ô, mỗi ô chứa 1 noãn Quả hạch hình bầu dục, kích thước 0,5cm x 0,4cm, khi chín có màu vàng đỏ.

34 Đặc điểm sinh học và sinh thái học Cây ưa sáng, ưa ẩm, ưa đất tốt, thường mọc trong các rừng nhiệt đới Hoa tháng 12-1, quả chín tháng 6-7

Phân bốđịa lý Phân bốở Trung Quốc, Việt Nam Loài gặp nhiều ở Miền Bắc, Miền Trung, trong đó có ở Trường Sơn, Quảng Bình, Phú Thọ

Công dụng, liều dùng Gỗ mền tương đương gỗ nhóm VI, sử dụng trong xây dựng và đóng đồ đạc thông thường, quảăn được

Ngoài ra để phục vụcho mô đun nhận dạng, với mỗi loài một bộ dữ liệu hình ảnh các bộ phận lá, hoa, thân, cành cũng được thu thập

Trong luận văn này, tôi sẽ tập trung vào việc phân loại cơ sở dữ liệu theo loài và chi, nhằm giải quyết bài toán phân loại cây, cho phép khai thác đồng thời thông tin về loài và chi.

Cơ sở dữ liệu theo loài hiện có 156 loài với tổng số khoảng 22,367 bức ảnh, bao gồm các loài như Bản xe, Bồ kết, và Cánh kiến Bộ dữ liệu này giới thiệu các loài thực vật địa phương, nhiều trong số đó có tầm quan trọng sinh thái đáng kể và được đưa vào danh sách bảo tồn Nó không chỉ hỗ trợ việc tìm hiểu môi trường sống địa phương mà còn cung cấp thông tin sinh học chi tiết về từng loài.

Hình 4.1 Phân bố loài trong CSDL

Cơ sử dữ liệu theo chi gồm 122 chi Trong cơ sở dữ liệu có những chi phổ biến như: Thông, Sưa, Xoài,

Hình 4.2 Phân bố chi trong CSDL

Hình 4.3 Phân bố số lượng ảnh thu thập cho từng loài

Dựa vào CSDL từ của Vietforest, có thểđưa ra một vài đặc điểm chi tiết như sau:

- Họ Vang có nhiều chi nhất (12 chi)

- Các họnhư Hà nu, Lộc vừng, Trầm hương,… có số chi là ít nhất (một chi duy nhất)

- Chi có nhiều loài nhất: Đa (5 loài)

- Chi có ít loài nhất: Xoan (một loài duy nhất)

- Số loài trung bình của mỗi chi: một loài

K ế t qu ả th ử nghi ệ m

Bảng 4.2 Kết quả so sánh hàm mất mát phân cấp với các hàm thành phần

Hàm mất mát Độđo chính xác

Bảng 4.2 đánh giá hiệu quả của từng thành phần trong hàm mất mát cho nhận dạng cây, cho thấy độ chính xác đạt gần 80% Thành phần mất mát 𝐿𝐿𝑠𝑠𝑖𝑖𝑠𝑠𝑠𝑠𝑖𝑖𝑠𝑠𝑠𝑠 không thể hiện hiệu quả rõ rệt Độ chính xác cao hơn so với hàm mất mát đề xuất là do khi loại bỏ một thành phần, mô hình tập trung vào hai thành phần còn lại, từ đó khai thác thông tin nhiều hơn mà không cần cân bằng độ chính xác cho ba thành phần họ, chi và loài AHL khai thác thông tin một cách chặt chẽ giữa họ, chi và loài, trong khi hai hàm mất mát thành phần có sự kết nối lỏng lẻo hơn.

Bảng 4.3 Kết quả công nhận bộ dữ liệu Vietforest

Hàm mất mát Độđo chính xác (%)

Bảng 4.3 thể hiện kết quả trên bộ dữ liệu VietForest Hệ thống đã đánh giá cụ thể

Mất mát Softmax phân cấp (HSL) khi áp dụng kiến trúc ResNet-50 trên bộ dữ liệu VietForest cho thấy độ chính xác đạt được chỉ là 27,12%, thấp hơn nhiều so với các hàm mất mát khác (78,43%) Đặc biệt, độ chính xác ở cấp độ chi và loài cũng giảm đáng kể Nguyên nhân có thể xuất phát từ cách tiếp cận nghiêm ngặt từ trên xuống của HSL, trong đó các dự đoán từ cấp cao hơn được truyền xuống cấp thấp hơn, dẫn đến độ chính xác kém ở các cấp độ phân cấp thấp hơn.

Trong các thử nghiệm đã thực hiện, hàm mất mát đề xuất cho thấy hiệu suất vượt trội so với các phương pháp khác, như được thể hiện qua các kết quả trong bảng.

Khi so sánh hàm mất mát được đề xuất với phương pháp tốt thứ hai, thường là mất mát TAX, mức cải thiện dao động từ 0,6% đến 1% Bên cạnh đó, so với mất mát en-tropy chéo phổ biến, hàm mất mát đề xuất đạt được mức tăng khoảng 1% đến 1,1%.

Hình 4.7 thể hiện kết quả nhận dạng ở thứ hạng 1 cho các loại Kết quả cho thấy nhiều loại có tỷ lệ nhận dạng tương đối cao Tuy nhiên, một số loại vẫn có kết quả nhận dạng thấp do số lượng ảnh huấn luyện còn hạn chế.

Hình 4.4 Top 1 độ chính xác mất mát phân cấp thích ứng

Hình 4.5 Top 5 độ chính xác mất mát phân cấp thích ứng

Hình 4.6 Top 10 độ chính xác mất phát phân cấp thích ứng

Hình 4.7: Độ chính xác thứ hạng 1 của các loài

Dưới đây là kết quả thử nghiệm với các ảnh đầu vào được lấy từ tập kiểm thử trong cơ sở dữ liệu đã được dán nhãn, bao gồm thông tin về chi, loài và thông tin chi, loài được dự đoán.

Bảng 4.4 Kết quả nhận dạng khi đưa ảnh truy vấn ứng với độ chính xác top 1 Ảnh đầu vào Thông tin chi loài trong groundtruth

Thông tin họ, chi và loài được dựđoán

Họ: Cà phê Chi: Gáo Tên thường gọi:

Họ: Cà phê Chi: Gáo Loài: Gáo

Họ: Thôi ba Chi: Thôi ba Tên thường gọi:

Họ: Thôi ba Chi: Thôi ba Loài: Thôi ba

Chi: Cánh kiến Tên thường gọi:

Cánh kiến Tên khoa học:

Mallotus philippinensis (Lam.) Muell - Arg

Họ: Ba mảnh vỏ Chi: Cánh kiến Loài: Cánh kiến

Chi: Gội gác Tên thường gọi:

Họ: Xoan Chi: Gội gác Loài: Gội gác

Họ: Máu chó Chi: Máu chó lá bé Tên thường gọi:

Họ: Máu chó Chi: Máu chó lá bé Loài: Máu chó lá bé

Họ: Dâu tằm Chi: Sui Tên thường gọi:

Họ: Dâu tằm Chi: Sui Loài: Sui

Họ: Du Chi: Hu đay Tên thường gọi:

Hu đay Tên khoa học:

Họ : Du Chi: Hu đay Loài: Hu đay

Họ: Tếch Chi: Tử châu Tên thường gọi:

Họ: Tếch Chi: Tử châu Loài: Tu hú lá to

Chi: Tếch Tên thường gọi:

Họ: Tếch Chi: Tếch Loài: Tếch

Chi: Lộc vừng Tên thường gọi:

Lộc vừng hoa đỏ Tên khoa học:

Họ: Lộc vừng Chi: Lộc vừng Loài: Lộc vừng hoa đỏ

Tích h ợ p h ệ th ố ng nh ậ n d ạ ng cây trên thi ế t b ị di độ ng

4.3.1 Tổng quan chung về hệ thống

Hệ thống phần mềm được phát triển bởi nhóm nghiên cứu tại Đại học Bách Khoa

Hà Nội trong khuôn khổ của đề tài Khoa học và Công nghệ cấp Tình của Sở Khoa

Đề tài "Nghiên cứu ứng dụng trí tuệ nhân tạo xây dựng phần mềm truy xuất thông tin và quản lý tài nguyên thực vật tại tỉnh Phú Thọ" với mã số 13/ĐT-KHCN.PT/2021 được thực hiện bởi Đại học Lâm nghiệp và Đại học Bách Khoa Mục tiêu của nghiên cứu là phát triển phần mềm hỗ trợ việc quản lý và truy xuất thông tin về tài nguyên thực vật, nhằm nâng cao hiệu quả sử dụng và bảo tồn nguồn tài nguyên thiên nhiên tại Phú Thọ.

Hà Nội phối hợp thực hiện

Phân tích chức năng của từng nhóm đối tượng trong hệ thống:

Người dùng thường (NG) là những cá nhân sử dụng phần mềm để tìm kiếm thông tin về các loại cây, bao gồm đặc điểm hình thái và sinh học Ngoài ra, họ có khả năng đăng tải ảnh lên trang web, góp phần làm phong phú thêm hình ảnh trong cơ sở dữ liệu thông qua những quan sát của mình.

Quản trị hệ thống (QTHT) là người có quyền cao nhất trên trang web, chịu trách nhiệm quản lý thông tin người dùng như thêm, sửa, xóa và tìm kiếm QTHT cũng phân quyền cho các đối tượng khác, đảm bảo mỗi người dùng có quyền hạn riêng khi truy cập phần mềm Bên cạnh đó, QTHT kiểm soát thông tin về các thành phố và vườn quốc gia, thực hiện thống kê và xuất báo cáo lịch sử tìm kiếm.

Trong bài báo cáo này, tôi sẽ tập trung vào công việc và phân tích các chức năng chính liên quan đến đối tượng NG, vì ứng dụng di động này chủ yếu phục vụ cho nhóm đối tượng đó.

Bảng 4.5 Bảng mô tả yêu cầu

TT Mô tả yêu cầu

1 ND đăng ký vào hệ thống

2 ND đăng nhập vào hệ thống

3 ND thay đổi mật khẩu của tài khoản

4 ND xem các loài từcơ sử dữ liệu

5 ND xem chi tiết loài từcơ sở dữ liệu

6 ND xem danh sách các quan sát của loài

7 ND thêm yêu cầu tìm kiếm

8 ND xóa yêu cầu tìm kiếm

9 ND thống kê các yêu cầu tìm kiếm

10 ND thêm một quan sát mới

11 ND nhận diện loài qua thư viện

12 ND nhận diện loài qua máy ảnh từ ứng dụng

Thống kê các chức năng của phần mềm Trong đó ND viết tắt cho “Người dùng”

Ngoài ra, phần mềm phải đáp ứng những yêu cầu phi chức năng sau:

- Giao diện dễ sử dụng

- Hoạt động ổn định, lưu trữ lâu dài

- Thời gian nhận dạng nhanh, độ chính xác cao

- Dễ dàng bảo trì, nâng cấp phần mềm

Có thẻ chạy đa nền tảng di động như Android hay IOS.

Tổng quan tính năng của hệ thống được tóm tắt bằng hình bên dưới

Hình 4.8 Tổng quan tính năng của hệ thống

Cấu trúc cơ sở dữ liệu của phần mềm được mô tả bằng hình bên dưới

Hình 4.9 Thiết kế cơ dữ liệu

Thông tin chi tiết về các trường dữ liệu và các thực thể trong thiết kế cơ sở dữ liệu được trình bày trong bảng dưới đây.

Bảng 4.6 Thông tin chi tiết các trường dữ liệu

ID Thực thể và các thuộc tính Mô tả

The data frame includes essential fields such as observation ID, description, latitude, longitude, altitude, GPS accuracy, national forest ID, owner ID, and species ID Each observation is uniquely identified by its ID, providing detailed descriptions along with geographical coordinates The latitude and longitude fields specify the exact location, while altitude and GPS accuracy ensure precise positioning Additionally, the national forest ID and owner ID link the observations to specific forests and their respective owners, along with the species ID identifying the relevant species.

The article discusses the attributes associated with tree observation images, including the image ID, description, tree part ID, reviewer comments, observation frame ID, upload date, last modified date, and status.

3 Treepart Bộ phận của cây id Mã bộ phận của cây name Tên bộ phận của cây description Mô tả bộ phận

Bài viết này đề cập đến các thông tin quan trọng của người dùng, bao gồm mã người dùng (user id), tên người dùng (username), địa chỉ email (email), mật khẩu (password), số điện thoại (phone_number) và nhóm đối tượng (group) mà người dùng thuộc về Những dữ liệu này là cần thiết để quản lý và phân loại người dùng một cách hiệu quả.

44 bio Tiểu sử của người dùng

5 SearchLog Lịch sử tìm kiếm id Mã lịch sử tìm kiếm date Ngày tìm kiếm user_id Mã của người tìm kiếm query Nội dung tìm kiếm

Discover six remarkable national forests, each with unique identifiers and names, showcasing their distinct features and ecological significance These forests are located in various provinces, highlighting their expansive areas and rich biodiversity Established in different years, each forest contributes to the preservation of nature and offers insights into the age and growth of its trees.

Bài viết này đề cập đến 7 tỉnh thành, bao gồm mã tỉnh thành, mã code tương ứng và loại khu vực mà tỉnh thành đó thuộc về Mỗi tỉnh thành được mô tả chi tiết với tên gọi và mã số riêng, giúp người đọc hiểu rõ hơn về đặc điểm và phân loại của từng tỉnh thành.

Bài viết này đề cập đến 8 loài cây, bao gồm mã của loài, tên loài, mô tả, tên khoa học, mã của chi, tình trạng bảo vệ theo IUCN, dạng sống, sự có mặt trong sách đỏ, và công dụng cũng như tên của bộ Các thông tin này giúp người đọc hiểu rõ hơn về từng loài cây và tầm quan trọng của chúng trong hệ sinh thái.

9 Genus Chi id Mã của chi name Tên của chi

45 description Mô tả family_id Mã của họ scientific_name Tên khoa học

10 Family Họ id Mã của họ name Tên của họ description Mô tả order_id Mã của bộ scientific_name Tên

11 Order Bộ id Mã của bộ name Tên của bộ description Mô tả scientific_name Tên khoa học

12 MLModel Mô hình nhận dạng id Mã của mô hình name Tên của mô hình description Mô tả mô hình activated Mô hình còn hoạt động hay không

Danh sách các API sử dụng trong phần mềm được liệt kê và mô tả trong bảng bên dưới:

Bảng 4.7 Danh sách API của hệ thống

Tên api: http://{api}/ cms/user/token Ý nghĩa: đăng nhập vào hệ thống với tài khoản Method: POST

Input: id (string): id của loài cần lấy thông tin chi tiết Output: token (string): chuỗi để sử dụng với các api khác email (string): email người dùng

Tên api: http://{api}/api/settings Ý nghĩa: lấy ra danh sách các loài từtrong cơ sở dữ liệu Method: GET

Input: Null Output: species (json object): thông tin các loài

Tên: http://{api}/api/species?id Ý nghĩa: lấy ra thông tin chi tiết của loài Method: GET

To retrieve detailed information about a species, you need to provide the species' ID (string) The output will include the species' ID (string), the order name (string), the family name (string), the genus name (string), and a description of the species (string).

Tên: http://{api}/cms/user/register Ý nghĩa: đăng ký để truy cập hệ thống Method: POST

Input: email (string): email người dùng đểđăng ký password (string): mật khẩu

Output: token (string): chuỗi để sử dụng với các api khác email (string): email người dùng

Tên: http://{api}/api/search?query Ý nghĩa: tìm kiếm loài Method: GET

Input: query (string): tên của loài cần tìm kiếm Output: id (string): id của loài cần lấy thông tin chi tiết order_name (string): bộ của loài

47 family_name (string): họ của loài genus_name (string): chi của loài description (string): mô tả về loài

4.3.2 Một số kết quả thử nghiệm trên hệ thống

Tại màn hình danh sách các loài, người dùng ấn vào loài cần xem thông tin chi tiết

Hệ thống sẽ chuyển người dùng đến trang thông tin chi tiết về loài, nơi họ có thể xem các thông tin liên quan và quan sát những tải lên mới nhất về loài đó.

Hình 4.10 Tính năng xem thông tin chi tiết và các quan sát tải lên

Phương pháp nhận dạng đề xuất trong chương 3 đã được tích hợp vào hệ thống, cho phép người dùng tải lên một bức ảnh và nhận thông tin chi tiết về cây được nhận dạng.

Hình 4.11 Một số kết quả nhận dạng với các ảnh đầu vào khác nhau

Trong chương thử nghiệm, tác giả đã trình bày cơ sở dữ liệu phân loại theo chi và loài, từ đó đánh giá kết quả thử nghiệm trên toàn bộ cơ sở dữ liệu Cuối cùng, hệ thống nhận dạng cây đã được tích hợp trên thiết bị di động Kết quả thử nghiệm cho thấy phương pháp đề xuất cải thiện độ chính xác nhận dạng, tuy nhiên, độ chính xác này phụ thuộc nhiều vào chất lượng và bộ phận của cây trong ảnh đầu vào.

Nhận dạng cây có tiềm năng ứng dụng rộng rãi trong các lĩnh vực như lâm nghiệp, nông nghiệp, bảo tồn thiên nhiên và nghiên cứu khoa học Gần đây, sự phát triển của trí tuệ nhân tạo và máy học đã làm cho nhận dạng cây dựa trên hình ảnh trở thành một trong những phương pháp phổ biến nhất.

Luận văn này trình bày nghiên cứu và phát triển hệ thống nhận dạng cây qua hình ảnh trên thiết bị di động, sử dụng mạng nơ-ron tích chập (CNN) Hệ thống được xây dựng dựa trên bộ dữ liệu hình ảnh cây thu thập từ thực tế.

Hệ thống thử nghiệm cho thấy độ chính xác trong việc nhận dạng các loại cây phổ biến ở Việt Nam đạt 82.02% cho họ, 80.26% cho chi và 78.43% cho loại.

Hệ thống nhận dạng cây được nghiên cứu trong luận văn có thểđược áp dụng trong nhiều lĩnh vực khác nhau, chẳng hạn như:

- Hỗ trợ công tác quản lý rừng và bảo tồn thiên nhiên

- Giúp người người sử dụng dễ dàng tiếp cận với các thông tin về loài cây phổ biến ở Việt Nam

- Hệ thống có thểđược sử dụng để hỗ trợ người dùng trong việc tìm hiểu về các loài cây, địa danh thiên nhiên,

Hệ thống nhận dạng cây được nghiên cứu trong luận văn này mang lại nhiều ưu điểm, bao gồm độ chính xác cao, khả năng hoạt động trên thiết bị di động và ứng dụng rộng rãi Những đặc điểm này có thể thúc đẩy sự phát triển của lĩnh vực nhận dạng cây dựa trên hình ảnh.

Mặc dù đã nỗ lực học hỏi và tra cứu tài liệu, nhưng do hạn chế về thời gian, năng lực và kinh nghiệm, vẫn tồn tại những vấn đề cần khắc phục.

- Một số chức năng cần được bổ sung thêm vào hệ thống chưa hoàn thiện

- Công cụ nhận dạng cây chưa được tối ưu hóa, đưa ra kết quảkhông đúng với yêu cầu của người dùng Định hướng phát triển

Sau khi hoàn thành luận văn, tác giả tiếp tục nghiên cứ và đưa ra một vài định hướng phát triển của đề tài:

Để nâng cao độ chính xác của hệ thống, chất lượng hình ảnh đầu vào là yếu tố quyết định Do đó, việc nghiên cứu các phương pháp xử lý ảnh tiên tiến nhằm cải thiện chất lượng hình ảnh là cần thiết Bên cạnh đó, cần phát triển các phương pháp trích xuất đặc trưng mới và hiệu quả hơn để tối ưu hóa độ chính xác của hệ thống.

Để nâng cao khả năng nhận dạng của hệ thống, hiện tại chỉ có thể nhận diện 156 loài cây phổ biến ở Việt Nam Cần tiến hành nghiên cứu các phương pháp nhằm mở rộng khả năng nhận diện này, giúp hệ thống có thể nhận dạng nhiều loài cây hơn.

Để nâng cao khả năng nhận diện các loài cây, cần thu thập thêm dữ liệu hình ảnh từ nhiều loài khác nhau Đồng thời, nghiên cứu và phát triển các phương pháp trích xuất đặc trưng mới sẽ giúp nhận dạng hiệu quả hơn các loài cây có đặc điểm tương tự.

Hệ thống nhận dạng cây dựa trên hình ảnh trên thiết bị di động sẽ ngày càng được ứng dụng rộng rãi, giúp nâng cao hiệu quả hoạt động của con người trong nhiều lĩnh vực.

[1] Go¨eau H., Bonnet P., and Joly A (September 2015) Lifeclef plant identification task 2015 In CEUR-WS, editor, CLEF: Conference and Labs of the Evaluation forum, volume 1391 of CLEF2015 Working notes Toulouse, France.

[2] Go¨eau H., Bonnet P., and Joly A (2016) Plant identification in an open-world

(lifeclef 2016) CLEF working notes, 2016: pp 428-439.

[3] Go¨eau H., Bonnet P., and Joly A (2017) Plant identification based on noisy web data: the amazing performance of deep learning (lifeclef 2017) CLEF working notes,

[4] Go¨eau H., Bonnet P., and Joly A (2018) Overview of expertlifeclef 2018: how far automated identification systems are from the best experts CLEF working notes.

[5] Bonnet P., Joly A., Go¨eau H., Champ J., Vignau C., Molino J.F., Barthélémy D., and Boujemaa N (2016) Plant identification: man vs machine Multimedia Tools and

[6] Kumar N., Belhumeur P.N., Biswas A., Jacobs D.W., Kress W.J., Lopez I.C., and Soares J.V (2012) Leafsnap: A computer vision system for automatic plant species identification In Computer Vision{ECCV 2012, pp 502-516 Springer.

Phyu K.H., Kutics A., and Nakagawa A (2012) presented a self-adaptive feature extraction scheme aimed at enhancing mobile image retrieval specifically for flowers This research was showcased at the Eighth International Conference on Signal Image Technology and Internet Based Systems (SITIS), highlighting advancements in image processing techniques The findings, detailed in pages 366-373, contribute significantly to the field of mobile image retrieval, offering innovative solutions for efficient flower identification.

[8] Govaerts R (2001) How many species of seed plants are there? Taxon, 50(4):pp. 1085-1090.

[9] W¨aldchen J and M¨ader P (2018) Plant species identification using computer vision techniques: A systematic literature review Archives of Computational Methods in Engineering, 25(2):pp 507-543.

[10] Goëau H., Bonnet P., Joly A., Bakic V., Barthélémy D., Boujemaa N., and Molino J.F (2013) The imageclef 2013 plant identification task In CLEF: Conference and Labs of the Evaluation forum.

[11] https://www.imageclef.org/2013/plant

[12] Le T.L and Pham N.H (2013) Mica at imageclef 2013 plant identification task

[13] Pham N.H., Le T.L., Grard P., and Nguyen V.N (2013) Computer aided plant identification system In Computing, Management and Telecommunications

(ComManTel), 2013 International Conference on, pp 134-139.

[14] http://idao.cirad.fr/(retrievel 17/january/2017).

Nguyen Q.K., Le T.L., and Pham N.H (2013) developed a leaf-based plant identification system for Android, utilizing SURF features alongside a bag of words model and supervised learning techniques Their research was presented at the 2013 International Conference on Advanced Technologies for Communications (ATC 2013), highlighting advancements in automated plant recognition technology.

[16] Zhang Y and Wu L (2012) Classification of fruits using computer vision and a multiclass support vector machine Sensors, 12(9): pp 12489-12505.

[19] Goëau H., Bonnet P., Joly A., Boujemaa N., Barthélémy D., Molino J.F.,

Birnbaum P., Mouysset E., and Picard M (2011) The imageclef 2011 plant images classification task In ImageCLEF 2011, pp 1{19.

[20] Goëau H., Bonnet P., Joly A., Yahiaoui I., Barthélémy D., Boujemaa N., and

Molino J.F (2012) The imageclef 2012 plant identification task In ImageCLEF 2012.

[21] Yanikoglu B., Aptoula E., and Tirkaz C (2014) Automatic plant identification from photographs Machine vision and applications, 25(6): pp 1369-1383.

[22] Wang X.F., Huang D.S., Du J.X., Xu H., and Heutte L (2008) Classification of plant leaf images with complicated background Applied mathematics and computation,

[23] Hong A.x., Chen G., Li J.l., Chi Z.r., and Zhang D (2004) A flower image retrieval method based on roi feature Journal of Zhejiang University Science, 5(7):pp

[25] Cerutti G., Antoine V., Tougne L., Mille J., Valet L., Coquin D., and Vacavant

A (2012) Reves participation-tree species classification using random forests and botanical features In Conference and Labs of the Evaluation Forum (CLEF).

[26] Cerutti G., Tougne L., Mille J., Vacavant A., and Coquin D (2013) A modelbased approach for compound leaves understanding and identification In 2013 IEEE

International Conference on Image Processing, pp 1471-1475.

[27] Rzanny M., Seeland M., W¨aldchen J., and M¨ader P (2017) Acquiring and preprocessing leaf images for automated plant identification: understanding the tradeoff between effort and information gain Plant Methods, 13(1): pp 1-11.

[28] Nilsback M.E and Zisserman A (2009) An automatic visual flora-segmentation and classification of flower images Ph.D thesis, Oxford University.

Huan N.V and Tao N.V (2015) presented a technique for searching medicinal plants that focuses on content-based detection, management, and exploitation This research was featured in the Proceedings of the 2015 National Conference on Electronics, Communications, and Information Technology (ECIT 2015), highlighting innovative methods for enhancing the accessibility and utilization of medicinal plant resources.

[30] Chen Q., Abedini M., Garnavi R., and Liang X (2014) Ibm research australia at lifeclef2014: Plant identification task In CLEF (Working Notes), pp 693-704.

[31] Wang Z., Sun X., Zhang Y., Ying Z., and Ma Y (2016) Leaf recognition based on pcnn Neural Computing and Applications, 27(4): pp 899-908

[32] Mouine S., Yahiaoui I., and Verroust-Blondet A (2013) Combining leaf salient points and leaf contour descriptions for plant species recognition In International Conference Image Analysis and Recognition, pp 205-214.

[33] Rodrigo R., Samarawickrame K., and Mindya S (2013) An intelligent flower analyzing system for medicinal plants In WSCG 2013 Conference on Computer

Graphics, Visualization and Computer Vision, pp 41{44 V´aclav Skala-UNION

[34] Angelova A., Zhu S., Lin Y., Wong J., and Shpecht C (2012) Development and deployment of a large-scale flower recognition mobile app NEC Labs America

[35] Aakif A and Khan M.F (2015) Automatic classification of plants based on their leaves Biosystems Engineering, 139: pp 66-75.

[36] Du J.X., Wang X.F., and Zhang G.J (2007) Leaf shape based plant species recognition Applied mathematics and computation, 185(2): pp 883-893.

[37] Du J.X., Shao M.W., Zhai C.M., Wang J., Tang Y., and Chen C.L.P (2016).

Recognition of leaf image set based on manifold-manifold distance Neurocomputing,

[38] Hu R., Jia W., Ling H., and Huang D (2012) Multiscale distance matrix for fast plant leaf recognition IEEE transactions on image processing, 21(11):pp.

[39] Lee K.B and Hong K.S (2013) An implementation of leaf recognition system using leaf vein and shape International Journal of Bio-Science and Bio-Technology,

[40] Bo L., Ren X., and Fox D (2010) Kernel descriptors for visual recognition In

Advances in neural information processing systems, pp 244-252.

[41] Le T.L., Tran D.T., and Pham N.H (2014) Kernel descriptor based plant leaf identification In Image Processing Theory, Tools and Applications (IPTA), 2014 4th International Conference on, pp 1-5.

[42] Krizhevsky A., Sutskever I., and Hinton G.E (2012) Imagenet classification with deep convolutional neural networks In Advances in neural information processing systems, pp 1097-1105

[43] VijayaLakshmi B and Mohan V (2016) Kernel-based pso and frvm: An automatic plant leaf type detection using texture, shape, and color features Computers and Electronics in Agriculture, 125: pp 99-112

[44] Nilsback M.E and Zisserman A (2006) A visual vocabulary for flower classification In 2006 IEEE Computer Society Conference on Computer Vision and Pattern Recognition (CVPR’06), volume 2, pp 1447-1454

[45] Nilsback M.E and Zisserman A (2008) Automated flower classification over a large number of classes In Computer Vision, Graphics & Image Processing, 2008 ICVGIP’08 Sixth Indian Conference on, pp 722-729

[46] Arivazhagan S., Shebiah R.N., Nidhyanandhan S.S., and Ganesan L (2010)

Fruit recognition using color and texture features Journal of Emerging Trends in Computing and Information Sciences, 1(2): pp 90-94

[47] Huang Z.K (2006) Bark classification using rbpnn based on both color and texture feature International Journal of Computer Science and Network Security,

[48] Zeiler M.D and Fergus R (2014) Visualizing and understanding convolutional networks In European conference on computer vision, pp 818-833

[49] Simonyan K and Zisserman A (2014) Very deep convolutional networks for large-scale image recognition CoRR, abs/1409.1556.

[50] Szegedy C., Liu W., Jia Y., Sermanet P., Reed S., Anguelov D., Erhan D.,

Vanhoucke V., and Rabinovich A (2015) Going deeper with convolutions In

Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, pp 1-9.

[51] He K., Zhang X., Ren S., and Sun J (2015) Deep residual learning for image recognition CoRR, abs/1512.03385.

[52] http://cs231n.github.io/convolutional-networks/(retrievel 17/january/2018).

[53] Thyagharajan K and Raji I.K (2018) A review of visual descriptors and classification techniques used in leaf species identification Archives of Computational Methods in Engineering, pp 1-28.

[54] Ghazi M.M., Yanikoglu B., and Aptoula E (2017) Plant identification using deep neural networks via optimization of transfer learning parameters

[55] Anh H V., Hoa.T D., Bao.T N., and Van-Huy P (2019) Vietnamese herbal plant recognition using deep convolutional features International Journal of Machine

Tiêu đề	Nghiên cứu và phát triển hệ thống nhận dạng cây dựa trên hình ảnh trên thiết bị di động
Tác giả	Nguyễn Hải Tùng
Người hướng dẫn	PGS. TS. Lê Thị Lan
Trường học	Đại học Bách Khoa Hà Nội
Chuyên ngành	Kỹ thuật Điện tử
Thể loại	luận văn thạc sĩ
Năm xuất bản	2023
Thành phố	Hà Nội

Định dạng
Số trang	63
Dung lượng	1,57 MB