1. Trang chủ
  2. » Luận Văn - Báo Cáo

CHẨN ĐOÁN BỆNH CÂY TRỒNG TRÊN DƯA LEO BẰNG MẠNG NƠ RON TÍCH CHẬP

52 0 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Chẩn Đoán Bệnh Cây Trồng Trên Dưa Leo Bằng Mạng Nơ Ron Tích Chập
Tác giả Trần Tiến Điệp, Hoàng Đức Hùng, Đỗ Khánh Vinh
Người hướng dẫn TS. Nguyễn Mạnh Cường
Trường học Trường Đại Học Công Nghiệp Hà Nội
Chuyên ngành Khoa Học Máy Tính
Thể loại Đồ Án Chuyên Ngành
Năm xuất bản 2023
Thành phố Hà Nội
Định dạng
Số trang 52
Dung lượng 3,32 MB

Cấu trúc

  • CHƯƠNG I: KHẢO SÁT VÀ PHÁT BIỂU BÀI TOÁN (7)
    • 1.1 Khảo sát hiện trạng nông nghiệp Việt Nam (7)
    • 1.2 Tìm hiểu về bài toán chẩn đoán bệnh cây trồng trên dưa leo (13)
      • 1.2.1 Các bệnh thường gặp trên cây dưa leo (13)
      • 1.2.2 Dữ liệu đầu vào và đầu ra (16)
  • CHƯƠNG II. CÁC PHƯƠNG PHÁP GIẢI QUYẾT VẤN ĐỀ (17)
    • 2.1 Mô hình mạng neuron cơ bản (17)
    • 2.2 Tổng quan về kiến trúc mạng CNN (0)
    • 2.3 Mô hình VGG-16 (29)
  • CHƯƠNG III. XÂY DỰNG MÔ HÌNH (31)
    • 3.1 Thư viện và công cụ sử dụng (31)
    • 3.2 Chuẩn bị dữ liệu (32)
    • 3.3 Huấn luyện mô hình (0)
    • CHƯƠNG 4: THỰC NGHIỆM (6)
      • 4.1 Thực nghiệm mô hình (42)
  • KẾT LUẬN (51)
  • TÀI LIỆU THAM KHẢO (0)

Nội dung

Trong thời kỳ khoa học công nghệ đã và đang phát triển, việc ứng dụng các thành tựu, phát minh sáng chế kỹ thuật vào các mặt của đời sống xã hội đang ngày càng trở nên phổ biến và mang lại những dấu hiệu tích cực. Những năm gần đây, AI hay trí tuệ nhân tạo nổi lên như một bằng chứng của cuộc cách mạng công nghiệp lần thứ tư (4.0). Trí tuệ nhân tạo có thể được định nghĩa như một ngành của khoa học máy tính liên quan đến việc tự động hóa các hành vi thông minh. Trí tuệ nhân tạo là một bộ phận của khoa học máy tính và do đó nó phải được đặt trên những nguyên lý lý thuyết vững chắc, có khả năng ứng dụng được cả lĩnh vực này. Ở thời điểm hiện tại, thuật ngữ này thường dùng để nói đến các máy tính có mục đích không nhất định và ngành khoa học nghiên cứu về các lý thuyết và các ứng dụng của trí tuệ nhân tạo. Theo đà phát triển của công nghệ, ứng dụng trí tuệ nhân tạo luôn là xu hướng công nghệ tương lai mà các hãng công nghệ trên toàn thế giới đua nhau sáng tạo, nó là nền tảng cốt lõi của cuộc cách mạng công nghệ 4.0. DL (Deep Learning) là một lĩnh vực của trí tuệ nhân tạo, được sinh ra từ khả năng nhận diện mẫu và từ lý thuyết các máy tính có thể học mà không cần phải lập trình để xử lý các nhiệm vụ cụ thể nào đó. Hầu hết mọi ngành công nghiệp đang làm việc với hàm lượng lớn đã liệu đều nhận ra tầm quan trọng của công nghệ AI. Những cái nhìn sáng suốt từ nguồn dữ liệu này chủ yếu trong thời gian thực sẽ giúp các tổ chức vận hành hiệu quả hơn hoặc tạo lợi thế cạnh tranh với các đối thủ. Các ứng dụng của AI đã quá quen thuộc với con người: xe tự hành của Google và Tesla, hệ thống tự tag khuôn mặt trên Facebook , hệ thống gợi ý sản phẩm của Amazon, hệ thống gợi ý phim trên ứng dụng Netflix… chỉ là một vài ứng dụng trong muôn vàn những ứng dụng của trí tuệ nhân tạo và cụ thể là ML Machine Learning

KHẢO SÁT VÀ PHÁT BIỂU BÀI TOÁN

Khảo sát hiện trạng nông nghiệp Việt Nam

Hiện trạng nông nghiệp Việt Nam

Nông nghiệp tại Việt Nam đóng vai trò quan trọng trong nền kinh tế, bất chấp quá trình công nghiệp hóa hiện đại hóa Ngành này đã có những thay đổi phù hợp, khẳng định vị thế của mình trong nền kinh tế quốc gia Luôn là một trong những mũi nhọn, nông nghiệp không chỉ đảm bảo an ninh lương thực trong nước mà còn góp phần xuất khẩu nông sản ra thị trường quốc tế.

Theo nhận định của Tổng cục Thống kê, kinh tế thế giới trong bảy tháng đầu năm

Năm 2023, thế giới đối mặt với nhiều khó khăn và thách thức, bao gồm cuộc xung đột kéo dài giữa Nga và Ukraine, lạm phát toàn cầu vẫn ở mức cao mặc dù đã hạ nhiệt Chính sách tiền tệ thắt chặt của nhiều ngân hàng trung ương đã ảnh hưởng mạnh mẽ đến tăng trưởng kinh tế, đầu tư và tiêu dùng Nhiều nền kinh tế lớn, đặc biệt là các đối tác thương mại quan trọng của Việt Nam, đã ghi nhận sự tăng trưởng chậm lại và thậm chí rơi vào suy thoái.

Dự báo rằng các tháng tới sẽ tiếp tục mang đến khó khăn cho các ngành kinh tế Việt Nam, đặc biệt là ngành nông nghiệp Những biến động trong lĩnh vực này đã bắt đầu xuất hiện, yêu cầu toàn ngành cần nỗ lực vượt qua thách thức và tận dụng mọi cơ hội tăng trưởng, đặc biệt là đối với các sản phẩm chủ lực.

Vụ trưởng Kế hoạch Bộ Nông nghiệp và Phát triển nông thôn, Nguyễn Văn Việt, cho biết các địa phương đang khẩn trương thực hiện gieo cấy lúa mùa và lúa thu đông, đồng thời chăm sóc và thu hoạch lúa hè thu Tính đến giữa tháng 7, cả nước đã gieo cấy gần 6,2 triệu héc-ta lúa.

Năm 2023, các địa phương đã thu hoạch gần 3,7 triệu héc-ta lúa với năng suất bình quân đạt 65,7 tạ/ha, tăng 0,8 tạ/ha so với năm trước Sản lượng lúa thu hoạch đạt hơn 24,1 triệu tấn, tăng 0,4% so với cùng kỳ năm 2022 Dự báo cả nước sẽ sản xuất từ 43,2 đến 43,4 triệu tấn lúa trong năm nay.

Tình hình sản xuất lúa ổn định tại Việt Nam không chỉ đảm bảo an ninh lương thực trong nước mà còn hỗ trợ xuất khẩu Sự duy trì diện tích, năng suất và sản lượng lúa là một thành công đáng kể của nền nông nghiệp Việt Nam, phản ánh nỗ lực to lớn của những người nông dân trồng lúa.

Thời gian qua, hiện tượng El Nino đã ảnh hưởng đến sản xuất nông nghiệp Việt Nam, cùng với việc giá vật tư đầu vào tăng cao Tuy nhiên, nông dân vẫn kiên trì gia tăng sản xuất bằng cách áp dụng các phương thức canh tác tiên tiến, như giảm lượng nước tưới, phân bón và thuốc bảo vệ thực vật Họ ưu tiên sử dụng thuốc bảo vệ thực vật sinh học và thực hiện kinh tế tuần hoàn trên đồng ruộng nhằm giảm chi phí đầu vào, nâng cao chất lượng lúa và tăng giá bán.

Lĩnh vực chăn nuôi tại Việt Nam đang có sự phục hồi ổn định, đặc biệt là chăn nuôi lợn và gia cầm Đến cuối tháng 7/2023, tổng số lợn cả nước tăng 2,8% so với cùng kỳ năm 2022, trong khi tổng số bò tăng 1% và tổng số gia cầm tăng 2,3%.

Trong bảy tháng đầu năm 2023, sản lượng thủy sản ước đạt gần 5,1 triệu tấn, tăng 1,9% so với cùng kỳ năm 2022 Cụ thể, cá đạt hơn 3,6 triệu tấn, tăng 1,7%; tôm đạt 673 nghìn tấn, tăng 3,5%; và thủy sản khác đạt 751 nghìn tấn, tăng 1,3% Mặc dù xuất khẩu thủy sản trong hai quý đầu năm 2023 liên tục giảm, nhưng các hộ nuôi trồng vẫn duy trì sản xuất, cho thấy nỗ lực đáng kể của ngành.

Từ đầu tháng 7/2023, tỉnh Bạc Liêu, một trong những vùng nuôi tôm trọng điểm của cả nước, chứng kiến giá tôm nguyên liệu giảm từ 4-18% Điều này đã buộc người nuôi tôm phải tìm kiếm những phương án mới và phù hợp với kinh tế hộ gia đình, đồng thời áp dụng công nghệ tiên tiến để tối ưu hóa chi phí và đảm bảo lợi nhuận.

Theo Hiệp hội Chế biến và Xuất khẩu thủy sản Việt Nam (VASEP), xuất khẩu thủy sản dự kiến sẽ phục hồi mạnh mẽ tại các thị trường chính như Mỹ, châu Âu và Trung Quốc Điều này mở ra nhiều cơ hội tăng thu nhập cho người nuôi, miễn là họ đảm bảo nguồn cung thủy sản chất lượng.

Sức sản xuất bền vững trong ngành nông nghiệp đã tạo nền tảng vững chắc cho nhiều ngành hàng xuất khẩu, giúp họ liên tục đạt kỷ lục trong bảy tháng đầu năm Điển hình là ngành hàng

Trong bảy tháng đầu năm 2023, xuất khẩu rau quả của Việt Nam đạt 3,23 tỷ USD, tăng 68,1% so với năm trước Xuất khẩu gạo đạt 2,58 tỷ USD, tăng 29,6%, trong khi cà phê đạt 2,76 tỷ USD, tăng 6% Trung Quốc, Mỹ và Nhật Bản vẫn là ba thị trường xuất khẩu nông, lâm, thủy sản lớn nhất của Việt Nam, với giá trị xuất khẩu sang Trung Quốc chiếm 21,9%, tăng 12,5% so với cùng kỳ năm 2022.

Theo Tổng cục Thống kê, trong bảy tháng đầu năm 2023, Việt Nam ước xuất siêu 15,23 tỷ USD, với các mặt hàng nông sản như gỗ và sản phẩm gỗ đạt 5,9 tỷ USD, thủy sản 3,4 tỷ USD, và rau quả 2,1 tỷ USD Mặc dù chỉ số sản xuất toàn ngành công nghiệp giảm 0,7% so với cùng kỳ năm 2022, nhưng sản xuất và xuất khẩu nông nghiệp vẫn duy trì tốt, cho thấy một thành tựu đáng kể trong bối cảnh hiện tại Việc ứng dụng công nghệ cao trong nông nghiệp cũng đóng góp tích cực vào kết quả này.

Trong những năm gần đây, ngành Nông nghiệp và Phát triển nông thôn đã vượt qua nhiều khó khăn do thời tiết bất thường, thiên tai và dịch bệnh như dịch tả lợn châu Phi và Covid-19 Nhờ vào việc áp dụng khoa học - kỹ thuật, tái cơ cấu sản xuất và kiểm soát dịch bệnh hiệu quả, ngành đã thực hiện tốt “mục tiêu kép” là phát triển sản xuất và phòng, chống dịch bệnh Nông nghiệp công nghệ cao đã được áp dụng để nâng cao hiệu quả sản xuất, tạo đột phá về năng suất và chất lượng nông sản, đáp ứng nhu cầu ngày càng cao của xã hội và đảm bảo phát triển nông nghiệp bền vững.

Tìm hiểu về bài toán chẩn đoán bệnh cây trồng trên dưa leo

1.2.1 Các bệnh thường gặp trên cây dưa leo

Hiện nay, chẩn đoán bệnh cây trồng chủ yếu dựa vào quan sát của nông dân và chuyên gia, nhưng phương pháp này có thể tốn thời gian và không chính xác Điều này dẫn đến việc áp dụng thuốc phòng trừ không hiệu quả hoặc quá muộn Dưới đây là danh sách các bệnh phổ biến gây hại cho cây dưa leo trong nông nghiệp.

Sương mai là một bệnh gây ra lớp sương mờ trắng trên lá cây trồng, làm giảm sức sống và ảnh hưởng tiêu cực đến quá trình quang hợp của cây.

Hình 1.1 Bệnh sương mai trên dưa leo

- Phấn trắng: phấn trắng là một loại bệnh gây ra sự nảy mầm của nấm và làm mục nát các cánh hoa và lá cây dưa leo

Hình 1.2 Bệnh phấn trắng trên dưa leo

- Thán thư: bệnh này gây ra sự héo rũ, nát lá và làm giảm khả năng hấp thụ CO2 của cây

Hình 1.3 Bệnh thán thư trên dưa leo

- Héo rũ: bệnh héo rũ gây ra sự héo rũ và mục nát các lá cây, làm suy giảm khả năng quang hợp và sinh trưởng của cây

Hình 1.4 Bệnh héo rũ trên dưa leo

Bệnh vàng lá là một tình trạng nghiêm trọng, gây ra sự thay đổi màu sắc của lá cây, làm mất đi màu xanh tự nhiên và ảnh hưởng tiêu cực đến quá trình quang hợp.

Hình 1.5 Bệnh vàng lá trên dưa leo

Các bệnh liên quan đến dưa leo gây thiệt hại nghiêm trọng cho cây trồng, tạo ra thách thức lớn trong việc duy trì năng suất và chất lượng sản phẩm nông nghiệp.

1.2.2 Dữ liệu đầu vào và đầu ra

Chẩn đoán bệnh cho cây dưa leo là một ứng dụng quan trọng của trí tuệ nhân tạo trong nông nghiệp thông minh Việc sử dụng công nghệ này giúp nâng cao hiệu quả quản lý và bảo vệ cây trồng, đồng thời tối ưu hóa năng suất và chất lượng nông sản.

Công nghệ này hỗ trợ nông dân và chuyên gia nông nghiệp trong việc nhanh chóng và hiệu quả xác định cũng như chẩn đoán các vấn đề liên quan đến sức kháng của cây trồng.

 Dữ liệu đầu vào (Input Data): Ảnh của cây dưa leo ( đây là dữ liệu hình ảnh của cây dưa leo cần chẩn đoán)

 Dữ liệu đầu ra (Output Data):

 Phân loại chẩn đoán: Đầu ra chính của bài toán là kết quả chẩn đoán cho cây dưa leo đó Điều này bao gồm:

 Xác định liệu cây dưa leo có khỏe mạnh (không bị nhiễm bệnh) hay không

 Nếu cây bị nhiễm bệnh, đưa ra loại bệnh cụ thể Loại bệnh này có thể được đánh dấu bằng một tên hoặc mã cụ thể

CÁC PHƯƠNG PHÁP GIẢI QUYẾT VẤN ĐỀ

Mô hình mạng neuron cơ bản

Mạng nơ-ron bao gồm các nơ-ron đơn lẻ gọi là perceptron Để hiểu rõ hơn về cấu trúc của mạng nơ-ron, trước tiên chúng ta cần tìm hiểu về perceptron Nơ-ron nhân tạo được phát triển dựa trên nguyên lý hoạt động của nơ-ron sinh học.

Neuron là tế bào thần kinh có khả năng phát sinh và dẫn truyền xung điện, đóng vai trò quan trọng trong hệ thần kinh của động vật, đặc biệt là não Thân và sợi nhánh của neuron tạo thành chất xám, trong khi sợi trục tạo thành chất trắng khi tập hợp thành bó Não người chứa khoảng 100 tỷ neuron và 100 nghìn tỷ synap, được hỗ trợ bởi microglia và tế bào hình sao Mặc dù neuron là những tế bào dài nhất và không có khả năng phân chia, chúng vẫn có khả năng tái sinh phần cuối sợi trục khi bị tổn thương.

Hình 2.1 Ảnh minh họa Neuron sinh học

Mô hình của perceptron cũng tương tự như vậy, dựa trên cấu trúc mạng neuron sinh học

Hình 2.2 Ảnh minh họa Perceptron

- Wj (0,1,2,3,4 …): các trọng số tương ứng vứi các đầu vào

Trong một mạng neuron có ba kiểu đơn vị:

- Các đơn vị đầu vào (Input units), nhận tín hiệu từ bên ngoài

- Các đơn vị đầu ra (Output units) , gửi dữ liệu ra bên ngoài

- Các đơn vị ẩn (Hidden units), tín hiệu vào (input) và ra (output) của nó nằm trong mạng

Mỗi đơn vị trong hệ thống có thể nhận một hoặc nhiều đầu vào như X0, X1, X2, Xn, nhưng chỉ tạo ra một đầu ra duy nhất là Y’ Đầu vào của một đơn vị có thể bao gồm dữ liệu từ bên ngoài mạng, đầu ra của một đơn vị khác, hoặc thậm chí là đầu ra của chính nó.

Trong mạng nơron, các đơn vị chuyển net input thông qua hàm kích hoạt, sản sinh ra mức độ kích hoạt của đơn vị Giá trị này, trừ khi đơn vị thuộc lớp đầu ra, sẽ được truyền đến một hoặc nhiều đơn vị khác Các hàm kích hoạt thường bị giới hạn trong một khoảng giá trị nhất định, vì vậy chúng còn được gọi là các hàm bẹp Một số hàm kích hoạt phổ biến thường được sử dụng trong mạng nơron bao gồm:

2.1.2.1 Hàm đồng nhất (Linear function)

Khi xem xét các đầu vào như một đơn vị, chúng ta sẽ áp dụng hàm này Đôi khi, một hằng số được nhân với giá trị đầu vào để tạo ra một hàm đồng nhất.

Hàm này cũng được biết đến với tên “Hàm ngưỡng” (Threshold hay Heaviside function) Đầu ra hàm này được giới hạn vào một trong hai giá trị:

Hình 2.4 Hàm bước nhị phân (Binary step function Hard limit function)

Dạng hàm này được sử dụng trong các mạng chỉ có một lớp Trong hình vẽ sau, theta được chọn bằng 1

Với đầu vào và đầu ra dạng nhị phân, việc điều chỉnh một lượng nhỏ đầu vào để thay đổi đầu ra trở nên khó khăn Để tăng tính linh hoạt, chúng ta có thể mở rộng khoảng đầu vào ra [0, 1] Khi đó, đầu ra sẽ được xác định bởi hàm sigmoid σ(w⊺.x), với công thức của hàm sigmoid như sau:

Hình 2.5 Hàm sigmoid (Sigmoid fuction)

Hàm này rất hữu ích cho các mạng được huấn luyện bằng thuật toán Lan truyền ngược, nhờ vào khả năng lấy đạo hàm dễ dàng, giúp giảm thiểu tính toán trong quá trình huấn luyện Nó thường được áp dụng trong các chương trình mà đầu ra mong muốn nằm trong khoảng [0,1].

2.1.2.4 Hàm Sigmoid lưỡng cực (Bipolar Sigmoid Function)

Hàm này có các thuộc tính tương tự hàm sigmoid Nó làm việc tốt đối với các ứng dụng có đầu ra yêu cầu trong khoảng [-1,1]

Hình 2.6 Hàm sigmoid lưỡng cực (Bipolar sigmoid function)

Các hàm chuyển của các đơn vị ẩn là cần thiết để biểu diễn sự phi tuyến trong mạng nơ-ron, giúp các mạng nhiều tầng có khả năng tốt trong việc biểu diễn các ánh xạ phi tuyến Để áp dụng luật học lan truyền ngược, hàm cần phải khả vi và thường được gắn trong một khoảng nhất định, vì vậy hàm sigmoid là lựa chọn phổ biến nhất Đối với các đơn vị đầu ra, hàm chuyển phải phù hợp với phân phối của các giá trị đích mong muốn Hàm sigmoid hữu ích cho các giá trị ra trong khoảng [0,1] và cũng có thể áp dụng cho các giá trị liên tục trong khoảng đó Nếu các giá trị đích không xác định trước, hàm đồng nhất là lựa chọn thường gặp Trong trường hợp giá trị mong muốn là dương nhưng không biết cận trên, hàm kích hoạt dạng mũ là phương án tối ưu.

Mạng CNN là sự kết hợp của của các tầng perceptron hay còn được gọi là perceptron đa tầng (multilayer perceptron) như hình vẽ bên dưới:

Hình 2.7 Ảnh minh họa mạng CNN

Một mạng NN sẽ có 3 kiểu tầng:

- Tầng vào (input layer): Là tầng bên trái cùng của mạng thể hiện cho các đầu vào của mạng

- Tầng ra (output layer): Là tầng bên phải cùng của mạng thể hiện cho các đầu ra của mạng

- Tầng ẩn (hidden layer): Là tầng nằm giữa tầng vào và tầng ra thể hiện cho việc suy luận logic của mạng

Một NN chỉ có 1 tầng vào và 1 tầng ra nhưng có thể có nhiều tầng ẩn

Hình 2.8 Ảnh minh họa mạng CNN có tầng ẩn

Trong mạng nơ-ron, mỗi nút mạng là một nơ-ron sigmoid với hàm kích hoạt có thể khác nhau, nhưng thường được đồng nhất để tiện lợi trong tính toán Số lượng nơ-ron ở mỗi tầng có thể thay đổi tùy thuộc vào bài toán, nhưng thường các tầng ẩn sẽ có số lượng nơ-ron bằng nhau Các nơ-ron giữa các tầng thường được liên kết đầy đủ, tạo thành mạng kết nối hoàn chỉnh Kích thước của mạng được xác định dựa trên số tầng và số nơ-ron.

- 4 tầng mạng, trong đó có 22 tầng ẩn

Các lớp cơ bản trong mạng CNN

2.2.2.1 Lớp tích chập – Convolutional Layer

Lớp này đóng vai trò cực kỳ quan trọng trong mạng nơ-ron tích chập (CNN) vì mọi phép toán đều được thực hiện tại đây Cụ thể, nó hoạt động như một cửa sổ trượt (Sliding Windows) trên một ma trận, như mô tả trong hình dưới đây.

Hình 2.9 Lớp tích chập - Convolutional layer

Các convolutional layer có các parameter(kernel) đã được học để tự điều chỉnh lấy ra những thông tin chính xác nhất mà không cần chọn các feature

Ma trận bên trái trong hình ảnh ví dụ là một hình ảnh trắng đen được số hóa với kích thước 5×5 Mỗi điểm ảnh trong ma trận này có giá trị 1 hoặc 0, tương ứng với giao điểm của dòng và cột.

Convolution, also known as convolutional operation, involves multiplying each element in a 3x3 matrix The Sliding Window, often referred to as a kernel, filter, or feature detection, is a small matrix used in this process, exemplified by its 3x3 size.

Tích chập, hay còn gọi là convolution, là quá trình nhân từng phần tử trong ma trận 3x3 với ma trận bên trái Kết quả của quá trình này là một ma trận gọi là Convolved feature, được tạo ra từ việc áp dụng ma trận Filter lên ma trận ảnh 5x5 bên trái.

Khi cửa sổ trượt trên ma trận đầu vào, các điểm ảnh ở biên sẽ bị bỏ qua, do đó cần thêm padding (các giá trị 0) cho ma trận đầu vào.

Lớp pooling thường được sử dụng ngay sau lớp convolutional để đơn giản hóa thông tin đầu ra để giảm bớt số lượng neuron

Hình 2.10 Lớp gộp - Pooling layer

Thủ tục pooling phổ biến là max-pooling, thủ tục này chọn giá trị lớn nhất trong vùng đầu vào 2×2

Hình 2.10 Quá trình Max-pooling 2x2

Qua lớp Max Pooling, số lượng neuron giảm đi một nửa Trong mạng CNN với nhiều Feature Map, mỗi Feature Map sẽ áp dụng một Max Pooling khác nhau Max Pooling giúp xác định đặc trưng nổi bật nhất trong các đặc trưng đã cho Bên cạnh Max Pooling, còn có phương pháp L2 Pooling.

Cuối cùng ta đặt tất cả các lớp lại với nhau thành một CNN với đầu ra gồm các neuron với số lượng tùy bài toán

Hình 2.11 Đầu ra các neuron sau lớp pooling

2.2.2.3 Lớp phi tuyến – ReLU Layer

Mô hình VGG-16

VGG16 là một mạng convolutional neural network được phát triển bởi K Simonyan và A Zisserman tại Đại học Oxford Mô hình này đạt độ chính xác 92.7% trong bài kiểm tra top-5 trên dữ liệu ImageNet, bao gồm 14 triệu hình ảnh thuộc 1000 lớp khác nhau Chúng ta sẽ khám phá chi tiết mô hình VGG-16 trong phần dưới đây.

Trong mạng VGG-16, lớp convolutional sử dụng bộ lọc kích thước 3x3 với padding bằng 1 và stride bằng 1 Điều này cho phép quét qua hình ảnh đầu vào mà không làm thay đổi kích thước đầu ra, nhờ vào việc thêm viền xung quanh.

Trong mạng VGG-16, lớp pooling được sử dụng là lớp max pooling với kích thước 2x2, có chức năng chọn giá trị lớn nhất từ mỗi vùng 2x2 trên đầu ra của lớp convolutional trước đó Điều này giúp giữ lại các đặc trưng quan trọng trong quá trình xử lý.

Lớp convolutional 3x3 với 64 bộ lọc được sử dụng để xác định độ sâu của đầu ra Kích thước bộ lọc 3x3 cho phép xử lý hiệu quả các đặc trưng hình ảnh, trong khi 64 bộ lọc đảm bảo rằng đầu ra của lớp này có độ phong phú và đa dạng cao Mỗi bộ lọc đóng vai trò quan trọng trong việc tạo ra đầu ra cuối cùng của lớp convolutional.

Trong mạng neural xử lý hình ảnh, các lớp convolutional và pooling đóng vai trò quan trọng trong việc trích xuất đặc trưng và giảm kích thước dữ liệu Kích thước đầu ra giảm dần qua từng lớp, trong khi độ sâu dữ liệu, tức số lượng đặc trưng, lại tăng lên Để tối ưu hóa hiệu suất trích xuất đặc trưng từ hình ảnh, các thiết lập như kích thước bộ lọc, padding và stride được lựa chọn một cách cẩn thận.

XÂY DỰNG MÔ HÌNH

Thư viện và công cụ sử dụng

Thư viện này cung cấp hỗ trợ cho các mảng và ma trận lớn, đa chiều, đi kèm với nhiều hàm toán học nâng cao để thao tác hiệu quả trên các mảng này.

Trong bài toán này, thư viện được áp dụng để xử lý dữ liệu số và chuyển đổi dữ liệu thành các mảng nhiều chiều (ndarrays) nhằm phục vụ cho các mô hình học máy.

● Thư viện xử lý ảnh và thị giác máy tính mã nguồn mở

● Hỗ trợ xử lý ảnh cơ bản: cắt, xoay, thay đổi kích thước

● Dùng để tiền xử lý ảnh trước khi đưa vào mô hình

● Keras là thư viện deep learning để xây dựng và huấn luyện mô hình học sâu

● Cung cấp các lớp mạng nơ-ron, tích chập, tối ưu hóa, huấn luyện mô hình

● Sử dụng để xây dựng và huấn luyện mô hình CNN

● Scikit-Learn là một thư viện Python phổ biến cho học máy và khai phá dữ liệu

● Trong bài toán chẩn đoán bệnh, Scikit-Learn có thể được sử dụng để xử lý dữ liệu số, chuẩn hóa dữ liệu, thực hiện tách tập dữ liệu

● Tensorflow là thư viện mã nguồn mở dành cho học máy

● Cung cấp bộ công cụ linh hoạt và mạnh mẽ

● Sử dụng để xây dựng và đào tạo CNN, lưu mô hình bằng ModelCheckpoint và trọng lượng trong tệp huấn luyện

Kaggle là nền tảng trực tuyến lý tưởng cho các nhà khoa học dữ liệu và những người yêu thích học máy, nơi người dùng có thể hợp tác và tham gia giải quyết các thách thức trong lĩnh vực khoa học dữ liệu.

Trong nghiên cứu chẩn đoán bệnh dưa leo, Kaggle đã được áp dụng để huấn luyện mô hình VGG16 với một lượng dữ liệu lớn, nhằm kiểm tra độ chính xác của mô hình này.

Google Colab là một nền tảng lưu trữ đám mây tương tự như Jupyter Notebook, được phát triển bởi Google Research Với Google Colab, người dùng không cần phải cài đặt hay nâng cấp phần cứng máy tính cá nhân để thực hiện các tác vụ nặng về CPU/GPU trong Python Nền tảng này cung cấp miễn phí quyền truy cập vào hạ tầng điện toán đám mây, bao gồm bộ lưu trữ, bộ nhớ, GPU, CPU và TPU, giúp tối ưu hóa quy trình làm việc.

Trong nghiên cứu chẩn đoán bệnh dưa leo, Google Colab đã được sử dụng để huấn luyện mô hình VGG16 với một lượng dữ liệu lớn, nhằm kiểm tra độ chính xác của mô hình trong việc nhận diện bệnh.

Chuẩn bị dữ liệu

Bộ dữ liệu: Cucumber Dataset

Dữ liệu bao gồm sáu loại bệnh dưa leo Gồm mục rụt, nhiễm khuẩn, rụt đuôi, mục đen, nhiễm nấm, rụt cành, lá tươi, và dưa leo tươi

Hình 3.1 Bộ dữ liệu chuẩn bị

Tổng cộng có 1280 hình ảnh dưa leo được thu thập từ các cánh đồng thực tế, từ đó tạo ra 6400 hình ảnh mới.

Hình 3.2 Minh hoạ một phần bộ dữ liệu

Hình 3.3 Minh hoạ một phần bộ dữ liệu

Bước 2: Khởi tạo mô hình

35 Bước 3: Cấu trúc mô hình

- Total params(Tổng số tham số):

● Đây là tổng số lượng tham số trong mô hình, bao gồm cả các tham số có thể đào tạo và không thể đào tạo

● Trong trường hợp này, tổng số tham số là 16,914,376, tức là có 16 triệu, 914 nghìn, và 376 tham số trong mô hình

- Trainable params (Số tham số có thể đào tạo):

● Đây là số lượng tham số mà mô hình có thể cập nhật và học từ dữ liệu đào tạo

Mô hình này có 2,198,408 tham số có thể đào tạo, số lượng tham số mà nó sẽ tối ưu hóa trong quá trình đào tạo để phản ánh đặc trưng của dữ liệu.

- Non-trainable params(Số tham số không thể đào tạo):

Số lượng tham số mà mô hình không thể cập nhật trong quá trình đào tạo thường bao gồm các trọng số đã được đào tạo trước (pre-trained) và được giữ nguyên Ví dụ, mô hình VGG16 được tải sẵn từ ImageNet và các trọng số của nó không thay đổi trong quá trình đào tạo.

Bước 4 : Duyệt qua các thư mục

Bước 5: Resize ảnh và đặt batch size cho mô hình

Bước 7: Tạo tập data train

Bước 8: Hiển thị ảnh đặc trưng cho từng loại bệnh

ModelCheckpoint là một callback trong TensorFlow Callbacks là các hàm được gọi tại một số điểm trong quá trình huấn luyện mô hình, như sau mỗi epoch

Đường dẫn và tên tệp "/content/model_weights_new_t6.h5" được sử dụng để lưu trữ trọng số của mô hình Trọng số này sẽ được lưu lại khi giá trị mất mát trên tập kiểm thử (val_loss) đạt mức thấp nhất.

- monitor="val_loss": Theo dõi giá trị mất mát trên tập kiểm thử để quyết định khi nào lưu trọng số tốt nhất

- mode="min": Lưu trọng số khi giá trị được theo dõi (mất mát trên tập kiểm thử) đạt giá trị thấp nhất

- save_best_only=True: Lưu trọng số chỉ khi giá trị mất mát trên tập kiểm thử cải thiện so với mô hình trước đó

- verbose=1: Hiển thị thông báo khi lưu trọng số

Biên dịch mô hình trước khi bắt đầu quá trình huấn luyện

- optimizer='adam': Chọn thuật toán tối ưu hóa Adam để cập nhật trọng số mô hình

- loss=tf.keras.losses.SparseCategoricalCrossentropy(from_logits=True):Sử dụng hàm mất mát Sparse Categorical Crossentropy, thường được sử dụng trong bài toán phân loại nhiều lớp

- metrics=['accuracy']: Đánh giá hiệu suất mô hình bằng độ chính xác trong quá trình huấn luyện

Biến epochs xác định số lần toàn bộ tập dữ liệu được sử dụng để huấn luyện mô hình Trong trường hợp này, mô hình sẽ trải qua quá trình huấn luyện với toàn bộ dữ liệu đào tạo trong 10 epochs.

- model.fit: Phương thức này được sử dụng để huấn luyện mô hình với dữ liệu đào tạo

- train_ds: Là tập dữ liệu đào tạo được đưa vào để huấn luyện mô hình

Số bước mỗi epoch, hay còn gọi là steps_per_epoch, đại diện cho số lần mà mô hình cập nhật trọng số sau mỗi lượt qua toàn bộ tập dữ liệu đào tạo Trong trường hợp này, mô hình thực hiện 30 bước mỗi epoch.

- verbose=1: Hiển thị thông tin về quá trình huấn luyện, ở đây là các thông số mất mát và độ chính xác trên tập đào tạo

- epochs=epochs: Số lượng epochs mà mô hình sẽ được huấn luyện

- callbacks=checkpoint: Sử dụng callback ModelCheckpoint đã được định nghĩa trước đó để lưu trọng số tốt nhất theo giảm mất mát trên tập kiểm thử

Sử dụng tập dữ liệu kiểm thử (val_ds) để đánh giá hiệu suất của mô hình sau mỗi epoch, thông tin này còn giúp xác định thời điểm lưu trọng số tốt nhất.

Kết quả huấn luyện mô hình Bước 11: Hiển thị Accuracy và val_accuracy từ lịch sử đào tạo

Bước 12: Hiển thị Loss và val_loss từ lịch sử đào tạo

Do cấu hình của máy tính bị hạn chế, nên việc thực hiện thực nghiệm mô hình sẽ được thực hiện trên Google Colab

Bước 1: Tạo folder ảnh test với 6 folder ứng với từng loại bệnh từ tập train

Bước 2: Tải mô hình đã huấn luyện và tải bộ dữ liệu kiểm tra

Bước 3: Duyệt ảnh trong thư mục kiểm tra và in ra tổng số ảnh trong file test

Bước 4: Tải và xử lý hình ảnh trước khi dự đoán

Kiểm tra kết quả tập test

- Nhãn true label là nhãn thực tế của ảnh

- Nhãn Predicted là nhãn được mô hình dự đoán

- Accuracy là tỉ lệ dự đoán chính xác với từng ảnh

- Độ dự đoán chính xác của toàn bộ file test

- Upload Image : Tải ảnh bất kì

- Xóa kết quả : Xóa phần thực hiện dự đoán

Thực hiện dự đoán các ảnh có bệnh được tải từ google image:

 Dấu hiệu nhận biết bệnh là quả non bị úng nước chuyển sang màu đen và thối nhũn

 Kết quả: loại bệnh dự đoán được ở đây là bệnh(Belly Rot) thối trái non

 Tỉ lệ dự đoán chính xác của ảnh với độ chính xác là 99,9%

 Các triệu chứng ban đầu bao gồm các vùng lớn, có góc cạnh hoặc hình khối, màu vàng nhìn thấy được ở bề mặt phía trên mai

 Tỉ lệ dự đoán chính xác của ảnh với độ chính xác là 99,64%

 Các triệu chứng xuất hiện đầu tiên trên lá là có thể phát triển các vùng nhiễm clo (tức là màu vàng) và hoại tử khi bệnh tiến triển

 Kết quả: loại bệnh dự đoán được ở đây là bệnh(bacterial wilt) Héo vi khuẩn

 Tỉ lệ dự đoán chính xác của ảnh với độ chính xác là 72,91%

THỰC NGHIỆM

Chúng em sẽ tiến hành thực nghiệm chuẩn đoán bệnh cây trồng trên dưa leo dựa trên mô hình đã xây dựng, với kiến thức đã được nghiên cứu và chuẩn bị Quá trình này bao gồm việc thu thập kết quả từ chương trình, đánh giá độ chính xác của các trường hợp dựa trên kết quả đầu ra, tốc độ xử lý và mức độ chuẩn xác Cuối cùng, chúng em sẽ đưa ra kết luận và đánh giá tổng thể về kết quả của đề tài, đồng thời đề xuất định hướng phát triển cho mô hình và bài toán chuẩn đoán bệnh cây trồng trên dưa leo trong tương lai.

Chúng tôi kỳ vọng rằng dự án này sẽ tạo ra giá trị đáng kể cho ngành nông nghiệp thông qua việc áp dụng công nghệ thông tin và trí tuệ nhân tạo, đồng thời góp phần vào sự phát triển bền vững của lĩnh vực nông nghiệp.

CHƯƠNG I: KHẢO SÁT VÀ PHÁT BIỂU BÀI TOÁN

1.1 Khảo sát hiện trạng nông nghiệp Việt Nam

Hiện trạng nông nghiệp Việt Nam

Nông nghiệp tại Việt Nam đóng vai trò quan trọng trong nền kinh tế, mặc dù đất nước đang tiến hành công nghiệp hóa hiện đại hóa Ngành nông nghiệp đã có những thay đổi phù hợp, khẳng định vị thế của mình trong nền kinh tế quốc gia Được coi là một trong những mũi nhọn, lĩnh vực này không chỉ đảm bảo an ninh lương thực trong nước mà còn góp phần xuất khẩu nông sản ra thị trường quốc tế.

Theo nhận định của Tổng cục Thống kê, kinh tế thế giới trong bảy tháng đầu năm

Năm 2023, thế giới phải đối mặt với nhiều khó khăn và thách thức, bao gồm cuộc chiến kéo dài giữa Nga và Ukraine, lạm phát toàn cầu vẫn ở mức cao mặc dù đã có dấu hiệu hạ nhiệt Chính sách tiền tệ thắt chặt của nhiều ngân hàng trung ương đã ảnh hưởng mạnh mẽ đến tăng trưởng kinh tế, đầu tư và tiêu dùng Nhiều nền kinh tế lớn, đặc biệt là các đối tác thương mại quan trọng của Việt Nam, đã ghi nhận sự tăng trưởng chậm lại, thậm chí rơi vào tình trạng suy thoái.

Trong những tháng tới, ngành nông nghiệp Việt Nam sẽ tiếp tục đối mặt với những khó khăn, ảnh hưởng chung từ các biến động kinh tế Điều này đòi hỏi toàn ngành nỗ lực hơn nữa để vượt qua thách thức và tận dụng mọi cơ hội tăng trưởng, đặc biệt là đối với các mặt hàng chủ lực.

Vụ trưởng Kế hoạch Bộ Nông nghiệp và Phát triển nông thôn, Nguyễn Văn Việt, cho biết các địa phương đang tích cực thực hiện gieo cấy lúa mùa và lúa thu đông, đồng thời chăm sóc và thu hoạch lúa hè thu Tính đến giữa tháng 7, cả nước đã gieo cấy gần 6,2 triệu héc-ta lúa.

Năm 2023, các địa phương đã thu hoạch gần 3,7 triệu héc-ta lúa với năng suất bình quân đạt 65,7 tạ/ha, tăng 0,8 tạ/ha so với năm trước, dẫn đến sản lượng lúa thu hoạch đạt hơn 24,1 triệu tấn, tăng 0,4% so với cùng kỳ năm 2022 Dự báo, tổng sản lượng lúa của cả nước sẽ đạt từ 43,2 đến 43,4 triệu tấn.

Sản xuất lúa ổn định về diện tích, năng suất và sản lượng không chỉ đảm bảo an ninh lương thực trong nước mà còn thúc đẩy xuất khẩu Đây là một tín hiệu tích cực cho nền nông nghiệp Việt Nam và phản ánh nỗ lực to lớn của những người nông dân trồng lúa.

Thời gian qua, hiện tượng El Nino đã ảnh hưởng đến sản xuất nông nghiệp ở nước ta, trong khi giá vật tư đầu vào liên tục tăng cao Tuy nhiên, nông dân vẫn kiên trì tăng cường sản xuất bằng cách áp dụng các phương thức canh tác tiên tiến, như giảm lượng nước tưới, phân bón và thuốc bảo vệ thực vật Họ ưu tiên sử dụng thuốc bảo vệ thực vật sinh học và thực hiện kinh tế tuần hoàn trên đồng ruộng để giảm chi phí đầu vào, nâng cao chất lượng lúa và tăng giá bán.

Lĩnh vực chăn nuôi tại Việt Nam đang có sự hồi phục đáng kể, đặc biệt là chăn nuôi lợn và gia cầm Đến cuối tháng 7/2023, tổng số lợn cả nước tăng 2,8% so với cùng kỳ năm 2022, trong khi tổng số bò tăng 1% và tổng số gia cầm tăng 2,3% Sự ổn định này cho thấy tiềm năng phát triển của ngành chăn nuôi trong thời gian tới.

Trong bảy tháng đầu năm 2023, sản lượng thủy sản ước đạt gần 5,1 triệu tấn, tăng 1,9% so với cùng kỳ năm 2022 Cụ thể, cá đạt hơn 3,6 triệu tấn (tăng 1,7%), tôm đạt 673 nghìn tấn (tăng 3,5%), và thủy sản khác đạt 751 nghìn tấn (tăng 1,3%) Dù xuất khẩu thủy sản liên tục giảm trong hai quý đầu năm, các hộ nuôi trồng vẫn nỗ lực duy trì sản xuất.

Từ đầu tháng 7/2023, giá tôm nguyên liệu tại tỉnh Bạc Liêu, vùng nuôi tôm trọng điểm của cả nước, đã giảm từ 4-18% Người nuôi tôm đang tìm kiếm các phương pháp mới phù hợp với kinh tế hộ gia đình và áp dụng công nghệ hiện đại để tối ưu hóa chi phí, nhằm đảm bảo lợi nhuận.

Theo dự báo của Hiệp hội Chế biến và Xuất khẩu thủy sản Việt Nam (VASEP), xuất khẩu thủy sản dự kiến sẽ phục hồi mạnh mẽ tại các thị trường chính như Mỹ, châu Âu và Trung Quốc Điều này mở ra nhiều cơ hội cho người nuôi, giúp họ tăng thu nhập nếu đảm bảo nguồn cung thủy sản chất lượng.

Sức sản xuất bền bỉ của ngành nông nghiệp đã tạo nền tảng vững chắc cho nhiều mặt hàng xuất khẩu, giúp chúng liên tục lập kỷ lục trong bảy tháng đầu năm Điển hình là các ngành hàng xuất khẩu nổi bật.

Trong bảy tháng đầu năm 2023, kim ngạch xuất khẩu rau quả của Việt Nam đạt 3,23 tỷ USD, tăng 68,1% so với cùng kỳ Xuất khẩu gạo đạt 2,58 tỷ USD, tăng 29,6%, trong khi cà-phê đạt 2,76 tỷ USD, tăng 6% Trung Quốc, Mỹ và Nhật Bản tiếp tục là ba thị trường xuất khẩu nông, lâm, thủy sản lớn nhất của Việt Nam, với giá trị xuất khẩu sang Trung Quốc chiếm 21,9%, tăng 12,5% so với năm trước.

Ngày đăng: 12/01/2024, 20:54

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w