1. Trang chủ
  2. » Luận Văn - Báo Cáo

Khóa luận tốt nghiệp Mạng máy tính và truyền thông: Phân loại và đánh giá chất lượng gạo dựa trên mô hình học sâu

67 8 0
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Phân loại và đánh giá chất lượng gạo dựa trên mô hình học sâu
Tác giả Lai Thien Hai, Nguyen Trung Thuc
Người hướng dẫn ThS. Thai Huy Tan, ThS. Tran Thi Dung
Trường học Trường Đại học Công Nghệ Thông Tin
Chuyên ngành Mạng Máy tính và Truyền thông
Thể loại Khóa luận tốt nghiệp
Năm xuất bản 2023
Thành phố TP. HCM
Định dạng
Số trang 67
Dung lượng 36,42 MB

Nội dung

Nội dung đề tài:Mục tiêu nghiên cứu: Xây dựng được một mô hình máy học có khả năng phân loại chính xác loại gạo đồng thời đánh giá chất lượng hạt gạo.. Kết quả mong đợi của đề tài: Xây d

Trang 1

ĐẠI HỌC QUOC GIA TP HO CHÍ MINH TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN KHOA MẠNG MAY TÍNH VÀ TRUYEN THONG

LAI THIEN HAI - 19520508 NGUYEN TRUNG THUC - 19521008

KHÓA LUẬN TÓT NGHIỆP

PHAN LOẠI VÀ DANH GIÁ CHAT LUQNG GAO

DUA TREN MO HINH HOC SAU

RICE CLASSIFICATION AND QUALITY ASSESSMENT

BASED ON DEEP LEARNING MODEL

KY SƯ NGÀNH MẠNG MAY TÍNH VA TRUYEN THONG DU LIEU

GIANG VIEN HUONG DAN

ThS THÁI HUY TAN ThS TRAN THI DUNG

TP HO CHÍ MINH, 2023

Trang 2

LỜI CẢM ƠN

Trước tiên, chúng em xin chân thành bày tỏ lời cảm ơn đến Ban giám hiệu, quý thầy cô và mọi người trong trường Đại học Công Nghệ Thông Tin.

Nhờ vào sự đóng góp của mọi người, chúng em đã có cơ hội tham gia và phát

triển bản thân trong một môi trường học tập thú vị và tràn đầy năng lượng Bên

trong đó chúng em cũng xin đặc biệt cảm ơn các thầy cô của khoa Mạng máy

tính và Truyền thông đã dành sự quan tâm, tận tình giảng day, hướng dẫn chúng

em trong suốt quá trình học tập của mình.

Lời cảm ơn tiếp theo chúng em xin dành đến cho thầy Lê Kim Hùng, người đã định hướng từ giai đoạn đầu giúp chúng em có hướng đi đúng đắn.

Bên cạnh đó, chúng em cũng đặc biệt gửi lời cảm ơn chân thành đến thầy Thái

Huy Tân và cô Trần Thị Dung, trong suốt quá trình thực hiện khóa luận, sự hỗ trợ và tâm huyết của thầy cô giúp cho chúng em có thé hoàn thành nghiên cứu

đúng tiến độ và tốt nhất trong khả năng của mình.

Sau cùng, lời cảm ơn và sự tri ân sâu sắc nhất chúng em xin được gửi đến

bố mẹ, anh em, gia đình, những người đã luôn đồng hành, khích lệ, động viên cũng như hỗ trợ, tạo mọi điều kiện về vật chất lẫn tinh thần và là điểm tựa vững

chắc cho chúng em trong suốt thời gian học tập của mình.

Toàn bộ sự nỗ lực, tâm huyết của chúng em trong thời gian qua đã đúc

kết vào trong bài khóa luận này Tuy nhiên, những nhằm lẫn, sai sót trong việc

trình bày và trong kiến thức là không thể nào tránh khỏi, mong rằng các thầy cô

sẽ xem xét và chỉ bảo cho chúng em.

Một lần nữa chúng em xin chân thành cảm ơn!

TP.HCM, ngày tháng năm 2023 Sinh viên 1 Sinh viên 2

(Ký tên và ghi rõ họ tên) (Ký tên và ghi rõ họ tên)

Trang 3

ĐẠI HỌC QUOC GIA TP HO CHÍMINH CỘNG HÒA XÃ HỘI CHỦ NGHĨA

TRƯỜNG ĐẠI HỌC VIỆT NAM

CÔNG NGHỆ THÔNG TIN Độc Lập - Tự Do - Hạnh Phúc

Cán bộ hướng dẫn: ThS Thái Huy Tân, ThS Tran Thị Dung

Thời gian thực hiện: Từ ngày 27/2/2023 đến ngày 12/6/2023

Sinh viên thực hiện:

Lai Thiên Hải — 19520508

Nguyễn Trung Thực — 19521008

Trang 4

Nội dung đề tài:

Mục tiêu nghiên cứu:

Xây dựng được một mô hình máy học có khả năng phân loại chính xác loại

gạo đồng thời đánh giá chất lượng hạt gạo Sau đó, tiến hành triển khai thành một ứng dụng Web cung cấp cho người dùng Ngoài ra, đề tài này chúng em

còn hướng tới việc triển khai thử nghiệm mô hình này trên máy tính nhúng (Raspberry Pi 4B và Jetson Nano), từ đó tạo tiền đề dé có thé xây dựng 1 thiết

bị nhỏ gọn cho phép phân loại chất lượng hạt gạo.

Đối tượng nghiên cứu: Tập dữ liệu hình ảnh về các loại gạo.

Pham vi nghiên cứu: 8 loại gạo và 5 nhóm chất lượng gạo.

Phương pháp thực hiện:

Nội dung 1: Thu thập dữ liệu

Mục tiêu:

Thu nhập các loại dataset, phân loại và kiểm định dé tăng sự phong phú và dal

dang hóa dữ liệu Bên cạnh đó, khảo sát các loại mô hình thuật toán được sty dung cho dataset đó.

Phương pháp:

— Tham khảo những nghiên cứu đã thực hiện.

— Thu thập dữ liệu và dataset trên Internet từ các trang như Github,

Trang 5

Mục tiêu:

Tham khảo về các mô hình học sâu về phân loại gạo, chọn mô hình phù hop!

để tiến hành xây dựng va đưa ra dự đoán anh | hạt gạo thuộc loại nào.

Phương pháp:

— Tham khảo các bài báo nước ngoài liên quan đến phân loại thông qual

Google Scholar.

— Tìm hiểu các mô hình học sâu: MobileNetVI và VGG-16Net [3],|

Convolutional Neuron Network (CNN) [3][4], MobileNetV2 [5]

— Tiến hành huấn luyện lại các mô hình học sâu trên bằng Tensorflow

và so sánh kết quả với bài báo, link tham khảo.

— Chọn mô hình MobileNetV2 đồng thời kết hợp mã nguồn xử lí đữ liệu|

ở [5] dé xây dựng và huấn luyện mô hình trên tập dữ liệu hình ảnh gạo

[5].

— Chia dữ liệu gạo theo tỉ lệ train: valid: test (7: 2: 1) Từ ảnh gồm nhiều

hạt gạo (cùng loại), chạy thuật toán để tách từng hạt ra thành | ảnh| riêng biệt Sau đó augmentation dữ liệu để tăng số lượng dữ liệu gạo|

lên bằng cách xoay ảnh 1 hạt gạo theo nhiều hướng.

— Tiếp theo, tiền xử lí dữ liệu thông qua albumentation va đặt lại kích|

thước ảnh theo chuẩn có định là 128 x 128 và chuyên đổi dữ liệu mỗi

pixel từ 0 — 255 theo khoảng [0, 1].

— Xây dựng mô hình MobileNetV2, huấn luyện và đánh giá mô hình.

— Tiến hành Fine Tune mô hình để tăng độ chính xác sau khi hội tụ.

— Cuối cùng, đưa ra dự đoán cho ảnh (1 hạt gạo).

Kết quả dự kiến:

Xây dựng thành công model với tỉ lệ dự đoán chính xác loại gạo 80 - 85 % Nội dung 3: Mở rộng mô hình học sâu

Mục tiêu:

Trang 6

Từ mô hình phân loại gạo đã thực hiện được, pi

dataset mới nhằm đưa ra dự đoán về chất lượng

Phương pháp:

— Bước 1: Từ tap dataset cũ, gan nhãn thị

một loại gạo theo 5 nhóm sau: healt

chalky, discolored (bình thường, vỡ, tổn thương, vôi hoá, 6 màu).

— Bước 2: Huấn luyện các mô hình MobileNetV2, AlexNet, VGG16,

ResNet50, InceptionV4, EfficientNetB4

đánh giá chất lượng mô hình thông qua c:

— Bước 3: Nếu bước 2 cho kết quả tốt, thực hiện lại cho các loại gạol

khác Ngược lại, tiến hành gia tăng tập

thức ở bước 1.

Kết quả dự kiến:

Xây dựng thành công các mô hình hoc sâu với khả năng đưa ra dự đoán cd

độ chính xác cao (85 — 90%) về chất lượng hạt gạo.

Nội dung 4: Tạo ứng dụng Web

Mục tiêu:

Cho phép người dùng upload anh 1 hạt gạo bất kỳ lên hoặc chụp anh 1 hạt

gạo thông qua Camera trên Raspberry Pi 4B, Jetson Nano và sẽ nhận được lại

ảnh hạt gạo đã qua xử lí và tên chất lượng của h

Phương pháp:

— Dựng giao diện bằng HTML, CSS, JS gồm các thành phan sau: thông

tin nhóm, chức năng upload và chụp ảnh.

— Backend được viết bằng framework Fl

hình đã xây dung Lúc nay server xử lí ảnh hạt gạo dé dự đoán Cuối cùng trả tên chất lượng của hạt gạo đến người dùng.

hát triển mô hình với một tập

hạt gạo.

ủ công cho các hình anh cual

hy, broken, normal damage,

trén tap dataset va dua ral

Trang 7

Kết quả dự kiến:

Dua ra dự đoán đúng về anh mà người dùng upload hoặc chụp lên server.

Nội dung 5: Đánh giá, tối ưu mô hình và triển khai server lên Raspberry Pi

4B và Jetson Nano

Mục tiêu:

Đánh giá những mô hình nào cho kết quả F1-score tốt, sau đó tiến hành tối|

ưu hoá các mô hình đó dé giảm thời gian đưa ra dự đoán trên Raspberry Pi 4B và Jetson Nano nhưng vẫn bảo đảm tỉ lệ chính xác của việc dự đoán.

Phương pháp:

— Đánh giá lại 6 mô hình qua thông số Fl-score trên mỗi loại gạo Tiếp

theo, chọn những mô hình cho kết quả tốt về phân loại chất lượng gạo|

để chuyển đổi sang dạng TFLite và TensorRT để tối ưu về dung|

lượng, thời gian dự đoán của mô hình.

— Đánh giá hiệu năng của mô hình trên Raspberry Pi 4B và Jetson Nan

thông qua các chỉ số: CPU (%), nhiệt độ máy tính (°C), Memory|

(MB), thời gian xử ly | anh (fps) của 6 mô hình.

— Triển khai mã nguồn server Flask lên Raspberry Pi, Jetson Nano val

gắn camera.

Kết quả dự kiến:

Ở máy tính nhúng, server xử lí được ảnh mà người dùng gửi đến với tỉ lệ mỗi| khung hình trên giây cao đồng thời vẫn đảm bảo được tính chính xác của| việc dự đoán đến 85 — 90%.

Kết quả mong đợi của đề tài: Xây dựng thành công ứng dụng Web áp dụng

kỹ thuật học sâu cho phép phân loại và đánh giá chất lượng gạo với độ chính xác cao khi người dùng gửi một tâm ảnh hạt gạo lên Từ đó triển khai mô hình lên máy tính nhúng và tạo ra 1 cái hộp nhỏ gọn dùng dé phân loại gạo khi

Trang 8

người dùng cho một hạt vào trong.

27/3/2023 — Lai Thién Hai

Huân luyện mô hình mở rộng

17/4/2023 — | Triển khai mã nguồn server lên Raspberry | Nguyễn Trung Thực

1/5/2023 | Pi và đánh giá hiệu năng các mô hình

2/5/2023 — Cả 2

12/6/2023

Hoàn thành luận văn

Trang 9

Xác nhận của CBHD TP HCM, ngày tháng năm 2023

Sinh viên 1 Sinh viên 2

ThS Thái Huy Tân Ths Trần Thị Dung |Lai Thiên Hải Nguyễn Trung Thực

Trang 10

MỤC LỤC

TOM TAT KHÓA LUẬN 2222:+-2222222222222222111312122222211111 2211111 re 1

Chương 1 MO ĐẦU -222-2222229222222222221112222111122711112271112221112 2.111 ce 2 1.1 Lí do chọn đề tài 222222222222222225222E22222211122 E222 rrrrrrrrrrrrrrrrrrrrrri 2

1.2 Mục đích nghiÊn CỨU - ¿+ tt TT HH ri 3

1.3 Đối tượng nghiên cứu

1.4 Phạm vi nghién CỨU ¿5+ +22 2k2 2E 212 g1 3

Chương 2 TONG QUAN

2.1 Các công trình nghiên cứu về bài toán phân loại gạo - -: 4

2.2 Các công trình nghiên cứu về bài toán phân loại chất lượng gạo

Chương 3 DU LIEU VÀ PHƯƠNG PHÁP -2 ©22222+2222+2zttevEveerrrrrscee 14

3.1 Dữ liệu

3.1.1 Dữ liệu cho bài toán phân loại gạO - - - +25 +5 *£ztzkeeexerrkrkerer 14

3.1.2 Dữ liệu cho bài toán phân loại chất lượng gạo «cccccx+eererrree 15 3.2 Mô hình triển khai -cvcccccccccctvctttttt22181EE1E tre 21 3.2.1 Tổng quan mô hình triển khai -2¿:¿£22222Vvvv+++tEEEEvvvrvrrrrrrrrrree 21

3.2.2 Các mô hình hoc sâu sử dụng - ¿+ + ket 22 3.2.2.1 AlexNNet HH Hà re 22 3.2.2.2 VGGIÓ Ă St th HH 1 111tr 23 3.2.2.3 ResNetÕ5U HH 111 tre 24 3.2.2.4 MobileNetV2 ác tt” HH hp 25 3.2.2.5 EfficientNetB4 cLHnHHHHHH HH hàn 26

3.2.2.6 Inception V4 oo 27

Chương 4 KET QUA ceecsssecsssssssessssssssssssssesessssssssssssssessssusscsssssssesssssesesssueseessseescessies 29

Trang 11

4.1 Chỉ số đánh giá -2222c222 2 222211112222111222211112221111 21111112 re 29 4.2 Kết quả thử nghiệm

4.2.1 Kết quả thử nghiệm trên bài toán phân loại gạo -+ 30 4.2.2 Kết quả thử nghiệm trên bài toán phân loại chat lương gạo

4.2.2.1 Hiệu suất phân loại chất lượng gạo ¿ +c¿+222v+crscrvseeerrr 32 4.2.2.2 Đánh giá mô hình trên thiết bị cận biên.

4.3 Hiện thực hệ thống 22 ©E+2+t2EE2122122211122711112272112 227111 E1 re 45 4.3.1 Mô tả hệ thống

4.3.2 Đặc tả giao diện ứng dụng Web ¿- - + St Sxk tt TH g1 rưy 46

4.3.2.1, Trang bắt đầu svccccccvcccc cover 46

4.3.2.2 Trang chọn ảnh -¿- +22 St te 47

4.3.2.3 Trang kết quả 22222c22222122E22111EE2211 E11 cerrrkrreeg 49

4.3.3 Thiết bị thực tẾ ccccccc tt 0012222222211 Tri 49 Chương 5 KET LUẬN -222222£2222EE2222+t22222222322E2E22222132 rrrrrrrrrree 52

5.1 Ưu điểm ccccc 2E vn grrrrirre 52 5.2 Khuyết điểm -222c:22222222222111122221122222111 2221111 E1 re 52 5.3 Hướng phát triỀn -:-22+2V+++22EE+++t222211E22111122211122111112221 re, 52 TÀI LIEU THAM KHẢO -222-2222222EE+229222211222211122211112222112 222122 xe 53

Trang 12

DANH MỤC HÌNH

Hình 3.1: Ảnh gốc của tập dữ liệu gạo I121 ¿- 2-52 + ++£+Ee£Eerkerxerxersrree 14

Hình 3.2: Các loại chất 0o 16

Hình 3.3: Ví dụ về các chức năng sử dụng trong Albumentations và chuan hoá 20

Hình 3.4: Kiến trúc hệ thống +2 2£©5£ E£SE£EE£2EEEEEEEEEEEEEEEEEEEEEEEEEEkrrkrrkrrei 21 Hình 3.5: Kiến trúc mô hình AlexNet [2/7] , 225211111111 1v ven re 23 Hình 3.6: Kiến trúc mô hình VGG16 [29] -2¿ 2£ ©2£+EE++E£+£x++£xzzxrxeree 24 Hình 3.7: Kiến trúc mô hình ResNet50 [3 1] - -cc¿-cc+cccrrxerrrrrrrrrrrrrree 25 Hình 3.8: Kiến trúc mô hình MobileNetV2 [33] -. - ¿22+ t+t+EeEzxsEerzezeee 26 Hình 3.9: Các kiểu chia tỉ lệ trong mô hình EfficientNet .: -: =5+ 27 Hình 3.10: Kiến trúc mô hình tổng quát Inception V4 2 ¿©sz2s+cs+zxzsz 28 Hình 4.1: Ma trận lỗi trên tập Í 121 -. ¿- ¿©2552 5++2++£++z++z+xerxerxerxerxereeree 38 Hình 4.2: Ma trận lỗi trên 0700 39

Hình 4.3: Ma trận lỗi trên tập Soma MaSOOTI - 55 +5 *++E+seeEseeeesereeeers 39 Hình 4.4: Một số ví dụ về các ảnh bị dự đoán sai cc:cccccsccxvererrveere 40 Hình 4.5: Biểu đô tiêu thụ bộ nhớ của mô hình trên Raspberry Pi 41

Hình 4.6: Biểu đồ tiêu thụ bộ nhớ của mô hình trên Jetson Nano - 42

Hình 4.7: Biểu đồ sử dụng CPU của mô hình trên Raspberry Pi - 42

Hình 4.8: Biểu đồ tiêu thụ bộ nhớ của mô hình trên Jetson Nano -: 43

Hình 4.9: Biểu đồ nhiệt độ của mô hình trên Jetson Nano 2 5 s+s+s+z 43 Hình 4.10: Biểu đồ nhiệt độ của mô hình trên Raspberry Pi - 5-52 44 Hình 4.11: Biểu đồ FPS của 2 mô hình trên Raspberry Pi và trên Jetson Nano 44 Hình 4.12: Mô hình hệ thống thực tẾ - 2-22 +¿++2+++Ex+2EEt2EEtEEterxrzrxerresree 45 Hình 4.13: Giao diện trang bắt đầu - ¿- ¿ ¿©tSE#EE#EESEEEEE2E2E2E2EEEerkrrkrree 46

Hình 4.14: Giao diện trang chọn ảnh s3 33x E**kESeEEseereeeeereeeereere 47

Hình 4.15: Danh sách ảnh được trả vé từ S€TV€T -¿2- 52 +x+E+E£EE+E+EeEEEE+Eererezeee 47

Hình 4.16: Giao diện trang khi chọn xong ảnhh 5 + s+*sk+seexeeeseeers 48

Hình 4.17: Giao diện trang kết quả - 2 2¿+¿+++2E++EE+2EEt2EEtrEterxrzrxerreeree 49 Hình 4.18: Tổng quan về thiết bị - 2 5¿++£2EE+2EE+EE+2EEEEEtEEterxrrrkrrresree 50

Trang 13

Hình 4.19: Phía sau hộp «+ c<csec<«e Hình 4.20: Đèn báo hiệu khi server nhận thành công

Trang 14

Bảng 2.1:

Bảng 2.2:

Bang 3.1:

Bang 3.2:

Bang 3.3:

Bang 3.4:

Bang 3.5:

Bang 3.6:

Bang 4.1:

Bang 4.2:

Bang 4.3:

Bang 4.4:

DANH MUC BANG

Tóm tat các bài báo về phân loại gạo - 2-2 2 + cxe£xeEerzrszrzed 6 Tóm tắt các bài báo về phân loại chất lượng gạo -5+ 11 Thống kê số lượng ảnh gạo -2: 22 5222x2E++EE+2ExSExerrrerxesrxee 15

Số lượng ảnh của tập 1121 sau khi tăng cường và chia dữ liệu 17

Số lượng ảnh của tập PR-11 sau khi tăng cường và chia dữ liệu 17

Số lượng ảnh của tập Sona Masoori sau khi tăng cường và chia dữ liệu.1§ Mô tả các chức năng sử dung trong Albumentations - 19

Yêu cầu về kích thước ảnh của 6 mô hình được đề xuất - 19

Kết quả điểm F1 của các mô hình trên tập 8 loại gạo - 30

Kết quả điểm F1 của các mô hình trên tập gạo 1121 - 32

Kết quả điểm F1 của các mô hình trên tập gạo PR-I I - 34

Kết quả điểm F1 của các mô hình trên tập gạo Sona Masoori 36

Trang 15

DANH MỤC TỪ VIET TAT

Từ Nội dung

CPU Central Processing Unit

SVM Support Vector Machine

ANN Artificial Neural Network

DNN Deep Neural Network

AdaBoost | Adaptive Boosting

ResNet Residual Network

DT Decision Tree

VGG Visual Geometry Group

RGB Red Green Blue

PNN Probabilistic Neural Network

HOG Histogram of Oriented Gradients

ILSVRC _ | ImageNet Large Scale Visual Recognition Challenge

Web Website

TFLite Tensorflow Lite

PLS-DA | Partial least squares-discriminant analysis

Trang 16

TOM TAT KHÓA LUẬN

Đi lên từ một quốc gia nông nghiệp lúa nước, Việt Nam nước ta hiểu rõ tamquan trọng về giá tri lương thực và giá tri kinh tế của hạt gạo Các thành tựu khoa

học về cơ khí, máy móc đã được ứng dụng rộng rãi trong khía cạnh canh tác và sản

xuất đem lại những hiệu quả nhất định về sản lượng và chất lượng, giúp cho giá trị

hạt gạo ngày càng tăng cao Gần đây, với sự phát triển mạnh mẽ của trí tuệ nhântạo, học máy và học sâu, các nghiên cứu về việc sử dụng các công nghệ này trong

việc phát triển hạt gạo ngày càng tăng, mang lại một cơ hội tiềm năng cho việc cảithiện chất lượng hạt gạo hơn nữa

Trong khóa luận này, hệ thống đánh giá chất lượng một hạt gạo thông qua

mô hình học sâu sẽ được đề xuất như một cách cải thiện tốc độ trong giai đoạn sausản xuất hạt gạo thông qua công nghệ mới Trước tiên, chúng em tập trung vào

nghiên cứu khả năng nhận diện và phân loại các hạt gạo thuộc những chủng loại

khác nhau Sau đó, trở lại với mục tiêu chính của hệ thống sẽ là nghiên cứu những

mô đun với khả năng đánh giá mức độ chất lượng của một hạt gạo Với mục tiêu

đưa ra độ chính xác của các dự đoán lớn hơn từ 5 - 10% so với bài báo đã cung cấptập dữ liệu hạt gạo, chúng em đã huấn luyện trên 6 mô hình học sâu Sau đó, cácthông số kĩ thuật của mô hình tốt nhất sẽ được đo trên thiết bị cận biên và được sửdụng để đánh giá tính thực tiễn

Khi hoàn thành, khóa luận sẽ đề xuất một hệ thống đánh giá chất lượng một

hạt gạo dựa vào việc sử dụng các mô hình học sâu Triển khai hệ thống sẽ đượcthực hiện trên trình duyệt và có thé mở rộng ra thiết bi cận biên giúp cho người

dùng có thể dễ dàng tiếp cận và sử dụng Hệ thống dự đoán này theo dự kiến sẽ là

tiền đề cho việc nghiên cứu cải thiện tốc độ sau sản xuất của gạo Từ đó mở rộngsang hệ thống nhúng với khả năng tích hợp bài toán phân loại và đánh giá chất

lượng.

Trang 17

Chương 1 MỞ DAU

1.1 Lí do chọn đề tài

Công nghệ thông tin đang phát triển rất nhanh chóng Sự phát triển này chính

là nền tảng của tương lai, nguyên nhân chính là sự xuất hiện của trí tuệ nhân tạo Trí

tuệ nhân tạo đã cải tiến, thay thế các công đoạn thủ công, có tính lặp lại của conngười Trí tuệ nhân tạo còn xuất sắc trong việc nhận diện và đánh giá hình ảnh, tiềmnăng ứng dụng vào cuộc sống là không hề nhỏ Do đó, nhiều công cụ hữu ích đãđược phát triển và đưa vào thực tiễn

Với dân số toàn cầu trên 8 tỉ người, yêu cầu về đảm bảo đủ lương thực cungcấp cũng như chất lượng thực pham ngày càng cao Gạo là một loại lương thực cótam quan trọng không hé nhỏ khi là thức ăn phô biến của rất nhiều quốc gia, đặc

biệt các nước châu Á Ở Việt Nam, là một nước xuất khẩu gạo luôn nằm trong top 5

của thế giới, có thể kê đến khối lượng gạo xuất khẩu năm 2021 của nước ta đạt 6.2

triệu tấn với giá trị đạt 3.2 ty USD [1], việc san xuất gạo không chỉ mang yếu tố duy

trì lương thực mà còn là nguồn kinh tế không hề nhỏ Dé luôn đảm bảo nguồn lợi

nhuận này, chất lượng hạt gạo phải được giữ ở mức tốt nhất Do đó, phát triển

nghiên cứu đê ứng dụng trí tuệ nhân tạo vào lĩnh vực này là điêu tât yêu.

Rat nhiều phương pháp và cách thức cải tiến khác nhau đã được đưa ra và ápdụng nghiên cứu với trí tuệ nhân tạo trong việc cải thiện chất lượng gạo Ta có thể

kê đến một số nghiên cứu như cải thiện giai đoạn trồng trọt, xác định sâu bệnh từsớm, tính toán năng suất được tạo ra, Trong khóa luận này, chúng em dé xuất mộtphương pháp nham cai thiện chất lượng và đây nhanh quá trình sau sản xuất, đó là

phân loại và đánh giá chất lượng gạo Với khả năng nhận diện gạo cả về mặt nguồn

gốc lẫn chất lượng, việc sàng lọc và phân loại sẽ hoạt động nhanh hơn, hiệu quả

hơn Từ đó, giá trị hạt gạo sẽ được cải thiện và nâng cao năng suât lao động.

Trang 18

1.2 Mục đích nghiên cứu

Trong bài khóa luận này, mục tiêu nghiên cứu được đặt ra là xây dựng một hệ

thống đánh giá chất lượng hạt gạo với các chi tiết cụ thể như sau:

— Áp dụng kỹ thuật học sâu để xây dựng một mô đun với khả năng nhận diện

loại gạo từ hình ảnh với độ chính xác cao hơn bài báo cung cấp đữ liệu 5 — 10%.

— Mở rộng nghiên cứu với 6 mô hình học sâu với khả năng đánh giá chất lượng

một hạt gạo thông qua hình ảnh Từ đó phân tích và đánh giá độ chính xác

của các mô hình thu được rồi chọn ra mô hình tốt nhất để tối ưu và triển khai

lên các thiết bị cận biên, cụ thé là Raspberry Pi 4B với Jetson Nano.

1.3 Đối tượng nghiên cứu

Dựa vào các mục tiêu được đặt ra ở trên, các đối tượng nghiên cứu chủ yếu là:

—_ Tập dữ liệu về ảnh các hạt gạo An Độ gồm 8 loại gạo khác nhau và 5 nhóm

Khóa luận sẽ được nghiên cứu trong phạm vi các tập dữ liệu ảnh đã được xin

phép sử dụng từ Mushahid Shanim qua bài báo [2] Chúng em sẽ tiến hành phân loại nguồn gốc và đánh giá chất lượng gạo dựa trên ảnh của một hạt Đối việc xác

định chất lượng sẽ dựa vào màu sắc của hạt gạo và vấn đề này sẽ được nói rõ ở mục

3.1.2.

Trang 19

Chương 2 TONG QUAN

Việc xác định hướng đi một cách rõ ràng và chính xác chính là chìa khóa để đến với được mục tiêu đã đề ra Do đó, bài luận văn này chúng em tham khảo 20 bài báo

gồm những nghiên cứu về mô hình học sâu trong việc phân loại gạo và đánh giá chất lượng hạt gạo.

2.1 Các công trình nghiên cứu về bài toán phân loại gạo

Trước tiên là về các nghiên cứu phân loại hạt gạo Đề đạt được phương pháp xác

định chính xác độ thuần chủng của gạo, bài báo nghiên cứu của Nadia Ansari và các cộng sự [3] được tiến hành bằng cách sử dụng các loại gạo bao gồm “BR 11”,

“BRRI dhan 28” và “BRRI dhan 29” Hình ảnh đầu vào được chụp từ camera RGB cùng 20 đặc điểm chính (với 7 đặc điểm màu sắc, 9 đặc điểm hình thái và 4 đặc

điểm cấu trúc) được trích xuất ra Tác giả sử dụng 375 hình ảnh về 3 loại gạo trên

để tạo ra một tập dữ liệu sử dụng cho việc đưa vào huấn luyện cho các mô hình

khác nhau gồm PLS-DA, SVM-C và KNN Kết quả chính xác của các mô hình lần

lượt là 83.8%, 93.9% và 87.2% Tiếp theo là quá trình nghiên cứu của bài viết thực hiện bởi P T T Hong và các cộng sự [4] nhóm tác giả trình bày hệ thống phân loại

gạo tự động Hình ảnh của sáu loại gạo khác nhau ở miền Bắc Việt Nam đã được

thu thập và phân tích Sử dụng phương pháp RF với kỹ thuật trích xuất đặc trưng đơn giản, thực nghiệm đã chứng minh độ chính xác trung bình của hệ thông phân loại có thé đạt tới 90.54% Kết quả này chứng minh rằng hệ thống này có thể được

sử dụng dé phát triển hệ thống thị giác máy tính đề đánh giá tự động độ thuần chủng của hạt gạo.

Bên cạnh đó, một số nghiên cứu được thực hiện để phân loại gạo thông qua mô

hình ANN Thông qua bài báo của P Liu và các cộng sự [5], nhờ tính hiệu quả

trong việc hiện thực hóa chức năng ánh xạ từ đầu vào đến đầu ra, phân loại dựa trên

ANN có khả năng xử lý các vấn đề liên quan đến các quy trình phức tạp Tính năng tổng quát hóa của ANN cũng có thể được sử dụng cho các mô hình lớn với nhiều

thông số khác nhau Nghiên cứu [6] được thực hiện tại Đại học Hồi giáo Azad, chi

Trang 20

nhánh Shahr-e-Rey, Pazoki và các cộng sự đã tạo ra mô hình phân loại 5 loại gạo

chính trồng ở các môi trường khác nhau tại lran Ảnh của từng hạt gạo sẽ trích xuất

ra 24 đặc trưng màu sắc, 11 đặc trưng hình thái và 4 đặc trưng hình dạng Sau đó,dựa theo mô hình MLP và mang neuro-fuzzy neural, hạt gạo có thé được phân loại

Kết quả thí nghiệm chỉ ra rằng mức độ chính xác trung bình đạt được ở phân loại

các giống lúa là 99.46% và 99.7% lần lượt với MLP và mạng neuro-fuzzy neural

Không những thế, nhiều bài báo đã sử dụng DNN để nhận dạng gạo Với khả

năng trích xuất đặc điểm tự động, học sâu nâng cao hiệu suất trong việc phát hiện

và phân loại [7] Nghiên cứu trong [2] đã đề xuất một cau trúc CNN dé phân loạitám loại gạo Mỗi ảnh có kích thước 3507 x 2550 pixel, gồm có khoảng 100 - 200hạt gạo riêng lẻ, được quét và phân đoạn thành các ảnh hạt riêng lẻ bang thuật toán

Canny Edge Detection Ngoài ra, bài báo cung cấp thêm 6 đặc trưng hình thái để

huấn luyện gồm KNN, DT va ANN dé so sánh hiệu suất với mô hình đề xuất Kếtquả thực nghiệm cho thấy độ chính xác trung bình của CNN, DT, KNN, ANN lànlượt là 77%, 52%, 48% và 51% Itthi Chatnuntawech và cộng sự [8] cũng đã kếthợp CNN và hình ảnh siêu phô đề phân loại gạo Bài báo sử dụng hai bộ dữ liệugồm gạo qua xử lí với 6 loại và gạo chưa qua xử lí với 4 loại Họ đã áp dụng hệthống hình anh siêu quang phổ dé chuyền đổi hình ảnh thành khối dit liệu Sau đó,

họ so sánh mô hình đề xuất (ResNet-B) với 3 biến thể SVM (có đặc trưng khônggian, đặc trưng phổ và đặc trưng không gian - phổ) Kết quả nhận được với đặctrưng không gian - quang phổ, mô hình ResNet - B đạt độ chính xác phân lớp cho

tập dữ liệu gạo chưa qua xử lý là 91.09% so với SVM là 79.8%.

Hơn cả thế, nhiều dạng mô hình khác nhau đã được kết hợp trong việc phân loại

gạo Murat Koklu và các cộng sự [9] đã sử dụng các đặc điểm của gạo bao gồm kếtcấu, hình dang và màu sắc dé phát triển mô hình phân loại Sử dung 5 loại gạo khácnhau bao gồm "Arborio", "Basmati", "Ipsala", "Jasmine" và "Karacadag" với tổng

cộng 75000 hình ảnh, 15000 ảnh từ mỗi loại gạo này đã được đưa vào bộ dữ liệu.

Từ bộ số liệu trên đã trích xuất ra được 106 đặc điểm của gạo gồm 12 đặc điểmhình thái, 4 đặc điểm kiêu dang và 90 đặc điểm màu sắc Bài nghiên cứu huấn luyện

Trang 21

các mô hình theo các thuật toán sau: ANN, DNN va CNN Các mô hình được đào

tạo đã mang lại thành công với chỉ số chính xác lần lượt là 99.87% cho ANN,99.95% cho DNN và 100% cho CNN Với kết quả trên đã chứng minh sự thànhcông của đề tài và có thé áp dụng các mô hình này dé phân loại giống lúa Mục tiêu

của bài báo trong [9] là phân biệt hạt gạo Cammeo và Osmancik từ Thổ Nhĩ Kỳ.Tổng cộng 3810 hình ảnh gạo được cung cấp và 7 đặc điểm hình thái được tríchxuất từ hình dé đào tạo Trong nghiên cứu, các tác giả đã sử dụng LR, MLP, SVM,

DT, RF, NB và KNN cho phân loại theo các tính năng được trích xuất Những mô

hình này đã đạt được thành công với tỷ lệ chính xác trên 90% Mục đích của bài viết

này [10] là cải thiện chất lượng nấu và ăn (cooking and eating quality - CEQ) bằngcách phát triển một công cụ phân loại nhanh Công cụ này được phát triển để xácđịnh các giống lai năng suất cao với các lớp CEQ tốt thông qua mô hình rừng ngẫunhiên, mạng thần kinh nhân tạo và máy vectơ hỗ trợ với độ chính xác lần lượt là63.9%, 69.4% và 69.4% Kết quả là mô hình đã được kiêm chứng, đồng thời có thê

áp dụng cho các hạt giống được trồng trong nhiều năm khác nhau và phù hợp nhất

dé dự đoán các kiểu hình CEQ tương tự phù hợp với “male sterile and pollenparents” Mô hình tiếp tục được sử dụng để xác định các dòng lai phù hợp với cácđặc tính của giống chất lượng cao dé đảm bảo sở thích của người tiêu dùng gạo

Bảng 2.1: Tóm tắt các bài báo về phân loại gạo

Năm

Tên bài báo xuất Hướng tiếp cận Kết quả

bản

Inspection of paddy seed Độ chính xác của

PLS-varietal purity using PLS-DA, SVM - C và | DA, SVM —- C và KNN

machine vision and 2021 KNN lần lượt là 83.8%,

multivariate analysis 93.9% va 87.2%

Comparative study on D6 chinh xac trung binh

vision based rice seed | 2015 | RF của hệ thống phan loại

varieties identification có thé đạt tới 90.54%

Trang 22

Classification of rice Độ chính xác trung bình

grain varieties using two 2014 MLP và mạng neuro- | 99.46% và 99.7% bang

artificial neural networks fuzzy neural MLP và mang (mlp and neuro-fuzzy) fuzzy neural

neuro-A deep convolutional ` , , Độ chính xác trung bình

Dé xuât một câu trúc neural network approach _| của CNN, DT, KNN,

2020 | CNN va so sánh với `

to rice grain purity ANN lân lượt là 77%,

KNN, DT và ANN

analysis 52%, 48% va 51%

Rice classification using " Đô chính xác của

Dé xuat sử dụng ResNet- Re Net-B tốt hơn 3 bié

io- , esNet-B tôt hơn 3 biên

spatio-spectral deep 2018 | B và so sánh với 3 biên hể SVM ,

Application of | 2021 | RF, ANN va SVM M6 hinh RF, ANN va

classification models in SVM với độ chính

screening superior rice xác lần lượt là 63.9%,

grain quality in male 69.4% va 69.4%.

sterile and pollen

parents

2.2 Các công trình nghiên cứu về bài toán phân loại chat lượng gạo

Bên cạnh việc phân loại, một cách khác dé tăng cường nghiên cứu là đánh giáchất lượng hạt gạo và đây cũng là mục đích chính trong các công trình nghiên cứu

Trang 23

sau Trong nghiên cứu [11] đã đề xuất một thuật toán máy tính dé phan loai chat

lượng hat gạo (cao cấp, hang A, hạng B và hang C) bang cách sử dung SVM da lớp

Sau khi tách vôi ra khỏi gạo, tỷ lệ gạo nguyên, gạo tắm và gạo mảnh được xác định

bằng cách sử dụng 10 đặc trưng hình học Phương pháp phân loại chất lượng với

SVM đạt độ chính xác trên 90% Dựa trên kết quả, bài báo kết luận rang hệ thốngsẵn sảng dé sử dụng cho việc phân loại và đánh giá các loại hạt gạo khác nhau dựatrên chất lượng bên trong và bên ngoài của chúng Trong [12], các tác giả đã sửdụng các mẫu gạo indica đỏ và đề xuất một hệ thống thị giác máy dé kiêm tra bốnlỗi (gãy, vôi hóa, ton thương và đốm) ở gạo Nghiên cứu sử dung hai máy phân loại

SVM dé xác định hạt gạo bị gãy và xác định vùng bị vôi hóa Các vùng bị tổn

thương và đốm trên hạt gạo được phát hiện bằng cách sử dụng các phương phápphát hiện cạnh và hình thái học Kết quả cho thấy, độ chính xác khi kiểm tra hạtgãy, vôi hóa, tôn thương và đốm lần lượt là 99.3%, 96.3% và 93.6% và thời gianchạy trung bình của hệ thống là 0.15 giây

Kavita V Horadi và các cộng sự [13] đã phát triển một phương pháp xác định

chất lượng hạt gạo Sử dụng thuật toán PNN cho hệ thống, nghiên cứu đã xác định

và phân loại ảnh gạo thành 3 loại gồm tốt, trung bình và xấu Kết quả nghiên cứu sửdụng PNN đã thành công khi bài báo đánh giá mô hình có thê triển khai trong nôngnghiệp với tỉ lệ chính xác (accuracy) trong huấn luyện là 100%, trong kiểm tra là97.89%, độ chính xác (precision) là 96.83% và độ thu hồi là 97.33% Ngoài bài báotrên, tác giả B Verma đã sử dụng dữ liệu bao gồm ba loại gạo Ấn Độ có tên là

"Markfed Supreme", "Markfed Golden" và "Hafed Basmati" trong nghiên cứu [14].

Mỗi loại gạo trích xuất 15-20 mẫu ảnh, mỗi mẫu ảnh quét được khoảng 500 hạt gạo,

các thông số như diện tích, chu vi, chiều dài tối đa, chiều rộng tối đa, độ nén, độ dàitối đa được xác định, ghi lại và tổng hợp theo hình dạng của gạo Qua đó, mô hìnhphân loại gạo được tạo ra với các thuật toán bao gồm BPTT và MLP dé huấn luyện

mô hình Kết quả thu được cho thấy hệ thống thị giác máy tính đã phát triển có théphân loại gạo thành hạt chắc, nứt, vôi hóa, vỡ và hư với độ chính xác 90-95% Một

framework tự động đánh giá chất lượng khác cũng được đề xuất để phân loại các

Trang 24

chất lượng gạo (đối màu, vôi hóa, vỡ, non, đỏ và hư hỏng) [15] Trong frameworknày, O C Agustin và cộng sự đã triển khai mô hình PNN dé phân loại các hạt gạo

bị lỗi Ngoài ra, họ đã phát triển một mô hình hồi quy tuyến tính dé ước tinh trọng

lượng gạo dựa trên diện tích đốm của hình ảnh gạo Kết qua phân loại PNN dat 94%

và mô hình hồi quy tuyến tính với hệ số xác định R? là 0,991.

Một bài viết khác [16] nhằm mục đích phân loại chất lượng của gạo, 5 loại chất

lượng gồm bình thường, vôi hóa, bán vôi hóa, vỡ, đổi mau và tổn thương Nghiên

cứu đã sử dụng EfficientNetBO, ResNet-50, InceptionV3, MobileNetV2 và

MobileNetV3 làm mô hình Deep-CNN dé dao tạo Kết quả kiểm tra qua 8048 hình

chất lượng cao cho thấy, EfficientNetB0 đạt các chỉ số cao nhất với độ chính xác

trung bình cho các các dự đoán loại gạo là 98.37% Tốc độ xử lí của mô hình

EfficientNetB0 cũng rất nhanh khi chi cần 0.122 giây dé dự đoán Nhìn chung,

nghiên cứu đã chỉ ra răng kiến trúc Deep-CNN áp dụng cho bộ dữ liệu hình ảnh gạo

chất lượng cao đã cung cấp một mô hình có độ chính xác tốt, có thé sử dụng dé danh gia chat lượng gạo hư hỏng trên thi trường một cách khách quan và chính xác.

So với các nghiên cứu khác, nghiên cứu này [17] đã sử dụng công nghệ xử lý

hình ảnh và thị giác máy tính để dự đoán chất lượng gạo Bằng cách sử dụngphương pháp kết hợp giữa phân đoạn và nhận diện cạnh, các nhà nghiên cứu có thê

phát hiện vùng phụ của hình ảnh có chứa gạo chồng lên nhau Sau đó, họ phát hiện

từng loại gạo bằng mạng thần kinh tích chập và cường độ pixel Dựa vào cácphương pháp trích xuất đặc trưng như HOG và KNN, phương pháp dựa trên bóng

đồ và ánh sáng ngoài và phương pháp dựa trên khúc xạ và CNN, một số thuật toán

phân vùng ảnh như Watershed segmentation, K-mean clustering, thuật toán SVM,

nghiên cứu có thê đưa ra phương pháp đánh giá chất lượng tự động, tốn ít thời gian

và hiệu quả hơn so với phương pháp thủ công Cụ thé là trong bài báo [18] đã déxuất mô hình Deep — Rice để đánh giá gạo trong nhiều điều kiện ánh sáng khác

nhau và cung cấp một tập di liệu quy mô lớn gọi là FIST — Rice (Future IntelligentSystem Technology) bao gồm 23386 ảnh để huấn luyện và 4680 ảnh để kiểm tra,trong đó, có 2 loại gạo (hoàn chỉnh và bị ton thương) trong 3 điều kiện ảnh sáng

Trang 25

khác nhau Tác giá đã kế thừa mô hình từ SphereFace [19] dé tao nén Deep — Rice,trong đó họ đã thay đổi hàm Softmax cho trường hop lớp nhị phân trong việc phânloại chất lượng của gạo Tác giả đã tiến hành đánh giá mô hình đề xuất của họ bằng

cách so sánh với phương pháp AdaBoost và SVM trên tập dữ liệu FIST — Rice Kết

quả cho thấy răng mô hình Deep — Rice đạt hiệu quả tốt hơn (trên 80%), AdaBoost

(66.99% - 69.02%) và SVM (62.69% - 65.71%) Mohan cùng với cộng sự [20] đã

xây dựng một hệ thống phân loại và đánh giá chất lượng gạo tự động sử dung kỹthuật xử lý ảnh kỹ thuật số cùng với thuật toán SVM và mô hình ANN Trongnghiên cứu, 2 loại gạo được sử dụng là Matta va Ponni va được phân theo bốn mức

độ (1 — 4) Sau khi trích xuất đặc trưng, có 7 đặc điểm hình học được sử dụng chothông tin đầu vào của 2 phương pháp được dé xuất và thông tin dau ra là chất lượng

và loại gạo Tỉ lệ chính xác của ANN là 83% và của SVM là 91%.

Việc phân loại và đánh giá hạt gạo đã được thực hiện bởi nhiều mô hình máyhọc cơ bản Tuy nhiên, các nhà nghiên cứu có một vấn đề mới cần xử lý chính làgiảm thiểu độ trễ Dé đạt được điều đó, các hệ thống nhúng là một phương pháphiệu quả dé áp dụng Những bài báo tiếp theo sử dụng các mô hình đã huấn luyệnlên các thiết bị cận biên dé hoàn thành mục đích là suy luận thời gian thực

Một hệ thong dựa trên xử lý hình anh tự động, thời gian thực va tiết kiệm chỉ phí

trên Raspberry Pi 3 đã được triển khai dé xác định hạt gạo từ Ấn Độ bằng SVM và

đánh giá chất lượng gạo [21] Đối tượng nghiên cứu sử dụng 15 loại gạo và được

chọn ngẫu nhiên 5 mẫu, mỗi mẫu có số hạt từ 40 - 60 hạt Sau khi trích xuất đặc

tính, mỗi loại gạo được dán nhãn 3 hạng (chất lượng cao, chất lượng trung bình và

chất lượng thấp) Chất lượng được đánh giá dựa trên thuật toán trong bài báo thông

qua thông số độ giãn dài của hạt Kết quả thực nghiệm cho thấy hệ thống đề xuấtđạt độ chính xác 93% và chỉ cần 2.4 giây để đánh giá 75 mẫu thử nghiệm Trong bàibáo [22], các tác giả đã phát triển một thiết bị cầm tay sử dụng SVM kết hợp

AdaBoost dé đánh giá các mẫu gạo (hạng cao cấp và hạng 1-5) Bài nghiên cứu sửdụng gạo Philippine với tổng số 340 mẫu hạt, 220 mẫu dé huấn luyện và 120 mau

dé kiểm tra, mỗi mẫu chứa hơn 200 hạt riêng lẻ Hệ thống sử dụng 7 mô hình SVM

10

Trang 26

cùng AdaBoost với các chức năng khác nhau Sau đó, một nền tảng được đề xuất

trong bài báo đã được xây dựng với Raspberry Pi dé phân loại chất lượng gạo và

hiển thị kết quả trên màn hình LCD (Liquid Crystal Display) Kết qua thử nghiệm

cho thấy hệ thống đạt được độ chính xác trung bình micro là 0.8667 và độ thu hồi

trung bình micro là 0.8667 với điểm FI là 0.8667 Bài nghiên cứu [23] triển khaimột hệ thống phân loại hạt gạo thành 4 loại: bình thường, nhăn, dém den, gay, đồngthời tiến hành so sánh với các mô hình phân loại hiện có như SVM, GoogleNet,ResNet152 Hai tập dữ liệu đầu tiên được sử dụng cho việc huấn luyện mô hình làgạo của Việt Nam được gán nhãn Kaggle và Data-world Oryza sativa của châu Á,

bộ dữ liệu tiếp theo được sử dụng cho việc xác nhận và kiểm tra mô hình là

Comprehensive Automation for Speciality Crops (CASC) Hệ thống sử dụng môhình được dao tạo trước AlexNet va áp dung hoc chuyén giao cho một mô hình mới

để xác định chất lượng gạo Đề đạt được việc suy luận ảnh thời gian thực, phầncứng của hệ thống được đề xuất bao gồm bộ xử lý National Instruments (NI) —

myRIO cùng với mô đun nhúng thị giác Google AIY Kết quả cho thấy mô hình

AlexNet vượt trội so với các mô hình hiện có khác về điểm số F1 là 97.2% so với

Classification and Độ chính xác của việc phan

grading rice using | 2013 | Multi-class SVM _ | chất lượng loại lên đến hơn

multi-class SVM 90%

Colored rice quality D6 chinh xac viéc phan loai

inspection system | 2019 | SVM chat lượng trên 90% với tốc

using machine vision độ xử lí chỉ 0.15 giây

lãi

Trang 27

Tỉ lệ chính xác (accuracy)

Rice grain quality trong huấn luyện là 100%,

determination using trong kiểm tra là 97.89%,

2021 |PNN

probabilistic neural độ chính xác (precision) là

networks 96.83% và độ thu hồi là

97.33%

Độ chính xác mô hình từ

Image Processing | 2010 phân loại chất lượng từ 90

-techniques for grading BPTT và MLP

95%

& classification of rice

Automatic milled rice Độ chính xác mô hình dem

2008 | PNN quality analysis lại là 94%

Deep CNN-based Độ chính xác trung bình

MobileNetV3 ` ; ,

dataset cân 0.122 giây đê dự đoán

Nghiên cứu này đề xuấtRice quality prediction 2020 HOG + KNN, | một loạt các điều kiện để

using computer vision CNN, SVM ngăn ngừa tôn thất về chat

Trang 28

Quality analysis of rice

grains using ann and

svm

2020

So sánh ANN va SVM

system for assessment SVM và | Độ chính xác 93% va chi

of rice quality and] 2019 | Raspberry can 2.4 giây dé đánh giá 75

defects for lassification Pi3 mau thir nghiém

according to inferred

commercial value

Milled rice — grain

: : Độ chính xác trung bình

grading using raspberry ;

SVM _ kêt hop | micro là 0.8667 và độ thu

p with mace | 2020 | AdaBoost và |hồi trung bình micro là

i d t ged

Processing anc’ Suppor Raspberry Pi 0.8667 voi diém FI là

vector machines with 0.8667

adaptive boosting

Computer-assisted

real-time rice variety

learning using deep

Trang 29

Chương 3 DỮ LIỆU VÀ PHƯƠNG PHÁP

3.1 Dữ liệu

3.1.1 Dữ liệu cho bài toán phân loại gạo

Trong nghiên cứu lần này, chúng em đã gửi yêu cầu xin phép đến tác giảMushahid Shanim để nhận một tập dữ liệu về anh các hạt gạo An Độ Tập dir liệu

có 8 loại gạo được cung cấp bởi một số nhà phân phối ở Bắc An Độ Ban dau, trong

một ảnh, có rất nhiều hạt cùng loại được đặt trên một nền đen như Hình 3.1 Mỗi

ảnh có kích thước 3507 x 2550 pixel, định dạng màu RGB và được quét bởi máy

quét mặt phẳng ở 300 ppi (pixel per inch) Sau đó, tiến hành thực hiện thuật toánđược mô tả trong bài [2] để tách từng hạt gạo thành các ảnh riêng biệt với kíchthước 128 x 128 pixel và vẫn giữ nguyên định dạng màu RGB, đồng thời chúng là

đối tượng cho bài toán phân loại hạt gạo Bảng 3.1 thể hiện tổng quát về các loại

gạo cũng như tổng số lượng ảnh và tong số hạt gạo được tách ra của từng loại gạo

Hình 3.1: Ảnh gốc của tập dit liệu gạo 1121

14

Trang 30

Bảng 3.1: Thống kê số lượng ảnh gạoLoại gạo Tổng ảnh Tổng số hạt

3.1.2 Dữ liệu cho bài toán phân loại chất lượng gạo

Chúng em đã chọn ra 3 loại gạo đã được tô nền xám ở Bảng 3.1: 1121,

PR-11 và Sona Masoori, sau đó chọn ngẫu nhiên ảnh từ các loại trên dé tiến hành thực

nghiệm Việc gán nhãn cho từng ảnh gạo được thực hiện thủ công với 5 nhóm chất

lượng: bình thường, gãy, ton thương, vôi hoá 6 màu va 6 màu và Hình 3.2a đến

Hình 3.2e minh hoạ tương ứng cho 5 loại.

15

Trang 31

a) Bình thường b) Gãy c) Tén thương

Hình 3.2: Các loại chất lượng gạoQuá trình gán nhãn được thực hiện dựa vào việc quan sát đặc điểm bên ngoàitrên ảnh hạt gạo Đối với hạt bình thường, bề mặt của gạo không bị tổn thương hayxuất hiện màu sắc Với hạt gãy, bề mặt của gạo tương đồng với loại bình thườngnhưng hình dạng bề ngoài của gạo xuất hiện tinh trạng gãy Với gạo bị tổn thương,

bề mặt có sự xuất hiện màu nâu đỏ Với gạo bị vôi hoá 6 màu, bề mặt có màu vàngnhạt cùng với một phần hoặc toàn phần màu trắng Cuối cùng, gạo 6 màu chỉ có

màu vàng nhạt trên bê mặt.

Sau khi hoàn tất việc gán nhãn, tổng cộng số lượng ảnh của 3 tập gạo thựcnghiệm 1121, PR-11 và Sona Masoori lần lượt là: 4767, 4971 và 4736 Tuy nhiên,

loại tổn thương, vôi hoá ố màu và ố màu được đánh dấu bằng nền màu xám cho

thấy số lượng ảnh khá thấp trong 5 loại Vì thế ở các loại này, thực hiện việc tăngcường ảnh hạt gạo (thêm 4 ảnh mới cho mỗi ảnh) dé tránh việc mất cân băng dữ

liệu giữa các loại Ngoài ra, việc tăng cường còn giúp các mô hình DNN thu được

kết quả tốt, đồng thời ngăn được việc quá khớp Kỹ thuật nhóm thực hiện là xoay

16

Trang 32

ảnh 72 độ Tổng số lượng ảnh sau đó của 3 tập gạo 1121, PR-11 và Sona Masoori

lần lượt là: 5167, 5571 và 5336 Tiếp theo, 3 tập dữ liệu này được tiến hành chia

thành 3 phần: huấn luyện, xác thực và kiểm tra tương ứng với tỉ lệ chia lần lượt là

7:2:1 Chi tiết của việc chia dữ liệu được thê hiện từ Bảng 3.2 đến Bảng 3.4

Bảng 3.2: Số lượng ảnh của tập 1121 sau khi tăng cường và chia dữ liệu

Ban đầu | Tăng cường | Huấn luyện | Xác thực | Kiểm tra

Bình thường 4081 4081 2857 816 408

Gãy 285 285 200 57 28

Tổn thương 50 250 175 50 25Vôi hoá ô màu | 50 250 175 50 25

O màu 301 301 211 60 30

Tổng cộng 4767 5167 3618 1033 516Bang 3.3: Số lượng ảnh cua tập PR-11 sau khi tăng cường và chia dữ liệu

Ban đầu | Tăng cường | Huấn luyện | Xác thực | Kiểm tra

Trang 33

Bảng 3.4: Số lượng ảnh của tập Sona Masoori sau khi tăng cường và chia dữ liệu

Ban đầu | Tăng cường | Huấn luyện | Xác thực | Kiểm tra

làm đầu vào cho mô hình huấn luyện nhằm cải thiện hiệu quả [24] Trong thư viện

này, nhóm đã sử dụng các chức năng là RandomBrightness, J]pegCompression,

HueSaturationValue, RandomContrast, HorizontalFlip va Rotate được mô ta thông

qua Bang 3.5, đồng thời được minh hoa ở Hình 3.3 Kế tiếp, các ảnh được chuanhoá bằng cách chia tỷ lệ pixel từ phạm vi 0 - 255 thành 0 - 1 Cuối cùng, thay đổikích thước ảnh sao cho phù hợp với yêu cầu đầu vào của từng mô hình theo như

Bảng 3.6.

18

Ngày đăng: 02/10/2024, 08:32

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w