1. Trang chủ
  2. » Luận Văn - Báo Cáo

Khóa luận tốt nghiệp Kỹ thuật máy tính: Thiết kế hệ thống hỗ trợ tư vấn chăm sóc bệnh trên lá cây xoài ứng dụng kỹ thuật máy học

58 1 0
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Thiết kế hệ thống hỗ trợ tư vấn chăm sóc bệnh trên lá cây xoài ứng dụng kỹ thuật máy học
Tác giả Vương Mạnh Kiên, Phan Hoàng Anh Tuân
Người hướng dẫn TS. Doan Duy
Trường học Đại học Quốc gia Thành phố Hồ Chí Minh
Chuyên ngành Kỹ thuật máy tính
Thể loại Khóa luận tốt nghiệp
Năm xuất bản 2021
Thành phố Thành phố Hồ Chí Minh
Định dạng
Số trang 58
Dung lượng 36,88 MB

Nội dung

luận, Đồng thời, nhóm cũng, xin chân thành gửi lời cắm ou đến cáo anh chị, bạn bè trong, khoa, những, người da giúp đỡ nhóm trong suốt qua trình học tap và nghiên cứu khóa luận này, Nhóm

Trang 1

ĐẠI HOG QUOO GIA ‘re HO CHÍ MINHTRUONG DAL HOO CONG NGHỆ THONG TIN

KHOA KY THUAT MAY TÍNH

Vương Mạnh Kiên

Phan Hoàng Anh Tuân

TREN LA CAY XOÀI UNG DUNG KY THUAT MAY HOO DESIGNING A TREATMENT ASSISTANT SYSTEM FOR LEAF DISEASES

ON MANGO USING MACHINE LEARNING TECHNIQUE

KY SU KY THUAT MAY TINH

TP Hồ Chi Minh, Năm 2021

Trang 2

ĐẠI HỌC QUỐO GIA ‘TP, HO CHÍ MINH

TRUONG ĐẠI HOC CONG NGHỆ THONG TIN

KHOA KY THUAT MAY TINH

Vương MạnH Kiên - 17520658

Phan Hoàng Anh Tuân - 17521222

- - _ KHÓA LUẬN TOL NGHIỆP

THIET KE HỆ THONG HO TRỢ LU VAN CHAM SOC BỆNH

TREN LA CAY XOAI UNG DUNG KY THUẬT MAY HOC DESIGNING A TREATMENT ASSISTANT SYSTEM FOR LEAF DISEASES

ON MANGO USING MAOHINE LEARNING TEOHNIQUE

KY SƯ KỸ THUAT MAY TÍNH

GIANG VIÊN HƯỚNG DAN

TS, Doan Duy.

TP Hồ Chi Minh, 2021

Trang 3

THONG LIN HỘI ĐỒNG CHAM KHÓA LUẬN LOL NGHIỆP.

Hội đồng chấm khóa luận tốt nghiệp, thành lập theo Quyết định số 62/QD-DHONI'T ngày, 14 tháng 02 năm

2022 volta Hiệu trướng, Lrường Dai học Odug nghệ Thống, tin.

Trang 4

LỜI CẮM ƠN

Trong suốt thời gian học tập tại trường, Đại họo Ooug Nghệ Thông Lin, daw biệt được học tập trong khoa

Kỹ thuật Máy tính, uhom đã được hướng dẫu bới những người thầy giáng dạy, rất nhiệt tình, truyền đạt

cho nhiều kiếu thức bố ích quau trọng cho chuyên ngành, Nhóu: xiv châu thành cain on Quy Lhay, Oo da

giúp đỡ uhow rat nhiều trong suôt thời gian qua.

Đặc biệt, nhóm xin châu thành oắm ou tiến si Doan Duy, đã hướng dẫu nhóm rất tận tình trong, suốt quá, trình thực hiệu đề tài, hỗ trợ và oung cấp cho nhóm nhiều kiên thức chuyên môn quý báu dé có thế hoàu

thành khuá luận,

Đồng thời, nhóm cũng, xin chân thành gửi lời cắm ou đến cáo anh chị, bạn bè trong, khoa, những, người

da giúp đỡ nhóm trong suốt qua trình học tap và nghiên cứu khóa luận này,

Nhóm cũng xin cắm ơn gia đình đã luôn tin tướng, tạo điều kiện và tug hộ rất nhiều về wat tỉnh thầu cũng như thé chất trong suốt khoảng, thời giau nhóm: thực hiệu đề tài khoá, Luau này,

Với điều kiệu vdu hau ohé về mặt thời gian và vo sé vật chất nêu trong, báo cáo này nhóm: không, thế tránh khối những thiếu sót uêu rất mong nhậu được sự đóng góp via người đọc dé hoàu thiệu hơn khóa luận tốt

nghiệp.

Một lần nữa, nhóm xin chân thành cấm ơn!

Thành Phô Hồ Ohi Minh, ngày 05 tháng OL năm 2022

Sinh viên thựo hiện

Vương Mạnh Kiêu - Phan Hoàng Anh ‘Luda.

Trang 5

Mục lục

1 GIỚI THIỆU LONG QUAN 1U

TA Boi vam ằ HH HẶIaaaaaaj{ 10

1.11 Nghiên cứu ngoài HƯỚC ch 10 1.12 Nghiên cứu trong nước 10

1⁄2 Mụo tiêu đỒ tai eee 1T

13 Gidihan dd tai ằằẰằẰ na -ằằẶ&< 12

2.1.9 Doleoirou MAI, CC SR ứ me ee es 26

3 HIỆN THỰO LHIẾU KẾ ĐỀ ‘VA! 29

3.1 Mô hình chung cho đề tai 29

3.2 Hiện thực hệ thông máy họo nhậu biết bệnh trên lá cây, xoài 30

3.2.2 lrainning 33 3.2.3 Validating 42

3.24 1ostTne, 45,

3.3 Hiệu thực dug dụng, 46

3.3.0 Phau tích bệnh TQ Q HH HH HH HH nh 40

4 KẾT QUA CUA NGHIÊN CỨU 48

Al HO thong way hoo ằằằ na eet eee eae 48

Trang 6

4.2.2 Nhậu biết bệnh trên lá cây xoài ở website 52

5 KẾT LUẬN 54

5.2 Điếm tích oựo và hạn chê vita nghiêu uứu 54

5.3 Dinh hướng nghiều cứu trong tương lai 55

TAL LIEU THAM KHAO 50

Trang 7

Mô hình uấo bude xử ly ánh 14

Giao diện thực hiện phân đoạn hình ánh của OVAL 15

Google Oulab va oáo tính nãng, di KÈU ee 16 Google Oolab và ve tính năng đĩ KÈM eee 17

Giao diệu KittyOue 18

Giao diệu Dataset View trong EiftyOne 20 NN"ỗhg ng ôn em 22

Sơ đồ xử lý oúa Mask RCONN 2 ee 23

Mo hình hoạt doug olla Easter R-ONN 24

Ví du trựo quan về Lo 25

Mô hình day, dit ota Mask RONN ee 25

Odo vật thế wa Devtectron2 có thé bắt được 26

Da ohtte udug vita Devteotuou2 2 ee 27

Mô Hình Hoạt Động Ota Hệ Thông 2 ee 29

Sơ lược cáo bướo thực hiệu việc huấn luyệu má 30

Data hình ánh vita nhóm bệnh trou lá cây, xoài sau khi đã add vào OVAT 31

Quá trình segmentation hình ánh trong OVAL BL

Xuất dataset và aunuotation task trong OVAL 32

Quá trình gop annotation của cáo nhãn bệnh 32

Labels.jsou là, file tống, hợp tit 8 nhậu bệnh 33

Lưu trữ data và annotation trêu Google Drive 33

có vi google drive eee 34 Dit liệu google drive kết nối với google colab oe ee 34

Cài đặt những thư viện liên quan đã

Define tên mô hình và ngưỡng, kiếm thỨ ee eee 42

Hình ánh kiếm thứ thành công, 43 Hình ánh kiểu thứ thành công 44

Hình duh kiếm thứ không thành công c2 v2 eee 4

Trang 8

3.25 Hình duh kiếm thứ có hai nhãn đồ/chông lên nhau

3.26 Hình ánh kiếm thứ sai nhãn từ apoderus javanions thành dappula tertia

3.27 Hình duh testing trêu tug dụng may họ cuc

3.28 Sơ đồ hoạt động chức uãng phâu tích bệnh

Biến đồ total loss thay, đối tit 100 đếu 3000 vòng lặp

Giao diệu phan tích bệnh ota ứng dung eee

Giao diện phân tích bệnh ota ứng dụng, sau khi nhập ánh và baw phan tích

Giao diệu phan tích bệnh via website

Giao diệu phân tích bệnh olla website sau khi nhập ánh ya bẫm phân tích.

44

45 46 47

40 50

51 52 52

53

Trang 10

GRU Graphivs Provessing Unit.

+PU Tensor Processing Unit.

Trang 11

LOM TẮI KHÓA LUẬN

Hiện nay, trên thé giới, cáo mầm bệnh trên vay, trồng nông nghiệp vẫn dang là một van đề nhức nhối đồi với viv người nông dâu Nhu cầu cấp thiết về vido phát hiệu ra gác loại mầm bệnh ngay, khi co dấu hiệu hiện ra và nhanh chóng tìm được giải pháp khắc phụo sẽ mang lại hiệu quá cao trong quá trình canh táo và tránh đượo các tou thất về thời giau và kinh tê.

Do đó, nhóm nghiện cứu quyết định sẽ xây dựng một hệ thống ứng dụng giúp chuẩn đoáu sớm bệnh trêu cây trông, gợi ý giải pháp phòng trị phù hợp, nhanh chóng, Vay, xoài là một trong, những loại cây, phố biếu

được trồng, với lượng lớn trên đất nước cũng, như có giá trị thương, mại cao, phù hợp với cáo đối tượng,

nhà nồng, hay v4 nhấn gó điều kiện về kinh tê hạn chê, Vì là một trong những loài cây, Au trái xuất khấu pho biếu nhất nêu khi v6 mầu: bệnh, sẽ gây duh hướng lou đều chất lượng, của cây, và udu kinh té trong nông.

Mask R-ONN sẽ được sử dị

gia tăng độ chính xáo, Mô hình

ng đế huấu luyện cùng với bộ dữ liệu 4000 ánh đã qua xứ lý, (segmentation) He

Khoa luận.

xoài và gợi ý gidi pháp có thé giúp người uouy dâu gia tăng năng, suất oanh báo, giám: phiếu rúi ro về kinh tê,

6 nghiệp này, đã xây dựng một hộ thông ứng dụng, và website giúp chuẩn đoáu bệnh trên cay,

Trang 12

Chương 1

GIỚI THIỆU TỐNG QUAN

1.1 Bối cảnh

1.1.1 Nghiên cứu ngồi nước

Ứng dụng kỹ thuật máy học, trí tuệ nhân tạo, khoa học dữ liệu và cơng nghệ quấn lý dựa trêu LoL (Luternet

vf hings) vào nơng nghiệp hiệu đang là xu hướng tồu cau Xu hướng phát triếu nồng nghiệp hiệu nay,

tại nhiều nước, dao biệt là áo quốc gia phát triển đang chuyến dịch dầu sung mơ hình mới “Nơng Nghiệp Chính Xác (Procise agriculture)", wo hình nơng nghiệp được áp dụng, cáo thành tựu khoa học để tạo ra hộ

sinh tỊ nơng nghiệp và cung cấp cáo dịch vụ cho người nơng, dâu tham gia Nhiều quốc gia đã 4p dụng, mơ

hình nơng nghiệp chính xáo trong nhiều nấm qua như Nhật Bắn, Uo, Au Độ, Băng-la-desh Nhiều loại cây,

trơng là đối tượng nghiên oứu, phố biểu nhất là xồi, táo, thanh long.

Oùng với sự phát triéu Luạnh wé via ngành vOug nghệ thống, tin, máy, họo giờ day, cĩ thế nhận dạng hình.

ánh một cách chính xáo và chất lương hon trước Vide nhận dạng, và phan tích hình ánh thoug qua wot đường truyền ở khoảng ốch xa với với độ trễ nhậu được khơng, quá cao cũng là yên t6 thu hút nhiều mối quan tam Hơn nữa, sự phát triểu wauh w6 các thuật tốu way học và độ thơng dụng, cửa chúng, gàng, khiêu cho nhiều cơng ty, tố chức nghiên city muốn áp dụng chúng vào trong cáo lĩnh vực kinh doanh, và nơng, nghiệp cũng khơng phái ngoại lệ Liêu thé giới thi da v6 rât nhiều nghiện cứu, và tiêu biếu thì gồm một số

sau đây:

w Bai báo jl] Rive Leaf Disease Detevtion Using Machine Learning Lechuiques vào nau 2019 sứ dụng,

nhiều loại thuật tốn như KNN(K-Nearest Neighbour), J48(Devision Tree), NB(Naive Bayes) và

LR(Logistio Regression) Sau 10-fold: cross validation thì đã đạt được độ chính xác lên tới hou 97

phầu trăm cho việc nhậu dạng, 14 vay, lúa bệnh.

« Bai báo |2| Maize Leaf Disease Detection and Olassifioation Using Machine Learning Algorithms vào

nau 2020 sit dụng, cáo loại thuật tốn như Naive Bayes(NB), Decision Iree (DL), K-Nearest Neighbor

(KNN), Support Vector Machine(SVM), và Randou Eorost (RE) dé phát hiện loại bệnh trên vay, ngơ

dựa trêu hình ánh lá vay, với độ chính xác lên tới 79.23 phan tram.

» Bai báo |B| Machine loarning regression technique for cotton leaf disease detection and coutcolling using

lol xào nấu 2017 sit dụng thuật tốn regression dé phát hiện nhiều loại bệnh trêu lá cây bơng với độ chính xáo lén 83.26 phan tram và kết hợp với tug dụng điệu thoại dé giúp người dan dé dàng sit dung.

1.1.2 Nghiên cứu trong nude

Luy, thé giới đã đặt sự quan tau lên đề tài này rất nhiều, song ở Việt Naw vẫn cịn rất han chế ya chí 06

Trang 13

« Bai báo |4| Lu động nhận dạng, một 36 loại sau bệnh trên lá bưới sử dụng, công, nghệ duh vào nãm 2017

sứ dụng m6 hình máy họo veotơ hỗ trợ (SVM) dé nhận dạng 4 loại sau bệnh trên lá bưởi với độ chính.

xác đạt trêu 99.5 phẫu trăm và thực nghiệm trêu 500 duh đạt 99.2 phan tran.

Dưới day, là bắng, so sánh cdc công, nghệ sử dụng, trong, way, họo giữa đề tài vila nhóm với áo đề tài nêu

tren.

Baug 1.1: So sánh công nghệ mấy, học sứ dung gitta các đồ ấu.

Tên đề tài Oáo vồng, nghệ sử dụng, | Li lệ chính xáo

Mango Leaf Diseas Detection | Lustauce Segmentation, a Rive Leaf Disease Detection KNN,J43,NB,LE 79.23

Maize Leaf Disease Detevtion | NB,D1,KNN,SVM,RE 79.23 Qotton loaf disease detection Regression algorithiu 83.26 Nhan dang bệnh trên lá bưởi SVM 99.2

Tuy, đã có nhiều cống, trình nghiên cứu và cáo mô hình gidi pháp da được giới thiệu, nhưng, da 36 cáo công,

trình nghiên oứu là những sắn phẩm rời cao, chưa có sự kết nối, chưa cung cấp các dịch vụ mà người nông,

dâu có thé thaw gia trực tiếp ngoài thao táo tra cứu thống, tin dou thuầu Dao biệt, áo giái pháp vẫu chua

có sự kết nôi va tư vấu của cáo chuyêu gia nông nghiệp dé hỗ trợ người nông, dâu một oách trực tiếp và kip

thời.

1.2 Mục tiêu đề tài

Phát triéu hệ thống, cáo giải pháp ứug dụng trêu thiết bị di động và website dé giúp người nông, dâu v6 thé

chuấu đoán bệnh, tra ottu cách phòng trị, kết nồi chuyên gia là ruột nhụ cau lớn và, có tidus nãng phát triếu

trong tương lai gầu Do đó, nhóm thực hiệu đề xuất đề tài “Lhidt kế hệ thông, hồ trợ tư yan cham sóo bệnh.

trêu lá cây, xoài ứng dụng kỹ thuật way, họ”.

Đề tài oung cấp cáo ứng dụng trêu thiết bị di động và website đế người nông, dâu có thế dễ dàng tham.

gia vào hệ sinh thái nông nghiệp, quấn lý quá trình canh tác và tương, tác trực tiẾp với gác chuyên gia uông,

nghiệp Lrong đề tài nghiên cứu này nhóm chọn cây, xoài làm mục tiêu nghiên cứu ola mình Bên cạnh đó,

nhóm cũng hướng đến xây, dựng cơ 36 dữ liệu về bệnh trêu cay, xoài phụo vụ vio nghiên oứu chuyên sâu.

trong, Hồng, nghiệp.

Oây, xoài (tên sinh học: Maugifora indiva) là wt loại oây, rất phố biến hiệu nay, cũng như qué cửa nó rất

được ta chuộng Day là một trong những, loại vay, vừa 06 thé sit dụng, để law cây cánh, vita v6 thé lây bóng,

râu: chơi đùa hay, ngồi hóng wat trong những, ngày nắng, nóng Dao biệt hou là nó có thé dew lại nguồn lợi

kinh tê rất lớu khi trồng với số lượng nhiều và xuât khấu

Tuy nhiên, người nông dân và người làm vườn đôi khi không thé biệt được liệu vườu xoài của mình có

phát triéu ruột oách tốt nhất hay không Đồi khi trên lá xoài v6 thế xuất hiệu những đốm đen hay, mụn ghế

Kì lạ mà người ông dâu không thé biết đó là bệnh gì và thực hiệu biệu pháp nào để chữa trị.

Do đồ trong đề tài nghiên oứu này, uhow đã, đề xuất ra phương, pháp là thiệt kế ra một hệ thông, way,

hoo v6 thé xác định bệnh trêu cây, xoài sau khi pha tích hình duh cửa lá Việo này sẽ giúp giải quyết đượo

cáo yan đề vita nông, dâu về xáo định bệnh hại của cây trồng, và đượo tư yan chău: sóo vay, trồng một oách

nhanh chóng và hiệu quả Điều này, sẽ giúp họ chữa khỏi bệnh cho cây, trồng kịp thời, giúp tăng cả về chất

lượng va sắn lượng thành phẩm, đồng, thời giúp tăng lợi nhuận cho người nông, dâu.

Phạm vi trong dé tài nghiên cứu bao gồm tầm nhân (bao gồm 7 bệnh và T loại là lá bình thường) trên cây,

xoài: Ga l4(apoderus javanicus), sâu bướm an 14(dappula tertia), héo lá(miotis longieornis), phân trắng(neomelicharia.

sparsa), 14 bình thudug(uormal), ghế xoài(proconbarinia cubus), than thư(mango anthracnose), trí do(red

rust) Do đối tường phan tích bệnh là lá cây, nêu cầu phái v6 wo hình máy học và thuật toán phù hợp để

Trang 14

đạt đượo két quã tốt nhật Qua phân tích và tim hiếu nhóm đã lựa chọn mồ hình way, họo phù hợp là Mask R-ONN với thuật toán phan đoạn đối tượng giúp chang ta vd thé phan đoạu vdv đối tượng một cách chinh

xáo.

Sit dụng kết qué nhậu biết bệnh cũa mô hình máy hyo, nhóm sẽ phát tridu ứng dụng, cho phép người dùng:

có thế chụp ánh lá vay, bị bệnh ngay, trêu thiệt bi di doug via mình, qua quá trình phân tích số đưa ra kết

y đồng thời đề xuất oáo cách phòng trị phù hợp, Hou nữa, hệ thông ứng dụng,

qua, tình trạng bệnh trêu |

còn hỗ trợ tính năng tạo kết nối với cáo chuyên gia giúp người dùng hiểu rõ hơn về cáo loại bệnh, trau doi

kiéu thức vita mình và cũng có thế được hỗ trợ giái đáp uáo thắc mắc liêu quan, Ứng dụng cũng sẽ 06 cáo

bài việt và tài thiệu liêu yuan đế mọi người cing nhau tìm hiểu và nâng cao kiêu thứo về các bệnh trên cay,

trông.

1.3 Giới hạn đề tài

Oo sở dữ liệu bệnh trên xoài với 4000 ánh được gắu nhãn, khoanh vùng đối tượng, (segmentation) Hệ thông,

may, học chấn đoán bệnh sẽ chí giới hạn ở lá cấy xoài trưởng thành và khi bệnh đã có dâu hiệu bệnh rõ rột

trên lá và hỗ trợ oác chức nãng phan tích cáo loại bệnh, đưa ra cáo biện pháp chăm sóc phù hợp với từng.

loại Oáo tính nãng, chính cúa ứng, dung:

» Phan tích cáo loại bệnh trên lá vay, xui.

# Goi ý cáo phương pháp chăm sóc phù hợp cho từng, loại bệnh.

w Odo bài viết, tài liệu về nông nghiệp liêu quan.

1.4 Kết qua dự kiến

Hệ thông nhận dạng hình ánh 4p dụng máy học sẽ 6 thế phát hiện nhiều loại bệnh với độ chính xáo trêu.

80 phan trăm Qua đó v6 đượo một hệ thông nhận dạng bệnh trêu lá xoài phụo vụ nghiên cứu khoa hoo và, đứng, dụng và udu tang tug dụng hỗ trợ uông, dâu chăm sóc cây xoài với cáo dao điếm có độ chính xác cao cũng, như có thế tích hợp vào ứng, dụng dé người nông, dan sử dung.

Trên đây là giới thiệu tống quan về lý do thực hiện, mục tiêu và giới hạn vita dé tài O chương, sau chúng,

ta sẽ đi sâu hơn về phầu phận tích và giới thiệu về uáo kỹ, thuật đượo dùng trong, quá trình nghiên cứu và

phát triéu ứng dụng.

Trang 15

Dữ liệu về lá cây xoài bệnh được thu thập từ cáo nguồu được chia số tuiễn phí trêu mạng, cũng, như tit wot

sô ánh thie tô mà nhóu chụp, được đề qua đó xây, dựng cơ sở dit liệu về bệnh lá, vay xoài (khoáng 4000 ánh).

Trang 16

chất lượng, phân đoạu và tách dạnh, gần nhãn cho vùng hay, quá trình biếu dịch cáo thông tin hình ánh ote ánh Qũng như xứ lý dữ liệu bằng, đồ hoạ, xứ lý duh số là một lĩnh vực vita tin họo ứng dung Xứ lý dữ liệu bằng đồ họa đề cập đến những duh nhân tạo, cáo duh này, đượo xem xét như là một cấu trúo dữ liệu và đượo tạo bởi oác chương trình Xử lý duh số bao gous các phương pháp và kỹ thuật biếu đối, dé truyều tai hoặo

ma hoá viv ánh bự nhiên Muyo đích của xứ lý ánh gồm:

w Hiến đối ánh làm tăng chất lượng, ánh.

® Lu động nhậu dạng ánh, đoán nhận ánh, đánh gia cáo nội dung của ánh.

Nhận biết và đánh giá cáo nội dung olla duh là sự phâu tích một hình duh thành những phần có ý nghĩa

dé phân biệt đối tượug này với đối tượng kháo, dựa vào đó nhóu: v6 thé m6 tá, dâu trúc via hình ãnh ban đầu, 06 thé ligt kẽ một số phương pháp nhậu dạng cơ bin nhất nhận dạng duh của cáo đối tượng trêu ảnh,

tách oạnh, phâu đoạn hìuh ánh, av bước xử lý ánh được thế hiệu chỉ tiết trong hình 3.2, qué trình xứ

» Thụ nhậu ảnh; có thé nhậu được qua camera mầu hoặc đen trắng, đây là loại ảnh tương, tự.

w Liên xứ lý; sau bộ phận thu nhậu ánh,áãnh có thế bị nhiêu hoặc độ tương phần thâp nêu cau đưa vào

bộ tiên xử lý dé nâng, cao chất lượng ảnh,

» Chức năng: lọc nhiêu, tang hoặc giduu độ tương, phan,

» Phan đoạn ánh ; là tách duh đầu vào thành cáo ving dé biếu diễn, phan tích và nhậu dạng duh

œ Biếu diễn ánh ; áo vật thế sau khi được phan đoạn có thế đượo mô tắ dưới dạng chuỗi cáo điếm và.

biếu diễn Suh thường được sử dụng khi quan tamu đến dao tính bền trong vita vùng ánh Vd: đường cong, hình dạng, Qué trình biểu diễn duh là vide biên đối cáo số liệu vita ánh thành dạng thích hợp và.

cầu thiết cho quá trình xứ lý bằng máy tính.

» Nhận dạng và nội suy : là quá trình phâu loại vat thế dua trêu vo sở cáo chỉ tiết wd tá vật thé và nhậu.

dạng ánh là quá trình xác định ánh và quá trình này, thu được bằng cách so sánh với mẫu da được lưu

trữ từ trướo.

» Oo sé tri thức : cáo qua trình xứ lý liệt kẽ trong hình thứo xứ lý ánh Được thực hiệu dưới sự giấu sát

và thực hiệu dựa trêu cơ sở các kiêu thứo về lĩnh vực xử lý ánh.

Trang 17

2.1.3 Computer Vision Annotation Tool - OVAT

Sơ lược về OVAL

OVAT(Oomputbor Vision Annobation Lool) là một ông cy chú thích hình ánh ya video dựa trên web, mã.

ugudn wd miễn phí đượo sứ dung dé gắn nhãn dữ liệu cho ấu thuật boán thi giáo máy bính Dược phat trién

ban, đầu bởi Lutel, OVAL được thiết kê dé sứ dung bởi nhóui chứ thích dữ liệu chuyéu nghiệp, với giao diệu.

người dùng được tôi ưu hoa cho oáo táo vụ chú thích thị giáo máy, tính

OVAL hỗ trợ oáo táo vụ ohính dứa, họo máy, v6 giám sát: phát hiện đối tượng, phân loại hình ánh và phan

đoạn hình ánh OVAL cho phép người dùng, chú thích dữ liệu cho từng trường hợp này,

OVAL 06 nhiều tính năng mạnh mS, bao gồm nội suy, hình, dạng, giữa, áo khung chính, chứ thích báu tu

động, bằng, vach sử dụng mô hình họo sân, phím bắt cho hầu hột oáo hành động quan trọng, bang điều khiến.

với danh sách vac dự ấn và nhiệm vụ chú thích, LDAP và xáo thựu truy, cap vo bắn, v.v.

OVAL được viết chú yêu bing LypeSoript, React, Aut Design, OSS, Python va Django Nó được phan

phối theo Giấy phép MLL va mã, nguồn vita nó 06 sẵn trên GitHub

Giao diệu tong quan ola OVAL sau khi người dùng đãug nhập khá, don giấu, với những, ohứu wang chú

đạo bêu ngoài như lối tắt tới dự án(projeot), nhiệm vụ(bask) hay mụo tìm kiêm dự ấn, tùy, chon người dùng,

và, quan trọng nhật là phan tao dự ấu

Hon nữa, OVAL vdu cung oấp sẵn mot nhỗ chứa nguồn dữ liệu mién phí được lưu thing trêu nều website

khiếu cho vide lưu trữ dữ liệu cho dự áu được dễ dàng hon

ØODVAT Projects Tasks "` - đền © GiHub @ Help 8 kiem |

Hình 2.3: Giao diện thực hiện phan đoạn hình ánh cla OVAL

Ưu nhược điểm của OVAL

OVAL dó những ưu và nhược điểm sau đây:

e Uu điễm

— OVAL giúp việu quau lý dự ấn liên quan tới máy hoo dễ dàng hơn, v6 day, di odo chite năng, tao

dự áu, nhiệm vụ hoặo thậu: chí c& phan người làm: và người kiếm tra sau khi mot nhiệm vụ được

Trang 18

2.1.4 Python

Giới thiệu

Python, là ngôn ngữ lập trình hướng, đôi tượng, cap cao, mạnh mẽ, duge tao ra bởi Guido van Rossum No

dễ dàng: dé tim hiếu và đang: nối lên như mot trong những ngôu ngữ lập trình nhập won tot nhật cho ngườilầu đầu tiếp xúu với ugdu ngữ lập trình, Pythou hoàu toàn, bạo kiểu động, và sử dụng vo chê vap phát bộ nhớ

tự động Pythou c6 vau trac dữ liệu cap cao mạnh tuế va cach tiếp cau dou gidu nhưng hiệu qua đối với lập

trinh hướng đối tượng OG pháp lệnh vita Python là diém oộng: võ dùng, lớu vì sự rõ ràng, dễ hiến và sách gõ

linh doug làm cho nó nhanh chóng, trổ thành một ngôn ngữ lý tướng để viết script và phát triễn tug dụng,trong nhiều lĩuh vựo, ở hầu hột cao nều tang

Đặc diém của Pythou

Python uó cA đặo điểm chính sau;

» Ngôu ngữ lập trình đơn giãn, dễ học.

e Miễu phí, wa ugudu wd.

e« Kha năng di chuyếu.

e Kha năng wd rộng: và, v6 thế nhúng

» Ngôu ngữ thông dịch oấp cao,

e Lhư viện tiêu chuẩn lớn dé gidi quyết những, táo vụ phố biến.

e Hướng đối tượng,

Pythou trong Machine Learning

Python, cO rất nhiều thư việu hỗ trợ liêu quan tới Machine learning như la: Numpy, Keras, Lensortlow,

ObeuOV, Vì vậy, nó là một trong những ngôn ngữ thông dụng nhất khi dùng lập trình Machine Learning

Oolaboratory, hay, cou gọi là Google Oolab, là wot sắn phẩm tit Google Research, nó cho phép chạy, cdc dòng,

uode python thông, qua trình duyệt, dao biệt phù hợp với Data analysis, machine learning và giao duc, Oolab

Trang 19

khong uầu yêu uầu vai dat hay, dẫu hình méy, tinh, wi thứ vd thé chạy, thông, qua trình duyệt bằng OPU,

GPU hay, LPU được cung ấp từ Oolab

co , URL to Google Drive

cloudconvert Sửu =

Hình 2.5: Google Oolab và vac tinh năng, di kèu:

Oolab cung cap nhiều loại GPU, thường, là Nvidia K80s, 43, P4s aud P100s, tuy, nhiều người dừng không,

thé chon loại GRU trong: Oolab, GRU trong: Oolab thay, đối theo thời gian Vì là dịch vụ miéu phí, nên, Oolab

sẽ 06 những thứ tự ưu tiêu troug, vise sử dụng tài nguyên hệ thông, oữug như giới hau thời gian sử dụng,

thời gian sử dụng tối da lên tới 12 giờ

Bang 2.1: Oấu hình phan cứng, mà google oolab cung cap

lên phan ứng: Sức mạnh Lov độ Dung lượng,

OPU Litern Xeou với 2 vore 2.3GHz 13

GPU GPU Lesla KSU, OPU Intel Xeon | 2.20GH¿ | 12GB GRU và, 13GB OPRU

TPU Olout LPU và OEPU Lutel Xeon 2.3GHz | 1SU teraflops, 13GB OPU

Uu và nhược diém

Google Oolab v6 những tu và nhược diéu sau đây:

e Un điểm

— Google Oolab wisn phí,

— Ouing cấp phầu ứng Hạnh cho việo nhạy thử code từ OPU, GRU đêu LRU

— Dỗ dàng sử dung và truy cap, kết nối lưu trữ true tiếp trêu Google Drive, Github

— Sử dung được nhiều thư viện phố dụng, dành cho DeepLearning như Keras, Leusork low, Py Lorch,

và QbouOV.

se Nhượo điếu:

— Thời gian sứ dụng 0ó giới hạn, sau T2 giờ VM cotta volab bị reset.

— Khong thế tự lựa chen cấu hình phan oứng với account free

17

Trang 20

2.1.0 EiftyOune

Giới thiệu

Eifty One là miột cong cy mã nguồn 16 với mục đích bạo ra, là đế xây, dựng, bộ dữ liệu chất lượng: cao và: mô

hình thi giáo máy, tính.

FiftyOue băng, dường, quy, trình họo mấy, bằng, oách cho phép true quan hoa tap dữ liệu và diễu giải mô

hình nhanh how va hiệu qua how.

Oai thiệu chat lượng dữ liệu và hiếu uáo chế độ lỗi ota Lô hình là những cach hiệu qua nhất dé tang hiệu

suất oửa mô hình

Eifty One cung vap gáo khối xây, dựng dé tối ưu hóa quy, trình phân tích tap dữ liệu Sử dụng, nó dé thựo

hành với dữ liệu, bao gồm hình dung cdo nhận phứo tap, đánh gia mộ hìnhn, khám phá cdo tình huGug quantam, x40 định véo chê độ lỗi, tìm lỗi chú thích

Dưới day, là giao diệu chính ota Eiftyone, với nhiều thành phầu và chứu năng.

‘| Osamples selected Viewing 114 samples

Lớp Dataset là cau trúu dữ liệu v6t lõi trong EifbyOne, cho phép trình bay, dif liệu và thao táo với dataset

thoug qua thư viện Python và ứng, dung Kitty One.

Bộ dữ liệu KiftyOue cho phép dễ dang tai, sửa đối, trựo quan hóa, va đánh giá dữ liệu vita mình cing vớibat kỳ nhãu liêu quan nào (phâu loại, phát hiệu, v.v.) Qhứng cung oấp giao diệu nhất quấu dé tai hình ánh,

video, chú thích và dự đoán mô hình sang định dạng 06 thế hiến thị teoug Ung dung KiftyOne, đượo đồng,

bộ hóa với nguồn chú thích và dễ dàng, chia số

Trang 21

Dataset bao gồm nhiều đối tượng sample chứa, vio thuộc tính field, tất v& đều vd thế đượo tao động, sửa:

đối và xóa FiftyOne sử dung cơ sở dữ liệu nhẹ không: quan hệ để lưu trữ tập dữ liệu, vi vậy bau 06 thé dễ

dàng: chia tý lệ thành tap dữ liệu ở bất kỳ kích thướu nào mài không cau lo lắng, về giới han RAM trêu, uy,

volta mình.

Dataset là wOt bộ sample đã, duge sắp xếp, Khi miột sample được thém vào dataset, nó sẽ được gấu Liột

LD duy, nhất 06 thé đượo sứ dụng, để lẫy, sample ttt dataset

Thao tao slicing và uấu hoạt động, hàng, loạt kháuo trêu dataset đượo thực hiệu thông, qua việu sit dung

dataset view DatasetView oung vap wot góo nhìu vào Dataset, thứ co thé đượo lọo, sắp xếp, sample, v.v.

dọo theo áo trụo kháo nhau dé uó được một tap hợp mong: mudu vita áo sample

Sample

Sample là vac phan ttt atomio ola dataset lưu trữ tat 04 thong tín liên quan déu wot phan dữ liệu nhật định

(ví dụ: hình ánh hoặc vidoo).

Lat uắ, cac sauple instance lưu trữ đường, dẫu déu dữ liệu nguồu gửa chứng trên disk troug đường, dẫu

field uửa chúng Bat kỳ số lượng field nào dũng: 66 thế đượo thêm mot oách lưu động: vào sample dé lưu trữthong tin tùy, chính bố sung, về sample

Eield

Oáuo field là thuộc tinh cla vac sample instauve lưu trữ thông tín tùy, chính về oáo sample OF nghĩ tới vide

dataset là Luột bang wad muỗi hàng trong, đó mỗi hàng, là ruột sample, muỗi vot là wot field.

Lat oắ oáo sample phai v6 filepath field oúa chúng điền vào, thứ trỏ đêu dữ liệu nguồu cla sample brêu,

disk Mao định, gáo sample cing được cung oấp oáo field id, mediatype, metadata và tag dé lưu trữ thông:tin phố biến:

Mediatype

Khi một sample đượo tao, loại phương: tiện vita nô đượo suy, ca từ filepath đến source media và hiến thi

thông qua thuộo tinh mediatype cla sample.

Tags

Ất vd uáo sample instance déu 06 thuộc tinh thé, thuộc tính này lựa trữ danh sách cao chuỗi có thế duge

sử dung lĩnh hoạt dé lưu trữ thông tin về wot sample

Một trường hợp sứ dụng, điễu hình là gin thé dataset split (test, train, validation) mA sample thude về

Tuy, nhiên, fiftyoue vẫn cho phépty do sử dụng cao thé một cach tùy, ý,

Metadata:

Lat vd oáu sample instance đều v6 thuộc tinh metadata lưu trữ type-specific metadata về source media dứa,

sauuple.

Label

Label lưu trữ thông tin ngữ ughia về miẫn, chẳng hạn như cht thích vo ban hoặo dự đoáu về mô hình

Eifty One cung gấp một lớp con label cho nhiều táo vụ phố biếu:

® Regression: gia ELỊ regression

® Olassifivation: classifivation label.

w Olassificatious: danh sách classifications (Phường, sử dụng, cho multilabel tasks)

19

Trang 22

® Doboobious: dauh sách object detevtions (6ó thé v6 hoặo không, Inistanue masks)

® Polylines: danh sách polylines hoặo polygous troug ruột hình ánh.

® Keypoiuts: danh sách keypoiuts troug một hình ánh.

® Segmoutation: seumautio segmeutation mask trong wot hình ánh

® Hoatmap: intensity, hoatmap troug wot hình ánh.

® lomporal detevtion: vac sự kiệu với temporal frame support trong miột video

# GeoLovation: điễm, đường hoặc da giáo govlovation

Sứ dung cáo loại label vita FifbyOne cho phép ban trựo quan hóa oáu label cla minh troug phan ứng, dung

Dataset View.

Dataset View là ruột vOug cu wauh mé dé khấu phá, tap dữ liệu DatasetView instance 06 thé đưgo sử dụng:

để tìm kiếm, loc, sắp xếp và thao báo với oáo tap con dứa, dataset dé thựo hiện vido phâu tich van thiết

ce FiftyOne ciaro-test

Labels Scalars

uniqueness

Match SortBy @ | uniqueness False x@

Hình 2.7: Giao diệu Dataset View trong Fifty One

Aggregatlons

Dataset View cho phép tim kiêm: oáo mẫu trong tập dữ liệu và loo nội dung của chtug Dé bố sung, vide tinh

toán thông, kê tống, hợp về tap dữ liệu hoặo ché độ xem thường, đượo quan tau nhiều hon, chẳng han như số

lượng nhãn, phâu phối và phạu! vi.

Trang 23

FiftyOue sở hữu wot framework Luạnh wé cung vdp vách tiếp van hiệu qua oao dé tính tốn thơng, kê về

— Oung vap nhiều chit ning như lọo, xĩa, sắp xếp nhằm phụo vụ cho vide phân đoạn hình ánh dũng,

như lưu trữ hình ánh sau khi phâu doan.

— Qĩ sẵn uä biếu đồ thơng: kê nhằm thuận lợi cho việo đánh giá và xem xét tong quan data

» Nhược diéu

— Géu nhãn phan đoạn hình ánh thường bị lệch ra khỏi duh hodc nhiễu so với file gd.

— 160 độ phau hồi con chậm

2.1.7 PyTorch

Giới thiệu

Py Lorch là một framework được xây, dựng: dựa, trêu python cung vip nền taug tính tốn, khoa hoe phụo vu

lĩnh vite Deep learning Pytorch tap trung; vào 2 kha năng, chính:

e Lính tốu lbusor (gidug NumPy) dé tậu dụng sứo manh tinh toda cia GRU

e Platform Deep learning phuo vụ trong nghiền cứu, mang, lại sự lĩnh hoạt và toc độ.

Py,1urch định nghĩa wot lớp gyi là Leusor (torch, Leusor) dé lưu trữ và hoạt động, trêu odo mắng hìuh chitnhật da chiều đồng nhất otta uáo số Py orch Leusors tương tự như Maug NumPy, nhưng oững: co thé hoạt

doug trêu GPU Nyidia hỗ trợ QUA Py Lorch hỗ trợ nhiều loại Lensors phụ kháo nhau

Py Lorch gồm 3 module:

® Autograd: Py lUrch sứ dụng mot phương phấp gọi là phần biệt tự động Một way, ghi ghi lại những,

thao táo da thực hiện, và sau đĩ nĩ phát lại nĩ dé tính tốn gradient Phương pháp nay, đặo biệt mạnh.

mẽ khi xây dựng mang nơ-rou để biệt kiệm: thời gian trên mt tiên trình bằng cách tính tốn sự kháobiệt cotta ốo thận số 6 chuyến tiếp

® Optim: torch.optim là ruột md-duu thu hiệu co thuật tốn bối tu hĩa kháo nhan đượo sit dụng dé xây, dựng trạng, uo-ron Hầu hột áo phương pháp thường, được sứ dụng đều đã đượu hỗ trợ, vì vậy,

khơng vin, phái xây, dung chứng, từ dau

e uu: Dy LOrch autograd giúp dễ dàng, xáo định đồ thi tính todu và lay gradient, nhưng autograd tho v6

thé hơi qué thấp dé xáo định uáo mang uo-rou phứo tap Day là nơi mA wO-dun uu 06 thé tro giúp

Ưu nhược điểm:

Py Lorch 06 những tu và nhượo diéu sau đây;

s Uu điếm.

— Mang lại khá năng debug dễ dàng hon theo hướng, interactively, rất nhiều nhà: nghiên oứu và

cugivesr da dừng gắ pytorch và 6ensorflow đều đánh giá uáo pytorch hon trong van đề debug và.

visualize.

21

Trang 24

— Hỗ trợ tốt dyuamio graphs.

— Đượo phát triễu bởi đội ngữ Facebvok,

— Két hop oắ vao APL vap oao và vap thập

e Nhượo điếu:

— Vẫn chua đượu hoàn thiện trong, việo deploy, 4p dụng cho vac hộ thong lớn, đượu như ñraiiowork

ra đời trướo nó như teusorflow

— Ngoài document chính từ pyborch thi vẫn con khá, han chê áo nguồn tài liệu bêu ngoài như gấu

tutorials hay, cao âu hối trén stackovertlow.

2.1.8 Convolutional Neural Networks - ONN

Giới thiệu

Trong, đề tai này, thi nhóu: đã, chọu Mask R-ONN đế giải bài toáu nhậu diệu đôi bượng dứa mình, Trước khitìm hiểu Mask R-ONN là gì thì sẽ phái di từ oo bam trước Đó chính là ONN

Định nghĩa ONN

Oouyolutional Neural Network (ONN) là một loại mạng nơ-ron nhân bạo duge sứ dụng, trong nhận dang và.

xứ lý hình ánh đượo tối ưu hoa dé xứ lý dữ liệu pixel Do đó, Convolutional Neural Network là nền tang vo

ban và co bau cho nhiệm vụ phan đoạn hình ánh cotta thị giáo mấy tính (phan đoạn ONN).

Kiệu trav Qonyolutional Neural Network bao gồm ba lớp chính:

I Lớp chuyéu đối: Lớp này giúp tritu tượng hóa hình ánh đầu vào như mot ban đồ dao trưng thông: qua

việu sứ dụng dấu bộ loo và hạt nhâu.

2 Lớp tống hợp: Lớp này giúp giãm bớt mẫn bắn đồ đối tượng: địa lý bằng uách tom tắt sự hiệu diệu dúa

vac đối tượng dia lý trong, vac bắn vá dứa bắn đồ đôi tượng, địa lý,

3 Lớp đượo kêt nối đầy đủ: Oáo lớp duge kêt nối đầy đủ kết nỗi mọi Hơ-ron trong miột Lép với wot HƠ-EOU.

trong, lớp kháu.

Việo kết hợp áo lớp cita ONN cho phép mang nơ-ron, được thiệt kệ học vach xáo định và nhậu dạng, đôi

tượng, quan tâm troug một hình ánh Convolutional Neural Network đượo xây, dựng dé phân loại ánh và:

phát hiệu đối tượng: với wot đối tượng duy, nhất trong, ánh

_ car

predicted

pooling convolutional pooling fully-connected class

convolutional layer layer layer layer

layer input image

Hình 2.5: Mo hình hoạt động ctta ONN

Trang 25

Dinh nghĩa Mask R-ONN

Mask R-ONN là một Qonvolutional Neural Network (ONN) và hiệu đại nhất về phan đoạn hình ánh va phan

đoạu phiêu bin Mask R-ONN đượo phát triéu dựa trêu Kastec R-ONN Kháu với Kaster R-ONN, khi dua

hình ánh vào ngoài việu tra ra label va bouding box cla từng object trong một hình ánh thi Mask R-ONN

36 tra phôi uấo object mask như Hình 2.9.

Oach thứu huạt động: của Mask R-ONN

Mask R-ONN được xây, dựng bang Faster R-ONN Trong khí Faster R-ONN có 2 đầu ca cho tuỗi đối bượng,

ứng: viên, một nhãn lớp và một khoáng, ách hộp giới hạn, thì Mask R-ONN là phầu bố sung dứa nhánh thứ

ba xuất ra wat nạ đối tượng Dau ra mat nạ bố sung kháo với đầu ra lớp và hộp, yêu cau trích xuất bố oụo

không gian tốt hou nhiều của mot đôi tượng.

Mask R-ONN là một phầu mỡ rộng: otta Faster R-ONN và hoạt động bằng gách thêm: một nhánh dé dự

đoán wat nạ, đôi tượng, (Region of Luterest) song song với nhậnh hiện co dé nhận dạng hộp giới hạn.

Nguyêu lý hoạt doug, oúa Mask R-ONN có thé đượo tóm luge lại như sau:

s lrước tiêu 16 sẽ sứ dụng QouvNet để trích xuất vac dao trưng từ hình ánh dau vào

e Oáu tinh này sau đó số đượo chuyển qua wot Region Proposal Network (RPN) sau đó sẽ tra về odo

bounding box tai co vùng 06 thé vd đối tượng với dáo kích thước kháo nhau

» Sau đó thêm vào lớp Rol pooling layer với mục đích gop tat áo bouding box tréu cling I đối bượng,với vac kích thước kháo nhau về dùng T kích od

e Và cuối cing được chuyến tới một fully connected layer dé phan loại và đầu ra là 1 bouding box cho

từng đối tượng

23

Trang 26

Tegion proposal network

Hình 2.10; M6 hình hoạt doug clita Faster R-ONN

Backboue Model

Tương tự như OouvNet trong Easter R-ONN thi trong Mask R-ONN, táo giá sử dụng kiên trúc ResuetTUT

dé trích xuất thong tin từ hình ánh đầu vào

Region Proposal Network-RPN

Jroug bướo này model sử dung tính nang được trích xuất ấp dung vào mang RPN dé dự đoán đôi tượng 06trong khi vue đó hay, không Sau bướo này thì sẽ thu được bounding box tại cdc vùng v6 thế dó đối tượng,

từ mô hình dự đoáu.

Region Of Luterest-ROL

Oáo bounding box tit cao khu vực phát hiện, đôi tượng, sẽ 06 những: kích thướu kháo nhau nêu qua bude này,

36 BỘp toàn bộ vac bouding box đó về 1 kích thước nhật định tại 1 đối tượng ip theo, vac vững này, đượu

chuyến qua một fully counevted layer để dự đoán nhấu lớp và hộp giới hạn Một đối tượng sẽ 06 rất nhiều

bonnding box với vac kích thước kháo nhau sau đó nó số được loại bó dan qua vise tính boáu LOU bang uống,

thite:

lol — Area of the intersevtion / Area of the union

loU là vừng, giao nhau giữa bouding box dự đoán và bounding box thu té chia cho bouding box thực bê.Nếu loU lớn hon hoặc bang U.S thì sẽ quan tai gòn, nhỏ hon thi sẽ loại bó

Trang 27

Box 4a

Box 14~

Hình 2.11: Ví dụ true quan về loU

Dựa trêu hình, v6 thé thay, box! và box2 uó LoU nhó hon 0.5 nôn nó sẽ là vitug loại bó vou box3 và box4

là vùng lớn hơu hoặo bằng, U.S nên sẽ gọi là ving quan tâm.

Seguueutation Mask

Sau khi có ROL dựa, trên những, gia ter LOU qua vide tính toáu thì mô hình sẽ được thém wot nhánh wask

vào trong kiên trúo hiện bại

Trang 28

Ưu nhược điểm của Mask R-ONN

Mask R-ONN uó những tu và nhượo diém sau đây:

e Un điểm

— Linh dou giắn: Mask R-ONN rất dễ đào tao.

— Hiệu suất: Mask R-ONN law tốt hon tat od odo mục nhập wd hình đơn hiện 06 troug mọi báo vu

— Hiệu gua: Phương, phép này rit hiệu qua va chí thêm wot khodm chỉ phí whd cho Faster R-ONN

— Lính lĩnh hoạt: Mask R-ONN dễ dàng tống quất hoa cho v4c nhiệm vụ kháo Ví dụ: 06 thé sử

dụng Mask R-ONN đế ướo tính tư thé người trong, cig một khuôn khố

» Nhược điếu

— dồn nhiều chi phí hon so với cáo mô hình thé hộ cũ

2.1.9 Detectron2

Giới thiệu

Detectrou2 là thư viện thé hệ tiép theo ứa Eaoebook AL Research và là sự kê thừa dứa Dotootrou và

Hmaskroun-benohinark oững như đượo implement vào brong Py Lorch Nó cuug cap ve thuật toán phân doan

và phát hiệu hiệu đại Deteotrou2 dũng, hỗ trợ một số dự ấu nghiện oứu thi giáo mấy, tinh và áo ứng, dụng,

Hình 2.13: Cáo vật thé wa Devtevtron2 v6 thé bắt đượu

Detectrou gốo đượo implement vào trong, Oaffo2 Py Lorch cung vap mot mô hình lập trình mệnh lệnh truequan hon cho phép vic nhà nghiều oứu và, người thựu hành, lặp lại nhanh, hơn về thiết kê và thứ nghiệm: môhình Vì chúng, toi đã việt lại Detoutron2 từ đầu trong, Py Lorch, người dùng, hiệu gó thé hướng, lợi từ phương,phấp họo sâu ola Py Lorch cing như cộng đồng, lớu và, tích cue liêu tụo vai thiện Py Lorch

Thiết ké theo từng: md-dun, 06 thé wd rộng;

rong Detevtrou2 giới thiệu mot thiết kế mô-đun cho phép người dùng cin oáo triển khai mô-đún tùy, chính

vào hầu hệt mọi phan dữa hệ thông phát hiện đôi tượng Điều này, uó nghĩa là nhiều dự ấu nghiện oứu tuới

uó thé đượo việt bằng hàng: tram doug mã với sự tach biệt rõ ràng: giữa thư viện Deteotrou2 cdt lõi vA videtriến khai ughiéu oứu mới Detevtrou2 liêu tuo được tỉnh chính thiệt kê m0-dun dé 06 thé mở rộng bằng vach

triễu khai oáo mô hình wdéi va kháui phá, những, gách wéi wi v6 thé làm cho Detectrou2 lĩnh hoạt hon

Trang 29

Hình 2.14: Da chứu năng dứa Dectevtron2

Oáu nô hình va tinh năng: wdi

Detevtrou2 bao gồm tat gã, áo mô hình 06 sin trong: Deteotron gốo, chắng hạn như Faster R-ONN, Mask

R-ONN, RotinaNet và DeusePose Nó oững 06 muột số m6 hình mới, bao gồm Oasoade RK ONN, PanoptioEPN ya IounsorMask, và 36 oòn được tiếp tuo thêm áo thuật toán kháo Detevtron2 clung đã, cing da thêu:uấo tính năng như Batch Norm đồng, bộ và hỗ tro cho áo dataset mdi như LYLS

Task vụ mdi

Detectrou2 hỗ trợ mot loạt cáo task vụ liên quan dén phát hiệu đôi tượng Giống như Debeotrou gôo, nó hỗtrợ phát hiệu đôi tượng bằng áo hộp (boxes) va mask sogruentation, oững như dự dodn tu thé von người

Ngoài ra, Detevtrou2 vdu bố sung, hỗ trợ segmentation ngữ nghĩa, (semantic) và segmentation toau dánh, wot

task vụ kết hợp v& segmentation ngữ nghĩa va instance segmentation

Ohat lượng triển khai

Do được viết lại từ đầu, nôn Detectron2 cho phép vo nhà phát triéu xem lại áo quyết định thiết kê cấpthấp và giãi quyết wot số vẫn đề triéu khai trong Detectrou ban dau

lốc độ và khá nang mở rộng;

Bằng uách chuyến boàn bộ quy, trình đào tao sang GPU, Debeotron2 nhanh hon Detectron ban đầu cho nhiều

mô hình tiêu chuẩn kháu nhan Ngoài ra, việo phan phối trainuing déu nhiều mấy chú GRU giờ đây đã tra

nêu dễ dàng, khidu vide wd rộng quy, mô đào bạo đêu vac tap dữ liệu rất lớu brớ nôn đơn giấn hou nhiều

Detevtron2go

Oáo kỹ sư thi giáo máy, tinh otta Facebook AL đã triển khai một lớp phan mềm: bố sung, Detectrontgo, dégiúp việu trién khai dáo mô hình mdi tiêu tiếu vào sắn xuât dễ dàng hou Odo tính năng này bao gồm quy,

trình đào bạo tiêu chuấn với bộ dữ liệu nội bộ, lượng: tử hoa mang và chuyéu đối mộ hình sang cdo định dạng,

được bối ưu hoa dé triéu khai trêu điện toán dam may, và di động

Ưu nhược điễm của Detectrou2

Detectrou2 v6 những, wu và: nhượo điểm sau đây:

e Un điễu:

27

Ngày đăng: 23/10/2024, 10:19

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

  • Đang cập nhật ...

TÀI LIỆU LIÊN QUAN

w