1. Trang chủ
  2. » Luận Văn - Báo Cáo

Đề tài xây dựng ứng dụng phát hiện và phân loại bệnh trên cây sắn mì

37 0 0
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Xây Dựng Ứng Dụng Phát Hiện Và Phân Loại Bệnh Trên Cây Sắn Mì
Tác giả Trương Thị Mai Thanh Phan Thị Thảo Nguyễn
Người hướng dẫn Nguyễn Hà Huy Cường
Trường học Trường Đại Học Công Nghệ Thông Tin & Truyền Thông Việt Hàn
Chuyên ngành Khoa Khoa Học Máy Tính
Thể loại đồ án chuyên ngành
Năm xuất bản 2021
Thành phố Đà Nẵng
Định dạng
Số trang 37
Dung lượng 4,77 MB

Nội dung

Nhận dạng các loại bệnh trên lá cây thông qua xử ly ảnh là phương pháp nhận dạng màu sắc, hình dạng, kích thước của lá cây bị vàng so với lá cây bình thường ban đầu từ đó rút ra nguyên n

Trang 1

TRUONG DAI HOC CONG NGHE THONG TIN &

TRUYEN THONG VIET HAN

Khoa Khoa Hoc May Tinh

VKU

DO AN CHUYEN NGANH 2

DE TAI: XAY DUNG UNG DUNG PHAT HIEN

VA PHAN LOAI BENH TREN CAY SAN Mi

Giảng viên hướng dẫn : NGUYÊN HÀ HUY CƯỜNG

Sinh viên thực hiện : TRƯƠNG THỊ MAI THANH

PHAN THỊ THẢO NGUYÊN

Đà Nẵng, tháng 4 năm 2021

Trang 2

TRUONG DAI HOC CONG NGHE THONG TIN &

TRUYEN THONG VIET HAN

Khoa Khoa Hoc May Tinh

VKU

DO AN CHUYEN NGANH 2

DE TAI: XAY DUNG UNG DUNG PHAT HIEN

VA PHAN LOAI BENH TREN CAY SAN Mi

Giảng viên hướng dẫn : NGUYÊN HÀ HUY CƯỜNG Sinh viên thực hiện : TRƯƠNG THỊ MAI THANH

PHAN THỊ THẢO NGUYÊN

Đà Nẵng, tháng 4 năm 2021

Trang 3

NHAN XET CUA GIANG VIEN HUONG DAN

Trang 4

tin và sự học hỏi lẫn nhau giữa bạn bè cùng khóa

Thông qua bản báo cáo này, chúng em xin được gửi lời chân thành cảm ơn

đến Ban Giám Hiệu Trường và cùng các thầy cô trong khoa đã tạo những điều kiện tốt nhất cho chúng em trong suốt thời gian học tập và sinh hoạt tại trường; xin chân thành cảm ơn thầy Nguyễn Hà Huy Cường, giáo viên phụ trách hướng dẫn chúng

em tận tình trong suốt quá trinh thực hiện đề tài nảy

Chúng em xin chân thành cảm ơn quý thầy cô đã nhiệt tình giảng dạy, truyền đạt

những kiến thức, kinh nghiệm quý báu và hơn hết là tình cảm mà quý thầy cô đã

dành cho chúng em trong suốt quá trình giảng dạy

Mặc du cố gắng hoàn thành đồ án trong phạm vi và khả năng cho phép nhưng chắc chắn sẽ không tránh khỏi những thiếu sót Chúng em rất mong nhận được sự thông cảm, góp ý và tận tỉnh chỉ bảo của thầy, cô và tất cả các bạn đề đề tài

ngảy càng hoàn thiện hơn

Chung em xin tran trong cam ơn!

Sinh vién,

TRUONG THI MAI THANH PHAN THI THAO NGUYEN

Trang 5

MUC LUC Chwong 1 TONG QUAN VE DE TAD o i.cccccccccccccecccsscesseesscsssesssesssesssesesseesssesssessesseessses

1.1 Deep Learning 0.0 -‹dd 1 1.1.1 Deep Learning 18 91? oo ciccccccccsscscsscsecsecsecsensccsesecesessesecssssessessessevsecsessesseseesaes 1

1.4.3 Kiến trúc mạng ResÌNet in 211 2 11011111012 111121111111111 11 1x ty 10

1.4.4 Xây dựng mạng ResNet-50 c2 11 HH H101 0211111 gay 12 1.5 Tìm hiểu về Keras S2 25 212 212211111221 11121 121 He 13

1.5.1 Giới thiệu vỀ K€TaS c chu gu gưau 13

1.5.2 Keras với lineaT T€ØT€SSIOT 1n 2111101111101 1811110111111 111111111 1 Hy 14 1.5.3 Keras với |ÒISEIC T€ĐT€SSIOT L0 v21 HH1 1H11 021110111 111011811 Hy 15

Chương 2 PHÂN TÍCH VÀ THIẾT KỂ - 52 1 121 121122111 221 te uyu

2.3 Phân tích dữ liệu khám phả S2 2121 12111111211111111111111111 111114111 1111 11 17

2.4 Chuân bị dữ liệu 2c 22222 HH HH 2 th gguueg 18

2.5 Phân tích yêu câu hệ thống 6 St St 1E 211121121121122122121 E101 rer re 18

Trang 6

Biểu đồ se €8§€ Q.21 121011 11111111111111111111111111121111211111 1111111111111 xe 19

Chương 3 XÂY DỰNG ĐỂ TÀI 5 S1 2t nh HH HH2 tru rên 20 3.1 Các bước huấn luyện mô hình - 2 St St E1 1211211221211 E110 E12 eerrrre 20

3.2 Cài đặt công cụ và môi †rưỜờng óc k2 221 11112111111101 1111 1101111111111 0118 ch 20

3.3 Cài đặt thư viện - 2s cnE1 2t H1 22 2 2n H2 22H ru 21 3.4 Tiến hành lập trình - + St E1 1871711211211 1121 2 E1 121 121g rên 21 3.5 Một số hình ảnh của đề tài - 5 22 21 2221121112212211222 12121 ea 24 KẾT LUẬN 5 ST HH HH HH2 12121212 H H1 12g ae rag 25

1 Kết lạ)):EL;LRS¡)19 vgÿššaiaiaiadiiaaaảaa 25

2 Hạn chế của đề tài 2 122 S21 2 H22 212121 ng 25

3 Hướng phát triển của đề tài - ST SE H21 n1 1 12tr re 26 TÀI LIỆU THAM KHẢO ©55- 5 225122212111 21122 22 2211212 re re 27

Trang 7

DANH MUC CAC TU VIET TAC

CNN Convolutional Neural Network

Al Artificial intelligence

TNTK The Microsoft Cognitive Toolkit

GPU Graphics processing unit

Trang 8

DANH MUC HINH VE

Hình 1: Mang luci KEt NOi AD LTCU cecccccccccccccscscscsevesecscscseseseevsvsvevevecetesevevevevevevsvevevees 1 Hình 2:Của số trượt trên ma H"ẬN St TH HH HH HH HH HH tt Hung 6 Hình 3: Các lớp trong ConYolilondl LAW€F à ác Tnhh HH nh nhu 7 Hình 4 Vamishing (TTddHCHW Ì à ào HT HH hi ha 9 Hình 5 Vamishing (TTddHi€fW 2 ằà ST HH HH Ho HT HH ha 9 Hinh 6 Kién tric mang ResNetcccccccsccsscsscsssessesvessessesvssvssvcsssessesvetivscessesvesettetseesseen 10

Hinh 7 So sanh VGG-19, ResNet- 152 va Feedforward Neural Network 1]

Hình 8 Mô tả chỉ tiết kiến trúc tạng nơ ron ÑesÌNet ác 12 Hình 9 Các thư viện được sử dụng nhiễu ANG ccc cccccccccccccccscscscscscscscsvevevsvsveveveevevees 13 Hinh 10 Biéu dO User COSC cccccccccccscsscsssessessesssssessesssssssvssssessetsesittesvtessatssessesieseses 19 Hình lÌ ICHVHW DIQĐTGHH on HH HH HT HH ko Hết 19 Hinh 12 Cai dat Visual Studio Code TT TT HH kg KT 111 xxx ko 20 F;7.7/8087192:8.20.i, nnnnnïnn he 21 7.8/08 0 .ñ8nnn ng n aiñlĂlIlaĂ ỏ.ỏ.ốỏảố al Hinh 15 Dt tén CLASS ooo nh 6e 6djddlAlA-‹L(a 22 Hình 16 Upload m6 hÌHÍ à ào ch HH HH HH HH HH Hết 22

Firth 18 Xe ACD ccc hố eee ẽ ốồ.ồ.ồ 23

Hình 19 lrang CHỦ à sàn nh HH HT HH TH HH Hi 24 Hình 20 Kết quả sau khi upload hình c cc cctnE E212 rea 24

Trang 9

MO DAU

1 Giới thiệu đề tài

Việt Nam là một nước phát triển nông nghiệp, nông nghiệp đóng một vai trò

quan trọng trong nền kinh tế nước nhà Vì thế, bệnh trên lá cây được xem là bệnh

phổ biến đối với người nhà nông mỗi loại bệnh trên lá cây làm cho cây sinh trưởng

phát triển kém năng suất

Trên thế giới đã có một số công trình nghiên về cứu nhận dạng sâu bệnh trên trái cà chua, dưa chuột, bằng cách vận dụng kỹ thuật xử lý ảnh và nhận dạng đã đạt được một số kết quả khả quan Các hệ thống nhận dạng sâu bệnh thường được thử nghiệm trong điều kiện lý tưởng là môi trường nhà kính, chưa được áp dụng rộng rãi vào môi trường thực tế ngoài trời

Nhận dạng các loại bệnh trên lá cây thông qua xử ly ảnh là phương pháp nhận dạng màu sắc, hình dạng, kích thước của lá cây bị vàng so với lá cây bình thường ban đầu từ đó rút ra nguyên nhân gây bệnh của cây mà khắc phục Nghiên cứu này có thê nhận biết chính xác lá cây có hoặc không có sâu bệnh nằm trên đó

Hệ nhận dạng có thể nhận dang sâu bệnh tổng quát khi đã có dữ liệu sâu bệnh sử dụng kết hợp kỹ thuật nhận dạng với bộ lọc tương hợp đề nhận dạng sâu bệnh Đến nay, vẫn có rất ít hệ thống nhận dạng sâu bệnh cho một loại nông sản Ở Việt Nam, hiện nay chưa có các công bồ về hệ thống phát hiện và nhận dạng sâu bệnh trên cây trồng mặc dù phát triển mạnh về nông nghiệp Vì vậy, nhóm em đã chọn nghiên cứu

về đề tài “Xây dựng ứng dụng phát hiện và phân loại bệnh hại lá sắn” một ứng dụng

nhân dạng bệnh dựa vào các biêu hiện của lá cây từ ảnh chụp có ý nghĩa khoa học

và thực tiễn cao

2 Mục tiêu đề tài

Tìm hiểu được các loại bệnh trên lá cây sẵn mi va xây dựng giải thuật nhận điện các loại bệnh trên lá cây thông qua kĩ thuật xử lí ảnh Thực hiện tính toán, phân tích vả so sánh dữ liệu bệnh trên lá, từ đó xây dựng ứng dụng hỗ trợ cho người dùng biết và khắc phục bệnh cho cây

Trang 10

3 Doi tượng người dùng

e© Người nông dân trồng sắn

e Người có nhụ cầu tìm hiểu về các loại bệnh của cây sắn

Tập trung vao tim hiểu các loại bệnh trên cây, tập hợp mô hình cơ sở đữ liệu

từ đó xây dựng giao dién tương tác người dùng

Trang 11

Chuong 1 TONG QUAN VE DE TAI

1.1 Deep Learning

1.1.1 Deep Learning là gì ?

Deep learning duoc bat nguồn từ thuật toán Neural network vốn xuất phát chi la mét nganh nho cua Machine Learning Deep Learning là một chi của ngành máy học dựa trên một tập hợp các thuật toán để cố gang mô hình dữ liệu trừu tượng hóa ở mức cao bằng cách sử dụng nhiều lớp xử lý với cấu trúc phức tạp, hoặc bằng cách khác bao gồm nhiều biến đôi phi tuyến

Tương tự như cách chúng ta học hỏi từ kinh nghiệm thuật toán, deep learning

sẽ thực hiện một nhiệm vụ nhiều lần mỗi lần tinh chỉnh nhiệm vụ một chút đề cải

thiện kết quả Deep Learning chỉ đơn giản là kết nối đữ liệu giữa tất cả các tế bảo

thần kính nhân tạo và điều chỉnh chúng theo dữ liệu mẫu

Convolutional neural network

Hình 1: Mang luci kết nối dữ liệu

Càng có nhiều tế bảo thần kinh được thêm vào thì kích thước của dữ liệu sẽ cảng lớn Nó tự động có tính năng học tập ở nhiều cấp độ trừu tượng Qua đó cho phép một hệ thống học hàm ánh xạ phức tạp mà không phụ thuộc vào bất kỳ thuật

Trang 12

toán cụ thê nào Không ai thực sự biết những gì xảy ra trong một mạng lưới thần kinh nhân tạo Vì vậy, hiện tại bạn có thế gọi Deep Learning là một cái hộp đen

Deep Learning da giup máy tính thực thi những việc tưởng chừng như không thê vào 15 năm trước: phân loại cả ngàn vật thế khác nhau trong các bức ảnh, tự tạo chú thích cho ảnh, bắt chước giọng nói và chữ viết của con người, giao tiếp với con người, hay thậm chí cả sáng tác văn, phim, ảnh, âm nhạc

Deep learning là một phần của Machine Learning, một ngành rất rộng và nặng về toán, pôm rất nhiều thuật toán và môi thuật toán có ứng dụng riêng tùy vào bài toán:

e Linear Regression

« Logistic Regresstion

e Decision Tree and Random Forest

e« Naive Bayes

e Support Vector Machines

Đề có thể dễ hình dung về Deep Learning chúng ta sẽ tìm hiểu cách nó hoạt động thông qua một số ví du sau Hãy bắt đầu với một ví dụ đơn gian vé Deep Learnine ở cấp độ khái niệm Hãy cùng suy nghĩ làm thế nào để chúng ta có thể nhận biết được một hình nào đó là hình vuông

Trang 13

Có thê đầu tiên bạn sẽ kiếm tra xem hình đó có 4 cạnh hay không, nếu nó

đúng chúng ta sẽ kiểm tra tiếp 4 cạnh này có được kết nối với nhau thành 1 hình tử giác hay không, nếu đúng chúng ta sẽ kiêm tra tiếp 4 cạnh này có vuông góc với nhau không và chúng có kích thước bằng nhau không Nếu tất cả đều đúng thì kết

quả nó là hình vuông

Nhìn chung thì cũng không có gì phức tạp cả nó chỉ là 1 hệ thống phân cấp

các khái niệm Chẳng hạn như ví dụ ở trên chúng ta đã chia nhiệm vụ xác định hình vuông thành những nhiệm vụ nhỏ và đơn giản hơn Deep Learninp cùng hoạt động tương tự như vậy nhưng ở quy mô lớn hơn

1.2 Tổng quan về thư viện Tensorflow

1.2.1 Tensorflow la gi ?

Với sự bùng nô của lĩnh vực Trí Tuệ Nhân Tao — A.J trong thập ký vừa qua, machine learning và deep learning rõ ràng cũng phát triển theo cùng Và ở thời

điểm hiện tại, TensorFlow chính là thư viện mã nguồn mở cho machine learning nỗi

tiếng nhất thế giới, được phát triển bởi các nhà nghiên cứu từ Google Việc hỗ trợ mạnh mẽ các phép toán học đề tinh toan trong machine learning va deep learning da

giúp việc tiếp cận các bài toán trở nên đơn giản, nhanh chóng và tiện lợi hơn nhiều

Các hàm được dựng sẵn trong thư viện cho từng bài toán cho phép TensorFlow xây dựng được nhiều neural network Nó còn cho phép bạn tính toán song song trên nhiều máy tính khác nhau, thậm chí trên nhiều CPU, GPU trong cùng 1 máy hay tạo ra các dataflow graph - đỗ thị luồng dữ liệu để dựng nên các model

Kiến trúc TensorFlow hoạt động được chia thành 3 phần:

- _ Tiền xử lý đữ liệu

- Dung model

- Train va woc tinh model

Trang 14

Tensor dai dién cho các loại dữ liệu được dua vao trong Tensorflow Mỗi thuộc tính trong tensor sẽ có những đặc điểm và tính năng khác nhau Để giúp bạn hiểu hơn về Tensorflow, Bizfly sẽ giới thiệu ngay đến bạn những thuộc tính cơ bản sau đây:

« Rank: Trong các cầu trúc đữ liệu, thuộc tính bậc được hiểu một cách đơn giản chính là sự phân cấp bậc và là căn cứ cho việc phân loại các tensor Mỗi tensor khi được phân bậc sẽ có tên gọi khác nhau, cụ thé bac 0 1a Scalar, bac

1 là Vector bậc 2 là Matrix, các bậc cao hơn nữa sẽ được gọi là n-tensor

« Shape: Day 1a thuéc tinh chiều của tensor các cấu trúc dữ liệu

« _ Type: Kiểu dữ liệu của các element và là thuộc tính type duy nhất có trong tensor Một tensor chỉ có một loại type duy nhất cho toàn bộ các element có trong tensor Vi vay ma cấu trúc đữ liệu có tính thông nhất

1.2.3 Cách thức hoạt động

TensorFlow cho phép các lập trình viên tạo ra dataflow graph, cấu trúc mô tả làm thế nào dữ liệu có thế di chuyên qua 1 biểu đồ, hay 1 sê-ri các node đang xử lý Mỗi node trong dé thi dai dién 1 operation toan hoc, va mỗi kết nối hay edge gitra cac node la 1 mảng dữ liệu đa chiéu, hay còn được goi la ‘tensor’

TensorFlow cung cấp tất cả những điều này cho lập trình viên theo phương thức của ngôn ngữ Python Vì Python khá dễ học và làm việc, ngoải ra còn cung cấp nhiều cách tiện lợi đề ta hiểu được làm thế nào các high-level abstractions c6 thê kết hợp cùng nhau Node và tensor trong TensorFlow là các đối tượng Python,

và các ứng dụng TensorFlow bản thân chúng cũng là các ứng dụng Python Cac operation toán học thực sự thì không được thi hành bằng Python Các thư viện biến đôi có sẵn thông qua TensorFlow được viết bang cac binary C++ hiéu suất cao Python chỉ điều hướng lưu lượng giữa các phần và cung cấp các hiph-level abstraction lập trình để nỗi chúng lại với nhau.Các ứng dụng TensorFlow có thể chạy trên hầu hết mọi mục tiêu thuận tiện: máy cục bộ, cụm trone đám mây, thiết bị 1OS và Android, CPU hoặc GPU Néu ban str dung dam mây của riêng Google, bạn

Trang 15

có thể chạy TensorFlow trên silicon Đơn vị xử lý TensorFlow (TPU) tùy chỉnh của Google dé tang tốc hơn nữa Tuy nhiên, các mô hình kết quả được tạo bởi TensorFlow, có thế được triển khai trên hầu hết mọi thiết bị nơi chúng sẽ được sử dụng đề phục vụ đự đoán TensorFlow 2.0, được ra mắt vào tháng 10 năm 2019, cải tién framework theo nhiều cách dựa trên phản hồi của người dùng, để dễ dàng và hiệu quả hơn khi làm việc củng nó (ví dụ: bằng cách sử dụng các Keras API liên quan đơn giản cho việc train model) Train phân tán dễ chạy hơn nhờ vao API moi

và sự hỗ trợ cho TensorFlow Lite cho phép triển khai các mô hình trên khá nhiều nên tảng khác nhau Tuy nhiên, nếu đã viết code trên các phiên bản trước đó của

TensorFlow thì bạn phải viết lại, đôi lúc 1 ít, đôi lúc cũng khá đáng kẻ, dé tận dụng

tối đa các tính năng mới của TensorFlow 2.0

1.3 M6 hình CNN — Convolutional Neural Network

Convolutional Neural Network (CNNs — Mang no-ron tich chap) la một

trong nhimng m6 hinh Deep Learning tiên tiến Nó giúp cho chúng ta xây dựng được những hệ thông thông minh với độ chính xác cao như hiện nay CNN được sử dụng

nhiều trong các bài toán nhan dang cac object trong anh

CNN cũng có lịch sử khá lâu đời Kiến trúc gốc của mô hình CNN được giới thiệu bởi một nhà khoa học máy tính người Nhật vào năm 1980 Sau đó, năm 1998, Yan LeCun lần đầu huấn luyện mô hình CNN với thuật toán backpropagation cho

bài toán nhận dạng chữ viết tay Tuy nhiên, mãi đến năm 2012, khi một nhà khoa

học máy tính người Ukraine Alex Krizhevsky (đệ của Geofffey Himton) xây dựng

mô hình CNN (AlexNet) và sử dụng GPU để tăng tốc quá trình huấn luyện deep nets dé dat duoc top 1 trong cuộc thi Computer Vision thường niên ImageNet với

độ lỗi phân lớp top 5 giảm hơn 10% so với những mô hình truyền thống trước đó,

đã tạo nên làn sóng manh mé str dung deep CNN với sự hỗ trợ của GPU để giải quyét cang nhiéu cac van dé trong Computer Vision

1.3.1 Convolutional la gi?

Là một cửa sô trượt (Slidine Windows) trên một ma trận

Trang 16

Hình 2:Của số trượt trên ma trận

Các convolutional layer có các parameter(kernel) đã được học để tự điều

chỉnh lấy ra những thông tin chính xác nhất mà không cần chọn các feature

Trong hình ảnh ví dụ trên, ma trận bên trái là một hình ảnh trắng đen được số hóa

Ma trận có kích thước 5x5 và mỗi điểm ảnh có giá trị 1 hoặc 0 là giao điểm của dòng và cột

Convolution hay tich chap la nhan timg phan tr trong ma tran 3 Sliding Window hay con øọi là kernel, filter hoặc feature detect là một ma trận có kích thước nhỏ như trong ví dụ trên là 3x3

Convolution hay tích chập là nhân từng phần tử bên trong ma trận 3x3 với ma trận bên trái Kết quả được một ma tran goi la Convoled feature duoc sinh ra từ việc nhận ma trận Filter với ma trận ảnh 5x5 bên trai

1.3.2 Cấu trúc của mang CNN

Mạng CNN là một tập hợp các lớp Convolution chồng lên nhau và sử dụng các hàm nonlinear activation như ReLU và tanh đề kích hoạt các trọng số trong các node Mỗi một lớp sau khi thông qua các hàm kích hoạt sẽ tạo ra các thông tin trừu tượng hơn cho các lớp tiếp theo

Mỗi một lớp sau khi thông qua các hàm kích hoạt sẽ tạo ra các thông tin trừu tượng hơn cho các lớp tiếp theo Trong mô hình mạng truyền ngược (feedforward

Trang 17

neural network) thi méi neural dau vao (input node) cho méi neural dau ra trong cac

lớp tiếp theo

Mô hình này gọi là mạng kết nối đầy đủ (fully connected layer) hay mạng toan ven (affine layer) Con trong m6 hinh CNNs thì ngược lại Các layer liên kết duoc voi nhau théng qua co ché convolution

Layer tiép theo la két qua convolution từ layer trước đó, nhờ vậy mà ta có được các kết nối cục bộ Như vậy mỗi neuron ở lớp kế tiếp sinh ra từ kết quả của filter áp đặt lên một vùng ảnh cục bộ của neuron trước đó

Mỗi một lớp được sử dụng các filter khác nhau thông thường có hàng trăm hàng nghìn ñilter như vậy và kết hợp kết quả của chúng lại Ngoài ra có một số layer khác như pooling/subsampling layer ding dé chat lọc lại các thông tin hữu ích hơn (loại bỏ các thông tin nhiễu)

Trong quá trình huấn luyện mạng (traning) CNN tự động học các giá trị qua các lớp filter dựa vào cách thức mà bạn thực hiện Ví dụ trong tác vụ phân lớp ảnh, CNNs sẽ cô gắng tìm ra thông số tối ưu cho các filter tương ứng theo thứ tự raw

pixel > edges > shapes > facial > hiph-level features Layer cuối cùng được dùng để phân lớp ảnh

Convolutions Subsampling Convolutions Subsampling Fully connected

Hinh 3: Cac lép trong Convolutional Layer

Trong mô hình CNN có 2 khía cạnh cần quan tâm là tính bất biến (Location

Invariance) và tính kết hợp (Compositionality) Với cùng một đối tượng, nếu đối

Trang 18

tượng này được chiếu theo các gốc độ khác nhau (translation, rotation, scaling) thi

độ chính xác của thuật toán sẽ bị ảnh hưởng dang ké Pooling layer sé cho ban tinh bất biến đối với phép dịch chuyến (translation), phép quay (rotation) và phép co giãn (scaling) Tính kết hợp cục bộ cho ta các cấp độ biểu diễn thông tin từ mức độ thấp đến mức độ cao và trừu tượng hơn thông qua convolution từ các filter Đó là lý

do tại sao CNNs cho ra mô hình với độ chính xác rất cao Cũng giống như cách con

người nhận biết các vật thể trong tự nhiên

Mạng CNN sử dụng 3 ý tướng cơ bản:

¢ Cac trudng tiếp nhận cục bộ (local receptive field)

¢ Trong sé chia sé (shared weights)

¢ Tong hgp (pooling)

1.4, Tổng quan về mạng ResNet

1.4.1 Giới thiệu về mạng ResNet

ResNet (Residual Network) được giới thiệu đến công chúng vào năm 2015 và thậm chí đã giành được vị trí thứ 1 trong cuộc thị ILSVRC 2015 với tỉ lệ lỗi top 5

chỉ 3.57% Không những thế nó còn đứng vị trí đầu tiên trong cuộc thí ILSVRC and

COCO 2015 với ImapeNet Detection, ImapeNet localization, Coco detectlon và Coco sepsmentation.Hiện tại thì có rất nhiều biến thể của kiến trúc ResNet với số lớp khác nhau như ResNet-I8, ResNet-34, ResNet-50, ResNet-101, ResNet-152, Với tên là ResNet theo sau là một số chỉ kiến trúc ResNet với số lớp nhất định

1.4.2 Vanishing Gradient

Trước hết thì Backpropagation Algorithm là một kỹ thuật thường được sử dụng trong quá trình tranining Ý tưởng chung của thuật toán lá sẽ đi từ output layer dén input layer và tinh toan gradient của cost function tương ứng cho từng parameter (weight) cua mang Gradient Descent sau do duoc su dụng dé cap nhat cac parameter

Ngày đăng: 20/12/2024, 17:55

TRÍCH ĐOẠN

TÀI LIỆU CÙNG NGƯỜI DÙNG

  • Đang cập nhật ...

TÀI LIỆU LIÊN QUAN