1. Trang chủ
  2. » Luận Văn - Báo Cáo

báo cáo thực tập kỹ thuật công ty thinklabs jsc

33 0 0
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Thực tập kỹ thuật tại Công ty Thinklabs JSC
Tác giả Trần Thị Hà
Người hướng dẫn Nguyễn Đình Công
Trường học Trường Đại học Bách Khoa Hà Nội
Chuyên ngành Điện tử
Thể loại Báo cáo thực tập
Năm xuất bản 2022
Thành phố Hà Nội
Định dạng
Số trang 33
Dung lượng 5,67 MB

Nội dung

LỜI MỞ ĐẦU Đối với mỗi sinh viên, thực tập không chỉ là giai đoạn chuyển tiếp giữa môi trường học tập với xã hội thực tiễn, mà nó còn là gian đoạn vừa học, vừa làm tiếp xúc với công việc

Trang 1

TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI

VI ỆN ĐI ỆN TỬ - VI ỄN THÔNG

BÁO CÁO THỰC TẬP KỸ THUẬT

Sinh viên thực hiện : Trần Thị Hà

MSSV : 20182477

Lớp : Điện tử 10 – K63

Đơn vị ực tậpth : Công ty Thinklabs JSC

Hà Nội, 1-2022

Trang 2

LỜI MỞ ĐẦU

Đối với mỗi sinh viên, thực tập không chỉ là giai đoạn chuyển tiếp giữa môi trường học tập với xã hội thực tiễn, mà nó còn là gian đoạn vừa học, vừa làm tiếp xúc với công việc thực tế Trong kỳ ực tập lần này, em đã may mắn được tham gia thực tập tại công ty thThinkLABs Đây là cơ hội rt tốt để em được tiếp cận môi trường làm việc thực tế tại cc công ty, doanh nghiệp, qua đó có thể phần nào học hi được cc k năng cần thiết v chuyên môn, nghiệp v cng như cc k năng mm cần có, đng thời cng là cơ hội để chúng em

tự đnh gi lại kh năng ca bn thân và trau di thêm những kiến thc cần thiết để phc v cho tương lai sắp tới

Đợt ực tập kéo dài từ ngày 31/7/2021 – 29/8/2021 Ở ThinkLABs, em được tham thgia buổi seminar bo co tiến độ ca cc anh chị, được trau di kh năng nghiên cu, tiếp xúc với lĩnh vực Deep learning, rèn luyện thêm ngôn ngữ Python Không chỉ là kiến thc, tại đây em còn được học hi v tc phong hoạt động chuyên nghiệp, gặp gỡ người gii, tạo nn tng cho tương lai sau này

Những thuậ ợi và khó khăn trong đợn l t thực tập:

Thuận lợi:

- Sự quan tâm và giúp đỡ nhiệt tình từ mentor khiến bn thân không bị tự ti khi

trình bày quan điểm

- Thời gian thự ập thuận lợi giúp cho em có thể sắp xếp thời gian hợp lý.c t

Khó khăn:

- Do tình hình dịch bệnh COVID-19 phc tạp nên em phi thực hiện thực tập

online khiến việc trao đổi đôi chút khó khăn

Em xin chân thành cm ơn công ty ThinkLABs đã tạo điu kiện để em có thể tham gia thực tập trong thời gian này Và đặc biệt gửi lời cm ơn tới người thầy, người anh Nguyễn Đình Công đã tận ty giúp đỡ em trong khong thời gian thực tập, giúp em có nhiu bà ọc và hoàn thành đợt thự ập Em xin chân thành cm ơn !i h c t

Trang 3

MỤC LỤC

DANH MỤC HÌNH ẢNH i

CHƯƠNG 1: GIỚI THIỆU VỀ CÔNG TY CỔ PHẦN THINKLABS 1

1 Giới thiệu khi qut 1

2 Cơ cu tổ chc 2

CHƯƠNG 2: NỘI DUNG THỰC TẬP 4

1 Cc vị trí công việc trong công ty 4

2 Mô t cc lĩnh vực hoạ ộng chuyên môn ct đ a công ty 4

2.1 Lĩnh vự ập trungc t 4

2.2 Mộ ố sn phẩm chính ca ThinkLABst s 5

2.3 Mộ ố thành tựu nổt s i bật 5

3 Mô t công việc được giao trong đợt thực tập 6

3.1 Tổng quan Machine Learning 7

3.2 Mạng Neuron tích chập (Convolutional Neural Network) 9

3.3 Tiếp cận bài ton nhận dạng và phân loại mộ ố t s loại sâu bệnh trên cây lúa 14

3.3.1 Giới thiệu bài ton 14

3.3.2 Cc nghiên cu liên quan 15

3.3.3 Đ t mô hìnhxu 15

3.4 Kết qu thực nghiệm và đnh gi 18 

3.2.1 Tập dữ ệu (dataset)li 18

3.4.2 Giao thc đnh gi 22

Trang 4

3.5 Kết luận 28

CHƯƠNG 3: NHẬN XÉT, ĐỀ XUẤT 30

1 Ưu điểm 30

2 Nhược điểm 30

3 Đ xut 30

CHƯƠNG 4: KẾT LUẬN 31

TÀI LIỆU THAM KHẢO 32

Trang 5

DANH MỤC HÌNH ẢNH

Hình 1: Hình nh logo ca công ty 1

Hình 2: Sơ đ tổ c bộ my công tych 2

Hình 3: Hình nh công ty dự ộc thi Watson Build do tập đoàn IBM tổ cu chc 6

Hình 4: Bc tranh tổng quan v AI 7

Hình 5 Cu trúc mạng CNN 9

Hình 6: Ví d v lớp convotional layer 10

Hình 7 Ví d lớp Max pooling 11

Hình 8 Ví d lớp Average Pooling 11

Hình 9 Cu trúc lớp kết n i đố ầy đ 12

Hình 10: Ví d v hàm softmax 13

Hình 11: Đ ị hàm ReLu th 13

Hình 13: Kiến trúc ca pretrained-model 17

Hình 14: Kiến trúc c giai đoạn – transfer learninga 2 17

Hình 15: Bộ sưu tầ nh gm m có 9 lớp sâu bệnh 18

Hình 16 Ảnh bệnh False Smut (bệnh than vàng) 19

Hình 17 Ảnh bệnh Bacterial Leaf Light ( bệnh bạc l) 19

Hình 18 Ảnh Brown plant hopper (sâu rầy nâu) 20

Hình 19 Ảnh Neck Blast (bệnh đạo ôn cổ bông) 20

Hình 20 Ảnh Brown Spot (bệnh đốm nâu) 21

Hình 21 Ảnh Sheath Blight (bệnh đốm vằn) 21

Hình 22: Cc loại sâu bệnh đã được chia theo triệu chng 22

Hình 23: Tổng kết lượng tham số sau giai đoạn 1 24

Hình 24: Số ợng mẫu đã được đnh nhẫnlư 24

Hình 25: Thực hiện tăng cường dữ liệu 24

Hình 26: Ảnh mẫu sau khi đượ gia tăng dữ c liệu 25

Trang 6

ii

Hình 28: Thực hiện đóng băng cc lớp đã hun luyện 26

Hình 29: Lượng tham số sau khi đóng băng dữ liệu 26

Hình 30: Lượng tham số sau khi thực hiện transfer learning 26

Hình 31: Kết qu đ thị 27

Hình 32: Confusion matrix sau khi hun luyện 27

Hình 33: Bo co bài ton phân loại 28

Trang 7

CHƯƠNG 1: GIỚI THIỆU VỀ CÔNG TY CỔ PH ẦN

THINKLABS

1 Giới thiệu khái quát

Tên công ty: CÔNG TY CỔ PHẦN THINKLABS

Tr sở chính: Tầng 1, tòa nhà Cao su Thanh Hóa, đường Lý Nam Đế, phường Đông Hương, thành phố Thanh Hóa, Thanh Hóa

Điện thoại: 09.444.888.68

Website: http://www.thinklabs.com.vn

Hình 1: Hình nh logo ca công ty Công ty cổ phần ThinkLABs được thành l p vào ngày 10 tháng 05 ậ năm 2017 bởinhững chuyên gia công ngh ệ trẻ, được đào tạo tại cc trường đại h c danh ti ng trongọ ế nước

và qu c t , luôn khát khao mang các sáng t o công ngh vào ph c vố ế ạ ệ   trực tiếpđờ ối s ng, đp ng những nhu cầu thiết thực ca doanh nghiệp và người sử dng.ThinkLABs cung cp các s n ph ẩm và d ch vị  đa dạng cho khách hàng bao gmcác gi i  php cho đô thịthông minh, chính quyn điện tử, ng d ng công ngh  ệ thôngtin t i các doanh nghi p trong ạ ệquá trình chuyển đổ ố trong xu hưới s ng cách m ng côngạ nghệ 4.0 Với phương châm

“Không ngừng h c h i, sáng tọ ỏ ạo” ThinkLABs đã kết hợpvới các phòng nghiên c u công nghệ tại cc công ty, trường đạ ọc hàng đầi h u trên thếgiới để cập nhật cc xu hướng công nghệ m i nh t nh m áp d ng vào các s n phớ  ằ   ẩm,gii pháp c a công ty nh ằm nâng cao năng sut, hiệu qu cho khách hàng.

Trang 8

2

2 Cơ cấu tổ chức

Tổng gim đốc: ông Hoàng Đc Thịnh

Hình 2: Sơ đ tổ c bộ my công ty ch

• Trường phòng sn xut phần mm: ông Phan Đình Hưng

• Trưởng phòng nghiên cu pht triển: ông Nguyễn Đình Công

• Trưởng phòng trung tâm đào tạo CNTT: ông Nguyễn Thế Cường

• Trường phòng kinh doanh và văn phòng: ông Lê Văn Chính

Đội ng chuyên gia năng động, nhiệt tình, sáng tạo được đào tạo một cách chuyên nghiệp, bài bn đã đạt được nhi u ch ng ch qu c t c  ỉ ố ế a cc trường đạ ọc hàng đầ thếi h u giới

Trang 9

ThinkLABs có đội ng hơn 30 nhân viên là cc k sư công nghệ thông tin t t nghiố ệp tại cc trường đại học chuyên ngành công nghệ thông tin trong nước, bên cạnh đó công ty cng có sự hợp tác với đội ng chuyên gia là cc Gio sư, tiến s đến từ các Công ty, các trường đạ ọc hàng đầu trong nưới h c và trên thế giới

Trang 10

4

CHƯƠNG 2: NỘI DUNG THỰC TẬP

1 Các vị trí công việc trong công ty

Công ty ThinkLABs có tiếp nhận cc sinh viên thự ập tùy theo thời gian làm việc : c tfulltime (toàn thời gian) hoặc parttime (bn thời gian) Sau khong thời gian thực tập nếu đ kh năng và pht triển có thể giữ lại làm nhân viên chính thc

Đố ới v i phòng R&D nghiên cu và pht triển:

- Leader nhận yêu cầu từ ban Gim đốc, chịu trch nhiệm trong cc dự n nghiên cu, tham gia pht triển prototype và hỗ trợ đào tạo, hướng dẫn cc thành viên

- Cc thành viên trong nhóm cần tinh thần trch nhiệm cao, luôn có buổi seminar mỗi

tuần để trao đổ n đ và họi v c hi thêm điu mới

2 Mô tả các lĩnh vực hoạt động chuyên môn của công ty

2.1 Lĩnh vực tập trung

Tư vn gii php cho cc dự n ng dng CNTT đô thị thông minh, chính quyn điện

tử, hỗ ợ công tc qun lý điu hành và tc nghiệp do nhu cầu ực tiễn đặt ra trên nhitr th u lĩnh vực

Phân tích, thi t k , xây dế ế ựng cơ sở ữ liệ d u các hệ thống thông tin ph c v  công tác chuyển đổi số theo yêu cầu ca cc đơn vị, tổ chc

Xây d ng hự ệ thống các ph n m m hầ  ỗ trợ qu n lý, h ỗ trợ điu hành tác nghiệp nh m nâng cao công tác qu n lý và ph c vằ    ca cc đơn vị, tổ ch c,doanh nghi p; xây d ng các ph n m m chuyên ngành, các Website công ty ệ ự ầ 

Triển khai, đào tạo các phần mm cho cc đơn vị, tổ chc, doanh nghiệ p

Cung c p các gói d ch v xây d ng h ị  ự ệ thống M ng, trung tâm tích h p d ạ ợ ữliệu, các gi i pháp truy n thông và các gói d ch v  ị  đào tạo CNTT

Trang 11

2.2 Mộ ố sản phẩm chính của ThinkLABst s

Những s n ph m, gi i pháp c a Công ty C ẩ   ổ phần ThinkLABs hiện đang đóng gópkhông nh vào quá trình  ng d ng công ngh thông tin trong cu c s ng hàng ngày và trong  ệ ộ ốqun lý hành chính nhà nước, bao gm:

• Hệ thống khám ch a b nh t xa: Hữ ệ ừ ệ thống hỗ trợ các phòng khám, bệnh viện

có thể khm và tư vn cho các b nh nhân t xa ệ ừ

• Hệ thống bệnh n điệ ửn t : Hệ thống giúp phòng khám, bệnh viện, bệnh nhân

có thể qun lý điệ ử  sơ khm chữn t h a bệnh

• Hệ thộng chẩn đon bệnh dựa trên trí tuệ nhân t o: H ạ ệ thống có th ể nhận diện các b nh thông qua các hình nh mà b nh nhân và b nh vi n cung c p vệ  ệ ệ ệ  ới độchính xác cao

• Hệ thống s d ng thi t bử  ế ị bay không người lái và trí tu nhân t o trong vi c ệ ạ ệgim st và đnh gi cc trạm viễn thông, đường dây truyn ti điện

- Thng 3 năm 2019 ThinkLABs đạt gii thưởng Top 50 doanh nghi p AI (trí ệ tuệnhân t o) kh i nghi p toàn c u t i AI&IOT&Smartcity ạ ở ệ ầ ạ ở Đài Loan

- Thng 4 năm 2019, ThinkLABs đạt Gii thưởng Sao Khuê 2019, danh hiệu uy tín nht ca ngành công ngh thông tin Vi t Nam ệ ệ

- Thng 6 năm 2019, ThinkLABs đạt gii nht cuộc thi IOT startup 2019 được tổ chc tại thành phố H Chí Minh

Trang 12

6

Hình 3: Hình nh công ty dự ộc thi Watson Build do tập đoàn IBM tổ cu chc

3 Mô tả công việc được giao trong đợt thực tập

Mục đích của đợt thực tập tại công ty:

• Tiếp cận với cch nghiên cu project v Trí tuệ nhân tạo

• Học Deeplearning v mặt lý thuy t và thế ực hành (ngôn ngữ Python):

- Tổng quan v Machine learning – Deep learning

- Cc bài ton cơ bn: Hi quy tuyến tính, phân lớp, …

- Cc phương php đnh gi và tham số cần thiết

- Tập trung vào mô hình CNN

• Qu trình thực tập được gim st bởi trưởng phòng R&D: anh Nguyễn ĐìnhCông

Trang 13

3.3 ếp cận bài toán nhậTi n dạng và phân loại m t sộ ố ại sâu bệnh trên cây lo lúa 3.3.1 Giới thiệu bài toán

Lúa gạo chiếm vị trí quan trọng trong xut khẩu ở Việt Nam nói riêng và Châu Á nói chung Lượng đt trng lúa ở Việt Nam hiện nay đang dần eo hẹp (gim khong 39.7 nghìn

ha trong năm 2021 [14] Tuy nhiên, việc pht hiện ra sâu bệnh ở cây lúa vẫn được nông dân thực hiện một cch th công và khó chính xc bởi không phi người nông dân nào cng có đ kiến thc và pht hiện kịp thờ ể đưa ra gii php hữu ích cho cây trng i đChính vì vậy, k thuật deep learning đã có thể gii quyết được vn đ đó trong việc phân loại hình nh

Trong thực tế, cc k thuật phân loạ ng dng rt nhiu Cc ngân hàng sử dng nó i

để phân loại khch hàng (ví d: liệu khch hàng có hoàn lại nợ tín dng hay không?) Cc bệnh viện ng dng nó để phân loại bệnh nhân, cc công ty bo hiểm dùng trong việc phân loại cc thân ch ca mình… Phân loại còn có thể được sử dng ở một mc độ sâu sắc hơn Ví d, cc loại camera hiện đại dùng bài ton classification để nhận diện khuôn mặt, dịch v bưu điện sử dng nó trong việc nhận dạng địa chỉ viết tay Cc thương gia dự đon

th trưị ờng bằng cc thuật ton phân loại, trong khi những nhà khí tượng sử dng nó để dự bo thời tiết

Vậy bài ton classification là gì?

Classification (bài ton phân lớp) [15] là bài ton thuộc loại học có giám sát (do

nh được đnh nhãn) Qu trình bắt đầu với việc dự đon lớp ca cc điểm d liữ ệu đã cho Cc lớp thường được gọi là đích, nhãn hoặc danh mc Mô hình dự bo phân loại là nhiệm v xp xỉ hàm nh xạ từ cc biến đầu vào đến cc biến đầu ra rời rạc Mc tiêu chính là xc định dữ ệu mới sẽ li thuộc lớp hoặc danh mc nào Gi sử 1 bài ton đơn gin như: pht hiện bệnh tim từ những dữ ệu sẵn có là một bài ton phân loại nhị phân (0 – không bị libệnh tim, 1- bị bệnh tim hoặc ngược lại) Trong bài ton này, qua qu trình hun luyện cc

dữ ệu nh v bệnh tim đã có từ li trước, my sẽ được học những đặc trưng cơ bn ca bệnh

Trang 14

3.3.2 Các nghiên cứu liên quan

Trong những năm gần đây, cc k thuật liên quan đến deeplearning đã đượ ng c dng trong việc phân tích bệnh trên cây chè [17] sử dng mô hình Caffenet để nhận dạng

13 loại bệnh khc nhau trên thực vật Một số nghiên cu v sâu bệnh trên cây lúa cng đã được công bố như k thuật transfer learning ọc chuyển giao) từ mô hình AlexNet (h [18]với 619 b nh v sâu bệnh, [19] sử dng k c thuật SVM (Support Vector Machine) phân loại 9 loại sâu bệnh trên cây lúa vớ ộ chính xc gần 97.5% i đ

Những nghiên cu được nhắ ở trên ch yếu tập trung vào c độ chính xác ca việc nhận dạng và phân loại bệnh trên cây Nhằm mc đích đó thì chúng ta có rt nhiu những

mô hình nổi tiếng với độ chính xc cao như: AlexNet, SVM, VGG16,… Tuy nhiên, với hoạt động ca những mô hình này lại yêu cầu lượng tham số khổng l, chẳng hạ như n VGG16 cần gần 14 triệu tham số [20] dẫn đến việc hun luyện tiêu tốn ngun tài nguyên my lớn, việc thực hiện rt mt thời gian (có thể lên đến 12 tiếng [21] cc thiết bị như ) Mobile hay my tính có phần cng CPU khó có thể đp ng (cần cu hình GPU) Điu này gây bt tiện cho việc pht triển ng dng sau này ca bài ton

3.3.3 Đề ất mô hìnhxu

Như đã đưa ra vn đ ở phần 3.3.2 v độ phc tạp ca những mô hình lớn, nhằm gii quyết điu đó, chúng tôi đ xu một mô hình có tên là Simple CNN Tuy độ chính xc t không cao như những mô hình ở trên p xỉ 94%) nhưng SimpleCNN lại gii quyết cân (xbằng được c 2 khía cạnh: độ tin cậy đ cao và thời gian tiêu tốn ít (lượng parameter chỉ khong vài trăm nghìn) Simple CNN là một mạng CNN được xây dựng toàn bộ từ đầu với

Trang 15

2 giai đoạn và lượng tham số tương đối nh sẽ phù hợp cho cc thiết bị mobile và những thiết bị có cu hình thp

Mô hình được chia thành 2 giai đoạn:

Giai đoạn 1: Toàn bộ dataset ca 17 lớp sau khi được chia ra từ dữ liệu gốc sẽ là dữ

liệu đầu vào cho giai đoạn này Kết qu cuối cùng ca giai đoạn này là lớp dense (lớp đầy đ) 17 nodes với hàm kích hoạt softmax →được xem là bước pretrained-model (mô hình tin hun luyện)

Giai đoạn 2: Bộ dataset ban đầu với 9 lớp được sử dng Toàn bộ trọng số ca giai

đoạn 1 được transfer sang trừ lớp ngoài cùng Như vậy, lớp dense 17 nodes đã được thay thế bằng lớp dense 9 nodes cùng với hàm kích hoạt là hàm softmax

K thuật transfer learning (học chuyển giao) mang lại nhiu lợi ích, nhưng những

ưu điểm chính là tiết kiệm thời gian đào tạo, hiệu sut tốt hơn ca mạng nơ ron (trong hầu hết cc trường hợp) và không cần lượng dữ liệu qu lớn Thông thường, dữ liệu đầu vào phi lên tới hàng nghìn tới để đào tạo một mạng nơ ron từ đầu nhưng không phi lúc nào -cng có sẵn quyn truy cập vào dữ liệu đó đây là lúc việc học chuyển giao trở nên hữu - ích Với việc học chuyển giao, một mô hình học my vững chắc có thể được xây dựng với

-dữ liệu đào tạo tương đối ít vì mô hình đã được đào tạo trước Ngoài ra, thời gian đào tạo được gim xuống vì đôi khi có thể mt vài ngày hoặc thậm chí vài tuần để đào tạo một mạng nơ-ron sâu từ đầu cho một nhiệm v phc tạp

Trong bài ton phân loại sâu bệnh trên cây lúa em đang trình bày, do lượng data kh

ít nên việc thực hiện transfer learning là một ý tưởng tốt Khc với những cch thông thường thì trong bài này, việc tạo pretrained model là làm từ đầu (tc là sử dng chính data thu thập được)

Kiến trúc của mô hình

Đúng như tên ca model, cu trúc rt đơn gin và không cần bộ tin xử lý Mô hình được trực quan hóa bằng sơ đ hình 13, 14

Ngày đăng: 17/06/2024, 17:26

w