1. Trang chủ
  2. » Luận Văn - Báo Cáo

LUẬN văn THẠC sĩ tìm HIỂU MẠNG TÍCH CHẬP và xây DỰNG ỨNG DỤNG đếm các vật THỂ THÔNG DỤNG

79 56 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 79
Dung lượng 2,16 MB

Nội dung

BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC DUY TÂN NGUYỄN TRẦN HOÀNG LINH TÌM HIỂU Mạng tích chập VÀ xây dựng ỨNG DỤNG ĐẾM CÁC VẬT THỂ tHÔNG DỤNG LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH ĐÀ NẴNG – 2021 BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC DUY TÂN NGUYỄN TRẦN HOÀNG LINH TÌM HIỂU Mạng tích chập VÀ xây dựng ỨNG DỤNG ĐẾM CÁC VẬT THỂ tHÔNG DỤNG Chuyên ngành Khoa học máy tính Mã số 84 80 101 LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH Người hướng dẫn khoa học TS ĐẶNG VIỆT HÙNG ĐÀ NẴNG – 2021 LỜI CAM ĐOAN Sau quá trình h.

BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC DUY TÂN - - NGUYỄN TRẦN HỒNG LINH TÌM HIỂU MẠNG TÍCH CHẬP VÀ XÂY DỰNG ỨNG DỤNG ĐẾM CÁC VẬT THỂ THÔNG DỤNG LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH ĐÀ NẴNG – 2021 BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC DUY TÂN - - NGUYỄN TRẦN HỒNG LINH TÌM HIỂU MẠNG TÍCH CHẬP VÀ XÂY DỰNG ỨNG DỤNG ĐẾM CÁC VẬT THỂ THÔNG DỤNG Chuyên ngành: Khoa học máy tính Mã số: 84.80.101 LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH Người hướng dẫn khoa học: TS ĐẶNG VIỆT HÙNG ĐÀ NẴNG – 2021 LỜI CAM ĐOAN Sau trình học tập Trường Đại học Duy Tân, với kiến thức lý thuyết thực hành tích lũy được, với việc vận dụng kiến thức vào thực tế, tự nghiên cứu tài liệu, cơng trình nghiên cứu, đồng thời có phân tích, tổng hợp, đúc kết phát triển để hồn thành luận văn thạc sĩ mình, Tơi xin cam đoan cơng trình nghiên cứu riêng ta Các số liệu, kết nêu luận văn trung thực chưa công bố cơng trình khác Tác giả Nguyễn Trần Hoàng Linh LỜI CẢM ƠN Luận văn hoàn thành trước hết xuất phát từ nỗ lực phấn đấu thân trình học tập, nghiên cứu suốt thời gian làm đề tài Đề tài hoàn thành với thời gian kế hoạch lập thời gian triển khai thực tế, để đạt không nhớ đến công ơn thầy, cô bạn lớp học K18MCS quan tâm, chia sẻ tận tình giúp đỡ, đặc biệt gia đình ln bên cạnh ủng hộ Tơi khóa học Tôi xin bày tỏ cảm ơn sâu sắc đến thầy TS Đặng Việt Hùng, người tận tình dẫn giúp đỡ Tơi suốt q trình xây dựng đề cương hoàn thành luận văn, bên cạnh Tơi xin bày tỏ lịng biết ơn đến thầy TS.Đặng Việt Hùng có trao đổi, chia sẻ kinh nghiệm quý báu lĩnh vực mà Tơi nghiên cứu để Tơi hồn thành tốt luận văn Tơi xin bày tỏ lịng biết ơn thầy TS Nguyễn Gia Như Ban Giám Hiệu, thầy cô anh chị khoa sau đại học Trường Đại Học Duy Tân chuyên ngành Khoa Học Máy Tính (2018-2020), tạo điều kiện thuận lợi thời gian, sở vật chất để Tơi học tốt khóa học thời gian hoàn thành luận văn tiến độ Tác giả luận văn Nguyễn Linh Trần Hoàng MỤC LỤC MỞ ĐẦU 1 Lý chọn đề tài Mục tiêu nghiên cứu Đối tượng phạm vi nghiên cứu .2 Phương pháp nghiên cứu .2 Kết dự kiến Ý nghĩa khoa học thực tiễn luận văn Bố cục luận văn CHƯƠNG TỔNG QUAN CHUNG VỀ HỌC MÁY .4 1.1 HỌC MÁY LÀ GÌ 1.2 MỐI LIÊN HỆ VỚI CÁC LĨNH VỰC KHÁC 1.2.1 Trí tuệ nhân tạo 1.2.2 Khai phá liệu 1.2.3 Tối ưu hóa 1.2.4 Khái quát hóa 1.2.5 Số liệu thống kê .9 1.3 LÝ THUYẾT 1.4 CÁC LỚP PHƯƠNG PHÁP TRONG MACHINE LEARNING 10 1.4.1 Học có giám sát 11 1.4.2 Học không giám sát .12 1.4.3 Học bán giám sát 12 1.4.4 Học tăng cường 13 1.4.5 Nén chiều liệu 13 1.4.6 Các vấn đề liên quan khác 14 1.4.7 Models 18 1.4.8 Traning Models 23 CHƯƠNG GIỚI THIỆU VỀ MẠNG CNN VÀ RETINANET 24 2.1 MẠNG NƠ-RON TÍCH CHẬP 24 2.1.1 Định nghĩa 25 2.1.2 Kiến trúc .25 2.1.3 Các loại mạng CNN 28 2.2 GIỚI THIỆU VỀ RETINANET 37 2.2.1 Mạng Kim Tự Tháp tính (FPN) 38 2.2.2 Kiến trúc RetinaNet 40 2.2.3 Focal Lost 41 CHƯƠNG XÂY DỰNG CHƯƠNG TRÌNH ỨNG DỤNG RETINANET TRONG NHẬN DIỆN VẬT THỂ 46 3.1 GIỚI THIỆU 46 3.2 TRIỂN KHAI HỆ THỐNG 49 3.2.1 import thư viện cần thiết python .49 3.2.2 tải dataset sử dụng để huấn luyện 49 3.2.3 xây dựng hàm hỗ trợ .50 3.2.4 INTERSECTION OVER UNION (IOU) 51 3.2.5 Triển khai hàm sinh Anchor Box 53 3.2.6 Tiền xử lý liệu 55 3.2.7 Mã hóa nhãn 56 3.2.8 Xây dựng khung xương RESNET50 58 3.2.9 Xây dựng mạng kim tự tháp tính 58 3.2.10 Xây dựng phân loại đầu hồi quy hộp .59 3.2.11 Xây dựng RetinaNet 59 3.2.12 Triển khai lớp tùy chọn để giải mã dự đoán 60 3.2.13 Triển khai Smooth L1 loss Focal Loss 61 3.2.14 Cài đặt tham số huấn luyện 63 3.2.15 Khởi tạo biên dịch model 63 3.2.16 Cài đặt gàm callbacks 63 3.2.17 Nạp tập liệu sử dụng TensorFlow 63 3.2.18 Cài đặt đường ống tf.data 64 3.2.20 Huấn luyện model 64 3.2.20 Nạp weights .65 3.2.21 Xây dựng giao diện model 65 3.2.21 Sinh kết nhận diện 65 3.2.22 Kết .66 KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN CHO ĐỀ TÀI 69 TÀI LIỆU THAM KHẢO DANH MỤC CÁC HÌNH Số hiệu Tên hình Trang hình 1.1 1.2 1.3 2.1 2.2 2.3 2.4 Mạng nơ-ron Mô linear regression tệp liệu Một mạng Bayeys đơn giản So sánh LexNex AlexNex Minh họa mạng LeNex Minh họa mạng AlexNex Minh họa mạng VGG-16 20 22 22 27 28 31 33 2.5 2.6 2.7 2.8 2.9 2.10 2.11 3.1 3.2 3.3 3.4 3.5 3.6 Minh họa dạng cell GoogleLeNex Minh họa mạng GoogleLeNex Cộng trực tiếp đầu vào khối Kiến trúc đơn giản hóa mạng ResNet Minh họa RetinaNet phát bể bơi Sự khác kiến trúc mạng Kim Tự Tháp Mơ hình kiến trúc mạng RetinaNet Mơ hình lớp Ví dụ output nhận dạng Minh họa cách tính IOU Mơ tả kiến trúc thử nghiệm Dữ liệu thử nghiệm lớp Person Dữ liệu thử nghiệm lớp Cup 34 34 36 37 38 39 41 42 47 51 52 66 67 MỞ ĐẦU Lý chọn đề tài Thời đại công nghệ lên ngôi, vạn vật kết nối internet (IoT) địi hỏi phải có phương thức giúp Tơi sử dụng Đồng thời, từ khối liệu khổng lồ mà người cần dự đốn, vận hành mà khơng cần đến q nhiều bàn tay người Sự lên AI - Trí Tuệ Nhân Tạo Machine Learning (máy tự học) mang đến nhiều lợi ích cho toàn giới Từ việc lại học tập hay mua sắm, xem phim trực tuyến, thời gian tới, tất có bàn tay AI xen vào Machine Learning (Máy học) đứng sau trợ lý ảo, ứng dụng dịch ngôn ngữ, chương trình mà YouTube gợi ý nội dung hiển thị mạng xã hội bạn Nó điều khiển loại xe tự lái chẩn đốn tình trạng bệnh lý dựa hình ảnh Khi cơng ty ngày triển khai chương trình trí tuệ nhân tạo (AI), họ sử dụng Machine Learning nhiều đến mức thuật ngữ thường sử dụng thay cho không rõ ràng Machine Learning hướng nghiên cứu trí tuệ nhân tạo, cung cấp cho máy móc khả học hỏi, làm cơng việc định Những tác động vấn đề tiềm ẩn Machine Learning lớn, phạm vi đề tài này, tơi nghiên cứu cơng nghệ mạng tích chập áp dụng kiến thức để xây dựng đề tài“Tìm hiểu mạng tích chập xây dựng ứng dụng đếm vật thể thơng dụng” Bài tốn đếm vật thể toán cần thiết đời sống, yêu cầu đơn giản khó tìm cơng cụ đáp ứng Ví dụ chúng Tơi cần đếm xem có khen tường đằng ? Có ... nghệ mạng tích chập áp dụng kiến thức để xây dựng đề tài? ?Tìm hiểu mạng tích chập xây dựng ứng dụng đếm vật thể thơng dụng? ?? Bài tốn đếm vật thể toán cần thiết đời sống, yêu cầu đơn giản khó tìm. .. DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC DUY TÂN - - NGUYỄN TRẦN HỒNG LINH TÌM HIỂU MẠNG TÍCH CHẬP VÀ XÂY DỰNG ỨNG DỤNG ĐẾM CÁC VẬT THỂ THÔNG DỤNG Chuyên ngành: Khoa học máy tính Mã số: 84.80.101 LUẬN... cách áp dụng học máy, cụ thể sử dụng mạng RetinaNet để giải Mục tiêu nghiên cứu - Tìm hiểu học máy lĩnh vực liên quan - Tìm hiểu mạng tích chập biến thể - Xây dựng mơ hình mạng tích chập RetinaNet

Ngày đăng: 19/04/2022, 16:26

HÌNH ẢNH LIÊN QUAN

2.11. Mô hình kiến trúc mạng RetinaNet 41 - LUẬN văn THẠC sĩ tìm HIỂU MẠNG TÍCH CHẬP và xây DỰNG ỨNG DỤNG đếm các vật THỂ THÔNG DỤNG
2.11. Mô hình kiến trúc mạng RetinaNet 41 (Trang 9)
hình Tên hình Trang - LUẬN văn THẠC sĩ tìm HIỂU MẠNG TÍCH CHẬP và xây DỰNG ỨNG DỤNG đếm các vật THỂ THÔNG DỤNG
h ình Tên hình Trang (Trang 9)
Hình 1.1. Mạng nơ-ron - LUẬN văn THẠC sĩ tìm HIỂU MẠNG TÍCH CHẬP và xây DỰNG ỨNG DỤNG đếm các vật THỂ THÔNG DỤNG
Hình 1.1. Mạng nơ-ron (Trang 29)
Hình 1.2 Mô phỏng linear regression trên tập dữ liệu - LUẬN văn THẠC sĩ tìm HIỂU MẠNG TÍCH CHẬP và xây DỰNG ỨNG DỤNG đếm các vật THỂ THÔNG DỤNG
Hình 1.2 Mô phỏng linear regression trên tập dữ liệu (Trang 31)
Hình 2.1. So sánh LeNex và AlexNex - LUẬN văn THẠC sĩ tìm HIỂU MẠNG TÍCH CHẬP và xây DỰNG ỨNG DỤNG đếm các vật THỂ THÔNG DỤNG
Hình 2.1. So sánh LeNex và AlexNex (Trang 36)
Bắt đầu từ VGG-16, một hình mẫu chung cho các mạng CNN trong các tác vụ học có giám sát trong xử lý ảnh đã bắt đầu hình thành đó là các mạng trở nên sâu hơn và sử dụng các block dạng [Conv2D*n + Max Pooling]. - LUẬN văn THẠC sĩ tìm HIỂU MẠNG TÍCH CHẬP và xây DỰNG ỨNG DỤNG đếm các vật THỂ THÔNG DỤNG
t đầu từ VGG-16, một hình mẫu chung cho các mạng CNN trong các tác vụ học có giám sát trong xử lý ảnh đã bắt đầu hình thành đó là các mạng trở nên sâu hơn và sử dụng các block dạng [Conv2D*n + Max Pooling] (Trang 42)
Hình 2.5. Minh họa dạng 1 cell của GoogleLeNet - LUẬN văn THẠC sĩ tìm HIỂU MẠNG TÍCH CHẬP và xây DỰNG ỨNG DỤNG đếm các vật THỂ THÔNG DỤNG
Hình 2.5. Minh họa dạng 1 cell của GoogleLeNet (Trang 43)
Hình 2.6. Minh họa mạng GoogleLeNet - LUẬN văn THẠC sĩ tìm HIỂU MẠNG TÍCH CHẬP và xây DỰNG ỨNG DỤNG đếm các vật THỂ THÔNG DỤNG
Hình 2.6. Minh họa mạng GoogleLeNet (Trang 43)
Hình 2.7. Cộng trực tiếp đầu vào của khối với nhánh còn lại trong Identity Block - LUẬN văn THẠC sĩ tìm HIỂU MẠNG TÍCH CHẬP và xây DỰNG ỨNG DỤNG đếm các vật THỂ THÔNG DỤNG
Hình 2.7. Cộng trực tiếp đầu vào của khối với nhánh còn lại trong Identity Block (Trang 45)
Hình 2.8. Kiến trúc đơn giản hóa của mạng ResNet - LUẬN văn THẠC sĩ tìm HIỂU MẠNG TÍCH CHẬP và xây DỰNG ỨNG DỤNG đếm các vật THỂ THÔNG DỤNG
Hình 2.8. Kiến trúc đơn giản hóa của mạng ResNet (Trang 46)
quy mô nhỏ. Vì lý do này, nó đã trở thành một mô hình phát hiện vật thể phổ biến được sử dụng với hình ảnh vệ tinh và trên không. - LUẬN văn THẠC sĩ tìm HIỂU MẠNG TÍCH CHẬP và xây DỰNG ỨNG DỤNG đếm các vật THỂ THÔNG DỤNG
quy mô nhỏ. Vì lý do này, nó đã trở thành một mô hình phát hiện vật thể phổ biến được sử dụng với hình ảnh vệ tinh và trên không (Trang 47)
Hình 2.10. Sự khác nhau của kiến trúc Kim Tự Tháp - LUẬN văn THẠC sĩ tìm HIỂU MẠNG TÍCH CHẬP và xây DỰNG ỨNG DỤNG đếm các vật THỂ THÔNG DỤNG
Hình 2.10. Sự khác nhau của kiến trúc Kim Tự Tháp (Trang 48)
Hình 2.11. Mô hình kiến trúc RetinaNet - LUẬN văn THẠC sĩ tìm HIỂU MẠNG TÍCH CHẬP và xây DỰNG ỨNG DỤNG đếm các vật THỂ THÔNG DỤNG
Hình 2.11. Mô hình kiến trúc RetinaNet (Trang 50)
Hình 2.5 Ví dụ minh họa negative trong Focal Loss - LUẬN văn THẠC sĩ tìm HIỂU MẠNG TÍCH CHẬP và xây DỰNG ỨNG DỤNG đếm các vật THỂ THÔNG DỤNG
Hình 2.5 Ví dụ minh họa negative trong Focal Loss (Trang 51)
Hình 3.1. Mô hình lớp - LUẬN văn THẠC sĩ tìm HIỂU MẠNG TÍCH CHẬP và xây DỰNG ỨNG DỤNG đếm các vật THỂ THÔNG DỤNG
Hình 3.1. Mô hình lớp (Trang 55)
Trong nhận dạng thực thể, các mô hình cần phải vẽ ra được một khung giới hạn để đánh dấu thực thể với một xác suất nào đó. - LUẬN văn THẠC sĩ tìm HIỂU MẠNG TÍCH CHẬP và xây DỰNG ỨNG DỤNG đếm các vật THỂ THÔNG DỤNG
rong nhận dạng thực thể, các mô hình cần phải vẽ ra được một khung giới hạn để đánh dấu thực thể với một xác suất nào đó (Trang 59)
Hình 3.3. Minh họa cách tính IOU - LUẬN văn THẠC sĩ tìm HIỂU MẠNG TÍCH CHẬP và xây DỰNG ỨNG DỤNG đếm các vật THỂ THÔNG DỤNG
Hình 3.3. Minh họa cách tính IOU (Trang 60)
Anchor box là các hộp có kích thước cố định mà mô hình sử dụng để dự đoán hộp giới hạn cho một đối tượng - LUẬN văn THẠC sĩ tìm HIỂU MẠNG TÍCH CHẬP và xây DỰNG ỨNG DỤNG đếm các vật THỂ THÔNG DỤNG
nchor box là các hộp có kích thước cố định mà mô hình sử dụng để dự đoán hộp giới hạn cho một đối tượng (Trang 61)
Xử lý trước hình ảnh bao gồm hai bước: - LUẬN văn THẠC sĩ tìm HIỂU MẠNG TÍCH CHẬP và xây DỰNG ỨNG DỤNG đếm các vật THỂ THÔNG DỤNG
l ý trước hình ảnh bao gồm hai bước: (Trang 63)
3.2.7. Mã hóa nhãn - LUẬN văn THẠC sĩ tìm HIỂU MẠNG TÍCH CHẬP và xây DỰNG ỨNG DỤNG đếm các vật THỂ THÔNG DỤNG
3.2.7. Mã hóa nhãn (Trang 64)
 Tạo anchor box cho các kích thước hình ảnh đã cho Gán các ground box truth cho các anchor box - LUẬN văn THẠC sĩ tìm HIỂU MẠNG TÍCH CHẬP và xây DỰNG ỨNG DỤNG đếm các vật THỂ THÔNG DỤNG
o anchor box cho các kích thước hình ảnh đã cho Gán các ground box truth cho các anchor box (Trang 64)
Mô hình RetinaNet có các đầu riêng biệt để hồi quy hộp giới hạn và để dự đoán xác suất lớp cho các đối tượng - LUẬN văn THẠC sĩ tìm HIỂU MẠNG TÍCH CHẬP và xây DỰNG ỨNG DỤNG đếm các vật THỂ THÔNG DỤNG
h ình RetinaNet có các đầu riêng biệt để hồi quy hộp giới hạn và để dự đoán xác suất lớp cho các đối tượng (Trang 67)
Để đảm bảo rằng mô hình được cung cấp dữ liệu một cách hiệu quả, tôi - LUẬN văn THẠC sĩ tìm HIỂU MẠNG TÍCH CHẬP và xây DỰNG ỨNG DỤNG đếm các vật THỂ THÔNG DỤNG
m bảo rằng mô hình được cung cấp dữ liệu một cách hiệu quả, tôi (Trang 71)
 Tạo lô với kích thước lô cố định. Vì hình ảnh trong lô có thể có các kích thước khác nhau và cũng có thể có số lượng đối tượng khác nhau, tôi sử dụng padded_batch để thêm phần đệm cần thiết để tạo ra các tensors hình chữ nhật - LUẬN văn THẠC sĩ tìm HIỂU MẠNG TÍCH CHẬP và xây DỰNG ỨNG DỤNG đếm các vật THỂ THÔNG DỤNG
o lô với kích thước lô cố định. Vì hình ảnh trong lô có thể có các kích thước khác nhau và cũng có thể có số lượng đối tượng khác nhau, tôi sử dụng padded_batch để thêm phần đệm cần thiết để tạo ra các tensors hình chữ nhật (Trang 72)
Hệ thống thử nghiệm được triển khai theo mô hình sau: - LUẬN văn THẠC sĩ tìm HIỂU MẠNG TÍCH CHẬP và xây DỰNG ỨNG DỤNG đếm các vật THỂ THÔNG DỤNG
th ống thử nghiệm được triển khai theo mô hình sau: (Trang 74)
Hình 3.5. Dữ liệu thử nghiệm lớp Person - LUẬN văn THẠC sĩ tìm HIỂU MẠNG TÍCH CHẬP và xây DỰNG ỨNG DỤNG đếm các vật THỂ THÔNG DỤNG
Hình 3.5. Dữ liệu thử nghiệm lớp Person (Trang 75)

TỪ KHÓA LIÊN QUAN

TRÍCH ĐOẠN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w