1. Trang chủ
  2. » Giáo Dục - Đào Tạo

(Tiểu luận) nội dung tìm hiểu và cài đặt yolo, demo một số ví dụ cơ bản

28 16 3

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Nội dung tìm hiểu và cài đặt YOLO, demo một số ví dụ cơ bản
Tác giả Hồ Văn Thành, Minh Đào Thị Hạnh, Nguyễn Nguyên Huy Tuấn, Trần Mạnh Hợp, Vũ Minh Thụ, Lưu Ánh Dương, Nghiêm Bá Quang Anh
Người hướng dẫn Trương Minh Đức
Trường học Học viện Công nghệ Bưu chính Viễn thông
Chuyên ngành Điện tử
Thể loại báo cáo
Năm xuất bản 2023
Thành phố Hà Nội
Định dạng
Số trang 28
Dung lượng 7,49 MB

Nội dung

HỌC VIỆN CƠNG NGHỆ BƯU CHÍNH VIỄN THƠNG KHOA ĐIỆN TỬ BÁO CÁO KẾT THÚC MÔN HỌC THỊ GIÁC MÁY TÍNH Nội dung: Tìm hiểu cài đặt YOLO, Demo số ví dụ Nhóm Thành viên: Hồ Văn Thành Minh Đào Thị Hạnh Nguyễn Nguyên Huy Tuấn Trần Mạnh Hợp Vũ Minh Thụ Lưu Ánh Dương Nghiêm Bá Quang Anh B19DCDT142 B19DCDT069 B19DCDT205 B19DCDT100 B19DCDT239 B19DCDT035 B19DCDT008 GV hướng dẫn: Trương Minh Đức Hà Nội, 2023 LỜI NÓI ĐẦU Ngày nay, khái niệm kỹ thuật trở nên quen thuộc với nhiều người phát triển ngành lớn với phát triển kinh tế toàn cầu Để đáp ứng nhu cầu cấp thiết sống hội nhập tiến độ phát triển giới, đòi hỏi ngành kỹ thuật ngày phải nâng cao phát triển chất lượng khả ứng dụng rộng rãi Trong ngành “Cơng nghệ kỹ thuật Điện - Điện tử ” đóng vai trị quan trọng sống sinh hoạt hàng ngày sản xuất khắp giới Với công nghiệp 4.0 thiết bị điện tử đóng vai trị quan trọng, ngày trở nên đại chất lượng tốt Đặc biệt với ngành công nghiệp, công suất khơng thể thiếu để vận hành máy móc hoạt động Cùng với kiến thức học lớp kinh nghiệm có chúng em bắt đầu vào làm tập lớn Trong trình làm hoàn thiện đề tài, chúng em dẫn tận tình thầy đặc biệt thầy Trương Minh Đức Chúng em xin gửi lời cảm ơn sâu sắc đến thầy tận tình bảo chúng em chúng em có thắc mắc đưa hướng giải khác chúng em cần Dù đồ án hoàn thành nhiên hiểu biết hạn hẹp nên làm khó tránh sai sót, chúng em mong thầy xem xét góp ý để báo cáo chúng em hoàn thiện Chúng em xin chân thành cảm ơn! MỤC LỤC Tổng quan mơ hình Deep Learning computer vision 1.1 Khái niệm Deep Learning _4 1.2 Sự phát triển vượt bậc thị giác máy tính có Deep Learning _4 Giới thiệu thuật toán lịch sử phát triển YOLO _5 2.1 Lịch sử phát triển thuật toán YOLO _5 2.2 Giới thiệu thuật toán YOLO _5 Kết luận chương _8 Kiến trúc mạng YOLO Anchor Box 11 2.1 Khái niệm _11 2.2 Cách chọn Anchor Box _11 Hàm mát YOLO _12 Nguồn liệu huấn luyện cách chuẩn bị liệu _12 Kết luận chương 12 Huấn luyện mô hình YOLO 13 Các tham số cách tinh chỉnh tham số để cải thiện độ xác mơ hình 13 Các thủ thuật để tăng tốc độ độ xác mơ hình YOLO _14 Tổng kết chương 15 Ứng dụng YOLO 16 1.1 Thị giác máy tính _16 1.2 Robot _16 1.3 Chăm sóc sức khỏe 17 1.4 Nông nghiệp _17 1.5 Giao thông _18 1.6 Thể thao _18 Ví dụ cụ thể ứng dụng YOLO _19 Tổng kết chương 20 Tầm quan trọng YOLO Computer visison 21 Những hướng phát triển cho YOLO mơ hình Deep Learning khác tương lai. 21 DANH MỤC HÌNH ẢNH Hình 1.1: Hình ảnh minh họa Deep Learning _4 Hình 1.2: Dịng thời gian phát triển YOLO _5 Hình 1.3: Ví dụ q trình xử lý mơ hình YOLO Hình 1.4: Sơ đồ prior bounding box Hình 2.1: Sơ đồ kiến trúc mạng thuật toán YOLO Hình 2.2: Kiến trúc backbone YOLOv3 _10 Hình 2.3: YOLO3 phát object scale khác feature map 10 Hình 2.4: Xác định anchor box cho vật thể 12 Hình 3.1: Model đạt tới điểm glocal minimum local minimum 14 Hình 3.2: Các bước thực Mosaic Augmentation 14 Hình 3.3: Mixup tỉ lệ 0.1 : 0.9 ảnh trộn vào theo tỷ lệ nhãn ảnh biến đổi tương tự. _15 Hình 4.1: Ứng dụng phát đối tượng 16 Hình 4.2: Ứng dụng giúp điều hướng tự động cho xe tự chế 16 Hình 4.3: Ứng dụng xem ảnh chụp y khoa _17 Hình 4.4: Ứng dụng phân xem nông sản thu hoạch hay chưa _17 Hình 4.5: Ứng dụng giám sát giao thông _18 Hình 4.6: Ứng dụng phân tích thể thao 18 CHƯƠNG 1: GIỚI THIỆU Chương giới thiệu kiến thức tảng Cung cấp nhìn tổng quan cho người nghiên cứu Chương giới thiệu mơ hình Deep Learning tìm hiểu sơ lược thuật tốn YOLO Tổng quan mơ hình Deep Learning computer vision 1.1 Khái niệm Deep Learning Deep learning phương pháp học máy (machine learning) dựa mơ hình mạng neural nhân tạo sâu (deep neural networks) để học hiểu liệu Nó phần lĩnh vực học sâu (deep learning), mà mục tiêu xây dựng mơ hình máy tính có khả học thực nhiệm vụ phức tạp nhận dạng hình ảnh, nhận dạng giọng nói, dịch máy, tổng hợp giọng nói, nhiều ứng dụng khác Deep learning sử dụng kiến trúc mạng neural sâu có nhiều lớp ẩn (hidden layers) để tự động rút trích đặc trưng từ liệu đầu vào mà không cần quy tắc cụ thể lập trình trước Kiến trúc mạng neural sâu cho phép mơ hình học cách biểu diễn liệu dạng đặc trưng cấp cao, từ tạo dự đốn phân loại xác Deep learning đạt phát triển đáng kể năm gần đây, nhờ tiến khả tính tốn tài ngun máy tính Nó tạo tiến đáng kể nhiều lĩnh vực, bao gồm thị giác máy tính, xử lý ngơn ngữ tự nhiên, dược lý học, robot, xe tự hành v.v Hình 1.1: 1.2 Sự phát triển vượt bậc thị giác máy tính có Deep Learning Trước deep learning đời, tác vụ mà thị giác máy tính thực hạn chế địi hỏi nhiều nỗ lực mã hóa thủ cơng nhà phát triển người vận hành Với Machine Learning , nhà phát triển không cần phải viết mã thủ cơng mà cần lập trình ứng dụng để phát pattern hình ảnh, dùng thuật toán thống kê : linear regression, máy vectơ hỗ trợ, v.v để phát mẫu, đối tượng phân loại hình ảnh Deep Learning phương pháp hiệu để thực thị giác máy tính Trong hầu hết trường hợp, việc tạo thuật tốn Deep Learning thích hợp để thu thập lượng lớn liệu đào tạo gắn nhãn điều chỉnh tham số loại số lớp mạng nơ-ron đào tạo tham số Epochs Giới thiệu thuật toán lịch sử phát triển YOLO 2.1 Lịch sử phát triển thuật tốn YOLO Hình 1.2: Mơ hình YOLO mơ tả lần đầu điên Joseph Redmon, cộng Trong viết năm 2015 có tiêu đề You Only Look Once: Unified, Real time Object Detection.Trong cơng trình lần Ross Girshick, người phát triển mạng RCNN, tác giả người đóng góp Mơ hình YOLOv2 Joseph Redmon Ali Farhadi cập nhật nhằm cải thiện hiệu suất báo năm 2016 có tựa đề YOLO9000: Better, Faster, Stronger YOLOv3 đời năm 2018 báo với tiêu đề YOLOv3: An Incremental Improvement Những cải tiến xa mơ hình đề xuất Joseph Redmon Ali Farhadi, cải tiến nhỏ, chủ yếu thay đổi mơ hình deep CNN trích xuất feature 2.2 Giới thiệu thuật tốn YOLO 2.2.1 YOLOv1 (2015) Phương pháp dựa mạng neural network huấn luyện dạng end-to-end model Mơ hình lấy input ảnh dự đoán bounding box nhãn lớp cho bounding box Do không sử dụng region proposal nên kỹ thuật có độ xác thấp Mơ hình hoạt động cách trước tiên phân chia hình ảnh đầu vào thành lưới ô (grid of cells), chịu trách nhiệm dự đốn bounding boxes tâm nằm Mỗi grid cell dự đoán bounding boxes xác định dựa tọa độ x, y, tọa độ tâm, tọa độ góc, chiều rộng, chiều dài, độ tin cậy Document continues below Discover more from:trúc máy kiến tính ktmt 2022 Học viện Cơng ng… 211 documents Go to course TIỂU LUẬN KĨ NĂNG THUYẾT Trình-ÁP… kiến trúc máy tính 100% (6) ĐỀ CƯƠNG ƠN TẬP 52 MƠN KIẾN TRÚC MÁ… kiến trúc máy tính 100% (8) Cau truc 3G - câc 14 kiến trúc máy tính 100% (3) Nhóm VLSI - Tìm 21 74 hiểu cấu trúc và… kiến trúc máy tính 100% (2) Dlscrib sấdfasdfasdfasdf kiến trúc máy tính 100% (2) Internal Memory - Bộ Ví dụ mơ hình YOLO 2015 : hình ảnh 7x7, lưới dự đốn slide giảng môn… bounding box, kết trả 98 đề xuất 45 kiến trúc máy tính 100% (2) Hình 1.3: Mơ tả chi tiết q trình xử lý:  Đầu tiên mơ hình chia hình ảnh thành grid search kích thước SxS  Trên grid cell ta dự báo số lượng B bounding boxes confidence cho boxes confidence cho boxes phân phối xác suất C classes  Như output dự báo kích thước S x S x ( B x + C )  Giá trị tham số offsets bounding box gồm x,y,w,h confidence, C số lượng tham số phân phối xác suất 2.2.2 YOLOv2 (2016) YOLOv2 đào tạo liệu nhận dạng đối tượng có khả dự đoán lên đến 9000 loại đối tượng khác nhau, đặt tên YOLO9000 Mơ hình tiến xa nhiều so với mơ hình trước Mơ hình YOLOv2 sử dụng anchor boxes, bounding box xác định trước với hình dạng kích thước hợp lý tùy chỉnh trình huấn luyện Sự lựa chọn bounding boxes cho hình ảnh xử lý trước cách sử dụng thuật toán phân cụm k-mean tập liệu huấn luyện Điều quan trọng, predicted bounding box tinh chỉnh phép thay đổi nhỏ có tác động đến dự đốn, dẫn đến mơ hình ổn định Thay dự đốn trực tiếp vị trí kích thước, offsets (tức tọa độ tâm, chiều dài chiều rộng) dự đoán để di chuyển định hình lại predefined anchor boxes grid cell thơng qua hàm logistic Hình 1.4: 2.2.3 YOLOv3 (2018) YOLOv3 có kiến trúc giống với YOLO2, với số cải tiến:  Logistic regression cho confidence score: YOLO3 dự đoán độ tự tin bounding box(có chứa vật hay khơng) sử dụng logistic regression  Thay softmax logistic classifier rời rạc: YOLO3 sử dụng logistic classifier thay softmax cho việc phân loại đối tượng  Backbone - Darknet-53: Backbone thiết kế lại với việc thêm residual blocks (kiến trúc sử dụng ResNet)  Multi-scale prediction: YOLOv3 sử dụng kiến trúc Feature Pyramid Networks (FPN) để đưa dự đoán từ nhiều scale khác feature map Việc giúp YOLOv3 tận dụng feature map với độ thô - tinh khác cho việc dự đoán  Skip-layer concatenation: YOLOv3 thêm liên kết lớp dự đốn Mơ hình upsample lớp dự đốn tầng sau sau concatenate với lớp dự đoán tầng trước Phương pháp giúp tăng độ xác predict object nhỏ 2.2.4 YOLOv4 (2020) Được phát hành vào năm 2020, YOLOv4 phiên YOLO phiên cải tiến đến thời điểm Nó sử dụng nhiều kỹ thuật CSPDarknet-53, SPP-blocks, PANet, kết hợp kỹ thuật Mish activation hàm siêu tuyến tính (Linear Activation) để đạt độ xác tốc độ phát đối tượng tốt Cụ thể nâng cấp so với YOLOv3:  Backbone: DarkNet53 > CSPDarkNet53, áp dụng thêm DropBlock  Neck: FPN > SPP + PAN  Data Augmentation: Mosaic Augmentation, Self-Adversarial Training  Loss function: Regression Loss từ squared loss > CIoU Loss  Anchor Box: anchor > nhiều anchors  Label Smoothing  Loại bỏ Grid Sensitivity  Cosine Learning Rate schedule 2.2.5 YOLOv5 Phiên YOLOv5 phát triển nhóm nghiên cứu độc lập phiên thức YOLO So với phiên YOLOv4 YOLOv5 không thay đổi nhiều mà tập trung vào tốc độ dễ sử dụng:  Backbone: CSPResidualBlock > C3 module  Neck: SPP + PAN > SPPF + PAN  Data Augmentation: Mosaic Augmentation, Copy-paste Augmentation, MixUp Augmentation  Loss function: Thêm hệ số scale cho Objectness Loss  Anchor Box: Auto Anchor sử dụng GA  Loại bỏ Grid Sensitivity công thức khác  EMA Weight Kết luận chương Chương giúp hiểu kiến thức Deep Learning nắm sơ lược phiên khác thuật toán YOLO vài ví dụ chứng minh cách thức hoạt động thuật tốn YOLO việc xử lý hình ảnh   Như xác định vật thể cần xác định thành phần gắn liền với (cell, anchor box) Khơng riêng cell anchor box Một số trường hợp vật thể bị trùng midpoint, xảy ra, thuật tốn khó xác định class cho chúng Hình 2.8: Hàm mát YOLO Hàm mát (Loss function): YOLO sử dụng hàm mát kết hợp Localization Loss, Confidence Loss Classification Loss Trong đó, Localization Loss đo lường sai số việc dự đốn vị trí đối tượng, Confidence Loss đo lường độ chắn mơ hình việc phát đối tượng Classification Loss đo lường sai số việc phân loại đối tượng Nguồn liệu huấn luyện cách chuẩn bị liệu Nguồn liệu huấn luyện:  Tạo thư mục trổ đến folder vừa tạo lệnh cd  Cuối lấy mã nguồn darknet về, thực câu lệnh: git clone https://github.com/AlexeyAB/darknet Cách chuẩn bị liệu:  Có thể thu thập internet từ nguồn có sẵn, nhiều tốt  Sau có liệu, bạn vào thư mục darknet/data tạo folder images Copy tất ảnh bạn dùng để train vào thư mục images Kết luận chương Chương giúp có nhìn chi tiết thuật toán YOLO Chương cung cấp kiến trúc mạng với cơng dụng anchor box hàm mát ứng dụng thuật tốn YOLO vào ví dụ thực tế CHƯƠNG 3: HUẤN LUYỆN,KIỂM TRA MƠ HÌNH YOLO Ở chương này, cung cấp kiến thức cách huấn luyện mơ hình YOLO cách để cải thiện độ xác tăng tốc độ xử lí mơ hình YOLO Huấn luyện mơ hình YOLO Để huấn luyện mơ hình YOLO cần phải trải qua bước bản: i Chuẩn bị liệu huấn luyện: Tạo tập liệu huấn luyện (training set) tập liệu kiểm thử (test set):  Tập liệu huấn luyện (training set) chứa ảnh gán nhãn (label) với đối tượng cần nhận diện  Tập liệu kiểm thử (test set): chứa ảnh không huấn luyện sử dụng để kiểm tra độ xác mơ hình ii Chuẩn bị file cấu hình: Tạo file cấu hình (configuration file) để định nghĩa kiến trúc mơ hình thơng số huấn luyện File thường đặt yolov3.cfg yolov4.cfg, tùy thuộc vào phiên YOLO sử dụng iii Chuẩn bị file danh sách ảnh huấn luyện: Tạo file danh sách (list file) chứa tên file ảnh tập liệu huấn luyện File thường đặt train.txt iv Chuẩn bị file danh sách ảnh kiểm thử: Tạo file danh sách chứa tên file ảnh tập liệu kiểm thử File thường đặt test.txt v Chuẩn bị file danh sách nhãn: Tạo file chứa nhãn đối tượng cần nhận diện Ví dụ, toán nhận diện đối tượng xe hơi, nhãn "car", "bus", "truck", vv File thường đặt obj.names vi Chuẩn bị file định dạng YOLO cho tập liệu huấn luyện: Tạo file định dạng YOLO (.txt) cho ảnh tập liệu huấn luyện Mỗi file txt chứa thông tin đối tượng cần nhận diện ảnh, bao gồm tên nhãn, tọa độ bounding box kích thước đối tượng vii Train mơ hình YOLO: Chạy lệnh train YOLO để bắt đầu trình huấn luyện Trong q trình này, mơ hình YOLO cập nhật trọng số (weights) để tối ưu hóa độ xác viii Kiểm tra độ xác mơ hình: Sau huấn luyện xong, ta cần kiểm tra độ xác mơ hình tập liệu kiểm thử Ta sử dụng lệnh test YOLO để chạy mơ hình tập liệu kiểm thử đánh giá độ xác mơ hình Sau đó, ta điều chỉnh tham số huấn luyện huấn luyện lại mơ hình để tăng độ xác mơ hình Các tham số cách tinh chỉnh tham số để cải thiện độ xác mơ hình Thêm nhiều liệu: coi cách dễ nhằm tăng độ xác mơ hình Thêm nhiều lớp layer: tăng khả tìm hiểu tính liệu cách sâu sắc Thay đổi kích thước ảnh: Ảnh hưởng sâu sắc đến độ xác ảnh:  Nếu chọn ảnh nhỏ model khơng chọn với tính đặc biệt giúp ta nhận dạng ảnh  Nếu chọn ảnh q to tăng mức độ tính tốn mf máy khơng đủ tinh vi để xử lý chúng Tăng Epochs: Epochs số lần vượt qua tồn liệu thơng qua mạng lớn neural Tăng train cho model với nhiều epochs với khoảng +25,+100, Nhưng việc tăng Epochs có ý nghĩa có nhiều liệu Và đến thời điểm model đạt đến điểm định việc tăng Epochs khơng làm cải thiện độ xác Hình 3.9: Các thủ thuật để tăng tốc độ độ xác mơ hình YOLO Bag Of Freebies (BOF): Các kĩ thuật áp dụng không làm tăng thời gian xử lý mạng Object Detection gọi Bag of Freebies Label Smoothing cho Classification head: Là kĩ thuật đơn giản mà hiệu quả, dùng Classification.Kĩ thuật làm giảm tự tin thái model, làm giảm khả overfit Mosaic Augmentation : Là kĩ thuật Data Augmentation mạnh Object Detection, độ hiệu ổn định đem lại cao Mosaic Augmentation lần đầu giới thiệu YOLOv4, tác giả YOLOv5 nghĩ với bước:  Chọn ảnh ngẫu nhiên cho góc khác hình vng  Resize ảnh chọn kích cỡ đặt chúng vào góc khác  Crop vùng trung tâm randomsẽ ảnh sử dụng để đưa vào model Hình 3.10: Viusally Coherent Image MixUp for Object Detection: MixUp kĩ thuật Augmentation thành cơng Classification làm tăng độ xác dễ dàng nhận dạng đối tượng  Ý tưởng MixUp toán Classification trộn lẫn pixel thông qua nội suy ảnh Cùng lúc đó, one-hot label ảnh biến đổi tương đương theo tỉ lệ trộn lẫn Ý tưởng MixUp thể qua hình ảnh: Tổng kết chương Chương giúp biết trình bước để huấn luyện mơ hình YOLO để ứng dụng vào thực tế thủ thuật để tăng tốc độ xử lí cung tính xác mơ hình vào sử dụng CHƯƠNG 4: ỨNG DỤNG CỦA YOLO Chương nêu ứng dụng thực tiễn gần gũi mà áp dụng mơ hình YOLO vào sử dụng đưa ví dụ cụ thể cách ứng dụng mơ hình YOLO vào thực tiễn Ứng dụng YOLO 1.1 Thị giác máy tính YOLO dùng cho nhiều nhiệm vụ thị giác máy tính phát đối tượng, phân đoạn hình ảnh, phát khn mặt theo dõi Nó áp dụng ngành công nghiệp khác nhau, bao gồm bán lẻ, an ninh sản xuất Hình 4.12: 1.2 Robot YOLO sử dụng Robot để phát xác định vị trí đối tượng, điều cần thiết cho nhiệm vụ điều hướng tự động, nắm bắt vận dụng Hình 4.13: 1.3 Chăm sóc sức khỏe YOLO sử dụng lĩnh vực y tế cho nhiệm vụ phát tế bào ung thư hình ảnh y khoa, xác định theo dõi dụng cụ phẫu thuật trình phẫu thuật phát phân loại bất thường hình ảnh y khoa Hình 4.14: 1.4 Nông nghiệp YOLO sử dụng cho phát ước tính sản lượng nơng sản Nó phát phân loại loại trồng khác thời gian thực, cho phép nông dân giám sát trồng họ tối ưu hóa thực hành nơng nghiệp Hình 4.15: 1.5 Giao thơng YOLO sử dụng cho giám sát quản lý giao thông, phát đếm xe cộ phát người Nó giúp thành phố quan vận tải đưa định thông minh lưu lượng giao thông an tồn Hình 4.16: 1.6 Thể thao YOLO sử dụng môn thể thao cho nhiệm vụ phát theo dõi người chơi, phát bóng nhận dạng hành động Nó giúp nhà phân tích huấn luyện viên thể thao có thơng tin Hình 4.17: Ví dụ cụ thể ứng dụng YOLO Code sử dụng YOLOv3 để phát khuôn mặt ảnh import cv2 import numpy as np # Load YOLO weights and configuration net = cv2.dnn.readNet("yolov3-face.cfg", "yolov3-face.weights") # Define the output layer names layer_names = net.getLayerNames() output_layers = [layer_names[i - 1] for i in net.getUnconnectedOutLayers()] # Load the input image img = cv2.imread("input.jpg") # Resize the image to fit YOLO input size height, width, channels = img.shape blob = cv2.dnn.blobFromImage(img, / 255.0, (416, 416), swapRB=True, crop=False) # Set the input for the neural network net.setInput(blob) # Run the forward pass to get the outputs outputs = net.forward(output_layers) # Define the confidence threshold and non-maximum suppression threshold conf_threshold = 0.5 nms_threshold = 0.4 # Loop over each of the outputs for output in outputs: # Loop over each of the detections for detection in output: # Get the class ID and confidence scores = detection[5:] class_id = np.argmax(scores) confidence = scores[class_id] # If the detection is a face with high enough confidence if class_id == and confidence > conf_threshold: # Get the coordinates of the bounding box box = detection[0:4] * np.array([width, height, width, height]) (x, y, w, h) = box.astype("int") # Draw the bounding box and label cv2.rectangle(img, (x, y), (x + w, y + h), (0, 255, 0), 2) text = "Face: {:.2f}%".format(confidence * 100) cv2.putText(img, text, (x, y - 5), cv2.FONT_HERSHEY_SIMPLEX, 0.5, (0, 255, 0), 2) # Show the output image cv2.imshow("Output", img) cv2.waitKey(0) cv2.destroyAllWindows() Các bước thực đoạn code trên: i Tải trọng lượng cấu hình YOLOv3 đào tạo cho phát khn mặt ii Đọc ảnh đầu vào chuyển đổi kích thước để phù hợp với đầu vào YOLOv3 iii Đưa ảnh đầu vào vào mạng chạy chuyển tiếp để lấy đầu iv Lặp lại đầu phát đối tượng v Nếu đối tượng khuôn mặt với độ tin cậy đủ cao, vẽ hộp giới hạn nhãn lên ảnh vi Hiển thị ảnh đầu Tổng kết chương Chương cho biết hữu ích mơ hình YOLO áp dụng cho nhiều khía cạnh lĩnh vực khác giúp ích cho người sử dụng Ngoài qua chương có nhìn chi tiết ứng dụng thực tiễn mơ hình YOLO CHƯƠNG 5: TỔNG KẾT Chương tổng kết lại vài điều thuật toán YOLO đánh dấu phần kết thúc hoàn thiện báo cáo Tầm quan trọng YOLO Computer visison Trước YOLO có nhiều ý tưởng thuật tốn cho chủ đề object detection, từ image-processing-based đến deep-learning-based Trong đó, deep-learning-based cho kết tốt vượt trội Hầu hết object detection model xây dựng theo kiến trúc 2stage Nổi bật số RCNN, FastRCNN, FasterRCNN Kiến trúc 2-stage bao gồm giai đoạn:  Định vị vùng chứa vật thể  Đối với vùng bước 1, tiến hành phân loại Hướng giải đảm bảo độ xác chất lượng model cao, nhiên lại không đảm bảo tốc độ hiệu tính tốn Lý model bị chia làm giai đoạn (đặc biệt sử dụng ROI Pooling) khơng thể song song hóa tính toán Sau này, YOLO xuất giải tốt vấn đề Những hướng phát triển cho YOLO mơ hình Deep Learning khác tương lai Chắc người khơng cịn xa lạ với tên YOLO rồi? YOLOv1, YOLOv2, YOLOv3 xây dựng dựa ý tưởng one-stage object detection model có thành cơng đột phá người công nhận, YOLOv4 lại kỷ ngun mơ hình này? YOLOv4 xây dựng dựa ý tưởng YOLOv3 thêm tỷ cải tiến BoF, BoS để cải thiện độ xác tốc độ mơ hình Lý gọi YOLOv4 kỷ ngun YOLOv4 mơ hình YOLO khơng phát triển Joseph Redmon - tác giả mơ hình YOLO đằng trước, tác giả tun bố ngưng phát triển YOLO số lý do; thay vào mơ hình YOLO sau phát triển tác giả khác YOLOv4 phát triển Alexey Bochkovskiy Tài Liệu Tham Khảo [1] R Kundu, «V7,» 17 2023 [En ligne] Available: https://www.v7labs.com/blog/yolo- object-detection [2] V Hồng, «VIBLO,» 11 2019 [En ligne] Available: https://viblo.asia/p/tim-hieu-veyolo-trong-bai-toan-real-time-object-detection-yMnKMdvr57P [3] N C Thắng, «Mì AL,» 09 08 2019 [En ligne] Available: https://miai.vn/2019/08/09/yolo-series-2-cach-train-yolo-de-detect-cac-object-dac-thu/ [4] A B M Arka Prava Jana, IEEE Xplore, IEEE, 2018 [5] Q Pham, 17 12 2018 [En ligne] Available: https://pbcquoc.github.io/yolo/ [6] P D Khanh, 09 03 2020 [En ligne] Available: https://phamdinhkhanh.github.io/2020/03/09/DarknetAlgorithm.html More from: kiến trúc máy tính ktmt 2022 Học viện Cơng ngh… 211 documents Go to course TIỂU LUẬN KĨ NĂNG THUYẾT Trình-ÁP LỰ… kiến trúc máy tính 100% (6) ĐỀ CƯƠNG ÔN TẬP 52 MÔN KIẾN TRÚC MÁ… kiến trúc máy tính 100% (8) Cau truc 3G - câc 14 kiến trúc máy tính 100% (3) Nhóm VLSI - Tìm 21 hiểu cấu trúc và… kiến trúc máy tính More from: Minh Thành 100% (2) 250 Học viện Công nghệ… Discover more Nhóm VLSI - Tìm 21 hiểu cấu trúc và… kiến trúc máy tính 100% (2) Baigiang He Thong 129 Nhung (Programming) Kỹ thuật vi xử lý None Lập Trình STM32F1 Cơ 91 Bản Kỹ thuật vi xử lý None Báo Cáo Thực Tập Tốt 44 Nghiệp Tại Công Ty… Thực Tập Tốt Nghiệp None Recommended for you Correctional Administration Criminology 96% (113) English - huhu 10 Led hiển thị 100% (3) Preparing Vocabulary 10 FOR UNIT Led hiển thị 100% (2) 20 ĐỀ THI THỬ TỐT 160 NGHIỆP THPT NĂM… an ninh mạng 100% (1)

Ngày đăng: 26/12/2023, 05:01

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w