Tóm tắt Luận văn Thạc sĩ kỹ thuật: Ứng dụng mạng nơ ron tích chập nhận dạng các đối tượng di động

27 4 0
Tóm tắt Luận văn Thạc sĩ kỹ thuật: Ứng dụng mạng nơ ron tích chập nhận dạng các đối tượng di động

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Đề tài “Ứng dụng mạng Nơ ron tích chập nhận dạng các đối tượng di động” được thực hiện nhằm mục tiêu của đề tài là thực nghiệm mô hình Faster R-CNN nhận dạng các đối tượng tĩnh và di động, đưa ra các đánh giá độ chính xác của mô hình trong trường hợp tín hiệu đầu vào lúc bình thường và nhiễu.

ĐẠI HỌC ĐÀ NẴNG TRƯỜNG ĐẠI HỌC BÁCH KHOA NGUYỄN VĂN NAM ỨNG DỤNG MẠNG NƠ RON TÍCH CHẬP NHẬN DẠNG CÁC ĐỐI TƯỢNG DI ĐỘNG Chuyên ngành: Kỹ thuật điều khiển tự động hóa Mã số: 8520216 LUẬN VĂN THẠC SĨ KỸ THUẬT Đà Nẵng - Năm 2020 ĐẠI HỌC ĐÀ NẴNG TRƯỜNG ĐẠI HỌC BÁCH KHOA Người hướng dẫn khoa học: TS NGƠ ĐÌNH THANH Phản biện 1: TS Phan Văn Hiền Phản biện 2: TS Nguyễn Bê Luận văn bảo vệ Hội đồng chấm luận văn tốt nghiệp thạc sĩ chuyên ngành Kỹ thuật điều khiển tự động hóa họp Trường Đại học Bách khoa vào ngày 18 tháng năm 2020 Có thể tìm hiểu luận văn tại: - Trung tâm thông tin-Học liệu, Đại học Đà Nẵng - Thư viện trường Đại học Bách khoa Đà Nẵng MỞ ĐẦU Tính cấp thiết đề tài Những năm gần đây, việc ứng dụng mơ hình Deep Learning vào thực tế nhiều nhà khoa học quan tâm tham gia nghiên cứu, trội mơ hình mạng Nơ ron tích chập (CNN Convolutional Neural Networks) [1], [2], [3] ứng cử viên sáng giá để giải vấn đề như: xử lý liệu đầu vào lớn; xử lý online; nâng cao độ xác khả xử lý nhiễu đầu vào Để thực u cầu mơ hình CNN trải qua cải tiến cụ thể: Mạng Nơ ron tích chập khu vực (R-CNN - Regional convolutional neural networks) [4], [5], [6]; Mạng Nơ ron tích chập khu vực nhanh (Fast R-CNN - Fast region-based convolutional neural networks) [7]; Mạng Nơ ron tích chập khu vực nhanh (Faster RCNN - Faster region-based convolutional neural networks) [8], [9] Trong đó, mơ hình Faster R-CNN khơng dùng thuật tốn tìm kiếm chọn lọc để lấy khu vực, mà thêm mạng CNN gọi mạng đề xuất khu vực (RPN - Region Proposal Networks) để tìm khu vực [8] Đầu tiên ảnh cho qua mơ hình huấn luyện trước để lấy đồ đặc trưng Sau đồ đặc trưng dùng cho RPN để lấy khu vực, sau lấy vị trí khu vực thực tương tự Fast R-CNN [7] Độ xác nhận dạng yếu tố quan trọng mơ hình ứng dụng vào thực tế, đầu vào bị nhiễu (nhiễu: hình ảnh mơi trường trời tối, trời mưa ảnh bị che khuất phần…) ảnh hưởng đến q trình nhận dạng nào? Do vậy, nghiên cứu cho thấy ảnh hưởng nhiễu đầu vào lên độ xác nhận dạng mơ hình Faster R-CNN Với lý trên, định chọn nghiên cứu đề tài: “Ứng dụng mạng Nơ ron tích chập nhận dạng đối tượng di động” Mục tiêu đề tài thực nghiệm mô hình Faster R-CNN nhận dạng đối tượng tĩnh di động, đưa đánh giá độ xác mơ hình trường hợp tín hiệu đầu vào lúc bình thường nhiễu Mục tiêu đề tài Mục tiêu đề tài thực nghiệm mô hình Faster R-CNN nhận dạng đối tượng tĩnh di động, đưa đánh giá độ xác mơ hình trường hợp tín hiệu đầu vào lúc bình thường nhiễu Từ tiến hành xây dựng mơ hình nhận dạng đối tượng từ hình ảnh, đoạn video từ camera online Đánh giá khả ứng dụng mơ hình Faster R-CNN để phân loại loài hoa, nhận dạng hệ động thực vật rừng di động Đối tượng phạm vi nghiên cứu 3.1 Đối tượng nghiên cứu: - Cơ sở liệu hình ảnh, video Google - Cơ sở lý thuyết nhận dạng đối tượng - Các phương pháp, giải thuật nhận dạng đối tượng - Thuật tốn mạng Nơ ron tích chập 3.2 Phạm vi nghiên cứu: - Nghiên cứu kỹ thuật nhận dạng đối tượng từ hình ảnh - Nghiên cứu nhận dạng đối tượng tĩnh di động Cách tiếp cận, phương pháp nghiên cứu 4.1 Cách tiếp cận - Tìm hiểu nghiên cứu tài liệu liên quan đến đề tài tạp chí nước, trang diễn đàn kỹ thuật, nguồn tư liệu từ trang mạng internet Google, YouTube… 4.2 Phương pháp nghiên cứu 4.2.1 Phương pháp lý thuyết: - Tìm hiểu sở lý thuyết xử lý hình ảnh, xử lý video … - Tìm hiểu sở lý thuyết thuật toán mạng Nơ ron tích chập - Các tài liệu liên quan đến nhận dạng đối tượng từ hình ảnh, video, từ kho liệu Google 4.2.2 Phương pháp thực nghiệm: - Xây dựng mơ hình Faster R-CNN để nhận dạng đối tượng tĩnh di động - Kiểm tra đánh giá độ xác mơ hình Faster R-CNN nhận dạng thực nghiệm 10 lồi hoa trường hợp hình ảnh đưa vào lúc bình thường nhiễu Cấu trúc luận văn Phần mở đầu Chương 1: Tổng quan thuật toán nhận dạng Chương 2: Xây dựng huấn luyện mô hình Faster R-CNN Chương 3: Kết thực nghiệm đánh giá độ xác mơ hình Faster R-CNN Kết luận CHƯƠNG - TỔNG QUAN VỀ THUẬT TOÁN NHẬN DẠNG Tổng quan nhận dạng đối tượng 1.1.1 Khái niệm nhận dạng Nhận dạng mẫu ngành thuộc lĩnh vực máy học Nói cách khác, xem việc "cần thực tác động” vào liệu thô mà tác động cụ thể tùy vào loại liệu Như tập phương pháp học có giám sát Nhận dạng mẫu nhằm mục đích phân loại liệu dựa kiến thức trước dựa vào thông tin thống kê trích rút từ mẫu có sẵn Các mẫu cần phân loại thường biểu diễn thành nhóm liệu đo đạc hay quan sát được, nhóm điểm khơng gian đa chiều phù hợp Đó khơng gian đặc tính để dựa vào ta phân loại 1.1.2 Các khó khăn việc nhận dạng đối tượng 1.1.2.1 Tư , góc chụp 1.1.2.2 Sự xuất thiếu số thành phần 1.1.2.3 Sự biến dạng đối tượng 1.1.2.4 Sự che khuất 1.1.2.5 Sự phức tạp hình 1.1.2.6 Mơi trường ảnh 1.1.3 Các ứng dụng nhận dạng đối tượng 1.1.4 Tổng quan kiến trúc hệ thống nhận dạng đối tượng 1.1.5 Tổng quan nhận dạng hoa Hệ thống nhận dạng hoa ứng dụng máy tính tự động xác định nhận dạng loại hoa từ hình ảnh kỹ thuật số khung hình video từ nguồn video Một cách để thực điều so sánh đặc điểm loại hoa chọn trước từ hình ảnh sở liệu loại hoa Từ tập liệu sau huấn luyện, lấy đặc trưng loại hoa Hệ thống so sánh với hình ảnh thu từ camera trực tiếp qua ứng dụng kết loại hoa Đồng thời xuất thông tin loại hoa tên hoa, đặc điểm, nguồn gốc hoa Hình 1.1: Nhận dạng hoa mai Tổng quan mạng Nơ ron Mạng Nơ ron xây dựng dựa hiểu biết não người Mạng bao gồm loạt đơn vị liên kết khác nhau, ánh xạ tập đầu vào tập đầu Mỗi đơn vị gọi Nơ ron Hai loại Nơ ron nhân tạo quan trọng perceptron sigmoid Nơ ron Perceptron phát triển năm 1950-1960 nhà khoa học Frank Rosenblatt dựa cảm hứng từ nghiên cứu trước Warren McCulloch Walter Pitts Cách thức hoạt động perceptrons sử dụng vài đầu vào nhị phân x1, x2… tạo đầu nhị phân hình 1.2 Hình 1.2: Cách thức perceptron hoạt động Giả sử perceptrons có ba đầu vào: x1, x2, x3 Để tính tốn đầu giả sử trọng số w1, w2, w3… số thực diễn tả độ quan trọng đầu vào tương ứng Đầu Nơ ron hay xác định thơng qua so sánh tổng xích ma tích wj*xj với giá trị ngưỡng theo biểu thức sau: 0 if  j w j x j  threshold output    if  j w j x j  threshold Tổng quan mạng Nơ ron tích chập (CNN) 1.3.1 Kiến trúc mạng Nơ ron tích chập Mạng Nơ ron tích chập có kiến trúc khác với mạng Nơ ron thơng thường Mạng Nơ ron bình thường chuyển đổi đầu vào thơng qua hàng loạt tầng ẩn Mỗi tầng tập Nơ ron tầng liên kết đầy đủ với Nơ ron tầng trước Và tầng cuối tầng kết đại diện cho dự đoán mạng Đầu tiên, mạng Nơ ron tích chập chia thành chiều: rộng, cao sâu Tiếp theo Nơ ron mạng khơng liên kết hồn tồn với tồn Nơ ron kế liên kết tới vùng nhỏ Cuối tầng đầu tối giản thành vector giá trị xác suất Hình 1.3: Mạng Nơ ron thông thường (trái) CNN (phải) CNN gồm hai thành phần: - Phần tầng ẩn hay phần rút trích đặc trưng: phần mạng tiến hành tính tốn hàng loạt phép tích chập phép hợp (pooling) để phát đặc trưng Ví dụ: ta có hình ảnh ngựa vằn phần mạng nhận diện sọc vằn, hai tai, bốn chân - Phần phân loại: phần lớp với liên kết đầy đủ đóng vai trị phân lớp đặc trưng rút trích trước Tầng đưa xác suất đối tượng hình 1.4 Hình 1.4: Lớp rút trích đặc trưng ảnh (Conv, Relu Pool) Lớp phân loại (FC softmax) 1.3.2 Trích rút đặc trưng 1.3.3 Phân loại Tổng quan Faster R-CNN 1.4.1 Bài toán nhận dạng vật thể Hình 1.5: Nhận dạng hoa đồng tiền Bài tốn object detection có đầu vào ảnh màu đầu vị trí vật thể ảnh Ta thấy bao gồm hai toán nhỏ: - Xác định khung quanh vật thể - Với khung cần phân loại xem vật thể với phần trăm chắn 1.4.2 Mạng Nơ ron tích chập khu vực (R-CNN) Ý tưởng thuật toán R-CNN đơn giản: Bước 1: Dùng thuật tốn tìm kiếm chọn lọc để lấy khoảng 2000 khu vực ảnh đầu vào mà có khả chứa vật thể Bước 2: Với khung ta xác định xem vật thể 1.4.2.1 Thuật tốn tìm kiếm chọn lọc 1.4.2.2 Phân loại khu vực đề xuất 1.4.2.3 Vấn đề với R-CNN 1.4.3 Mạng Nơ ron tích chập khu vực nhanh (Fast R-CNN) Sau có đầu khu vực, tìm hiểu khái niệm anchors Tại vị trí cửa sổ trượt đặc trưng tích chập, tạo k anchors tương ứng hình ảnh gốc Trong nghiên cứu [7] tác giả sử dụng hình vng, hình chữ nhật với tỉ lệ chiều rộng, chiều dài 1×2 2×1, với kích cỡ khác nhau, k= 3×3 = Các anchors gán mác tích cực tiêu cực dựa vào diện tích chồng chéo với ground truth box theo luật sau Các anchor phân loại tích cực nếu: - Là anchor có tỉ lệ diện tích chồng chéo diện tích chồng chéo (Intersection-over-Union) lớn với ground truth box - Là anchor có tỉ lệ giao với ground truth lớn 0.7 Các anchor phân loại tiêu cực có giá trị IoU bé 0.3 Tại phải tạo anchors Câu trả lời gồm nguyên nhân chính: - Dựa phân loại anchor, để dự đoán xác suất chứa vật thể khu vực - Dựa vào khoảng cách từ anchor đến ground truth box, để dự đốn vị trí khung Từ ta xác định mục tiêu đầu box-regression layer box-classification nhắc tới phần cấu trúc mạng RPN 11 2.1.3 Cài đặt file môi trường 2.1.4 Cài đặt thư viện hỗ trợ 2.2 Huấn luyện cho mơ hình nhận dạng mười lồi hoa Để thực nghiệm mơ hình đạt kết tốt q trình thu thập tập liệu để huấn luyện cho mơ hình học quan trọng Ở nghiên cứu tác giả chọn thực nghiệm nhận dạng cho mười loài hoa nên việc thu thập liệu chủ yếu lấy từ mạng internet thơng qua trang tìm kiếm Google Đây thuận lợi trình nghiên cứu 2.2.1 Thu thập liệu Tổng số hình ảnh thu thập để huấn luyện mơ hình 506 (ảnh) [17] Các loài hoa gán số thứ tự chia thành hai tập: tập dạy mơ hình học (train) chiếm 80% tổng số hình ảnh; cịn lại tập kiểm tra mơ hình (test) chiếm 20% Tập hình ảnh train test chọn cách ngẫu nhiên Số lượng hình ảnh lồi hoa thu thập thể chi tiết bảng 2.1 Hình 2.1: Thu thập liệu hoa hồng hoa hướng dương 2.2.2 Gán nhãn cho loài hoa Sử dụng phần mềm LabelImg để gán nhãn cho loài hoa thư mục train test Trong hình ảnh ta lấy khu vực (RPN) gán nhãn hình 2.2 12 Tương tự ta thực việc gán nhãn cho tất loài hoa thư mục train test Số liệu cụ thể thể bảng liệu lưu [18] Hình 2.2: Gán nhãn cho hoa hồng hoa cẩm tú cầu Bảng 2.1: Bảng thu thập liệu loài hoa gán nhãn Số lượng Số Số Số Số Tên lượng lượng lượng Tên gán nhãn TT loài hoa tổng train test 1 Cầu 55 44 11 Hydrangeas 2 Cúc 50 40 10 Chrysanthemum Tiền3 41 33 Gerbera 4 Dương 45 36 Sun Flower 5 Hồng 57 46 11 Rose 6 Ly 55 44 11 Lily 7 Mai 51 41 10 Apricot Plossom 8 Sen 55 44 11 Lotus 9 Sứ 56 45 11 Porcelain Flower 10 10 Tiên 41 33 Narcissus Tổng 506 406 100 10 (lồi hoa) Chú thích: 1) Hoa cẩm tú cầu; 2) Hoa Cúc; 3) Hoa đồng tiền; 4) Hoa hướng dương; 5) Hoa hồng; 6) Hoa ly; 7) Hoa mai; 8) Hoa sen; 9) Hoa sứ; 10) Hoa thủy tiên 13 2.2.3 Xây dựng chương trình huấn luyện Sau xây dựng tập sở liệu tác giả tiến hành xây dựng chương trình mạng Nơ ron tích chập nhanh (Faster R-CNN) để rút trích giá trị đặc trưng đối tượng cần nhận dạng Chương trình viết phần mềm Python gồm hai file là: labelmap.py faster_rcnn.py đặt folder trainning hình sau: Hình 2.3: File chương trình huấn luyện 2.2.4 Huấn luyện cho mơ hình (a) (b) Hình 2.4: a) Q trình bắt đầu huấn luyện liệu mơ hình; b) Q trình kết thúc huấn luyện liệu mơ hình 2.2.5 Dừng huấn luyện mơ hình Trong q trình huấn luyện việc dừng huấn luyện cho mơ hình tác giả dựa vào đồ thị tensorboard, biểu đồ mát theo thời gian trình huấn luyện 14 Hình 2.5: Biểu đồ mát theo thời gian mơ hình Faster R-CNN Biểu đồ hình 10 cho thấy từ bước 25000 trở độ mát huấn luyện dao động khoảng từ đến 0.06 Như vậy, huấn luyện đến bước dừng huấn luyện cho mơ hình học Theo hình 4b tác giả dừng huấn luyện mơ hình bước 45555 nhận kết 0.0214, độ mát huấn luyện Trung bình thời gian để huấn luyện bước 0.300 (giây/step) 2.2.6 Kết sau huấn luyện Sau kết thúc việc huấn luyện mơ hình tạo sở liệu hình 2.6 Hình 2.6: Cơ sở liệu sau huấn luyện mơ hình học 2.3 Xây dựng chương trình nhận dạng cho đối tượng Sau huấn luyện tạo sở liệu, tác giả xây dựng chương trình nhận dạng đối tượng tĩnh di động với nguồn đầu vào 15 nhận dạng từ hình ảnh, video từ camera online (webcam) Các file chương trình viết ngơn ngữ Python hình sau: Hình 2.7: Các file chương trình nhận dạng đối tượng 2.4 Thực nghiệm mơ hình - Thực nghiệm mơ hình Faster R-CNN với đối tượng tĩnh: Đối với đối tượng tĩnh tác giả tiến hành thực nghiệm với đối tượng đầu vào mơi trường bình thường (ảnh mơi trường có ánh sáng tốt) nhiễu (ảnh bị che khuất 1/3; Ảnh bị che khuất 1/2; Ảnh môi trường thiếu ánh sáng) Qua tiến hành đánh gá độ xác mơ hình tương ứng với bốn trạng thái đầu vào - Thực nghiệm mơ hình Faster R-CNN với đối tượng di động: Đối với đối tượng di động tác giả thực nghiệm từ nguồn đầu vào video với đối tượng di dộng thực nghiệm với nguồn đầu vào từ webcam với đối tượng di động 2.1 Phương pháp đánh giá độ xác nhận dạng mơ hình Faster R_CNN Lập bảng ma trận để đánh giá độ xác tổng thể mơ hình, độ xác q trình nhận dạng dựa vào số mẫu (số ảnh) nhận dạng chia cho tổng số mẫu (số ảnh) kiểm chứng đưa vào Trong đó: 16 ĐCX: Độ xác q trình nhận dạng SMNDĐ: Số mẫu nhận dạng TSMKC: Tổng số mẫu kiểm chứng đưa vào CHƯƠNG - THỰC NGHIỆM VÀ ĐÁNH GIÁ ĐỘ CHÍNH XÁC MƠ HÌNH FASTER R_CNN 3.1 Thực nghiệm mơ hình Faster R-CNN 3.1.1 Thực nghiệm mơ hình Faster R-CNN với đối tượng tĩnh 3.1.1.1 Thực nghiệm nhận dạng với đối tượng bình thườn Hình 3.1: Hình ảnh đối tượng nhận dạng mơi trường bình thường Tại hình 3.1 tác giả đưa vào bốn hình ảnh để nhận dạng là: Hình 3.1a-hoa cẩm tú cầu; hình 3.1b-hoa cúc; hình 3.1c-hoa đồng tiền; hình 3.1d-hoa hồng, hình ảnh tác giả chụp từ thực tế Kết nhận dạng mơ hình Faster R-CNN thể hình 3.2 17 Hình 3.2: Kết nhận dạng mơ hình 3.1.1.2 Thực nghiệm nhận dạng với đối tượng bị che khuất 1/3 Tại hình 3.3 tác giả tạo hình ảnh với đối tượng nhận dạng bị che khuất khoảng 1/3 hình 3.3a-hoa cẩm tú cầu; hình 3.3b-hoa cúc; hình 3.3c-hoa đồng tiền; hình 3.3d-hoa hồng Kết nhận dạng mơ hình Faster R-CNN thể hình 3.4 Hình 3.3: Hình ảnh đối tượng nhận dạng bị che khuất 1/3 18 Hình 3.4: Kết nhận dạng đối tượng bị che khuất 1/3 3.1.1.3 Thực nghiệm nhận dạng với đối tượng bị che khuất 1/2 Tại hình 3.5 tác giả tạo hình ảnh với đối tượng nhận dạng bị che khuất khoảng 1/2 hình 3.5a-hoa cẩm tú cầu; hình 3.5b-hoa cúc; hình 3.5c-hoa đồng tiền; hình 3.5d-hoa hồng Kết nhận dạng mơ hình Faster R-CNN thể hình 3.6 Hình 3.5: Hình ảnh đối tượng nhận dạng bị che khuất ½ 19 Hình 3.6: Kết nhận dạng đối tượng bị che khuất ½ 3.1.1.4 Thực nghiệm nhận dạng với đối tượng mơi trường thiếu ánh sáng Hình ảnh đối tượng đưa vào nhận dạng tác giả chụp lúc trời tối hình 3.7 bên gồm hình 3.7a-hoa cẩm tú cầu; hình 3.7bhoa cúc; hình 3.7c-hoa đồng tiền; hình 3.7d-hoa hồng Sau đưa vào mơ hình Faster R-CNN nhận dạng kết nhận dạng thể hình 3.8 Hình 3.7: Hình ảnh đối tượng nhận dạng môi trường thiếu ánh sáng 20 Hình 3.8: Kết nhận dạng đối tượng môi trường thiếu ánh sáng 3.1.1.5 Đánh giá kết thực nghiệm nhận dạng đối tượng trạng thái bình thường nhiễu Quy ước kết nhận dạng: Kết nhận dạng kết nhận dạng với mẫu kiểm chứng đưa vào; kết nhận dạng sai kết nhận dạng không với mẫu kiểm chứng đưa vào; không nhận dạng kết không cho kết nhận dạng loài mẫu kiểm chứng cho kết nhận dạng từ hai loài khác trở lên Kết đánh giá độ xác mơ hình lúc bình thường nhiễu thể bảng sau: Bảng 3.1: Bảng tổng hợp đánh giá độ xác kết nhận dạng mơ hình Mơi trường TN Môi trường Môi trường Môi trường đối Môi trường đối bình thiếu ánh tượng bị che tượng bị che thường sáng khuất 1/3 khuất 1/2 Kết nhận dạng 138 68 102 44 Kết nhận dạng nhầm 7 10 Không nhận dạng 34 21 55 TCM đưa vào nhận dạng 139 109 130 109 Độ xác nhận dạng 99,28% 62,38% 78,46% 40,36% Kết TN Ghi chú: TN: Thực nghiệm; TCM: Tổng số mẫu 21 3.1.2 Thực nghiệm mơ hình với đối tượng di động 3.1.2.1 Thực nghiệm loài hoa di động Với đầu vào nguồn video loài hoa di động: Hình 3.9: Nguồn video hoa cẩm tú cầu di động Hình 3.10: Kết nhận dạng hoa cẩm tú cầu mơ hình 3.1.2.2 Thực nghiệm số đối tượng di động khác 22 Với đầu vào nhận dạng video người, xe di động: Hình 3.11: Nguồn video người, xe di động Hình 3.12: Kết nhận dạng người, xe di động mơ hình 23 KẾT LUẬN Thuận lợi đề tài Đây hướng nghiên cứu bước đầu tác giả thực nghiệm thành cơng cho mơ hình Faster R-CNN nhận dạng mười loài hoa chế độ bình thường nhiễu Qua đưa đánh giá độ xác mơ hình với bốn trạng thái đầu vào khác đối tượng nhận dạng Ngoài ra, việc thực nghiệm tác giả thực nghiệm nhận dạng thành công đối tượng di động bước tiến thuận lợi để thực nghiên cứu Hạn chế đề tài - Môi trường thực nghiệm mô hình có cấu hình chưa đủ mạnh nên chưa thể thực liệu đầu vào có dung lượng lớn - Chưa đưa đánh giá độ xác nhận dạng mơ hình với đối tượng di động - Chưa đánh giá ảnh hưởng khoản cách chụp ảnh đến độ xác nhận dạng mơ hình Kết đạt Xây dựng hồn thiện mơ hình nhận dạng đối tượng tĩnh di động - Xây dựng hoàn thiện mơ hình nhận dạng đối tượng tĩnh di động - Thực nghiệm mơ hình Faster R-CNN nhận dạng đối tượng tĩnh trạng thái bình thường nhiễu - Đánh giá độ xác nhận dạng mơ hình Faster R-CNN với trạng thái khác hình ảnh đưa vào nhận dạng: Ảnh mơi trường có ánh sáng tốt; ảnh bị che khuất 1/3; ảnh bị che khuất 1/2; ảnh môi trường thiếu ánh sáng Kết cho, độ xác đạt 24 99,28%, 78,46%, 40,36% 62,38% tương ứng với trạng thái - Thực nghiệm nhận dạng đối tượng di động với đầu vào nhận dạng nguồn video đối tượng di động - Một báo đăng Hội thảo Khoa học Quốc gia “Ứng dụng cơng nghệ Cơng trình xanh” - lần thứ 5, năm 2019, Trường Đại học Sư phạm Kỹ thuật – Đại học Đà Nẵng tổ chức vào ngày 15 tháng 11 năm 2019 - Một báo đăng Tạp chí Khoa học Cơng nghệ Đại học Đà Nẵng Mã số tạp chí phát hành: VOL 17, NO 11, 2019 (24/12/2019), mã số báo: JST-UD2019-146 Hướng phát triển đề tài - Nghiên cứu chưa đánh giá ảnh hưởng khoảng cách chụp ảnh đến độ xác nhận dạng mơ hình, nghiên cứu sau cần đánh giá thêm trường hợp - Nghiên cứu chưa thực nghiệm đánh giá đối tượng di động chế độ bình thường nhiều, tác giả triển khai thực nghiên cứu - Hiện nay, vấn đề cải tiến để nâng cao độ xác ảnh đầu vào bị nhiễu chưa có giải pháp hiệu chưa thấy có nghiên cứu xử lý vấn đề công bố Do vậy, nghiên nghiên cứu đưa giải pháp khắc phục độ xác nhận dạng môi trường nhiễu 25 DANH MỤC CÁC CƠNG TRÌNH ĐÃ CƠNG BỐ CỦA TÁC GIẢ - Một báo đăng Hội thảo Khoa học Quốc gia “Ứng dụng cơng nghệ Cơng trình xanh” - lần thứ 5, năm 2019, Trường Đại học Sư phạm Kỹ thuật – Đại học Đà Nẵng tổ chức vào ngày 15 tháng 11 năm 2019 - Một báo đăng Tạp chí Khoa học Cơng nghệ Đại học Đà Nẵng Mã số tạp chí phát hành: VOL 17, NO 11, 2019 (24/12/2019), mã số báo: JST-UD2019-146 ... j  threshold Tổng quan mạng Nơ ron tích chập (CNN) 1.3.1 Kiến trúc mạng Nơ ron tích chập Mạng Nơ ron tích chập có kiến trúc khác với mạng Nơ ron thông thường Mạng Nơ ron bình thường chuyển đổi... sở lý thuyết nhận dạng đối tượng - Các phương pháp, giải thuật nhận dạng đối tượng - Thuật tốn mạng Nơ ron tích chập 3.2 Phạm vi nghiên cứu: - Nghiên cứu kỹ thuật nhận dạng đối tượng từ hình... xác nhận dạng mơ hình Faster R-CNN 2 Với lý trên, định chọn nghiên cứu đề tài: ? ?Ứng dụng mạng Nơ ron tích chập nhận dạng đối tượng di động? ?? Mục tiêu đề tài thực nghiệm mơ hình Faster R-CNN nhận

Ngày đăng: 08/07/2022, 14:26

Hình ảnh liên quan

Hình 1.2: Cách thức perceptron hoạt động - Tóm tắt Luận văn Thạc sĩ kỹ thuật: Ứng dụng mạng nơ ron tích chập nhận dạng các đối tượng di động

Hình 1.2.

Cách thức perceptron hoạt động Xem tại trang 7 của tài liệu.
Hình 1.1: Nhận dạng hoa mai - Tóm tắt Luận văn Thạc sĩ kỹ thuật: Ứng dụng mạng nơ ron tích chập nhận dạng các đối tượng di động

Hình 1.1.

Nhận dạng hoa mai Xem tại trang 7 của tài liệu.
Hình 1.3: Mạng Nơ ron thông thường (trái) và CNN (phải) CNN gồm hai thành phần:  - Tóm tắt Luận văn Thạc sĩ kỹ thuật: Ứng dụng mạng nơ ron tích chập nhận dạng các đối tượng di động

Hình 1.3.

Mạng Nơ ron thông thường (trái) và CNN (phải) CNN gồm hai thành phần: Xem tại trang 8 của tài liệu.
Hình 1.5: Nhận dạng hoa đồng tiền - Tóm tắt Luận văn Thạc sĩ kỹ thuật: Ứng dụng mạng nơ ron tích chập nhận dạng các đối tượng di động

Hình 1.5.

Nhận dạng hoa đồng tiền Xem tại trang 9 của tài liệu.
Hình 1.4: Lớp rút trích đặc trưng của ảnh (Conv, Relu và Pool) và Lớp phân loại (FC và softmax)  - Tóm tắt Luận văn Thạc sĩ kỹ thuật: Ứng dụng mạng nơ ron tích chập nhận dạng các đối tượng di động

Hình 1.4.

Lớp rút trích đặc trưng của ảnh (Conv, Relu và Pool) và Lớp phân loại (FC và softmax) Xem tại trang 9 của tài liệu.
Hình 1.6: Mô hình ROI pooling - Tóm tắt Luận văn Thạc sĩ kỹ thuật: Ứng dụng mạng nơ ron tích chập nhận dạng các đối tượng di động

Hình 1.6.

Mô hình ROI pooling Xem tại trang 11 của tài liệu.
2.2. Huấn luyện cho mô hình nhận dạng mười loài hoa - Tóm tắt Luận văn Thạc sĩ kỹ thuật: Ứng dụng mạng nơ ron tích chập nhận dạng các đối tượng di động

2.2..

Huấn luyện cho mô hình nhận dạng mười loài hoa Xem tại trang 13 của tài liệu.
Hình 2.2: Gán nhãn cho hoa hồng và hoa cẩm tú cầu Bảng 2.1: Bảng thu thập dữ liệu các loài hoa và gán nhãn  - Tóm tắt Luận văn Thạc sĩ kỹ thuật: Ứng dụng mạng nơ ron tích chập nhận dạng các đối tượng di động

Hình 2.2.

Gán nhãn cho hoa hồng và hoa cẩm tú cầu Bảng 2.1: Bảng thu thập dữ liệu các loài hoa và gán nhãn Xem tại trang 14 của tài liệu.
Hình 2.3: File chương trình huấn luyện - Tóm tắt Luận văn Thạc sĩ kỹ thuật: Ứng dụng mạng nơ ron tích chập nhận dạng các đối tượng di động

Hình 2.3.

File chương trình huấn luyện Xem tại trang 15 của tài liệu.
Hình 2.5: Biểu đồ mất mát theo thời gian của mô hình Faster R-CNN Biểu đồ tại hình 10 cho thấy từ bước 25000 trở đi thì độ mất mát  khi  huấn  luyện  dao  động  trong  khoảng  từ  0  đến  0.06 - Tóm tắt Luận văn Thạc sĩ kỹ thuật: Ứng dụng mạng nơ ron tích chập nhận dạng các đối tượng di động

Hình 2.5.

Biểu đồ mất mát theo thời gian của mô hình Faster R-CNN Biểu đồ tại hình 10 cho thấy từ bước 25000 trở đi thì độ mất mát khi huấn luyện dao động trong khoảng từ 0 đến 0.06 Xem tại trang 16 của tài liệu.
3.1 Thực nghiệm mô hình Faster R-CNN - Tóm tắt Luận văn Thạc sĩ kỹ thuật: Ứng dụng mạng nơ ron tích chập nhận dạng các đối tượng di động

3.1.

Thực nghiệm mô hình Faster R-CNN Xem tại trang 18 của tài liệu.
Hình 3.2: Kết quả nhận dạng bởi mô hình - Tóm tắt Luận văn Thạc sĩ kỹ thuật: Ứng dụng mạng nơ ron tích chập nhận dạng các đối tượng di động

Hình 3.2.

Kết quả nhận dạng bởi mô hình Xem tại trang 19 của tài liệu.
Tại hình 3.3 tác giả đã tạo ra các hình ảnh với đối tượng nhận dạng bị che khuất khoảng 1/3 như hình 3.3a-hoa cẩm tú cầu; hình 3.3b-hoa  cúc; hình 3.3c-hoa đồng tiền; hình 3.3d-hoa hồng - Tóm tắt Luận văn Thạc sĩ kỹ thuật: Ứng dụng mạng nơ ron tích chập nhận dạng các đối tượng di động

i.

hình 3.3 tác giả đã tạo ra các hình ảnh với đối tượng nhận dạng bị che khuất khoảng 1/3 như hình 3.3a-hoa cẩm tú cầu; hình 3.3b-hoa cúc; hình 3.3c-hoa đồng tiền; hình 3.3d-hoa hồng Xem tại trang 19 của tài liệu.
Tại hình 3.5 tác giả đã tạo ra các hình ảnh với đối tượng nhận dạng bị che khuất khoảng 1/2 như hình 3.5a-hoa cẩm tú cầu; hình 3.5b-hoa  cúc; hình 3.5c-hoa đồng tiền; hình 3.5d-hoa hồng - Tóm tắt Luận văn Thạc sĩ kỹ thuật: Ứng dụng mạng nơ ron tích chập nhận dạng các đối tượng di động

i.

hình 3.5 tác giả đã tạo ra các hình ảnh với đối tượng nhận dạng bị che khuất khoảng 1/2 như hình 3.5a-hoa cẩm tú cầu; hình 3.5b-hoa cúc; hình 3.5c-hoa đồng tiền; hình 3.5d-hoa hồng Xem tại trang 20 của tài liệu.
Hình 3.4: Kết quả nhận dạng các đối tượng bị che khuất 1/3 - Tóm tắt Luận văn Thạc sĩ kỹ thuật: Ứng dụng mạng nơ ron tích chập nhận dạng các đối tượng di động

Hình 3.4.

Kết quả nhận dạng các đối tượng bị che khuất 1/3 Xem tại trang 20 của tài liệu.
Hình 3.6: Kết quả nhận dạng các đối tượng bị che khuất ½ - Tóm tắt Luận văn Thạc sĩ kỹ thuật: Ứng dụng mạng nơ ron tích chập nhận dạng các đối tượng di động

Hình 3.6.

Kết quả nhận dạng các đối tượng bị che khuất ½ Xem tại trang 21 của tài liệu.
Hình ảnh đối tượng đưa vào nhận dạng được tác giả chụp lúc trời tối như hình 3.7 bên dưới gồm hình 3.7a-hoa cẩm tú cầu; hình  3.7b-hoa cúc; hình 3.7c-3.7b-hoa đồng tiền; hình 3.7d-3.7b-hoa hồng - Tóm tắt Luận văn Thạc sĩ kỹ thuật: Ứng dụng mạng nơ ron tích chập nhận dạng các đối tượng di động

nh.

ảnh đối tượng đưa vào nhận dạng được tác giả chụp lúc trời tối như hình 3.7 bên dưới gồm hình 3.7a-hoa cẩm tú cầu; hình 3.7b-hoa cúc; hình 3.7c-3.7b-hoa đồng tiền; hình 3.7d-3.7b-hoa hồng Xem tại trang 21 của tài liệu.
Hình 3.8: Kết quả nhận dạng các đối tượng trong môi trường thiếu ánh sáng  - Tóm tắt Luận văn Thạc sĩ kỹ thuật: Ứng dụng mạng nơ ron tích chập nhận dạng các đối tượng di động

Hình 3.8.

Kết quả nhận dạng các đối tượng trong môi trường thiếu ánh sáng Xem tại trang 22 của tài liệu.
Kết quả đánh giá độ chính xác mô hình lúc bình thường và nhiễu được thể hiện tại bảng sau:  - Tóm tắt Luận văn Thạc sĩ kỹ thuật: Ứng dụng mạng nơ ron tích chập nhận dạng các đối tượng di động

t.

quả đánh giá độ chính xác mô hình lúc bình thường và nhiễu được thể hiện tại bảng sau: Xem tại trang 22 của tài liệu.
3.1.2. Thực nghiệm mô hình với đối tượng di động - Tóm tắt Luận văn Thạc sĩ kỹ thuật: Ứng dụng mạng nơ ron tích chập nhận dạng các đối tượng di động

3.1.2..

Thực nghiệm mô hình với đối tượng di động Xem tại trang 23 của tài liệu.
Hình 3.11: Nguồn video người, xe di động - Tóm tắt Luận văn Thạc sĩ kỹ thuật: Ứng dụng mạng nơ ron tích chập nhận dạng các đối tượng di động

Hình 3.11.

Nguồn video người, xe di động Xem tại trang 24 của tài liệu.

Tài liệu cùng người dùng

Tài liệu liên quan