Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 54 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
54
Dung lượng
3,49 MB
Nội dung
BỘ GIÁO DỤC VÀ ĐÀO TẠO UBND TỈNH THANH HÓA TRƯỜNG ĐẠI HỌC HỒNG ĐỨC PHẠM TIẾN CƯỜNG NGHIÊN CỨU MỘT SỐ ĐẶC TÍNH CỦA CÁC MẠNG NƠ RON NHÂN TẠO NHẰM TẠO RA CÁC MẪU ĐỐI NGHỊCH ĐỂ KIỂM TRA ĐỘ TIN CẬY CỦA MỘT SỐ MƠ HÌNH NHẬN DẠNG LUẬN VĂN THẠC SĨ MÁY TÍNH THANH HĨA, NĂM 2022 BỘ GIÁO DỤC VÀ ĐÀO TẠO UBND TỈNH THANH HÓA TRƯỜNG ĐẠI HỌC HỒNG ĐỨC PHẠM TIẾN CƯỜNG NGHIÊN CỨU MỘT SỐ ĐẶC TÍNH CỦA CÁC MẠNG NƠ RON NHÂN TẠO NHẰM TẠO RA CÁC MẪU ĐỐI NGHỊCH ĐỂ KIỂM TRA ĐỘ TIN CẬY CỦA MỘT SỐ MƠ HÌNH NHẬN DẠNG LUẬN VĂN THẠC SĨ MÁY TÍNH Chuyên ngành: Khoa học máy tính Mã số: 8480101 Người hướng dẫn khoa học: TS Nguyễn Đình Cơng THANH HĨA, NĂM 2022 Danh sách Hội đồng đánh giá luận văn Thạc sỹ khoa học (Theo Quyết định số: /QĐ- ĐHHĐ ngày tháng năm 2022 Hiệu trưởng Trường Đại học Hồng Đức) Học hàm, học vị Cơ quan Chức danh Họ tên Công tác Hội đồng Chủ tịch HĐ UV, Phản biện UV, Phản biện Uỷ viên Uỷ viên, Thư ký Xác nhận Người hướng dẫn Học viên chỉnh sửa theo ý kiến Hội đồng Ngày tháng năm 2022 LỜI CAM ĐOAN Tôi xin cam đoan luận văn tự thân tơi tìm hiểu, nghiên cứu hướng dẫn TS.Nguyễn Đình Cơng Trong tồn nội dung luận văn, điều trình bày cá nhân tổng hợp từ nhiều nguồn tài liệu Tất tài liệu tham khảo có xuất xứ rõ ràng trích dẫn hợp pháp Các số liệu, kết nêu luận văn trung thực chưa công bố cơng trình khác Người cam đoan Phạm Tiến Cường i LỜI CẢM ƠN Lời xin gửi lời cảm ơn lòng biết ơn sâu sắc đến thầy giáo TS.Nguyễn Đình Cơng, người giúp tơi chọn đề tài, định hình hướng nghiên cứu, tận tình hướng dẫn bảo tơi suốt q trình thực luận văn tốt nghiệp Tôi xin gửi lời cảm ơn chân thành đến thầy, cô giáo trường Đại học Hồng Đức nói chung thầy giáo khoa Cơng nghệ thơng tin nói riêng Các thầy, cô giáo dạy bảo truyền đạt cho tơi nhiều kiến thức, giúp tơi có tảng kiến thức vững sau ngày tháng học tập trường Tôi xin gửi lời cảm ơn chân thành tới bạn khóa K13 chuyên ngành Khoa học máy tính ủng hộ khuyến khích tơi suốt q trình học tập trường Cuối cùng, tơi muốn gửi lời cảm ơn sâu sắc đến gia đình bạn bè – người thân u ln kịp thời động viên giúp đỡ vượt qua khó khăn học tập sống Thanh Hoá, Ngày 12 tháng năm 2022 Tác giả luận văn Phạm Tiến Cường ii MỤC LỤC LỜI CAM ĐOAN - LỜI CẢM ƠN ii MỤC LỤC iii DANH MỤC HÌNH VẼ v MỞ ĐẦU 1 Tính cấp thiết đề tài Mục đích nhiệm vụ nghiên cứu Phương pháp nghiên cứu: Dự kiến kết đạt Cấu trúc nội dung nghiên cứu: Chương CƠ SỞ LÝ THUYẾT 1.1 Khái niệm mạng nơ ron 1.2 Các xu hướng phát triển mạng nơ ron 1.3 Một số mạng nơ ron Chương CÁC THUẬT TOÁN SỬ DỤNG TRONG MẠNG NƠ RON 10 2.1 Giới thiệu chung 10 2.2 Thuật toán Gradient descent 10 2.2.1 Tốc độ học learning rate 11 2.2.2 Thuật toán Batch gradient descent (BGD) 12 2.2.3 Thuật toán Stochastic gradient descent (SGD) 13 2.2.4 Thuật toán Mini-batch gradient descent (MGD) 13 2.3 Các thuật toán hồi quy 14 2.3.1 Hồi quy tuyến tính 14 2.3.2 Hàm mát hồi quy tuyến tính 14 2.3.3 Hồi quy phi logistic 15 2.3.3 Hàm mát hồi quy logistic 16 Kết luận chương 16 Chương MẠNG NƠ RON TÍCH CHẬP (CNN) 17 3.1 Giới thiệu chung 17 3.2 Các thành phần mạng CNN 17 3.2.3 Lớp gộp 19 3.2.4 Lớp kết nối đầy đủ 20 iii 3.3 Một số kỹ thuật sử dụng để huấn luyện mạng CNN 21 3.3.1 Dữ liệu tăng cường liệu để huấn luyện mạng CNN 21 3.4 Mơ tả thuật tốn Fast gradient sign method (FGSM) 22 3.4.1 Giới thiệu chung 22 3.4.2 Thuật toán FGSM 25 Kết luận chương 27 Chương THỰC NGHIỆM VÀ LUẬN GIẢI 28 4.1 Giới thiệu 28 Mô tả giao thức 28 4.2 Xây dựng mẫu đối nghịch FGSM 28 4.2.1 Xây dựng mẫu đối nghịch sử dụng mạng LeNet cho tốn nhận dạng tí tự viết tay 28 4.2.2 Xây dựng mẫu đối nghịch dựa vào mạng YOLOv4 mạng CNN phân lớp cho toán nhận dạng biển số xe 31 4.2.3 Xây dựng mẫu đối nghịch dựa vào mơ hình MobileNetv2 cho tốn nhận dạng vật ni 33 4.3 Đánh giá độ xác số mơ hình với liệu đối nghịch 35 4.3.1 Thang đánh giá 35 4.3.2 Đánh giá độ xác mơ hình với liệu đối nghịch 35 Kết luận chương 39 KẾT LUẬN VÀ HƯỚNG NGHIÊN CỨU 40 TÀI LIỆU THAM KHẢO 42 iv DANH MỤC HÌNH VẼ Hình 1 Mơ hình mạng nơ ron [1] Hình Các mơ hình thực toán nhận dạng đối tượng liệu COCO [34] Hình Các mơ hình thực tốn phân loại đối tượng liệu ImageNet [34] Hình Mơ hình cấu trúc mạng AlexNet [6] Hình Mơ hình mạng VGG16 [7] Hình Tốn tử cộng vào đầu khối với nhánh cịn lại khối xác định Hình Mơ hình cấu trúc khối Inception [9] Hình Sự ảnh hưởng giá trị tốc độ học tới mơ hình [35] 11 Hình 2 Các giá trị cực trị hàm số [36] 12 Hình Kiến trúc mơ hình CNN dùng để nhận dạng đối tượng [37] 18 Hình Một số hàm kích hoạt [37] 19 Hình 3 Thực phép gộp với kích thước 2x2 [37] 19 Hình Miêu tả tầng kết nối đầy đủ [37] 20 Hình Ví dụ kỹ thuật tăng cường ảnh [38] 22 Hình Con Đà điểu bị phân lớp sai tác động lượng nhiễu nhỏ vào sử dụng mơ hình InceptionV3 để phân lớp [18] 24 Hình Một cách sử dụng sticker để làm sai kết nhận dạng mơ hình [19] 24 Hình Ảnh đầu vào, ảnh chỉnh sửa để tạo ảnh đối nghịch [20] 25 Hình Cách tiếp cận thuật toán FGSM thêm nhiễu vào ảnh đầu vào để mơ hình phân loại sai kết [21] 26 v Hình Mơ hình mạng LeNet [23]………………………………………30 Hình Các ảnh đối nghịch thu giá trị ngưỡng khác 31 Hình Mơ hình YOLOv4 [24] 32 Hình 4 Phát biển số xe mơ hình YOLOv4 32 Hình Mơ hình CNN dùng để nhận dạng kí tự biển số xe 32 Hình Bộ liệu đối nghịch biển số xe 33 Hình Dữ liệu đối nghịch sinh thuật toán FGSM MobileNetv2 34 Hình Tổng quan mơ hình MobileNetv2 [41]………………………… 34 Hình 4.9 Ảnh hưởng mẫu đối nghịch tới độ xác mơ hình LeNet 36 Hình 10 Ảnh hưởng giá trị nhiễu khác lên ảnh gốc 36 Hình 11 Ảnh hưởng mẫu đối nghịch tới độ xác mơ hình YOLOv4 CNN 37 Hình 12 Ảnh hưởng giá trị nhiễu khác lên ảnh gốc 38 Hình 13 Ảnh hưởng mẫu đối nghịch tới độ xác mơ hình MobileNetv2 38 Hình 14 Ảnh hưởng giá trị nhiễu lên ảnh 39 vi dựng liệu đối nghịch với liệu Một đoạn chương trình đơn giản nhằm tạo mẫu đối nghịch dựa vào phương trình (4.1) sau: # FGSM def fgsm_attack(image, epsilon, data_grad): # Thu thập liệu kèm theo dấu (+/-) giá trị gradient sign_data_grad = data_grad.sign() # Tạo mẫu đối nghịch perturbed_image = image + epsilon*sign_data_grad # Chuẩn hoá giá trị khoảng [0,1] perturbed_image = torch.clamp(perturbed_image, 0, 1) # Trả ảnh return perturbed_image 30 Hình Các ảnh đối nghịch thu giá trị ngưỡng khác Với giá trị nhiễu epsilon thay đổi từ 0:0.05:3 ta thu tập liệu Hình 4.2 4.2.2 Xây dựng mẫu đối nghịch dựa vào mạng YOLOv4 mạng CNN phân lớp cho tốn nhận dạng biển số xe Mơ hình YOLOv4 [24] mơ hình mạng CNN tiên tiến cơng bố vào năm 2020 Được cấu trúc với bốn thành phần là: Phần xương sống (Backbone); phần cổ (Neck); dự đốn đọng (Dense prediction) – bảo tồn lại từ phiên cũ YOLOv3 [25]; dự đoán thưa thớt (Spare prediction) – sử 31 dụng mơ hình hai trạng thái R-CNN [26] Cấu trúc mô hình YOLOv4 biểu diễn Hình 4.3 Trong toán nhận dạng biển số xe, chúng tơi sử dụng Hình Mơ hình YOLOv4 [24] mơ hình YOLOv4 để nhận dạng biển số Q trình mơ tả Hình 4.4 Để nhận dạng phân loại kí tự biển số xe, tự triển khai mạng CNN đơn giản bao gồm hai khối tích chập nhằm mục đích trích chọn đặc trưng Số lượng lọc thiết kế tăng dần từ 32 đến 64 Với hai lớp kết nối đầy đủ với mục đích phân loại ký tự bao gồm 31 kí tự (A, B, C, D, E, F, G, H, K, L, M, N, P, R, S, T, U, V, X, Y, Z, 0, 1, 2, 3, 4, 5, 6, 7, 8, 9) Mô hình mạng CNN phân loại thể Hình 4.5 Hình 4 Phát biển số xe mơ hình YOLOv4 Hình Mơ hình CNN dùng để nhận dạng kí tự biển số xe 32 Dữ liệu biển số xe sử dụng để huấn luyện bao gồm 1759 ảnh biển số xe máy 945 ảnh biển số xe ô tô [40] Sử dụng chế tạo nhiễu tương tự mô tả (4.1) ta thu tập ảnh đối nghịch mơ tả Hình 4.6 với ngưỡng thay đổi Hình Bộ liệu đối nghịch biển số xe 4.2.3 Xây dựng mẫu đối nghịch dựa vào mơ hình MobileNetv2 cho tốn nhận dạng vật ni Mơ hình MobileNetv2 [27] kiến trúc ưu chuộng nhiều ứng dụng phát nhận dạng đối tượng Với cải tiến để nâng cao độ xác đồng thời tối ưu số lượng tham số số lượng phép toán thực bên mơ hình MobileNetv2 sử dụng kết nối tắt tương tự mơ hình ResNet [28] Cụ thể lớp phía trước cộng trực tiếp vào lớp phía sau Ví dụ coi giá trị đầu vào lớp x, qua khối biến đổi tích chập ta thu F(x) kết đầu nối tắt x + F(x) 33 Tuy nhiên, MobileNetv2 thiết kế cho số kênh đầu thắt hẹp dần với mục đích dẫn thu hẹp độ phức tạp mơ hình (kỹ thuật biết tới kỹ thuật Bottleneck) Mơ hình MobileNetv2 minh hoạ Hình 4.7 Hình Dữ liệu đối nghịch sinh thuật toán FGSM MobileNetv2 Hình Tổng quan mơ hình MobileNetv2 [41] Trong kịch này, chúng tơi sử dụng mơ hình MobileNetv2 nhằm thực tốn nhận dạng vật ni Trong thư viện Tensorflow, mơ hình MobileNetv2 huấn luyện sẵn tập liệu lớn ImageNet [30] Việc sử dụng mơ hình huấn luyện sẵn tập liệu lớn xem hình thức học chuyển giao tri thức (Transfer learning) giúp cho mơ hình huấn luyện lại với toán cụ thể nhanh hội tụ mang lại độ xác cao Sử dụng giao thức tạo nhiễu thuật tốn FGSM mơ tả (4.1) chúng tơi thu tập liệu mẫu đối nghịch vật ni Chó Hình 4.8 mơ tả liệu mẫu đối nghịch sinh thuật tốn FGSM với mơ hình MobileNetv2 34 4.3 Đánh giá độ xác số mơ hình với liệu đối nghịch 4.3.1 Thang đánh giá Để đánh giá độ xác mơ hình bị ảnh hưởng mẫu đối nghịch nghiên cứu này, thang đo độ xác (Accuracy %) sử dụng Nó cho biết dự báo tổng số trường hợp Thang đo Accuracy đánh giá hiệu dự báo mơ hình xét liệu Độ xác cao mơ hình đánh giá Thang đo tính theo công thức (4.2): 𝐴𝑐𝑐𝑢𝑟𝑎𝑐𝑦 = 𝑇𝑃 + 𝑇𝑁 𝑇ổ𝑛𝑔 𝑐á𝑐 𝑚ẫ𝑢 (4.2) Với TP true positive số nhãn nhận dạng đúng đối tượng; Với TN true negative số nhãn nhận dạng đối tượng; from sklearn.metrics import accuracy_score accuracy_score(y_true, y_pred) 4.3.2 Đánh giá độ xác mơ hình với liệu đối nghịch Mơ hình LeNet với mẫu đối nghịch kí tự viết tay: việc thay đổi giá trị ngưỡng Epsilon, tính giá trị trung bình toàn tập liệu kiểm tra với giá trị độ xác tương ứng Ta thu kết kiểm tra Hình 4.9 Qua quan sát, thấy rằng, việc đưa thêm nhiều mật độ nhiễu vào ảnh đầu vào làm tăng hiệu cơng mơ hình, mơ tả Hình 4.10 Tuy nhiên điều đơi mang tới số yếu điểm sau: - Làm tăng khả bị phát mắt thường; - Làm tăng thời gian xử lý hệ thống để tạo nhiễu; - Làm tăng dung lượng ảnh đầu vào 35 Hình 4 Ảnh hưởng mẫu đối nghịch tới độ xác mơ hình LeNet Hình Ảnh hưởng giá trị nhiễu khác lên ảnh gốc 36 Mơ hình YOLOv4 CNN với mẫu đối nghịch biển số xe: việc thay đổi giá trị ngưỡng Epsilon, tính giá trị trung bình toàn tập liệu kiểm tra với giá trị độ xác tương ứng Ta thu kết kiểm tra Hình 4.11 Hình 4.12 thể ảnh hưởng nhiễu lên ảnh cách trực quan Hình Ảnh hưởng mẫu đối nghịch tới độ xác mơ hình YOLOv4 CNN 37 Hình Ảnh hưởng giá trị nhiễu khác lên ảnh gốc Mơ hình MobileNetv2 với mẫu đối nghịch động vật: việc thay đổi giá trị ngưỡng Epsilon, tính giá trị trung bình tồn tập liệu kiểm tra với giá trị độ xác tương ứng Ta thu kết kiểm tra Hình Ảnh hưởng mẫu đối nghịch tới độ xác mơ hình MobileNetv2 38 Hình Ảnh hưởng giá trị nhiễu lên ảnh Kết luận chương Trong chương này, thực nghiệm triển khai kịch khác nhằm đo lường ảnh hưởng mẫu đối nghịch tới độ xác số mơ hình nhận dạng từ đơn giản tới phức tạp Bắt đầu với mơ hình LeNet, YOLOv4, MobileNetv2 số ứng dụng cụ thể Với ba liệu đối nghịch, sử dụng để kiểm tra thực nghiệm ba kịch mơ hình Từ Hình 4.9, 4.10, 4.11 dễ dàng nhận thấy ảnh hưởng rõ rệt thuật tốn FGSM lên độ xác mơ hình nhận dạng thay đổi ngưỡng giá trị Epsilon Độ xác trung bình tồn liệu kiểm tra giảm dần tăng giá trị thêm nhiễu Tuy nhiên, việc thêm mật độ nhiễu dày vào ảnh đầu vào ảnh hưởng tới chất lượng ảnh Đơi làm tính bí mật cơng Đó lí thí nghiệm chúng tơi dừng giá trị Epsilon tối đa 0.5 với mục đích kiểm chứng độ xác tổng thể cố gắng minh hoạ mẫu cho phù hợp với thực tế 39 KẾT LUẬN VÀ HƯỚNG NGHIÊN CỨU Đánh giá mức độ ổn định hệ thống sử dụng trí tuệ nhân tạo (AI) nói chung mơ hình mạng nơ ron tích chập (CNN) nói riêng cho tốn nhận dạng đối tượng nhận quan tâm đáng kể cộng đồng nghiên cứu năm gần Về chất, hệ thống nhận dạng sử dụng CNN độ xác hệ thống phụ thuộc vào 02 yếu tố: - Mơ hình thiết kế: Đối với tốn cụ thể, mơ hình tương ứng thiết kế riêng biệt Thêm vào đó, với ứng dụng u cầu độ xác cao, mơ hình thiết kế sâu rộng thiết kế lớp tích chập với độ phức tạp mơ hình lớn Ngược lại, ứng dụng u cầu thời gian xử lý nhanh mơ hình thiết kế nhỏ gọn với độ phức tạp mơ hình nhỏ - Dữ liệu: Đối với hệ thống nhận dạng sử dụng CNN độ xác hệ thống phụ thuộc lớn vào độ xác đầy đủ liệu Dữ liệu phong phú đa dạng khả nhận dạng mơ hình tốt mang tính tổng quát hoá cao Để tăng cường liệu cho việc huấn luyện mơ hình CNN số kỹ thuật tăng cường liệu (Data Augmentation) áp dụng như: xoay ảnh, mờ ảnh, ghép ảnh, thay đổi kích thước etc Trong phạm vi nghiên cứu luận văn, điểm qua phần khái qt mơ hình mạng nơ ron ý đặc biệt vào mạng nơ ron tích chập thuật tốn tồn bên mơ kỹ thuật sử dụng việc huấn luyện mô hình CNN cho tốn nhận dạng đối tượng Tiếp theo đó, chúng tơi tập trung nghiên cứu mẫu đối nghịch với quan tâm đặc biệt vào thuật toán tạo nhiễu sử dụng chế Gradient Fast Gradient Sign Method (FGSM) Để thực việc đánh giá triển khai ba kịch khác cho mơ hình khác cho tốn nhận dạng đối tượng Cụ thể là: 40 - Sử dụng thuật tốn FGSM mơ hình LeNet với liệu MINST kí tự viết tay; - Sử dụng thuật tốn FGSM mơ hình YOLOv4 với mạng CNN với liệu biển số xe; - Sử dụng thuật tốn FGSM mơ hình MobileNetv2 với liệu động vật nuôi Bằng việc sử dụng độ đo Accuracy Qua quan sát, thấy rằng, việc đưa thêm nhiều mật độ nhiễu vào ảnh đầu vào làm tăng hiệu cơng mơ hình Tuy nhiên điều mang tới số yếu điểm sau: - Làm tăng khả bị phát mắt thường; - Làm tăng thời gian xử lý hệ thống để tạo nhiễu; - Làm tăng dung lượng ảnh đầu vào Trong nghiên cứu tiếp theo, tập trung vào nghiên cứu phương thức để xây dựng chế loại bỏ ảnh hưởng nhiễu FGSM vào hệ thống nhận dạng Một số hướng triển khai: - Xây dựng module phát nhiễu FGSM thêm vào ảnh từ có phương thức loại bỏ - Sử dụng chế huấn luyện tăng cường ảnh có nhiễu FGSM nhằm mục đích gia cố lại mơ hình theo mẫu chứa nhiễu 41 TÀI LIỆU THAM KHẢO * Tiếng Việt [1] Vũ Hữu Tiệp (2019), Machine learning bản, NXB KHKT * Tiếng Anh [2] A.Szegedy, Christian, et al (2013), Intriguing properties of neural networks, arXiv preprint arXiv:1312.6199 https://arxiv.org/pdf/1312.6199.pdf [3] B.Goodfellow, Ian J., Jonathon Shlens, and Christian Szegedy (2014), Explaining and harnessing adversarial examples, arXiv preprint arXiv:1412.6572 [4] Chen, Sheng, et al, (2018), "Mobilefacenets: Efficient cnns for accurate real-time face verification on mobile devices", Chinese Conference on Biometric Recognition, Springer, Cham [5] D.Tan, Mingxing, and Quoc Le (2019), "Efficientnet: Rethinking model scaling for convolutional neural networks", International Conference on Machine Learning, PMLR [6] E.Krizhevsky, Alex, Ilya Sutskever, and Geoffrey E Hinton (2012), "Imagenet classification with deep convolutional neural networks.", Advances in neural information processing systems 25: 1097-1105 [7] EA.Simonyan, Karen, and Andrew Zisserman (2014), Very deep convolutional networks for large-scale image recognition, arXiv preprint arXiv:1409.1556 [8] F.He, Kaiming, et al, (2016), "Deep residual learning for image recognition", Proceedings of the CVPR [9] G.Szegedy, Christian, et al, (2015), "Going deeper with convolutions", Proceedings of the IEEE conference on computer vision and pattern recognition [10] G.Szegedy, Christian, et al, (2016), "Rethinking the inception architecture for computer vision", Proceedings of the IEEE conference on computer vision and pattern recognition [11] H.Zhang, Aston, et al, (2021), Dive into deep learning, arXiv preprint arXiv:2106.11342 42 [12] HA.Voulodimos, Athanasios, et al, (2018), "Deep learning for computer vision: A brief review." Computational intelligence and neuroscience [13] I.Stan, Zhang, Shifeng & Zhu, Xiangyu & Lei, Zhen & Shi, Hailin & Wang, Xiaobo & Li (2017), FaceBoxes: A CPU Real-time Face Detector with High Accuracy, 10.1109/BTAS.2017.8272675 [14] Jian Li, Yabiao Wang, Changan Wang, Ying Tai, Jianjun Qian, Jian Yang, Chengjie Wang, Jilin Li, Feiyue Huang, (2018), DSFD: Dual Shot Face Detector [15] JA.Shuo Yang, Yuanjun Xiong, Chen Change Loy, Xiaoou Tang, (2017), Face Detection through Scale-Friendly Deep Convolutional Networks [16] K.Kaipeng Zhang, Zhanpeng Zhang, Zhifeng Li, Yu, (2016), Joint Face Detection and Alignment using Multi-task Cascaded Convolutional Networks [17] KB.Face Detection Data Set and Benchmark, http://viswww.cs.umass.edu/fddb/ [18] L.Chen, Pin-Yu, Yash Sharma, Huan Zhang, Jinfeng Yi, and Cho-Jui Hsieh, (2018), "Ead: elastic-net attacks to deep neural networks via adversarial examples", AAAI conference on artificial intelligence, vol 32, no [19] LA.Brown, Tom B., Dandelion Mané, Aurko Roy, Martín Abadi, and Justin Gilmer, (2017), Adversarial patch, arXiv preprint arXiv:1712.09665 [20] LL.Adversarial, Examples on Object Recognition: A Comprehensive Survey [21] M Goodfellow, Ian J., Jonathon Shlens, and Christian Szegedy (2014), Explaining and harnessing adversarial examples, arXiv preprint arXiv:1412.6572 [22] MA.LeCun, Yann, Léon Bottou, Yoshua Bengio, and Patrick Haffner (1998), "Gradient-based learning applied to document recognition.",Proceedings of the IEEE 86, no 11: 2278-2324 [23] MC.Zhang, Aston, Zachary C Lipton, Mu Li, and Alexander J Smola, (2021), Dive into deep learning, arXiv preprint arXiv:2106.11342 43 [24] N.Bochkovskiy, Alexey, Chien-Yao Wang, and Hong-Yuan Mark Liao, (2020), Yolov4: Optimal speed and accuracy of object detection, arXiv preprint arXiv:2004.10934 [25] ND.Redmon, Joseph, and Ali Farhadi, (2018), Yolov3: An incremental improvement, arXiv preprint arXiv:1804.02767 [26] NC.Kaiming, He, et al, (2017), Mask r-cnn." Proceedings of the IEEE international conference on computer vision [27] O.Sandler, Mark, Andrew Howard, Menglong Zhu, Andrey Zhmoginov, and Liang-Chieh Chen, (2018), "Mobilenetv2: Inverted residuals and linear bottlenecks.", In Proceedings of the IEEE conference on computer vision and pattern recognition, pp 4510-4520 [28] Xiangyu Zhang, He, Kaiming, Shaoqing Ren, and Jian Sun (2016), “Deep residual learning for image recognition”, In Proceedings of the IEEE conference on computer vision and pattern recognition, pp 770-778 [29] YJ Deng, A Berg, K Li and L Fei-Fei (2010), “What does classifying more than 10,000 image categories tell us?”, Proceedings of the 12th European Conference of Computer Vision (ECCV) *Trang Web [33] https://github.com/ultralytics/yolov5 [34] https://paperswithcode.com [35] https://www.ai-summary.com/summary-true-gradient-descent [36] https://alzaibkarovalia.medium.com [37] https://cs231n.github.io/convolutional-networks [38] https://miro.medium.com/max/1400/0*0Je9h2iT9m7ribFJ.png [39].http://yann.lecun.com/exdb/mnist [40].https://thigiacmaytinh.com/tai-nguyen-xu-ly-anh/tong-hop-data-xu-ly-anh 44