đồ án lựa chọn thuật toán và xây dựng mô hình nhận diện và bám mục tiêu trên biển

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề	Lựa Chọn Thuật Toán Và Xây Dựng Mô Hình Nhận Diện Và Bám Mục Tiêu Trên Biển
Tác giả	Trần Mạnh Hùng
Người hướng dẫn	Trịnh Huy Long
Trường học	Đại Học Công Nghiệp Hà Nội
Chuyên ngành	Công Nghệ Thông Tin
Thể loại	Đồ Án Tốt Nghiệp
Năm xuất bản	2021
Thành phố	Hà Nội

Định dạng
Số trang	109
Dung lượng	11,85 MB

Nội dung

Tổng quan về bài toán phát hiện đối tượng và bài toán bám mục tiêu,cơ sở lý thuyết về các mạng mạng neural cơ bản, đánh giá các mô hình mạng nơ ron cơ bản, khái quát về học tăng cường, lựa chọn và sử dụng mô hình SSDMobilenetV2 để nhân diện và bám mục tiêu trên biển, mục tiêu cụ thể là tàu thuyền

ĐẠI HỌC CÔNG NGHIỆP HÀ NỘI TRẦN MẠNH HÙNG ĐỒ ÁN TỐT NGHIỆP ĐẠI HỌC CHUYÊN NGÀNH: CÔNG NGHỆ THÔNG TIN LỰA CHỌN THUẬT TỐN VÀ XÂY DỰNG MƠ HÌNH NHẬN DIỆN VÀ BÁM MỤC TIÊU TRÊN BIỂN NĂM 2021 ĐẠI HỌC CÔNG NGHIỆP HÀ NỘI TRẦN MẠNH HÙNG ĐỒ ÁN TỐT NGHIỆP ĐẠI HỌC CHUYÊN NGÀNH: CÔNG NGHỆ THÔNG TIN LỰA CHỌN THUẬT TỐN VÀ XÂY DỰNG MƠ HÌNH NHẬN DIỆN VÀ BÁM MỤC TIÊU TRÊN BIỂN Giáo viên hướng dẫn: Trịnh Huy Long NĂM 2021 DANH MỤC VIẾT TẮT STT Từ viết tắt Tên tiếng Anh CNN Convolutional neural network COCO Common Objects In Context DPM Deformable Part-based Model GPU Graphic Processing Unit HOG Histogram of Oriented Gradients ILSVRC ImageNet Large Scale Visual Recognition Challenge SAR Synthetic-aperture radar SSD Single Shot Detector TD Temporal Difference 10 RCNN Region Convolutional neural network 11 RBF Radial Basis Function 12 RL Reinforcement Learning 13 VGG Visual Geometry Group 14 VJ Viola - Jones DANH MỤC HÌNH ẢNH MỤC LỤC MỞ ĐẦU Tính cấp thiết đề tài nghiên cứu Trong thời gian gần đây, nhờ ứng dụng rộng rãi mơ hình trí tuệ nhân tạo, q trình tự động hóa tác vụ người ngày đạt đến mức độ cao hơn, thay hoạt động phức tạp người nhận dạng, dự đoán, chẩn đoán, định… Ý tưởng, sở tốn học mơ hình trí tuệ nhân tạo phát triển từ kỷ 20, nhiên, thập kỷ kỷ 21, sở lý thuyết chưa tìm hướng phát triển ứng dụng thực tế Sự trở lại mạnh mẽ trí tuệ nhân tạo năm gần nhờ có ba yếu tố chính: 1) Sự xuất liệu lớn hệ trình bùng nổ thông tin, dẫn đến khả xây dựng liệu chuẩn hóa để khai thác khả luyện nhanh trí tuệ nhân tạo máy tính 2) Sự phát triển cơng cụ tính tốn song song, chip xử lý hiệu suất cao cho phép triển khai nhanh mơ hình tính toán theo cấu trúc mạng nơ-ron nhiều lớp 3) Sự phát triển kỹ thuật thiết kế chiến thuật luyện mơ hình máy khác Trong đó, số ứng dụng thuộc lĩnh vực thị giác máy tính, chuẩn đốn hình ảnh, phân tích liệu có tiến nhảy vọt Các ứng dụng phổ biến rộng rãi đánh giá tình huống, giám sát video, robot hệ thống tự hành khuyến khích số lượng lớn nghiên cứu chuyên sâu lý thuyết ứng dụng trí tuệ nhân tạo Trong giới biến đổi theo hướng kỹ thuật số Ngày nhiều giá trị gia tăng từ việc tự động hóa tối ưu trình điều khiển định cách thu thập thơng tin chun sâu mơ hình thơng minh sử dụng trí tuệ nhân tạo Trí tuệ nhân tạo nhanh chóng trở thành cơng cụ quan trọng sở hạ tầng công nghiệp 4.0 Điều khiển tối ưu giải tốn tìm kiếm quy luật điều khiển cho hệ thống cho trước tiêu chuẩn tối ưu định đạt Một toán điều khiển bao gồm hàm chi phí hàm trạng thái biến điều khiển Một điều khiển tối ưu tập hợp phương trình vi phân mơ tả đường biến điều khiển cực tiểu hóa hàm chi phí Trong mảng ứng dụng trí tuệ nhân tạo, tối ưu hóa q trình điều khiển lĩnh vực nghiên cứu nhắc đến nghiên cứu điều khiển tối ưu hai mang lý thuyết có nhiều điểm liên quan đến Vấn đề luyện mạng nơ-ron feed-forward nhà nghiên cứu tiếp cận trình giải tốn quy hoạch phi tuyến tính điều khiển tối ưu (Bazaraa et al., 2013; Bertsekas, 1999; Kuhn & Tucker, 2014) có dạng: (1) Trong θ tập hợp tham số cần luyện J hàm mát quy ước Trong điều kiện giới hạn, sở cho toán xuống dốc xuống dốc ngẫu nhiên học máy để tìm tập hợp tham số tối ưu θ Vì việc sử dụng cách tiếp cận trí tuệ nhân tạo học sâu tốn điều khiển tối ưu hướng có tiềm ứng dụng thực tế Trí tuệ nhân tạo, cụ thể mơ hình học sâu, hoc tăng cường dựa sở mô lại trình nhận thức người cách sử dụng mạng nơ-ron nhiều lớp tương tự hệ thống nơ ron hệ thần kinh thị giác người Kiến trúc hệ nơ-ron cách kết hợp mơ hình hệ nơ-ron khác lĩnh vực đầu tư nghiên cứu rộng rãi nhằm phát triển mơ hình điều khiển ứng dụng cho mục đích tối ưu điều khiển hệ thống phức tạp chứa nhiều yếu tố phi tuyến Mục tiêu nhiệm vụ đề tài Xây dựng thuật toán mơ hình trí tuệ nhân tạo sử dụng học tăng cường nhằm tự động hiệu chỉnh, thích nghi tối ưu chất lượng mơ hình điều khiển bám mục tiêu di động khí tài quang điện tử Đối tượng phạm vi nghiên cứu • Nghiên cứu toán phát mục tiêu sử dụng học sâu • Xây dựng liệu, đánh giá lựa chọn mơ hình cho tốn phát mục tiêu sử dụng học sâu • Nghiên cứu mơ hình trí tuệ nhân tạo sử dụng học tăng cường Nghiên cứu kỹ thuật Q-learning xây dựng mơ hình tác từ tự động điều chỉnh thích nghi • Xây dựng mơ hình thử nghiệm tương tác mơi trường luyện tác từ học tăng cường Thử nghiệm đánh giá kết mơ hình điều khiển bám mục tiêu khí tài quang điện tử Phương pháp nghiên cứu Căn vào mục đích, yêu cầu, nội dung đặt đề tài, xác định phương pháp nghiên cứu bao gồm: • Xây dựng sơ đồ nghiên cứu tổng quan mang lại nhìn chung • Tiến hành thu thập thông tin, nghiên cứu tài liệu, dựa tài liệu tham khảo, xây dựng quy trình dự kiện; nêu rõ sở khoa học từ xác định cần nghiên cứu tồn hay số cơng đoạn cụ thể • Xử lý thơng tin, số liệu thu thập được, viết chương trình, huấn luyện mơ hình kiểm thử Ý nghĩa khoa học thực tiễn • Về mặt lý thuyết Nghiên cứu phương pháp phát mục tiêu dựa nển tảng có, từ tiếp tục nghiên cứu phát triển toán đáp ứng tốt độ xác, xử lý tính tốn nhanh đáp ứng yêu cầu thời gian thực • Về mặt thực tiễn Cung cấp mơ hình tự động phát hiện, hiệu chỉnh, thích nghi tối ưu hóa chất lượng bám mục tiêu di động khí tài quang điện tử Lời cảm ơn Để hồn thành đồ án cách hoàn chỉnh, bên cạnh nỗ lực cố gắng thân cịn có giúp đỡ nhiệt tình q thầy cơ, ủng hộ động viên đơn vị, gia đình bạn bè suốt thời gian học tập, nghiên cứu thực đồ án tốt nghiệp Xin chân thành bày tỏ lòng biết ơn đến thầy ThS Trịnh Huy Long, người động viên, giúp đỡ tạo điều kiện thuận lợi cho em hoàn thành đồ án 10 Chương TỔNG QUAN VỀ BÀI TOÁN 1.1 Bài toán phát đối tượng 1.1.1 Bài toán phát đối tượng tự động cảnh giới Phát đối tượng tự động có vai trị quan trọng hệ thống trinh sát phát mục tiêu, hệ thống giám sát, nhận dạng khảo sát Việc sử dụng thị giác máy tính để phát đối tượng giải pháp sử dụng rộng rãi toàn giới Phương pháp ứng dụng kỹ thuật xử lý ảnh thuật toán học máy để tìm đối tượng hình ảnh Tuy nhiên, việc phát đối tượng dựa thị giác máy tính vấn đề khó hệ thống phải giải với thay đổi điều kiện tạo ảnh (ví dụ thay đổi điều kiện ánh sáng thời tiết) thay đổi bối cảnh môi trường Nhiều phương pháp phát đối tượng khác sử dụng thị giác máy tính phát triển ứng dụng rộng rãi đời sống thực tiễn Các phương pháp phát đối tượng với ba bước Bước thứ dựa vào thuộc tính đối tượng màu sắc, kết cấu bề mặt hình dạng để trích chọn đặc trưng ảnh Bước thứ hai sử dụng tập liệu mẫu để xác định tham số cho nhận dạng đối tượng ảnh Bước thứ sử dụng nhận dạng để xác định đối tượng ảnh đầu vào Trong hệ thống phát mục tiêu qn việc trích chọn đặc trưng ảnh đóng vai trị quan trọng Có hai hướng giải việc trích chọn đặc trưng thể hình 1.1 Hai quy trình có điểm đặc trưng sau: a) Sử dụng đặc trưng trích chọn, xử lý tay đặc trưng vùng, đặc trưng cạnh, đặc trưng kết cấu bề mặt vùng ảnh, làm đường bao đối tượng Điểm mạnh phương pháp bất biến với điều kiện ánh sáng dịch chuyển đối tượng Tuy nhiên, phương pháp dựa vào cạnh lại nhạy cảm với đặc trưng nhiễu khơng có hiệu 95 (t) := (4.11) Lớp thứ ba gọi lớp đầu ra, nơi có liên quan đến kết đầu Actor - Critic Các kết đầu tính tốn cách đơn giản trực tiếp, tham số PID, K (t) sau: (4.12) với trọng số đơn vị ẩn thứ j đầu lớp Actor Hàm giá trị Critic thu sau: (4.13) (t) biểu thị trọng số đơn vị ẩn thứ j lớp đầu Critic Các trọng số đầu khác đào tạo thuật toán học dựa gradient Do đó, lấy quy tắc cập nhật thích ứng theo thơng số tự định nghĩa Tín hiệu tăng cường nghiên cứu định nghĩa là: (4.14) cho biết khác biệt hiệu suất dự đoán giá trị tham chiếu Sau đó, lỗi TD trở thành: (4.15) Hàm chi phí biểu thị sau: (4.16) Do đó, phương trình đạo hàm riêng trọng số đầu Actor sau: (4.17) đó, tỷ lệ học tập, (4.18) (4.19) 96 (4.20) Cần ý đến thông tin hệ Jacobian ∂y (t + 1) / ∂u (t) Xem xét quan hệ , sau phương trình Jacobian thu là: (4.21) với sign () = () , -1 () Dựa giả thiết trên, dấu hệ thống Jacobian lấy, Quy tắc cập nhật cho trọng lượng đầu Critic (4.22) với learning rate = Các tâm độ rộng đơn vị ẩn lớp ẩn coi cập nhật theo cách sau: với (4.24) đó, learning rate tâm chiều rộng tương ứng 4.2.3 Tổng quan thuật toán ● Sơ đồ thủ tục 97 Hình 3: : Sơ đồ tổng quan thuật toán ● Triển khai thuật toán Các bước thiết kế điều khiển PID thích ứng đề xuất theo cấu trúc Actor-Critic dựa mạng RBF sau: Khởi tạo giá trị tức thời t = 0, tín hiệu điều khiển đầu vào u(0) tín hiệu tham chiếu yd (t) Khởi tạo tham số đặt giá trị learning rate αw, αv, αµ, ασ Bắt đầu vịng lặp t = 1: EndTime Đo đầu hệ thống y (t) sau thu sai số hệ thống e (t) Tính tốn hàm nhân lớp ẩn Tính tốn đầu Actor, tham số PID từ (4) đầu hàm giá trị Critic V (t) thời điểm t Nhận tín hiệu điều khiển cách ∆u(t) = KI(t)e(t) − Kp(t)∆y(t) − Kd(t)∆2y(t) (4.25) Áp dụng tín hiệu điều khiển cho hệ thống điều khiển mang lại giá trị dự đoán đầu hệ thống y (t + 1) Xây dựng trạng thái hệ thống giá trị dự đoán: 98 Θ (t + 1) := [e(t + 1),∆y(t + 1),∆2y(t + 1)]T (4.26) 10.Tính giá trị hàm V (t + 1) 11.Lấy lỗi TD δTD(t) từ hàm 12.Cập nhật trọng số tham số PID trọng số hàm giá trị 13.Cập nhật trung tâm độ rộng hàm chức RBF 14.Kết thúc vòng lặp 4.3 Thử nghiệm mơ hình mơ 4.3.1 Lunar Lander Continuous Environment Landing pad tọa độ (0,0) Tọa độ hai số vector trạng thái Phần thưởng cho việc di chuyển từ đầu hình đến bệ hạ cánh tốc độ không khoảng 100 - 140 điểm Nếu tàu đổ di chuyển khỏi bệ hạ cánh, phần thưởng trở lại Tập kết thúc tàu đổ gặp cố nghỉ ngơi, nhận thêm -100 +100 điểm Mỗi điểm tiếp xúc đất chân +10 Kích hoạt động -0,3 điểm khung Đã giải 200 điểm Có thể hạ cánh bên ngồi bãi đáp Nhiên liệu vơ hạn, đặc vụ học cách bay sau hạ cánh lần thử Bốn hành động rời rạc có sẵn: khơng làm cả, bán động định hướng bên trái, bán động chính, bán động định hướng bên phải Hình 4: Mơ trạng thái bắt đầu Lunar Lander 99 Quá trình điều khiển điều chỉnh PID đặt cố định tham số I, D thay đổi giá trị P (0, 0.5, 1, 1.5, 2) kết theo biểu đồ, màu cam đại diện cho “SetPoint”, màu xanh đại điện cho “Feedback”, bên trái angular controller, bên phải vertical controller: ● P = 0, I = 0, D = ● P = 0.5, I = 0, D = ● P = 1, I = 0, D = ● P = 1.5, I = 0, D = 100 ● P = 2, I = 0, D = Từ biểu đồ thấy rõ việc điều chỉnh PID cách đặt giá trị (1,0,0) cho kết tối ưu trình điều khiển bay điều khiển dọc góc Áp dụng mơ hình tự điều khiển PID, với siêu tham số: gamma = 0.99, learning rate (actor = 0.01, critic = 0.001), để điều khiển online learning dò tự động tham số PID trình bay, kết ghi lại sau: ● Lần bay 1: ● Lần bay 60: Qua trình huấn luyện số lượng định điều khiển PID liên tục điều chỉnh, tự động tìm đặt giá trị khoảng thời gian hoạt 101 động định Điều tiết kiệm thời gian thực tế bỏ qua q trình điều chỉnh phải huấn luyện từ đầu thiết bị đưa vào môi trường thực hoạt động với yêu cầu 4.3.2 Track Point Environment Mục tiêu giữ cho vòng tròn màu đỏ gần trỏ chuột màu xanh tốt Nói cách khác, điểm đặt định nghĩa vị trí trỏ chuột lỗi định nghĩa khoảng cách (có hướng) vòng tròn màu đỏ trỏ chuột Bằng cách điều chỉnh hệ số PID, khả theo dõi trỏ vịng trịn màu đỏ nâng cao Hình 5: Mơ Track point Kết q trình huấn luyện sử dụng mơ hình để tự động dò PID sau: x Lần thứ y 102 Lần thứ 48 4.4 Thử nghiệm khí tài quang Trên sở sơ đồ tổng quan thuật tốn, xây dựng mơ hình cụ thể cho tốn bám mục tiêu di chuyển bệ khí tài quang sau: Hình 6: Sơ đồ thuật tốn khí tài quang Q trình bám mục tiêu thực kênh góc: góc tầm góc hướng, mơ hình điều khiển kênh hồn tồn giống nhau, chúng tơi nghiên cứu mơ hình điều khiển kênh, động Khi mục tiêu trường nhìn camera, tọa độ góc mục tiêu xác định bám ảnh (sử dụng thuật toán bám ảnh KCF, CSRT) Sai số góc vị trí mục tiêu trục tâm camera bám ảnh tính tốn gửi cho điều khiển, đồng thời sở xác định reward cho RL agent Bộ điều khiển dựa tham số PID thiết lập RL agent để đưa tín hiệu điều khiển đến động quay camera Bộ điều khiển đạt đến 103 trạng thái lý tưởng mục tiêu di chuyển, điều khiển đưa tốc độ phù hợp cho động để bám theo mục tiêu giữ cho mục tiêu trục camera Sai số trục tâm camera vị trí mục tiêu nhỏ reward cho agent lớn 4.5 Đánh giá nhận xét 4.5.1 Kết thử nghiệm Qua trình nghiên cứu điều khiển PID thích ứng theo cấu trúc ActorCritic dựa mạng RBF cho hệ thống phi tuyến Một quy tắc cập nhật thích ứng trình bày thơng qua cập nhật trọng số mạng Đầu tiên, điều khiển PID thông thường kết hợp với việc học tăng cường sở mạng RBF PID điều chỉnh theo cách trực tuyến Tín hiệu tăng cường xác định cách xem xét đầu dự đốn, đó, cập nhật thực cách xác Sau đó, lớp ẩn mạng RBF chia sẻ Actor Critic Khơng gian lưu trữ tiết kiệm giảm chi phí tính tốn cho kết đầu đơn vị ẩn Ngồi ra, thơng số PID ban đầu đặt 0, có nghĩa khơng cần biết kiến thức trước hệ thống kiểm soát Cuối cùng, số mô đưa để hiệu tính khả thi sơ đồ đề xuất cho hệ thống phi tuyến phức tạp Các thơng số PID dựa quy tắc cập nhật thích ứng đạt đến giá trị khơng đổi Hình 7: Thử nghiệm thiết bị khí tài gắn tàu biển 104 Áp dụng cho trình thử nghiệm thiết bị nhận thấy q trình học cịn nhiều thời gian Ngồi thiếu sót chương trình đề xuất số tham số người dùng định cần thiết để thiết lập thử nghiệm thực nghiệm chúng vượt phạm vi định 4.5.2 Nhận xét Trong trình tìm hiểu, kiến thức cịn nhiều thiếu sót hạn chế, nội dung thực số tồn cần tiếp tục nghiên cứu giải sau: -Vấn đề cải thiện tốc độ học, điều chỉnh miền giá trị giảm thiểu chi phí tính tốn cho kết đầu xác dựa thông số biết trước hệ thống - Khả dự đốn cịn nhiều sai lệch đưa PID phù hợp, kết mô kết chạy thiết bị khí tài, cần phải tiếp tục cải thiện thuật toán tăng cường khả luyện thực tiễn - Huấn luyện thực tiễn khí tài cịn thời gian, chưa đánh giá xác tồn thuật tốn hoạt động Việc giải mặt tồn kể trọng tâm nghiên cứu nhóm thực đề tài thời gian tới Khi diễn biến dịch ổn định hơn, q trình thử nghiệm, điều chỉnh thuật tốn tiếp tục thực tiến hành triển khai thiết bị đơn vị sở 4.6 Tóm tắt chương Trong hệ thống bệ Camera ổn định tàu, điều khiển cấu trúc biến dựa luật tiếp cận theo cấp số nhân thiết kế dựa thực tế mơ hình hệ thống tham số khơng xác với chuyển động bệ quay chịu tác động ma sát nhiễu bên ngồi Bởi điều khiển cấu trúc biến dựa trạng thái hệ thống (như độ lệch dẫn xuất khác nhau) quy trình động để thực thay đổi tham số điều khiển, buộc hệ thống 105 phải di chuyển theo quỹ đạo chế độ trượt xác định trước Hệ thống không nhạy cảm với tham số nhiễu, khơng u cầu mơ hình động xác Điều khiển khắc phục ảnh hưởng ma sát cải thiện độ xác theo dõi hệ thống Servo Các thí nghiệm mơ tiếp tục cho thấy điều khiển cấu trúc biến đổi tốt so với điều khiển PID truyền thống hiệu ứng động điều khiển đánh giá dựa mơ hình ma sát Điều có ý nghĩa hướng dẫn định cho việc thiết kế lựa chọn điều khiển 106 KẾT LUẬN Các hệ thống camera giám sát trở thành phổ biến thiết yếu nhằm đảm bảo an ninh cho khu vực dân nhà nước, qn Mơ hình phổ biến hệ thống bao gồm camera bố trí khu vực cần quan sát, truyền hình ảnh liên tục trung tâm điều khiển Tại trung tâm điều khiển, liệu hình ảnh lưu trữ ghi hình hiển thị hình quan sát Đồng thời trung tâm tích hợp thiết bị điều khiển nhằm điều hành phản ứng trước tình Với lượng liệu lớn liên tục 24/24 vậy, việc sử dụng phương pháp giám sát phát thủ công phương pháp tốn mang nhiều rủi ro liên quan đến yếu tố người Với phương pháp mơ hình nghiên cứu có, nhóm nghiên cứu có kế hoạch kết hợp với kết nghiên cứu khác, mở rộng phạm vi hướng đến ứng dụng để xây dựng đề xuất thành sản phẩm chuyên dụng đề tài nghiên cứu chuyên sâu, có phát drone, flycam, người phục vụ cho mục đích an ninh, an toàn, cảnh giới giám sát tự động cho sân bay, quân sự, cảng biển Mục tiêu áp dụng mơ hình phát vị trí cần khả quan sát liên tục ngày đêm nhiều camera yêu cầu tích hợp nhiều nguồn liệu khác nên yêu cầu khả tự động hóa sử dụng liệu lớn trí tuệ nhân tạo cao Trên giới, nhiều nước nghiên cứu phát triển đưa vào thành dòng sản phẩm thương mại FLIR, SPI có chức giám sát không gian rộng ngày đêm trang bị xử lý phát bám mục tiêu, nhận dạng đo tọa độ, đưa thị cảnh báo tự động việc ứng dụng thị giác máy tính trí tuệ nhân tạo Tuy nhiên, hệ thống nước phân phối thương mại với giá thành lớn khó tùy biến cho ứng dụng chuyên biệt 107 DANH MỤC TÀI LIỆU THAM KHẢO [1] Walsh, Joseph & O' Mahony, Niall & Campbell, Sean & Carvalho, Anderson & Krpalkova, Lenka & Velasco-Hernandez, Gustavo & Harapanahalli, Suman & Riordan, Daniel (2019) Deep Learning vs Traditional Computer Vision 10.1007/978-3-030-17795-9_10 [2] P Viola and M J Jones, “Robust real-time face detection,” International journal of computer vision, vol 57, no 2, pp 137–154, 2004 [3] N Dalal and B Triggs, “Histograms of oriented gradients for human detection,” in Computer Vision and Pattern Recognition, 2005 CVPR 2005 IEEE Computer Society Conference on, vol IEEE, 2005, pp 886–893 [4] P Felzenszwalb, D McAllester, and D Ramanan, “A discriminatively trained, multiscale, deformable part model,” in Computer Vision and Pattern Recognition, 2008 CVPR 2008 IEEE Conference on IEEE, 2008, pp 1–8 [5] A Krizhevsky, I Sutskever, and G E Hinton, “Imagenet classification with deep convolutional neural networks,” in Advances in neural information processing systems, 2012, pp 1097–1105 [6] K Simonyan and A Zisserman, “Very deep convolutional networks for large-scale image recognition,” arXiv preprint arXiv:1409.1556, 2014 [7] C Szegedy, V Vanhoucke, S Ioffe, J Shlens, and Z Wojna, “Rethinking the inception architecture for computer vision,” in Proceedings of the IEEE conference on computer vision and pattern recognition, 2016, pp 2818–2826 [8] K He, X Zhang, S Ren, and J Sun, “Deep residual learning for image recognition,” in Proceedings of the IEEE conference on computer vision and pattern recognition, 2016, pp 770–778 [9] G Huang, Z Liu, L Van Der Maaten, and K Q Weinberger, “Densely connected convolutional networks.” in CVPR, vol 1, no 2, 2017, p 108 [10] J Hu, L Shen, and G Sun, “Squeeze-and-excitation networks,” arXiv preprint arXiv:1709.01507, vol 7, 2017 [11] Szegedy, Christian & Reed, Scott & Erhan, Dumitru & Anguelov, Dragomir (2014) Scalable, High-Quality Object Detection arXiv:1412.1441 [12] W Liu, D Anguelov, D Erhan, C Szegedy, S Reed, C.Y Fu, A.C Berg, in: SSD: Single shot multibox detector, 14th European Conference on Computer Vision, Amsterdam, The Netherlands, 2016, pp 21–37, https://doi.org/10.1007/978-3- 319-46448-0_2 [13] Yu, Jiahui & Jiasng, Yuning & Wang, Zhangyang & Cao, Zhimin & Huang, Thomas (2016) UnitBox: An Advanced Object Detection Network MM '16: Proceedings of the 24th ACM international conference on Multimedia 10.1145/2964284.2967274 [14] Howard, A.G., Zhu, M., Chen, B., Kalenichenko, D., Wang, W., Weyand, T., Andreetto, M.,Adam, H., 2017 MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications.1704.04861 [15] S Ren, K He, R Girshick, and J Sun Faster r-cnn: Towards realtime object detection with region proposal networks In Advances in neural information processing systems, pages 91–99, 2015 [16] J Dai, Y Li, K He, and J Sun R-fcn: Object detection via regionbased fully convolutional networks arXiv preprint arXiv:1605.06409, 2016 [17] W Liu, D Anguelov, D Erhan, C Szegedy, S Reed, C.-Y Fu, and A C Berg Ssd: Single shot multibox detector In European Conference on Computer Vision, pages 21–37 Springer, 2016 [18] C Szegedy, S Reed, D Erhan, and D Anguelov Scalable, highquality object detection arXiv preprint arXiv:1412.1441, 2014 109 [19] J Redmon, S Divvala, R Girshick, and A Farhadi You only look once: Unified, real-time object detection arXiv preprint arXiv:1506.02640, 2015 ... hồn thành đồ án cách hoàn chỉnh, bên cạnh nỗ lực cố gắng thân cịn có giúp đỡ nhiệt tình q thầy cơ, ủng hộ động viên đơn vị, gia đình bạn bè suốt thời gian học tập, nghiên cứu thực đồ án tốt nghiệp... lớn Các thuật toán bám mục tiêu, bám 22 quỹ đạo hành gặp khó khăn thường bám, quỹ đạo bám Trong báo cáo đồ án tốt nghiệm, thực xây dựng thử nghiệm phương pháp phát mục tiêu thuật toán tối ưu điều... thuật toán học máy để tìm đối tượng hình ảnh Tuy nhiên, việc phát đối tượng dựa thị giác máy tính vấn đề khó hệ thống phải giải với thay đổi điều kiện tạo ảnh (ví dụ thay đổi điều kiện ánh sáng thời

Ngày đăng: 08/03/2022, 11:05