4.2.1. Kết quả đề xuất
Mô hình (PAA) AP
mAP mAP50 mAP75
Tập Train Tập Test Car Truck Bus
Raw Raw 19.6 17.1 0.7 12.5 26.7 9.7
Dehazing Raw 18.7 11.2 1.5 10.4 21.4 9.1
Dehazing (truck_ex) Raw 21.9 11.3 4.4 12.5 26.5 9.8
Bảng 4.1: Bảng kết quả thực nghiệm với bộ dữ liệu huấn luyện được khử sương mờ loại trừ đối tượng truck phương pháp phát hiện đối tượng PAA.
40
4.2.2. Trực quan hóa kết quả
• Kết quả khử sương loại trừ truck
(a)Ảnh gốc (b)Khử sương toàn bộ (c)Khử sương loại trừ truck
(a)Ảnh gốc (b)Khử sương toàn bộ (c)Khử sương loại trừ truck Hình 4-1: Ảnh kết quả khử sương loại trừ đối tượng truck.
Nhận xét: Kết quả khử sương loại trừ đối tượng truck cho ta thấy được khu vực bên trong các bounding boxes của lớp đối tượng truck được giữ nguyên trong khi các vùng ảnh còn lại đều thực hiện khử sương mờ.
41
• Kết quả phát hiện đối tượng trên dữ liệu khử sương mờ loại trừ truck
(a)Ground truth (b)Khử sương toàn bộ ảnh (c)Khử sương loại trừ truck
(a)Ground truth (b)Khử sương toàn bộ ảnh (c)Khử sương loại trừ truck Hình 4-2: Ảnh kết quả phát hiện đối tượng trên dữ liệu khử sương mờ loại trừ truck
(a) Ground truth, (b) Khử sương toàn bộ ảnh, (c) Khử sương loài trừ truck.
Nhận xét: Nhìn vào hình ảnh trực quan hóa kết quả, ta thấy được rằng so với Ground truth, mô hình sử dụng dữ liệu khử sương loại trừ lớp đối tượng truck có kết quả dự đoán ít sai lệch với nhãn của Ground truth hơn và các đối tượng có điểm IoU cao hơn so với mô hình còn lại. Tuy nhiên, vẫn còn một số đối tượng car không được phát hiện ra trong điều kiện trời tối.
4.3. Đánh giá kết quả
42
• Đối với lớp truck, việc khử sương sẽ làm kết quả phát hiện đối tượng này giảm sút nhiều so với việc giữ nguyên lớp sương và coi lớp sương như là một phần của đối tượng.
• Ngược lại, đối với lớp car, việc khử sương đã giúp cho mô hình giảm tỉ lệ phát hiện sai lớp car thành lớp truck. Từ đó, kết quả phát hiện đối tượng củalớp này đã tăng lên đến 21.9% trên độ đo mAP. Hơn nữa, điểm IoU của từng đối tượng car riêng lẻ trong các điẻm dữ liệu cũng tăng lên trong khoảng 0.01% - 0.35%.
43
Chương 5. KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN
5.1. Kết luận
Nội dung đề tài tập trung tìm hiểu bài toán Phát hiện đối tượng trong không ảnh chứa sương mờ, nghiên cứu và chạy thực nghiệm phương pháp khử sương mờ cũng như phát hiện đối tượng dựa trên học sâu. Dựa trên những mục tiêu đặt ra, đề tài này đã đạt được một số kết quả sau:
• Đề xuất việc kết hợp hai phương pháp tiên tiến FFANet (AAAI-2021) và PPA (ECCV-2020) cho việc pháp hiện phương tiện trong không ảnh chứa sương mờ trên bộ dữ liệu UAV DT Benchmark-M.
• Dựa trên kết quả phát hiện đối tượng của mô hình được huấn luyện trên bộ dữ liệu khử sương mờ, nhóm nhận thấy rằng việc khử sương dữ liệu gốc đã làm ảnh hưởng đến các đặc trưng của hai lớp (car và truck) dẫn đến kết quả kiểm tra bị giảm sút.
• Thông qua quá trình thực nghiệm mở rộng, nhóm đã nhận thấy sương mờ làm giảm kết quả phát hiện lớp car nhưng lại cho kết quả tốt khi xem sương mờ là một phần của lớp truck.
• Dựa vào kết quả nghiên cứu được, nhóm đã có một bài báo khoa học được đăng tại Hội nghị Khoa học Trẻ và nghiên cứu sinh năm 2021 được tổ chức bởi trường Đại học Công nghệ thông tin: “MỘT PHƯƠNG PHÁP PHÁT HIỆN ĐỐI TƯỢNG TRONG KHÔNG ẢNH CHỨA SƯƠNG MỜ”13.
5.2. Thuận lợi
Trong suốt quá trình tìm hiểu, nhóm nhận được sự giúp đỡ của thầy, các anh chị và các bạn trong nhóm nghiên cứu.
13 https://khoahoctre.uit.edu.vn/trien-lam-khoa-hoc-cong-nghe-hoi-nghi-khoa-hoc-tre-va-nghien- cuu-sinh-nam-2021
44
Nhóm được sử dụng GPU cung cấp bới phòng MMLab, giúp thời gian huấn luyện mô hình được giảm tối đa.
5.3. Khó khăn
Nhóm gặp phải một số khó khăn khi tìm hiểu các bài toán khử sương mờ và phát hiện đối tượng do kiến thực nền tảng chưa đủ.
Nhóm vẫn còn phải sử dụng mô hình pre-trained của FFA-Net do không đủ thời gian thu thập dữ liệu mới.
Việc huấn luyện mô hình dựa trên phương pháp PAA tốn khá nhiều thời gian và gặp một số khó khăn khi thiết lập cấu hình chạy thực nghiệm.
5.4. Hướng phát triển
Trong tương lai, nhóm sẽ thu thập dữ liệu không ảnh chứa sương mờ để huấn luyện mô hình FFA-Net để tạo ra phân phối dữ liệu phù hợp với góc nhìn từ trên không.
Thực hiên tinh chỉnh tham số mô hình phương pháp PAA cho phù hợp với bộ dữ liệu không ảnh.
45
TÀI LIỆU THAM KHẢO
[1] D. Chen et al., “Gated context aggregation network for image dehazing and deraining,” in 2019 IEEE winter conference on applications of computer vision (WACV), 2019, pp. 1375–1383.
[2] K. He, J. Sun, and X. Tang, “Single image haze removal using dark channel prior,” IEEE Trans. Pattern Anal. Mach. Intell., vol. 33, no. 12, pp. 2341–2353, 2010.
[3] B. Li, X. Peng, Z. Wang, J. Xu, and D. Feng, “Aod-net: All-in-one dehazing network,” in Proceedings of the IEEE international conference
on computer vision, 2017, pp. 4770–4778.
[4] D. Yang and J. Sun, “Proximal dehaze-net: A prior learning-based deep network for single image dehazing,” in Proceedings of the european conference on computer vision (ECCV), 2018, pp. 702–717.
[5] X. Qin, Z. Wang, Y. Bai, X. Xie, and H. Jia, “FFA-Net: Feature fusion attention network for single image dehazing,” in Proceedings of the AAAI
Conference on Artificial Intelligence, 2020, vol. 34, no. 07, pp. 11908–
11915.
[6] D. Du et al., “The unmanned aerial vehicle benchmark: Object detection and tracking,” in Proceedings of the European conference on computer vision (ECCV), 2018, pp. 370–386.
[7] K. Kim and H. S. Lee, “Probabilistic anchor assignment with iou prediction for object detection,” in European Conference on Computer Vision, 2020, pp. 355–371.
[8] P. Poirson, P. Ammirato, C.-Y. Fu, W. Liu, J. Kosecka, and A. C. Berg, “Fast single shot detection and pose estimation,” in 2016 Fourth International Conference on 3D Vision (3DV), 2016, pp. 676–684.
[9] E. J. McCartney, “Optics of the atmosphere: scattering by molecules and particles,” New York, 1976.
[10] S. G. Narasimhan and S. K. Nayar, “Chromatic framework for vision in bad weather,” in Proceedings IEEE Conference on Computer Vision and
Pattern Recognition. CVPR 2000 (Cat. No. PR00662), 2000, vol. 1, pp.
598–605.
46
Comput. Vis., vol. 48, no. 3, pp. 233–254, 2002.
[12] B. Cai, X. Xu, K. Jia, C. Qing, and D. Tao, “Dehazenet: An end-to-end system for single image haze removal,” IEEE Trans. Image Process., vol. 25, no. 11, pp. 5187–5198, 2016.
[13] W. Ren, S. Liu, H. Zhang, J. Pan, X. Cao, and M.-H. Yang, “Single image dehazing via multi-scale convolutional neural networks,” in European conference on computer vision, 2016, pp. 154–169.
[14] B. Li et al., “Benchmarking single-image dehazing and beyond,” IEEE Trans. Image Process., vol. 28, no. 1, pp. 492–505, 2018.
[15] K. Chen et al., “MMDetection: Open mmlab detection toolbox and
47