HỒ CHÍ MINHKHOA CÔNG NGHỆ THÔNG TIN COMPUTER VISION Báo cáo giữa kỳ Đề tài: So sánh RCNN và YOLOv8 với với tập dữ liệu khối u... CHƯƠNG 1: GIỚI THIỆU TỔNG QUAN1.1 Giới thiệu đề tài Trong
Trang 1TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP TP HỒ CHÍ MINH
KHOA CÔNG NGHỆ THÔNG TIN
COMPUTER VISION
Báo cáo giữa kỳ
Đề tài: So sánh RCNN và YOLOv8 với với tập dữ liệu khối u
Trang 2NHẬN XÉT CỦA GIẢNG VIÊN HƯỚNG DẪN
Ngày tháng năm
GIẢNG VIÊN HƯỚNG DẪN
(Ký và ghi rõ họ tên)
2
Trang 3DANH SÁCH THÀNH VIÊN NHÓM 8
Nhung
20088101
MỤC LỤC
CHƯƠNG 1: GIỚI THIỆU TỔNG QUAN 3
1.1 Giới thiệu đề tài 3
1.2 Mục tiêu 3
CHƯƠNG 2: DỮ LIỆU HUẤN LUYỆN 4
2.1 Nguồn gốc 4
2.2 Trực quan hóa dữ liệu 4
CHƯƠNG 3: CÁC BƯỚC THỰC HIỆN 6
3.1 Huấn luyện mô hình YOLOV9 6
3.2 Huấn luyện mô hình YOLOv8 và so sánh với YOLOv9 13
3.3 Huấn luyện mô hình R-CNN 14
CHƯƠNG 4: KẾT LUẬN 17
4.1 Những khó khăn gặp phải khi thực hiện đề tài 17
4.2 Hạn chế còn tồn tại 17
TÀI LIỆU THAM KHẢO 17
2
Trang 4CHƯƠNG 1: GIỚI THIỆU TỔNG QUAN
1.1 Giới thiệu đề tài
Trong thời đại công nghệ ngày nay, việc nhận diện và phân loại đối tượng trong hình ảnh và video đã trở thành một phần quan trọng của nhiều ứng dụng công nghệ, từ an ninh đến tự động hóa công nghiệp và xe tự lái,y tế Đề tài này tập trung vào việc nghiên cứu và triển khai các phương pháp nhận diện đối tượng hiệu quả, với việc sử dụng hai mô hình là R-CNN và YOLO
Trang 5CHƯƠNG 2: DỮ LIỆU HUẤN LUYỆN
2.2 Trực quan hóa dữ liệu
Tập dữ liệu được chia thành 3 thư mục nhỏ, tương ứng với một lát cắt
Mỗi thư mục lát cắt chứa 2 thư mục images (train, test) và 2 thư mục ảnh labels (train, test)
2
Trang 6Tổng số lượng file trong mỗi lát cắt
2
Trang 7CHƯƠNG 3: CÁC BƯỚC THỰC HIỆN 3.1 Huấn luyện mô hình YOLOV9
3.1.1 Chuẩn bị dữ liệu
2
Trang 113.1.2 Load model và huấn luyện
2
Trang 123.1.3 Visualize results và Confusion metrics
2
Trang 133.1.4 Ảnh trên tập test detect
2
Trang 143.2 Huấn luyện mô hình YOLOv8 và so sánh với YOLOv9
3.3 Huấn luyện mô hình R-CNN
3.3.1 Import thư viện chuẩn bị dữ liệu và tiền xử lý
2
Trang 15Dữ liệu ảnh và label sau khi được xử lý
2
Trang 163.3.2 Selective search
Vẽ bodding box với ảnh đầu tiên với label có sẵn
2
Trang 17Selective search với 1 ảnh trong tập train.
3.3.3 Tính iou và xử lý thêm các ảnh sau khi selective search vào img_list
2
Trang 193.3.4 Xử lý dữ liệu để chuẩn bị đưa vào mô hình CNN
Thêm các ảnh vào data và class vào data_label
Chia tập X_train,X_val,y_train,y_val
2
Trang 203.3.5 Train data với mô hình CNN ở đây sử dụng VGG16
2
Trang 213.3.6 Detection model RCNN trên 1 ảnh test
2
Trang 22CHƯƠNG 4: KẾT LUẬN
4.1 Những khó khăn gặp phải khi thực hiện đề tài
● Thống nhất thời gian họp mặt offline giữa các thành viên
● Quá trình tìm hiểu và thực thi các model R-CNN ,Fast-R-CNN, CNN gặp rất nhiều khó khăn trong việc xử lý dữ liệu để phù hợp với từng
Faster-R-mô hình.Tài liệu tham khảo đa phần về lý thuyết , tài liệu về thực hành đa phần chỉ gọi ra và test trên một ảnh có sẵn của họ Lỗi về môi trường khi chạy kaggle gặp rất nhiều khó khăn trong việc download và load model Faster-R-CNN dẫn đến lỗi mà tụi em chưa thể khắc phục
4.2 Hạn chế còn tồn tại
Những hạn chế cần được cải thiện:
- Chỉ chạy được model Yolo cho kết quả detect khá đúng , đối với R-CNN cho accuracy cao nhưng kết quả detect lại không đúng và chỉ mới chạy thử trên một ảnh
- Chưa thể chạy model Fast-R-CNN và Faster-R-CNN
- Tài liệu tham khảo về dữ liệu đang dùng khá ít
- Việc xử lý lỗi và debugging mô hình có thể đòi hỏi có hiểu biết sâu về môhình
TÀI LIỆU THAM KHẢO
faster-r-cnn-va-yolo/ : Lý thuyết về các model
https://miai.vn/2020/07/04/co-ban-ve-object-detection-voi-r-cnn-fast-r-cnn-2