Computer vision báo cáo giữa kỳ Đề tài so sánh rcnn và yolov8 với với tập dữ liệu khối u não

HỒ CHÍ MINHKHOA CÔNG NGHỆ THÔNG TIN COMPUTER VISION Báo cáo giữa kỳ Đề tài: So sánh RCNN và YOLOv8 với với tập dữ liệu khối u... CHƯƠNG 1: GIỚI THIỆU TỔNG QUAN1.1 Giới thiệu đề tài Trong

Trang 1

TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP TP HỒ CHÍ MINH

KHOA CÔNG NGHỆ THÔNG TIN

COMPUTER VISION

Báo cáo giữa kỳ

Đề tài: So sánh RCNN và YOLOv8 với với tập dữ liệu khối u

Trang 2

NHẬN XÉT CỦA GIẢNG VIÊN HƯỚNG DẪN

Ngày tháng năm

GIẢNG VIÊN HƯỚNG DẪN

(Ký và ghi rõ họ tên)

2

Trang 3

DANH SÁCH THÀNH VIÊN NHÓM 8

Nhung

20088101

MỤC LỤC

CHƯƠNG 1: GIỚI THIỆU TỔNG QUAN 3

1.1 Giới thiệu đề tài 3

1.2 Mục tiêu 3

CHƯƠNG 2: DỮ LIỆU HUẤN LUYỆN 4

2.1 Nguồn gốc 4

2.2 Trực quan hóa dữ liệu 4

CHƯƠNG 3: CÁC BƯỚC THỰC HIỆN 6

3.1 Huấn luyện mô hình YOLOV9 6

3.2 Huấn luyện mô hình YOLOv8 và so sánh với YOLOv9 13

3.3 Huấn luyện mô hình R-CNN 14

CHƯƠNG 4: KẾT LUẬN 17

4.1 Những khó khăn gặp phải khi thực hiện đề tài 17

4.2 Hạn chế còn tồn tại 17

TÀI LIỆU THAM KHẢO 17

2

Trang 4

CHƯƠNG 1: GIỚI THIỆU TỔNG QUAN

1.1 Giới thiệu đề tài

Trong thời đại công nghệ ngày nay, việc nhận diện và phân loại đối tượng trong hình ảnh và video đã trở thành một phần quan trọng của nhiều ứng dụng công nghệ, từ an ninh đến tự động hóa công nghiệp và xe tự lái,y tế Đề tài này tập trung vào việc nghiên cứu và triển khai các phương pháp nhận diện đối tượng hiệu quả, với việc sử dụng hai mô hình là R-CNN và YOLO

Trang 5

CHƯƠNG 2: DỮ LIỆU HUẤN LUYỆN

2.2 Trực quan hóa dữ liệu

Tập dữ liệu được chia thành 3 thư mục nhỏ, tương ứng với một lát cắt

Mỗi thư mục lát cắt chứa 2 thư mục images (train, test) và 2 thư mục ảnh labels (train, test)

2

Trang 6

Tổng số lượng file trong mỗi lát cắt

2

Trang 7

CHƯƠNG 3: CÁC BƯỚC THỰC HIỆN 3.1 Huấn luyện mô hình YOLOV9

3.1.1 Chuẩn bị dữ liệu

2

Trang 11

3.1.2 Load model và huấn luyện

2

Trang 12

3.1.3 Visualize results và Confusion metrics

2

Trang 13

3.1.4 Ảnh trên tập test detect

2

Trang 14

3.2 Huấn luyện mô hình YOLOv8 và so sánh với YOLOv9

3.3 Huấn luyện mô hình R-CNN

3.3.1 Import thư viện chuẩn bị dữ liệu và tiền xử lý

2

Trang 15

Dữ liệu ảnh và label sau khi được xử lý

2

Trang 16

3.3.2 Selective search

Vẽ bodding box với ảnh đầu tiên với label có sẵn

2

Trang 17

Selective search với 1 ảnh trong tập train.

3.3.3 Tính iou và xử lý thêm các ảnh sau khi selective search vào img_list

2

Trang 19

3.3.4 Xử lý dữ liệu để chuẩn bị đưa vào mô hình CNN

Thêm các ảnh vào data và class vào data_label

Chia tập X_train,X_val,y_train,y_val

2

Trang 20

3.3.5 Train data với mô hình CNN ở đây sử dụng VGG16

2

Trang 21

3.3.6 Detection model RCNN trên 1 ảnh test

2

Trang 22

CHƯƠNG 4: KẾT LUẬN

4.1 Những khó khăn gặp phải khi thực hiện đề tài

● Thống nhất thời gian họp mặt offline giữa các thành viên

● Quá trình tìm hiểu và thực thi các model R-CNN ,Fast-R-CNN, CNN gặp rất nhiều khó khăn trong việc xử lý dữ liệu để phù hợp với từng

Faster-R-mô hình.Tài liệu tham khảo đa phần về lý thuyết , tài liệu về thực hành đa phần chỉ gọi ra và test trên một ảnh có sẵn của họ Lỗi về môi trường khi chạy kaggle gặp rất nhiều khó khăn trong việc download và load model Faster-R-CNN dẫn đến lỗi mà tụi em chưa thể khắc phục

4.2 Hạn chế còn tồn tại

Những hạn chế cần được cải thiện:

- Chỉ chạy được model Yolo cho kết quả detect khá đúng , đối với R-CNN cho accuracy cao nhưng kết quả detect lại không đúng và chỉ mới chạy thử trên một ảnh

- Chưa thể chạy model Fast-R-CNN và Faster-R-CNN

- Tài liệu tham khảo về dữ liệu đang dùng khá ít

- Việc xử lý lỗi và debugging mô hình có thể đòi hỏi có hiểu biết sâu về môhình

TÀI LIỆU THAM KHẢO

faster-r-cnn-va-yolo/ : Lý thuyết về các model

https://miai.vn/2020/07/04/co-ban-ve-object-detection-voi-r-cnn-fast-r-cnn-2

Tiêu đề	So Sánh Rcnn Và Yolov8 Với Với Tập Dữ Liệu Khối U Não
Tác giả	Nguyễn Phú Điền Nhung, Nguyễn Nhật Huy, Nguyễn Văn Anh Khoa, Nguyễn Văn Phường
Người hướng dẫn	GVHD: Lưu Giang Nam
Trường học	Trường Đại Học Công Nghiệp TP. Hồ Chí Minh
Chuyên ngành	Công Nghệ Thông Tin
Thể loại	Báo cáo
Năm xuất bản	2024
Thành phố	TP. Hồ Chí Minh

Định dạng
Số trang	22
Dung lượng	5,76 MB