Ứng dụng Convolutional Neural Network để giải quyết bài toán

Một phần của tài liệu ỨNG DỤNG CÔNG NGHỆ học sâu để PHÂN LOẠI và KIỂM TRA CHẤT LƯỢNG THUỐC CHỮA BỆNH (Trang 83 - 84)

Trên cơ sở các kiến thức về học sâu và mạng tích chập đã trình bày ở trên. Nhằm giảm thời gian nghiên cứu, thiết kế xây dựng mạng để nhận diện đối tượng trong đề tài, nhóm đã lựa chọn sử dụng YOLO của Darknet.

YOLO là giải thuật nhận diện đối tượng ứng dụng mạng nơ ron nhân tạo hiện đại với tốc độ cao nhất hiện nay (tốc độ cao nhất có thể đạt được là 220 khung hình trên giây ở phiên bản v3 Tiny).

Hình 4. 14. Nhận dạng đối tượng với YOLO

Trong các hệ thống nhận diện trước đây phải sử dụng lại nhiều lần trình phân loại để tiến hành nhận diện. Để phát hiện một đối tượng, các hệ thống này lấy một trình phân loại cho đối tượng đó và đánh giá nó ở các vị trí và các thang đo khác nhau trong một khung hình. Các giải thuật hiện đại hơn như R-CNN sử dụng phương pháp tìm vùng có khả năng để khởi tạo ban đầu các hình hộp bao (Bounding Boxes), sau đó cho trình phân loại trên các hình hộp đó để giảm bớt thời gian nhận diện. Tất cả các phương pháp này đều cho tốc độ chậm và khó có thể tối ưu bởi vì mỗi đối tượng phải được học mạng trên các mạng nơ ron riêng biệt.

YOLO sử dụng một mạng nơ ron duy nhất để dự đoán cho các hình hộp bao với nguyên lý như Hình 4.15. Mô hình mạng thống nhất này có vài điểm có lợi hơn so với các phương pháp truyền thống:

- YOLO đem lại tốc độ cực nhanh. Khi đã thống nhất được mạng nơ ron thì phương pháp không cần các giải thuật rắc rối khác. Với GPU TiTan X, mạng này xử lý được với tốc độ 45 khung hình trên giây. Điều này có nghĩa là YOLO hoàn toàn có thể ứng dụng trong xử lý ảnh trực tiếp với độ trễ nhỏ hơn 25ms.

Hình 4. 15. Nguyên lý nhận diện đối tượng của YOLO

- YOLO không cần sử dụng các giải thuật phức tạp như xác định vùng có khả năng của R-CNN, YOLO đọc vào toàn bộ bức ảnh để xử lý vì vậy YOLO tạo ra ít lỗi hơn nhiều so với R-CNN.

Tuy nhiên YOLO vẫn không bằng các hệ thống tối tân hiện đại nhất ở độ chính xác nhưng điều này đang được Joseph Redmon – tác giả của YOLO cải thiện.

Một phần của tài liệu ỨNG DỤNG CÔNG NGHỆ học sâu để PHÂN LOẠI và KIỂM TRA CHẤT LƯỢNG THUỐC CHỮA BỆNH (Trang 83 - 84)