Kiến trúc mạng autoencoders

Một phần của tài liệu Điều hướng xe tự hành dùng trí tuệ nhân tạo (Trang 30 - 31)

2.3. Convolutional Neural Network (CNN)

Mạng nơron thần kinh (CNN) là mô hình học tập sâu hàng đầu cho thị giác máy tính. Thị giác máy đã trở nên tốt đến nỗi hiện nay nó đang đánh bại cả con người trong những nhiệm vụ khó nhất và CNN đóng một vai trò quan trọng trong câu chuyện thành công này. CNN là một trong những thuật toán Deep Learning cho kết quả tốt nhất hiện nay trong hầu hết các bài toán về thị giác máy như phân loại, nhận dạng… Về cơ bản CNN là một kiểu mạng ANN truyền thẳng, trong đó kiến trúc chính gồm nhiều thành phần được ghép nối với nhau theo cấu trúc nhiều tầng đó là

 Convolution (tích chập)  Pooling (gộp chung)

 ReLU (tinh chỉnh các đơn vị tuyến tính)  Fully connected (liên kết đầy đủ)

Trước khi đi vào các thành phần cơ bản của CNN, ta xem xét một ví dụ về cách thức xử lý thông tin đầu vào của một ANN truyền thẳng để từ đó rút ra tác dụng của các thành phần có trong mạng CNN.

Hình 2.12 mô tả một ví dụ với dữ liệu đầu vào là một bức ảnh có kích thước 200x200 được xử lý bằng ANN với kết nối đầy đủ giữa hai tầng liên tiếp (full connected). Như vậy giả sử số neural tầng ẩn là 40000 thì tổng số tham số (mà cụ thể hơn ở đây là các trọng số liên kết W giữa các neural tầng nhập với tầng ẩn) cần phải

ước lượng lên đến 1.6 tỉ. Điều này gây khó khăn cho việc huấn luyện ANN trên hai yếu tố: thứ nhất là chi phí để xây dựng dữ liệu huấn luyện lớn và thứ hai thời gian huấn luyện lâu.

Từ thực tế đặt ra ở trên người ta thấy rằng để giảm số lượng tham số cần giảm số lượng kết nối giữa các lớp. Từ đây thành phần convolution được áp dụng – ý tưởng chính là mỗi neural chỉ cần kết nối tới một vùng cục bộ của ảnh thay vì trên toàn bộ ảnh (hình 2.13).

W

Một phần của tài liệu Điều hướng xe tự hành dùng trí tuệ nhân tạo (Trang 30 - 31)

Tải bản đầy đủ (DOC)

(69 trang)
w