Tìm hiểu bài toán tạo câu mô tả cho ảnh thời trang dùng học sâu

58 33 0
Tìm hiểu bài toán tạo câu mô tả cho ảnh thời trang dùng học sâu

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Hình ảnh liên quan

Hình 3.1: Cấu trúc nơ-ron sinh học - Tìm hiểu bài toán tạo câu mô tả cho ảnh thời trang dùng học sâu

Hình 3.1.

Cấu trúc nơ-ron sinh học Xem tại trang 19 của tài liệu.
Hình 3.3: Đồ thị của hàm step (trái) và hàm Sigmoid (phải). - Tìm hiểu bài toán tạo câu mô tả cho ảnh thời trang dùng học sâu

Hình 3.3.

Đồ thị của hàm step (trái) và hàm Sigmoid (phải) Xem tại trang 21 của tài liệu.
Mỗi mô hình mạng luôn có một input layer và một output layer, hidden layer có thể có hoặc không - Tìm hiểu bài toán tạo câu mô tả cho ảnh thời trang dùng học sâu

i.

mô hình mạng luôn có một input layer và một output layer, hidden layer có thể có hoặc không Xem tại trang 22 của tài liệu.
Hình 3.5: Cấu trục ANN cùng với các tham số. - Tìm hiểu bài toán tạo câu mô tả cho ảnh thời trang dùng học sâu

Hình 3.5.

Cấu trục ANN cùng với các tham số Xem tại trang 23 của tài liệu.
Hình 3.6: Learning rate của Gradient Descent. - Tìm hiểu bài toán tạo câu mô tả cho ảnh thời trang dùng học sâu

Hình 3.6.

Learning rate của Gradient Descent Xem tại trang 26 của tài liệu.
Hình 3.7: So sánh giữa BGD, MGD, SGD. - Tìm hiểu bài toán tạo câu mô tả cho ảnh thời trang dùng học sâu

Hình 3.7.

So sánh giữa BGD, MGD, SGD Xem tại trang 27 của tài liệu.
Hình 3.8: Recceptive field trong CNN. - Tìm hiểu bài toán tạo câu mô tả cho ảnh thời trang dùng học sâu

Hình 3.8.

Recceptive field trong CNN Xem tại trang 29 của tài liệu.
Để hiểu rõ hơn, ta xét ví dụ trong hình trên. Trong đó ma trận  - Tìm hiểu bài toán tạo câu mô tả cho ảnh thời trang dùng học sâu

hi.

ểu rõ hơn, ta xét ví dụ trong hình trên. Trong đó ma trận Xem tại trang 30 của tài liệu.
Hình 3.11: Pooling layer trong CNN. - Tìm hiểu bài toán tạo câu mô tả cho ảnh thời trang dùng học sâu

Hình 3.11.

Pooling layer trong CNN Xem tại trang 31 của tài liệu.
Hình 3.10: Padding và Stride. - Tìm hiểu bài toán tạo câu mô tả cho ảnh thời trang dùng học sâu

Hình 3.10.

Padding và Stride Xem tại trang 31 của tài liệu.
hợp (conv-pool) liên tiếp nhau càng về phía sau mô hình học được càng nhiều các đặc  tính  cao  cấp  của  dữ  liệu,  cụm  conv-pool  cuối  cùng  sẽ  được  chuyển  từ  ten-xơ  thành véc-tơ và được kết nối đầy đủ sau đó xử lí để đưa ra kết quả dự đoán mong  - Tìm hiểu bài toán tạo câu mô tả cho ảnh thời trang dùng học sâu

h.

ợp (conv-pool) liên tiếp nhau càng về phía sau mô hình học được càng nhiều các đặc tính cao cấp của dữ liệu, cụm conv-pool cuối cùng sẽ được chuyển từ ten-xơ thành véc-tơ và được kết nối đầy đủ sau đó xử lí để đưa ra kết quả dự đoán mong Xem tại trang 32 của tài liệu.
Mô hình trên mô tả phép triển khai nội dung của một RNN. Tương ứng với mỗi từ trong câu input thì sẽ có tương ứng số tầng nơ-ron - Tìm hiểu bài toán tạo câu mô tả cho ảnh thời trang dùng học sâu

h.

ình trên mô tả phép triển khai nội dung của một RNN. Tương ứng với mỗi từ trong câu input thì sẽ có tương ứng số tầng nơ-ron Xem tại trang 34 của tài liệu.
Hình 16: Cổng quên trong LSTM và công thức. - Tìm hiểu bài toán tạo câu mô tả cho ảnh thời trang dùng học sâu

Hình 16.

Cổng quên trong LSTM và công thức Xem tại trang 36 của tài liệu.
Hình 3.18: Tế bào trạng thái trong LSTM và công thức. - Tìm hiểu bài toán tạo câu mô tả cho ảnh thời trang dùng học sâu

Hình 3.18.

Tế bào trạng thái trong LSTM và công thức Xem tại trang 37 của tài liệu.
Hình 3.17: Cổng vào trong LSTM và công thức. - Tìm hiểu bài toán tạo câu mô tả cho ảnh thời trang dùng học sâu

Hình 3.17.

Cổng vào trong LSTM và công thức Xem tại trang 37 của tài liệu.
Hình 3.19: Cổng ra trong LSTM và công thức. - Tìm hiểu bài toán tạo câu mô tả cho ảnh thời trang dùng học sâu

Hình 3.19.

Cổng ra trong LSTM và công thức Xem tại trang 38 của tài liệu.
dụng làm bộ mã hoá – mã hoá hình ảnh thành các thông tin cần thiết, một mạng RNN làm bộ giải mã – giải mã các thông tin về hình ảnh thành câu mô tả và để thực hiện  cơ chế attention, một mô hình attention sẽ đảm nhận giao tiếp trung gian giữa CNN  và RNN - Tìm hiểu bài toán tạo câu mô tả cho ảnh thời trang dùng học sâu

d.

ụng làm bộ mã hoá – mã hoá hình ảnh thành các thông tin cần thiết, một mạng RNN làm bộ giải mã – giải mã các thông tin về hình ảnh thành câu mô tả và để thực hiện cơ chế attention, một mô hình attention sẽ đảm nhận giao tiếp trung gian giữa CNN và RNN Xem tại trang 40 của tài liệu.
Hình 4.2: Kiến trúc bộ giải mã. - Tìm hiểu bài toán tạo câu mô tả cho ảnh thời trang dùng học sâu

Hình 4.2.

Kiến trúc bộ giải mã Xem tại trang 42 của tài liệu.
Mô hình tổng thể SCA cho bài toán tạo câu mô tả ảnh thời trang như sau: - Tìm hiểu bài toán tạo câu mô tả cho ảnh thời trang dùng học sâu

h.

ình tổng thể SCA cho bài toán tạo câu mô tả ảnh thời trang như sau: Xem tại trang 43 của tài liệu.
HIỆN THỰC VÀ ĐÁNH GIÁ MÔ HÌNH - Tìm hiểu bài toán tạo câu mô tả cho ảnh thời trang dùng học sâu
HIỆN THỰC VÀ ĐÁNH GIÁ MÔ HÌNH Xem tại trang 48 của tài liệu.
Chương 5: Hiện thực và đánh giá mô hình - Tìm hiểu bài toán tạo câu mô tả cho ảnh thời trang dùng học sâu

h.

ương 5: Hiện thực và đánh giá mô hình Xem tại trang 48 của tài liệu.
Chương 5: Hiện thực và đánh giá mô hình - Tìm hiểu bài toán tạo câu mô tả cho ảnh thời trang dùng học sâu

h.

ương 5: Hiện thực và đánh giá mô hình Xem tại trang 49 của tài liệu.
Chương 5: Hiện thực và đánh giá mô hình - Tìm hiểu bài toán tạo câu mô tả cho ảnh thời trang dùng học sâu

h.

ương 5: Hiện thực và đánh giá mô hình Xem tại trang 51 của tài liệu.
Chương 5: Hiện thực và đánh giá mô hình - Tìm hiểu bài toán tạo câu mô tả cho ảnh thời trang dùng học sâu

h.

ương 5: Hiện thực và đánh giá mô hình Xem tại trang 52 của tài liệu.
Chương 5: Hiện thực và đánh giá mô hình - Tìm hiểu bài toán tạo câu mô tả cho ảnh thời trang dùng học sâu

h.

ương 5: Hiện thực và đánh giá mô hình Xem tại trang 53 của tài liệu.

Từ khóa liên quan

Mục lục

  • Page 1

Tài liệu cùng người dùng

Tài liệu liên quan