1. Trang chủ
  2. » Luận Văn - Báo Cáo

Báo Cáo Seminar Nhập Môn Trí Tuệ Nhân Tạo Đề Tài Tìm Hiểu Về Mô Hình Long Short-Term Memory.pptx

18 1 0
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Trang 1

BÁO CÁO SEMINAR NHẬP MÔN TRÍ TUỆ NHÂN TẠO

SHORT-TERM MEMORY

BÁO CÁO NHÓM 7

GVHD:Nguyễn Thái Công Nghĩa

Trang 2

Thành viên nhóm 7

MSSVHọ và tên

19200080Nguyễn Nhựt Hào19200111Nguyễn Quốc Khánh19200268Nguyễn Thành Đạt19200276Trần Trung Dũng

19200491Phạm Hồng Lâm Thành20200011Tô Thế Bảo

20200063Đỗ Nhật Phát

Trang 3

1.GIỚI THIỆU VỀ LSTM

LSTM (Long Short-Term Memory) là một loại mạng nơ-ron đặc biệt của RNN (Recurrent Neural

Network), được giới thiệu bởi Hochreiter &

Schmidhuber (1997) LSTM có khả năng học và ghi nhớ các phụ thuộc dài hạn, giúp nó trở nên hiệu quả trong việc xử lý các chuỗi dữ liệu dài mà RNN truyền thống gặp khó khăn.

Trang 4

2.CẤU TRÚC MÔ HÌNH LSTM

Mô hình LSTM bao gồm bốn mạng nơ-ron và nhiều khối bộ nhớ gọi là tế bào (cell) trong cấu trúc chuỗi Mỗi đơn vị LSTM có ba cổng chính: cổng đầu vào (Input Gate), cổng đầu ra (Output Gate), và cổng quên (Forget Gate) Các cổng này điều khiển luồng thông tin ra vào các tế bào.

Trang 5

Hình 1 Gates in LSTM

-Ở sơ đồ trên, mỗi một đường mang một véc-tơ từ đầu ra của một nút tới đầu vào của một nút khác Các hình trong màu hồng biểu diễn các phép toán như phép cộng véc-tơ chẳng hạn, còn các ô màu vàng được sử dụng để học trong các từng mạng nơ-ron Các đường hợp nhau kí hiệu việc kết hợp, còn các đường rẽ nhánh ám chỉ nội dung của nó được sao chép và chuyển tới các nơi khác nhau.

Trang 6

3.SƠ LƯỢC THUẬT TOÁN TRONG LSTM

Trạng thái tế bào (Cell State) là yếu tố cốt lõi của LSTM, chạy xuyên suốt qua các mắt xích và chỉ bị thay đổi đôi chút Các cổng (gates) trong LSTM

quyết định thông tin nào cần giữ lại hoặc bỏ đi, giúp duy trì trạng thái của tế bào.

Trang 7

3.SƠ LƯỢC THUẬT TOÁN TRONG LSTM

Trạng thái tế bào (Cell State) là yếu tố cốt lõi của LSTM, chạy xuyên suốt qua các mắt xích và chỉ bị thay đổi đôi chút Các cổng (gates) trong LSTM

quyết định thông tin nào cần giữ lại hoặc bỏ đi, giúp duy trì trạng thái của tế bào.

Trang 8

3.SƠ LƯỢC THUẬT TOÁN TRONG LSTM

Các cổng là nơi sàng lọc thông tin đi qua nó, chúng được kết hợp bởi một tầng mạng

sigmoid và một phép nhân

Tầng sigmoid sẽ cho đầu ra là một số trong khoản [0,1][0,1], mô tả có bao nhiêu thông tin có thể được thông qua Khi đầu ra là 00 thì có nghĩa là không cho thông tin nào qua cả, còn khi là 11 thì có nghĩa là cho tất cả các thông tin đi qua nó.

Trang 9

4.HOẠT ĐỘNG CỦA LSTM

Các bước hoạt động của LSTM bao gồm:

1.Quyết định thông tin nào cần bỏ qua từ trạng thái tế bào hiện tại thông qua cổng quên.

2.Xác định thông tin mới cần thêm vào trạng thái tế bào qua cổng đầu vào.

3.Cập nhật trạng thái tế bào.

4.Quyết định đầu ra dựa trên trạng thái tế bào và thông tin mới qua cổng đầu ra.

Trang 10

4.HOẠT ĐỘNG LSTM

Bước đầu tiên của LSTM là quyết định xem thông tin nào cần bỏ đi từ trạng thái tế bào Quyết định này được đưa ra bởi tầng sigmoid - gọi là “tầng cổng quên” (forget gate layer) Nó sẽ lấy đầu vào là ℎt-1  và xt  rồi đưa ra kết quả là

một số trong khoảng [0,1]] cho mỗi số trong trạng thái tế bào Ct−1 Đẩu ra

là 1 thể hiện rằng nó giữ toàn bộ thông tin lại, còn 0 chỉ rằng toàn bộ thông tin sẽ bị bỏ đi.

Trang 11

4.HOẠT ĐỘNG LSTM

Bước tiếp theo là quyết định xem thông tin mới nào ta sẽ lưu vào trạng thái tế bào Việc này gồm 2 phần Đầu tiên là sử dụng một tầng sigmoid được gọi là

“tầng cổng vào” (input gate layer) để quyết định giá

trị nào ta sẽ cập nhập Tiếp theo là một tầng tanh tạo

ra một véc-tơ cho giá trị mới  nhằm thêm vào cho trạng thái Trong bước tiếp theo, ta sẽ kết hợp 2 giá trị đó lại để tạo ra một cập nhập cho trạng thái.

 

Trang 12

Ta sẽ nhân trạng thái cũ với ft  để bỏ đi những thông

tin ta quyết định quên lúc trước Sau đó cộng thêm it

*  Trạng thái mới thu được này phụ thuộc vào việc ta quyết định cập nhập mỗi giá trị trạng thái ra sao.

 

Trang 13

4.HOẠT ĐỘNG LSTM

Cuối cùng, ta cần quyết định xem ta muốn đầu ra là gì Giá trị đầu ra sẽ dựa vào trạng thái tế bào, nhưng sẽ được tiếp tục sàng lọc Đầu tiên, ta chạy một tầng sigmoid để quyết định phần nào của trạng thái tế bào ta muốn xuất ra Sau đó, ta đưa nó trạng thái tế

bảo qua một hàm tanh để có giá trị nó về

khoảng [−1,1], và nhân nó với đầu ra của cổng sigmoid để được giá trị đầu ra ta mong muốn.

Trang 15

6.LỢI ÍCH VÀ THÁCH THỨC •Lợi ích:

1.Quản lý phụ thuộc dài hạn tốt hơn.

2.Hiệu quả hơn RNN thông thường.

3.Độ chính xác cao trong dự đoán.

Trang 16

6.LỢI ÍCH VÀ THÁCH THỨC

Thách thức:

1.Dễ bị trang bị quá mức (overfitting).

2.Đòi hỏi nhiều sức mạnh tính toán và bộ nhớ.

3.Khó khăn trong đào tạo do phức tạp của mô hình.

Trang 17

7.KẾT LUẬN

LSTM là một kiến trúc mạng nơ-ron mạnh mẽ cho các bài toán chuỗi thời gian và xử lý dữ liệu tuần tự Tuy nhiên, việc đào tạo và triển khai LSTM đòi hỏi nhiều tài nguyên và cân nhắc kỹ lưỡng.

Trang 18

TÀI LIỆU THAM KHẢO

"Long Short-Term Memory“

Christopher Olah

Ngày đăng: 29/06/2024, 15:52

Xem thêm:

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w