Các mơ hình học sâu

Một phần của tài liệu XÂY DỰNG ỨNG DỤNG NHẬN DẠNG TIẾNG nói TIẾNG VIỆT BẰNG PHƢƠNG PHÁP học sâu (Trang 40 - 43)

2.

2.2 Học sâu – DeepLearning

2.2.2. Các mơ hình học sâu

Mạng nơ ron hồi quy (Recurrent Neural Network)

Mạng nơ ron hồi quy ra đời với ý tƣởng chính là sử dụng một bộ nhớ để lƣu lại thông tin từ những bƣớc tính tốn xử lý trƣớc để dựa vào nó có thể đƣa ra dự đốn chính xác nhất cho bƣớc dự đoán hiện tại.

Trong các mạng nơ-ron truyền thống tất cả các đầu vào và cả đầu ra là độc lập với nhau. Tức là chúng không liên kết thành chuỗi với nhau. Nhƣng các mơ hình này khơng phù hợp trong rất nhiều bài tốn.

Ví dụ, nếu muốn đốn từ tiếp theo có thể xuất hiện trong một câu thì ta cần biết các từ trƣớc đó xuất hiện lần lƣợt nhƣ thế nào? RNN đƣợc gọi là hồi quy bởi lẽ chúng thực hiện cùng một tác vụ cho tất cả các phần tử của một chuỗi với đầu ra phụ thuộc vào cả các phép tính trƣớc đó. Nói cách khác, RNN có khả năng nhớ các thơng tin đƣợc tính tốn trƣớc đó.

CHƢƠNG 2: CƠ SỞ LÝ THUYẾT VÀ CÁC NGHIÊN CỨU CÓ LIÊN QUAN

Mạng nơ ron tích chập

Mạng nơ ron tích chập (CNNs -Convolutional Neural Network) là một trong những mơ hình học sâu tiên tiến. Nó giúp xây dựng đƣợc những hệ thống thông minh với độ chính xác cao nhƣ hiện nay. Nhƣ hệ thống xử lý ảnh lớn nhƣ Facebook, Google hay Amazon đã đƣa vào sản phẩm của mình những chức năng thông minh nhƣ nhận diện khuôn mặt ngƣời dùng, phát triển xe hơi tự lái hay drone giao hàng tự động. CNN đƣợc sử dụng nhiều trong các bài toán nhận dạng các object trong ảnh.

Mạng nơ ron tích chập gồm nhiều lớp tích chập chồng lên nhau, sử dụng các hàm tanh hay Relu để kích hoạt các trọng số. Mỗi lớp sau khi kích hoạt sẽ cho ra kết quả trừu tƣợng cho các lớp tiếp theo. Mỗi Layer kế tiếp chính là thể hiện kết quả của Layer trƣớc đó.

Thơng qua q trình huấn luyện, các lớp Layer của mạng CNN sẽ tự động học các giá trị đƣợc thể hiện qua các lớp filter.

Mạng nơ ron học sâu tăng cƣờng

Deep Learning có thể hiểu là loại Machine Learning với "mạng thần kinh - Neural Networks" sâu có thể xử lý dữ liệu theo cách tƣơng tự nhƣ một bộ não con ngƣời có thể thực hiện.

Điểm khác biệt chính ở đây là con ngƣời khơng sẽ phải dạy một chƣơng trình Deep Learning biết một con mèo trơng nhƣ thế nào, mà chỉ cần cung cấp cho nó đủ hình ảnh cần thiết về lồi mèo, và nó sẽ tự mình hình dung, tự học. Các bƣớc cần làm nhƣ sau:

 Cung cấp cho máy rất nhiều ảnh về mèo.

 Thuật toán sẽ kiểm tra ảnh để xem các đặc điểm, chi tiết chung giữa các bức ảnh.

CHƢƠNG 2: CƠ SỞ LÝ THUYẾT VÀ CÁC NGHIÊN CỨU CÓ LIÊN QUAN

 Mỗi bức ảnh sẽ đƣợc giải mã chi tiết dƣới nhiều cấp độ, từ các hình dạng lớn, chung đến các ô nhỏ và nhỏ hơn nữa. Nếu một hình dạng hoặc các đƣờng đƣợc lặp lại nhiều lần, thuật tốn sẽ gắn nhãn nó nhƣ là một đặc tính quan trọng.

 Sau khi phân tích đủ hình ảnh cần thiết, thuật tốn giờ đây sẽ biết đƣợc các mẫu nào cung cấp bằng chứng rõ ràng nhất về mèo và tất cả những gì con ngƣời phải làm chỉ là cung cấp các dữ liệu thơ.

Nhìn chung Deep learning là loại machine learning mà trong đó máy tự đào tạo chính nó. Deep learning địi hỏi rất nhiều dữ liệu đầu vào và sức mạnh tính tốn hơn là machine learning, nhƣng nó đã bắt đầu đƣợc triển khai bởi các công ty cơng nghệ lớn nhƣ Facebook, Amazon. Trong đó, một trong những cái tên nổi tiếng nhất về machine learning là AlphaGo, một máy tính có thể chơi cờ vây với chính bản thân nó cho đến khi nó có thể dự đốn những đƣờng đi nƣớc bƣớc chính xác nhất đủ để đánh bại nhiều nhà vô địch trên thế giới.

CHƢƠNG 2: CƠ SỞ LÝ THUYẾT VÀ CÁC NGHIÊN CỨU CÓ LIÊN QUAN

Một phần của tài liệu XÂY DỰNG ỨNG DỤNG NHẬN DẠNG TIẾNG nói TIẾNG VIỆT BẰNG PHƢƠNG PHÁP học sâu (Trang 40 - 43)

Tải bản đầy đủ (PDF)

(89 trang)