CHƯƠNG I GIỚI THIỆU TRÍ TUỆ NHÂN TẠO
1.4. Thuật toán sử dụng trong hàm
Các thuật tốn học có giám sát cịn được phân ra thành hai loại chính là phân lớp (Classification) và hồi quy (Regression).
- Phân lớp
Một bài toán được gọi là phân lớp nếu các nhãn của dữ liệu đầu vào được chia thành một số hữu hạn lớp (miền giá trị là rời rạc). Chẳng hạn như tính năng xác định xem một email có phải là spam hay khơng của Gmail; xác định xem hình ảnh của con vật là chó hay mèo. Hoặc ví dụ nhận dạng ký số viết tay ở trên cũng thuộc bài toán phân lớp, bao gồm mười lớp ứng với các số từ 0 đến 9. Tương tự cho ví dụ nhận dạng khn mặt với hai lớp là phải và khơng phải khn mặt, …
Một bài tốn được xem là hồi quy nếu nhãn không được chia thành các nhóm mà là một giá trị thực cụ thể (miền giá trị là liên tục). Hầu hết các bài toán dự báo (giá cổ phiếu, giá nhà, …) thường được xếp vào bài tốn hồi quy. Ví như, nếu một căn nhà rộng 150 m2, có 7 phịng và cách trung tâm thành phố 10 km sẽ có giá là bao nhiêu? Lúc này kết quả dự đoán sẽ là một số thực.
Nếu như phát hiện khn mặt là bài tốn phân lớp thì dự đốn tuổi là bài tốn hồi quy. Tuy nhiên dự đốn tuổi cũng có thể coi là phân lớp nếu ta cho tuổi là một số nguyên dương N và khi đó ta sẽ có N lớp khác nhau tính từ 1. Một số thuật tốn nổi tiếng thuộc về nhóm học có giám sát như: [7]
Phân lớp: k-Nearest Neighbors, mạng nơron nhân tạo, SVM, … Hồi quy: Linear Regression, Logistic Regression, …
- Thuật toán mạng Nơron nhân tạo
Hình 1.8: Thuật tốn Nơron nhân tạo
Mạng nơron nhân tạo là các mơ hình được lấy cảm hứng từ cấu trúc và chức năng của mạng lưới thần kinh sinh học. Hình 1.8 minh hoạ cho một mạng truyền thẳng. Nhóm thuật tốn này có thể được sử dụng cho bài tốn phân lớp và hồi quy với rất nhiều biến thể khác nhau cho hầu hết các vấn đề. Tuy nhiên, trong bài viết này chỉ trình bày các thuật tốn cổ điển và phổ biến nhất: [7]
Các thuật toán mạng thần kinh nhân tạo phổ biến nhất là: Perceptron
Back-Propagation Hopfield Network
- Thuật toán dạng Deep Learning.
Thực chất Deep Learning là một bản cập nhật hiện đại cho Artificial Neural Networks nhằm khai thác khả năng tính tốn của máy tính, tuy nhiên vì sự phát triển lớn mạnh của chúng nên mình tách ra thành một nhóm riêng.
Deep Learning quan tâm đến việc xây dựng các mạng thần kinh lớn hơn, phức tạp hơn nhiều, và làm sao để khai thác hiệu quả các bộ dữ liệu lớn chứa rất ít dữ liệu đã được gán nhãn. Hình 1.9 minh hoạ cho ý tưởng của Deep Learning.
Hình 1.9: Thuật toán học sâu
Phương pháp Deep Learning là một bản cập nhật hiện đại cho Mạng nơron nhân tạo.
Các dạng thuật toán Deep Learning phổ biến nhất là: Deep Boltzmann Machine (DBM).
Deep Belief Networks (DBN).
Convolutional Neural Network (mạng thần kinh CNN). Stacked Auto-Encoders.
- Thuật tốn giảm kích thước trong hàm
Giống như các phương pháp phân cụm, giảm khơng gian tìm kiếm và khai thác cấu trúc vốn có trong dữ liệu nhưng theo cách khơng giám sát hoặc để tóm tắt hay mơ tả dữ liệu sử dụng ít thơng tin hơn là mục tiêu của nhóm phương pháp này. Hình 1.10 minh hoạ cho việc giảm chiều dữ liệu.
Điều này có thể hữu ích để trực quan hóa dữ liệu hoặc đơn giản hóa dữ liệu mà sau đó có thể được sử dụng trong phương pháp học có giám sát. Nhiều trong số
các phương pháp này có thể được điều chỉnh để sử dụng trong phân lớp và hồi quy. [8].
Hình 1.10: Thuật tốn giảm kích thước
Một số phương pháp áp dụng để phân loại và hồi quy như:
Principal Component Analysis (PCA Phân tích thành phần chính). Principal Component Regression (PCR).
Partial Least Squares Regression (Dạng hồi quy). Sammon Mapping.
Multidimensional Scaling (MDS). Projection Pursuit.
Linear Discriminant Analysis (LDA). Mixture Discriminant Analysis (MDA). Quadratic Discriminant Analysis (QDA). Flexible Discriminant Analysis (FDA). - Dạng Thuật toán tập hợp.
Ensemble Methods là những phương pháp kết hợp các mơ hình yếu hơn được huấn luyện độc lập và phần dự đoán của chúng sẽ được kết hợp theo một cách nào đó để đưa ra dự đốn tổng thể như minh họa ở Hình 1.11 [6]
Hình 1.11: Thuật tốn tổng hợp
Một số dạng thuật toán phổ biến như: Boosting.
Bootstrapped Aggregation (Bagging). AdaBoost.
Stacked Generalization (blending). Gradient Boosting Machines (GBM).
Gradient Boosted Regression Trees (GBRT). Random Forest.