1.4 Một số tiếp cận phổ biến hiện nay
Dựa trên một báo cáo của tổ chức nghiên cứu và phát triển phần mềm
altexsoft[6], chúng tôi chỉ tổng hợp, giới thiệu một cách khái qt để bạn đọc có
cái nhìn tổng quan và sẽ khơng đi sâu vào cụ thể từng phương pháp.
K-Nearest Neighbors
K-Nearest Neighbors (KNN) là giải thuật học có giám sát khá đơn giản. Nó sẽ phân loại dữ liệu mới dựa vào K điểm dữ liệu gần nhất trong tập huấn luyện. Nhãn đấy sẽ được quyết định dựa vào việc bầu chọn theo đa số trong K điểm đấy. Và KNN là một trong số những giải thuật được sử dụng thông thường.
Mạng nơ-ron và mạng nơ-ron sâu
Mạng nơ-ron hay mạng nơ-ron sâu là những mơ hình q phổ biến ở thời điểm hiện tại và được sử dụng vô cùng rộng rãi. Mạng nơ-ron là mơ hình cho phép xác định mối quan hệ phi tuyến giữa đầu vào và đầu ra. Cấu trúc của mơ hình dựa trên các nguyên tắc gần giống với nguyên tắc hoạt động của các tế bào thần kinh con người. Mơ hình được xây dựng dựa trên tập dữ liệu đầu vào đã được gắn nhãn đi qua một số lớp hay nói cách khác chính là các hàm tốn học. Mạng nơ-ron thường chỉ gồm một hoặc hai lớp ẩn (hidden layer). Cấu trúc của mạng nơ-ron như hình bên dưới.
1.4. Một số tiếp cận phổ biến hiện nay
Hình 1.2: Mạng nơ-ron đơn giản [6]
Mạng nơ-ron sâu hoạt động như mạng nơ-ron nhưng số lớp ẩn là nhiều hơn một. Với mơ hình này, độ chính xác có thể tăng lên và hiển nhiên là mơ hình cần một tài nguyên lớn cho việc tính tốn cũng như thời gian xử lý.
Support Vector Machine
Support Vector Machine là giải thuật học có giám sát rất phổ biến về độ sử dụng rộng rãi của nó. Giải thuật được sử dụng trong bài toán phân loại hai lớp. Cụ thể về cơ sở lý thuyết của giải thuật sẽ được trình bày ở dưới. Và đây cũng chính là hướng tiếp cận được áp dụng trực tiếp trong đề tài này.