Khái niệm máy học

Một phần của tài liệu Nghiên cứu và phát triển phương pháp rút gọn câu tiếng việt dựa trên phương pháp học không giám sát (Trang 25 - 26)

Từ những năm 90, khi máy học được đưa vào ứng dụng, các nghiên cứu ra đời kết hợp với trào lưu của máy học, có thể khẳng định rằng máy học đã mang lại những hiệu quả to lớn so với các phương pháp trước. Đặc biệt trong những vấn đề trích rút ra tri thức từ dữ liệu.

Định nghĩa 2.1 [Máy học (Machine Learning)]

Máy học là một chương trình máy tính cho phép tối ưu hiệu năng công việc thông qua sử dụng dữ liệu mẫu hoặc các kinh nghiệm từ quá khứ [29].

Học được sử dụng khi thiếu chuyên gia con người, hay con người gặp khó khăn khi giải thích một vấn đề nào đó, hoặc để giải quyết các vấn đề thay đổi theo thời gian hay cần thiết phải giải quyết được thích ứng với những trường hợp đặc biệt. Máy học được ứng dụng trong nhiều ngành khoa học khác nhau, đặc biệt những lĩnh vực cần phân tích dữ liệu lớn như xử lý ngôn ngữ tự nhiên (Natural Language Processing), Nhận dạng mặt người (Face Recognition), chẩn đoán bệnh, công nghiệp người máy,...

Học có thể coi như là quá trình tìm một hàm ánh xạ từ X sang Y, trong đó X là đầu vào và Y là đầu ra mong muốn. Học được chia thành ba kỹ thuật

chính: Học có giám sát (supervised learning), không giám sát (unsupervised learning) và học tăng cường (reinforcement learning):

- Học có giám sát: Giả sử có một tập mẫu huấn luyện dưới dạng các cặp (đặc trưng, nhãn) {(x1, y1), . . . , (xn, yn)}. Vấn đề của học giám sát là xác định nhãn y của một đầu vào đặc trưng x bất kỳ. Các mô hình học giám sát điển hình: cây quyết định, mạng noron, mô hình Markov ẩn, mạng Bayes, SVM (Support Vector Machines),…Học giám sát được ứng dụng nhiều trong các bài toán phân loại, nhận dạng mẫu,…

- Học không giám sát: Trong học không giám sát, chỉ có một tập các đặc trưng đầu vào {x1, x2 . . . , xn} nhưng không có nhãn đầu ra tương ứng. Vấn đề đặt ra là đưa ra một cách thức, cơ chế tổ chức các đặc trưng đầu vào. Điển hình của học không giám sát là phân cụm. Ưu điểm của học không giám sát là kho dữ liệu huấn luyện không cần quá lớn. Học không giám sát được ứng dụng trong các bài toán phân cụm, dự báo,...

- Học tăng cƣờng: Hệ thống học quan sát môi trường x, thực hiện hành động a và nhận được giá trị r. Mục đích là chọn hành động để nhận được giá trị r tốt nhất trong tương lai.

Một phần của tài liệu Nghiên cứu và phát triển phương pháp rút gọn câu tiếng việt dựa trên phương pháp học không giám sát (Trang 25 - 26)