5. Phương pháp nghiên cứu
2.3.2 Liên quan học máy với khai thác dữ liệu và trí tuệ nhân tạo
Trong thực tế, ba môn học này có sự đan xen và chồng chéo nhau mạnh. Ba lĩnh vực này có mối quan hệ cộng sinh và sự kết hợp của các phương pháp này có thể được sử dụng như một chiến thuật để tạo ra các thông số hiệu quả và nhạy cảm hơn.
Khai thác dữ liệu về cơ bản là diễn giải bất kỳ loại dữ liệu nào, nhưng nó tạo nền tảng cho cả trí tuệ nhân tạo và học máy. Trong thực tế, nó không chỉ lấy mẫu thông tin từ nhiều nguồn khác nhau mà nó còn phân tích và nhận ra mô hình và mối tương quan tồn tại trong những thông tin khó có thể diễn giải bằng tay. Do đó, khai thác dữ liệu không phải là một phương pháp đơn thuần để chứng minh một giả thuyết mà là phương pháp để đưa ra các giả thuyết có liên quan. Dữ liệu được khai thác và các mẫu và giả thuyết tương ứng có thể được sử dụng làm cơ sở cho cả máy học và trí tuệ nhân tạo.
Trí tuệ nhân tạo có thể được định nghĩa rộng rãi là những cỗ máy có khả năng tự giải quyết một vấn đề nhất định mà không cần sự can thiệp của con người. Các giải pháp không được lập trình trực tiếp vào hệ thống mà là dữ liệu cần thiết và AI diễn giải rằng dữ liệu đó tự tạo ra một giải pháp.
Học máy sẽ thúc đẩy cách tiếp cận đến cấp độ nâng cao bằng cách cung cấp dữ liệu cần thiết cho máy để đào tạo và sửa đổi phù hợp khi tiếp xúc với dữ liệu mới. Điều này được biết đến như là “đào tạo”. Nó tập trung vào việc thu thập thông tin từ các dữ liệu lớn đáng kể, sau đó phát hiện và xác định các mẫu cơ bản bằng các biện pháp thống kê khác nhau để cải thiện khả năng diễn giải dữ liệu mới và tạo ra kết quả hiệu quả hơn. Một số tham số nên được điều chỉnh bởi mức độ phù hợp thế nào để có năng suất tốt hơn.
Học máy là chỗ đứng của trí tuệ nhân tạo. Không thể thiết kế bất kỳ máy nào có khả năng liên quan đến trí thông minh, như ngôn ngữ hoặc quan sát (vision), để đạt được điều đó ngay lập tức. Nhiệm vụ đó gần như không thể giải quyết. Hơn nữa, một hệ thống không thể được coi là hoàn toàn thông minh nếu nó thiếu khả năng học hỏi và cải thiện qua các lần tiếp xúc trước đó.
Các dữ liệu sử dụng trong học máy có thể là gán nhãn hoặc không. Các thuật toán ML cũng có thể liên kết. Vấn đề bảo mật dữ liệu và bảo toàn tính riêng tư dữ liệu cũng phải được quan tâm trong học máy.