Chương 2. KHAI PHÁ DỮ LIỆU VÀ PHÁT HIỆN TRI THỨC
2.2. Mô hình mạng nơron nhân tạo
Nghiên cứu và mô phỏng trí não, cụ thể là tế bào thần kinh (nơron) là ước muốn từ lâu của nhân loại. Từ mơ ước đó, các nhà khoa học đã không ngừng nghiên cứu và tìm hiểu về mạng nơron. Với khoảng 15 tỷ nơron của não người, mỗi nơron có thể nhận hàng vạn tín hiệu từ các khớp thần kinh và được coi là một cơ chế sinh vật phức tạp nhất. Não người có khả năng giải quyết những vấn đề như: nghe, nhìn, nói, hồi ức thông tin, phân biệt các mẫu mặc dù sự kiện có bị méo mó, thiếu hụt…
Não thực hiện những nhiệm vụ như vậy nhờ các phần tử tính toán là nơron. Não phân bố việc xử lý cho hàng tỷ nơron có liên quan, điều khiển các mối liên hệ giữa các nơron đó. Nơron không ngừng nhận và truyền thông tin lẫn nhau. Các nơron tự liên kết với nhau thành mạng trong xử lý. Mỗi mạng gồm hàng vạn các phần tử nơron khác nhau. Mỗi phần tử nơron có khả năng liên kết với hàng nghìn các nơron khác. Lý thuyết về mạng nơron đã hình thành từ những năm 40 của thế kỷ trước và đang phát triển, đặc biệt là nghiên cứu ứng dụng chúng.
Mô hình mạng nơron nhân tạo (ANN - Artificial Neural Network) bắt chước theo cách học của hệ thần kinh sinh vật. Có nhiều ứng dụng của mạng nơron đã được áp dụng trong thực tế và mang lại những hiệu quả tốt như ứng dụng mạng nơron trong chế tạo các mạch điện tử thông minh, xây dựng hệ chuyên gia y học, ứng dụng nhận dạng và phân loại các sản phẩm... cùng với trí tuệ nhân tạo, mạng nơron thực sự trở thành lĩnh vực nghiên cứu quan trọng trong việc phát triển các ứng dụng có giá trị thực tiễn.
Hình 2-4: Mạng nơron nhân tạo
Khi đề cập đến khai phá dữ liệu, người ta thường đề cập nhiều đến mạng nơron. Tuy mạng nơron có một số hạn chế gây khó khăn trong việc áp dụng và triển khai nhưng nó cũng có những ưu điểm đáng kể. Một trong số những ưu điểm phải kể đến của mạng nơron là khả năng tạo ra các mô hình dự đoán có độ chính xác cao, lại có tính mềm dẻo, có thể áp dụng được cho rất nhiều loại bài toán khác nhau, đáp ứng được nhiệm vụ đặt ra của khai phá dữ liệu như phân lớp, phân nhóm, mô hình hóa, dự báo các sự kiện phụ thuộc vào thời gian, v.v…
Hình 2-5: Sơ đồ quá trình khai phá dữ liệu bằng mạng nơron
Mẫu chiết xuất bằng mạng nơron được thể hiện ở các nút đầu ra của mạng.
Mạng nơron sử dụng các hàm số chứ không sử dụng các hàm biểu tượng để tính mức tích cực của các nút đầu ra và cập nhật các trọng số của nó. Trong mạng lan truyền ngược, mỗi nút khái niệm được kết hợp với một ngưỡng, vì vậy trong mạng lan truyền ngược, các mẫu (hay các luật) của một khái niệm là sự kết hợp của các trọng số lớn hơn ngưỡng. Với tập dữ liệu khách hàng vay vốn ngân hàng, ta có bài toán phân lớp áp dụng mạng nơron sẽ cho kết quả là mẫu chiết xuất được như trên
Input
Output Hidden
Dữ liệu Mô hình mạng nơron Mẫu chiết xuất được
Hình 2-6: Mẫu kết quả với kỹ thuật mạng nơron
Đặc điểm của mạng nơron là không cần gia công dữ liệu nhiều trước khi bắt đầu quá trình học như các phương pháp khác. Tuy nhiên, để có thể sử dụng mạng nơron có hiệu quả cũng cần phải xác định các yếu tố khi thiết kế mạng như:
- Mô hình mạng là gì?
- Mạng cần có bao nhiêu nút?
- Khi nào việc học dừng để tránh “học quá”?
- ...
Ngoài ra, còn nhiều bước quan trọng cần phải làm để tiền xử lý dữ liệu trước khi đưa vào mạng nơron để mạng có thể hiểu được (ví dụ như việc chuẩn hóa dữ liệu, đưa tất cả tiêu chuẩn dự đoán về dạng số…).
Mạng nơron được đóng gói với những thông tin trợ giúp của các chuyên gia đáng tin cậy và được các chuyên gia đảm bảo các mô hình này làm việc tốt. Sau khi học, mạng có thể được coi là một chuyên gia trong lĩnh vực thông tin mà nó vừa được học.
Các bài toán thường được áp dụng với mạng nơron là:
- Bài toán phân loại (classification): quyết định một giá trị đưa vào thuộc loại hay nhóm nào.
- Bài toán nhận dạng mẫu (pattern recognition): nhận dạng cấu trúc trong các dữ liệu có thể là bị nhiễu.
- Bài toán dự đoán (prediction): dự đoán giá trị dựa vào các giá trị cho trước.
- Bài toán tối ưu (optimization): tìm một tổ chức ràng buộc tốt nhất.
- Bài toán lọc nhiễu (Noise filtering): phân biệt các tín hiệu với nền, tìm ra các thành phần không quan trọng trong một tín hiệu.
Thu nhập ≥ t
Nợ
Cho vay