Mạng neuron là một tiếp cận tính toán mới liên quan đến việc phái triển các cấu trúc toán học với khả năng học. Các phương pháp là kết quả của việc nghiên cứu mô hình học của hệ thống thần kinh COI1 người. Mạng neuron có thể đưa ra ý nghĩa từ các dữ liệu phức tạp hoặc không chính xác và có thể dược sử dụng dể chiết xuất các
m ẫ u v à p h á t h iệ n ra c á c xu h ư ớ n g q u á p h ứ c tạp m à COI1 n g ư ờ i c ũ n g như c á c k ỹ thuật
máy tính khác không thể phát hiện được.
Khi đề cập đến khai thác dữ liệu người ta thường dề cập nhiều đến mạng neuron. Tuy mạng neuron có một số hạn chế gây khó khăn liong việc áp dụng và triển khai nhưng nó cũng có những ưu điểm đáng kể. Một trong số những ưu điểm phải kể đến của mạng neuron là khả năng tạo ra các mô hình dự đoán có độ chính xác cao, có thể áp dụng được cho lất nhiều các loại bài toán khác nhau dáp ứng dược các nhiệm vự đặt ra của khai phá dữ liệu như phân lớp, phân nhóm, mô hình hóa, dự báo các sự kiện phụ thuộc vào thời gian, v.v.
ỉ ỉ ì n h 3-1. Sơ tlổ quá n in h khai thác dữ liệu báng m ạ ng neuron
Mẫu chiết xuất bằng mạng neuron dược thể hiện ớ các nút dầu ra cúa mạng. Mạng neuron sử dụng các hàm số chứ không sử dụng các hàm biểu tirựng (Symbol function) để tính mức lích cực của các nút đầu ra và cập nhật các Irọng số của nó. Với tập dữ liệu khách hàng vay vốn ngàn hàng, ta c ó bài toán phân lớp áp dụng m ạng neuron sẽ cho kếl quả là mẫu chiết xuất dược như trên hình 3.2 [ 10].
Hì nh 3-2. Mầu két quả với kỹ ihuậi mạng neuron
Đặc điểm của mạng neuron là không cần gia công dữ liệu nhiều irước khi bắt đầu quá trình học như các phương pháp khác. Tuy nhiên, dể có thể sử dụng mạng neuron có hiệu quả cần phải xác định các yếu tỏ khi thiết kế mạng như: mô hình mạng là gì? mạng cần có bao nhiêu nút? khi náo thì việc học dừng dể uáiili bị “hục quá”? v.v.
Ngoài ra còn rất nhiều bước quan trọng cẩn phải làm để tiền xử lý dữ liệu trước khi đưa vào mạng neuron để mạng có thể hiểu được (ví dụ như việc chuẩn hóa dữ liệu, dưa tất cả các tiêu chuẩn dự đoán về dạng số).
Ưu điểm của mạng neuron trong khai phá dữ liệu:
Mạng neuron có khả năng mô hình hoá những dữ liệu phức lạp và nhiều chiều. Khi dữ liệu tãng lên, vấn đề của bài toán cũng tăng lên gây khó khăn cho việc giải quyết và thậm chí không giải quyết dược. Đây là hạn chế của lất nhiều các kỹ thuật truyền thống như kiểm tra bằng tay hay các plnrưng pháp thông kê. nhúng đối với mạng neuron thì không gặp phải tình trạng này.
Mạng neuron được đóng gói thành một giải pháp hoàn chỉnh. Điểu này cho phép mạng neuron được chuẩn bị kỹ càng cho một ứng dựng. Khi mạng đã được áp dụng thành công, nó có thể sử dụng lâu dài mà không cẩn phải hiểu mạng neuron làm việc như thế nào.
Mạng neuron dược dóng gói với những thông tin trợ giúp của các chuyên gia đáng tin cậy và được các chuyên gia đảm bảo các mô hình này làm việc tốt.
Mặc dù có rất nhiều kỹ thuật và giải thuật được sử dụng trong khai phá dữ liệu, một số còn được kết hợp để có thể sử dụng một cách có hiệu quả, mạng neuron vẫn đưa ra những ưu điểm đáng chú ý như:
• Tự động tìm kiếm lất cả các mối quan hệ có thể giữa các nhân tố chính.
• Mô hình hóa tự động các bài toán phức tạp mà không cần biết trước mức độ phức tạp.
• Có khả năng chiết xuất ra những thông tin nhanh hơn rất nhiều so với rất nhiều các công cụ khác.