BÀI TỐN NHẬN DẠNG TRÁI DỨA CHÍN ÁP DỤNG MẠNG NƠ RON TÍCH CHẬP
2.1.1. Giới thiệu về mạng nơ-ron nhân tạo
Bộ não con người chứa khoảng 1011 các phần tử (được gọi là nơron) liên kết chặt chẽ với nhau. Đối với mỗi nơron, có khoảng 104 liên kết với các nơron khác. Một nơron được cấu tạo bởi các thành phần như tế bào hình cây, tế bào thân và sợi trục thần kinh (axon). Tế bào hình cây có nhiệm vụ mang các tín hiệu điện tới tế bào thân, tế bào thân sẽ thực hiện gộp (sum) và phân ngưỡng các tín hiệu đến. Sợi trục thần kinh làm nhiệm vụ đưa tín hiệu từ tế bào thân tới tế bào hình cây của các nơ-ron liên kết.
Hình 2.1: Nơ-ron sinh học
Điểm tiếp xúc giữa một sợi trục thần kinh của nơron này với một tế bào hình cây của một nơron khác được gọi là khớp thần kinh (synapse). Sự sắp xếp các nơron và mức độ mạnh yếu của các khớp thần kinh do các quá trình hố học phức tạp quyết định, sẽ thiết lập chức năng của mạng nơron.
Khi con người sinh ra, một bộ phận các nơron đã có sẵn trong não, cịn các bộ phận khác được phát triển thơng qua q trình học, và trong q trình đó xảy ra việc
thiết lập các liên kết mới và loại bỏ đi các liên kết cũ giữa các nơron.
Cấu trúc mạng nơron luôn luôn phát triển và thay đổi. Các thay đổi có khuynh hướng chủ yếu là làm tăng hay giảm độ mạnh các mối liên kết thông qua các khớp thần kinh.
Một trong những phương pháp điển hình giải quyết bài tốn học máy là thiết lập các mạng nơron nhân tạo. Mạng nơron nhân tạo chưa tiếp cận được sự phức tạp của bộ não. Tuy nhiên, do mô phỏng hoạt động học trong não mà về cơ bản có hai sự tương quan giữa mạng nơron nhân tạo và nơron sinh học. Thứ nhất, cấu trúc tạo thành chúng đều là các thiết bị tính tốn đơn giản (với mạng nơron sinh học đó là các tế bào thân cịn với mạng nhân tạo thì đơn giản hơn nhiều) được liên kết chặt chẽ với nhau. Thứ hai, các liên kết giữa các nơron quyết định chức năng hoạt động của mạng.
Mạng nơ-ron, được xem như hoặc là mơ hình liên kết (connectionist model), hoặc là mơ hình phân bố song song (parallel-distributed model) và có các thành phần phân biệt sau đây:
1) Tập các đơn vị xử lý;
2) Trạng thái kích hoạt hay đầu ra của đơn vị xử lý;
3) Liên kết giữa các đơn vị, mỗi liên kết được xác định bởi một trọng số wji cho ta biết hiệu ứng mà tín hiệu của đơn vị j có trên đơn vị i;
4) Luật lan truyền quyết định cách tính tín hiệu ra của đơn vị từ đầu vào của nó;
5) Hàm kích hoạt, xác định mức độ kích hoạt khác dựa trên mức độ kích hoạt hiện tại;
6) Đơn vị điều chỉnh (độ lệch - bias) của mỗi đơn vị;
7) Phương pháp thu thập thông tin (luật học – learning rule); 8) Mơi trường hệ thống có thể hoạt động.