Hoạt động của một mạng neural
Hoạt động của mạng neural có thể xem như hoạt động của một hệ thống xử lý thông tin được cấu thành từ nhiều phần tử hoạt động song song. Như đã giới thiệu ở mục trước, chức năng của mạng được xác định bởi cấu trúc, các liên kết có trọng số và hàm hoạt hoá của các neural trong mạng.
Khi mạng neural hoạt động, các thành phần của vectơ tín hiệu vào P = (p1, p2, ... , pS) được đưa vào S neural của lớp vào, tiếp đó các neural ở lớp ẩn và lớp ra sẽ được kích hoạt dần dần. Sau một quá trình tính toán tại các neural (tổng trọng số (w) đầu vào kết hợp hệ số bias, hàm hoạt hoá), mạng sẽ được kích hoạt hoàn toàn và cho ra vectơ tín hiệu đầu ra A = (a1, a2, ..., as) tại S neural ở lớp ra. Với cách mô tả hoạt động như vậy, ta có thể coi mạng neural như một bảng tra cứu giữa P và A, mà ta không cần biết hàm quan hệ tường minh của A theo P.
Nhưng sự khác biệt với các hệ thống xử lý thông thường là khả năng thích nghi với dữ liệu vào. Điều này là do việc các trọng số và các hệ số bias của mạng có thể hiệu chỉnh được để thích nghi với bài toán đặt ra. Quá trình hiệu chỉnh các trọng số (w) và hệ số bias của mạng gọi là quá trình huấn luyện mạng, và mạng sẽ được huấn luyện theo các thuật toán học thích hợp.
33 Sau khi một mạng đã được thiết kết cấu trúc cho một bài toán cụ thể nào đó
xong nó cũng sẵn sàng để được huấn luyện. Huấn luyện mạng có nghĩa là cung cấp các bộ tín hiệu vào cho mạng gọi là tập mẫu học hay tập huấn luyện, và mục đích của việc huấn luyện mạng là để hiệu chỉnh các trọng số và các hệ số bias, hoặc để hiệu chỉnh cấu trúc của mạng. Có hai phương pháp để huấn luyện mạng là được giám sát và không được giám sát.
Huấn luyện đƣợc giám sát :
Mạng được cung cấp một tập gồm K mẫu học {(PK, TK)} với PK là vectơ tín hiệu vào sẽ được đưa vào mạng và theo yêu cầu thì vectơ tín hiệu ra tương ứng sẽ phải là TK. Thực tế thì vectơ đầu ra lại là AK và sẽ có một sai số (error) so với TK. Sai số này được giám sát và được truyền trở lại hệ thống để hiệu chỉnh các trọng số liên kết và các hệ số bias của mạng. Quá trình đưa các mẫu học vào mạng được lặp đi lặp lại và mỗi lần như vậy các trọng số và hệ số bias luôn được hiệu chỉnh, cho đến khi mạng đạt một tiêu chuẩn nào đó thì dừng lại.
Người ta có đưa ra hàm sai số để đánh giá sự sai lệch giữa vectơ đấu ra AK và
vectơ kết quả đúng TK. Đạo hàm của hàm sai số thường được sử dụng cho quá trình
huấn luyện lặp đi lặp lại nói trên. Dưới đây là sơ đồ khối mô tả quá trình huấn luyện được giám sát.
Hình 2.9 Huấn luyện được giám sát.
Hàm sai số phổ biến nhất là hàm sai số bình phương (sum squared error- tổng bình phương các sai số tại đầu ra các neural, lóp ra). Một khái niệm rất hữu ích
34 nữa cho vấn đề đánh giá sai số là mặt sai số. Mỗi một trong N trọng số (w) và hệ số
bias sẽ tương ứng với 1 chiều trong không gian, và chiều thứ N + 1 là sai số của mạng. Đối với bất kỳ bộ trọng số (w) nào có thể thì sai số sẽ được vẽ trên chiều thứ N + 1 của không gian và sẽ tạo thành một mặt sai số. Mục tiêu của việc huấn luyện mạng là tìm ra được điểm thấp nhất của mặt phẳng đa chiều này.
Huấn luyện không đƣợc gi ám sát
Khác với kiểu huấn luyện có giám sát, ở đây tập huấn luyện chỉ bao gồm các vectơ tín hiệu đầu vào {PK}. Huấn luyện là quá trình hệ thống tự tìm ra các nhóm họp của số liệu vào. Điều này thường được gọi là sự tự tổ chức hay sự thích ứng.
Huấn luyện không được giám sát khá phức tạp. Việc huấn luyện cho mạng Kohonen là một ví dụ. Các tín hiệu đầu ra không được biết chính xác và việc hiệu chỉnh trọng số (w) ứng với một mẫu tín hiệu vào là để tín hiệu đầu ra của neural "chiến thắng" lớn hơn hoặc gần giá trị mong muốn, còn tín hiệu đầu ra của các neural lân cận sẽ được giảm đi.
2.4. Kết luận
Qua các nghiên cứu về công nghệ AI trên, mạng neural có nhiều ưu điểm trong việc dự báo đặc biệt là dự báo nhu cầu dịch vụ viễn thông. Do đó tôi sẽ chọn công nghệ mạng neural cho việc dự báo, sử dụng mạng lan truyền ngược, huấn luyện có giám sát. Tuy nhiên bên cạnh đó trong luận văn này sẽ sử dụng thuật toán di truyền để tối ưu quá trình huấn luyện và nếu có thể sẽ sử dụng tập mờ để tăng tính hiệu quả của quá trình dự báo.
35
CHƢƠNG 3
NGHIÊN CỨU ỨNG DỤNG AI TRONG DỰ BÁO