Như đã nói trong chương 1 bài toán nội suy hàm một biến đã được nghiên cứu nhiều và giải quyết tương đối hoàn thiện. Với bài toán nội suy nhiều biến thì còn nhiều vấn đề mở. Mặc dù có những hạn chế về kết quả lý thuyết, các phương pháp học dựa trên mẫu và mạng nơron đang là công cụ hữu hiệu để giải quyết bài toán nội suy nhiều biến trong thực tiễn. So với các mạng nơron, phương pháp k-lân cận gần nhất và hồi quy tuyến tính địa phương tuy dễ sử dụng nhưng có nhược điểm là không xác định trước hàm nội suy (xấp xỉ) qua dữ liệu huấn luyện được.
Mỗi hàm bán kính chỉ có miền ảnh hưởng địa phương phụ thuộc vào tham số độ rộng nên mạng RBF có thể xem là cầu nối giữa mạng MLP và các phương pháp dựa trên mẫu. Nó giống mạng MLP là xác định trước được hàm nội suy để dùng và giống phương pháp học dựa trên mẫu ở tính ảnh hưởng địa phương. So với mạng MLP, mạng RBF có thời gian huấn luyện nhanh hơn nhiều. Tuy vậy ngày nay có nhiều bài toán ứng dụng thời gian thực, đòi hỏi thời gian huấn luyện càng ngắn càng tốt. Đó là chủđể còn mở hiện nay và luận án tập trung tìm phương pháp huấn luận mạng nội suy, đưa ra các thuật toán dùng được cho số mốc lớn mà chưa xét đến mạng xấp xỉ.
CHƯƠNG 3. THUẬT TOÁN MỚI HUẤN LUYỆN MẠNG
NỘI SUY RBF
Trong chương này, chúng tôi đề xuất một thuật toán lặp hai pha huấn luyện mạng nội suy RBF. Pha thứ nhất xác định tham số độ rộng cho các hàm cơ sở bán kính, còn các trọng số tầng ra được tìm nhờ phép lặp xác định điểm bất động của một ánh xạ co trong pha sau. Phân tích toán học và kết quả thực nghiệm cho thấy thuật toán có những ưu điểm vượt trội so với những thuật toán thông dụng: dễước lượng sai số huấn luyện, thời gian huấn luyện ngắn, tính tổng quát cũng tốt hơn và dễ song song hoá. Thuật toán này cũng là cơ sở cho các thuật toán ở các chương sau. Mục 3.1 sẽ dành để giới thiệu các phương pháp lặp giải hệ phương trình tuyến tính cần dùng về sau và tóm tắt lại mạng nội suy RBF với hàm bán kính dạng Gauss. Thuật toán lặp hai pha được giới thiệu ở mục 3.2, kết quả thử nghiệm được trình bày ở mục 3.3. Mục 3.4 dành để so sánh hiệu quả của thuật toán mới với thuật toán Gradient và các nhận xét chung được đưa ra trong mục cuối.
Kết quả chủ yếu của chương này đã được công bố trong hội thảo khoa học [4], và tạp chí quốc tế Signal Processing [34].