6. Bố cục của luận án
2.2. Vai trò của tri thức tiên nghiệm trong học mơ hình mờ
2.2.1. Học dựa trên sự giải thích (EBL)
Kịch bản học EBL là một phương thức trích xuất những luật chung từ các quan sát riêng lẻ. Ý tưởng cơ bản của EBL là sử dụng tri thức tiên nghiệm để xây dựng cấu trúc ban đầu của Hypothesis, rồi sau đó xác lập Hypothesis chính thức dựa vào các quan sát thực nghiệm. Hình 2.1 biểu diễn kịch bản học EBL. Cụ thể trong [71] kịch bản học EBL được mơ tả như sau (trong đó 𝐵𝑎𝑐𝑘𝑔𝑟𝑜𝑢𝑛𝑑 đại diện cho tri thức tiên nghiệm trong các kịch bản học tương ứng):
𝐵𝑎𝑐𝑘𝑔𝑟𝑜𝑢𝑛𝑑╞ 𝐻𝑦𝑝𝑜𝑡ℎ𝑒𝑠𝑖𝑠
𝐻𝑦𝑝𝑜𝑡ℎ𝑒𝑠𝑖𝑠 ˄ 𝐷𝑒𝑠𝑐𝑟𝑖𝑝𝑡𝑖𝑜𝑛𝑠╞ 𝑃𝑟𝑒𝑑𝑖𝑐𝑡𝑖𝑜𝑛𝑠
Hình 2.1. Kịch bản học EBL
Xét một ví dụ học trong thực tế như sau: Trong một phim hoạt hình nổi tiếng của Gary Larson có cảnh một người thượng cổ lớn tuổi, tên là Jog, đang xiên một con thằn lằn trên đầu một chiếc cây nhọn. Ông ta được quan sát bởi một đám đông ngơ ngác những người có trí tuệ hạn chế như thời của ơng ta. Những người này chỉ có thói quen cầm nắm những con mồi bắt được trên tay và nướng chúng trên ngọn lửa để làm thức ăn. Chỉ bằng một trải nghiệm trực quan như trên là đủ để thuyết phục những người theo dõi về một nguyên tắc chung trong việc nướng thức ăn mà không làm tổn hại tay. Trong trường hợp ví dụ này, người thượng cổ đã khái qt hóa bằng cách giải thích sự thành cơng của cây nhọn: nó đỡ được con thằn lằn trong khi tay họ được giữ tránh xa con thằn lằn. Từ sự giải thích quan sát thực nghiệm này, họ có thể rút ra một quy tắc chung là: bất kỳ vật nhọn, dài và cứng nào cũng có thể được dùng để nướng những mảnh thức ăn nhỏ, mềm. Kiểu quy trình trích xuất ra quy tắc chung
Tri thức tiên nghiệm
Hypothesis Kết quả dự đoán Dữ liệu thu
thập được
Khởi tạo Hypothesis
Học dựa trên sự giải thích
từ sự giải thích các quan sát thực nghiệm này được gọi là học dựa trên sự giải thích, hay EBL. Cần lưu ý rằng, quy tắc chung trong trường hợp này tuân theo logic được sở hữu bởi những người thượng cổ.
Xét trong trường hợp học mơ hình mờ, kịch bản học EBL được mơ tả như sau (xem Hình 2.1):
Cho 𝐴 là một tri thức có trước về một mơ hình mờ 𝑀. Việc học mơ hình mờ 𝑀 từ tập dữ liệu quan sát 𝐷 = {(𝑥𝑖, 𝑦𝑖), 𝑥𝑖 ∈ 𝑋, 𝑦𝑖 ∈ 𝑌 } với 𝑋, 𝑌 ∈ 𝑅 và tri thức tiên
nghiệm 𝐴 được gọi là học theo kịch bản học EBL nếu thỏa mãn điều kiện sau:
𝐴╞ 𝑀,
((∀𝑥𝑖 ∈ 𝑋)(𝑀(𝑥𝑖) = 𝑦𝑖 ∈ 𝑌) .
Theo kịch bản học này, tri thức tiên nghiệm có vai trị xác định khn mẫu ban đầu của mơ hình và mơ hình thì được trích xuất từ dữ liệu huấn luyện. Đối với việc học mơ hình mờ từ dữ liệu huấn luyện thì việc lựa chọn trước các nguyên mẫu về phân lớp hay hồi quy cho mơ hình, rồi sau đó tiến hành huấn luyện mơ hình bằng dữ liệu thu thập được, được xem là hình thức học EBL.
Ví dụ, xét bài toán hồi quy sau: Cho một tập dữ liệu quan sát được
𝐷 = {(𝑥𝑖, 𝑦𝑖), 𝑥𝑖 ∈ 𝑋, 𝑦𝑖 ∈ 𝑌 } với 𝑋, 𝑌 ∈ 𝑅. Mục đích của bài toán hồi quy là xác
định một giả thuyết:
𝑦 = 𝑀(𝑥; 𝜃), 𝑥 ∈ 𝑋, 𝑦 ∈ 𝑌, 𝜃 ∈ 𝑅 ,
sao cho mơ hình mờ 𝑀 có thể giải thích được tập dữ liệu 𝐷. Những tri thức tiên
nghiệm được tổng hợp như sau:
- Kiểu của mơ hình hồi quy: Kiểu của mơ hình hồi quy là vấn đề quan trọng của bài toán hồi quy. Việc xác định kiểu của mơ hình hồi quy cho chúng ta xác định được những tham số liên quan của mơ hình. Các ngun mẫu của mơ hình hồi quy phổ biến có thể được kể đến là hồi quy tuyến tính, hồi quy đa thức hoặc hàm cơ sở hướng tâm (Radial Basis Functions- RBF).
- Ý nghĩa của “Similar”: Phổ biến nhất được dùng để đo lường sự giống nhau giữa các giá trị dữ liệu và đường hồi quy là “sai số khoảng cách” và “sự hợp
lý”. Sai số khoảng cách thường dùng là khoảng cách Euclid tiêu chuẩn.