Mô hình mờ loại 2 khoảng được thử nghiệm cùng mô hình mờ loại 1 nhằm đánh giá hiệu năng của hệ mờ loại 2 khoảng so với hệ mờ loại một. Tập mờ loại 1 cơ sở khi thiết kế FOU được sử dụng để xây dựng mô hình mờ loại một. Trong quá trình thử nghiệm, hệ số b trong hàm thuộc hình chuông tổng quát được điều chỉnh đểđánh giá sựảnh hưởng của hình dạng tập mờ tới hiệu năng của mô hình. Các tập mờ loại hai khoảng xây dựng từ dữ liệu được mô tả trong hình 3.8, 3.9 và 3.10
Hình 3.8. Các tập mờ loại hai khoảng với b= 0.6
Hình 3.10. Các tập mờ loại hai khoảng với b= 3
Kết quả thực nghiệm được trình bày trong bảng 2. Kết quả cho thấy mô hình mờ loại hai khoảng có hiệu năng tốt hơn và ổn định hơn so với hệ mờ loại 1 khi giải quyết bài toán phân lớp mà dữ liệu có nhiễu. Kết quả này cũng chỉ ra hiệu năng của mô hình mờ loại 1 không ổn định khi điều chỉnh dạng của tập mờ giả thiết. Trong khi mô hình phân lớp mờ loại 2 khoảng có hiệu năng gần như không đổi với các dạng tập mờ khác nhau. Cả hai mô hình mờ loại 1 và loại 2 đều đạt được độ chính xác cao nhất với tập mờ có hàm thuộc dạng Gaussian chuẩn (b = 1) và độ chính xác thấp nhất với b>3.
Bảng 2: Kết quả phân lớp tập dữ liệu (%) của hệ mờ loại một và hệ
mờ loại hai
Type-1 Fuzzy Classifier Type-2 khoảng Fuzzy
Classifier b=0.6 b=1 b=3 b=0.6 b =1 b =3 VF 80 86.6 73.3 93.3 93.3 93.3 VT 80 84 76 92 92 88 NSR 100 100 100 100 100 100
CHƯƠNG 4. SỬ DỤNG GIẢI THUẬT DI TRUYỀN (GA) ĐỂ TỐI ƯU
THAM SỐ HỆ MỜ
4.1. GIỚI THIỆU
Với mô hình mờ sử dụng logic mờ loại 2 khoảng đơn trị thì khả năng làm việc với nhiễu hiệu quả chưa cao. Do đó, hệ mờ không đơn trị được chọn vì nó thích hợp hơn hệ mờ đơn trị khi làm việc với nhiễu. Giải thuật di truyền được dùng để tối ưu hóa đồng thời hàm thuộc và cơ sở luật.Chương này trình bày khả năng của hệ mờ ko đơn trị và giải thuật di truyền để xử lý nhiễu trong các bài toán phân loại mẫu. Hiệu năng của các hệ thống đơn trị và ko đơn trị được so sánh với nhau trong bài toán phân lớp điện tim. Các kết quả chỉ ra rằng hệ mờ không đơn trị làm việc với nhiễu hiệu quả hơn, vì vậy cho phép phân loại dựa trên các đặc trưng được trích chọn.
Các thành phần của một bộ phân loại và trình tự thiết kế bộ phân loại được chỉ ra trên hình 4.1. Bước trích chọn đặc trưng biến đổi dữ liệu đầu vào (trong không gian quan sát) thành các véc tơ đặc trưng (trong không gian đặc trưng). Không gian đặc trưng có số chiều ít hơn nhiều so với không gian quan sát. Bước tiếp theo là biến đổi từ không gian đặc trưng sang không gian quyết định được định nghĩa bởi tập các lớp (xác định). Một bộ phân loại, hay một thuật toán, sẽ sinh ra một phân hoạch của không gian đặc trưng bởi các miền quyết định. Sau khi thiết kế bộ phân loại với hiệu năng mong muốn, ta có thể sử dụng nó để phân loại các đối tượng mới. Điều này có nghĩa là bộ phân loại sẽ gán từng véc tơ đặc trưng trong không gian đặc trưng với một lớp trong không gian quyết định.
Hình 4.1. Các thành phần và trình tự thiết kế bộ phân loại sử dụng GA
Việc lựa chọn chính xác các đặc trưng có lẽ là nhiệm vụ khó khăn nhất trong bài toán phân loại mẫu. Những đặc trưng thừa hay không thích hợp ảnh hưởng đến hiệu năng của hầu hết các thuật toán học máy hay phân loại mẫu. Việc lựa chọn tập các đặc trưng hữu ích từ một tập khổng lồ các đặc trưng giúp ích trong việc tìm ra thuật toán học hiệu quả cho bài toán phân loại mẫu cũng như bài toán học máy nhằm hiểu rõ hơn về dữ liệu khi khai phá tri thức. Do có nhiều cách lựa chọn thuật toán nên độ khó khi trích chọn đặc trưng cũng rất đa dạng. Chi phí tính toán có thểđược giảm đi bằng cách sử dụng các đặc trưng dễ trích chọn. Tuy nhiên, những đặc trưng này lại ẩn chứa nhiều
thông tin không cần thiết có thể dẫn tới việc phân loại sai. Hơn nữa, trong các ứng dụng ta luôn phải đối mặt với nhiễu. Nguyên nhân của chúng là do nhiễu điện trong các thiết bị trích chọn hoặc thao tác các thiết bị không đúng.
Chương này chỉ ra rằng giải thuật di truyền tốt hơn hệ mờ đơn trị khi có nhiễu trong các đặc trưng được trích chọn. Điều này rất hữu ích khi không thể tránh khỏi sự nhập nhằng trong dữ liệu đầu vào.