VÀ THUẬT GIẢI DI TRUYỀN
3.1 Giới thiệu
Động lực quan trọng nhất để dùng hệ mờ cho mô hình dự đoán là mô hình
được tạo ra được đặc tả bởi ngữ nghĩa phụ thuộc vào ngôn ngữ mà cho phép
con người hiểu dễ dàng. Vì thế, những phương pháp để xây dựng những mô
hình mờ từ dữ liệu không chỉ được định hướng để tìm sự xấp xỉ tốt nhất cho dữ
liệu mà còn quan trọng hơn, chúng nên chiết xuất kiến thức từ dữ liệu trong định dạng những luật mờ mà có thể dễ dàng hiểu và diễn giải. Vì thế, những
thuật toán nhận dạng những mô hình mờ chính xác và diễn giải được cần được
triển khai. Đây là công việc chính được mô tả trong chương này.
Như được mô tả trong phần trước, có hai thiết kế chính được dùng cho mô hình hoá mờ: nhận dạng cấu trúc và thông số của cơ sở luật mờ. Độ chính xác
và tính diễn giải được của mô hình mờ được trích phụ thuộc vào những định
nghĩa hoàn hảo của hai hệ số này.
Hầu hết những phương pháp mô hình mờ tự động và những phương pháp
neuro-mờ đặc biệt chú trọng độ chính xác và bỏ qua tính diễn giải được để mà những mô hình kết quả thường không có điểm chung so với mô hình mờ ban
đầu. Điều này tạo nên những khó khăn chính trong việc hình thành mô tả toán
học của khái niệm thông suốt và diễn giải ngôn ngữ của những luật mờ. Hiện
thời, không tồn tại những định nghĩa được thiết lập tốt cho tính diễn giải được
của một hệ mờ. Để đối phó với khó khăn này, nhiều tác giả đã cố gắng tìm những điều kiện hợp lý mà tính diễn giải được của một hệ mờ phải thoả. Chúng
ta thấy rằng tính diễn giải được của một mô hình mờ phụ thuộc vào hai khía cạnh chính:độ phức tạp của cơ sở luật mờ ( ví dụ số luật) và tính dễ đọc của
những tập mờ được dùng trong những luật mờ.
Đầu tiên, số lượng luật là điều kiện cốt yếu để đạt được diễn giải ngôn ngữ
mô hình mờ. Vì thế, vấn đề tìm kiếm cân bằng giữa độ phức tạp (kích thước cơ
sở luật) và độ chính xác của mô hình mờ cần phải được chú ý nhiều. Điều này có nghĩa là phương pháp mô hình mờ dựa trên dữ liệu có thể tối thiểu cả lỗi
ngõ ra và độ phức tạp mô hình kết quả. Nguyên tắc cơ bản này của mô hình tinh giản là yêu cầu cơ bản cho tất cả những kỹ thuật mô hình hoá hỗ trợ tính diễn
giải được và khả năng tổng quát hoá. Tuy nhiên, nhiều kỹ thuật thiết kế neuro- mờ chỉ quan tâm đến nhận dạng thông số và bỏ qua nhận dạng cấu trúc, vì thế không được tối ưu hay biến đổi.
Thứ hai, với những luật mờ dễ dàng hiểu phân chia mờ nên hoàn toàn và phân biệt để mà ý nghĩa vật lý (thuật ngữ ngôn ngữ) có thể liên quan với mỗi
tập mờ trong vùng chia. Có vài trường hợp mà phân chia mờ của vài biến ngõ vào không còn đầy đủ và phân biệt sau khi những hàm liên thuộc mờ được tối ưu. Sau khi học từ dữ liệu, ý nghĩa vật lý của vài tập mờ có thể không còn rõ
ràng, điều này có nghĩa là chúng thiếu độ phân biệt và phân chia mờ trở nên
không đầy đủ. Hình 3.1 thể hiện hai ảnh hưởng không mong muốn này. Mặc dù những ảnh hưởng này khá dễ dàng giải thích bởi vì tất cả những thuật toán tối ưu đều cố gắng hiệu chỉnh phân bố của những hàm liên thuộc theo sự phân bố
của tập dữ liệu, chúng xần phải tránh vì chúng sẽ làm cho việc diễn giải những
luật được tạo khó khăn. Cụ thể, tính phân biệt của những tập mờ là điều đầu
tiên cần xem xét để cải tiến tính diễn giải của một hệ mờ.
Hình 3.1. Hai ảnh hưởng chính khi những luật mờ được học từ dữ liệu:
(a)Phân chia mờ không đầy đủ (b) thiếu tính phân biệt
Trong luận án này đề xuất một phương pháp luận dựa trên dữ liệu để mô hình hoá neuro-mờ. Để nhận được một mô hình mờ chính xác cũng như diễn giải được từ dữ liệu số, người ta đã định nghĩa phương pháp mô hình ba pha.
Theo phương pháp neuro-mờ, một mạng nơron được đề xuất thực thi hệ mờ, để việc nhận dạng cấu trúc và thông số của cơ sở luật mờ được thực hiện bằng cách định nghĩa, thích nghi và tối ưu tôpô và những thông số của mạng neuro- mờ tương ứng chỉ dựa trên những dữ liệu hợp lý. Mạng này được xem như là
một hệ thống suy luận mờ thích nghi với khả năng học những luật mờ từ dữ liệu và như là một kiến trúc kết nối được cung cấp ý nghĩa ngôn ngữ. Những luật
mờ được trích từ những ví dụ huấn luyện bởi một sơ đồ học lai gồm ba pha
chính:
1. Cho cấu trúc và thông số giá trị ban đầu để nhận được một mô hình mờ
“thô”
2. điều chỉnh toàn cục tất cả các thông số để cải tiến độ chính xác của mô
hình mờ nhận được.
3. giảm cấu trúc và tinh chỉnh cục bộ những thông số để cải tiến tính diễn
giải được của mô hình mờ kết quả.
Khi quá trình học hoàn tất, kiến trúc mạng mã hoá những kiến thức được học
theo dạng những luật mờ và xử lý dữ liệu theo những nguyên tắc lập luận mờ.
Những nét chính của chương này như sau. Phần 3.2 mô tả mô hình mờ ứng cử
mà có thể được ứng dụng cho cả nhận dạng và phân loại. Phần 3.3 mô tả kiến
thiệu sơ đồ học theo tầng. Sau đó ba pha học của chiến lược học được mô tả chi
tiết trong các phần 3.5,3.6 và 3.7. Kết luận được tóm tắt trong phần 3.8.
3.2 Hệ mờ ứng cử
Trong phần này chúng ta trình bày cơ sở của sơ đồ lập luận mờ mà có thể ứng
dụng cho cả những bài toán nhận dạng và phân loại.
Giả sử một tập huấn luyện DN x t ,yt Nt1 gồm N dữ liệu vào-ra mô tả
cách ứng xử của một quá trình. Véctơ ngõ vào x=(x1,…,xn) thể hiện những biến độc lập trong trường hợp nhận dạng hay là véctơ đặc tính trong trường hợp bài toán phân loại. Véctơ ngõ ra y=(y1,…,ym) thể hiện những biến phụ thuộc trong trường hợp nhận dạng hay những giá trị liên thuộc phân loại rõ trong trường
hợp phân loại. Với bài toán nhận dạng mục đích là nhận được một mô hình mà mô tả những giá trị của những biến phụ thuộc (y1,…,ym) khi cho giá trị của
những biến độc lập (x1,…,xn). Với công việc phân loại, mục đích là nhận được
một mô hình mà gán đặc tính x cho một trogn m lớp dựa trên những giá trị đặc điểm của nó. Trong cả hai trường hợp chúng ta phải xấp xỉ một hàm chưa biết
mà ánh xạ những biến vào thành những biến ra:
(3.1)
Đề mô hình sự phụ thuộc (4.1) giữa những biến vào và biến ra, chúng ta xem
xét những luật mờ theo dạng sau:
Nếu (x1 là A1k) và …(xn là Ank) thì (y1 là b1k) và …(ym là bmk)
với k=1,…,K trong đó K là số luật mờ, Aik(i=1,…,n) là những tập mờ được định nghĩa qua những biến vào xi và bjk (j=1…m) là những singleton mờ được định nghĩa trên những biến ra yj. Vì thế một mô hình mờ singleton được chấp
nhận ở đây.
Những loại hàm liên thuộc khác nhau có thể được dùng cho những tập mờ
tiền đề. Trong luận án này, những hàm liên thuộc Gauss được dùng vì chúng sở
hữu nhiều đặc tính mong muốn lý tưởng để thể hiện những hàm liên thuộc mờ
trong những ứng dụng mô hình :
Chúng là những hàm bình thường, một trạng thái và trơn;
dạng toán học được thông số hoá của chúng hổ trợ việc tính toán và lập
trình;
chúng khá lý tưởng để thể hiện những nhãn ngôn ngữ mờ, phổ biến hơn
những hàm tam giác và hình thang;
Chúng sở hữu một đáp ứng cục bộ mặc dù chúng không phải là tập đóng
hoàn toàn;
Chúng có thể đạo hàm bất kỳ nơi nào, một đặc tính hữu ích cho học dựa
trên những kỹ thuật giảm gradient.
2 2 2 exp ; ; ij ij j ij ij j A c x c x ij (3.2)
với cij và ij là tâm và độ rộng của hàm Gauss.
Dựa trên một tập gồm K luật, ngõ ra của bất kỳ véctơ ngõ vào x(0) đạt được
bằng chương trình lập luận mờ sau:
1. Tính độ đáp ứng của luật thứ k, với k=1…K bằng toán hạng tích
(3.3)
2. Tính ngõ ra suy luận yˆj 0 bằng cách lấy trung bình trọng số của những
giá trị kết quả bjktương ứng với cường độ kích hoạt luật kx 0:
(3.4) Hệ suy luận mờ có thể được tổng hợp như một hàm .,. được định nghĩa trên
không gian ngõ vào X và không gian thông số W theo cách sau:
(3.5)
Với bài toán nhận dạng, đặc tính ánh xạ trong (3.5) giảm thành:
mW W
X 0,1
:
(3.6) Ví dụ ngõ ra suy luận yˆj 0,1 thể hiện độ liên thuộc của đặc tính x thuộc lớp
Cj. Điều này sinh ra phân loại “mềm”. Ngược lại, công việc phân loại rõ có thể được thể hiện như một ánh xạ:
EX X : (3.7) với (3.8) để mà x(0) thuộc lớp Cl x el
Để đạt được một phân loại “cứng” (rõ) từ một bộ phân loại mờ, một bước tính
toán khác cần có sau quá trình suy luận để mà bộ phận cao nhất véctơ ngõ ra
được ánh xạ đến 1 trong khi những bộ phận khác được ánh xạ đến 0. Để làm
điều này, một đặc tính x(0) được gán cho lớp Clđể mà đặc tính đúng:
x(0) thuộc lớp Cl j1,...,m:yˆl 0 yˆj 0
(với những lớp có cùng giá trị liên thuộc, một giá trị ngẫu nhiên được chọn). Để
hình thành việc chuyển mờ đến rõ của kết quả phân loại chúng ta định nghĩa
hàm sau:
0,1m E
:
với 1m biểu thị véctơ đơn vị m chiều và những hàm max(.) và m .,. được định
nghĩa như sau:
RRm Rm : max (3.10) Và (3.11) (3.12)
Để đơn giản, vai trò của hàm . là để chọn thành phần cao nhất của một véctơ
m chiều và đặt nó là 1, trong khi những thành phần khác là 0. Bằng cách ứng
dụng hàm . đến kết quả suy luận của bộ phân loại mờ, chúng ta có được kết
quả phân loại rõ. Vì thế, một bộ phân loại mờ được chuyển thành một bộ phân
loại rõ bằng cách tổng hợp các hàm . và .,. ,để mà hàm phân loại đích .
được xấp xỉ bởi hàm hợp:
EW W
X
: (3.13) Trong phần sau chúng ta sẽ chỉ định hệ mờ bởi hàm .,. được định nghĩa trong
(3.5), cả cho bài toán nhận dạng và phân loại. Hàm hợp (3.13) sẽ chỉ được dùng khi sự tách biệt là cần thiết.
3.3 Mạng neuro-mờ
Hệ mờ được giới thiệu bên trên có thể được xem như một hệ gồm:luật, những
tập mờ được dùng trong những luật này và những hoạt động suy luận mờ, chỉ
có một phần mà có thể được định nghĩa thông qua việc học là cấu trúc của cơ sở
luật (được định nghĩa với thuật ngữ là số lượng luật) và những thông số giả thiết
và kết luận liên hệ với luật. Bài toán có thể được phát biểu theo một cách chính
xác là tìm một cấu hình hoàn hảo của những hàm liên thuộc và tạo ra một tập
những luật mờ từ tập dữ liệu DN của N cặp vào-ra để mà hệ mờ .,. xấp xỉ gần
nhất với hàm chưa biết f(.) sử dụng cân bằng giữa độ phức tạp và chính xác của cơ sở luật.
Để làm được điều này, hệ mờ được thực thi dùng mạng nơron. Mạng nơron
này mã hoá một tập những luật mờ thành tôpô của nó và xử lý thông tin theo
cách mà gắn kết với sơ đồ lập luận mờ. Mạng neuro-mờ được đề xuất là một
kiến trúc truyền thẳng
Thông số
Không gian thông số có thể hiệu chỉnh của mạng, được biểu thị bởi W, gồm
không gian con những thông số giả thiết WP và không gian con những thông số
kết luận WC. Chúng ta có,
W=WPWC (3.14) với (3.15)
là tập những tâm và độ rộng của những hàm liên thuộc Gauss ik mô tả những
tập mờ trong phần giả thiết của luật và
(3.16) Là tập những singleton mờ trong phần kết luận của những luật. Vì thế, với mỗi
luật, ba véctơ thông số được định nghĩa:
những véctơ thông số giả thiết véctơ thông số kết luận
3.4 Thuật toán học lai
Những mô hình neuro-mờ tự động chiết một mô hình mờ (ví dụ, một tập
những luật mờ) sử dụng những thông tin hợp lý là một tập những cặp vào-ra mong muốn. Những luật được tạo để mà mô hình kết quả có thể thể hiện đủ ánh
xạ với tập dữ liệu được cho, với cả thuật ngữ dự đoán và mô tả. Nói cách khác,
mục đích chính của phương pháp đề xuất là đạt được mô hình mờ mà có cả độ
chính xác (ví dụ với khả năng tổng quát hoá tốt) và tính diễn giải được (ví dụ dễ
dàng hiểu bởi người dùng). Mô hình mờ nhận được hoàn toàn từ dữ liệu thông
qua học của mạng nơron. Thuật toán học dựa trên một sơ đồ lai gồm ba pha: