PHƯƠNG PHÁP LUẬN MÔ HÌNH NEURO-MỜ VÀ THUẬT GIẢI DI- 123docz.net

VÀ THUẬT GIẢI DI TRUYỀN

3.1 Giới thiệu

Động lực quan trọng nhất để dùng hệ mờ cho mô hình dự đoán là mô hình

được tạo ra được đặc tả bởi ngữ nghĩa phụ thuộc vào ngôn ngữ mà cho phép

con người hiểu dễ dàng. Vì thế, những phương pháp để xây dựng những mô

hình mờ từ dữ liệu không chỉ được định hướng để tìm sự xấp xỉ tốt nhất cho dữ

liệu mà còn quan trọng hơn, chúng nên chiết xuất kiến thức từ dữ liệu trong định dạng những luật mờ mà có thể dễ dàng hiểu và diễn giải. Vì thế, những

thuật toán nhận dạng những mô hình mờ chính xác và diễn giải được cần được

triển khai. Đây là công việc chính được mô tả trong chương này.

Như được mô tả trong phần trước, có hai thiết kế chính được dùng cho mô hình hoá mờ: nhận dạng cấu trúc và thông số của cơ sở luật mờ. Độ chính xác

và tính diễn giải được của mô hình mờ được trích phụ thuộc vào những định

nghĩa hoàn hảo của hai hệ số này.

Hầu hết những phương pháp mô hình mờ tự động và những phương pháp

neuro-mờ đặc biệt chú trọng độ chính xác và bỏ qua tính diễn giải được để mà những mô hình kết quả thường không có điểm chung so với mô hình mờ ban

đầu. Điều này tạo nên những khó khăn chính trong việc hình thành mô tả toán

học của khái niệm thông suốt và diễn giải ngôn ngữ của những luật mờ. Hiện

thời, không tồn tại những định nghĩa được thiết lập tốt cho tính diễn giải được

của một hệ mờ. Để đối phó với khó khăn này, nhiều tác giả đã cố gắng tìm những điều kiện hợp lý mà tính diễn giải được của một hệ mờ phải thoả. Chúng

ta thấy rằng tính diễn giải được của một mô hình mờ phụ thuộc vào hai khía cạnh chính:độ phức tạp của cơ sở luật mờ ( ví dụ số luật) và tính dễ đọc của

những tập mờ được dùng trong những luật mờ.

Đầu tiên, số lượng luật là điều kiện cốt yếu để đạt được diễn giải ngôn ngữ

mô hình mờ. Vì thế, vấn đề tìm kiếm cân bằng giữa độ phức tạp (kích thước cơ

sở luật) và độ chính xác của mô hình mờ cần phải được chú ý nhiều. Điều này có nghĩa là phương pháp mô hình mờ dựa trên dữ liệu có thể tối thiểu cả lỗi

ngõ ra và độ phức tạp mô hình kết quả. Nguyên tắc cơ bản này của mô hình tinh giản là yêu cầu cơ bản cho tất cả những kỹ thuật mô hình hoá hỗ trợ tính diễn

giải được và khả năng tổng quát hoá. Tuy nhiên, nhiều kỹ thuật thiết kế neuro- mờ chỉ quan tâm đến nhận dạng thông số và bỏ qua nhận dạng cấu trúc, vì thế không được tối ưu hay biến đổi.

Thứ hai, với những luật mờ dễ dàng hiểu phân chia mờ nên hoàn toàn và phân biệt để mà ý nghĩa vật lý (thuật ngữ ngôn ngữ) có thể liên quan với mỗi

tập mờ trong vùng chia. Có vài trường hợp mà phân chia mờ của vài biến ngõ vào không còn đầy đủ và phân biệt sau khi những hàm liên thuộc mờ được tối ưu. Sau khi học từ dữ liệu, ý nghĩa vật lý của vài tập mờ có thể không còn rõ

ràng, điều này có nghĩa là chúng thiếu độ phân biệt và phân chia mờ trở nên

không đầy đủ. Hình 3.1 thể hiện hai ảnh hưởng không mong muốn này. Mặc dù những ảnh hưởng này khá dễ dàng giải thích bởi vì tất cả những thuật toán tối ưu đều cố gắng hiệu chỉnh phân bố của những hàm liên thuộc theo sự phân bố

của tập dữ liệu, chúng xần phải tránh vì chúng sẽ làm cho việc diễn giải những

luật được tạo khó khăn. Cụ thể, tính phân biệt của những tập mờ là điều đầu

tiên cần xem xét để cải tiến tính diễn giải của một hệ mờ.

Hình 3.1. Hai ảnh hưởng chính khi những luật mờ được học từ dữ liệu:

(a)Phân chia mờ không đầy đủ (b) thiếu tính phân biệt

Trong luận án này đề xuất một phương pháp luận dựa trên dữ liệu để mô hình hoá neuro-mờ. Để nhận được một mô hình mờ chính xác cũng như diễn giải được từ dữ liệu số, người ta đã định nghĩa phương pháp mô hình ba pha.

Theo phương pháp neuro-mờ, một mạng nơron được đề xuất thực thi hệ mờ, để việc nhận dạng cấu trúc và thông số của cơ sở luật mờ được thực hiện bằng cách định nghĩa, thích nghi và tối ưu tôpô và những thông số của mạng neuro- mờ tương ứng chỉ dựa trên những dữ liệu hợp lý. Mạng này được xem như là

một hệ thống suy luận mờ thích nghi với khả năng học những luật mờ từ dữ liệu và như là một kiến trúc kết nối được cung cấp ý nghĩa ngôn ngữ. Những luật

mờ được trích từ những ví dụ huấn luyện bởi một sơ đồ học lai gồm ba pha

chính:

1. Cho cấu trúc và thông số giá trị ban đầu để nhận được một mô hình mờ

“thô”

2. điều chỉnh toàn cục tất cả các thông số để cải tiến độ chính xác của mô

hình mờ nhận được.

3. giảm cấu trúc và tinh chỉnh cục bộ những thông số để cải tiến tính diễn

giải được của mô hình mờ kết quả.

Khi quá trình học hoàn tất, kiến trúc mạng mã hoá những kiến thức được học

theo dạng những luật mờ và xử lý dữ liệu theo những nguyên tắc lập luận mờ.

Những nét chính của chương này như sau. Phần 3.2 mô tả mô hình mờ ứng cử

mà có thể được ứng dụng cho cả nhận dạng và phân loại. Phần 3.3 mô tả kiến

thiệu sơ đồ học theo tầng. Sau đó ba pha học của chiến lược học được mô tả chi

tiết trong các phần 3.5,3.6 và 3.7. Kết luận được tóm tắt trong phần 3.8.

3.2 Hệ mờ ứng cử

Trong phần này chúng ta trình bày cơ sở của sơ đồ lập luận mờ mà có thể ứng

dụng cho cả những bài toán nhận dạng và phân loại.

Giả sử một tập huấn luyện DN x   t ,yt Nt1 gồm N dữ liệu vào-ra mô tả

cách ứng xử của một quá trình. Véctơ ngõ vào x=(x1,…,xn) thể hiện những biến độc lập trong trường hợp nhận dạng hay là véctơ đặc tính trong trường hợp bài toán phân loại. Véctơ ngõ ra y=(y1,…,ym) thể hiện những biến phụ thuộc trong trường hợp nhận dạng hay những giá trị liên thuộc phân loại rõ trong trường

hợp phân loại. Với bài toán nhận dạng mục đích là nhận được một mô hình mà mô tả những giá trị của những biến phụ thuộc (y1,…,ym) khi cho giá trị của

những biến độc lập (x1,…,xn). Với công việc phân loại, mục đích là nhận được

một mô hình mà gán đặc tính x cho một trogn m lớp dựa trên những giá trị đặc điểm của nó. Trong cả hai trường hợp chúng ta phải xấp xỉ một hàm chưa biết

mà ánh xạ những biến vào thành những biến ra:

(3.1)

Đề mô hình sự phụ thuộc (4.1) giữa những biến vào và biến ra, chúng ta xem

xét những luật mờ theo dạng sau:

Nếu (x1 là A1k) và …(xn là Ank) thì (y1 là b1k) và …(ym là bmk)

với k=1,…,K trong đó K là số luật mờ, Aik(i=1,…,n) là những tập mờ được định nghĩa qua những biến vào xi và bjk (j=1…m) là những singleton mờ được định nghĩa trên những biến ra yj. Vì thế một mô hình mờ singleton được chấp

nhận ở đây.

Những loại hàm liên thuộc khác nhau có thể được dùng cho những tập mờ

tiền đề. Trong luận án này, những hàm liên thuộc Gauss được dùng vì chúng sở

hữu nhiều đặc tính mong muốn lý tưởng để thể hiện những hàm liên thuộc mờ

trong những ứng dụng mô hình :

 Chúng là những hàm bình thường, một trạng thái và trơn;

 dạng toán học được thông số hoá của chúng hổ trợ việc tính toán và lập

trình;

 chúng khá lý tưởng để thể hiện những nhãn ngôn ngữ mờ, phổ biến hơn

những hàm tam giác và hình thang;

 Chúng sở hữu một đáp ứng cục bộ mặc dù chúng không phải là tập đóng

hoàn toàn;

 Chúng có thể đạo hàm bất kỳ nơi nào, một đặc tính hữu ích cho học dựa

trên những kỹ thuật giảm gradient.

              2 2 2 exp ; ; ij ij j ij ij j A c x c x ij    (3.2)

với cij và ij là tâm và độ rộng của hàm Gauss.

Dựa trên một tập gồm K luật, ngõ ra của bất kỳ véctơ ngõ vào x(0) đạt được

bằng chương trình lập luận mờ sau:

1. Tính độ đáp ứng của luật thứ k, với k=1…K bằng toán hạng tích

(3.3)

2. Tính ngõ ra suy luận yˆj 0 bằng cách lấy trung bình trọng số của những

giá trị kết quả bjktương ứng với cường độ kích hoạt luật kx 0:

(3.4) Hệ suy luận mờ có thể được tổng hợp như một hàm  .,. được định nghĩa trên

không gian ngõ vào X và không gian thông số W theo cách sau:

(3.5)

Với bài toán nhận dạng, đặc tính ánh xạ trong (3.5) giảm thành:

 mW W

X 0,1

:  

 (3.6) Ví dụ ngõ ra suy luận yˆj 0,1 thể hiện độ liên thuộc của đặc tính x thuộc lớp

Cj. Điều này sinh ra phân loại “mềm”. Ngược lại, công việc phân loại rõ có thể được thể hiện như một ánh xạ:

EX  X  : (3.7) với (3.8) để mà x(0) thuộc lớp Cl  x el

Để đạt được một phân loại “cứng” (rõ) từ một bộ phân loại mờ, một bước tính

toán khác cần có sau quá trình suy luận để mà bộ phận cao nhất véctơ ngõ ra

được ánh xạ đến 1 trong khi những bộ phận khác được ánh xạ đến 0. Để làm

điều này, một đặc tính x(0) được gán cho lớp Clđể mà đặc tính đúng:

x(0) thuộc lớp Cl j1,...,m:yˆl 0 yˆj 0

(với những lớp có cùng giá trị liên thuộc, một giá trị ngẫu nhiên được chọn). Để

hình thành việc chuyển mờ đến rõ của kết quả phân loại chúng ta định nghĩa

hàm sau:

 0,1m E

với 1m biểu thị véctơ đơn vị m chiều và những hàm max(.) và m .,. được định

nghĩa như sau:

RRm  Rm  : max (3.10) Và (3.11) (3.12)

Để đơn giản, vai trò của hàm  . là để chọn thành phần cao nhất của một véctơ

m chiều và đặt nó là 1, trong khi những thành phần khác là 0. Bằng cách ứng

dụng hàm  . đến kết quả suy luận của bộ phân loại mờ, chúng ta có được kết

quả phân loại rõ. Vì thế, một bộ phân loại mờ được chuyển thành một bộ phân

loại rõ bằng cách tổng hợp các hàm  . và  .,. ,để mà hàm phân loại đích  .

được xấp xỉ bởi hàm hợp:

EW W

X 

: (3.13) Trong phần sau chúng ta sẽ chỉ định hệ mờ bởi hàm  .,. được định nghĩa trong

(3.5), cả cho bài toán nhận dạng và phân loại. Hàm hợp (3.13) sẽ chỉ được dùng khi sự tách biệt là cần thiết.

3.3 Mạng neuro-mờ

Hệ mờ được giới thiệu bên trên có thể được xem như một hệ gồm:luật, những

tập mờ được dùng trong những luật này và những hoạt động suy luận mờ, chỉ

có một phần mà có thể được định nghĩa thông qua việc học là cấu trúc của cơ sở

luật (được định nghĩa với thuật ngữ là số lượng luật) và những thông số giả thiết

và kết luận liên hệ với luật. Bài toán có thể được phát biểu theo một cách chính

xác là tìm một cấu hình hoàn hảo của những hàm liên thuộc và tạo ra một tập

những luật mờ từ tập dữ liệu DN của N cặp vào-ra để mà hệ mờ  .,. xấp xỉ gần

nhất với hàm chưa biết f(.) sử dụng cân bằng giữa độ phức tạp và chính xác của cơ sở luật.

Để làm được điều này, hệ mờ được thực thi dùng mạng nơron. Mạng nơron

này mã hoá một tập những luật mờ thành tôpô của nó và xử lý thông tin theo

cách mà gắn kết với sơ đồ lập luận mờ. Mạng neuro-mờ được đề xuất là một

kiến trúc truyền thẳng

 Thông số

Không gian thông số có thể hiệu chỉnh của mạng, được biểu thị bởi W, gồm

không gian con những thông số giả thiết WP và không gian con những thông số

kết luận WC. Chúng ta có,

W=WPWC (3.14) với (3.15)

là tập những tâm và độ rộng của những hàm liên thuộc Gauss ik mô tả những

tập mờ trong phần giả thiết của luật và

(3.16) Là tập những singleton mờ trong phần kết luận của những luật. Vì thế, với mỗi

luật, ba véctơ thông số được định nghĩa:

những véctơ thông số giả thiết véctơ thông số kết luận

3.4 Thuật toán học lai

Những mô hình neuro-mờ tự động chiết một mô hình mờ (ví dụ, một tập

những luật mờ) sử dụng những thông tin hợp lý là một tập những cặp vào-ra mong muốn. Những luật được tạo để mà mô hình kết quả có thể thể hiện đủ ánh

xạ với tập dữ liệu được cho, với cả thuật ngữ dự đoán và mô tả. Nói cách khác,

mục đích chính của phương pháp đề xuất là đạt được mô hình mờ mà có cả độ

chính xác (ví dụ với khả năng tổng quát hoá tốt) và tính diễn giải được (ví dụ dễ

dàng hiểu bởi người dùng). Mô hình mờ nhận được hoàn toàn từ dữ liệu thông

qua học của mạng nơron. Thuật toán học dựa trên một sơ đồ lai gồm ba pha:

PHƯƠNG PHÁP LUẬN MÔ HÌNH NEURO-MỜ VÀ THUẬT GIẢI DI TRUYỀN

Mạng nơron cấu trúc truyền thẳng

Mạng nơron cấu trúc truyền thẳng