Như được giới thiệu bởi L. Zadeh trong các bài báo chuyên đề, logic mờ và lý luận gần đúng cung cấp một khuôn khổ để chính thức hóa trực giác và kiến thức thông thường. Trong lĩnh vực điều khiển quá trình, các công cụ cơ bản này đã được sử dụng để chính thức hóa kiến thức vận hành thu được thành các cơ sở quy tắc mờ (fuzzy rule bases - FRB) tạo ra các bộ điều khiển logic mờ thông qua máy móc mờ hoặc mô hình bộ nhớ kết hợp mờ. FRB được đề xuất trong tài liệu để mô tả bộ điều khiển nhiều đầu vào-nhiều đầu ra (MIMO) thường được nêu dưới dạng tập hợp các quy tắc If-Then như:
IF x1 is F1j, …, and xn is j n F Then v1is G1j, …, and vq is j q G .
với j = 1,2, …, M; xi và vk lần lượt biểu thị các biến đầu vào và đầu ra ngôn ngữ, trong khi j
i
F và j k
G đại diện cho trình độ ngôn ngữ của chúng có liên quan đến các tập con mờ. Trong một biểu diễn tri thức như vậy, mỗi phần của một quy tắc có thể được xem như là một mô tả về trạng thái quy trình cụ thể mà một tập hợp các hành động kiểm soát được chỉ định theo ngôn ngữ được liên kết. Do đó, số lượng quy tắc phụ thuộc trực tiếp vào số lượng cặp {trạng thái quá trình, hành động điều khiển} mà một người điều khiển có kinh nghiệm có thể liệt kê.
15 2.4.2. Giới thiệu về điều khiển mờ loại 2
Tập mờ loại 2 (type-2 fuzzy set) được giới thiệu lần đầu tiên bởi Zadeh. Vì tập mờ loại 1 là rõ và chính xác (các hàm liên thuộc của chúng được giả sử là biết rõ), cho nên nó không cho phép sự không chắc chắn về các giá trị hàm liên thuộc, có thể dẫn đến sự thiếu sót trong việc sử dụng điều khiển mờ. Tập mờ loại 2 được đặc trưng bởi một hàm liên thuộc mờ (mỗi giá trị thành viên (membership value) của mỗi phần tử cũng là một tập mờ trong khoảng [0,1]. Hàm liên thuộc của tập mờ loại 2 là 3 chiều và bao gồm FOU (footprint of uncertainty). Nó là chiều thứ 3 của tập mờ loại 2. [2]
Hình 2.3 Ví dụ về hàm liên thuộc của mờ loại 2
Khi mà tất cả các giá trị của hàm liên thuộc thứ 2 (secondary membership) đều bằng 1 thì tập mờ loại 2 trở thành tập mờ khoảng loại 2 (interval type 2 fuzzy set, IT2 FS). Cho đến nay, do tính toán phức tạp khi sử dụng T2 FS, hầu hết mọi người chỉ sử dụng các IT2 FLS trong T2 FLS.Các tính toán liên quan đến khoảng thời gian T2 FS có thể quản lý được dễ dàng hơn, điều này làm cho IT2 FLS khá thiết thực.
16
Sơ đồ khối bộ điều khiển mờ khoảng loại 2 (interval type 2 fuzzy logic controller – IT2FLC) gồm 5 thành phần: khối mờ hóa (Fuzzier), khối quy tắc mờ (Rules), khối suy luận mờ (inference), khối giảm loại mờ (type-reducer), khối giải mờ (defuzzifier).
Khối mờ hóa
Khối này dùng để chuyển giá trị rõ thành giá trị mờ. Khối quy tắc mờ
Khối này biểu diễn tri thức kinh nghiệm của con người trong việc giải quyết bài toán dưới dạng các phát biểu ngôn ngữ có dạng:
Nếu mệnh đề điều kiện thì mệnh đề kết luận Có 2 loại quy tắc điều khiển thường dùng:
- Quy tắc mờ Mamdani: mệnh đề kết luận có dạng là mệnh đề mờ.
- Quy tắc mờ Takagi-Sugeno-Kang: mệnh đề kết luận là hàm của các biến đầu vào.
Khối suy luận mờ:
Khối này kết hợp các giá trị ngôn ngữ của ngõ vào sau khi mờ hóa với hệ quy tắc để rút ra kết luận giá trị mờ của ngõ ra.
Khối giảm loại mờ:
Khối này chuyển các giá trị mờ loại 2 về loại 1. Có nhiều phương pháp giảm loại mờ như: Karnik-Mendel, Center of sets,…
Khối giải mờ:
Khối này biến đổi giá trị tập mờ sang giá trị rõ. 2.5. Giới thiệu về đại số gia tử
2.5.1. Đại số gia tử
a. Khái niệm về đại số gia tử
Đế mô phỏng các quá trình suy luận của con người, lý thuyết đại số gia tử đã cố gắng nhúng tập ngôn ngữ vào một cấu trúc đại số thích hợp và tìm cách xem chúng như là một đại số để tiên đề hóa sao cho cấu trúc thu được mô phỏng tốt ngữ nghĩa ngôn ngữ.
17
, , er , , , , ,
, , , , , }
T True False V yTrue VeryFalse MoreTrue MoreFalse ApproximatelyTrue ApproximatelyFalse LittleTrue LittleFalse VerryMoreTrue VerryVerryTrue etc
Ta có thể xem tập này như là, một cấu trúc đại số: AT T G H, , , trong đó: T là, tập cơ sở của AT,
G là phần tử sinh (khái niệm nguyên thủy True False, ),
H H H,H là poset các gia tử dương, H là poset các gia tử âm, là quan hệ thứ tự.
Quan hệ thể hiện các tính chất định tính ngữ nghĩa của tập T , chẳng hạn: hx x kx x , , với mọi h H ,k H . Nếu h k thì (hx x kx x ) và (x hx hx kx ). Nếu x x hx khx( ) hoặc (x hx khx )thì {( ) y y hy y hy khy và (hy y khy hy y )}. Nếu x x khx hx( ) hoặc (x khx hx )thì {( ) y y hy y khy hy và (hy y hy khy y )}. Tính di truyền ngữ nghĩa: ký hiệu , là xâu các gia tử:
Nếu ngữ nghĩa của x và hx: được biểu thị bằng x hx thì (x hx); Nếu ngữ nghĩa của x và hx: được biểu thị bằng x hx thì (x hx); Nếu ngữ nghĩa của hx và kx được biểu thị bằng hx kx thì hx kx. Ta có thể nói , bảo toàn quan hệ ngữ nghĩa. Suy ra:
( ) ( )
hx kx H hx H kx
Trong đó ( )H hx kí hiệu tập tất cả phần tử sinh ra từ hx trongAX . Định lý 1. AT ( , )T Là tập sắp thứ tự tuyến tính.
b. Định lượng đại số gia tử
Mô hình lập luận mờ thường mô phỏng sự phụ thuộc giữa hai đại lượng vật lý, nghĩa là các giá trị ngôn ngữ xuất hiện trong mô hình mờ mô tả các giá trị vật lý trên
18
đường thẳng. Điều này gợi ý cho chúng ta thiết lập một ánh xạ, định lượng từ miền ngôn ngữ sang đường thẳng.
Định nghĩa 1. :f X 0,1 Gọi là, hàm ngữ nghĩa định lượng của X nếu: Với mọi h k H, hoặc h k H, và ,x y X : ( ) ( ) ( ) ( )
( ) ( ) ( ) ( ) f hx f x f hy f y h kx f x f ky f y
Tính mờ (fuzziness) của một giá trị ngôn ngữ:
Xét các giá trị: True, Very False, … làm thế nào định nghĩa tính mờ.?
Trên quan điểm đại số gia tử có một cách định nghĩa tính mờ khá trực quan bằng kích cỡ của tập ( )H x như sau:
Cho trước một hàm định lượng ngữ nghĩa f của X . Xét x X . Tính mờ của x khi đó đo bằng đường kính của tập f H x( ( )) 0,1 .
Hình 2.5 Tính mờ của một ngữ nghĩa
Định nghĩa 2: (Độ đo tính mờ) Hàm fm X: 0,1 được gọi là độ đo tính mờ nếu: (1) fm c( ) 0 và fm c( ) 1 0 trong đó c và c là các phần tử sinh
âm và dương.
(2) Giả sử tập các gia tử là H H H,H h h1, ,2hp với h h1 2 hp và H hp 1,hp 2, hp q với hp1hp2 hp q . Khi đó ip q1 fm h c( , ) fm c( ) với c c c, (3) Với bất kì ,x y X h H , , ( ) ( ) ( ) ( ) fm hx fm hy
fm x fm y đẳng thức này không phụ thuộc vào các phần tử x y, và do đó ta có thể kí hiệu là ( )h và gọi là hàm độ đo tính mờ (fuzziness measure) của gia tử h.
19 Mệnh đề 1. Ta có: 1) fm hx( ) ( ) ( ),h fm x x X; (2.36) 2) ip q1 fm h c( , ) fm c c( ), c c, ; (2.37) 3) ip1 ( )hi và i pq 1 ( )hi với , 0, 1 (2.38) Xây dưng hàm định lượng ngữ nghĩa trên cơ sở độ đo tính mờ của gia tử. Định nghĩa 3: Hàm Sign: X 1,0,1 :
( ) 1
Sign c và Sign hc( ) Sign c( ) nếu hc c;
( ) ( )
Sign hc Sign c nếu hc c;
( ) 1
Sign c và Sign hc( ) Sign c( ) nếu hc c;
( ) ( )
Sign hc Sign c nếuhc c;
( ' ) ( )
Sign h hx Sign hx nếu h' là negative đối với h và h hx hx' ;
( ' ) ( )
Sign h hx Sign hx nếu h' là positive đối với h và h hx hx' ;
( ' ) 0
Sign h hx nếu 'h hx hx
Xây dựng hàm định lượng ngữ nghĩa:
Giả sử cho trước độ đo tính mờ của các gia tử là ( )h và các giá trị độ đo tính mờ của các phần tử sinh fm c( ) , fm c( ) và giá trị của phần tử trung hòa(neutral).
Hàm định lượng ngữ nghĩa v của X được xây dựng như saux h imh h ci2 1i 1) v c( ) fm c( ) , v c( ) fm c( ) ; 2) fm x( ) fm h h h c( im i2 1i ) ( )him ( ) ( ) ( )h2 h fm c1 ; 3) ( ) ( ) ( ) ( ) 1(1 ( ) ( )( ) ( )) 2 p j j i j j j i j j
v h x v x Sign h x fm h x Sign h x Sign h h x fm h x
Nếu j p và 1 1 ( ) ( ) ( ) ( ) (1 ( ) ( )( ) ( )) 2 j j j i p j j i j j
v h x v x Sign h x fm h x Sign h x Sign h h x fm h x
20
2.5.2. Giải bài toán mờ bằng nội suy đại số gia tử a. Giải bài toán mờ bằng nội suy a. Giải bài toán mờ bằng nội suy
Xét mô hình mờ: 1 1 2 2 (1) (2) ( ) n n IF X A THEN Y B IF X A THEN Y B n IF X A THEN Y B
Gọi X Y, là, các đại số gia tử sinh ra từ các giá trị ngôn ngữ tương ứng xuất hiện trong mô hình. Khi đó ta có thể xem mỗi mệnh đề if then xác định một điểm trong tích X Y và n mệnh đề trên xác định một đường cong mờ c trong không gian X Y .Gọi fx và fy là, các hàm định lượng ngữ nghĩa tương ứng của X và của Y. Các hàm này sẽ chuyển đường cong mờ c thành đường cong thực C trong không gian
1,0 0,1 .
Như vậy bài toán lập luận mờ được chuyển về bài toán nội suy thông thường nhờ hàm định lượng đại số gia tử.
Có thể thấy phương pháp này có một số ưu điểm sau:
- Cho một ý tưởng trực quan rõ ràng Về cách thức giải bài toán.
- Trong phương pháp giải dưa trên lý thuyết tập mờ có rất nhiều yếu tố gây sai số và không dễ có trực quan như: xây dưng hàm thuộc; chọn cách giải nghĩa mệnh đề then bằng quan hệ mờ (thực chất là chọn việc giải nghĩa toán tử kéo theo); chọn toán tử kết nhập (aggregation) các quan hệ chọn phép hợp thanh để tính output; chọn phương pháp khử mờ.
Trong phương pháp nội suy trên chỉ phải tập trung lựa chọn độ đo của các gia tử và chúng trở thành hệ tham số của phượng pháp. Vì vậy nó rất gần gũi với các cách giải kinh điển.
Không cần phương pháp khử mờ Lưu ý rằng trong lý thuyết tập mớ có khá nhiều phượng pháp khử mờ.
21
b. Chuyển điều khiển mờ sang điều khiển dùng đại số gia tử Bài toán điều khiển mờ thông thường có các bước sau đây:
- Bước 1: Xác định biến vào, biến trạng thái và1ến điều khiển (biến ra) và xác định tạp nền của các biến.
- Bước 2: Phân hoạch tập nền và gán nhãn ngôn ngữ cho mỗi tập mờ (mờ hóa ).
- Bước 3: Xác định dạng hàm thuộc cho mỗi tập mờ.
- Bước 4: Xây dưng quan hệ mờ giữa các tập mở đầu vào, tập mờ trạng thái và tập mờ điều khiển tạo thành hệ luật điều khiển (bảng điều khiển trên cơ sở tri thức chuyên gia).
- Bước 5: Giải bài toán lập luận xấp xỉ xác định tập mở đầu ra điều khiến theo từng luật (phép hợp thành).
- Bước 6: Kết nhập (aggregate) các đầu ra điều khiển mờ.
- Bước 7: Giải mờ tìm điều khiển rõ.
Để sử dụng đại số gia tử cần phải chuyển lần lượt các bước trên đây sang dạng đại số gia tử như sau:
- Bước l: Xác định biến vào, biến trạng thái và biến điều khiển (biến ra) và xác định khoảng làm việc của các biến. Xác định các điều kiện tính toán (chọn các bộ tham số tính toán của đại số gia tử).
- Bước 2 : Tính toán các giá trị định lượng ngữ nghĩa của biến đầu vào biến trạng thái và biến điều khiển (áp các gia tử lên các khoảng làm việc của các biến).
- Bước 3: (Tương đương với bước 3 và bước 4 ở trên). Chuyển bảng điều khiển mờ sang bảng điều khiến với các tham số ngữ nghĩa định lượng của đại số gia tử thay thế cho các tập mờ.
- Bước 4: (Tương đương với bước 5 ở trên) Giải bài toán lập luận xấp xỉ trên cơ sở đại số gia tử để xác định ngữ nghĩa định lượng của điều khiển, trạng thái.
- Bước 5: (Tương đương với bước 6 ở trên). Kết nhập các giá, trị ngữ nghĩa định lượng của điều khiên và xây dưng đường cong ngữ nghĩa định lượng.
- Bước 6: (Tương đương với bước 7 ở trên). Trên cơ sở điều kiện ban đầu của bài toán điều khiển, giải bài toán nội suy đường cong ngữ nghĩa định lượng xác định giá trị điều khiển thực.
22
2.5.3. Ứng dụng giải thuật di truyền để xác định thông số tối ưu cho bộ điều khiển Giới thiệu giải thuật di truyền GA Giới thiệu giải thuật di truyền GA
Thuật toán di truyền (Genetic Algorithms - GA) là phương pháp tìm kiếm toàn cục ngẫu nhiên dựa trên cơ chế chọn lọc tự nhiên và di truyền học tự nhiên. Chúng lặp đi lặp lại việc tìm kiếm và được sử dụng rộng rãi trong các bài toán tối ưu hóa ở một số ngành khoa học và công nghệ. Chúng ta có thể xem tiến trình trên như là một qui trình vòng kín (tạo ra các thế hệ mới). Quá trình lai ghép, đột biến, chọn lọc bắt đầu lại từ điểm cơ sở và các mẫu tốt nhất sẽ được chọn. Việc lựa chọn các thể di truyền (sản phẩm của sự kết hợp giữa 2 cá thể cha mẹ) là một quá trình ngẫu nhiên nhưng nó được định hướng bởi việc lựa chọn các mẫu tốt nhất trong quần thể. Thực tế, để kết thúc quá trình GA sau khi số lượng thế hệ được tạo ra và sau đó tiến hành kiểm tra chất lượng của tập hợp đó. Nếu không tìm thấy giải pháp tối ưu, GA có thể được khởi động lại hoặc tìm kiếm mới bắt đầu.
Tóm lại, để giải quyết bài toán bằng giải thuật di truyền, chúng ta cần thực hiện bảy bước quan trọng sau đây:
Bước 1: Chọn mô hình cho lời giải của bài toán, chọn một số lời giải tượng trưng cho toàn bộ các lời giải (tương đương như quần thể) có thể có của bài toán.
Bước 2: Chỉ định cho mỗi lời giải (cá thể) một ký hiệu (mã hoá). Ký hiệu có thể là một dãy các số 0 và 1 hay dãy số thập phân, dãy các chữ hay hỗn hợp của số và chữ. Ký hiệu đơn giản nhất và thường dùng nhất là dãy số 0 và 1.
Bước 3: Tìm hàm số thích nghi cho bài toán và tính hệ số thích nghi cho từng lời giải (cá thể).
Bước 4: Dựa trên hệ số thích nghi của các lời giải để thực hiện chọn lọc (Selection) và các phép toán di truyền như: lai ghép (Crossover), đột biến (Mutation).
Bước 5: Tính hệ số thích nghi cho các lời giải (cá thể) mới, loại bỏ đi các cá thể kém nhất để chỉ còn giữ lại một số nhất định các cá thể tương đối tốt.
Bước 6: Nếu chưa tìm được lời giải mong muốn (tối ưu) hay tương đối tốt nhất hay chưa hết thời gian ấn định, quay lại bước 4 để tìm lời giải mới.
Bước 7: Tìm được lời giải tối ưu hay thời gian ấn định đã hết thì kết thúc giải thuật và đưa ra kết quả tìm được.
23
Hình 2.6: Lưu đồ giải thuật di truyền
2.6. Giới thiệu về học tăng cường 2.6.1. Giới thiệu chung
Trong những năm gần đây DeepMind đã giới thiệu nhiều phần mềm chơi trò chơi mà có thể chiến thắng áp đảo các tuyển thủ trên thế giới, từ các trò chơi đơn giản như Mario, Caro, cờ vây, Atari … tới những trò chơi phức tạp như StarCraft, Dota2. Và để làm được điều đó đằng sau những công nghệ đó là một giải thuật được nghiên cứu từ rất lâu: Học tăng cường ( Reinforcement Learning).
Học tăng cường là một nhánh của học máy (machine learning). Thuật toán này đào tạo các mô hình học máy để đưa ra một chuỗi các quyết định. Tác tử học cách đạt được mục tiêu trong một môi trường không chắc chắn hoặc có thể rất phức tạp.