Hệ thống bất biến theo thời gian trong biểu thức (1.88) có thể đạt đƣợc nếu chỉ có một ma trận
1
n n
Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc-tnu.edu.vn
30
cấp n. Nếu bi là cột thứ i của BRn x n, khi đó hệ thống là bình thƣờng nếu:
1
n
U b Ab A b (1.100) cấp n cho mỗi giá trị i = 1, 2, …, m ; mà khi thành lập cho mỗi giá trị riêng biệt u, uRm.
Giả sử hệ thống bình thƣờng và ta muốn dẫn x(t0) tiến đến trạng thái cuối cố định x(T) với hàm điều khiển thỏa u(t) 1. Khi đó:
1. Nếu trạng thái cuối x(T) bằng zero, khi đó sẽ tồn tại bộ điều khiển thời gian tối thiểu nếu hệ thống không có cực với phần thực dƣơng.
2. Cho bất kỳ giá trị x(T) cố định, nếu tồn tại đáp án cho bài toán tối ƣu thời gian thì nó là duy nhất.
3. Cuối cùng, nếu hệ thống có n cực thực và nếu tồn tại bộ điều khiển tối ƣu thời gian thì mỗi thành phần ui(t) của bộ điều khiển tối ƣu thời gian thay đổi n-1 lần.
1.2.4. Kết luận
Phƣơng pháp biến phân cổ điển Euler_Lagrange thuận lợi khi giải bài toán tối ƣu mà phiếm hàm có dạng phi tuyến, còn tín hiệu điều khiển là những hàm trơn mà ta có thể dự đoán trƣớc dựa trên bản chất vật lý của chúng. Phƣơng pháp này gặp nhiều khó khăn khi áp dụng cho các trƣờng hợp mà tín hiệu điều khiển có thể là hàm gián đoạn. Trên thực tế ta thƣờng gặp bài toán tối ƣu mà tín hiệu điều khiển lại là hàm liên tục từng đoạn, cho nên phƣơng pháp biến phân cổ điển bị hạn chế khả năng sử dụng trong thực tế rất nhiều.
Đối với hệ thống gián đoạn tốt nhất ta nên áp dụng phƣơng pháp quy hoạch động của Belman. Đặc biệt với các bài toán tối ƣu phức tạp dùng máy tính số tác động nhanh giải quyết bằng phƣơng pháp này rất có hiệu quả. Tuy
Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc-tnu.edu.vn
31
nhiên, do hàm mô tả tín hiệu điều khiển tìm đƣợc theo bảng số liệu rời rạc nên biểu thức giải tích của tín hiệu điều khiển chỉ là gần đúng. Phƣơng pháp quy hoạch động còn gặp hạn chế khi áp dụng đối với hệ thống liên tục vì rất khó giải phƣơng trình Belman.
Nguyên lý cực tiểu Pontryagin áp dụng tốt cho các bài toán tối ƣu có điều kiện ràng buộc bất kể điều kiện ràng buộc cho theo hàm liên tục hoặc hàm gián đoạn. Nhƣng đối với bài toán tối ƣu phi tuyến thì nguyên lý cực tiểu
Pontryagin lại gặp khó khăn, đặc biệt trong việc xác định các hàm phụ i( )t
để cho hàm H đạt cực đại.
1.3. ĐIỀU KHIỂN TỐI ƢU CÁC HỆ TUYẾN TÍNH VỚI PHIẾM HÀM DẠNG TOÀN PHƢƠNG LQR DẠNG TOÀN PHƢƠNG LQR
Trong phần này chúng ta sẽ xem xét phƣơng pháp xây dựng bài toán tổng hợp các hệ tuyến tính với chỉ tiêu chất lƣợng dạng toàn phƣơng.
1.3.1 Ổn định Lyapunov đối với hệ thống tuyến tính
Tiêu chuẩn ổn định thứ hai của Lyapunov ( điều kiện đủ )
Xét hệ thống được mô tả bởi phương trình trạng thái:
) ,..., , (x1 x2 xn f x
Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc-tnu.edu.vn
32
Nếu tìm được một hàm V(x) với mọi biến trạng thái x1, x2,…, xn là một hàm xác định dấu dươn, sao cho đạo hàm của nó
dt x dV
dựa theo phương trình vi phân của chuyển động bị nhiễu cũng là hàm xác định dấu, song trái dấu với hàm V(x) thì chuyển động không bị nhiễu sẽ ổn định tiệm cận.
( ). ( ) 0 V x V x : hệ thống ổn định tiệm cận. ( ). ( ) 0 V x V x : hệ thống ổn định. ( ). ( ) 0 V x V x : hệ thống không ổn định. Phƣơng trình Lyapunov
Xét hệ tuyến tính mô tả bởi phƣơng trình trạng thái:
Ax
x (1.115) Yêu cầu cực tiểu hoá chỉ tiêu chất lƣợng J:
0
T J x Qxdt
(1.116) với Q là ma trận vuông xác định dƣơng.
Chọn hàm năng lƣợng V(x) xác định dƣơng:
T
V x x Sx (1.117) trong đó ma trận S là ma trận vuông xác định dƣơng. V x có dạng:
T T T V x x Sx x Sxx Sx T T T Ax Sx x S Ax x Sx T T T T x A Sx x SAx x Sx T T x A S SA S x
Do V(x) xác định dƣơng, nên để hệ thống ổn định thì V x( ) phải là xác định âm.Ta chọn V x( ) x QxT ( do Q là ma trận xác định dƣơng nên V x( ) sẽ là xác định âm ).
Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc-tnu.edu.vn
33
Điều kiện cần và đủ để trạng thái cân bằng x = 0 ổn định tiệm cận: cho trước bất kỳ một ma trận xác định dương Q và ma trận A ổn định, tồn tại một ma trận xác định dương S thoả mãn phương trình:
Q S SA S AT T S A S SA Q (1.119) Phƣơng trình (1.119) đƣợc gọi là phƣơng trình Lyapunov.
Khi S không thay đổi theo thời gian S 0, ta có phƣơng trình đại số
Lyapunov: 0 A ST SA Q (1.120) Chỉ tiêu chất lƣợng J đƣợc tính nhƣ sau: 0 0 0 0 T T T T J x Qxdt x Sx x Sx x Sx
Khi tất cả các phần tử của ma trận A âm, ta có x 0. Do đó:
0 0
T
J x Sx (1.121)
1.3.2 Điều khiển tối ƣu hệ tuyến tính với chỉ tiêu chất lƣợng dạng toàn phƣơng _ Phƣơng trình Riccati đối với hệ liên tục phƣơng _ Phƣơng trình Riccati đối với hệ liên tục
Xét hệ thống:
Bu Ax
x (1.122) Chúng ta cần tìm ma trận K của vector điều khiển tối ƣu:
t Kx t
u (1.123) thỏa mãn chỉ tiêu chất lƣợng J đạt giá trị cực tiểu:
0 dt Ru u Qx x J T T (1.124) Trong đó Q là ma trận xác định dƣơng ( hoặc bán xác định dƣơng ), R
là ma trận xác định dƣơng. Chú ý: thành phần thứ hai ở phần bên phải phƣơng trình (1.124) xác định lƣợng năng lƣợng tiêu tốn của tín hiệu điều khiển.
Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc-tnu.edu.vn
34
Chúng ta sẽ chứng minh luật điều khiển tuyến tính cho bởi phƣơng trình (1.123) là luật điều khiển tối ƣu. Khi đó, nếu ma trận K đƣợc xác định để tối thiểu hoá chỉ tiêu chất lƣợng J thì luật điều khiển u(t) sẽ tối ƣu với mọi trạng thái ban đầu x(0).
Từ (1.122) và (1.123) ta có:
A BKx BKx
Ax
x (1.125) Thay u t Kx t vào phƣơng trình (1.124):
0 0 xdt RK K Q x dt RKx K x Qx x J T T T T T (1.126)
Bây giờ ta chọn hàm năng lƣợng:
( ) T
V x x Sx V x( ) 0, x (1.127) với S là ma trận vuông xác định dƣơng.
V x( )x SxT x SxT x SxT
xT(ABK)TSxx SxT x S AT ( BK x)
xT (A BK )TS S S A BK( )x (1.128) Do V(x) xác định dƣơng, nên để hệ thống ổn định thì V x( ) phải là xác định âm. Ta đặt: ( ) d T T( T ) V x x Sx x Q K RK x dt ( do Q và R là ma trận xác định dƣơng nên ma trận T QK RK cũng là xác định dƣơng, từ đó V x( ) sẽ là xác định âm ). T T T T x QK RK x x A BK SS A BK S x T T QK RK A BK SS A BK S (1.129)
Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc-tnu.edu.vn
35
Theo tiêu chuẩn ổn định thứ hai của Lyapunov, nếu ma trận (A-BK) ổn định thì sẽ tồn tại một ma trận xác định dƣơng S thoả mãn phƣơng trình (1.129).
Chỉ tiêu chất lƣợng bây giờ có thể đƣợc xác định nhƣ sau:
0 0 0 0 Sx x Sx x Sx x dt Ru u Qx x J T T T T T Lƣu ý rằng x 0 J x 0 TSx0 Đặt RTTT , phƣơng trình (1.129) trở thành: AT KTBTSSABKSQKTTTTK 0
Phƣơng trình trên có thể viết lại nhƣ sau:
1 1 1 0 S Q S B SBR S B T TK S B T TK SA S A T T T T T T T (1.130)
Chỉ tiêu chất lƣợng J đạt giá trị cực tiểu khi biểu thức:
TK T B S TK T B Sx x T T T T T T 1 1
đạt giá trị cực tiểu. Khi đó: T B S
TK T 1 T
KT1 TT 1BTSR1BTS (1.131) Phƣơng trình (1.131) cho ta ma trận tối ƣu K. Nhƣ vậy, luật điều khiển tối ƣu cho bài toán điều khiển tối ƣu dạng toàn phƣơng với chỉ tiêu chất lƣợng cho bởi phƣơng trình (1.131) là tuyến tính và có dạng:
1 T
u t Kx t R B Sx t (1.132) Ma trận S khi đó phải thỏa mãn phƣơng trình (1.130) đƣợc viết lại nhƣ sau:
1
T T
A SSA SBR B S Q S (1.133) Phƣơng trình (1.133) đƣợc gọi là phƣơng trình Riccati.
Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc-tnu.edu.vn
36
Khi S không thay đổi theo thời gian S 0, ta có phƣơng trình đại số
Riccati ( ARE: Algebraic Riccati Equation ):
1
0
T T
A SSA SBR B S Q (1.134)
1.3.3 Phƣơng trình Riccati đối với hệ rời rạc
Xét hệ rời rạc: 1 k k k k k x A x B u (1.135) với n k x R và m k u R .
Chỉ tiêu chất lƣợng J đƣợc định nghĩa trong khoảng [1,N] có dạng:
1 N T T i k k k k k k k i J x Q x u R u (1.136) Khi đó, luật điều khiển tối ƣu của tín hiệu điều khiển có dạng:
k k k u K x (1.137) với Kkđƣợc xác định nhƣ sau: 1 1 1 ( T ) T k k k k k k k k K B S B R B S A (1.138) Trong đó Sk phải thoả mãn phƣơng trình:
1 1 1 1 1 T T T k k k k k k k k k k k k k S A S S B B S B R B S A Q (1.139)
Phƣơng trình (1.139) chính là phƣơng trình Riccati cho hệ rời rạc. Khi
0
k
S với k, ta có thể dùng bổ đề ma trận nghịch đảo để viết lại phƣơng trình (1.139) nhƣ sau: 1 1 1 T T k k k k k k k k S A S B R B A Q (1.140)
1.3.4 Các bƣớc giải bài toán toàn phƣơng tuyến tính
Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc-tnu.edu.vn 37 Thành lập hệ phƣơng trình trạng thái: x Ax Bu c Dx Xác định các thông số A, B, D. Bước 2:
Xác định ma trận trọng lƣợng Q, R từ chỉ tiêu chất lƣợng J cho dƣới dạng toàn phƣơng tuyến tính.
Bước 3:
Tìm nghiệm S của phƣơng trình Riccati:
- Đối với hệ liên tục: T 1 T
S A S SA SBR B S Q
- Đối với hệ rời rạc:
1 1 1 1 1 T T T k k k k k k k k k k k k k S A S S B B S B R B S A Q Bước 4:
Chỉ tiêu chất lƣợng tối ƣu đối với hệ dừng:
min T 0 0
J x Sx
Bước 5:
Luật điều khiển tối ƣu:
- Đối với hệ liên tục: 1 T u R B Sx
- Đối với hệ rời rạc: 1
1 1
T T
k k k k k k k k k
u B S B R B S A x [1]
Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc-tnu.edu.vn
38
Phƣơng trình Riccati dùng để tổng hợp các hệ tuyến tính với chỉ tiêu chất lƣợng dạng toàn phƣơng. Với cách giải quyết này, ta vừa đảm bảo đƣợc tính ổn định của hệ thống ( do cách chọn hàm năng lƣợng V(x) theo tiêu
chuẩn ổn định thứ hai của Lyapunov ), vừa cực tiểu hoá đƣợc chỉ tiêu chất lƣợng J theo yêu cầu bài toán đặt ra.
Tuy nhiên, để giải đƣợc phƣơng trình Riccati thì các ma trận trong phƣơng trình này phải là tuyến tính và xác định. Trong trƣờng hợp các phần tử trong ma trận này là phi tuyến thì việc giải phƣơng trình tối ƣu Riccati khó thực hiện. Luận văn nghiên cứu và đề xuất giải pháp dùng thuật toán di truyền để giải quyết bài toán trên.
Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc-tnu.edu.vn
39
CHƢƠNG 2
THUẬT TOÁN DI TRUYỀN (GA) VÀ ỨNG DỤNG TRONG VIỆC XÁC ĐỊNH THAM SỐ TỐI ƢU BỘ ĐIỀU KHIỂN LQR
2.1 KHÁI QUÁT
Thuật toán di truyền là thuật toán tối ƣu ngẫu nhiên dựa trên cơ chế chọn lọc tự nhiên và tiến hóa di truyền. Nguyên lý cơ bản của thuật toán di truyền đã đƣợc Holland giới thiệu vào năm 1962. Cơ sở toán học đã đƣợc phát triển từ cuối những năm 1960 và đã đƣợc giới thiệu trong quyển sách đầu tiên của Holland, Adaptive in Natural and Artificial Systems. Thuật toán di truyền đƣợc ứng dụng đầu tiên trong hai lĩnh vực chính: tối ƣu hóa và học tập của máy. Trong lĩnh vực tối ƣu hóa thuật toán di truyền đƣợc phát triển nhanh chóng và ứng dụng trong nhiều lĩnh vực khác nhau nhƣ tối ƣu hàm, xử lý ảnh, bài toán hành trình ngƣời bán hàng, nhận dạng hệ thống và điều khiển.
Thuật toán di truyền cũng nhƣ các thuật toán tiến hóa nói chung, hình thành dựa trên quan niệm cho rằng, quá trình tiến hóa tự nhiên là quá trình hoàn hảo nhất, hợp lý nhất và tự nó đã mang tính tối ƣu. Quan niệm này có thể xem nhƣ một tiên đề đúng, không chứng minh đƣợc, nhƣng phù hợp với thực tế khách quan. Quá trình tiến hóa thể hiện tính tối ƣu ở chỗ, thế hệ sau bao giờ cũng tốt hơn (phát triển hơn, hoàn thiện hơn) thế hệ trƣớc bởi tính kế thừa và đấu tranh sinh tồn.[6]
Thuật giải di truyền (GA) là kỹ thuật chung giúp giải quyết vấn đề-bài toán bằng cách mô phỏng sự tiến hóa của con ngƣời hay của sinh vật nói chung (dựa trên thuyết tiến hóa muôn loài của Darwin) trong điều kiện qui định sẵn của môi trƣờng. GA là một thuật giải, nghĩa là mục tiêu của GA không nhằm đƣa ra lời giải chính xác tối ƣu mà là đƣa ra lời giải tương đối tối ƣu.
Trong các tài liệu về GA, ngƣời ta thƣờng đề cập đến hai thuật ngữ là "thuật giải di truyền" và "lập trình di truyền". Theo các tài liệu này, "thuật giải di truyền" chỉ sử dụng cấu trúc dữ liệu là chuỗi số nhị phân còn "lập trình di
Số hóa bởi Trung tâm Học liệu – ĐHTN http://www.lrc-tnu.edu.vn
40
truyền" nghĩa là sử dụng cấu trúc dữ liệu tổng quát. Sở dĩ có cách hiểu nhƣ thế vì ý niệm thuật giải di truyền xuất hiện trƣớc và ban đầu ngƣời ta chỉ áp dụng nó với cấu trúc dữ liệu là chuỗi nhị phân. Về sau, ngƣời ta mới đƣa ra cách áp dụng thuật giải này trên các cấu trúc dữ liệu tổng quát hơn nên gọi là lập trình di truyền.
Theo đề xuất ban đầu của giáo sƣ John Holland, một vấn đề-bài toán đặt ra sẽ đƣợc mã hóa thành các chuỗi bit với chiều dài cố định. Nói một cách chính xác là các thông số của bài toán sẽ đƣợc chuyển đổi và biểu diễn lại dƣới dạng các chuỗi nhị phân. Các thông số này có thể là các biến của một hàm hoặc hệ số của một biểu thức toán học. Ngƣời ta gọi các chuỗi bit này là mã genome ứng với mỗi cá thể, các genome đều có cùng chiều dài. Nói ngắn gọn, một lời giải sẽ đƣợc biểu diễn bằng một chuỗi bit, cũng giống nhƣ mỗi cá thể đều đƣợc quy định bằng gen của cá thể đó vậy. Nhƣ vậy, đối với thuật giải di truyền, một cá thể chỉ có một gen duy nhất và một gen cũng chỉ phục vụ cho một cá thể duy nhất. Do đó, gen chính là cá thể và cá thể chính là gen nên ta sẽ dùng lẫn lộn thuật ngữ gen và cá thể từ đây về sau.
Ban đầu, ta sẽ phát sinh một số lƣợng lớn, giới hạn các cá thể có gen ngẫu nhiên - nghĩa là phát sinh một tập hợp các chuỗi bit ngẫu nhiên. Tập các cá thể này đƣợc gọi là quần thể ban đầu (initial population). Sau đó, dựa trên một hàm nào đó, ta sẽ xác định đƣợc một giá trị gọi là độ thích nghi - Fitness. Giá trị này, để đơn giản cho bạn đọc lúc đầu, có thể tạm hiểu chính là độ "tốt" của lời giải hay độ cao trong tìm kiếm theo kiểu leo đồi. Vì phát sinh ngẫu