Trang 1 ĐIỀU KHIỂN HỌCLet’s start with the first set of Trang 2 Khái niệm về điều khiển họcSo sánh điều khiển học và điều khiển thích nghiSơ đồ khối hệ thống điều khiển họcThực thi hệ
Trang 1ĐIỀU KHIỂN HỌC Let’s start with the first set of
slides
Trang 2Khái niệm về điều khiển học
So sánh điều khiển học và điều khiển
thích nghi
Sơ đồ khối hệ thống điều khiển học
Thực thi hệ thống điều khiển học
Các thí dụ điều khiển học dùng mạng
RBF, điều khiển học mờ
Trang 3Khái niệm hệ thống điều khiển học
✘Là hệ thống có khả năng cải thiện chất lượng điều khiển trong tương lai dựa vào:
*thông tin kinh nghiệm thu thập trong quá khứ*
*thông qua tương tác vòng kín với đối tượng và môi trường*
Trang 4Khái niệm hệ thống điều khiển học
✘Đặc điểm của hệ thống điều khiển học:
*Có khả năng tự chủ (autonomy), vì có thể cải thiện chất lượng của chính nó*
*Có bộ nhớ để lưu trữ thông tin quá
khứ=>cải thiện chất lượng tương lai
*Hệ thống nhận thông tin phản hồi chất
lương dựa trên một hàm mục tiêu mà hệ thống tìm cực trị*
Trang 5So sánh
ĐIỀU KHIỂN HỌC
VSĐIỀU KHIỂN THÍCH NGHI
Trang 6do lưu trong bộ nhớ -> không cần quá trình thích nghi khi lặp lại tình huống cũ.
Hệ thống điều khiển thích nghi không có bộ nhớ, phải chỉnh định lại thông số khi tình huống cũ lặp lại
Trang 7Cơ sở Tri thức
Trang 8Thực thi hệ thống
Tra bảng:
Phân chia không gian tín hiệu vào thành các miền rời nhau sao cho tín hiệu ra có thể được xác định bằng cách “ tra bảng“ tương ứng với miền tín hiệu vào
Rất nhiều hệ thống diều khiển học được thực hiện bằng cách này
Khuyết điểm : Tổ hợp các miền tín hiệu vào tăng lên khi không gian trạng thái tăng lên hoặc số miền phân chia mỗi chiều không gian trạng thái tăng lên
Trang 9Thực thi hệ thống
- Mô tả mộtcáchhiệu quả qua các thông số tự do
- Cần ít bộ nhớ để biểu diễn một hàm liên tục
- Có tính chất tổng quát hóa ( tức là nội suy giữa những điểm tín hiệu vào ).
Cấu trúc xấp xỉ hàm được sử dụng phổ biến : mạng thần kinh (MLP,RBF) và mô hình mờ(mamdani ,takagi-
sugeno)
Trang 10THÍ DỤ ĐIỀU KHIỂN HỌC DÙNG MẠNG RBF
Đối tượng mô tả bởi mô hình toán học
Trang 11THÍ DỤ ĐIỀU KHIỂN HỌC DÙNG
MẠNG RBF (tt)
Giả thiết chúng ta chỉ biết bậc của hệ
thống (bậc 2) mà không biết ảnh hưởng của điểm làm việc đến đặc tính động học của hệ thống như thế nào ( tức là không
cụ thể A(v) và B(v) phụ thuộc vào v như thế nào)
Mục tiêu điều khiển là bám theo tín hiệu vào với đáp ứng quá độ cho trước.
Trang 12Place your screenshot here
THÍ DỤ ĐIỀU KHIỂN HỌC DÙNG MẠNG RBF (tt)
thống điều
khiển học
trực tiếp:
Trang 13 độ lợi hồi tiếp trạng thái,
: độ lợi đầu vào
✘
Trang 14Place your screenshot here
THÍ DỤ ĐIỀU KHIỂN HỌC DÙNG MẠNG RBF (tt)
Mục đích của HTĐK học
là nhận dạng và lưu trữ
vector thông số của bộ
điều khiển như hàm của
biến hoạch định điểm
Trang 15 Quá trình học: Tại mỗi thời điểm lấy mẫu hệ thống học thực hiện các tác vụ sau:
Đo lường biến hoạch định điểm làm việc
Đọc độ lợi điều khiển từ ngõ ra mạng RBF:
Tính tín hiệu điều khiển hồi tiếp trạng thái:
Xuất tín hiệu điều khiển tác động vào đối tượng
Sai lệch giữa đáp ứng của đối tượng với tín hiệu ra mong muốn của mô hình chuẩn được sử dụng để cập nhật trọng số mạng RBF
✘
THÍ DỤ ĐIỀU KHIỂN HỌC DÙNG
MẠNG RBF (tt)
Trang 16 Thuật toán cập nhật trọng số mạng RBF:
mạng RBF được tính dựa vào sai số giữa tín hiệu ra của mô hình chuẩn và tín hiệu ra của hệ thống theo công thức:
Trong đó: là hệ số dương nhỏ
bằng thuật toán suy giảm độ dốc:
Trang 18 Kết quả học luật điều khiển : Độ lợi hồi tiếp trạng thái (v)
✘
THÍ DỤ ĐIỀU KHIỂN HỌC DÙNG
MẠNG RBF (tt)
Trang 19 Kết quả học luật điều khiển : Độ lợi hồi tiếp trạng thái (v)
✘
THÍ DỤ ĐIỀU KHIỂN HỌC DÙNG
MẠNG RBF (tt)
Trang 20 Kết quả học luật điều khiển : Độ lợi hồi tiếp trạng thái (v)
✘
THÍ DỤ ĐIỀU KHIỂN HỌC DÙNG
MẠNG RBF (tt)
Trang 21Thí dụ điều khiển học mờ
Đối tượng:tên lửa một tầng có mô hình toán học đơn giản cho bởi phương trình:
Trang 22Thí dụ điều khiển học mờ (tt)
Sơ đồ khối hệ thống điều khiển học mờ:
Trang 23Thí dụ điều khiển học mờ (tt)
o Quan sát dữ liệu vào ra của hệ thống điều khiển mờ
o Đánh giá chất lượng của hệ thống điều khiển
o Tự chỉnh thông số bộ điều khiển mờ để đạt được chất lượng mong muốn (chất lượng mong muốn xác định bởi mô hình
chuẩn trong sơ đồ điều khiển)
o Lưu trữ tri thức (qui luật chỉnh định thông số) vào bộ nhớ
Trang 24Thí dụ điều khiển học mờ (tt)
Bộ điều khiển:Bộ điều khiển được sử dụng là bộ điều khiển PD mờ gồm các qui tắc Sugeno với mệnh đề kết luận là hằng số.
o Tín hiệu vào của bộ điều khiển PD mờ là:
sai số e(k ) r(k ) y(k )
biến thiên sai số: Δe(k ) [e(k ) e(k 1)]/)]/ T
o Tín hiệu ra của bộ điều khiển là u(k) Các hệ số chuẩn hóa ở ngõ vào vàn vào ngõ ra của g
bộ điều khiển là K E, K D, và K U được chọn như sau:
.
Trang 25Thí dụ điều khiển học mờ (tt)
✘ Hàm liên thuộc của các tập mờ định nghĩa cho biến vào e(k) và
Δe(k):
Trang 26Thí dụ điều khiển học mờ (tt)
Các qui tắc điều khiển có dạng:
.
Trang 28Thí dụ điều khiển học mờ (tt)
Cơ chế học: Nếu chất lượng mong muốn được thỏa mãn (e m (k)0) thì cơ ch học sẽ ế
không thỏa mãn (e (k) m lớn) thì cơ chế học sẽ điều chỉnh bộ điều khiển mờ
.
Trang 29Thí dụ điều khiển học mờ (tt)
đối tượng điều khiển
✘ Mô hình ngược được dùng để xác định sự thay đổi ở ngõ vào củ đối tượng alàm cho ngõ ra của đối tượng giống như ngõ ra của mô hình chuẩn
✘ Tín hiệu vào mô hình ngược là: e m (k) và Δe m (k)
✘ Tín hiệu ra mô hình ngược là: p(k)
Trang 30Thí dụ điều khiển học mờ (tt)
.
Trang 31Thí dụ điều khiển học mờ (tt)
• Khối điều chỉnh cơ sở tri thức:
• Điều chỉnh bộ điều khiển mờ để hệ thống đạt được chất lượng điều
khiển tốt hơn.
• Cho thông tin về thay đổi cần thiết ở ngõ vào của đối tượng là p(k),
bộ điều chỉnh cơ sở tri thức sẽ cập nhật cơ sở tri thức của bộ điều khiển mờ (mệnh đề kết luận của các qui tắc điều khiển) sao cho tác động điều khiển trước đó (tức u(k 1)]/)) sẽ được thay đổi một lượng là
p(k).
• Muốn đạt được điều này ngõ ra của các qui tắc mờ tác động thời
điểm lấy mẫu thứ (k 1)]/) phải được thay đổi một lượng là:
Trang 32Thí dụ điều khiển học mờ (tt)
Kết quả điều khiển
.
Trang 33Thí dụ điều khiển học mờ (tt)
.