Xác định ngõ vào, ngõ ra của hệ thống cần nhận dạng ⇒ xác định tín hiệu “kích thích“ để thực hiện thí nghiệm thu thập số liệu và vị trí đặt cảm biến để đo tín hiệu ra.. Nhận dạng mô
Trang 1MÔ HÌNH HÓA VÀ NHẬN DẠNG HỆ THỐNG
Giảng viên: TS Huỳnh Thái Hoàng
Bộ môn Điều Khiển Tự Động, Khoa Điện – Điện Tử
Đại học Bách Khoa TP.HCM Email: hthoang@hcmut.edu.vn,
hthoang.hcmut@yahoo.com Homepage: http://www4.hcmut.edu.vn/~hthoang/
Môn học
Trang 2THỰC NGHIỆM NHẬN DẠNG HỆ THỐNG
Chương 7
Trang 3Vịng lặp nhận dạng hệ thống
Thí nghiệm thu thập dữ liệu
ngữ, … bộ dữ liệuXử lý sơ
Chọn cấu trúc mô hình
Chọn tiêu chuẩn ước lượng Ước lượng thông số
Đánh giá
Trang 4 Thí nghiệm thu thập dữ liệu
Tiền xử lý dữ liệu
Chọn cấu trúc mơ hình
Chọn tiêu chuẩn ước lượng
Đánh giá chất lượng mơ hình
Nội dung chương 7
Trang 6Thí nghiệm thu thập dữ liệu
Trang 7 Xác định ngõ vào, ngõ ra của hệ thống cần nhận dạng
⇒ xác định tín hiệu “kích thích“ để thực hiện thí nghiệm thu thập
số liệu và vị trí đặt cảm biến để đo tín hiệu ra
Chọn tín hiệu vào:
Tín hiệu vào bao gồm thành phần tần số nào?
Biên độ, giá trị cực đại tín hiệu vào bằng bao nhiêu?
Tín hiệu vào quyết định:
điểm làm việc của hệ thống
bộ phận nào và chế độ làm việc nào của hệ thống được kích thích trong thí nghiệm
Xác định chu kỳ lấy mẫu
Các vấn đề liên quan đến thí nghiệm thu thập số liệu
Trang 8 Nhận dạng mô hình tuyến tính:
Tín hiệu vào bé, thay đổi ngẫu nhiên sao cho trạng thái của hệ
thống thay đổi trong phạm vi nhỏ quanh điểm làm việc tĩnh
Nhận dạng mô hình phi tuyến:
Tín hiệu vào ngẫu nhiên, gồm nhiều thành phần tần số và biên độkhác nhau, sao cho trạng thái của hệ thống thay đổi rộng trong phạm vi cần nhận dạng đặc tính phi tuyến
Chọn tín hiệu vào
Trang 9Yêu cầu đối với tín hiệu vào
Tín hiệu vào phải được chọn sao cho tập dữ liệu thu thập được phải
đủ giàu thông tin.
Tập dữ liệu gần dừng Z∞ giàu thông tin nếu ma trận phổ Φz(ω) của tín hiệu z(k) = [y(k) u(k)]T xác định dương tại hầu hết tất cả các tần
(
) ( )
( )
(
ωω
ω
ωω
y yu
uy
u z
Trang 10Tín hiệu kích thích vững
Đối với trường hợp nhận dạng hệ thống hở, tập dữ liệu thực nghiệm
đủ giàu thông tin khi tín hiệu vào u(k) là tín hiệu gần dừng có phổ
φu(ω) > 0 tại hầu hết các tần số ω (“hầu hết” nghĩa là phổ có thể
bằng 0 trong một tập hợp tần số hữu hạn)
Tín hiệu u(k) thỏa mãn điều kiện trên được gọi là tín hiệu kích thích vững (persistently exciting).
Có rất nhiều lựa chọn để tín hiệu vào là tín hiệu kích thích vững
Khi chọn tín hiệu vào cần để ý các yếu tố sau:
Tính chất tiệm cận của thông số ước lượng (độ lệch và phương sai) chỉ phụ thuộc phổ tín hiệu vào, không phụ thuộc dạng sóng tín hiệu vào
Tín hiệu vào phải có biên độ hữu hạn
Tín hiệu vào tuần hoàn có một số ưu điểm
Trang 11k r
k
u N
k
u C
1 2
2 2
) (
1 lim
) ( max
1 0
) (
) (
)
( )
( )
ˆ , (
) ˆ ,
− Φ
Φ Φ
ω
ωω
N j
N j
N
n e
H
e
G Cov
θθ
Ma trận hiệp phương sai của đặc tính tần số nhận dạng tỉ lệ nghịch với công suất tín hiệu vào (xem chương 6)
⇒ công suất tín hiệu vào càng lớn kết quả nhận dạng càng chính xác
Trang 12Thành phần tần số của tín hiệu vào
⇒ Tín hiệu vào cần được chọn sao cho công suất của tín hiệu tập trung vào miền tần số mà tại đó đặc tính tần số của mô hình nhạy với sự thay đổi thông số mô hình
π π
ωλ
H
G B
G
u
r u
u
2
2 0
0 2
2 0
* arg min
θ
θ θ
θ θ
θ
2 0
0
2
) , (
)
( )
(
)
(
) (
) ,
ω
ωω
u
e u u
)
( )
(
ω
ωω
j
u
e H
Tham số tối ưu trong trường hợp nhận dạng hệ hở (xem chương 6)
Trang 13Nhiễu trắng phân bố Gauss qua bộ lọc tần số
Nhiễu trắng có mật độ phổ công suất (Power Spectral Density) bằng nhau tại mọi tần số, cho nhiễu trắng qua bộ lọc tần số ta sẽ được tín hiệu ngẫu nhiên có mật độ phổ công suất tập trung tại miền tần sốmong muốn
Về lý thuyết tín hiệu nhiễu Gauss có biên độ không bị chặn, do đóphải cho tín hiệu nhiễu Gauss bão hòa tại một giá trị ngưỡng nào đó
để được tín hiệu ngẫu nhiên bị chặn Thí dụ có thể cho tín hiệu bão hòa ở mức biên độ bằng 3 lần độ lệch chuẩn, khi đó chỉ có khoảng 1% số mẫu tín hiệu bị ảnh hưởng, tín hiệu sẽ có hệ số đỉnh bằng 3
và méo tần số không đáng kể
Các dạng tín hiệu vào thông dụng
Trang 14 Lệnh Matlab tạo tín hiệu ngẫu nhiên phân bố Gauss
>> u = idinput(N, ‘RGS’,[wmin wmax],[μ-σ μ+σ])
N: số mẫu
‘RGS’: Random Gaussian Signal
[wmin wmax]: băng thông của tín hiệu (mặc định [0 1])
μ: giá trị trung bình của phân bố Gauss (mặc định 0)
σ: độ lệch chuẩn của phân bố Gauss (mặc định 1)
Các dạng tín hiệu vào thông dụng (tt)
Trang 15 Thí dụ tín hiệu ngẫu nhiên phân bố Gauss
Các dạng tín hiệu vào thông dụng (tt)
(a) Băng thông [0 1]
4 6 8
Trang 16Tín hiệu nhị phân ngẫu nhiên
Tín hiệu nhị phân ngẫu nhiên là tín hiệu có biên độ thay đổi ngẫu
nhiên giữa hai mức cố định
Có thể tạo ra tín hiệu nhị phân ngẫu nhiên bằng cách lấy dấu tín hiệu ngẫu nhiên phân bố Gauss, sau đó có thể dịch mức −1 và +1 sang hai mức bất kỳ
Tín hiệu nhị phân ngẫu nhiên có hệ số đỉnh bằng 1
Không thể điều chỉnh như ý muốn dạng phổ tín hiệu
Các dạng tín hiệu vào thông dụng (tt)
Trang 17 Lệnh Matlab tạo tín hiệu nhị phân ngẫu nhiên
>> u = idinput(N, ‘RBS’,[wmin wmax],[umin umax])
N: số mẫu
‘RBS’: Random Binary Signal
[wmin wmax]: băng thông của tín hiệu (mặc định [0 1])
[umin umax]: mức thấp và mức cao của tín hiệu
(mặc định [−1 +1])
Các dạng tín hiệu vào thông dụng (tt)
Trang 18 Thí dụ tín hiệu nhị phân ngẫu nhiên
Các dạng tín hiệu vào thông dụng (tt)
(a) Băng thông [0 1]
Trang 19Tín hiệu nhị phân ngẫu nhiên giả
(PRBS – Pseudo-Random Binary Signal)
Các dạng tín hiệu vào thông dụng (tt)
Tín hiệu PRBS là tín hiệu tuần hoàn với chu kỳ cực đại là M=2 n – 1, chu kỳ tuần hoàn của tín hiệu phụ thuộc vào A(q) Với mỗi giá trị n
tồn tại đa thức A(q) để chu kỳ tuần hoàn của tín hiệu PRBS đạt cực
)2),(
)1(
(rem)
2),()((rem)
(rem: phần dư (remainder))
Tín hiệu nhị phân ngẫu nhiên giả là tín hiệu tiền định, tuần hoàn cócác tính chất giống tín hiệu nhiễu trắng Tín hiệu nhị phân ngẫu nhiên giả được tạo ra nhờ phương trình sai phân:
Trang 20Các dạng tín hiệu vào thơng dụng (tt)
a9, a11
2047 11
a7, a10
1023 10
a4, a9
511 9
a1, a2, a7, a8
255 8
a3, a7
127 7
a1, a6
63 6
a2, a5
31 5
a1, a4
15 4
a2, a3
7 3
a1, a2
3 2
Hệ số bằng 1
M=2 n−1 Bậc n
Đa thức A(q) tạo ra tín hiệu PRBS cĩ độ dài cực đại, các hệ số của A(q) khơng được liệt kê trong bảng cĩ giá trị bằng 0
Trang 21Các dạng tín hiệu vào thông dụng (tt)
Phổ công suất của tín hiệu PRBS có M–1 vạch có độ cao bằng nhau phân bố trong miền −π≤ω<π (không kể thành phần tần số ω=0)
⇒ tín hiệu PRBS có tính chất “giống” như nhiễu trắng tuần hoàn
∑− −
) (ω πu M δ ω πl M
u M
,
2 , ,
0 )
( ) (
1 )
M M
l u
l k u k
u M
l
k u
Tín hiệu PRBS độ dài cực đại có biên độ thay đổi giữa hai giá trị
có tính chất sau:
Trang 22 Lệnh Matlab tạo tín hiệu ngẫu giả
>> u = idinput(N, ‘PRBS’,[0 B],[umin umax])
N: số mẫu
‘PRGS’: Pseudo Random Gaussian Signal
[wmin wmax]: băng thông của tín hiệu (mặc định [0 1])
[umin umax]: mức thấp và mức cao của tín hiệu
(mặc định [−1 +1])
Các dạng tín hiệu vào thông dụng (tt)
Trang 23 Thí dụ tín hiệu nhị phân ngẫu nhiên giả
Các dạng tín hiệu vào thông dụng (tt)
Trang 24Tín hiệu đa hài (multi-sines)
Các dạng tín hiệu vào thông dụng (tt)
Tín hiệu đa hài là tổng của nhiều thành phần hình sin
a k
u
1
) cos(
−
k u
(
[ 4
2 )
Bằng cách chọn d, ak, ωk, có thể tập trung công suất tín hiệu tại các tần số mong muốn một cách chính xác
Khuyết điểm của tín hiệu đa hài là hệ số đỉnh cao, có thể lên đến
nếu các thành phần hình sin cùng pha và có biên độ bằng nhau
d
2
Để giảm hệ số đỉnh cần chọn pha φk sao cho các thành phần lệch pha càng nhiều càng tốt
Trang 25 Lệnh Matlab tạo tín hiệu đa hài
>> u = idinput(N,‘SINE’,[wmin wmax],[umin umax], SINEDATA)
N: số mẫu
‘SINE’: Multi-sines signal
[wmin wmax]: băng thông của tín hiệu (mặc định [0 1])
[umin umax]: mức thấp và mức cao của tín hiệu
(mặc định [−1 +1])
SINEDATA = [No_of_Sinusoids, No_of_Trials, Grid_Skip]
Các dạng tín hiệu vào thông dụng (tt)
Trang 26 Thí dụ tín hiệu đa hài
Các dạng tín hiệu vào thông dụng (tt)
(a) Băng thông [0 1]
Trang 27 Lấy mẫu quá nhanh (Ts nhỏ) có thể dẫn đến các khó khăn khi ước lượng thông số bằng phương pháp số, mô hình khớp (fit) ở miền tần
số cao Nếu hệ thống có thời gian chết thì việc chọn chu kỳ lấy mẫu quá nhỏ có thể sẽ làm cho hệ thống được mô hình hóa với khâu trểkéo dài trong nhiều chu kỳ lấy mẫu, điều này sẽ gây khó khăn khi sửdụng mô hình để thiết kế hệ thống điều khiển
Lấy mẫu quá chậm (Ts lớn) có thể gây ra méo tần số làm mất thông tin Khi chu kỳ lấy mẫu tăng vượt quá thời hằng tự nhiên của hệ
thống phương sai tăng đột ngột
Chu kỳ lấy mẫu tối ưu trong trường hợp số mẫu dữ liệu cố định xấp
xỉ thời hằng của hệ thống Nếu không biết trước thời hằng của hệ
thống thì ta phải ước lượng, nếu thời hằng ước lượng cao hơn thực
tế thì việc chọn chu kỳ lấy mẫu xấp xỉ thời hằng sẽ dẫn kết kết quả
Chọn chu kỳ lấy mẫu
Trang 28 Số mẫu dữ liệu càng nhiều càng mất nhiều thời gian tính toán
Chọn số mẫu dữ liệu
1 0
) (
) (
)
( )
( )
ˆ , (
) ˆ ,
− Φ
Φ Φ
ω
ωω
N j
N j
N
n e
H
e
G Cov
θθ
Ma trận hiệp phương sai của đặc tín tần số nhận dạng tỉ lệ nghịch với số mẫu dữ liệu (xem chương 6)
⇒ Số mẫu dữ liệu càng nhiều thì kết quả nhận dạng càng chính xác
Nên chọn số mẫu dữ liệu bằng khoảng 100 lần số tham số cần nhận dạng
Trang 29Tiền xử lý dữ liệu
Trang 30 Dữ liệu thu thập khi thí nghiệm thường không thể sử dụng ngay
trong các thuật toán nhận dạng hệ thống do các khiếm khuyết sau:
Nhiễu tần số cao trong tập dữ liệu thu thập được
Tập dữ liệu bị gián đoạn, thiếu dữ liệu, hoặc có các giá trị đo sai (outlier)
Nhiễu tần số thấp, trôi (drift), độ lệch không (offset)
Do vậy, nếu thực hiện nhận dạng offline trước tiên nên vẽ đồ thị dữliệu vào ra, xem xét đồ thị để phát hiện ra các khiếm khuyết trong tập dữ liệu và tiền xử lý tập dữ liệu để loại bỏ các khiếm khuyết
(nếu có)
Tại sao cần tiền xử lý dữ liệu
Trang 31 Nhiễu tần số thấp, độ lệch không, nhiễu trôi, nhiễu chu kỳ thường gặp trong các tập dữ liệu
Có hai hướng xử lý:
Loại bỏ nhiễu bằng cách tiền xử lý dữ liệu
Nhận dạng mô hình nhiễu
6 cách loại ảnh hưởng của nhiễu tần số thấp:
Đặt y(k) và u(k) là độ lệch xung quanh điểm cân bằng vật lý
Loại bỏ trung bình mẫu
Ước lượng độ lệch không
Dùng mô hình nhiễu có khâu tích phân
Trôi và khử trôi
Trang 32Chọn cấu trúc mô hình
Trang 33 Chọn cấu trúc mô hình bao gồm 2 vấn đề:
Trang 34Chất lượng mô hình
Mâu thuẫn:
Độ lệch càng giảm khi mô hình càng linh hoạt (bậc mô hình
càng cao, mô hình dùng càng nhiều tham số);
Phương sai tăng khi số lượng tham số sử dụng càng tăng
Có thể đánh giá chất lượng mô hình dựa vào tiêu chuẩn trung bình bình phương sai số J(D) (D={all design variables})
Theo chương 6, trung bình bình phương sai số có thể phân tích ra làm 2 thành phần: độ lệch và phương sai
) ( )
( )
(D J B D J P D
⇒ Cần chọn bậc mô hình sao cho dung hòa giữa độ lệch và phương sai
Trang 35Chi phí nhận dạng mô hình
Độ phức tạp của thuật toán ước lượng tham số:
có thể ước lượng thông số bằng công thức giải tích hay phải ước lượng thông số bằng thuật toán lặp?
Tính đạo hàm của bộ dự báo theo tham số dễ dàng hay khó
khăn?
Tính chất của hàm tiêu chuẩn ước lượng mô hình:
có cực trị duy nhất hay nhiều cực trị
Trang 36Chọn loại mô hình
Mô hình hộp xám (gray-box model):
Xây dựng mô hình tham số vật lý của hệ thống bằng cách dựa vào hiểu biết về các qui luật vật lý bên trong hệ thống, sau đó ước lượng tham số mô hình dựa vào dữ liệu thực nghiệm
Mô hình hộp đen: (blackbox model) tuyến tính hay phi tuyến?
Hệ thống có thể mô tả bằng mô hình tuyến tính nếu:
Quan hệ vào ra của hệ thống chỉ phụ thuộc vào tần số màkhông phụ thuộc vào biên độ tín hiệu
Khi tín hiệu vào là tín hiệu hình sin, ở trạng thái xác lập tín hiệu ra là tín hiệu hình sin cùng tần số với tín hiệu vào
Hệ thống làm việc trong phạm vi “nhỏ” xung quanh điểm tĩnh
Các trường hợp còn lại đều phải nhận dạng hệ thống dùng cấu trúc mô hình phi tuyến
Trang 37Chọn bậc mô hình
Nguyên tắc chung để đưa ra các tiêu chuẩn chọn bậc mô hình là sựcân bằng giữa độ chính xác và độ phức tạp của mô hình
Tổng quát, các tiêu chuẩn này gồm hai thành phần:
thành phần thứ nhất là trung bình bình phương sai số phản ánh
độ chính xác của mô hình;
thành phần thứ hai là hệ số phạt có đặc điểm tăng lên theo bậc hệthống
Trang 38Tiêu chuẩn chọn bậc mô hình tuyến tính
Tiêu chuẩn sai số dự báo cuối cùng (Final Prediction Error – FPE)
trong đó N : số mẫu dữ liệu thực nghiệm, d: số thông số của mô hình
N
d
N J
1
2 )) ˆ , ( ˆ ) ( (
Tiêu chuẩn thông tin Akaike (Akaike Information Critetion – AIC)
N
d k
y k
y N
k AIC
2 ))
ˆ , ( ˆ ) ( (
1 log
y k
y N
k MDL
)
log(
)) ˆ , ( ˆ ) ( (
1 log
Trang 39Tiêu chuẩn chọn bậc mô hình phi tuyến tính
Vấn đề chọn bậc mô hình phi tuyến vẫn còn là một bài toán mở
Thông thường số thông số của mô hình phi tuyến được chọn dựa
vào kinh nghiệm hoặc bằng phương pháp thử sai
Có thể mở rộng tiêu chuẩn AIC cho trường hợp mô hình phi tuyến
] )
y k
y N
k NIC
2 ))
ˆ , ( ˆ ) ( (
1 log
Trang 40Chọn tiêu chuẩn ước lượng tham số
Trang 41Tiêu chuẩn ước lượng tham số
Tiêu chuẩn trung bình bình phương sai số: được sử dụng phổ biến nhất
Tiêu chuẩn trung bình trị tuyệt đối sai số
Tiêu chuẩn l∞
Trang 42Đánh giá mô hình
Trang 43Các phương pháp đánh giá mô hình
Thuật toán ước lượng thông số chọn được mô hình “tốt nhất” trong cấu trúc mô hình đã chọn Câu hỏi đặt ra là mô hình “tốt nhất” này
đã “đủ tốt” chưa? Câu hỏi trên bao hàm:
Mô hình có phù hợp với dữ liệu quan sát?
Mô hình đủ tốt để sử dụng theo mục đích nào đó?
Mô hình có mô tả được “hệ thống thật”?
Có nhiều phương pháp đánh giá mô hình tùy theo phương pháp
đánh giá đó trả lời câu hỏi nào trong số 3 câu hỏi nêu trên
Đa số các phương pháp đánh giá được trình bày trong các tài liệu trả lời câu hỏi 1
Câu hỏi 2 tùy theo từng ứng dụng cụ thể
Trang 44( 1
1
2 1
y
k y k
y fitness
y
1
) ( 1
trong đó:
Trang 45Phân tích thặng dư
Thặng dư (residual) là phần dữ liệu mà mô hình không tái tạo được
) ˆ , ( ˆ ) ( )
ˆ , ( )
(k ε k θN y k y k θN
Thặng dư phản ánh chất lượng của mô hình, nếu mô hình “tốt” thì:
thặng dư phải có giá trị nhỏ , và
thặng dư là chuỗi tín hiệu ngẫu nhiên
Nếu ε(k) “nhỏ” thì các đại lượng thống kê sau đây sẽ có giá trị nhỏ:
) ( max
Trang 46Phân tích thặng dư (tt)
Nếu ε(k) là chuỗi ngẫu nhiên thì:
ε(k) không tương quan với u(k), do đó hàm hiệp phương sai
chéo giữa thặng dư ε(k) và tín hiệu vào u(k) xấp xĩ bằng 0
ε(k) là chuỗi ngẫu nhiên độc lập, do đó hàm tự hiệp phương sai của ε(k) xấp xĩ bằng 0
0 ) (
) (
1 )
) (
1 )
(
Trang 47Đánh giá chéo
Đánh giá chéo (Cross Validation – CV) là mô phỏng mô hình đã nhận dạng được với tập dữ liệu đầu vào không dùng ở bước ước lượng thông số
Thông thường tập dữ liệu thực nghiệm được chia làm hai phần:
một phần dùng để ước lượng thông số
một phần để đánh giá chéo
Kỹ thuật đánh giá chéo có khuyết điểm là mất nhiều thời gian nhưng hiện nay vẫn là một trong những phương pháp được sử dụng phổbiến nhất để chọn bậc mô hình phi tuyến
Trang 48Phân biệt dự báo và mô phỏng
Dự báo (Prediction): sử dụng dữ liệu ra của hệ thống trong quá khứ
để tính trước giá trị ngõ ra mô hình
Dự báo 1 bước (1 step prediction)
Dự báo k bước (k-step prediction)
Tính vector hoài qui
Trang 49Phân biệt dự báo và mô phỏng
Mô phỏng (Simulation): sử dụng dữ liệu ra của mô hình trong quákhứ để tính giá trị ngõ ra của mô hình
Tính vector hoài qui
ϕ(k)
u(k)
ŷ (k,θ)