84 Trang 10 Danh mục các chữ viết tắtAIC Akaike Information Criterion AR Autoregressive BIC Bayesian Information Criterion BP Backpropagation BPEM Bilinear model-based Prediction Error
Trang 1LUẬN VĂN THẠC SĨ KỸ THUẬT
KỸ THUẬT ĐIỀU KHIỂN VÀ TỰ ĐỘNG HÓA
Trang 2BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI
LUẬN VĂN THẠC SĨ KỸ THUẬT
KỸ THUẬT ĐIỀU KHIỂN VÀ TỰ ĐỘNG HÓA
NGƯỜI HƯỚNG DẪN KHOA HỌC :
PGS.TS HOÀNG MINH SƠN
Hà Nội – 2017
Trang 3CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM
Độc lập – Tự do – Hạnh phúc
BẢN XÁC NHẬN CHỈNH SỬA LUẬN VĂN THẠC SĨ
Họ và tên tác giả luận văn : Vũ Huy Hoàng
Đề tài luận văn: Nhận dạng lò hơi sử dụng mô hình phi tuyến
Chuyên ngành: Kỹ thuật điều khiển và tự động hóa
Mã số HV: CB140499
Tác giả, Người hướng dẫn khoa học và Hội đồng chấm luận văn xác nhận tác giả đã sửa chữa, bổ sung luận văn theo biên bản họp Hội đồng ngày 26/04/2017 với các nội dung sau:
- Không sửa chữa
Ngày 11 tháng 05 năm 2017
Giáo viên hướng dẫn Tác giả luận văn
PGS.TS Hoàng Minh Sơn Vũ Huy Hoàng
CHỦ TỊCH HỘI ĐỒNG
GS.TS Nguyễn Doãn Phước
Trang 4Lời cam đoan
Tôi xin cam đoan bản luận văn: “Nhận dạng lò hơi sử dụng mô hình phi tuyến”
do tôi tự thực hiện dưới sự hướng dẫn của thầy giáo, PGS TS Hoàng Minh Sơn Các số liệu và kết quả là hoàn toàn đúng với thực tế và chưa từng được công bố
Để hoàn thành luận văn này, tôi chỉ sử dụng những tài liệu được ghi trong danh mục tài liệu tham khảo và không sao chép hay sử dụng bất kỳ tài liệu nào khác Nếu phát hiện có sự sao chép tôi xin chịu hoàn toàn trách nhiệm
Học viên
Vũ Huy Hoàng
Trang 5MỤC LỤC
Trang Danh sách hình vẽ v
Danh sách bảng vii
Danh mục các chữ viết tắt viii
Danh mục các kí hiệu ix
MỞ ĐẦU 1
CHƯƠNG 1: TỔNG QUAN VỀ NHẬN DẠNG LÒ HƠI 4
1.1 Sơ lược về vấn đề nhận dạng 4
1.1.1 Tổng quan về phương pháp 4
1.1.2 Phân loại các phương pháp nhận dạng 5
1.1.3 Các bước tiến hành nhận dạng 7
1.2 Lịch sử nghiên cứu trong lĩnh vực nhận dạng lò hơi 8
CHƯƠNG 2: PHƯƠNG PHÁP SAI SỐ DỰ BÁO 10
2.1 Phương pháp sai số dự báo (PEM) 10
2.2 Thuật toán Newton 12
2.3 Thuật toán di truyền (GA) 13
2.4 Thuật toán tối ưu bầy đàn (PSO) 18
CHƯƠNG 3: MÔ HÌNH PHI TUYẾN TRONG NHẬN DẠNG HỆ THỐNG 22
3.1 Các loại mô hình phi tuyến trong nhận dạng hệ thống 22
3.2 Mô hình song tuyến tính (Bilinear) 22
3.3 Mô hình mạng nơron hồi quy (RNN) 23
3.4 Mô hình Wiener sử dụng mạng nơron (Wiener – Neural Network) 33
3.5 Cấu trúc mô hình trong bài toán nhận dạng 35
CHƯƠNG 4: ĐỐI TƯỢNG LÒ HƠI 41
4.1 Quá trình công nghệ lò hơi 41
4.2 Giải pháp điều khiển cho lò hơi 42
Trang 64.2.1 Kiểm soát nhiệt độ hơi nước quá nhiệt 43
4.2.2 Áp suất hơi quá nhiệt ở đầu ra 44
4.2.3 Chất lượng quá trình cháy trong buồng lửa 44
4.3 Mô hình lý thuyết cho đối tượng lò hơi 44
CHƯƠNG 5: NHẬN DẠNG NGOẠI TUYẾN ĐỐI TƯỢNG LÒ HƠI 49
5.1 Nội dung thực nghiệm 49
5.2 Một số lưu ý trong quá trình nhận dạng lò hơi 50
5.3 Mô hình trạng thái tuyến tính 54
5.4 Mô hình trạng thái song tuyến tính 63
5.5 Mô hình Wiener sử dụng mạng nơron (WNN) 72
5.6 Mô hình mạng nơron hồi quy (RNN) 76
5.7 Tổng kết các mô hình nhận dạng ngoại tuyến 81
CHƯƠNG 6: NHẬN DẠNG TRỰC TUYẾN ĐỐI TƯỢNG LÒ HƠI 84
6.1 Phương pháp sai số dự báo đệ quy cho mô hình song tuyến tính 84
6.2 Nhận dạng trực tuyến lò hơi sử dụng mô hình song tuyến tính 88
KẾT LUẬN 96
DANH MỤC CÁC CÔNG TRÌNH ĐÃ CÔNG BỐ 97
TÀI LIỆU THAM KHẢO 98
Trang 7Danh sách hình vẽ
Nội dung Trang
Hình 2.1 Lưu đồ thuật toán di truyền 14
Hình 2.2 Minh họa hoạt động của thuật toán PSO 18
Hình 2.3 Lưu đồ thuật toán PSO 19
Hình 3.1 Cấu tạo một nơron 24
Hình 3.2 Một số hàm kích hoạt cơ bản trong mạng nơron 26
Hình 3.3 Cấu trúc mạng nơron Elman 29
Hình 3.4 Cấu trúc mạng nơron TDNN 29
Hình 3.5 Cấu trúc mạng nơron NARX 30
Hình 3.6 Minh họa thuật toán BPTT 31
Hình 3.7 Minh họa hiện tượng Vanishing gradient 31
Hình 3.8 Mô hình phi tuyến Wiener - Hammerstein 33
Hình 3.9 Cấu trúc mô hình Wiener Neural Network (WNN) 34
Hình 3.10 Minh họa hiện tượng overfitting 36
Hình 3.11 Quan hệ giữa bậc mô hình – bias – variance 37
Hình 3.12 Minh họa quan hệ giữa số lượng mẫu – bias – variance 39
Hình 4.1 Sơ đồ cấu tạo lò hơi của một nhà máy nhiệt điện 41
Hình 4.2 Mô hình lò hơi giản lược 46
Hình 4.3 Các biến vào – ra trong đối tượng lò hơi 48
Hình 5.1 Dữ liệu vào – ra cho thí nghiệm 1 52
Hình 5.2 Dữ liệu vào – ra cho thí nghiệm 2 53
Hình 5.3 Kết quả nhận dạng – LLM – Thí nghiệm 1 55
Hình 5.4 Kết quả nhận dạng – LGA – Thí nghiệm 1 56
Hình 5.5 Kết quả nhận dạng – LPSO – Thí nghiệm 1 57
Hình 5.6 Kết quả nhận dạng – LLM – Thí nghiệm 2 58
Hình 5.7 Kết quả nhận dạng – LGA – Thí nghiệm 2 59
Hình 5.8 Kết quả nhận dạng – LPSO – Thí nghiệm 2 60
Trang 8Hình 5.9 Kết quả nhận dạng – BLM – Thí nghiệm 1 64
Hình 5.10 Kết quả nhận dạng – BGA – Thí nghiệm 1 65
Hình 5.11 Kết quả nhận dạng – BPSO – Thí nghiệm 1 66
Hình 5.12 Kết quả nhận dạng – BLM – Thí nghiệm 2 67
Hình 5.13 Kết quả nhận dạng – BGA – Thí nghiệm 2 68
Hình 5.14 Kết quả nhận dạng – BPSO – Thí nghiệm 2 69
Hình 5.15 Kết quả nhận dạng – WNN – Thí nghiệm 1 73
Hình 5.16 Kết quả nhận dạng – WNN – Thí nghiệm 2 74
Hình 5.17 Kết quả nhận dạng – RNN – Thí nghiệm 1 77
Hình 5.18 Kết quả nhận dạng – RNN – Thí nghiệm 2 78
Hình 5.19 Hiện tượng overfitting khi huấn luyện RNN 79
Hình 6.1 Kết quả nhận dạng – BRPEM-0 91
Hình 6.2 Kết quả nhận dạng – BRPEM 92
Hình 6.3 Kết quả nhận dạng – LRPEM 93
Hình 6.4 Sự biến thiên giá trị các tham số theo thời gian - BRPEM 94
Hình 6.5 Sự biến thiên giá trị các tham số theo thời gian - LRPEM 94
Trang 9Danh sách bảng
Bảng 5.1 Kết quả nhận dạng – LLM 61
Bảng 5.2 Kết quả nhận dạng – LGA 61
Bảng 5.3 Kết quả nhận dạng – LPSO 62
Bảng 5.4 Kết quả nhận dạng – BLM 70
Bảng 5.5 Kết quả nhận dạng – BGA 70
Bảng 5.6 Kết quả nhận dạng – BPSO 71
Bảng 5.7 Kết quả nhận dạng – WNN 75
Bảng 5.8 Kết quả nhận dạng – RNN 79
Bảng 5.9 Kết quả nhận dạng ngoại tuyến 81
Bảng 5.10 Thời gian tính toán của các mô hình trong thí nghiệm 2 81
Bảng 6.1 So sánh nhận dạng ngoại tuyến và nhận dạng trực tuyến 84
Bảng 6.2 Kết quả nhận dạng - BRPEM 90
Trang 10BPEM Bilinear model-based Prediction Error Method
BPTT Backpropagation Through Time
EC Evolutionary Computation
FIR Finite Impulse Response
IIR Infinite Impulse Response
LPEM Linear model-based Prediction Error Method
MSE Mean Squared Error
NARX Nonlinear Autoregressive Network with exogenous inputs PEM Prediction Error Method
PSO Particle Swarming Optimization
RNN Recurrent Neural Network
RPEM Recursive Prediction Error Method
SNR Signal to Noise Ration
TDNN Time Delay Neural Network
WNN Wiener model-based Neural Network
Trang 11Danh mục các kí hiệu
V(θ) Hàm mục tiêu
N Số lượng mẫu huấn luyện
y(k) Giá trị (vector) biến đầu ra ở thời điểm thứ k
u(k) Giá trị (vector) biến đầu vào ở thời điểm thứ k
x(k) Giá trị (vector) biến trạng thái ở thời điểm thứ k
θ(k) Giá trị (vector) tham số mô hình ở thời điểm thứ k ε(k) Giá trị (vector) sai số dự báo ở thời điểm thứ k
e(k) Giá trị (vector) nhiễu đo ở thời điểm thứ k
ψ(k) Giá trị (vector) gradient của hàm mục tiêu theo tham số φ(k) Giá trị (vector) biến hồi quy ở thời điểm thứ k
Λ(k) Ma trận hiệp phương sai của nhiễu
q Toán tử giữ trễ
A Ma trận trạng thái
∗ Giá trị tuyến tính hóa của đại lượng (∗)
∆(∗) Giá trị chênh lệch của đại lượng (∗)
E[∗] Giá trị kì vọng của đại lượng (∗)
Var[∗] Giá trị phương sai của đại lượng (∗)
Giá trị của đại lượng theo dải biểu diễn ban đầu
Trang 12MỞ ĐẦU
Lý do lựa chọn đề tài
Lò hơi là đối tượng đóng vai trò quan trọng trong nhiều quá trình công nghiệp
Dù một số giải pháp điều khiển lò hơi đã ra đời và được ứng dụng rộng rãi trong thực tế, nhu cầu nâng cao chất lượng điều khiển vẫn là yếu tố thu hút sự quan tâm của các nhà công nghệ Những năm gần đây, một số phương pháp điều khiển hiện đại đã và đang được nghiên cứu, ứng dụng cho bài toán điều khiển lò hơi; trong số
đó, phải kể đến nhóm các phương pháp điều khiển dự báo với nhiều ưu điểm vượt trội so với các phương pháp truyền thống Mặt khác, để thiết kế những bộ điều khiển có chất lượng cao, việc mô hình hóa đối tượng điều khiển là nhiệm vụ đầu tiên cần tiến hành
Trong một số trường hợp, việc mô hình hóa đối tượng điều khiển có thể được thực hiện tương đối hiệu quả dựa trên hướng tiếp cận lý thuyết Bằng cách phân tách các quá trình diễn ra bên trong đối tượng, áp dụng các quy luật vật lý, hóa học… các nhà công nghệ có thể tìm ra được những mô hình toán học phản ánh tương đối chính xác sự vận động của đối tượng Dù vậy, với bản chất phức tạp, phi tuyến, đa biến vào – ra của lò hơi, việc xây dựng mô hình toán học dựa hoàn toàn vào lý thuyết trở nên không khả thi hoặc quá phức tạp Do đó, hướng tiếp cận phổ biến trong bài toán nhận dạng lò hơi là thực nghiệm hoặc kết hợp giữa lý thuyết và thực nghiệm
Trong giai đoạn từ năm 1950 đến nay, đã có rất nhiều công trình nghiên cứu xoay quanh chủ đề mô hình hóa đối tượng lò hơi, trong đó bao gồm các công trình thực hiện ở Việt Nam Mặc dù vậy, đa số các công trình nêu trên sử dụng lớp mô hình tuyến tính vốn chỉ hiệu quả trong một phạm vi làm việc hạn chế Khả năng mô
tả chính xác hoạt động của lò hơi tại nhiều điểm làm việc khác nhau vẫn là một vấn
đề phức tạp, đòi hỏi các hướng tiếp cận mới, chẳng hạn như sử dụng các mô hình
Trang 13phi tuyến Do đó, em xin được sử dụng đề tài “Nhận dạng lò hơi sử dụng mô hình phi tuyến” cho luận văn cao học của mình
Mục đích, đối tượng, phạm vi nghiên cứu của luận văn
Mục tiêu chính của luận văn đó là: Xây dựng mô hình trạng thái phi tuyến của
lò hơi sử dụng dữ liệu vận hành thu thập được từ một số nhà máy nhiệt điện, phù
hợp cho việc áp dụng các phương pháp điều khiển nâng cao
Các nội dung công việc cụ thể cần đạt được bao gồm:
Nghiên cứu các phương pháp nhận dạng mô hình trạng thái nói chung và mô hình trạng thái phi tuyến nói riêng
Nghiên cứu lựa chọn kiểu mô hình phi tuyến phù hợp cho lò hơi (mô hình Hammerstein, Wiener-Hammerstein, mô hình song tuyến, )
Phát triển thuật toán, cài đặt và nhận dạng mô hình dựa trên dữ liệu vận hành thu thập từ một số nhà máy nhiệt điện
Đánh giá ưu nhược điểm và khả năng sử dụng của mô hình nhận được
Các luận điểm cơ bản và đóng góp mới của tác giả
Tìm hiểu quá trình công nghệ, phân tích cấu trúc điều khiển được sử dụng trong lò hơi nhà máy nhiệt điện Làm rõ các biến vào – ra của đối tượng và sử dụng các biến này làm nền tảng cho việc mô hình hóa lò hơi
Trình bày cơ sở lý thuyết nhận dạng hệ thống dựa trên phương pháp sai số dự báo Trình bày qui trình xây dựng mô hình trạng thái nói chung bằng phương pháp sai số dự báo sử dụng thuật toán Newton, thuật toán di truyền và thuật toán tối ưu bầy đàn Đề xuất mô hình phi tuyến Wiener sử dụng mạng nơron trong bài toán nhận dạng lò hơi Sử dụng mô hình song tuyến tính và mô hình mạng nơron hồi quy trong bài toán nhận dạng lò hơi Phát triển thuật toán sai số dự báo đệ quy cho việc
nhận dạng trực tuyến lò hơi sử dụng mô hình song tuyến tính
Trang 14 Tiến hành nhận dạng và kiểm chứng trên đối tượng là một lò hơi thuộc nhà máy nhiệt điện Phả Lại Từ đó đưa ra ưu nhược điểm và khả năng ứng dụng của các
mô hình nêu trên
Bố cục của luận văn
Luận văn bao gồm 6 chương với các nội dung cơ bản như sau:
Chương 1 (Tổng quan về nhận dạng lò hơi): Trình bày một số khái niệm chung
về nhận dạng hệ thống cũng như một số kết quả nghiên cứu trước đây trong bài toán nhận dạng lò hơi
Chương 2 (Phương pháp sai số dự báo): Giới thiệu về phương pháp sai số dự báo và đề xuất sử dụng một số thuật toán tối ưu nhằm cải thiện chất lượng phương pháp sai số dự báo
Chương 3 (Mô hình phi tuyến trong nhận dạng hệ thống): Trình bày một số dạng mô hình phi tuyến thường dùng trong nhận dạng hệ thống cũng như một số lưu ý khi lựa chọn cấu trúc mô hình
Chương 4 (Đối tượng lò hơi): Trình bày những hiểu biết cơ bản về đối tượng lò hơi trong nhà máy nhiệt điện, làm rõ các biến vào – ra cần quan tâm trong luận văn Chương 5 (Nhận dạng ngoại tuyến đối tượng lò hơi): Áp dụng các thuật toán và
mô hình nêu trên trong việc nhận dạng ngoại tuyến lò hơi tại nhà máy nhiệt điện Phả Lại Phân tích ưu nhược điểm, phạm vi ứng dụng của từng loại mô hình
Chương 6 (Nhận dạng trực tuyến đối tượng lò hơi): Xây dựng thuật toán nhận dạng trực tuyến lò hơi sử dụng mô hình song tuyến tính
Kết luận: Trình bày các kết quả đã đạt được và hướng phát triển tiếp theo của luận văn
Trang 15CHƯƠNG 1: TỔNG QUAN VỀ NHẬN DẠNG LÒ HƠI
Phần đầu chương này trình bày khái quát về bài toán nhận dạng (hệ thống), phân loại các phương pháp nhận dạng thông dụng cũng như các bước cần tiến hành khi nhận dạng hệ thống Phần tiếp theo của chương tóm lược một số kết quả trong lĩnh vực nhận dạng lò hơi; trên cơ sở đó xác định hướng tiếp cận và phương pháp nhận dạng sử dụng trong luận văn
1.1 Sơ lược về vấn đề nhận dạng
1.1.1 Tổng quan về phương pháp
Đại đa số các phương pháp điều khiển đều dựa trên mô hình động học của đối tượng Công việc xây dựng các mô hình toán học mô tả các hệ động học có sử dụng các thông tin thu được từ hệ thống thực được gọi là nhận dạng hệ thống
Một cách khái quát nhất, việc mô hình hóa thường được tiếp cận theo một trong các hướng sau đây:
Phương pháp lý thuyết (còn được gọi là nhận dạng “hộp trắng”): dựa trên các quy luật vật lý, hóa học…, cùng với các thông số kỹ thuật của thiết bị để xác định cấu trúc mô hình và giá trị của các tham số Phương pháp này có ích trong việc khảo sát đặc tính động học, xác định cấu trúc mô hình, thiết kế sách lược điều khiển nhưng ít phù hợp cho việc xác định các tham số mô hình Trên thực tế, cách tiếp cận này ít được sử dụng do mức độ phức tạp, đòi hỏi hiểu biết sâu sắc hệ thống cũng như việc khó xác định chính xác các thông số kỹ thuật của thiết bị
Phương pháp thực nghiệm (còn được gọi là nhận dạng “hộp đen”): quan sát tín hiệu vào ra, phân tích số liệu thu được để xác định mô hình trực tiếp từ thực nghiệm Phương pháp này có thể giúp ước lượng tương đối chính xác mô hình, nhưng đòi hỏi người dùng biết trước cấu trúc của mô hình cũng như dữ liệu đo phải
đủ tin cậy Trong nhiều trường hợp dữ liệu đo chịu nhiều ảnh hưởng của nhiễu hoặc
Trang 16mô hình phức tạp, số lượng tham số cần xác định lớn, phương pháp này tỏ ra kém chính xác
Phương pháp kết hợp lý thuyết và thực nghiệm (còn gọi là nhận dạng “hộp xám”): kết hợp việc phân tích lý thuyết và phân tích dữ liệu thực nghiệm Nhờ đó, phương pháp này kế thừa ưu điểm của cả hai phương pháp nêu trên, giúp thu được
mô hình có độ chính xác cao nhưng vẫn đảm bảo được tính đơn giản và tin cậy
1.1.2 Phân loại các phương pháp nhận dạng
Các phương pháp nhận dạng được phân loại dựa trên nhiều tiêu chí, bao gồm:
a Theo dạng mô hình được sử dụng
Mô hình liên tục (continuous-time model): mối quan hệ giữa các đại lượng đặc trưng cho quá trình được mô tả bằng một hệ các phương trình vi phân trên miền thời gian liên tục
Mô hình gián đoạn (discrete-time model): mối quan hệ giữa các đại lượng đặc trưng cho quá trình được mô tả bằng một hệ các phương trình sai phân trên miền thời gian gián đoạn Do dữ liệu thu được trong thực nghiệm đều là dữ liệu trên miền gián đoạn, nên mô hình gián đoạn thường được sử dụng trong thực nghiệm
Mô hình tuyến tính (linear model): mối quan hệ giữa các đại lượng đặc trưng cho quá trình được mô tả bằng một hệ phương trình tuyến tính Mô hình tuyến tính được ưa chuộng do sự phát triển của các phương pháp điều khiển tuyến tính
Mô hình phi tuyến (nonlinear model): mối quan hệ giữa các đại lượng đặc trưng cho quá trình được mô tả bằng một hệ phương trình trong đó có ít nhất một yếu tố phi tuyến
Mô hình vào ra (input – output model): mô tả mối quan hệ giữa các biến vào –
ra thay vì các liên kết nội tại bên trong hệ thống
Mô hình trạng thái (state – space model): mô tả mối quan hệ giữa các biến vào – ra thông qua các biến trạng thái
Trang 17b Theo điều kiện thực nghiệm
Nhận dạng chủ động: tác động tín hiệu kích thích ở biến đầu vào hoặc đầu ra sao cho phù hợp với đặc tính động học của quá trình, làm tăng độ tin cậy và chất lượng cho dữ liệu Phương pháp này có thể khá tốn kém và không khả thi với các quá trình đang vận hành ổn định
Nhận dạng bị động: sử dụng các số liệu thu được trong lúc hệ thống đang vận hành mà không làm ảnh hưởng nhiều đến quá trình công nghệ Phương pháp này có thể không đảm bảo tính bền (giàu thông tin) nếu sự thay đổi của tín hiệu kích thích
là quá nhỏ hoặc quá đơn giản so với đặc tính động học của quá trình thực
Nhận dạng vòng hở (open-loop identification): thu thập dữ liệu khi hệ thống
bị cách li khỏi vòng điều khiển Phương pháp này có thể không đảm bảo tính ổn định và chất lượng khi đang vận hành quá trình công nghệ
Nhận dạng vòng kín (closed-loop identification): thu thập dữ liệu trong khi hệ thống vẫn làm việc ổn dịnh dưới sự điều khiển của các bộ điều khiển Mặc dù có thể đảm bảo tính ổn định của quá trình công nghệ, phương pháp có thể gây khó khăn khi sử dụng một số thuật toán nhận dạng, do sự tương quan ngược giữa các biến vào
ra thông qua việc phản hồi
Nhận dạng trực tiếp (direct identification): sử dụng giá trị các biến vào – ra của hệ thống, không cần thông tin chính xác về bộ điều khiển Tuy nhiên, nếu quá trình nhận dạng được thực hiện trong vòng kín, cần lưu ý đến tính nhất quán và hội
hệ hở, vì vậy khắc phục được nhược điểm của phương pháp nhận dạng gián tiếp
Trang 18c Theo yêu cầu công nghệ:
Nhận dạng ngoại tuyến (offline identification): tiến hành thu thập toàn bộ dữ liệu trước, sau đó mới tiến hành nhận dạng, kiểm chứng trên tập dữ liệu đã thu được
Nhận dạng trực tuyến (online identification): thu thập dữ liệu và tiến hành nhận dạng đồng thời để phục vụ việc chỉnh định trực tuyến, liên tục cho bộ điều khiển hoặc tối ưu hóa theo thời gian thực
d Theo phương pháp ước lượng tham số
Phương pháp bình phương cực tiểu (least-squares)
Phương pháp phân tích tương quan (correlation analysis)
Phương pháp phân tích phổ (spectrum analysis)
Phương pháp biến phụ (instrumental variable)
Phương pháp xác suất cực đại (maximum likelihood)
Phương pháp sai số dự báo (prediction error method)
Phương pháp không gian con (subspace method)
Về mặt tư tưởng, các phương pháp này có thể độc lập nhưng về bản chất không hoàn toàn khác biệt; nhiều khi chúng còn là dẫn xuất của nhau Mỗi phương pháp đều có ưu nhược điểm riêng, do đó tùy theo từng đối tượng, yêu cầu và hoàn cảnh
sự dụng cụ thể, chúng ta khó có thể khẳng định sự vượt trội tuyệt đối của riêng một phương pháp nào
1.1.3 Các bước tiến hành nhận dạng
i Thu thập số liệu và khai thác thông tin ban đầu về quá trình: mô tả các quá
trình vật lý, hóa học xảy ra bên trong đối tượng, các thông số vận hành, các giới hạn trên và dưới của các đại lượng có liên quan… Từ đó xác định các biến vào ra cần quan tâm, các điều kiện biên và các giả thiết có liên quan
ii Lựa chọn phương pháp nhận dạng: tùy theo từng trường hợp cụ thể, lựa chọn
phương pháp nhận dạng phù hợp, chẳng hạn như nhận dạng trực tuyến/ngoại tuyến,
Trang 19nhận dạng vòng hở/vòng kín, nhận dạng chủ động/bị động, thuật toán ước lượng tham số và tiêu chuẩn đánh giá chất lượng mô hình
iii Thu thập số liệu thực nghiệm: thu thập dữ liệu để thỏa mãn được mối quan
hệ vào ra giữa các biến, xử lý thô các số liệu nhằm loại bỏ những giá trị đo kém tin cậy, lọc nhiễu, chuẩn hóa
iv Xác định dạng và cấu trúc mô hình: từ yêu cầu về mục đích sử dụng mô hình
và khả năng ứng dụng của phương pháp nhận dạng, chọn dạng mô hình (phi tuyến/tuyến tính, liên tục /gián đoạn…) Đưa ra các giả thiết ban đầu về cấu trúc mô hình (bậc tử số, mẫu số của hàm truyền đạt, có hay không có trễ )
v Xác định tham số mô hình: ước lượng giá trị các tham số của mô hình theo
phương pháp, thuật toán đã chọn Nếu tiến hành theo từng mô hình con (ví dụ từng kênh vào ra, từng khâu trong quá trình) thì sau đó cần kết hợp chúng lại thành một
mô hình tổng thể
vi Mô phỏng, kiểm chứng và đánh giá mô hình: thực hiện mô phỏng để kiểm
chứng độ chính xác Việc kiểm chứng thông thường được thực hiện bằng việc sử dụng mô hình để mô phỏng dữ liệu vào ra, sau đó kết quả thu được sẽ đem so với
bộ dữ liệu vào ra thu thập được từ thực nghiệm Dữ liệu thực tế dùng để kiểm chứng phải là bộ dữ liệu khác với bộ dữ liệu dùng để tính toán thiết lập mô hình
1.2 Lịch sử nghiên cứu trong lĩnh vực nhận dạng lò hơi
Từ những năm 1950 đến nay, đã có rất nhiều công trình bàn về lĩnh vực mô hình hóa lò hơi, trong đó phổ biến nhất là hướng tiếp cận nhận dạng hộp đen và hộp xám Theo hướng nhận dạng hộp đen, đa phần các công trình nghiên cứu xoay quanh việc sử dụng mô hình vảo – ra dạng đa thức như ARX, OE hoặc ARMAX (Vasqueza, 2008 [29] và Inoue, 2002 [15]) Ngoài ra, các công trình sử dụng mạng nơron để mô phỏng hoạt động của lò hơi cũng đã được ghi nhận (Irwin, 1995 [16]
và Rusinowski , 2007 [28]) Nhìn chung, phương pháp nhận dạng hộp đen tuy mang tính trực tiếp và có thể chính xác nhưng kéo theo đó là sự phức tạp do số lượng các
Trang 20tham số trong mô hình lớn cũng như độ tin cậy bị hạn chế theo điều kiện thực nghiệm
Theo hướng nhận dạng hộp xám, tiêu biểu có thể kể đến công trình của Astrom (2000) [7], trong đó mô tả đặc tính của bao hơi tương đối chính xác sử dụng mô hình phi tuyến Ngoài ra, các công trình nghiên cứu có sử dụng các khâu phi tuyến tĩnh như mô hình Wiener – Hammerstein (Rizvi, 2010 [27] và Jafari, 2012 [17] cũng đã ra đời, với ưu điểm là sự đơn giản và hiệu quả khi xây dựng mô hình Trong các công trình này, phương pháp nhận dạng lò hơi là sử dụng dữ liệu thu được từ vòng hở
Ở Việt Nam, hai trong số các công trình gần đây bao gồm luận văn của các tác giả N H Q Đạt [1], T T K Ly và H M Sơn [4] Công trình [1] xây dựng mô hình động học cho lò hơi tại nhà máy đạm Phú Mỹ, sử dụng các mô hình đa thức và phương pháp bình phương tối thiểu Công trình [4] xây dựng mô hình phi tuyến giả LPV và phương pháp sai số dự báo cho lò hơi tại một số nhà máy nhiệt điện ở Quảng Ninh và Phả Lại
Tựu chung, phần nhiều các công trình trước đây đi theo hướng nhận dạng vòng
hở và sử dụng kích thích chủ động Trên thực tế, hướng tiếp cận này có thể gặp nhiều khó khăn do vấn đề về chi phí cũng như an toàn khi tiến hành thực nghiệm Ngoài ra, số lượng các công trình sử dụng mô hình phi tuyến trong nhận dạng lò hơi cũng chưa thực sự nhiều, nhất là tại Việt Nam Hiểu được điều đó, trong khuôn khổ luận văn này, em xin tập trung vào trường hợp nhận dạng lò hơi trong vòng kín với kích thích bị động, sử dụng một số mô hình phi tuyến trên miền thời gian gián đoạn Trong các phương pháp nhận dạng hệ thống được sử dụng phổ biến, phương pháp sai số dự báo thích hợp cho việc nhận dạng vòng kín do không cần giả thiết về sự độc lập giữa tín hiệu vào – ra, đồng thời có thể áp dụng dễ dàng cho các dạng mô hình khác nhau, bao gồm cả các mô hình phi tuyến Do đó, nội dung chương tiếp theo sẽ bàn về phương pháp sai số dự báo, cũng như khả năng ứng dụng của một số thuật toán tối ưu trong việc nâng cao chất lượng của phương pháp sai số dự báo
Trang 21CHƯƠNG 2: PHƯƠNG PHÁP SAI SỐ DỰ BÁO
Nội dung của chương này xoay quanh phương pháp sai số dự báo, cũng như khả
năng ứng dụng một số thuật toán tối ưu như thuật toán di truyền (GA), thuật toán tối
ưu bầy đàn (PSO) với mục đích cải thiện chất lượng của phương pháp sai số dự báo
truyền thống
2.1 Phương pháp sai số dự báo (PEM)
Phương pháp sai số dự báo là một phương pháp kinh điển được sử dụng rất
rộng rãi trong bài toán nhận dạng hệ thống Ý tưởng của phương pháp này xuất phát
từ việc đánh giá tiêu chuẩn “sai số dự báo” qua một hàm mục tiêu, và nếu tìm được
vector tham số làm cho hàm phí tổn này là nhỏ nhất thì tham số đó cũng là tham số
tối ưu cần tìm
Xét trường hợp một cấu trúc mô hình ℳ đã được lựa chọn và đặc trưng bởi
vector tham số θ ∈ D⊂ ℛ , trong đó d là số phần tử của vector Tập các mô θ
hình tương ứng sẽ là ℳ∗ = {ℳ(θ)|θ ∈ D} Mỗi mô hình ℳ(θ) có thể được coi
như một cách dự báo đầu ra tương lai của hệ Chẳng hạn, nếu mô hình là tuyến tính
thì bộ dự báo tuyến tính của mô hình có thể chọn là:
y(k|θ) = W(q, θ) y(k) + W(q, θ) u(k) (2.1)
Bộ dự báo cũng có thể coi là một bộ lọc phi tuyến:
y(k|θ) = gk, Z, θ (2.2)
Với bộ dữ liệu thu thập: Z = {y(1), u(1), y(2), u(2), … , y(N), u(N)} Bài toán
ước lượng tham số trở thành bài toán xác định ánh xạ từ tập ZN → θ ∈ D Sai số
dự báo là sai số giữa đầu ra thực và đầu ra dự báo:
Từ bộ dữ liệu Z đã thu thập được, sai số ε(k, θ)sẽ được tính cho các thời điểm
k=1,…, N Tiếp theo, chúng ta cần tìm vectơ tham số sao cho dãy sai số dự báo θ
ε(k, θ)thu được “càng nhỏ càng tốt”
Trang 22Ngoài ra, dãy sai số cũng có thể được lọc bằng một bộ lọc tuyến tính ổn định L(q) quanh một miền tần số quan tâm
ε(k, θ) = L(q) ε(k, θ)k = 1, … , N (2.4)
Nếu gom dãy sai số dự báo ε(k, θ)lại thành vector ε(θ) = ε(1, θ)…
ε(N, θ), thì độ lớn của vector này có thể được xác định thông qua các chuẩn, chẳng hạn như chuẩn Euclide, chuẩn bậc nhất hay chuẩn vô cùng:
Như vậy, vấn đề còn lại của phương pháp PEM chính là cách thức giải bài toán tối ưu Các phương pháp giải có thể chia ra 2 nhóm chính:
Phương pháp sử dụng công cụ đạo hàm theo hướng (gradient): tiêu biểu là thuật toán Newton và dẫn xuất khác Phương pháp sai số dự báo (PEM) do Ljung [22] đề xuất sử dụng thuật toán Newton để giải bài toán cực tiểu hóa hàm mục tiêu
Trang 23 Phương pháp không sử dụng gradient: tiêu biểu là thuật toán simulated annealing (SA), thuật toán di truyền (GA), thuật toán tối ưu bầy đàn (PSO)…
2.2 Thuật toán Newton
Thuật toán Newton là một thuật toán lặp giúp tìm điểm dừng của một hàm số,
và thường được áp dụng để giải bài toán cực tiểu hóa hàm mục tiêu V(θ, Z) Nội dung của thuật toán Newton có thể tóm tắt như sau:
Bước 1: Khởi tạo
Biến đếm bước lặp (s = 0)
Tham số θ(s = 0) = θ
Bước 2: Tìm gradient ψ(k, θ) =(|) với k = 1,2 N theo cấu trúc mô hình
Bước 3: Cập nhật vector tham số theo luật:
θ(s + 1) = θ(s) − [V(θ(s))] V′(θ(s)) (2.7) Trong đó:
Từ đây, chúng ta có các dẫn xuất của thuật toán Newton như sau:
Thuật toán suy giảm độ dốc (steepest descent) :
Trang 24 Thuật toán Levenberg – Marquardt:
Bước 4: Kiểm tra điều kiện dừng thuật toán:
Số bước lặp s > s với s > 0cho trước
Giá trị hàm mục tiêu V[θ(s + 1)] < V với V > 0cho trước
Bước học μ(s) > μ với μ > 0cho trước
Giá trị ‖θ(s + 1) − θ(s)‖ < δ với δ > 0cho trước
Gradient đạt dưới một ngưỡng nào đó [()] < grad
Nếu không thỏa mãn một trong các điều kiện trên, đặt s = s+1 và quay trở lại bước 2
2.3 Thuật toán di truyền (GA)
Phương pháp sai số dự báo có bản chất là bài toán tối ưu phi tuyến; công cụ để giải quyết bài toán này thường là thuật toán Newton hay điển hình là thuật toán Levenberg – Marquardt Tuy nhiên, trong nhiều trường hợp khi hàm mục tiêu có dạng phức tạp, dữ liệu bị chịu ảnh hưởng của nhiễu hoặc điểm khởi tạo thuật toán tìm kiếm chưa thích hợp thì các thuật toán tìm kiếm dựa trên gradient có thể bị kẹt trong một lòng chảo (basin) và vì vậy chỉ tìm được cực trị địa phương thay vì cực trị toàn cục Thuật toán di truyền (GA – Genetic Algorithm) có thể giúp khắc phục vấn
đề này
Thuật toán di truyền mô phỏng quá trình chọn lọc tự nhiên và di truyền trong vấn đề tìm kiếm nghiệm cho bài toán tối ưu Tư tưởng chính của thuật toán là: cá
Trang 25thể nào phù hợp với điều kiện môi trường sẽ tồn tại và truyền lại những đặc tính tốt cho đời sau Các cá thể kém phù hợp sẽ bị loại bỏ dần theo thời gian
Hình 2.1 Lưu đồ thuật toán di truyền
Trong thuật toán di truyền, khái niệm “quần thể” đóng vai trò như tập các lời giải của bài toán Mỗi “cá thể” trong quần thể đóng vai trò như một lời giải và mỗi
“gen” đóng vai trò như một thành phần trong lời giải đó Qua nhiều thế hệ chọn lọc, lai ghép và đột biến, các cá thể sẽ tiến hóa và có thể hội tụ đến nghiệm tối ưu toàn cục
Trang 26Cách mã hóa các nhiễm sắc thể
Tùy theo từng bài toán, có thể lựa chọn kiểu mã hóa nhị phân, hoán vị Ở bài toán nhận dạng hệ thống, mỗi cá thể là một vector tham số còn mỗi gen chính là θmột thành phần của Do đó em lựa chọn kiểu mã hóa là số thực θ
Khởi tạo quần thể ban đầu
Quần thể ban đầu có thể lựa chọn một cách ngẫu nhiên theo một phân bố nào
đó, hoặc trải đều trên không gian tìm kiếm Kích thước quần thể càng lớn thì mức
độ bao phủ không gian tìm kiếm càng lớn, nhờ vậy việc tìm kiếm cũng sẽ bao quát hơn Tuy nhiên kích thước quần thể lớn sẽ làm tăng khối lượng tính toán Tùy thuộc vào độ phức tạp bài toán cũng như số chiều của vector tham số mà chúng ta cần θlựa chọn kích thước quần thể và cách sinh quần thể ban đầu cho phù hợp
Hàm thích nghi (fitness function)
Để đánh giá độ phù hợp của từng lời giải (từng cá thể trong quần thể), khái niệm hàm thích nghi được sử dụng Cá thể càng phù hợp, giá trị hàm thích nghi càng cao Có nhiều cách lựa chọn hàm thích nghi Có thể chọn hàm thích nghi là nghịch đảo của hàm mục tiêu V[θ(s)] Tuy nhiên, cần lưu ý rằng dải giá trị của hàm thích nghi đóng vai trò quan trọng đến hoạt động của thuật toán Nếu các giá trị này chênh lệch quá lớn sẽ dẫn tới việc các cá thể có điểm số cao nhất được chọn lựa quá thường xuyên Điều này có thể làm giảm độ rộng của miền tìm kiếm Ngược lại, nếu các giá trị này chênh lệch quá ít, các cá thể sẽ có cơ hội được chọn gần bằng nhau, dẫn tới việc tìm kiếm sẽ mất nhiều thời gian hoặc có thể không hội tụ Vì vậy, cần biến đổi hàm mục tiêu về dải biểu diễn phù hợp (scaling)
Các cơ chế scaling phổ biến là: xếp hạng (rank), hay chọn bình đẳng n cá thể tốt nhất…Trong luận văn này, cơ chế xếp hạng được sử dụng: hàm mục tiêu càng cao thì hạng cá thể càng thấp Cá thể hạng r sẽ có giá trị hàm thích nghi là
√
Chọn lọc (selection)
Trang 27Các cá thể có độ thích nghi cao sẽ được lai ghép để sinh ra các cá thể mới tốt hơn Một số cơ chế chọn lọc bao gồm: chọn ngẫu nhiên, bánh xe roulette, đấu loại (tournament)…
Trong luận văn này, em sử dụng cơ chế chọn lọc mẫu ngẫu nhiên đều (stochastic uniform) Số phần tử được chọn lọc là N
Biểu diễn các cá thể lên trên một đoạn thẳng, mỗi cá thể chiếm một phần của đoạn thẳng có độ dài tỉ lệ với độ thích nghi đã chuẩn hóa của cá thể đó
Đặt N điểm chọn lên đường thẳng Các điểm chọn này cách nhau
, điểm đầu tiên đặt ngẫu nhiên trong khoảng [0,
]
Với một điểm chọn, cá thể gần nhất về bên phải sẽ được chọn
Về bản chất, phương pháp này có đặc điểm là các cá thể sẽ được chọn với xác suất tỉ lệ với độ thích nghi của chúng, đồng thời vẫn cho phép các cá thể có mức độ thích nghi yếu hơn không bị lấn át hoàn toàn, do đó duy trì tính đa dạng cho quần thể Các cá thể sau khi chọn lọc sẽ được đưa vào lai ghép
Lai ghép (crossover)
Lai ghép là sự kết hợp các cá thể cha mẹ để tạo ra một cá thể có độ thích nghi tốt hơn Đây là quá trình chủ đạo trong thuật toán di truyền
Các cơ chế lai ghép thông thường bao gồm: cơ chế trung bình, cơ chế phân tán,
cơ chế kinh nghiệm, cơ chế số học… Trong luận văn này, em chọn cơ chế lai ghép trung bình được biểu diễn bởi công thức:
Trong đó Ratio là một ma trận trọng số cho trước
Đột biến (mutation)
Đột biến là một sự biến đổi tại một (hay một số) gen của nhiễm sắc thể ban đầu
để tạo ra một nhiễm sắc thể hay cá thể mới Đột biến có xác suất xảy ra thấp hơn nhiều so với lai ghép Đột biến có thể tạo ra một cá thể mới tốt hơn hoặc xấu hơn cá thể ban đầu
Trang 28Các cơ chế đột biến thông thường được lựa chọn là: phân bố Gauss, phân bố đều, thích nghi…Trong luận văn này, em lựa chọn cơ chế phân bố Gaus cho bước lặp thứ k như sau:
σ = σ1 − Shrink (2.16) Trong đó,w là số ngẫu nhiên rút ra từ phân bố Gauss (0, σ); Generation
là số bước lặp tối đa và Shrink là hệ số suy giảm tính đa dạng Đột biến là thành phần quan trọng; nó góp phần mở rộng phạm vi tìm kiếm ra các khu vực khác trong không gian Tuy nhiên, nếu tỉ lệ đột biến quá cao, việc tìm kiếm có thể mất quá nhiều thời gian hoặc thậm chí là không hội tụ Tỉ lệ đột biến nên thấp hơn 10%
Các điều kiện kết thúc thuật toán
Thuật toán dừng khi gặp một trong hai điều kiện sau:
Kết thúc khi số bước lặp sinh ra đạt đến giới hạn (em chọn = 5000 bước lặp)
Kết thúc khi cá thể tốt nhất trong quần thể hầu như không thay đổi qua một số
lượng bước lặp nhất định (em chọn = 50 bước lặp)
b Ưu nhược điểm thuật toán GA
Ưu điểm:
Thuật toán GA duyệt qua không gian tìm kiếm sử dụng nhiều cá thể, vì vậy ít
mắc phải cực trị địa phương hơn so với một số thuật toán khác
Việc lựa chọn các tham số cho thuật toán đòi hỏi nhiều thử nghiệm
Thuật toán di truyền không đảm bảo tính hội tụ đến nghiệm tối ưu toàn cục
Trang 292.4 Thuật toán tối ưu bầy đàn (PSO)
Hình 2.2 Minh họa hoạt động của thuật toán PSO [13]
Thuật toán tối ưu bầy đàn (Particle Swarming Optimization – PSO) là một thuật toán tối ưu ngẫu nhiên không sử dụng gradient, có nhiều nét tương tự như thuật toán
di truyền Ý tưởng của phương pháp đó là mô phỏng hành vi của các bầy chim hay đàn cá trong quá trình tìm mồi Trong PSO, mỗi nghiệm được gọi là một cá thể (hay phần tử - particle) Từng cá thể sẽ di chuyển về phía các cá thể khác có vị trí tốt hơn trong bầy Trong quá trình di chuyển, mỗi cá thể đều duyệt qua không gian tìm kiếm, do đó giúp mở rộng khả năng tìm kiếm Theo thời gian, các cá thể sẽ tụ họp lại quanh những vị trí tốt nhất, tương ứng với các nghiệm của bài toán tối ưu
Kí hiệu:
X : Vị trí cá thể i tại thời điểm k
V: Vận tốc cá thể i tại thời điểm k
Pbest: Vị trí tốt nhất của cá thể i tính tới thời điểm thứ k
Gbest : Vị trí tốt nhất của “nhóm lân cận” của cá thể i tính tới thời điểm k
Gbest : Vị trí tốt nhất của toàn bộ quần thể tính tới thời điểm k
a Các bước thực hiện thuật toán tối ưu bầy đàn
Trang 30Hình 2.3 Lưu đồ thuật toán PSO
Bước 1: Khởi tạo
Tạo ra một quần thể gồm N cá thể, trong đó với mỗi cá thể thứ i:
Vị trí X và vận tốc V được khởi tạo ngẫu nhiên
Chọn một tập con ngẫu nhiên chứa Scá thể trong tổng số N cá thể khác i làm nhóm “lân cận” (S = minNeighborhoodSize: kích thước tối thiểu của nhóm lân cận)
Trang 31 Đánh giá tất cả các cá thể dựa trên hàm mục tiêu F = fun(X), từ đó tìm được các vị trí Pbest , Gbest
Đặt bộ đếm số bước ổn định (là số bước lặp mà cá thể tốt nhất giữ nguyên vị trí) SC= 0
Đặt giá trị quán tính W = max(IntertiaRange), với InertiaRange là dải biến thiên quán tính của mỗi cá thể
Đặt giá trị c= SelfAdjustmentWeight: trọng số ưu tiên việc điều chỉnh vận tốc theo kinh nghiệm bản thân cá thể và c = SocialAdjustmentWeight trọng số ưu tiên việc điều chỉnh vận tốc dựa trên kinh nghiệm của nhóm lân cận
Bước 2: Lặp
Đối với mỗi cá thể thứ i ở thời điểm thứ k:
Kiểm tra điều kiện dừng thuật toán:
o Kết thúc khi số bước lặp đạt đến giới hạn ( em chọn 5000 bước lặp)
o Kết thúc khi cá thể tốt nhất trong quần thể không thay đổi qua một số lượng bước lặp nhất định (em chọn 50 bước lặp)
Chọn một tập con ngẫu nhiên chứa Scá thể khác cá thể thứ i làm nhóm
“lân cận” (S = minNeighborhoodSize: kích thước tối thiểu của nhóm lân cận) Tính lại hàm mục tiêu trên tập lân cận và tìm giá trị Gbest
Với hai vector u, u có các thành phần ngẫu nhiên phân bố đều trong khoảng (0,1), cập nhật vận tốc của và vị trí theo luật:
V = WV+ cuPbest −X + cuGbest−X
Tính lại hàm mục tiêu dựa trên vị trí mới của cá thể đó F= fun(X)
o Nếu F < fun(Pbest) => Đặt Pbest = X
o Nếu F < fun(Gbest)
Đặt Gbest = X
Đặt cờ flag = true
Trang 32o Ngược lại, đặt cờ flag = false
Nếu W nằm ngoài dải InertiaRange thì đưa về biên gần nhất
o Nếu flag = false:
Đặt SC=SC + 1
Đặt S= min(S+ minNeighborhoodSize,N)
b Một số chú ý khi thiết lập các tham số cho thuật toán:
Kích thước quần thể: tương tự như với thuật toán di truyền
Quán tính W: Tăng trọng số cho thành phần quán tính nhìn chung sẽ giúp mở rộng phạm vi tìm kiếm, nhưng lại làm giảm tốc độ hội tụ của thuật toán
Trọng số c: ưu tiên việc điều chỉnh vận tốc theo kinh nghiệm cá thể Tăng cgiúp mở rộng phạm vi tìm kiếm, nhưng lại làm giảm tốc độ hội tụ của thuật toán
Trọng số c: ưu tiên việc điều chỉnh vận tốc theo kinh nghiệm của nhóm lân cận Tăng cgiúp thuật toán hội tụ nhanh hơn nhưng đồng thời sẽ có xu hướng bỏ qua nhiều vùng không gian tìm kiếm
Kích thước các nhóm lân cận: Việc tăng kích thước các nhóm lân cận sẽ mở rộng phạm vi tìm kiếm nhưng có xu hướng làm giảm tốc độ hội tụ thuật toán
c Ưu nhược điểm của thuật toán tối ưu bầy đàn
Thuật toán PSO có nhiều nét tương đồng với thuật toán GA Ưu điểm của thuật toán PSO so với GA là thời gian tính toán ngắn hơn và việc cấu hình cho PSO cũng đơn giản hơn so với GA Mặc dù vậy, PSO vẫn còn khá chậm so với các thuật toán tìm kiếm khác sử dụng công cụ gradient Do đó, PSO thích hợp với bài toán nhận
dạng ngoại tuyến
Trang 33CHƯƠNG 3: MÔ HÌNH PHI TUYẾN TRONG NHẬN
3.1 Các loại mô hình phi tuyến trong nhận dạng hệ thống
Trái với mô hình tuyến tính, các mô hình phi tuyến rất phong phú về chủng loại
và độ phức tạp Tính chất phi tuyến có thể được thể hiện qua nhiều hình thức: hàm lũy thừa, hàm lượng giác Việc lựa chọn loại hình phi tuyến là tùy thuộc vào bản chất của đối tượng Cho đến thời điểm hiện tại, các lớp mô hình phi tuyến phổ biến nhất trong bài toán nhận dạng hệ thống bao gồm:
i Mô hình chuỗi Volterra: tiêu biểu là mô hình song tuyến tính (Bilinear
model)…
ii Mô hình ghép nối nhiều khối: tiêu biểu là mô hình Hammerstein, Wiener… iii Mô hình mạng nơron: tiêu biểu là mô hình mạng perceptron, mô hình mạng
nơron hồi quy…
iv Mô hình NARMAX
Trong khuôn khổ luận văn này, em xin tập trung vào 3 loại mô hình phi tuyến sau:
Mô hình song tuyến tính (Bilinear model)
Mô hình mạng nơron hồi quy (Recurrent Neural Network)
Mô hình Wiener sử dụng mạng nơron (Wiener – Neural Network)
3.2 Mô hình song tuyến tính (Bilinear)
Trong lĩnh vực nhận dạng hệ thống, mô hình (trạng thái) song tuyến tính trên
Trang 34x(k + 1) = Ax(k) + Bu(k) + ∑ L x(k) u(k)
y(k) = Cx(k) + Du(k) (3.1) Trong đó:
Do sự đơn giản trong cấu trúc, khả năng biểu diễn các quan hệ phi tuyến của
mô hình loại này là khá hạn chế, chẳng hạn như khi so sánh với mô hình mạng nơron Tuy nhiên, cũng chính nhờ sự đơn giản này mà việc ước lượng tham số của
mô hình là tương đối dễ dàng, tương tự như ước lượng tham số cho mô hình tuyến tính Số lượng các tham số của mô hình cũng tương đối thấp so với các dạng mô hình phức tạp như mạng nơron, do đó kết quả ước lượng nhìn chung cũng đáng tin cậy hơn, đặc biệt là với số mẫu huấn luyện hạn chế Đồng thời, mô hình song tuyến tính cũng là dạng mô hình phi tuyến phổ biến trong các bài toán điều khiển Những
lý do trên khiến cho mô hình song tuyến tính dù ra đời đã lâu nhưng vẫn một lựa chọn hấp dẫn trong bài toán nhận dạng hệ thống
3.3 Mô hình mạng nơron hồi quy (RNN)
a Tổng quan về mạng nơron
Mạng nơron nhân tạo (ANN) là một hệ thống bao gồm nhiều phần tử xử lý đơn giản (còn gọi là nơron) tương tự như các nơron thần kinh của não người, hoạt động
Trang 35song song và được kết nối với nhau bởi các liên kết Mỗi liên kết được kèm theo một trọng số nào đó, đặc trưng cho tính kích hoạt hoặc ức chế giữa các nơron
Mô hình mạng nơron cơ bản gồm 3 lớp: lớp vào (input), lớp ẩn (hidden) và lớp
ra (output) Thông tin từ lớp vào sẽ được tổng hợp, biến đổi và lan truyền khi qua lớp ẩn trước khi kết thúc ở lớp ra Mạng nơron như vậy được gọi là mạng nơron nông (shallow neural network) để phân biệt với trường hợp mạng nơron có nhiều lớp ẩn (mạng nơ ron sâu hay deep neural network) Các liên kết trong hình trên chỉ
đi từ lớp mạng trước đến lớp mạng sau, vì thế mạng nơron trong hình gọi là mạng truyền thẳng (feedforward network) Ngoài ra, có những mạng nơron với cấu trúc liên kết phức tạp hơn, cho phép thông tin được hồi tiếp (feedback network hay recurrent network), hoặc các nơron trong cùng một lớp được liên kết theo một tổ hợp đặc biệt (convolutional network)
Cấu tạo một nơron
Hình 3.1 Cấu tạo một nơron [6]
Nơron là phần tử xử lý cơ bản trong mạng Các thành phần của một nơron bao gồm:
Trang 36 Ngưỡng (hay bias) b
Hàm tính tổng gom các tín hiệu sau liên kết lại thành một số vô hướng
Hàm kích hoạt f (có thể là một hàm tuyến tính hoặc phi tuyến)
Có thể miêu tả quan hệ vào – ra của một nơron như sau:
y = f(∑ w x+ b
Khả năng xấp xỉ của mạng nơron
Một trong những lý do mạng nơron được sử dụng nhiều trong các bài toán nhận dạng chính là khả năng xấp xỉ được các quan hệ phi tuyến Nếu một mạng nơron cấu thành bởi các phần tử phi tuyến thì tự nó sẽ có tính phi tuyến Hơn nữa, điều đặc biệt là tính phi tuyến này được phân tán trên toàn mạng, do đó có thể lựa chọn kiểu hàm kích hoạt phi tuyến cơ bản cũng như số nút mạng (nơron) hữu hạn nhằm xấp xỉ một hàm phi tuyến bất kì với độ chính xác cho trước (định lý Stone – Weiertrass – [6])
Lựa chọn cấu trúc cho mạng nơron
Công việc này bao gồm lựa chọn:
Số đầu vào – ra
Số lớp ẩn
Số nơron cho các lớp ẩn: Tài liệu [6] chỉ ra rằng toàn bộ các ánh xạ liên tục từ [0,1] → [0,1] đều có thể được xấp xỉ bằng một mạng nơron perceptron 1 lớp ẩn gồm (2p + 1) nơron
Kiểu liên kết giữa các nơron
Dạng hàm kích hoạt cho các nơron
Trang 37Hình 3.2 Một số hàm kích hoạt cơ bản trong mạng nơronơ [6]
Công việc này được tiến hành dựa trên quá trình phân tích bản chất cụ thể của từng bài toán và đòi hỏi thử nghiệm thực tế Chính vì khả năng linh hoạt của mạng nơron nên các bước thử nghiệm để tìm được cấu trúc phù hợp là không thể tránh khỏi Ngoài ra, có thể xây dựng một số thuật toán để tự động hóa việc thử nghiệm, giúp tiết kiệm thời gian và công sức cho người sử dụng
Thuật toán huấn luyện mạng nơron
Sau khi lựa chọn cấu trúc cho mạng nơron, công việc cần làm tiếp theo đó là huấn luyện mạng tìm ra các hệ số trong mạng (bao gồm các trọng số liên kết và các ngưỡng của từng nơron) Tùy thuộc loại hình mạng nơron được sử dụng và mục đích sử dụng (học có giám sát hay không giám sát, nhận dạng mẫu hay xấp xỉ hàm…) mà người ta sử dụng thuật toán huấn luyện cho phù hợp Chẳng hạn, khi huấn luyện một mạng nơron truyền thẳng theo phương pháp học có giám sát, thuật toán hay được sử dụng đó là thuật toán lan truyền ngược (backpropagation)
Thuật toán sử dụng một tập các mẫu gồm N cặp đầu vào - đầu ra để huấn luyện mạng Với mỗi cặp đầu vào - đầu ra {u(k),y(k)} thuật toán lan truyền ngược sai số thực hiện hai giai đoạn sau:
Giai đoạn thứ nhất, mẫu đầu vào u(k) được truyền từ lớp vào tới lớp ra, và kết quả đầu ra tính toán được là y(k) và so sánh với đầu ra thực y(k)
Giai đoạn tiếp theo, sai số dự báo y(k) − y(k) được lan truyền ngược lại từ lớp ra đến các lớp trước Từ đó điều chỉnh các trọng số của mạng sao cho hàm mục tiêu V = ∑ [y(k) −y(k)]
Trang 38Tổng quát với một mạng nơron truyền thẳng có Q lớp, m đầu vào và 1 đầu ra Trường hợp n đầu ra tương tự nhưng chúng ta sử dụng hàm mục tiêu V =E{(y − y)(y − y)}, E{.} là toán tử lấy kì vọng Gọi :
net và o lần lượt là tín hiệu vào và ra của nơron thứ i trong lớp thứ q
w là trọng số liên kết từ nơron thứ j lớp thứ q-1 tới nơron thứ i lớp q
s là số nơron trong lớp thứ q
Lưu ý: để tiện biểu diễn, người ta đưa thành phần bias b vào trong trọng số w
và coi nó như trọng số liên kết với một nơron “ảo” có đầu ra luôn là 1
Bước 1: Khởi tạo:
Khởi tạo ngẫu nhiên các trọng số trong một khoảng giá trị nhỏ
Tuần tự như vậy tới lớp ra: y(k) = o
Bước 3: Lan truyền ngược sai số:
Trang 39b Mạng nơron trong bài toán nhận dạng hệ thống
Nhận dạng hệ thống bằng mạng nơron đòi hỏi việc tìm mối quan hệ vào – ra trong hiện tại và quá khứ Để thể hiện sự lưu giữ thông tin trong quá khứ, người ta
sử dụng phần tử giữ trễ hay còn gọi là delay: z
Cấu trúc mạng nơron thường dùng trong nhận dạng hệ thống
Tương tự như khái niệm về hệ tuyến tính đáp ứng xung hữu hạn FIR (hay quá trình trung bình trượt – Moving Average) và đáp ứng xung vô hạn IIR (hay quá trình tự hồi quy AR), chúng ta cũng có hai cấu trúc mạng nơron tương ứng:
Time Delay Neural Network (TDNN - mạng nơron truyền thẳng có giữ trễ đầu vào)
Recurrent Neural Network (RNN - mạng nơron hồi quy) Mạng nơron hồi quy lại được phân ra thành hai loại cấu trúc:
o Mạng nơron hồi quy cục bộ Ví dụ mạng Elman…
o Mạng nơron hồi quy toàn cục Ví dụ mạng Jordan, NARX…
Trang 40Hình 3.3 Cấu trúc mạng nơron Elman [20]
Hình 3.4 Cấu trúc mạng nơron TDNN [20]