1. Trang chủ
  2. » Luận Văn - Báo Cáo

Nhận dạng lò hơi sử dụng mô hình phi tuyến

111 4 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Nhận Dạng Lò Hơi Sử Dụng Mô Hình Phi Tuyến
Tác giả Vũ Huy Hoàng
Người hướng dẫn PGS.TS. Hoàng Minh Sơn
Trường học Trường Đại Học Bách Khoa Hà Nội
Chuyên ngành Kỹ Thuật Điều Khiển Và Tự Động Hóa
Thể loại luận văn thạc sĩ
Năm xuất bản 2017
Thành phố Hà Nội
Định dạng
Số trang 111
Dung lượng 13,89 MB

Nội dung

84 Trang 10 Danh mục các chữ viết tắtAIC Akaike Information Criterion AR Autoregressive BIC Bayesian Information Criterion BP Backpropagation BPEM Bilinear model-based Prediction Error

Trang 1

LUẬN VĂN THẠC SĨ KỸ THUẬT

KỸ THUẬT ĐIỀU KHIỂN VÀ TỰ ĐỘNG HÓA

Trang 2

BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI

LUẬN VĂN THẠC SĨ KỸ THUẬT

KỸ THUẬT ĐIỀU KHIỂN VÀ TỰ ĐỘNG HÓA

NGƯỜI HƯỚNG DẪN KHOA HỌC :

PGS.TS HOÀNG MINH SƠN

Hà Nội – 2017

Trang 3

CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM

Độc lập – Tự do – Hạnh phúc

BẢN XÁC NHẬN CHỈNH SỬA LUẬN VĂN THẠC SĨ

Họ và tên tác giả luận văn : Vũ Huy Hoàng

Đề tài luận văn: Nhận dạng lò hơi sử dụng mô hình phi tuyến

Chuyên ngành: Kỹ thuật điều khiển và tự động hóa

Mã số HV: CB140499

Tác giả, Người hướng dẫn khoa học và Hội đồng chấm luận văn xác nhận tác giả đã sửa chữa, bổ sung luận văn theo biên bản họp Hội đồng ngày 26/04/2017 với các nội dung sau:

- Không sửa chữa

Ngày 11 tháng 05 năm 2017

Giáo viên hướng dẫn Tác giả luận văn

PGS.TS Hoàng Minh Sơn Vũ Huy Hoàng

CHỦ TỊCH HỘI ĐỒNG

GS.TS Nguyễn Doãn Phước

Trang 4

Lời cam đoan

Tôi xin cam đoan bản luận văn: “Nhận dạng lò hơi sử dụng mô hình phi tuyến”

do tôi tự thực hiện dưới sự hướng dẫn của thầy giáo, PGS TS Hoàng Minh Sơn Các số liệu và kết quả là hoàn toàn đúng với thực tế và chưa từng được công bố

Để hoàn thành luận văn này, tôi chỉ sử dụng những tài liệu được ghi trong danh mục tài liệu tham khảo và không sao chép hay sử dụng bất kỳ tài liệu nào khác Nếu phát hiện có sự sao chép tôi xin chịu hoàn toàn trách nhiệm

Học viên

Vũ Huy Hoàng

Trang 5

MỤC LỤC

Trang Danh sách hình vẽ v

Danh sách bảng vii

Danh mục các chữ viết tắt viii

Danh mục các kí hiệu ix

MỞ ĐẦU 1

CHƯƠNG 1: TỔNG QUAN VỀ NHẬN DẠNG LÒ HƠI 4

1.1 Sơ lược về vấn đề nhận dạng 4

1.1.1 Tổng quan về phương pháp 4

1.1.2 Phân loại các phương pháp nhận dạng 5

1.1.3 Các bước tiến hành nhận dạng 7

1.2 Lịch sử nghiên cứu trong lĩnh vực nhận dạng lò hơi 8

CHƯƠNG 2: PHƯƠNG PHÁP SAI SỐ DỰ BÁO 10

2.1 Phương pháp sai số dự báo (PEM) 10

2.2 Thuật toán Newton 12

2.3 Thuật toán di truyền (GA) 13

2.4 Thuật toán tối ưu bầy đàn (PSO) 18

CHƯƠNG 3: MÔ HÌNH PHI TUYẾN TRONG NHẬN DẠNG HỆ THỐNG 22

3.1 Các loại mô hình phi tuyến trong nhận dạng hệ thống 22

3.2 Mô hình song tuyến tính (Bilinear) 22

3.3 Mô hình mạng nơron hồi quy (RNN) 23

3.4 Mô hình Wiener sử dụng mạng nơron (Wiener – Neural Network) 33

3.5 Cấu trúc mô hình trong bài toán nhận dạng 35

CHƯƠNG 4: ĐỐI TƯỢNG LÒ HƠI 41

4.1 Quá trình công nghệ lò hơi 41

4.2 Giải pháp điều khiển cho lò hơi 42

Trang 6

4.2.1 Kiểm soát nhiệt độ hơi nước quá nhiệt 43

4.2.2 Áp suất hơi quá nhiệt ở đầu ra 44

4.2.3 Chất lượng quá trình cháy trong buồng lửa 44

4.3 Mô hình lý thuyết cho đối tượng lò hơi 44

CHƯƠNG 5: NHẬN DẠNG NGOẠI TUYẾN ĐỐI TƯỢNG LÒ HƠI 49

5.1 Nội dung thực nghiệm 49

5.2 Một số lưu ý trong quá trình nhận dạng lò hơi 50

5.3 Mô hình trạng thái tuyến tính 54

5.4 Mô hình trạng thái song tuyến tính 63

5.5 Mô hình Wiener sử dụng mạng nơron (WNN) 72

5.6 Mô hình mạng nơron hồi quy (RNN) 76

5.7 Tổng kết các mô hình nhận dạng ngoại tuyến 81

CHƯƠNG 6: NHẬN DẠNG TRỰC TUYẾN ĐỐI TƯỢNG LÒ HƠI 84

6.1 Phương pháp sai số dự báo đệ quy cho mô hình song tuyến tính 84

6.2 Nhận dạng trực tuyến lò hơi sử dụng mô hình song tuyến tính 88

KẾT LUẬN 96

DANH MỤC CÁC CÔNG TRÌNH ĐÃ CÔNG BỐ 97

TÀI LIỆU THAM KHẢO 98

Trang 7

Danh sách hình vẽ

Nội dung Trang

Hình 2.1 Lưu đồ thuật toán di truyền 14

Hình 2.2 Minh họa hoạt động của thuật toán PSO 18

Hình 2.3 Lưu đồ thuật toán PSO 19

Hình 3.1 Cấu tạo một nơron 24

Hình 3.2 Một số hàm kích hoạt cơ bản trong mạng nơron 26

Hình 3.3 Cấu trúc mạng nơron Elman 29

Hình 3.4 Cấu trúc mạng nơron TDNN 29

Hình 3.5 Cấu trúc mạng nơron NARX 30

Hình 3.6 Minh họa thuật toán BPTT 31

Hình 3.7 Minh họa hiện tượng Vanishing gradient 31

Hình 3.8 Mô hình phi tuyến Wiener - Hammerstein 33

Hình 3.9 Cấu trúc mô hình Wiener Neural Network (WNN) 34

Hình 3.10 Minh họa hiện tượng overfitting 36

Hình 3.11 Quan hệ giữa bậc mô hình – bias – variance 37

Hình 3.12 Minh họa quan hệ giữa số lượng mẫu – bias – variance 39

Hình 4.1 Sơ đồ cấu tạo lò hơi của một nhà máy nhiệt điện 41

Hình 4.2 Mô hình lò hơi giản lược 46

Hình 4.3 Các biến vào – ra trong đối tượng lò hơi 48

Hình 5.1 Dữ liệu vào – ra cho thí nghiệm 1 52

Hình 5.2 Dữ liệu vào – ra cho thí nghiệm 2 53

Hình 5.3 Kết quả nhận dạng – LLM – Thí nghiệm 1 55

Hình 5.4 Kết quả nhận dạng – LGA – Thí nghiệm 1 56

Hình 5.5 Kết quả nhận dạng – LPSO – Thí nghiệm 1 57

Hình 5.6 Kết quả nhận dạng – LLM – Thí nghiệm 2 58

Hình 5.7 Kết quả nhận dạng – LGA – Thí nghiệm 2 59

Hình 5.8 Kết quả nhận dạng – LPSO – Thí nghiệm 2 60

Trang 8

Hình 5.9 Kết quả nhận dạng – BLM – Thí nghiệm 1 64

Hình 5.10 Kết quả nhận dạng – BGA – Thí nghiệm 1 65

Hình 5.11 Kết quả nhận dạng – BPSO – Thí nghiệm 1 66

Hình 5.12 Kết quả nhận dạng – BLM – Thí nghiệm 2 67

Hình 5.13 Kết quả nhận dạng – BGA – Thí nghiệm 2 68

Hình 5.14 Kết quả nhận dạng – BPSO – Thí nghiệm 2 69

Hình 5.15 Kết quả nhận dạng – WNN – Thí nghiệm 1 73

Hình 5.16 Kết quả nhận dạng – WNN – Thí nghiệm 2 74

Hình 5.17 Kết quả nhận dạng – RNN – Thí nghiệm 1 77

Hình 5.18 Kết quả nhận dạng – RNN – Thí nghiệm 2 78

Hình 5.19 Hiện tượng overfitting khi huấn luyện RNN 79

Hình 6.1 Kết quả nhận dạng – BRPEM-0 91

Hình 6.2 Kết quả nhận dạng – BRPEM 92

Hình 6.3 Kết quả nhận dạng – LRPEM 93

Hình 6.4 Sự biến thiên giá trị các tham số theo thời gian - BRPEM 94

Hình 6.5 Sự biến thiên giá trị các tham số theo thời gian - LRPEM 94

Trang 9

Danh sách bảng

Bảng 5.1 Kết quả nhận dạng – LLM 61

Bảng 5.2 Kết quả nhận dạng – LGA 61

Bảng 5.3 Kết quả nhận dạng – LPSO 62

Bảng 5.4 Kết quả nhận dạng – BLM 70

Bảng 5.5 Kết quả nhận dạng – BGA 70

Bảng 5.6 Kết quả nhận dạng – BPSO 71

Bảng 5.7 Kết quả nhận dạng – WNN 75

Bảng 5.8 Kết quả nhận dạng – RNN 79

Bảng 5.9 Kết quả nhận dạng ngoại tuyến 81

Bảng 5.10 Thời gian tính toán của các mô hình trong thí nghiệm 2 81

Bảng 6.1 So sánh nhận dạng ngoại tuyến và nhận dạng trực tuyến 84

Bảng 6.2 Kết quả nhận dạng - BRPEM 90

Trang 10

BPEM Bilinear model-based Prediction Error Method

BPTT Backpropagation Through Time

EC Evolutionary Computation

FIR Finite Impulse Response

IIR Infinite Impulse Response

LPEM Linear model-based Prediction Error Method

MSE Mean Squared Error

NARX Nonlinear Autoregressive Network with exogenous inputs PEM Prediction Error Method

PSO Particle Swarming Optimization

RNN Recurrent Neural Network

RPEM Recursive Prediction Error Method

SNR Signal to Noise Ration

TDNN Time Delay Neural Network

WNN Wiener model-based Neural Network

Trang 11

Danh mục các kí hiệu

V(θ) Hàm mục tiêu

N Số lượng mẫu huấn luyện

y(k) Giá trị (vector) biến đầu ra ở thời điểm thứ k

u(k) Giá trị (vector) biến đầu vào ở thời điểm thứ k

x(k) Giá trị (vector) biến trạng thái ở thời điểm thứ k

θ(k) Giá trị (vector) tham số mô hình ở thời điểm thứ k ε(k) Giá trị (vector) sai số dự báo ở thời điểm thứ k

e(k) Giá trị (vector) nhiễu đo ở thời điểm thứ k

ψ(k) Giá trị (vector) gradient của hàm mục tiêu theo tham số φ(k) Giá trị (vector) biến hồi quy ở thời điểm thứ k

Λ(k) Ma trận hiệp phương sai của nhiễu

q Toán tử giữ trễ

A Ma trận trạng thái

∗ Giá trị tuyến tính hóa của đại lượng (∗)

∆(∗) Giá trị chênh lệch của đại lượng (∗)

E[∗] Giá trị kì vọng của đại lượng (∗)

Var[∗] Giá trị phương sai của đại lượng (∗)

 Giá trị của đại lượng theo dải biểu diễn ban đầu

Trang 12

MỞ ĐẦU

Lý do lựa chọn đề tài

Lò hơi là đối tượng đóng vai trò quan trọng trong nhiều quá trình công nghiệp

Dù một số giải pháp điều khiển lò hơi đã ra đời và được ứng dụng rộng rãi trong thực tế, nhu cầu nâng cao chất lượng điều khiển vẫn là yếu tố thu hút sự quan tâm của các nhà công nghệ Những năm gần đây, một số phương pháp điều khiển hiện đại đã và đang được nghiên cứu, ứng dụng cho bài toán điều khiển lò hơi; trong số

đó, phải kể đến nhóm các phương pháp điều khiển dự báo với nhiều ưu điểm vượt trội so với các phương pháp truyền thống Mặt khác, để thiết kế những bộ điều khiển có chất lượng cao, việc mô hình hóa đối tượng điều khiển là nhiệm vụ đầu tiên cần tiến hành

Trong một số trường hợp, việc mô hình hóa đối tượng điều khiển có thể được thực hiện tương đối hiệu quả dựa trên hướng tiếp cận lý thuyết Bằng cách phân tách các quá trình diễn ra bên trong đối tượng, áp dụng các quy luật vật lý, hóa học… các nhà công nghệ có thể tìm ra được những mô hình toán học phản ánh tương đối chính xác sự vận động của đối tượng Dù vậy, với bản chất phức tạp, phi tuyến, đa biến vào – ra của lò hơi, việc xây dựng mô hình toán học dựa hoàn toàn vào lý thuyết trở nên không khả thi hoặc quá phức tạp Do đó, hướng tiếp cận phổ biến trong bài toán nhận dạng lò hơi là thực nghiệm hoặc kết hợp giữa lý thuyết và thực nghiệm

Trong giai đoạn từ năm 1950 đến nay, đã có rất nhiều công trình nghiên cứu xoay quanh chủ đề mô hình hóa đối tượng lò hơi, trong đó bao gồm các công trình thực hiện ở Việt Nam Mặc dù vậy, đa số các công trình nêu trên sử dụng lớp mô hình tuyến tính vốn chỉ hiệu quả trong một phạm vi làm việc hạn chế Khả năng mô

tả chính xác hoạt động của lò hơi tại nhiều điểm làm việc khác nhau vẫn là một vấn

đề phức tạp, đòi hỏi các hướng tiếp cận mới, chẳng hạn như sử dụng các mô hình

Trang 13

phi tuyến Do đó, em xin được sử dụng đề tài “Nhận dạng lò hơi sử dụng mô hình phi tuyến” cho luận văn cao học của mình

Mục đích, đối tượng, phạm vi nghiên cứu của luận văn

Mục tiêu chính của luận văn đó là: Xây dựng mô hình trạng thái phi tuyến của

lò hơi sử dụng dữ liệu vận hành thu thập được từ một số nhà máy nhiệt điện, phù

hợp cho việc áp dụng các phương pháp điều khiển nâng cao

Các nội dung công việc cụ thể cần đạt được bao gồm:

 Nghiên cứu các phương pháp nhận dạng mô hình trạng thái nói chung và mô hình trạng thái phi tuyến nói riêng

 Nghiên cứu lựa chọn kiểu mô hình phi tuyến phù hợp cho lò hơi (mô hình Hammerstein, Wiener-Hammerstein, mô hình song tuyến, )

 Phát triển thuật toán, cài đặt và nhận dạng mô hình dựa trên dữ liệu vận hành thu thập từ một số nhà máy nhiệt điện

 Đánh giá ưu nhược điểm và khả năng sử dụng của mô hình nhận được

Các luận điểm cơ bản và đóng góp mới của tác giả

 Tìm hiểu quá trình công nghệ, phân tích cấu trúc điều khiển được sử dụng trong lò hơi nhà máy nhiệt điện Làm rõ các biến vào – ra của đối tượng và sử dụng các biến này làm nền tảng cho việc mô hình hóa lò hơi

 Trình bày cơ sở lý thuyết nhận dạng hệ thống dựa trên phương pháp sai số dự báo Trình bày qui trình xây dựng mô hình trạng thái nói chung bằng phương pháp sai số dự báo sử dụng thuật toán Newton, thuật toán di truyền và thuật toán tối ưu bầy đàn Đề xuất mô hình phi tuyến Wiener sử dụng mạng nơron trong bài toán nhận dạng lò hơi Sử dụng mô hình song tuyến tính và mô hình mạng nơron hồi quy trong bài toán nhận dạng lò hơi Phát triển thuật toán sai số dự báo đệ quy cho việc

nhận dạng trực tuyến lò hơi sử dụng mô hình song tuyến tính

Trang 14

 Tiến hành nhận dạng và kiểm chứng trên đối tượng là một lò hơi thuộc nhà máy nhiệt điện Phả Lại Từ đó đưa ra ưu nhược điểm và khả năng ứng dụng của các

mô hình nêu trên

Bố cục của luận văn

Luận văn bao gồm 6 chương với các nội dung cơ bản như sau:

Chương 1 (Tổng quan về nhận dạng lò hơi): Trình bày một số khái niệm chung

về nhận dạng hệ thống cũng như một số kết quả nghiên cứu trước đây trong bài toán nhận dạng lò hơi

Chương 2 (Phương pháp sai số dự báo): Giới thiệu về phương pháp sai số dự báo và đề xuất sử dụng một số thuật toán tối ưu nhằm cải thiện chất lượng phương pháp sai số dự báo

Chương 3 (Mô hình phi tuyến trong nhận dạng hệ thống): Trình bày một số dạng mô hình phi tuyến thường dùng trong nhận dạng hệ thống cũng như một số lưu ý khi lựa chọn cấu trúc mô hình

Chương 4 (Đối tượng lò hơi): Trình bày những hiểu biết cơ bản về đối tượng lò hơi trong nhà máy nhiệt điện, làm rõ các biến vào – ra cần quan tâm trong luận văn Chương 5 (Nhận dạng ngoại tuyến đối tượng lò hơi): Áp dụng các thuật toán và

mô hình nêu trên trong việc nhận dạng ngoại tuyến lò hơi tại nhà máy nhiệt điện Phả Lại Phân tích ưu nhược điểm, phạm vi ứng dụng của từng loại mô hình

Chương 6 (Nhận dạng trực tuyến đối tượng lò hơi): Xây dựng thuật toán nhận dạng trực tuyến lò hơi sử dụng mô hình song tuyến tính

Kết luận: Trình bày các kết quả đã đạt được và hướng phát triển tiếp theo của luận văn

Trang 15

CHƯƠNG 1: TỔNG QUAN VỀ NHẬN DẠNG LÒ HƠI

Phần đầu chương này trình bày khái quát về bài toán nhận dạng (hệ thống), phân loại các phương pháp nhận dạng thông dụng cũng như các bước cần tiến hành khi nhận dạng hệ thống Phần tiếp theo của chương tóm lược một số kết quả trong lĩnh vực nhận dạng lò hơi; trên cơ sở đó xác định hướng tiếp cận và phương pháp nhận dạng sử dụng trong luận văn

1.1 Sơ lược về vấn đề nhận dạng

1.1.1 Tổng quan về phương pháp

Đại đa số các phương pháp điều khiển đều dựa trên mô hình động học của đối tượng Công việc xây dựng các mô hình toán học mô tả các hệ động học có sử dụng các thông tin thu được từ hệ thống thực được gọi là nhận dạng hệ thống

Một cách khái quát nhất, việc mô hình hóa thường được tiếp cận theo một trong các hướng sau đây:

 Phương pháp lý thuyết (còn được gọi là nhận dạng “hộp trắng”): dựa trên các quy luật vật lý, hóa học…, cùng với các thông số kỹ thuật của thiết bị để xác định cấu trúc mô hình và giá trị của các tham số Phương pháp này có ích trong việc khảo sát đặc tính động học, xác định cấu trúc mô hình, thiết kế sách lược điều khiển nhưng ít phù hợp cho việc xác định các tham số mô hình Trên thực tế, cách tiếp cận này ít được sử dụng do mức độ phức tạp, đòi hỏi hiểu biết sâu sắc hệ thống cũng như việc khó xác định chính xác các thông số kỹ thuật của thiết bị

 Phương pháp thực nghiệm (còn được gọi là nhận dạng “hộp đen”): quan sát tín hiệu vào ra, phân tích số liệu thu được để xác định mô hình trực tiếp từ thực nghiệm Phương pháp này có thể giúp ước lượng tương đối chính xác mô hình, nhưng đòi hỏi người dùng biết trước cấu trúc của mô hình cũng như dữ liệu đo phải

đủ tin cậy Trong nhiều trường hợp dữ liệu đo chịu nhiều ảnh hưởng của nhiễu hoặc

Trang 16

mô hình phức tạp, số lượng tham số cần xác định lớn, phương pháp này tỏ ra kém chính xác

 Phương pháp kết hợp lý thuyết và thực nghiệm (còn gọi là nhận dạng “hộp xám”): kết hợp việc phân tích lý thuyết và phân tích dữ liệu thực nghiệm Nhờ đó, phương pháp này kế thừa ưu điểm của cả hai phương pháp nêu trên, giúp thu được

mô hình có độ chính xác cao nhưng vẫn đảm bảo được tính đơn giản và tin cậy

1.1.2 Phân loại các phương pháp nhận dạng

Các phương pháp nhận dạng được phân loại dựa trên nhiều tiêu chí, bao gồm:

a Theo dạng mô hình được sử dụng

 Mô hình liên tục (continuous-time model): mối quan hệ giữa các đại lượng đặc trưng cho quá trình được mô tả bằng một hệ các phương trình vi phân trên miền thời gian liên tục

 Mô hình gián đoạn (discrete-time model): mối quan hệ giữa các đại lượng đặc trưng cho quá trình được mô tả bằng một hệ các phương trình sai phân trên miền thời gian gián đoạn Do dữ liệu thu được trong thực nghiệm đều là dữ liệu trên miền gián đoạn, nên mô hình gián đoạn thường được sử dụng trong thực nghiệm

 Mô hình tuyến tính (linear model): mối quan hệ giữa các đại lượng đặc trưng cho quá trình được mô tả bằng một hệ phương trình tuyến tính Mô hình tuyến tính được ưa chuộng do sự phát triển của các phương pháp điều khiển tuyến tính

 Mô hình phi tuyến (nonlinear model): mối quan hệ giữa các đại lượng đặc trưng cho quá trình được mô tả bằng một hệ phương trình trong đó có ít nhất một yếu tố phi tuyến

 Mô hình vào ra (input – output model): mô tả mối quan hệ giữa các biến vào –

ra thay vì các liên kết nội tại bên trong hệ thống

 Mô hình trạng thái (state – space model): mô tả mối quan hệ giữa các biến vào – ra thông qua các biến trạng thái

Trang 17

b Theo điều kiện thực nghiệm

 Nhận dạng chủ động: tác động tín hiệu kích thích ở biến đầu vào hoặc đầu ra sao cho phù hợp với đặc tính động học của quá trình, làm tăng độ tin cậy và chất lượng cho dữ liệu Phương pháp này có thể khá tốn kém và không khả thi với các quá trình đang vận hành ổn định

 Nhận dạng bị động: sử dụng các số liệu thu được trong lúc hệ thống đang vận hành mà không làm ảnh hưởng nhiều đến quá trình công nghệ Phương pháp này có thể không đảm bảo tính bền (giàu thông tin) nếu sự thay đổi của tín hiệu kích thích

là quá nhỏ hoặc quá đơn giản so với đặc tính động học của quá trình thực

 Nhận dạng vòng hở (open-loop identification): thu thập dữ liệu khi hệ thống

bị cách li khỏi vòng điều khiển Phương pháp này có thể không đảm bảo tính ổn định và chất lượng khi đang vận hành quá trình công nghệ

 Nhận dạng vòng kín (closed-loop identification): thu thập dữ liệu trong khi hệ thống vẫn làm việc ổn dịnh dưới sự điều khiển của các bộ điều khiển Mặc dù có thể đảm bảo tính ổn định của quá trình công nghệ, phương pháp có thể gây khó khăn khi sử dụng một số thuật toán nhận dạng, do sự tương quan ngược giữa các biến vào

ra thông qua việc phản hồi

 Nhận dạng trực tiếp (direct identification): sử dụng giá trị các biến vào – ra của hệ thống, không cần thông tin chính xác về bộ điều khiển Tuy nhiên, nếu quá trình nhận dạng được thực hiện trong vòng kín, cần lưu ý đến tính nhất quán và hội

hệ hở, vì vậy khắc phục được nhược điểm của phương pháp nhận dạng gián tiếp

Trang 18

c Theo yêu cầu công nghệ:

 Nhận dạng ngoại tuyến (offline identification): tiến hành thu thập toàn bộ dữ liệu trước, sau đó mới tiến hành nhận dạng, kiểm chứng trên tập dữ liệu đã thu được

 Nhận dạng trực tuyến (online identification): thu thập dữ liệu và tiến hành nhận dạng đồng thời để phục vụ việc chỉnh định trực tuyến, liên tục cho bộ điều khiển hoặc tối ưu hóa theo thời gian thực

d Theo phương pháp ước lượng tham số

 Phương pháp bình phương cực tiểu (least-squares)

 Phương pháp phân tích tương quan (correlation analysis)

 Phương pháp phân tích phổ (spectrum analysis)

 Phương pháp biến phụ (instrumental variable)

 Phương pháp xác suất cực đại (maximum likelihood)

 Phương pháp sai số dự báo (prediction error method)

 Phương pháp không gian con (subspace method)

Về mặt tư tưởng, các phương pháp này có thể độc lập nhưng về bản chất không hoàn toàn khác biệt; nhiều khi chúng còn là dẫn xuất của nhau Mỗi phương pháp đều có ưu nhược điểm riêng, do đó tùy theo từng đối tượng, yêu cầu và hoàn cảnh

sự dụng cụ thể, chúng ta khó có thể khẳng định sự vượt trội tuyệt đối của riêng một phương pháp nào

1.1.3 Các bước tiến hành nhận dạng

i Thu thập số liệu và khai thác thông tin ban đầu về quá trình: mô tả các quá

trình vật lý, hóa học xảy ra bên trong đối tượng, các thông số vận hành, các giới hạn trên và dưới của các đại lượng có liên quan… Từ đó xác định các biến vào ra cần quan tâm, các điều kiện biên và các giả thiết có liên quan

ii Lựa chọn phương pháp nhận dạng: tùy theo từng trường hợp cụ thể, lựa chọn

phương pháp nhận dạng phù hợp, chẳng hạn như nhận dạng trực tuyến/ngoại tuyến,

Trang 19

nhận dạng vòng hở/vòng kín, nhận dạng chủ động/bị động, thuật toán ước lượng tham số và tiêu chuẩn đánh giá chất lượng mô hình

iii Thu thập số liệu thực nghiệm: thu thập dữ liệu để thỏa mãn được mối quan

hệ vào ra giữa các biến, xử lý thô các số liệu nhằm loại bỏ những giá trị đo kém tin cậy, lọc nhiễu, chuẩn hóa

iv Xác định dạng và cấu trúc mô hình: từ yêu cầu về mục đích sử dụng mô hình

và khả năng ứng dụng của phương pháp nhận dạng, chọn dạng mô hình (phi tuyến/tuyến tính, liên tục /gián đoạn…) Đưa ra các giả thiết ban đầu về cấu trúc mô hình (bậc tử số, mẫu số của hàm truyền đạt, có hay không có trễ )

v Xác định tham số mô hình: ước lượng giá trị các tham số của mô hình theo

phương pháp, thuật toán đã chọn Nếu tiến hành theo từng mô hình con (ví dụ từng kênh vào ra, từng khâu trong quá trình) thì sau đó cần kết hợp chúng lại thành một

mô hình tổng thể

vi Mô phỏng, kiểm chứng và đánh giá mô hình: thực hiện mô phỏng để kiểm

chứng độ chính xác Việc kiểm chứng thông thường được thực hiện bằng việc sử dụng mô hình để mô phỏng dữ liệu vào ra, sau đó kết quả thu được sẽ đem so với

bộ dữ liệu vào ra thu thập được từ thực nghiệm Dữ liệu thực tế dùng để kiểm chứng phải là bộ dữ liệu khác với bộ dữ liệu dùng để tính toán thiết lập mô hình

1.2 Lịch sử nghiên cứu trong lĩnh vực nhận dạng lò hơi

Từ những năm 1950 đến nay, đã có rất nhiều công trình bàn về lĩnh vực mô hình hóa lò hơi, trong đó phổ biến nhất là hướng tiếp cận nhận dạng hộp đen và hộp xám Theo hướng nhận dạng hộp đen, đa phần các công trình nghiên cứu xoay quanh việc sử dụng mô hình vảo – ra dạng đa thức như ARX, OE hoặc ARMAX (Vasqueza, 2008 [29] và Inoue, 2002 [15]) Ngoài ra, các công trình sử dụng mạng nơron để mô phỏng hoạt động của lò hơi cũng đã được ghi nhận (Irwin, 1995 [16]

và Rusinowski , 2007 [28]) Nhìn chung, phương pháp nhận dạng hộp đen tuy mang tính trực tiếp và có thể chính xác nhưng kéo theo đó là sự phức tạp do số lượng các

Trang 20

tham số trong mô hình lớn cũng như độ tin cậy bị hạn chế theo điều kiện thực nghiệm

Theo hướng nhận dạng hộp xám, tiêu biểu có thể kể đến công trình của Astrom (2000) [7], trong đó mô tả đặc tính của bao hơi tương đối chính xác sử dụng mô hình phi tuyến Ngoài ra, các công trình nghiên cứu có sử dụng các khâu phi tuyến tĩnh như mô hình Wiener – Hammerstein (Rizvi, 2010 [27] và Jafari, 2012 [17] cũng đã ra đời, với ưu điểm là sự đơn giản và hiệu quả khi xây dựng mô hình Trong các công trình này, phương pháp nhận dạng lò hơi là sử dụng dữ liệu thu được từ vòng hở

Ở Việt Nam, hai trong số các công trình gần đây bao gồm luận văn của các tác giả N H Q Đạt [1], T T K Ly và H M Sơn [4] Công trình [1] xây dựng mô hình động học cho lò hơi tại nhà máy đạm Phú Mỹ, sử dụng các mô hình đa thức và phương pháp bình phương tối thiểu Công trình [4] xây dựng mô hình phi tuyến giả LPV và phương pháp sai số dự báo cho lò hơi tại một số nhà máy nhiệt điện ở Quảng Ninh và Phả Lại

Tựu chung, phần nhiều các công trình trước đây đi theo hướng nhận dạng vòng

hở và sử dụng kích thích chủ động Trên thực tế, hướng tiếp cận này có thể gặp nhiều khó khăn do vấn đề về chi phí cũng như an toàn khi tiến hành thực nghiệm Ngoài ra, số lượng các công trình sử dụng mô hình phi tuyến trong nhận dạng lò hơi cũng chưa thực sự nhiều, nhất là tại Việt Nam Hiểu được điều đó, trong khuôn khổ luận văn này, em xin tập trung vào trường hợp nhận dạng lò hơi trong vòng kín với kích thích bị động, sử dụng một số mô hình phi tuyến trên miền thời gian gián đoạn Trong các phương pháp nhận dạng hệ thống được sử dụng phổ biến, phương pháp sai số dự báo thích hợp cho việc nhận dạng vòng kín do không cần giả thiết về sự độc lập giữa tín hiệu vào – ra, đồng thời có thể áp dụng dễ dàng cho các dạng mô hình khác nhau, bao gồm cả các mô hình phi tuyến Do đó, nội dung chương tiếp theo sẽ bàn về phương pháp sai số dự báo, cũng như khả năng ứng dụng của một số thuật toán tối ưu trong việc nâng cao chất lượng của phương pháp sai số dự báo

Trang 21

CHƯƠNG 2: PHƯƠNG PHÁP SAI SỐ DỰ BÁO

Nội dung của chương này xoay quanh phương pháp sai số dự báo, cũng như khả

năng ứng dụng một số thuật toán tối ưu như thuật toán di truyền (GA), thuật toán tối

ưu bầy đàn (PSO) với mục đích cải thiện chất lượng của phương pháp sai số dự báo

truyền thống

2.1 Phương pháp sai số dự báo (PEM)

Phương pháp sai số dự báo là một phương pháp kinh điển được sử dụng rất

rộng rãi trong bài toán nhận dạng hệ thống Ý tưởng của phương pháp này xuất phát

từ việc đánh giá tiêu chuẩn “sai số dự báo” qua một hàm mục tiêu, và nếu tìm được

vector tham số làm cho hàm phí tổn này là nhỏ nhất thì tham số đó cũng là tham số

tối ưu cần tìm

Xét trường hợp một cấu trúc mô hình ℳ đã được lựa chọn và đặc trưng bởi

vector tham số θ ∈ D⊂ ℛ , trong đó d là số phần tử của vector Tập các mô θ

hình tương ứng sẽ là ℳ∗ = {ℳ(θ)|θ ∈ D} Mỗi mô hình ℳ(θ) có thể được coi

như một cách dự báo đầu ra tương lai của hệ Chẳng hạn, nếu mô hình là tuyến tính

thì bộ dự báo tuyến tính của mô hình có thể chọn là:

y(k|θ) = W(q, θ) y(k) + W(q, θ) u(k) (2.1)

Bộ dự báo cũng có thể coi là một bộ lọc phi tuyến:

y(k|θ) = gk, Z, θ (2.2)

Với bộ dữ liệu thu thập: Z = {y(1), u(1), y(2), u(2), … , y(N), u(N)} Bài toán

ước lượng tham số trở thành bài toán xác định ánh xạ từ tập ZN → θ ∈ D Sai số

dự báo là sai số giữa đầu ra thực và đầu ra dự báo:

Từ bộ dữ liệu Z đã thu thập được, sai số ε(k, θ)sẽ được tính cho các thời điểm

k=1,…, N Tiếp theo, chúng ta cần tìm vectơ tham số sao cho dãy sai số dự báo θ

ε(k, θ)thu được “càng nhỏ càng tốt”

Trang 22

Ngoài ra, dãy sai số cũng có thể được lọc bằng một bộ lọc tuyến tính ổn định L(q) quanh một miền tần số quan tâm

ε(k, θ) = L(q) ε(k, θ)k = 1, … , N (2.4)

Nếu gom dãy sai số dự báo ε(k, θ)lại thành vector ε(θ) = ε(1, θ)…

ε(N, θ), thì độ lớn của vector này có thể được xác định thông qua các chuẩn, chẳng hạn như chuẩn Euclide, chuẩn bậc nhất hay chuẩn vô cùng:

Như vậy, vấn đề còn lại của phương pháp PEM chính là cách thức giải bài toán tối ưu Các phương pháp giải có thể chia ra 2 nhóm chính:

 Phương pháp sử dụng công cụ đạo hàm theo hướng (gradient): tiêu biểu là thuật toán Newton và dẫn xuất khác Phương pháp sai số dự báo (PEM) do Ljung [22] đề xuất sử dụng thuật toán Newton để giải bài toán cực tiểu hóa hàm mục tiêu

Trang 23

 Phương pháp không sử dụng gradient: tiêu biểu là thuật toán simulated annealing (SA), thuật toán di truyền (GA), thuật toán tối ưu bầy đàn (PSO)…

2.2 Thuật toán Newton

Thuật toán Newton là một thuật toán lặp giúp tìm điểm dừng của một hàm số,

và thường được áp dụng để giải bài toán cực tiểu hóa hàm mục tiêu V(θ, Z) Nội dung của thuật toán Newton có thể tóm tắt như sau:

Bước 1: Khởi tạo

 Biến đếm bước lặp (s = 0)

 Tham số θ(s = 0) = θ

Bước 2: Tìm gradient ψ(k, θ) =(|) với k = 1,2 N theo cấu trúc mô hình

Bước 3: Cập nhật vector tham số theo luật:

θ(s + 1) = θ(s) − [V(θ(s))] V′(θ(s)) (2.7) Trong đó:

Từ đây, chúng ta có các dẫn xuất của thuật toán Newton như sau:

 Thuật toán suy giảm độ dốc (steepest descent) :

Trang 24

 Thuật toán Levenberg – Marquardt:

Bước 4: Kiểm tra điều kiện dừng thuật toán:

 Số bước lặp s > s với s > 0cho trước

 Giá trị hàm mục tiêu V[θ(s + 1)] < V với V > 0cho trước

 Bước học μ(s) > μ với μ > 0cho trước

 Giá trị ‖θ(s + 1) − θ(s)‖ < δ với δ > 0cho trước

 Gradient đạt dưới một ngưỡng nào đó [()]  < grad

Nếu không thỏa mãn một trong các điều kiện trên, đặt s = s+1 và quay trở lại bước 2

2.3 Thuật toán di truyền (GA)

Phương pháp sai số dự báo có bản chất là bài toán tối ưu phi tuyến; công cụ để giải quyết bài toán này thường là thuật toán Newton hay điển hình là thuật toán Levenberg – Marquardt Tuy nhiên, trong nhiều trường hợp khi hàm mục tiêu có dạng phức tạp, dữ liệu bị chịu ảnh hưởng của nhiễu hoặc điểm khởi tạo thuật toán tìm kiếm chưa thích hợp thì các thuật toán tìm kiếm dựa trên gradient có thể bị kẹt trong một lòng chảo (basin) và vì vậy chỉ tìm được cực trị địa phương thay vì cực trị toàn cục Thuật toán di truyền (GA – Genetic Algorithm) có thể giúp khắc phục vấn

đề này

Thuật toán di truyền mô phỏng quá trình chọn lọc tự nhiên và di truyền trong vấn đề tìm kiếm nghiệm cho bài toán tối ưu Tư tưởng chính của thuật toán là: cá

Trang 25

thể nào phù hợp với điều kiện môi trường sẽ tồn tại và truyền lại những đặc tính tốt cho đời sau Các cá thể kém phù hợp sẽ bị loại bỏ dần theo thời gian

Hình 2.1 Lưu đồ thuật toán di truyền

Trong thuật toán di truyền, khái niệm “quần thể” đóng vai trò như tập các lời giải của bài toán Mỗi “cá thể” trong quần thể đóng vai trò như một lời giải và mỗi

“gen” đóng vai trò như một thành phần trong lời giải đó Qua nhiều thế hệ chọn lọc, lai ghép và đột biến, các cá thể sẽ tiến hóa và có thể hội tụ đến nghiệm tối ưu toàn cục

Trang 26

Cách mã hóa các nhiễm sắc thể

Tùy theo từng bài toán, có thể lựa chọn kiểu mã hóa nhị phân, hoán vị Ở bài toán nhận dạng hệ thống, mỗi cá thể là một vector tham số còn mỗi gen chính là θmột thành phần của Do đó em lựa chọn kiểu mã hóa là số thực θ

Khởi tạo quần thể ban đầu

Quần thể ban đầu có thể lựa chọn một cách ngẫu nhiên theo một phân bố nào

đó, hoặc trải đều trên không gian tìm kiếm Kích thước quần thể càng lớn thì mức

độ bao phủ không gian tìm kiếm càng lớn, nhờ vậy việc tìm kiếm cũng sẽ bao quát hơn Tuy nhiên kích thước quần thể lớn sẽ làm tăng khối lượng tính toán Tùy thuộc vào độ phức tạp bài toán cũng như số chiều của vector tham số mà chúng ta cần θlựa chọn kích thước quần thể và cách sinh quần thể ban đầu cho phù hợp

Hàm thích nghi (fitness function)

Để đánh giá độ phù hợp của từng lời giải (từng cá thể trong quần thể), khái niệm hàm thích nghi được sử dụng Cá thể càng phù hợp, giá trị hàm thích nghi càng cao Có nhiều cách lựa chọn hàm thích nghi Có thể chọn hàm thích nghi là nghịch đảo của hàm mục tiêu V[θ(s)] Tuy nhiên, cần lưu ý rằng dải giá trị của hàm thích nghi đóng vai trò quan trọng đến hoạt động của thuật toán Nếu các giá trị này chênh lệch quá lớn sẽ dẫn tới việc các cá thể có điểm số cao nhất được chọn lựa quá thường xuyên Điều này có thể làm giảm độ rộng của miền tìm kiếm Ngược lại, nếu các giá trị này chênh lệch quá ít, các cá thể sẽ có cơ hội được chọn gần bằng nhau, dẫn tới việc tìm kiếm sẽ mất nhiều thời gian hoặc có thể không hội tụ Vì vậy, cần biến đổi hàm mục tiêu về dải biểu diễn phù hợp (scaling)

Các cơ chế scaling phổ biến là: xếp hạng (rank), hay chọn bình đẳng n cá thể tốt nhất…Trong luận văn này, cơ chế xếp hạng được sử dụng: hàm mục tiêu càng cao thì hạng cá thể càng thấp Cá thể hạng r sẽ có giá trị hàm thích nghi là 

√

Chọn lọc (selection)

Trang 27

Các cá thể có độ thích nghi cao sẽ được lai ghép để sinh ra các cá thể mới tốt hơn Một số cơ chế chọn lọc bao gồm: chọn ngẫu nhiên, bánh xe roulette, đấu loại (tournament)…

Trong luận văn này, em sử dụng cơ chế chọn lọc mẫu ngẫu nhiên đều (stochastic uniform) Số phần tử được chọn lọc là N

 Biểu diễn các cá thể lên trên một đoạn thẳng, mỗi cá thể chiếm một phần của đoạn thẳng có độ dài tỉ lệ với độ thích nghi đã chuẩn hóa của cá thể đó

 Đặt N điểm chọn lên đường thẳng Các điểm chọn này cách nhau 

 , điểm đầu tiên đặt ngẫu nhiên trong khoảng [0,

]

 Với một điểm chọn, cá thể gần nhất về bên phải sẽ được chọn

Về bản chất, phương pháp này có đặc điểm là các cá thể sẽ được chọn với xác suất tỉ lệ với độ thích nghi của chúng, đồng thời vẫn cho phép các cá thể có mức độ thích nghi yếu hơn không bị lấn át hoàn toàn, do đó duy trì tính đa dạng cho quần thể Các cá thể sau khi chọn lọc sẽ được đưa vào lai ghép

Lai ghép (crossover)

Lai ghép là sự kết hợp các cá thể cha mẹ để tạo ra một cá thể có độ thích nghi tốt hơn Đây là quá trình chủ đạo trong thuật toán di truyền

Các cơ chế lai ghép thông thường bao gồm: cơ chế trung bình, cơ chế phân tán,

cơ chế kinh nghiệm, cơ chế số học… Trong luận văn này, em chọn cơ chế lai ghép trung bình được biểu diễn bởi công thức:

Trong đó Ratio là một ma trận trọng số cho trước

Đột biến (mutation)

Đột biến là một sự biến đổi tại một (hay một số) gen của nhiễm sắc thể ban đầu

để tạo ra một nhiễm sắc thể hay cá thể mới Đột biến có xác suất xảy ra thấp hơn nhiều so với lai ghép Đột biến có thể tạo ra một cá thể mới tốt hơn hoặc xấu hơn cá thể ban đầu

Trang 28

Các cơ chế đột biến thông thường được lựa chọn là: phân bố Gauss, phân bố đều, thích nghi…Trong luận văn này, em lựa chọn cơ chế phân bố Gaus cho bước lặp thứ k như sau:

σ = σ1 − Shrink  (2.16) Trong đó,w là số ngẫu nhiên rút ra từ phân bố Gauss (0, σ); Generation

là số bước lặp tối đa và Shrink là hệ số suy giảm tính đa dạng Đột biến là thành phần quan trọng; nó góp phần mở rộng phạm vi tìm kiếm ra các khu vực khác trong không gian Tuy nhiên, nếu tỉ lệ đột biến quá cao, việc tìm kiếm có thể mất quá nhiều thời gian hoặc thậm chí là không hội tụ Tỉ lệ đột biến nên thấp hơn 10%

Các điều kiện kết thúc thuật toán

Thuật toán dừng khi gặp một trong hai điều kiện sau:

 Kết thúc khi số bước lặp sinh ra đạt đến giới hạn (em chọn = 5000 bước lặp)

 Kết thúc khi cá thể tốt nhất trong quần thể hầu như không thay đổi qua một số

lượng bước lặp nhất định (em chọn = 50 bước lặp)

b Ưu nhược điểm thuật toán GA

Ưu điểm:

 Thuật toán GA duyệt qua không gian tìm kiếm sử dụng nhiều cá thể, vì vậy ít

mắc phải cực trị địa phương hơn so với một số thuật toán khác

 Việc lựa chọn các tham số cho thuật toán đòi hỏi nhiều thử nghiệm

 Thuật toán di truyền không đảm bảo tính hội tụ đến nghiệm tối ưu toàn cục

Trang 29

2.4 Thuật toán tối ưu bầy đàn (PSO)

Hình 2.2 Minh họa hoạt động của thuật toán PSO [13]

Thuật toán tối ưu bầy đàn (Particle Swarming Optimization – PSO) là một thuật toán tối ưu ngẫu nhiên không sử dụng gradient, có nhiều nét tương tự như thuật toán

di truyền Ý tưởng của phương pháp đó là mô phỏng hành vi của các bầy chim hay đàn cá trong quá trình tìm mồi Trong PSO, mỗi nghiệm được gọi là một cá thể (hay phần tử - particle) Từng cá thể sẽ di chuyển về phía các cá thể khác có vị trí tốt hơn trong bầy Trong quá trình di chuyển, mỗi cá thể đều duyệt qua không gian tìm kiếm, do đó giúp mở rộng khả năng tìm kiếm Theo thời gian, các cá thể sẽ tụ họp lại quanh những vị trí tốt nhất, tương ứng với các nghiệm của bài toán tối ưu

Kí hiệu:

 X : Vị trí cá thể i tại thời điểm k

 V: Vận tốc cá thể i tại thời điểm k

 Pbest: Vị trí tốt nhất của cá thể i tính tới thời điểm thứ k

 Gbest : Vị trí tốt nhất của “nhóm lân cận” của cá thể i tính tới thời điểm k

 Gbest : Vị trí tốt nhất của toàn bộ quần thể tính tới thời điểm k

a Các bước thực hiện thuật toán tối ưu bầy đàn

Trang 30

Hình 2.3 Lưu đồ thuật toán PSO

Bước 1: Khởi tạo

Tạo ra một quần thể gồm N cá thể, trong đó với mỗi cá thể thứ i:

 Vị trí X và vận tốc V được khởi tạo ngẫu nhiên

 Chọn một tập con ngẫu nhiên chứa Scá thể trong tổng số N cá thể khác i làm nhóm “lân cận” (S = minNeighborhoodSize: kích thước tối thiểu của nhóm lân cận)

Trang 31

 Đánh giá tất cả các cá thể dựa trên hàm mục tiêu F = fun(X), từ đó tìm được các vị trí Pbest , Gbest

 Đặt bộ đếm số bước ổn định (là số bước lặp mà cá thể tốt nhất giữ nguyên vị trí) SC= 0

 Đặt giá trị quán tính W = max(IntertiaRange), với InertiaRange là dải biến thiên quán tính của mỗi cá thể

 Đặt giá trị c= SelfAdjustmentWeight: trọng số ưu tiên việc điều chỉnh vận tốc theo kinh nghiệm bản thân cá thể và c = SocialAdjustmentWeight trọng số ưu tiên việc điều chỉnh vận tốc dựa trên kinh nghiệm của nhóm lân cận

Bước 2: Lặp

Đối với mỗi cá thể thứ i ở thời điểm thứ k:

 Kiểm tra điều kiện dừng thuật toán:

o Kết thúc khi số bước lặp đạt đến giới hạn ( em chọn 5000 bước lặp)

o Kết thúc khi cá thể tốt nhất trong quần thể không thay đổi qua một số lượng bước lặp nhất định (em chọn 50 bước lặp)

 Chọn một tập con ngẫu nhiên chứa Scá thể khác cá thể thứ i làm nhóm

“lân cận” (S = minNeighborhoodSize: kích thước tối thiểu của nhóm lân cận) Tính lại hàm mục tiêu trên tập lân cận và tìm giá trị Gbest

 Với hai vector u, u có các thành phần ngẫu nhiên phân bố đều trong khoảng (0,1), cập nhật vận tốc của và vị trí theo luật:

V = WV+ cuPbest −X + cuGbest−X

 Tính lại hàm mục tiêu dựa trên vị trí mới của cá thể đó F= fun(X)

o Nếu F < fun(Pbest) => Đặt Pbest = X

o Nếu F < fun(Gbest)

 Đặt Gbest = X

 Đặt cờ flag = true

Trang 32

o Ngược lại, đặt cờ flag = false

 Nếu W nằm ngoài dải InertiaRange thì đưa về biên gần nhất

o Nếu flag = false:

 Đặt SC=SC + 1

 Đặt S= min(S+ minNeighborhoodSize,N)

b Một số chú ý khi thiết lập các tham số cho thuật toán:

 Kích thước quần thể: tương tự như với thuật toán di truyền

 Quán tính W: Tăng trọng số cho thành phần quán tính nhìn chung sẽ giúp mở rộng phạm vi tìm kiếm, nhưng lại làm giảm tốc độ hội tụ của thuật toán

 Trọng số c: ưu tiên việc điều chỉnh vận tốc theo kinh nghiệm cá thể Tăng cgiúp mở rộng phạm vi tìm kiếm, nhưng lại làm giảm tốc độ hội tụ của thuật toán

 Trọng số c: ưu tiên việc điều chỉnh vận tốc theo kinh nghiệm của nhóm lân cận Tăng cgiúp thuật toán hội tụ nhanh hơn nhưng đồng thời sẽ có xu hướng bỏ qua nhiều vùng không gian tìm kiếm

 Kích thước các nhóm lân cận: Việc tăng kích thước các nhóm lân cận sẽ mở rộng phạm vi tìm kiếm nhưng có xu hướng làm giảm tốc độ hội tụ thuật toán

c Ưu nhược điểm của thuật toán tối ưu bầy đàn

Thuật toán PSO có nhiều nét tương đồng với thuật toán GA Ưu điểm của thuật toán PSO so với GA là thời gian tính toán ngắn hơn và việc cấu hình cho PSO cũng đơn giản hơn so với GA Mặc dù vậy, PSO vẫn còn khá chậm so với các thuật toán tìm kiếm khác sử dụng công cụ gradient Do đó, PSO thích hợp với bài toán nhận

dạng ngoại tuyến

Trang 33

CHƯƠNG 3: MÔ HÌNH PHI TUYẾN TRONG NHẬN

3.1 Các loại mô hình phi tuyến trong nhận dạng hệ thống

Trái với mô hình tuyến tính, các mô hình phi tuyến rất phong phú về chủng loại

và độ phức tạp Tính chất phi tuyến có thể được thể hiện qua nhiều hình thức: hàm lũy thừa, hàm lượng giác Việc lựa chọn loại hình phi tuyến là tùy thuộc vào bản chất của đối tượng Cho đến thời điểm hiện tại, các lớp mô hình phi tuyến phổ biến nhất trong bài toán nhận dạng hệ thống bao gồm:

i Mô hình chuỗi Volterra: tiêu biểu là mô hình song tuyến tính (Bilinear

model)…

ii Mô hình ghép nối nhiều khối: tiêu biểu là mô hình Hammerstein, Wiener… iii Mô hình mạng nơron: tiêu biểu là mô hình mạng perceptron, mô hình mạng

nơron hồi quy…

iv Mô hình NARMAX

Trong khuôn khổ luận văn này, em xin tập trung vào 3 loại mô hình phi tuyến sau:

 Mô hình song tuyến tính (Bilinear model)

 Mô hình mạng nơron hồi quy (Recurrent Neural Network)

 Mô hình Wiener sử dụng mạng nơron (Wiener – Neural Network)

3.2 Mô hình song tuyến tính (Bilinear)

Trong lĩnh vực nhận dạng hệ thống, mô hình (trạng thái) song tuyến tính trên

Trang 34

x(k + 1) = Ax(k) + Bu(k) + ∑ L  x(k) u(k)



y(k) = Cx(k) + Du(k) (3.1) Trong đó:

Do sự đơn giản trong cấu trúc, khả năng biểu diễn các quan hệ phi tuyến của

mô hình loại này là khá hạn chế, chẳng hạn như khi so sánh với mô hình mạng nơron Tuy nhiên, cũng chính nhờ sự đơn giản này mà việc ước lượng tham số của

mô hình là tương đối dễ dàng, tương tự như ước lượng tham số cho mô hình tuyến tính Số lượng các tham số của mô hình cũng tương đối thấp so với các dạng mô hình phức tạp như mạng nơron, do đó kết quả ước lượng nhìn chung cũng đáng tin cậy hơn, đặc biệt là với số mẫu huấn luyện hạn chế Đồng thời, mô hình song tuyến tính cũng là dạng mô hình phi tuyến phổ biến trong các bài toán điều khiển Những

lý do trên khiến cho mô hình song tuyến tính dù ra đời đã lâu nhưng vẫn một lựa chọn hấp dẫn trong bài toán nhận dạng hệ thống

3.3 Mô hình mạng nơron hồi quy (RNN)

a Tổng quan về mạng nơron

Mạng nơron nhân tạo (ANN) là một hệ thống bao gồm nhiều phần tử xử lý đơn giản (còn gọi là nơron) tương tự như các nơron thần kinh của não người, hoạt động

Trang 35

song song và được kết nối với nhau bởi các liên kết Mỗi liên kết được kèm theo một trọng số nào đó, đặc trưng cho tính kích hoạt hoặc ức chế giữa các nơron

Mô hình mạng nơron cơ bản gồm 3 lớp: lớp vào (input), lớp ẩn (hidden) và lớp

ra (output) Thông tin từ lớp vào sẽ được tổng hợp, biến đổi và lan truyền khi qua lớp ẩn trước khi kết thúc ở lớp ra Mạng nơron như vậy được gọi là mạng nơron nông (shallow neural network) để phân biệt với trường hợp mạng nơron có nhiều lớp ẩn (mạng nơ ron sâu hay deep neural network) Các liên kết trong hình trên chỉ

đi từ lớp mạng trước đến lớp mạng sau, vì thế mạng nơron trong hình gọi là mạng truyền thẳng (feedforward network) Ngoài ra, có những mạng nơron với cấu trúc liên kết phức tạp hơn, cho phép thông tin được hồi tiếp (feedback network hay recurrent network), hoặc các nơron trong cùng một lớp được liên kết theo một tổ hợp đặc biệt (convolutional network)

Cấu tạo một nơron

Hình 3.1 Cấu tạo một nơron [6]

Nơron là phần tử xử lý cơ bản trong mạng Các thành phần của một nơron bao gồm:

Trang 36

 Ngưỡng (hay bias) b

 Hàm tính tổng gom các tín hiệu sau liên kết lại thành một số vô hướng

 Hàm kích hoạt f (có thể là một hàm tuyến tính hoặc phi tuyến)

Có thể miêu tả quan hệ vào – ra của một nơron như sau:

y = f(∑ w  x+ b

Khả năng xấp xỉ của mạng nơron

Một trong những lý do mạng nơron được sử dụng nhiều trong các bài toán nhận dạng chính là khả năng xấp xỉ được các quan hệ phi tuyến Nếu một mạng nơron cấu thành bởi các phần tử phi tuyến thì tự nó sẽ có tính phi tuyến Hơn nữa, điều đặc biệt là tính phi tuyến này được phân tán trên toàn mạng, do đó có thể lựa chọn kiểu hàm kích hoạt phi tuyến cơ bản cũng như số nút mạng (nơron) hữu hạn nhằm xấp xỉ một hàm phi tuyến bất kì với độ chính xác cho trước (định lý Stone – Weiertrass – [6])

Lựa chọn cấu trúc cho mạng nơron

Công việc này bao gồm lựa chọn:

 Số đầu vào – ra

 Số lớp ẩn

 Số nơron cho các lớp ẩn: Tài liệu [6] chỉ ra rằng toàn bộ các ánh xạ liên tục từ [0,1] → [0,1] đều có thể được xấp xỉ bằng một mạng nơron perceptron 1 lớp ẩn gồm (2p + 1) nơron

 Kiểu liên kết giữa các nơron

 Dạng hàm kích hoạt cho các nơron

Trang 37

Hình 3.2 Một số hàm kích hoạt cơ bản trong mạng nơronơ [6]

Công việc này được tiến hành dựa trên quá trình phân tích bản chất cụ thể của từng bài toán và đòi hỏi thử nghiệm thực tế Chính vì khả năng linh hoạt của mạng nơron nên các bước thử nghiệm để tìm được cấu trúc phù hợp là không thể tránh khỏi Ngoài ra, có thể xây dựng một số thuật toán để tự động hóa việc thử nghiệm, giúp tiết kiệm thời gian và công sức cho người sử dụng

Thuật toán huấn luyện mạng nơron

Sau khi lựa chọn cấu trúc cho mạng nơron, công việc cần làm tiếp theo đó là huấn luyện mạng tìm ra các hệ số trong mạng (bao gồm các trọng số liên kết và các ngưỡng của từng nơron) Tùy thuộc loại hình mạng nơron được sử dụng và mục đích sử dụng (học có giám sát hay không giám sát, nhận dạng mẫu hay xấp xỉ hàm…) mà người ta sử dụng thuật toán huấn luyện cho phù hợp Chẳng hạn, khi huấn luyện một mạng nơron truyền thẳng theo phương pháp học có giám sát, thuật toán hay được sử dụng đó là thuật toán lan truyền ngược (backpropagation)

Thuật toán sử dụng một tập các mẫu gồm N cặp đầu vào - đầu ra để huấn luyện mạng Với mỗi cặp đầu vào - đầu ra {u(k),y(k)} thuật toán lan truyền ngược sai số thực hiện hai giai đoạn sau:

 Giai đoạn thứ nhất, mẫu đầu vào u(k) được truyền từ lớp vào tới lớp ra, và kết quả đầu ra tính toán được là y(k) và so sánh với đầu ra thực y(k)

 Giai đoạn tiếp theo, sai số dự báo y(k) − y(k) được lan truyền ngược lại từ lớp ra đến các lớp trước Từ đó điều chỉnh các trọng số của mạng sao cho hàm mục tiêu V =  ∑ [y(k) −y(k)] 

Trang 38

Tổng quát với một mạng nơron truyền thẳng có Q lớp, m đầu vào và 1 đầu ra Trường hợp n đầu ra tương tự nhưng chúng ta sử dụng hàm mục tiêu V =E{(y − y)(y − y)}, E{.} là toán tử lấy kì vọng Gọi :

 net và o lần lượt là tín hiệu vào và ra của nơron thứ i trong lớp thứ q

 w là trọng số liên kết từ nơron thứ j lớp thứ q-1 tới nơron thứ i lớp q

 s là số nơron trong lớp thứ q

Lưu ý: để tiện biểu diễn, người ta đưa thành phần bias b vào trong trọng số w

và coi nó như trọng số liên kết với một nơron “ảo” có đầu ra luôn là 1

Bước 1: Khởi tạo:

Khởi tạo ngẫu nhiên các trọng số trong một khoảng giá trị nhỏ

 Tuần tự như vậy tới lớp ra: y(k) = o

Bước 3: Lan truyền ngược sai số:

Trang 39

b Mạng nơron trong bài toán nhận dạng hệ thống

Nhận dạng hệ thống bằng mạng nơron đòi hỏi việc tìm mối quan hệ vào – ra trong hiện tại và quá khứ Để thể hiện sự lưu giữ thông tin trong quá khứ, người ta

sử dụng phần tử giữ trễ hay còn gọi là delay: z

Cấu trúc mạng nơron thường dùng trong nhận dạng hệ thống

Tương tự như khái niệm về hệ tuyến tính đáp ứng xung hữu hạn FIR (hay quá trình trung bình trượt – Moving Average) và đáp ứng xung vô hạn IIR (hay quá trình tự hồi quy AR), chúng ta cũng có hai cấu trúc mạng nơron tương ứng:

 Time Delay Neural Network (TDNN - mạng nơron truyền thẳng có giữ trễ đầu vào)

 Recurrent Neural Network (RNN - mạng nơron hồi quy) Mạng nơron hồi quy lại được phân ra thành hai loại cấu trúc:

o Mạng nơron hồi quy cục bộ Ví dụ mạng Elman…

o Mạng nơron hồi quy toàn cục Ví dụ mạng Jordan, NARX…

Trang 40

Hình 3.3 Cấu trúc mạng nơron Elman [20]

Hình 3.4 Cấu trúc mạng nơron TDNN [20]

Ngày đăng: 22/01/2024, 14:58

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w