16 2 Chuyển một loại bài toán điều khiển ngẫu nhiên tổng hợp về điều khiển theo chương trình 19 2.1.. Vấn đề càng trở nên phức tạp khi bài toán điềukhiển được đặt ra dưới dạng điều khiển
Trang 1Mục lục
Lời nói đầu 5
1 Kiến thức chuẩn bị 9 1.1 Tạo các phân bố đều 9
1.1.1 Khái niệm phân bố đều 9
1.1.2 Tạo phân bố đều trên hộp 10
1.1.3 Tạo phân bố đều trong đơn hình 11
1.1.4 Tạo phân bố đều trên mặt đơn hình 12
1.1.5 Phương pháp loại trừ Von Neuman trên miền bất kỳ giới nội 13
1.2 Phương pháp dò tìm ngẫu nhiên 14
1.2.1 Phương pháp dò tìm ngẫu nhiên đơn giản 14
1.2.2 Phương pháp dò tìm ngẫu nhiên tổng quát 16
2 Chuyển một loại bài toán điều khiển ngẫu nhiên tổng hợp về điều khiển theo chương trình 19 2.1 Thiết lập bài toán 19
2.2 Thiết lập các điều khiển chấp nhận được tham số hoá 32
3 Cơ sở của phương pháp bắn ngẫu nhiên Markov định
Trang 2hướng 46
3.1 Xấp xỉ hệ động lực 46
3.2 Thuật toán bắn ngẫu nhiên "Markov định hướng" 63
Kết luận 104
Phụ lục 105
Tài liệu tham khảo 110
Trang 3LỜI NÓI ĐẦU
Các bài toán điều khiển tối ưu (dạng tất định và ngẫu nhiên) đóngmột vai trò quan trọng trong khoa học kỹ thuật và đời sống xã hội Bởivậy nhiều tài liệu khoa học (xem [13], [14], [15], [16]) đã quan tâm nghiêncứu giải loại hình bài toán này trong dạng điều khiển theo chương trình(programme control) theo phương pháp gián tiếp (xem [13]) và trực tiếp(xem [14], [15], [16]) Trong số các phương pháp này, có phương pháp bắntất định (shooting method) (xem [13] pag 186-187) tỏ ra rất có hiệu quảđối với trường hợp có ràng buộc hỗn hợp giữa biến trạng thái và biến điềukhiển
Tuy nhiên, các phương pháp trên chỉ chứng minh được sự hội tụ củadãy điều khiển xấp xỉ về điều khiển tối ưu khi miền chấp nhận được vàhàm mục tiêu có tính lồi Vấn đề càng trở nên phức tạp khi bài toán điềukhiển được đặt ra dưới dạng điều khiển tổng hợp (Synthetic control).Trong luận văn này, chúng tôi quan tâm đến một loại bài toán điềukhiển ngẫu nhiên tổng hợp trong mô hình liên tục với miền chấp nhậnđược không có tính lồi và hàm mục tiêu không những không có tính lồi
mà còn không liên tục (giới nội địa phương) Loại hình bài toán này đãđược đặt ra trong các tài liệu [3], [4], [8] khi nghiên cứu việc giảm thiểu
độ rủi ro lũ lụt cho công trình thuỷ điện Sơn La
Phương pháp bắn ngẫu nhiên Makov [10] cũng đã được sử dụng làm
cơ sở toán học cho phần mềm VISAM-3 nhằm lựa chọn với một xác suấtdương biến điều khiển trên phân tập (có độ đo dương) của tập hợp cácđiều khiển chấp nhận được Trên cơ sở này mô hình dò tìm ngẫu nhiên
Trang 4tổng quát đã được sử dụng trong VISAM-5 [9] trong đó hàm mục tiêuđược mô phỏng bởi VISAM-4.
Nhằm cải tiến phương pháp bắn ngẫu nhiên Markov nói trên, trong[13] tác giả Nguyễn Đình Thi đã đề nghị một phương pháp mới "Phươngpháp bắn ngẫu nhiên định hướng để giải số một loại bài toán điều khiểnngẫu nhiên tổng hợp" và để cải tiến phần mềm VSAM-3 trong những tínhtoán liên quan đến công trình thuỷ điện Sơn La Tuy nhiên, do thuật toánnày quá thô trên miền biến thiên hẹp của khúc quỹ đạo nên tác giả luậnvăn chưa làm được việc thử nghiệm số cho phương pháp trên
Để khắc phục nhược điểm đó, trong luận văn này chúng tôi đưa ra mộtphương pháp bắn mới mang tên "MarKov định hướng", dựa vào việc kếthợp giữa phương pháp bắn ngẫu nhiên định hướng trên miền biến thiênrộng của khúc quỹ đạo với phương pháp bắn ngẫu nhiên Markov (trênmiền biến thiên hẹp của khúc quỹ đạo)
Với mục tiêu nói trên, tại chương 1 chúng tôi trình bày một số kiếnthức chuẩn bị có liên quan về phương pháp Monte-Carlo Thông qua việctham số hoá hàm điều khiển, trong chương 2 bài toán điều khiển nói trênđược chuyển về một loại bài toán quy hoạch ngẫu nhiên Cuối cùng, trongchương 3 những cơ sở của phương pháp bắn "MarKov định hướng" đượcxây dựng, nhằm thiết lập các dãy dò tìm ngẫu nhiên (Mục 1.2) để giải sốbài toán quy hoạch ngẫu nhiên nói trên gắn với "thuật toán Markov địnhhướng" của luận văn này, phần mềm tính toán(mang tên VSAM-6) đãđược soạn thảo bằng Mathematica 5.2 dưới dạng tham số hóa Khi thửnghiệm phần mềm này đối với bộ tham số của dự án thủy điện Sơn Lathấp (đang được triển khai) chúng tôi thu được (một cách ngẫu nhiên)những kết quả trình bày trong phần Phụ Lục của luận văn
Để hoàn thành luận văn này, tôi đã được sự hướng dẫn tận tình và chuđáo của GS.TS.Nguyễn Quý Hỷ Với tất cả tình cảm của mình, tôi xin bày
Trang 5tỏ lòng kính trọng và biết ơn sâu sắc đến Thầy và gia đình Tôi xin chânthành cảm ơn các thầy, cô giáo trong và ngoài Khoa Toán-Cơ-Tin học
đã truyền đạt cho tôi những kiến thức quý giá để cho tôi vững bước trêncon đường nghiên cứu khoa học sau này Tôi cũng xin cảm ơn Ban Chủnhiệm Khoa Toán-Cơ-Tin học và Phòng Sau đại học Trường ĐHKHTN,ĐHQGHN đã tạo điều kiện cho tôi hoàn thành khoá học
Hà Nội, tháng 12 năm 2010
Học viên
Vũ Bá Toản
Trang 6Chương 1
Kiến thức chuẩn bị
1.1 Tạo các phân bố đều
1.1.1 Khái niệm phân bố đều
Định nghĩa 1.1.1
Giả sử gắn với miền X đã cho trong Rn có một σ-đại số Σ các phântập của X có một độ đo µ xác định trên Σ, sao cho (xem[5]):
0 < µ(X) < +∞; µ(A) := mes(A) (∀A ∈ Σ) (1.1.1)
Một vectơ ngẫu nhiên (VTNN) ξ = (ξ1, , ξn) ∈ X gọi là có phân bốđều trên X (ký hiệu ξ ∼ U(X)), nếu
P (ξ ∈ S) = µ(S)
Đặc biệt, ta xét trường hợp µ là độ đo Lebesgue và Σ = Bn là σ đại sốBorel trong Rn mà X ∈ Bn, trong đó: µ(X) hiểu là độ dài |X| của đoạnthẳng X(n = 1), diện tích mes(X) của hình phẳng X(n = 2), thể tích
V ol(X) của hình khối X(n ≥ 3) Khi đó có thể chỉ ra định nghĩa (1.1.1)tương đương với định nghĩa sau:
Trang 7Định nghĩa 1.1.2.
Véc tơ ngẫu nhiên liên tục ξ = (ξ1, , ξn) ∈ X gọi là có phân bố đềutrong miền X (thoả mãn điều kiện (1.1.1)) và ký hiệu ξ ∼ U(X), nếuhàm mật độ (đồng thời) của ξ có dạng (xem [5]):
Định lý 1.1.1 [5] Giả sử R1, , Rn là n số ngẫu nhiên (độc lập) Khi
đó có thể tạo VTNN ξ = (ξ1, , ξn) ∼ U [a, b] với các thành phần cho từcông thức:
ξi = ai + (bi − ai)Ri (1 ≤ i ≤ n) (1.1.6)
Trang 81.1.3 Tạo phân bố đều trong đơn hình
Xét đơn hình m chiều với đỉnh tại a = (a1, , am) và các cạnh ở đỉnh có
VTNN ξ ∈ Rn gọi là có phân bố đều trong đơn hình m - chiều ∆m
h(a),nếu hàm mật độ của ξ có dạng:
Giả sử R1, , Rm là m số ngẫu nhiên (thuộc dãy ngẫu nhiên {Rj}j,trong đó R(j) là vị trí thống kê thứ j của m số ngẫu nhiên Rj (1 ≤ j ≤ m),nghĩa là:
R(1) ≤ R(2) ≤ ≤ R(m−1) ≤ R(m)Khi đó, VTNN ξ = (ξ1, , ξm) với các thành phần:
Trang 91.1.4 Tạo phân bố đều trên mặt đơn hình
Trang 101.1.5 Phương pháp loại trừ Von Neuman trên miền bất kỳ giới
nội
Trên đây, ta xét việc tạo VTNN ξ ∼ U(X), trong đó X ⊂ Rn là một hình
có những dạng đặc biệt Trong trường hợp X có dạng phức tạp, từ (1.1.1)
ta suy ra rằng: X là một miền giới nội trong Rn, bởi vậy ta có thể xemrằng:
trong đó G cũng là một miền giới nội trong Rn Giả sử rằng đã tạo đượcVTNN ξ0
∼ U (G) (chẳng hạn, theo định lý (1.1.1) G là hình hộp) Trên cơ
sở này ta có thể dùng phương pháp loại trừ Von Neuman để tạo ξ ∼ U(X)như sau:
1.2.1 Phương pháp dò tìm ngẫu nhiên đơn giản
Xét bài toán quy hoạch đo được dạng tổng quát: (xem [5])
f (x∗) = min{f (x) : x ∈ D}, D ⊂ Rn (1.2.1)
Trang 11gắn với không gian độ đo (D, Σ, µ), trong đó hàm f là Σ-đo được trên D
và là hàm tính được; còn miền D là nhận dạng được Đồng thời, giả thiếtrằng:
Giả sử bài toán (1.2.1) tồn tại ít nhất một lời giải (tối ưu) Ta cần tìmlời giải x∗ ∈ D trong tập D các lời giải chấp nhận được, sao cho hàm mụctiêu f đạt giá trị nhỏ nhất (theo nghĩa toàn cục):
f (x∗) ≤ f (x) (∀x ∈ D)
Để giải bài toán quy hoạch (1.2.1) bằng mô hình dò tìm ngẫu nhiênđơn giản, ta thiết lập dãy dò tìm ngẫu nhiên đơn giản {xn}n theo côngthức lặp:
Khi đó nếu ta coi xN (N 1) là xấp xỉ cho lời giải tối ưu x∗, thì "sai
số tương đối" của nó có thể được xác định bằng độ đo tương đối
µN := µ{x ∈ D : f (x) < f (xN)}/µ(D), (1.2.5)của tập hợp:
AN := {x ∈ D : f (x) < f (xN)} (1.2.5∗)các lời giải chấp nhận được tốt hơn lời giải xấp xỉ xN (so với tập hợp tất
cả các lời giải chấp nhận được)
Trang 12Nếu µN = µ(AN)
µ(D) ≈ 0 thì độ đo của AN nhỏ hơn (không đáng kể) sovới của D Độ đo tương đối µN nói trên có thể được đánh giá theo sốphép lặp N bằng kết quả sau:
Định lý 1.2.1 [5] Nếu hàm mục tiêu f là đo được trên không gian độ
đo (D, Σ, µ) và bài toán (1.2.1) có lời giải x∗ ∈ D thì có thể đánh giá µN
như sau:
P {µN +1 ≤ } ≥ 1 − (1 − )N (∀ ∈ (0, 1)) (1.2.6)1.2.2 Phương pháp dò tìm ngẫu nhiên tổng quát
Khi đó {¯xn} được gọi là dãy dò tìm ngẫu nhiên tổng quát theo phân
bố xác suất Pξ¯ của VTNN ¯ξ (1), nếu ¯ξ có khả năng nhận giá trị trong mọitập hợp ΣD - đo được với độ đo dương, nghĩa là:
Pξ¯(A) := P { ¯ξ ∈(A)} > 0 (∀A ∈ ΣD : µ(A) > 0) (1.2.8)Giả sử (D, ΣD, µ) là một không gian độ đo với D ⊂ Rn, Σ = ΣD là mộtσ− đại số nào đó các phân tập của D và µ(.) : ΣD → [0, +∞] là một độ
đo xác định trên ΣD Xét bài toán quy hoạch đo được:
(1) Không nhất thiết là phân bố đều
Trang 13trong đó: 0 < µ(D) ≤ ∞ và ta còn giả thiết giá trị cực tiểu của nó "không
cô lập" theo nghĩa sau:
Định nghĩa 1.2.2
Bài toán quy hoạch đo được (1.2.9) gắn với không gian độ đo (D, ΣD, µ)gọi là có giá trị cực tiểu f∗ = f (x∗) không cô lập, nếu nó có ít nhất mộtlời giải x = x∗, sao cho:
µ({x ∈ D : f (x) < f∗ + ε}) > 0 (∀ε > 0) (1.2.10)Định lý 1.2.2 [5]
Giả sử bài toán quy hoạch đo được (1.2.9) (gắn với không gian độ đo(D, ΣD, µ))có giá trị cực tiểu f∗ = f (x∗) không cô lập và {¯xn}n ≥ 1 là dãy
dò tìm ngẫu nhiên tổng quát tương ứng Khi đó dãy này sẽ hội tụ hầuchắc chắn về x∗ theo hàm mục tiêu, nghĩa là:
P { lim
N →∞f (¯xN) = f (x∗)} = 1 (1.2.11)
Hệ quả 1.2.1 [5]
Cùng với các giả thiết nêu trong định lý (1.2.2) về bài toán quy hoạch
đo dược (1.2.9), ta còn thêm điều kiện:
Trên đây là những kiến thức cơ sở được sử dụng trong việc thiết lập
mô hình bắn ngẫu nhiên "Markov định hướng" (chương 3)
Trang 14Chương 2
Chuyển một loại bài toán điều khiển ngẫu nhiên tổng hợp về điều khiển theo chương trình
2.1 Thiết lập bài toán
Khi thiết kế hệ thống thuỷ điện (HTTĐ) bậc thang, ta cần quan tâm đếntính đa tiêu chí của bài toán như: phát điện, an toàn, phòng lũ, chốnghạn, tham gia cắt lũ ở hạ du, tưới tiêu cho nông nghiệp Tuỳ theo thờigian và tính chất của HTTĐ, người ta chọn một trong những tiêu chí kểtrên làm mục tiêu tối ưu; các tiêu chí còn lại gọi là tham số thiết kế vềchỉ tiêu và xem như đã biết
Mỗi kế hoạch vận hành trong một chu kỳ điều tiết (thường là mộtnăm) của HTTĐ bậc thang gọi là một quy trình vận hành (QTVH) Quytrình này bao gồm kế hoạch về lưu lượng nước dùng và nước xả của từngnhà máy thuỷ điện (NMTĐ) trong HTTĐ vào từng thời gian trong mộtchu kỳ điều tiết
Quy trình vận hành hợp lý, khả thi (QTVHHLKT)
Một QTVH được gọi là hợp lý (HL), nếu trạng thái động của mực nước
Trang 15các hồ chứa trong chu kỳ điều tiết năm đảm bảo các yêu cầu của thuỷ điện
và thuỷ lợi về: mực nước dâng bình thường (MNDBT), cao trình phòng
lũ và tích nước (mùa lũ muộn) Quy trình này gọi là khả thi (KT), nếu
nó đáp ứng các tham số về chỉ tiêu và phù hợp với tham số thiết kế về kỹthuật đối với từng NMTĐ trong hệ thống
Cụ thể tính hợp lý được thể hiện:
- Trong mùa ít mưa (15/9 - 15/12) cần giữ cho cao trình ở mực nướcdâng bình thường (MNDBT) với thời gian lâu nhất để tận dụng chiềucao cột nước phát điện ở mức tối đa
- Trong thời gian trước lũ tiểu mãn (15/12 (năm trước) - 15/6) cần giữcho cao trình tối tiểu của mực nước hồ, để khoảng cách từ cao trình nàytới mực nước chết tạo nên một dung tích dự trữ (gọi là dung tích chốnghạn)
- Trong mùa lũ chính vụ (15/7 - 25/8) cần giữ cho cao trình nước hồ
ở mức không đổi nào đó (gọi là cao trình phòng lũ), để khoảng cách từcao trình này đến mái đập tạo nên một dung tích phòng lũ nhằm chứa lũđột ngột
- Cuối cùng sau mùa lũ chính vụ, cần tận dụng những con lũ muộn đểtích nước cho chu kỳ điều tiết tiếp theo
Trang 16Bài toán xác định QTVHANHL được gọi là Bài toán giảm thiểu rủi
ro lũ lụt
Về mặt toán học, việc xác định các QTVHATHL nói trên đưa về giảimột loại bài toán điều khiển tối ưu với biến điều khiển là lưu lượng nướcđiều tiết từ các hồ chứa bao gồm lưu lượng nước dùng và nước xả, biếntrạng thái là trạng thái động của mực nước trong các hồ chứa, hàm mụctiêu là độ rủi ro lũ lụt trung bình, các điều kiện ràng buộc (chấp nhậnđược) là các điều kiện HLKT, tập hợp các biến điều khiển thoả mãn cácđiều kiện HLKT là tập hợp các điều khiển chấp nhận được, hệ động lực
là hệ phương trình liên hệ các trạng thái động của mực nước trong các
hồ chứa (gọi là "phương trình trạng thái")
Để thiết lập phương trình trạng thái của hệ thống thuỷ điện (HTTĐ)
3 bậc thang trên sông Đà [3], ta cần phải xét chu kỳ điều tiết năm [0, T ]của quá trình vận hành (trong tương lai) các nhà máy thuỷ điện (NMTĐ)Hoà Bình, Sơn La, Lai châu, ta đánh số chúng ( theo thứ tự từ hạ đếnthượng nguồn) lần lượt là i = 1 ÷ 3 Tại mỗi thời điểm t ∈ [0, T ], ký hiệu:
xi(t) (m3/s)- là lưu lượng trung bình (TB) nước điều tiết từ hồ thứ ixuống hồ dưới,
ui(t) (m3/s) - là lưu lượng (TB) nước dùng của hồ thứ i,
vi(t) (m3/s) - là lưu lượng (TB) nước xả của hồ thứ i, trong đó:
qi(t) - là lưu lượng (TB) nước tự nhiên đổ vào hồ chứa thứ i ,
wi(t) (106m3) - là thể tích (TB) nước trong hồ chứa thứ i,
woi (106m3) - là thể tích ứng với mực nước hoi (m) dâng bình thường của
Trang 17ri(t) - lưu lượng nước thấm và bốc hơi (TB) của hồ thứ i tại thời điểm t
và được xác định dưới dạng (xem [2] tr 6-8):
là các quá trình lưu lượng TB nước tự nhiên
đổ về hồ chứa thứ i đã được dự báo bằng mô hình chuỗi thời gian
Hệ phương trình vi phân trên có thể viết lại dưới dạng:
Trang 18Khi đó, dễ dàng nhận thấy rằng: việc xác định quy trình vận hành
(QTVH)[4]:
u, v:= n
x = n
x(t) , 0 ≤ t ≤ To
là quy trình điều tiết (QTĐT)của hệ thống thuỷ điện
Nếu ta chia mốc thời gian theo các mùa nước trong năm:
0 = T0 < T1 < T2 < T3 < T4 < T5 < Tvới Ti ∈ [0, T ] (i = 0 ÷ 5) là các mốc thời gian được quy định (trong [1])
như sau:
0 = To = ngày 16/9 (năm trước) ; T1 = ngày 15/12 (năm trước) ; T2 = ngày 15/6
T3 = ngày 25/6 ; T4 = ngày 15/7 T5 = ngày 25/8 ; T = ngày 15/9
trong đó: [0, T1] là thời gian mực nước dâng bình thường; [T1, T2] là thời
gian cạn nước; [T2, T3] là thời gian lũ tiểu mãn; [T4, T5] là thời gian lũ
chính vụ; [T5, T ] là thời gian lũ muộn
Trang 19"Tính HL" của QTVH (2.1.5) đặc trưng bởi các điều kiện sau:
1 - Đảm bảo mực nước của hồ chứa thứ i dâng ở mức bình thường vớithời gian lâu nhất để tận dụng chiều cao cột nước phát điện ở mức tối đa
vì trong thời gian [T0, T1] rất ít mưa
wi(t) ≡ woi, (i = 1 ÷ 3; 0 ≤ t ≤ T1) (2.1.7)
2 - Đảm bảo giữ cho cao trình nước hồ ở mức không đổi nào đó (gọi làcao trình phòng lũ), để khoảng cách từ cao trình này tới mái đập tạo nênmột dung tích phòng lũ nhằm chứa lũ đột ngột vì đây là mùa lũ chính vụ[T4, T5]
"Tính KT" của mỗi QTVH (2.1.5) đặc trưng bởi các điều kiện sau:
1 - Đáp ứng tham số thiết kế về chỉ tiêu phát điện ¯N dưới dạng:
¯
N ≤ 24
Z T 0
3
X
i=1
2 - Đảm bảo các chỉ tiêu phòng lũ V trong thời gian lũ chính vụ [T4,
T5] và chỉ tiêu chống hạn V trong thời gian cạn nước và lũ tiểu mãn [T1,
Trang 20V (106m3) - là dung tích phòng lũ TB của HTTĐ theo thiết kế.
V (106m3) - là dung tích chống hạn TB của HTTĐ theo thiết kế
wi (106m3) - là thể tích nước hồ thứ i ứng với cao trình mái đập hi (xem[3] tr.49-50)
wi (106m3) - là thể tích hồ thứ i ứng với mục nước chết hi (cho trong [3]tr.49-50)
vi (m3/s) - là lưu lượng xả mặt đập tối đa của đập thứ i
ui (m3/s) và ui (m3/s)- là lưu lượng nước dùng tối đa và tối thiểu củaNMTĐ thứ i, xác định như sau (xem [6] tr.54 và [3] tr.59):
ui = Pi(lm)α[hi− ho,i−1]β (i = 2 ÷ 3),
Trang 21cung cấp cho hạ lưu để tưới tiêu (xem [6] tr.54).
q(hl) = 4.000(m3/s) - là lưu lượng nước tối đa mà HTTĐ bậc thang cóthể đưa xuống hạ lưu trong thời gian lũ tiểu mãn (xem [1] tr.4)
Ni(t) (103Kw) - là công suất phát điện của NMTĐ thứ i vào thời điểm t
và ta có thể xác định theo các công thức (xem [3] tr.16-17):
ci - là cao trình của chân đập thứ i (i = 1 ÷ 3) (xem [3] tr.49-50);
Zi(t) = hi(wi(t)) - là cao trình của mực nước hồ thứ i vào thời điểm
t ∈ [0, T ], xác định theo thể tích wi(t) tương ứng của nước hồ, với hàm
hi = hi(wi) (biểu diễn cao trình của thể tích nước hồ thứ i) có dạng tuyếntính từng khúc:
Trang 22Các dãy số liệu n(hki, wki)oK i
k=1 (i = 1 ÷ 3) được cho trong tài liệu [3](tr.149-156), với K1 = 21 , K2 = 21 , K3 = 15
Tương tự, ta có thể xác định được hàm ngược của hàm hi(wi), ký hiệu
wi = Wi(hi), biểu thị sự phục thuộc của dung tích wi (106m3) vào caotrình hi với i = 1 ÷ 3
Trang 23qi(t) - là lưu lượng nước tự nhiên thực tế (ngẫu nhiên) về hồ i vào thờiđiểm t ∈ [0, T ].
Trang 24Trên cơ sở này, xác định trạng thái tương ứng ˆωi(t) của hệ động lựcngẫu nhiên trong (2.1.33) để sử dụng VISAM-4 [10] thiết lập độ rủi ro lũlụt λ(ˆω(., x)) Sau đó, sử dụng VISAM-5 [10] để giải số bài toán (2.1.33).Với ý nghĩa trên, dưới đây chúng tôi sẽ thiết lập tập hợp D trong dạngtham số hoá của hàm điều khiển x ∈ X với lưu ý rằng: các điều khiển chấpnhận được x ∈ X lại liên quan đến trạng thái ωi(t), (i = 1÷3) của hệ độnglực tất định (2.1.21) và liên quan đến tính "tổng hợp" (2.1.22)-(2.1.24)của hàm điều khiển.
Với lý do đó, trong mục 2 dưới đây, chúng ta sẽ xét việc thiết lập tậphợp D nói trên
2.2 Thiết lập các điều khiển chấp nhận được tham
số hoá
Ta biết rằng (xem [8]) trên các khoảng
[0, T ] \ [T1, T4] = [0, T1) ∪ (T4, T5] ∪ (T5, T ],
Trang 25hàm điều khiển (2.1.6) của hệ động lực (2.1.21) có dạng một điều khiểntổng hợp (ĐKTH), vì nếu đặt:
thì tính "tổng hợp" (phụ thuộc vào trạng thái điều khiển) của các thànhphần:
x(t) = ˆx(t) := ˆx1(t), ˆx2(t), ˆx3(t)
(∀t ∈ [0, T ] \ [T1, T4]);ˆ
xi ∈ C([0, T ] \ [T1, T4]) (∀i = 1 ÷ 3) (2.2.2)trong hàm điều khiển (2.1.6), được biểu hiện qua bổ đề dưới đây:
ˆ
xi(t) = q0i(t) + qo − ˆXi(t).106 (i = 3 ÷ 1 , ∀t ∈ [0, T ] \ [T1, T4]), (2.2.3)trong đó ta xem rằng q0
Trang 26Với ý nghĩa đó, ta chỉ cần xét điều khiển:
x(t) =
x1(t), x2(t), x3(t)
(∀t ∈ [T1, T4]), xi ∈ C[T1, T4] (2.2.4)của hệ động lực (2.1.21) dưới dạng thu hẹp trên đoạn [T1, T4] với các điềukiện khả thi (2.1.22) - (2.1.28) và gọi nó là các biến điều khiển theo chươngtrình (gọi tắt là điều khiển)
Để chuyển bài toán ĐKTH (2.1.19) - (2.1.28) về việc xác định các hàmđiều khiển theo chương trình, ta đặt:
xi(t), W wi−1(T4); t
, W wi(T4); t
ˆ
ui(t)dt,(2.2.8)
hi(wi)) − Hi(xi, wi−1)β
(∀t ∈ [0, T ]), (2.2.12)
Trang 27Hi(xi, wi−1) := χi hi−1(wi−1)
Zoi(xi)+h
1−χi hi−1(wi−1)i
hi−1(wi−1)(2.2.13)(i = 1 ÷ 3) ; ho(wo) ≡ 0
với hi(w) (i = 1 ÷ 3) xác định bởi (2.2.18), Zoi(xi) (i = 1 ÷ 3) xác địnhbởi (2.1.16)
Bổ đề 2.2.2 (xem[4]) Nếu các hàm (đã cho) qi(t) (i = 1 ÷ 3) và cácđiều khiển (2.2.4) là liên tục:
qi ∈ C(0, T ) ; xi ∈ C(T1, T4) (i = 1 ÷ 3), (2.2.14)thì ta có:
Bổ đề 2.2.3 (xem[4]) Với các điều kiện của bổ đề (2.2.2), thì điều kiện(2.1.25) tương đương với điều kiện sau;
N (ˆx, w(T4)) ≤ N(o)(x, w) (2.2.18)
Trang 28Dựa vào điều kiện (2.1.28) và các bổ đề (2.2.1) - (2.2.3) ta có thể chuyểnkhái niệm "chấp nhận được" của điều khiển tổng hợp (2.1.6) thành kháiniệm "chấp nhận được của điều khiển theo chương trình" trong định nghĩasau đây:
Mối liên hệ giữa tính "chấp nhận được" của điều khiển tổng hợp (2.1.6)
và tính "chấp nhận được" của điều khiển theo chương trình (2.2.4) chotrong kết quả dưới đây
Định lý 2.2.1 (xem[4]) Với các điều kiện của bổ đề (2.2.1) - (2.2.3),nếu điều khiển theo chương trình (2.2.4) của hệ động lực (2.2.17) là chấpnhận được thì ĐKTH (2.1.6) của hệ động lực (2.1.21) cũng là chấp nhậnđược và ngược lại
Chú ý 2.2.1 Nếu biết các hàm điều khiển chấp nhận được (2.2.4) theonghĩa trên và biết trạng thái w(T4) :=
w1(T4), w2(T4), w3(T4)
của hệđộng lực (2.2.17) tương ứng với điều khiển này, thì thông qua các công
Trang 29thức (2.2.1), (2.2.3) ta có thể bổ sung (vào (2.2.4)) các hàm điều khiển(2.2.2) để thu được hàm điều khiển tổng hợp (2.1.6) đối với hệ động lực(2.1.21) (trong đó tính chấp nhận được xác định bởi các điều kiện (2.1.22)
- (2.1.28)); Nghĩa là ta thu được một QTVHHLKT đối với HTTĐ 3 bậcthang trên sông Đà
Để tham số hoá hàm điều khiển (2.2.4) (liên tục) nói trên, ta thu hẹplớp hàm liên tục C(T1, T4) về lớp hàm tuyến tính từng khúc trên [T1, T4]Với ý nghĩa đó, ta thiết lập một phân hoạch {tk}K
k=0 của đoạn [0, T ], saocho:
Khi đó mỗi hàm điều khiển (2.2.4) sẽ được xác định bởi một bộ tham sốđiều khiển:
Trang 30Chú ý 2.2.2 Nếu đã cho phân hoạch {tk}K
k=0 thì ma trận X hoàn toànđược xác định
Định nghĩa 2.2.2
Mỗi ma trận X ∈ R3×n được gọi là một bộ tham số điều khiển của hệđộng lực (2.2.17) ứng với phân hoạch {tk}K
k=0 của đoạn [0, T]; còn hàmđiều khiển (2.2.4) với các thành phần xác định theo (2.2.26) được gọi làđiều khiển (tham số hoá) tuyến tính từng khúc tương ứng
Tính chấp nhận được của bộ tham số điều khiển X nói trên cũng đượcxác định bởi tính chấp nhận được của hàm điều khiển của hàm điều khiển(2.2.26) tưng ứng, nghĩa là thoả mãn các điều kiện (2.2.19) - (2.2.23)Định nghĩa 2.2.3
Tập hợp D gồm tất cả các bộ tham số điều khiển chấp nhận được theonghĩa trên:
D := n
X ∈ R3×n : (2.2.26), (2.2.19) − (2.2.23)o
(2.2.27∗)được gọi là tập hợp các bộ tham số điều khiển chấp nhận được đối với hệđộng lực (2.2.17)
Chú ý 2.2.3 Nếu biết được tập hợp D, ta có thể dựa trên công thức(2.2.26) để khôi phục tập hợp ˆD gồm tất cả các hàm điều khiển (tuyếntính từng khúc) chấp nhận được đối với hệ động lực (2.2.17) Khi đó, cóthể dựa trên chú ý (2.2.1) để thu được tập hợp tất cả các QTVHHLKT,nghĩa là dự báo được tất cả các kế hoạch vận hành có thể lập được trongtương lai đối với mỗi dự án thiết kế HTTĐ 3 - bậc thang trên sông Đà
Tuy nhiên, ta không thể tiếp cận trực tiếp tập hợp D nói trên, vìcác bất đẳng thức cần phải kiểm tra trong (2.2.19) - (2.2.23) có số lượngkhông chỉ là vô hạn mà là không đếm được
Trang 31Nhằm khắc phục khó khăn này, trước hết ta đặt:
(2.2.29)trong đó (xem (2.1.2))
Để thiết lập các điều kiện ε - chấp nhận được của bộ tham số điều khiển
X (xem (2.2.27)), ta xét bổ đề dưới đây:
Bổ đề 2.2.4 [4]
Nếu các điều khiển (2.2.4) là tuyến tính từng khúc với bộ tham số điềukhiển (2.2.27) thì các điều kiện chấp nhận được (2.2.19) - (2.2.23) tươngđương với các điều kiện sau:
Trang 32hệ động lực (2.2.17).
Chú ý 2.2.4 Ta biết (xem [4]) rằng: Nếu các điều kiện ε - chấp nhậnđược nói trên (đối với mỗi bộ tham số X) được thoả mãn thì các điềukiện chấp nhận được nêu trong định nghĩa (2.2.3) cũng sẽ được thoả mãn,nghĩa là
Ngoài ra ta còn có
lim
Trang 33Vì vậy, ta có thể sử dụng chú ý (2.2.3) (với việc xấp xỷ tập hợp D bởitập hơp Dε) để xác định tất cả các QTVHHLKT có thể lập được trongtương lai đối với mỗi dự án thiết kế của HTTĐ 3 - bậc thang trên sôngĐà.
Với ý nghĩa trên, ta sẽ xét trong chương 3 dưới đây việc lựa chọn mộtcách ngẫu nhiên bộ tham số điều khiển ε - chấp nhận được X ∈ Dε
Trong việc giải số bài toán giảm thiểu độ rủi ro vỡ đập cho công trìnhthuỷ điện Sơn la, ta biết rằng (xem [7]): đây là một loại bài toán điềukhiển ngẫu nhiên tổng hợp [7], nên khi giải nó (bằng phương pháp MonteCarlo), ta cần phải lựa chọn một cách ngẫu nhiên ma trận X ∈ Dε, saocho (xem (1.2.3) - (1.2.12)):
P {X ∈ A} > 0 (∀A ⊂ Dε : mes(A) > 0) (2.2.41)Phần mềm VSAM-3A của hội UDTH Việt Nam đã được soạn thảo đểchỉ ra sự tồn tại của miền D0
ε) Mặcdầu VSAM-3A đã đưa ra những quy trình VHHLKT khá tốt về mặt sảnxuất điện và phân bổ dung tích phòng lũ Nhưng nó chưa thể sử dụng đểgiải bài toán giảm thiểu độ rủi ro lũ lụt cho công trình thuỷ điện Sơn La,
vì rằng điều kiện (2.2.41) chưa được bảo đảm Điều này dẫn tới yêu cầucần phải cải tiến chương trình VSAM-3A nói trên
Về mặt nguyên tắc, ta có thể thực hiện điều này thông qua việc tạoVTNN với 3n-chiều X ∼ U Dε
, với các thành phần xk
i ∼ U [ui, ¯xi]thoả mãn các điều kiện tương ứng (nêu trong (2.2.31)) Những điều kiệncòn lại trong (2.2.32) - (2.2.36) sẽ được kiểm tra bằng phương pháp loạitrừ Von Neumann đã trình bày ở chương 1
Trang 34Tuy nhiên, do thể tích của siêu hộp 3n-chiều quá lớn so với thể tíchmiền Dε:
nên hiệu quả của thuật toán loại trừ Von Neumann quá thấp Điều nàylàm cho thời gian tính toán lâu, tới mức không sử dụng được trong thựctế
Nhằm khắc phục khó khăn nói trên, ta sẽ sử dụng thuật toán loại trừVon Neumann với hiệu quả cao hơn để thu được bộ tham số điều khiển
X ∈ Dε thoả mãn điều kiện (2.2.41)
Thuật toán "bắn ngẫu nhiên Markov" cùng với phần mềm VISAM-3
đã giải quyết được bài toán trên Trong luận văn này, ta sẽ cải tiến thuậttoán bắn ngẫu nhiên nói trên dưới dạng thuật toán mới mang tên "Bắnngẫu nhiên Markov định hướng " sẽ được trình bày ở chương 3 dưới đây
Ý tưởng của thuật toán này là: các trạng thái wi(tk) thoả mãn điềukiện (2.2.32) với k = k1 + 1 ÷ k3 sẽ thu được bằng cách tạo phân bố đềutrên từng hộp (xem chương 1), với k = k3 + 1 ÷ k4 − 1 sẽ thu được bằngcách tạo phân bố đều trong đơn hình (xem chương 1) Điểm cuối wi(T4)của quỹ đạo nói trên sẽ thu được bằng phương pháp bắn ngẫu nhiên vàomiền xác định bởi các điều kiện (2.2.33) - (2.2.34)
Bằng cách làm này ta thu được một miền đủ nhỏ chứa Dε, khi đó cóthể sử dụng phương pháp loại trừ Von Neumann với "hiệu quả cao"(xem[10]) để kiểm tra sự thoả mãn điều kiện (2.2.31) và các điều kiện (2.2.35)
- (2.2.36)
Trang 35Chương 3
Cơ sở của phương pháp bắn ngẫu
nhiên Markov định hướng
3.1 Xấp xỉ hệ động lực
Từ định lý (2.2.1) ta nhận thấy rằng hệ động lực (2.1.21) trong bài toán(2.1.19) - (2.1.28) có thể thay bởi dạng thu hẹp (2.2.17) của nó trênkhoảng [T1, T4]
Với ý nghĩa đó, ta xét hệ phương trình vi phân (2.2.17) trên đoạn[T1, T4]
fi(t, x(t)) = −pi + σ
q0i(t) − xi(t)
(T1 ≤ t ≤ T4)trong đó các hằng số σ, pi chọn theo công thức:
σ = 10−6
Trang 36wi ≤ wi(t) ≤ wi ⇒ ∆wi(t) ≤ ¯wi − wi (T1 ≤ t ≤ T4) (4)Kết hợp (2), (3) và (4) ta thu đươc:
∆i(t) ≤ 7,2 x 10−9 x (wi + woi − wi
2 ) := ∆i (T1 ≤ t ≤ T4, i = 1 ÷ 3)
(5)Dựa vào các số liệu ban đầu woi, wi, wi ta dễ dàng đánh giá sai số của
∆i nhỏ hơn nhiều lần so với sai số của số liệu ban đầu (có thể bỏ quachúng khi tính toán), nên ta có thể xấp xỉ vế phải của hệ phương trình(2.2.17) bởi vế phải của hệ phương trình sau đây:
Trang 37Tương tự, ta có thể xấp xỉ hệ phương trình (2.1.21) bởi hệ phương trình
Bổ đề 3.1.1 Nếu hệ phương trình (2.2.17) được xấp xỷ bởi hệ (3.1.2), thìcông thức (2.2.3) (để xác định điều khiển tổng hợp (2.2.2)) sẽ trở thành:
xi(t) = ˆxi(t) := ˆq0i(t) − σ−1pi (∀t ∈ [0, T1) ∪ (T4, T5] , i = 3 ÷ 1) (3.1.4)
xi(t) = ˆxi(t) := ˆq0i(t)−wi(T4) − woi− pi(T − T5)
σ(T − T5) (∀t ∈ (T5, T ] , i = 3÷1),
(3.1.5)trong đó wi(T4) (i = 1 ÷ 3) là nghiệm của hệ (3.1.2) tại t = T4 và
Trang 38Khi đó ta thu được (3.1.5)
Bổ đề 3.1.2 Nếu hệ phương trình (2.2.17) được xấp xỷ bởi hệ (3.1.2) ,thì các nghiệm wi(tk) (k = k1 + 1 ÷ k4 , i = 3 ÷ 1) của chúng được xácđịnh từ các biến điều khiển mới ξk
i (k = k1 ÷ k4 − 1) theo các công thứcsau:
ξik(3.1.8)(j = 1 ÷ n1 , i = 3 ÷ 1)
ξik =(3.1.9):= fk3 +j
σ|∆k|− x
k
i (k = k1 ÷ k4 − 1 , i = 3 ÷ 1), (3.1.10)trong đó:
Trang 39Chứng minh:
Với mỗi i = 3 ÷ 1, khi tích phân 2 vế của (3.1.2) trên các khoảng
[T1, tk 1 +j] và [T3, tk 3 +j] ta lần lượt thu được:
ξik (j = 1 ÷ n1) (3)σ
Z tk3+j
T 3
xi(t)dt =
k 3X+j−1 k=k 3
Cuối cùng, để chứng minh (3.1.10*) ta chú ý đến điều kiện (2.1.6) về tính
liên tục tại t = T1 của hàm điều khiển (2.2.2), để từ (2.2.26) và (3.1.4)
q0i(t) − σ−1pi
(i = 3 ÷ 1)
(5)Ngoài ra, từ (3.1.5*) và giả thiết về tính liên tục của các hàm qi ∈ C(0, T )
Trang 40Kết hợp điều này với (5) và tính liên tục tại t = T1 của hàm p(t) (xem(2.1.2)) ta thu được (3.1.10*).
Để xét các dấu hiệu có thể giảm bớt các điều kiện ε - chấp nhận được(2.2.31) - (2.2.36), ta ký hiệu:
wi(tk) ≤ woi (∀i = 1 ÷ 3) (3.1.12*)2- Nếu tồn tại số tự nhiên k, sao cho:
σ
Z t k
T 3
qi(t)dt ≥ Pi(tk− T3) (k = k3 + 1 ÷ k4 , i = 1 ÷ 3), (3.1.13)thì trạng thái wi(tk) tương ứng thoả mãn điều kiện:
wi(tk) ≥ wi(T3) (∀i = 1 ÷ 3) (3.1.13*)Chứng minh: