5. Bố cục luận văn
2.5. Phân tích hội tụ cục bộ
Phần này liên quan đến các thuộc tính hội tụ cục bộ của thuật toán 1 theo giả định rằng các hàm fi có thể phân biệt hai lần liên tục. Ở đây ý tưởng chính chỉ ra rằng thuật toán 1 kế thừa các thuộc tính hội tụ từ các phương pháp SQP không chính xác nếu
đủ lớn.
Bổ đề 3: để cho các hàm f ii, 1,...,Nđược phân biệt hai lần liên tiếp và để bộ giảm thiểu ( ,x* *) của vấn đề (2.1) là một điểm KKT thông thường. Ngoài ra
N n m
N là một tập mở đủ nhỏ với 0N và để 0 như vậy
1,..., , 2x[ ( )i *i iT i( )]*i i 0
i N f x h x
Có tồn tại những hàng số c c c, 1, 2< ¥ sao cho mọi điểm ( , ) x l thỏa mãn điều kiện
* *
(x- x ,l - l )ẻ Nnhững vấn đề giảm thiểu tỏch rời
min (y ) y y 2 (y ) 0
2 i
i
T
i i i i i i i i
y f A r x st h
l ồ
+ + - £ (2.16)
Cú cỏc bộ giảm thiểu cục bộ duy nhất (y1T,...,yTN)T ẻ { }x* ÅcN thỏa món đẳng thức
* * *
1 2
y- x £ c x- x + c l - l
Như đã đề cập trước đó, các vấn đề tối ưu hóa được phân tích trong thuật toán 1 có liên quan chặt chẽ với phương pháp Lagrangian tăng cường tiêu chuẩn. Ví dụ Bertsekas đã phân tích các giải pháp tối thiểu hóa các hàm Lagrangian tăng cường dưới các nhiễu loạn nhỏ của hệ số nhân. Một phân tích rất giống có thể tìm thấy trong định lý 17.6 của [12].
Chứng minh: ma trận Hessian ẹ2[ ( )f xi i* + kiTh xi( )]i* + ồr i của cỏc vấn đề tối ưu hóa tách rời
( , ) arg min ( ) 2 ( ) 0
2 i
i
T
i x fi i Ai i i xi st hi i
x
x l = x + l x + r x - ồ x Ê (2.17)
Là hoàn toàn dương cho tất cả ( , ) x l trong một lân cận nhỏ của ( ,x l* *). Do đó tham số của các bộ giảm thiểu xi( , )x l là tính cục bộ được xác định và các hàm phân biệt hai lần liên tục trong vùng lân cận này, bởi vì ( ,x l* *)là một điểm KKT thông thường. Ngoài ra phương trình xi( ,x* l *)= x*giữ. Phát biểu của bổ đề bây giờ lập tức là một hệ quả, bởi vì các hằng số hữu hạn c1 và c2 thỏa mãn 1 *i ( ,x* *)
x
c ảx l
> ả và
* *
2 xi ( ,x )
c l
l
> ả
ả tương ứng
Các ước lượng tỉ lệ hội tụ cục bộ của phương pháp SQP tiêu chuẩn có thể áp dụng dễ dàng cho biến thể toàn bộ bước của thuật toán 1 với a1= a2= a3= 1 miễn là các yêu cầu của bổ đề 3 được thỏa mãn, ví dụ nếu Hessian và ràng buộc chính xác Jacobian
* *
i i , i i
H = H C = C được sử dụng và nếu 1 O y( x* )
m< - khi giải bài toán QP kết hợp (2.3) sau đó là bất đẳng thức
2 2
* * * *
2 à 2
x x w y x v w y x
l l
+ - £ - + - £ - (2.18)
Giữ trong một lân cận của giải pháp tối ưu cho một hằng số w< ¥ . Phát biểu này xuất phát từ thực tế là điều kiện tối ưu cho QP (2.3) có thể được viết dưới dạng
* *
0
*
( ) ( )
1 0
0
0 0
T T N T
y i i i
QP
H A C y f y A
A I b Ay
C
l
l l
m k
= +
ổ ửữ ổ ử
ỗ ữổ D ử ỗẹ + ữ
ỗ ữỗ ữ ỗ ữ
ỗ ữỗ ữ ỗ ữ
ỗ ữỗ ữ ỗ ữ
ỗ - ữỗ - ữ= ỗ - ữ
ỗ ữỗ ữ ỗ ữữ
ỗ ữỗữ ữữ ỗ ữ
ỗ ữỗ ữ ỗ ữ
ỗ ữỗố ữứ ỗ ữ
ỗ ữữ ỗố ữứ
ỗố ứ
ồ
ở dạng này rõ ràng việc giải quyết QP (2.3) tương đương với việc áp dụng Newton không chính xác cho các điều kiện tối ưu của vấn đề (2.1). Do ma trận Hessian H* và ràng buộc Jacobian C* là chính xác, nên phép tính gần đúng duy nhất đến từ 1
mI làm nhiễu loạn khối trung tâm của ma trận KKT. Giả sử 1 O y( x* )
m< - giới hạn này hội tụ về 0 khi tiếp cận bộ giảm thiểu x* sao cho tốc độ hội tụ bậc hai cục bộ của phương pháp Newton được bảo toàn. Ở đây người ta cho rằng ( ,x l* *) là một điểm KKT thông thường, kết hợp với bổ đề 3 tạo ra
( )2
* * 1 2 * *
1 2 1 2
( )
x x c 2c w x x
c + - + c l + - l £ + c + - + c l + - l (2.19)
Điều này là đủ để chứng minh sự hội tụ bậc hai cục bộ của thuật toán với X X1, 2 là hằng số dương. Tương tự đối với trường hợp ma trận Hi® Hi*, m® ¥ và
*
i i
C ® C hội tụ đến Hessian chính xác và Jacobian chính xác , tương ứng hội tụ siêu tuyến có thể được thiết lập. Các đặc tính hội tụ của ALADIN được thiết lập ở trên cung cấp một sự cải thiện đáng kể về kết quả hiện có cho phương pháp này. Ngoài ra thuật tán ALADIN được đề xuất có thể được hiểu là cầu nối giữa các thuật toán tối ưu hóa phân tán và tập trung cung cấp một khung thống nhất cho phân thích hội tụ của phương pháp này.
Cuối cùng là sự thảo luận phân tích hội tụ cục bộ ở trên dựa trên giả định rằng các bước đầy đủ được thực hiện trong một vùng lân cận cục bộ của giải pháp tối ưu. Đây là trường hợp nếu thuật toán 2 chọn a1= a2= a3= 1. Đối với các phương thức SQP tiêu chuẩn giả định một bước đầy đủ là rất quan trọng. Lưu ý rằng có một sự khác biệt quan trọng giữa phương pháp SQP và ALADIN, cụ thể là ALADIN giải quyết các NLP tách rời như một phần của bước 1 của thuật toán 1. Do đó nếu thuật toán 1 bắt đầu ở giải phỏp tối ưu x* nguyờn thủy, nhưng với một nhõn tử sai l ạ l *. Giải phỏp y của cỏc NLP tách rời nói chung sẽ khác với x*. Do đó thuật toán 1 có thể chọn x+ = x*nếu áp
dụng bước đầy đủ với a1= a2= a3= 1. Tất nhiên hành vi này là không mong muốn vì điều này cú nghĩa là thuật toỏn sẽ chọn x+ ạ x*, mặc dự việc khởi tạo x = x* đó tối ưu.
Trong thực tế nếu chỳng ta bắt đầu tại x = x* nhưng l ạ l *, bước toàn cục húa (c) đảm bảo rằng chỉ có biến kép được cập nhật. Trong trường hợp này, các biến kép hội tụ với tỉ lệ mong muốn cho giải pháp tối ưu. Thuật toán 2 chọn a3= 1 nếu nằm trong vùng lân cận cục bộ của giải pháp kép thông thường l * miễn là Hivà Ci đủ gần với Hi* và
*
Ci .
Định lý 4: cho ( ,x l* *) là một điểm KKT thông thường của (2.1) cũng như Hi= Hi* và Ci= Ci* (Hi® Hi* và Ci ® Ci*). Nếu các điều kiện từ bổ đề 3 thỏa mãn và nếu
( , ) x l nằm trong vùng lân cận đủ nhỏ của ( ,x l* *), thuật toán 1 kết hợp với thuật toán 2 sẽ chọn trong mỗi bước hoặc là a1= a2= a3= 1 hoặc a1= a2 = 0 nhưng a3 = 1
Chứng minh. Phân tích cục bộ của các phương pháp SQP không chính xác [11]
đảm bảo rằng
(x+)< ( )y
F F (2.20)
Cho a1= a2= a3 giả sử rằng ( , ) x l nằm trong một vùng lân cận đủ nhỏ của một bộ giảm thiểu thông thường. Do đó bất cứ khi nào các điều kiện của bước (b) thói quen toàn cầu hóa từ bước 6 được thỏa mãn, các điều kiện từ bước (a) cũng được thỏa mãn.
Điều này ngụ ý rằng thói quen toàn cầu hóa không bao giờ áp dụng ở bước (b) trong một vùng lân cận cục bộ của một giải pháp tối ưu. Để tránh nhầm lẫn kết quả này lưu ý rằng với x ạ x* thuật toỏn 2 ỏp dụng bước toàn cục húa (c) nhiều nhất cho số lần lặp hữu hạn. Do định lý trên loại trừ bước (b) được áp dụng gần với giải pháp, thuật toán 2 phải áp dụng một bước đầy đủ sau mỗi số lần lặp hữu hạn. Đó là, định mức x- x* không nhất thiết phải bậc hai (siêu tuyến) trong mỗi bước, nhưng nó thực hiện trong một số lần lặp hữu hạn.
ỨNG DỤNG PHƯƠNG PHÁP ALADIN TRONG ĐÁNH GIÁ TÍNH BỀN VỮNG CỦA MẠNG
TRUYỀN THÔNG