Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 29 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
29
Dung lượng
287,41 KB
Nội dung
TRƯỜNG ĐẠI HỌC SƯ PHẠM HÀ NỘI 2
KHOA TOÁN
———————o0o——————–
KHÓA LUẬN TỐT NGHIỆP
Phương pháp Gradient và phương pháp Newton
Chuyên ngành: TOÁN GIẢI TÍCH
Giảng viên hướng dẫn: Phùng Đức Thắng
Sinh viên: Vũ Thị Yến
Lớp: K37-sp Toán
HÀ NỘI, 5/2015
LỜI CẢM ƠN
Bài khóa luận này được hoàn thành dưới sự hướng dẫn nhiệt tình
của thầy giáo Th.S Phùng Đức Thắng . Qua đây em xin gửi lời
cảm ơn sâu sắc tới các thầy cô trong tổ Toán giải tích và các thầy
cô trong khoa Toán trường ĐHSP Hà Nội 2 đã giúp đỡ em trong
quá trình học tập để thuận lợi cho việc nghiên cứu. Đặc biệt, em xin
gửi lời cảm ơn chân thành tới thầy giáo Th.S Phùng Đức Thắng
người đã dành cho em sự hướng dẫn nhiệt tình, chu đáo và chỉ bảo
cho em trong suốt quá trình học tập nghiên cứu và thực hiện khóa
luận.
Dù đã hết sức cố gắng, nhưng do đây là lần đầu tiên làm quen với
việc nghiên cứu khoa học và do năng lực còn hạn chế nên khó tránh
khỏi những sai sót. Em mong muốn nhận được sự chỉ bảo, đóng góp
của quí thầy cô để cho bài khóa luận được tốt hơn.
Em xin chân thành cảm ơn!
Hà Nội, tháng 05 năm 2015
Sinh viên
Vũ Thị Yến
LỜI CAM ĐOAN
Sau một thời gian nghiên cứu với sự cố gắng, nỗ lực của bản thân
cùng sự hướng dẫn nhiệt tình chỉ bảo của thầy giáo Th.S Phùng
Đức Thắng em đã hoàn thành bài khóa luận của mình.
Em xin cam đoan bài khóa luận là do bản thân nghiên cứu cùng
với sự hướng dẫn của thầy giáo Th.S Phùng Đức Thắng không hề
trùng với bất cứ đề tài nào.
Hà Nội, tháng 05 năm 2015
Sinh viên
Vũ Thị Yến
Mục lục
Lời cảm ơn
1
Lời cam đoan
2
Lời mở đầu
4
1 Một số kiến thức cần nhớ
1.1 Đạo hàm của hàm vô hướng . . . . . .
1.1.1 Định nghĩa . . . . . . . . . . . .
1.1.2 Một số loại vi phân thường gặp:
1.2 Đạo hàm của hàm vecto: . . . . . . . .
1.3 Đạo hàm bậc 2 . . . . . . . . . . . . .
1.4 Các hàm số lồi . . . . . . . . . . . . . .
1.5 Các điều kiện về cực trị . . . . . . . . .
1.5.1 Điều kiện cần bậc nhất . . . . .
1.5.2 Điều kiện đủ bậc nhất . . . . . .
1.5.3 Điều kiện cần bậc hai . . . . . .
1.5.4 Điều kiện đủ bậc hai . . . . . .
.
.
.
.
.
.
.
.
.
.
.
5
5
5
6
8
9
10
12
12
13
13
14
2 Phương pháp Gradient
2.1 Nội dung của phương pháp . . . . . . . . . . . . . . .
2.2 Tính hội tụ . . . . . . . . . . . . . . . . . . . . . . .
15
15
16
3 Phương pháp Newton
3.1 Nội dung của phương pháp . . . . . . . . . . . . . . .
3.2 Tính hội tụ . . . . . . . . . . . . . . . . . . . . . . .
3.3 Phương pháp Newton trong việc giải các phương trình
22
22
23
25
Tài liệu tham khảo
28
3
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
LỜI MỞ ĐẦU
Bài toán tối ưu có ứng dụng rộng rãi trong toán học cũng như trong
đời sống. Nó được nghiên cứu một cách toàn diện nhờ các phương pháp
định tính và định lượng như phương pháp miền tin cậy, phương pháp
nhân tử Lagrange,...
Trong đó phương pháp Gradient và phương pháp Newton là những
phương pháp số đầu tiên để giải bài toán tối ưu. Khóa luận này trình
bày một số hiểu biết về hai phương pháp này.
Cuốn chuyên khảo [1] của tác giả B. T. Polyak là một cẩm nang
khá đầy đủ và chi tiết về lý thuyết phương pháp Gradient và phương
pháp Newton.
Khi nghiên cứu về hai phương pháp này em quan tâm đến tính hội
tụ của hàm khả vi và ứng dụng của chúng trong việc giải toán.
Nội dung chính của khóa luận gồm 3 chương:
• 1. Một vài kiến thức cần nhớ
• 2. Phương pháp Gradient
• 3. Phương pháp Newton
Do thời gian thực hiện đề tài không nhiều, kiến thức còn hạn chế
nên báo cáo không tránh khỏi những sai sót. Em mong nhận được sự
góp ý và những ý kiến phản biện của quý thầy cô và bạn đọc.
Em xin chân thành cảm ơn!
Chương 1
Một số kiến thức cần nhớ
1.1
1.1.1
Đạo hàm của hàm vô hướng
Định nghĩa
Định nghĩa 1.1.1. Hàm vô hướng f (x) của đối số x trong không
gian n chiều.
f : Rn → R1 được gọi là khả vi tại điểm x nếu tìm được a ∈ Rn :
∀y ∈ Rn
f (x + y) = f (x) + (a, y) + o(y)
(1.1)
trong đó a được gọi là đạo hàm của f (x) tại x. Kí hiệu: f (x) hoặc
∇f (x).
Khi đó đạo hàm được định nghĩa như sau:
f (x + y) = f (x) + (∇f (x), y) + o(y)
∂f (x)
∂f (x)
trong đó ∇f (x) =
, ...,
.
∂x1
∂xn
(1.2)
Nói cách khác hàm số khả vi tại điểm x nếu nó xác định xấp xỉ
với hàm tuyến tính bậc nhất tại x. Có nghĩa là có thể tìm ra hàm số
momen tuyến tính f (y) = f (x)+(∇f (x), y) là f (x+y)− f (y) = o(y).
Ví dụ 1. Cho hàm toàn phương
f (x) = (Ax, x) 2 − (b, x)
trong đó A là ma trận đối xứng n × n, b ∈ Rn . Khi đó
f (x + y) = (A(x + y), x + y)
5
2 − (b, (x + y))
Khóa luận tốt nghiệp
GVHD: Th.s Phùng Đức Thắng
= (Ax, x) 2 − (b, x) + (Ax − b, y) + (Ay, y) 2
= f (x) + (Ax − b, y) + (Ay, y) 2.
Mà |(Ay, y)| ≤ A y 2 . Do đó (Ay, y) 2 = o(y).
Vậy f (x) khả vi tại bất kì điểm x nào và
∇f (x) = Ax − b.
(1.3)
Hàm f (x) được gọi là khả vi trên tập Q ⊂ Rn nếu nó khả vi tại
mọi điểm trên Q. Nếu f (x) khả vi trên toàn bộ Rn thì nó được gọi là
vi phân đơn giản.
Giả sử f (x) khả vi trên [x, x + y] ( tức là tại các điểm x + τ y, 0 ≤
τ ≤ 1 ). Chúng ta xét hàm một biến φ(τ ) = f (x + τ y) và tính đạo
hàm trong 0 ≤ τ ≤ 1 :
φ(τ + ∆x) − φ(τ ) f (x + (τ + ∆τ )y) − f (x + τ y)
=
∆τ
∆τ
(∇f (x + τ y), ∆τ y) + o(∆τ y)
=
∆τ
φ(τ + ∆τ ) − φ(τ )
φ (τ ) = lim∆τ →0
= (∇f (x + τ y), y) .
∆τ
Do đó φ(τ ) là vi phân trên [0, 1] và
φ (τ ) = (∇f (x + τ y), y) .
(1.4)
Giá trị
f (x + εy) − f (x)
(1.5)
ε
được gọi là đạo hàm theo hướng của f (x) tại x theo hướng y . Đạo
hàm theo hướng có thể tồn tại với các hàm số không trơn.
f (x; y) = limε→0+
Ví dụ 2. Hàm f (x) = x có f (0; y) = y .
1.1.2
Một số loại vi phân thường gặp:
•Vi phân Gâteaux
Nếu f có đạo hàm theo mọi hướng y tại x thì ta nói f (x) có đạo
hàm Gâuteaux tại điểm x.
Vũ Thị Yến
6
K37C-SPT ĐHSP Hà Nội 2
Khóa luận tốt nghiệp
GVHD: Th.s Phùng Đức Thắng
Chú ý:Hàm số có tập nghiệm riêng f (x; ei ) =
∂f
∂f
, ...,
.
∂x1
∂xn
các vecto cơ sở), a =
∂f (x)
(ei là tọa độ
∂xi
Hàm này tuân theo công thức (1.4) là nếu f (x) khả vi tại x thì đó
cũng là đạo hàm vi phân Gâuteaux với
f (x; y) = φ (0) = (∇f (x), y) .
(1.6)
Điều ngược lại là không đúng
Ví dụ 3. Cho f : Rn → R1 , n ≥ 2
1
f (x) =
x − a = a ,x = 0
nếu
0
(1.7)
trong đó a ∈ Rn , a = 0. Hàm số này có vi phân theo mọi hướng tại 0
và f (0; y) = 0, ∀y . Do đó nó có đạo hàm Gâuteaux tại 0. Nhưng nó
không khả vi (thậm chí không liên tục) tại 0.
•Vi phân Frechet:
Nếu hàm f (x) có vi phân trên [x, x + y] . Khi đó sử dụng (1.4) và
công thức Newton- Leibniz có
1
φ (τ )dτ
φ(1) = φ(0) +
0
Chúng ta có được biểu thức cho phần dư trong định lý tích phân:
1
f (x + y) = f (x) +
(∇f (x + τ y), y) dτ
(1.8)
0
1
(∇f (x + τ y) − ∇f (x), y) dτ.
= f (x) + (∇f (x), y) +
0
Một kết quả có ích khác (định lý giá trị trung bình) tuân theo công
thức số gia hữu hạn φ(1) = φ(0) + φ (Θ), 0 ≤ Θ ≤ 1 và từ (1.4)
f (x + y) = f (x) + (∇f (x + Θy), y)) , 0 ≤ Θ ≤ 1.
Vũ Thị Yến
7
(1.9)
K37C-SPT ĐHSP Hà Nội 2
Khóa luận tốt nghiệp
1.2
GVHD: Th.s Phùng Đức Thắng
Đạo hàm của hàm vecto:
Định nghĩa 1.2.1. Cho hàm g : Rn → Rm được gọi là đạo hàm tại
x nếu tìm được ma trận A cấp m × n sao cho với ∀y ∈ Rn :
g(x + y) = g(x) + Ay + o(y).
(1.10)
Ma trận A được gọi là đạo hàm hoặc ma trận Jacobian của ánh xạ
g(x) và giống nhau trong trường hợp vô hướng. Kí hiệu: g (x) hoặc
∇g(x)
Do đó
g(x + y) = g(x) + g (x)y + o(y)
(1.11)
có nghĩa là đạo hàm của hàm số xác định tại x là xấp xỉ tuyến tính bậc
nhất. Với hàm vecto có đạo hàm g(x) = (g1 (x), ..., gm (x)) có những
phần tử trong ma trận Jacobian được định nghĩa bởi công thức
g (x)ij =
∂gi (x)
.
∂xi
Cho g : Rn → Rm có đạo hàm tại x và h : Rm → Rs có đạo hàm
tại g(x). Khi đó quy tắc cho đạo hàm vi phân với hàm số phức hợp
(hay quy tắc chuỗi) có hiệu lực
[h (g(x))] = h (g(x)) g (x)
(1.12)
Định lý giá trị trung bình không thỏa mãn các hàm số vecto. Có nghĩa
là θ, 0 < θ < 1 để
g(x + y) = g(x) + g (x + θy)y
Cho hàm g : Rn → Rm , (m > 1).Giả sử g(x) khả vi trên [x, x + y]
thì
1
g(x + y) = g(x) +
g (x + τ y)ydτ
(1.13)
0
1
(g (x + τ y) − g (x)) ydτ
= g(x) + g (x)y +
0
Nếu g (x + τ y) ≤ L, 0 ≤ τ ≤ 1 thì
g(x + y) − g(x) ≤ L y
Vũ Thị Yến
8
(1.14)
K37C-SPT ĐHSP Hà Nội 2
Khóa luận tốt nghiệp
GVHD: Th.s Phùng Đức Thắng
ngược lại nếu g (x) thỏa mãn điều kiện Lipschitz trên [x, x + y]:
g (u) − g (v) ≤ L u − v , u, v ∈ [x, x + y]
thì
y 2
g(x + y) − g(x) − g (x)y ≤ L
.
2
(1.15)
Trong trường hợp vô hướng, hàm số g : Rn → Rn có đạo hàm tại
mọi điểm trên Rn được gọi là đạo hàm vi phân.
1.3
Đạo hàm bậc 2
Định nghĩa 1.3.1. Hàm vô hướng f (x)trên Rn được gọi là khả vi 2
lần tại x nếu nó khả vi tại x và tồn tại ma trận H đối xứng cấp n × n:
∀y ∈ Rn ,
f (x + y) = f (x) + (∇f (x), y) + (Hy, y) 2 + o
y
2
(1.16)
Ma trận H được gọi là ma trận của đạo hàm bậc 2 (hay ma trận
Hessian). Kí hiệu: f (x) hoặc ∇2 f (x).
Ta cũng có thể định nghĩa theo cách khác: Một hàm số có khả vi
2 lần tại điểm x nếu xác định được một hàm xấp xỉ bậc 2 tại lân cận
điểm x. Có nghĩa là tồn tại hàm bậc 2
f (y) = f (x) + (∇f (x), y) + ∇2 f (x)y, y
2
để
|f (x + y) − f (y)| = o
y
2
.
Xét hàm vô hướng φ(τ ) = f (x + τ y)
Ta thấy f có vi phân 2 lần trên [x, x + y] và
φ (τ ) = ∇2 f (x + τ y)y, y .
(1.17)
Từ công thức Taylor với các hàm số hữu tỷ
1
t
φ(1) = φ(0) + φ (0) +
φ (τ )dτ dt
0
Vũ Thị Yến
9
0
K37C-SPT ĐHSP Hà Nội 2
Khóa luận tốt nghiệp
GVHD: Th.s Phùng Đức Thắng
ta có
1
t
∇2 f (x + τ y)y, y dτ dt.
f (x + y) = f (x) + (∇f (x), y) +
0
0
(1.18)
Đặc biệt nếu
∇2 f (x + τ y) ≤ L, 0 ≤ τ ≤ 1
ta có
|f (x + y) − f (x) − (∇f (x), y) | ≤
L
2
y
2
(1.19)
ngược lại nếu
∇2 f (x + τ y) − ∇2 f (x) ≤ Lτ y
thì
|f (x + y) − f (x) − (∇f (x), y) −
1
2
∇2 f (x)y, y | ≤
L
6
y 3.
(1.20)
Sử dụng công thức Taylor với hàm các số dư trong dạng Lagrange
φ(1) = φ(0) + φ (0) + φ (Θ) 2, 0 ≤ Θ ≤ 1
ta tìm được Θ, 0 ≤ Θ ≤ 1 để
f (x + y) = f (x) + (∇f (x), y) + ∇2 f (x + Θy)y, y
1.4
2.
Các hàm số lồi
Định nghĩa 1.4.1. f (x) là hàm vô hướng trên Rn được gọi là lồi nếu
f (λx + (1 − λ)y) ≤ λf (x) + (1 − λ)f (y), ∀x, y ∈ Rn , 0 ≤ λ ≤ 1.
(1.21)
Bổ đề 1.4.2. (Bất đẳng thức Jensen)([1, LEMMA 1,p.8])
Cho f (x) là hàm lồi trên Rn . Khi đó ∀x1 , ..., xk ∈ Rn , λi ≥ 0, i =
1, ..., k, ta có:
f λ1 x1 + ... + λk xk ≤ λ1 f (x1 ) + ... + λk f (xk ).
Vũ Thị Yến
10
(1.22)
K37C-SPT ĐHSP Hà Nội 2
Khóa luận tốt nghiệp
GVHD: Th.s Phùng Đức Thắng
Hàm f (x) mà −f (x) lồi được gọi là hàm lõm. Rõ ràng, hàm affine
f (x) = (a, x) + β vừa là hàm số lồi vừa là hàm lõm.
Các trường hợp đặc biệt của hàm số lồi:
Hàm lồi ngặt: Hàm f (x) trên Rn được gọi là lồi ngặt nếu ∀x =
y, 0 < λ < 1 :
f (λx + (1 − λ)y) < λf (x) + (1 − λ)f (y).
(1.23)
Hàm lồi mạnh: Hàm f (x) trên Rn được gọi là lồi mạnh với hệ số
> 0 nếu với mọi 0 ≤ λ ≤ 1 ta có
f (λx + (1 − λ)y) ≤ λf (x) + (1 − λ)f (y) − λ(1 − λ) x − y
2
2.
(1.24)
Chú ý: Hàm lồi mạnh là lồi ngặt.
Bổ đề 1.4.3. ([1, LEMMA 2,p.9]) Cho ψ(t) là hàm khả vi trên R1 .
Khi đó bề lồi của ψ(τ ) tương đương với sự đơn điệu của đạo hàm
(ψ (τ1 ) ≥ ψ (τ2 )) cho τ1 ≥ τ2 , lồi ngặt cho đơn điệu ngặt (ψ (τ1 ) > ψ (τ2 ))
cho τ1 > τ2 và lồi mạnh cho đơn điệu mạnh (ψ (τ1 ) − ψ (τ2 ) ≥ (τ1 − τ2 ), τ1 > τ2 ) .
Bổ đề 1.4.4. ([1, LEMMA 3,p.9]) Cho f (x) khả vi trên Rn .∀x, y ∈ Rn
f (x) lồi tương đương với bất đẳng thức:
f (x + y) ≥ f (x) + (∇f (x), y) ,
(1.25)
f (x) lồi ngặt tương đương với bất đẳng thức:
f (x + y) > f (x) + (∇f (x), y) , y = 0
(1.26)
f (x) lồi mạnh tương đương với bất đẳng thức:
f (x + y) ≥ f (x) + (∇f (x), y) +
y
2
2.
(1.27)
Chú ý: 1) Đồ thị của hàm lồi ngặt nằm trên siêu phẳng tiếp xúc,
đồ thị của hàm lồi mạnh nằm trên một số đường parabol.
Sự suy rộng điều kiện đơn điệu trong trường hợp nhiều
chiều:
Vũ Thị Yến
11
K37C-SPT ĐHSP Hà Nội 2
Khóa luận tốt nghiệp
GVHD: Th.s Phùng Đức Thắng
Với hàm lồi
(∇f (x) − ∇f (y), x − y) ≥ 0.
(1.28)
Với hàm lồi ngặt thì điều kiện đơn điệu ngặt
(∇f (x) − ∇f (y), x − y) > 0, x = y.
(1.29)
Với hàm lồi mạnh thì điều kiện đơn điệu mạnh
(∇f (x) − ∇f (y), x − y) ≥
x − y 2.
(1.30)
2)Tiêu chuẩn cho lồi là đơn giản nhất cho các hàm số khả vi hai lần
f (x). Lồi tương đương với điều kiện
∇2 f (x) ≥ 0.
(1.31)
lồi mạnh tương đương với điều kiện
∇2 f (x) ≥ I, ∀x.
(1.32)
lồi ngặt tương đương với điều kiện
∇2 f (x) > 0.
(1.33)
Cho x∗ là điểm cực tiểu của vi phân trên hàm lồi mạnh f (x) (với
hệ số ). Tồn tại duy nhất một điểm và ∇f (x∗ ) = 0. Do đó từ các
bất đẳng thức (1.27),(1.30) ta có các kết luận:
f (x) ≥ f (x∗ +
x − x∗
(∇f (x), x − x∗ ) ≥
∇f (x) ≥
1.5
1.5.1
2
2.
(1.34)
x − x∗ 2 .
(1.35)
x − x∗ .
(1.36)
Các điều kiện về cực trị
Điều kiện cần bậc nhất
Định nghĩa 1.5.1. Điểm x∗ được gọi là cực tiểu địa phương của f (x)
trên Rn nếu ∃ε > 0 : f (x) ≥ f (x∗ ), ∀x là lân cận của x∗ .
Có nghĩa là x − x∗ ≤ ε. Trong trường hợp này x∗ còn được gọi
là điểm cực tiểu.
Vũ Thị Yến
12
K37C-SPT ĐHSP Hà Nội 2
Khóa luận tốt nghiệp
GVHD: Th.s Phùng Đức Thắng
Định lí 1.5.2. (Fermat:)([1, THEREM 1,p.11]) Cho x∗ là điểm cực
tiểu của f (x) trên Rn , f (x) khả vi tại x∗ thì
∇f (x∗ ) = 0.
(1.37)
Chứng minh. Giả sử ∇f (x∗ ) = 0. Ta có
f (x∗ − τ ∇f (x∗ )) = f (x∗ ) − τ ∇f (x∗ )
2
+ o (τ ∇f (x∗ ))
= f (x∗ ) − τ ∇f (x∗ ) 2 + τ −1 o(τ ) < f (x∗ ) (với τ > 0 đủ nhỏ).
( Trái với giả thiết x∗ là điểm cực tiểu )
Vậy
∇f (x∗ ) = 0.
1.5.2
Điều kiện đủ bậc nhất
Định lí 1.5.3. ([1, THEREM 2,p.12]) Cho f (x) là hàm lồi khả vi tại
x∗ , ∇f (x∗ ) = 0. Thì x∗ gọi là điểm cực tiểu toàn cục của f (x) trên
Rn .
Chứng minh. Chứng minh này trực tiếp tuân theo từ công thức (1.25)
của phần 1.3 vì
f (x) ≥ f (x∗ ) + (∇f (x∗ ), x − x∗ ) = f (x∗ ), ∀x ∈ Rn
1.5.3
Điều kiện cần bậc hai
Định lí 1.5.4. ([1, THEREM 3,p.13]) Cho x∗ là điểm cực tiểu của
f (x) trên Rn , f (x) khả vi hai lần tại x∗ thì
∇2 f (x∗ ) ≥ 0.
(1.38)
Chứng minh. Từ định lý 1.5.2, ∇f (x∗ ) = 0, do đó ∀y và τ đủ nhỏ ta
có:
f (x∗ ) ≤ f (x∗ + τ y) = f (x∗ ) + τ 2 ∇2 f (x∗ )y, y
Vũ Thị Yến
13
2 + o(τ 2 ),
K37C-SPT ĐHSP Hà Nội 2
Khóa luận tốt nghiệp
GVHD: Th.s Phùng Đức Thắng
∇2 f (x∗ )y, y ≥ o(τ 2 ) τ 2 .
Khi τ → 0 ta có ∇2 f (x∗ )y, y ≥ 0. Vì y tùy ý nên
∇2 f (x∗ ) ≥ 0.
1.5.4
Điều kiện đủ bậc hai
Định lí 1.5.5. ([1, THEREM 4,p.13]) Cho f ∗ (x) khả vi hai lần tại
x∗ ,cho điều kiện cần bậc nhất (∇f (x∗ ) = 0) và
∇2 f (x∗ ) > 0.
(1.39)
ta có x∗ là điểm cực tiểu.
Chứng minh. Cho y là vecto đơn vị. Ta có:
f (x∗ + τ y) = f (x∗ ) + τ 2 ∇2 f (x∗ )y, y
2 + o τ2 y
2
τ2
≥ f (x ) +
+ o(τ 2 )
2
trong đó > 0 là giá trị riêng nhỏ nhất của ∇2 f (x∗ ) và hàm số o(τ 2 )
không phụ thuôc vào y.
τ2
Do đó ∃τ0 : 0 ≤ τ ≤ τ0 ta có
≥ o(τ 2 )
2
hay
f (x∗ + τ y) ≥ f (x∗ ).
∗
Chú ý: Nếu điều kiện cần bậc nhất và bậc hai thỏa mãn tại x∗
∇f (x∗ ) = 0, ∇2 f (x∗ ) ≥ 0 nhưng điều kiện đủ bậc hai không thỏa
mãn (ma trận ∇2 f (x∗ ) không xác định dương) thì x∗ không là điểm
cực tiểu.
Vũ Thị Yến
14
K37C-SPT ĐHSP Hà Nội 2
Chương 2
Phương pháp Gradient
2.1
Nội dung của phương pháp
Giả sử tại điểm x bất kì có thể tính được đạo hàm của hàm số ∇f (x).
Trong trường hợp này cách đơn giản nhất để tính cực tiểu của hàm
số f (x) là phương pháp Gradient bằng cách bắt đầu từ xấp xỉ gần
đúng x0 để tạo thành chuỗi lặp
xk+1 = xk − γk ∇f (xk ),
(2.1)
trong đó γk ≥ 0 là độ dài bước nhảy.
Đầu tiên, xem lại việc chứng minh các điều kiện cần với cực trị
(Định lý 1.5.2 phần 1.5), nếu điều kiện cực trị không thỏa mãn tại
x(∇f (x) = 0) thì giá trị của hàm số có thể bị giảm tới x − τ ∇f (x)
với τ > 0 đủ nhỏ.
Thứ hai, tại điểm xk hàm khả vi f (x) được xấp xỉ với hàm tuyến
tính fk (x) = f (xk + ∇f (xk ), x − xk với độ sai khác o(x − xk ) . Do
đó có thể tìm cực tiểu xấp xỉ của hàm fk (x) tại lân cận của xk .
Chẳng hạn như ta đi xác định εk và giải bài toán bổ trợ:
min
x−xk ≤εk fk (x).
(2.2)
Điều đó là tự nhiên khi áp dụng bài toán như một xấp xỉ mới xk+1 .
Thứ ba, tại điểm xk ta chọn lân cận của hướng dốc nhất. Có nghĩa
là hướng yk , y = 1 trong đó cực tiểu f (xk ; y) là thỏa mãn. Sử dụng
công thức (1.6) của phần 1.1 với đạo hàm theo hướng ta có:
y k = argmin ∇f (xk ), y = −∇f (xk )
∇f (xk ) .
Do đó, hướng dốc nhất ngược với hướng Gradient.
15
(2.3)
Khóa luận tốt nghiệp
2.2
GVHD: Th.s Phùng Đức Thắng
Tính hội tụ
Xét trường hợp đơn giản của phương pháp Gradient, tại γk ≡ γ :
xk+1 = xk − γ∇f (xk ).
(2.4)
Định lí 2.2.1. ([1, THEOREM 1,p.21])
Cho f (x) khả vi trên Rn , đạo hàm của f (x) thỏa mãn điều kiện
Lipschitz:
∇f (x) − ∇f (y) ≤ L x − y ,
(2.5)
cho f (x) bị chặn dưới:
f (x) ≥ f ∗ > −∞,
(2.6)
và γ thỏa mãn điều kiện:
0 0, theo (2.7) ta có:
s
k 2
≤ α−1 f (x0 ) − f (xs+1 ) ≤ α−1 f (x0 ) − f ∗ , ∀s.
k=0 ∇f (x )
k 2
có nghĩa là ∞
< ∞ tức là ∇f (xk ) → 0. Ta có điều
k=0 ∇f (x )
phải chứng minh.
Ở đây, các điều kiện của định lý là rất cần thiết.
Các vi phạm điều kiện 2.5 có thể có hai phần:
1) Hàm f (x) có thể không trơn tại một số điểm.
Ví dụ 4. Cho f (x) = x 1+α , 0 < α < 1
f (x) khả vi nhưng không có đạo hàm thỏa mãn điều kiện Lipschitz
vì
∇f (x) − ∇f (0)
= (α + 1) x α−1 → ∞ khi x → 0.
x−0
Trong trường hợp này ta có
xk − x∗ = xk
γ ∇f (xk )
với xk đủ nhỏ.
Có nghĩa là độ dài bước nhảy trong công thức (2.4) nhỏ và f (x) không
đơn điệu giảm.
2) Bất đẳng thức (2.5) không phụ thuộc vào các hàm số lớn hơn
hàm số bậc hai.
Ví dụ 5. Cho f (x) = x 2+α , α > 0
∇f (x) − ∇f (0)
Ta có:
= (2 + α) x α → ∞ khi x → ∞.
x−0
Với ∀γ > 0, ∃x0 để công thức (2.4) khi áp dụng cho hàm số x
(α > 0) với xấp xỉ ban đầu x0 sẽ phân kì vì
2+α
,
xk+1 > xk , k = 0, 1, ...
Bổ đề 2.2.2. ([1, LEMMA 1,p.23]) Cho f (x) khả vi, ∇f (x) thỏa
mãn điều kiện Lipschitz với hệ số L và f (x) ≥ f ∗ , ∀x thì
∇f (x)
Vũ Thị Yến
2
≤ 2L (f (x) − f ∗ ) .
17
(2.9)
K37C-SPT ĐHSP Hà Nội 2
Khóa luận tốt nghiệp
GVHD: Th.s Phùng Đức Thắng
Chứng minh. f ∗ ≤ f x − L−1 ∇f (x) ≤ f (x) − (2L)−1 ∇f (x) 2 .
Bổ đề 2.2.3. ([1, LEMMA 2,p.24]) Cho f (x) là hàm lồi, khả vi và
∇f (x) thỏa mãn điều kiện Lipschitz với hệ số L thì
(∇f (x) − ∇f (y), x − y) ≥ L−1 ∇f (x) − ∇f (y) 2 .
(2.10)
Chứng minh. Chứng minh công thức (2.10) với các hàm số khả vi hai
lần. Từ (1.13) phần 1.1 ta có
1
∇2 f (x + τ (y − x)) (y−x)dτ = ∇f (x)+A(y−x),
∇f (y) = ∇f (x)+
0
trong đó ma trận
1
∇2 f (x + τ (y − x)) dτ
A=
0
là đối xứng và không âm xác định bởi công thức (1.31) của phần 1.4,
có nghĩa là A ≥ 0.
Mà A ≤ L khi ∇2 f (x) ≤ L, ∀x.
Do đó
(∇f (x) − ∇f (y), x − y) = (A(x − y), x − y)
≥ A
−1
A(x − y)
2
≥ L−1 ∇f (x) − ∇f (y) 2 .
Bổ đề 2.2.4. ([1, LEMMA 3,p.24]) Cho f (x) là hàm lồi mạnh khả
vi ( với hệ số ) và x∗ là điểm cực tiểu thì
∇f (x)
2
≥ 2 (f (x) − f (x∗ )) .
Định lí 2.2.5. ([1, THEOREM 2,p.24]) Cho f (x) khả vi trên Rn có
đạo hàm thỏa mãn điều kiện Lipschitz với hệ số L và f (x) là hàm lồi
2
mạnh với hệ số . Cho 0 < γ < phương pháp (2.4) hội tụ tới điểm
L
cực tiểu toàn cục x∗ duy nhất với sự suy biến của cấp số nhân
xk − x∗ ≤ cq k , 0 ≤ q < 1.
Vũ Thị Yến
18
(2.11)
K37C-SPT ĐHSP Hà Nội 2
Khóa luận tốt nghiệp
GVHD: Th.s Phùng Đức Thắng
Chứng minh. Các điều kiện của định lý 1.5.2 đều được thỏa mãn.
f (xk+1 ) ≤ f (xk ) − γ 1 −
Lγ
2
∇f (xk ) 2 .
Sử dụng bổ đề 2.2.4
f (xk+1 ) ≤ f (xk ) − γ(2 − Lγ) f (xk ) − f (x∗ )
hay
f (xk+1 ) − f (x∗ ) ≤ (1 − γ(2 − Lγ)) f (xk ) − f (x∗ )
= q1 f (xk ) − f (x∗ )
f (xk ) − f (x∗ ) ≤ q1k f (x0 ) − f (x∗ ) , q1 = 1 − 2 γ + L γ 2 .
2
thì 0 < q1 < 1 và f (xk ) → f (x∗ ). Từ bất đẳng thức
L
(1.34) phần 1.4 ta có:
Khi 0 < γ <
xk − x∗
2
2
q1k f (x0 ) − f (x∗ ) .
L
≤
Định lí 2.2.6. ([1, THEOREM 1,p.25]) Cho f (x) khả vi hai lần và
I ≤ ∇2 f (x) ≤ LI, > 0, ∀x
Khi 0 < γ <
(2.12)
2
L
xk − x∗ ≤ x0 − x∗ q k , q = max {|1 − γ |, |1 − γL|} < 1. (2.13)
thì
q ≤ q∗ =
với γ = γ ∗ =
(L − )
L+
(2.14)
2
.
L+
Chứng minh. Từ công thức (1.13) phần (1.2) ta có
k
1
∗
∇f (x ) = ∇f (x ) +
∇2 f x∗ + τ (xk − x∗ ) (xk − x∗ )dτ
0
Vũ Thị Yến
19
K37C-SPT ĐHSP Hà Nội 2
Khóa luận tốt nghiệp
GVHD: Th.s Phùng Đức Thắng
= Ak (xk − x∗ )
khi I ≤ Ak ≤ LI . Do đó
xk+1 − x∗ = xk − x∗ − γ∇f (xk ) = (I − γAk )(xk − x∗ )
≤ I − γAk
xk − x∗ .
Với ma trận đối xứng A ta có I − A = max {|1 − λ1 |, |1 − λn |}
trong đó λ1 và λn tương ứng là các giá trị riêng nhỏ nhất và lớn nhất
của A.
Do đó: xk+1 − x∗ ≤ q xk − x∗ , q = max {|1 − |, |1 − γL|}
2
Khi 0 < γ < thì |1 − γ | < 1 hay q < 1.
L
Cực tiểu hóa q theo γ ta có điều phải chứng minh.
Ta thấy rằng ước tính tốc độ hội tụ cho bởi Định lý 2.2.6 là chính
xác và có thể đạt được với bất kì hàm bậc 2 nào.
Cho
f (x) = (Ax, x) 2 − (b + x), A > 0, 0 < = λ1 γλ2 ≤ ... ≤ λn = L
với λi là các giá trị riêng của A
2
Lấy tùy ý 0 < γ < . Giả sử |1 − γ | ≥ |1 − γL|
L
Chọn x0 = x∗ + e1 , với e1 là giá trị riêng tương ứng của λ1 . Thì
xk − x∗ = (I − γA)k (x0 − x∗ ) = (1 − γλ1 )k e1 ,
xk − x∗ = |(1 − γ )|k = q k x0 − x∗ .
Nếu |1 − γL| ≥ |1 − γ |, lấy x0 = x∗ + en , với en là giá trị riêng tương
ứng với λn . Thì
xk − x∗ = |(1 − γL)|k = q k x0 − x∗
2
Vì thế với 0 < γ < , ∃x0 : xk −x∗ = q k x0 −x∗ , q = max {|1 − |, |1 − γL|} .
L
Ước tính
(L − )
xk − x∗ ≤ (q ∗ )k x0 − x∗ , q ∗ =
L+
không được cải thiện thậm chí nếu γ là tối ưu cho mỗi x0 .
Thật vậy, chọn x0 = x∗ + e1 + en .
2
Với ∀0 < γ < :
L
Vũ Thị Yến
20
K37C-SPT ĐHSP Hà Nội 2
Khóa luận tốt nghiệp
GVHD: Th.s Phùng Đức Thắng
xk − x∗ = (I − γA)k (x0 − x∗ ) = (1 − γ )k e1 + (1 − γL)k en ,
0
− x∗
k
∗
2k
2k 1/2 x √
x − x = (1 − γ ) + (1 − γL)
.
2
Do đó, nếu một trong hai |1−γ | > q ∗ hoặc |1−γL| > q ∗ thì xk −x∗
giảm chậm hơn so với (q ∗ )k . Nhưng q = max {|1 − |, |1 − γL|} ≤ q ∗
với γ = γ ∗ và
|1 − γ ∗ | = |1 − γ ∗ L| = q ∗ và xk − x∗ = (q ∗ )k x0 − x∗ .
Định lí 2.2.7. ([1, THEOREM 4,p.27]) Cho x∗ là điểm cực tiểu địa
phương không suy biến của f (x).
2
, phương pháp (2.4) hội tụ địa phương tới x∗
Với 0 < γ <
2
∇ f (x∗ )
với tốc độ của cấp số hình học (thuật ngữ tiếng anh là: the rate of
geometric progression).
Có nghĩa là
∀δ > 0, ∃ε > 0 : x0 − x∗ ≤ ε,
xk − x∗ ≤ x0 − x∗ (q + δ)k ,
q = max {|1 − γ |, |1 − γL|} < 1, 0 < I < ∇2 f (x∗ ) ≤ LI thì
q ≤ q∗ =
Vũ Thị Yến
(L − )
2
với γ ∗ =
.
(L + )
(L + )
21
K37C-SPT ĐHSP Hà Nội 2
Chương 3
Phương pháp Newton
3.1
Nội dung của phương pháp
Trong phương pháp Gradient, khái niệm xấp xỉ tuyến tính địa phương
của hàm mục tiêu f (x) là căn bản. Nếu hàm số có khả vi hai lần thì
có thể sử dụng xấp xỉ bậc hai tại điểm xk , có nghĩa là hàm số
fk (x) = f (xk ) + ∇f (xk ), x − xk + ∇2 f (xk )(x − xk ), x − xk
2.
(3.1)
Trong phương pháp Gradient xấp xỉ tiếp theo xk+1 được cho trong
điều kiện xấp xỉ tuyến tính là điểm cực tiểu dưới giới hạn khi tiến tới
xk . Lấy cực tiểu của fk (x) như một xấp xỉ mới:
xk+1 = argminfk (x).
Ta có
xk+1 = xk − ∇2 f (xk )
−1
∇f (xk ).
(3.2)
Điểm cực tiểu là nghiệm của hệ phương trình
∇f (x) = 0.
(3.3)
Một trong những phương pháp căn bản cho việc giải các bài toán
như vậy là phương pháp Newton. Phương pháp này bao gồm việc
tuyến tính hóa các phương trình tại điểm xk và giải quyết hệ thống
tuyến tính đó ( xem phần 3.3 dưới đây ). Hệ thống tuyến tính hóa có
dạng:
∇f (xk ) + ∇2 f (xk )(x − xk ) = 0
(3.4)
và cách giải xk+1 được cho bởi công thức (3.2).
22
Khóa luận tốt nghiệp
3.2
GVHD: Th.s Phùng Đức Thắng
Tính hội tụ
Định lí 3.2.1. ([1, THEOREM 1,p.28]) Cho f (x) khả vi hai lần,
∇2 f (x) thỏa mãn điều kiện Lipschitz (với hệ số L), cho f (x) là lồi
mạnh (với hệ số ) và xấp xỉ ban đầu thỏa mãn điều kiện
q= L
−2
∇f (x0 < 1
2
(3.5)
thì công thức (3.2) hội tụ tới điểm cực tiểu toàn cục x∗ với tỉ lệ bậc
hai:
2
k
q2 .
(3.6)
xk − x∗ ≤
L
Chứng minh. Theo điều kiện Lipschitz trên ∇2 f (x) (sử dụng (1.15)
phần 1.2)
L
2
∇f (x + y) − ∇f (x) − ∇2 f (x)y ≤
trong đó
x = xk , y = − ∇2 f (xk )
−1
2
y
∇f (xk ).
Thì x + y = xk+1 và
L
2
∇f (xk+1 ) ≤
∇2 f (xk )
−1
∇f (xk )
2
L
−1 2
∇2 f (xk )
∇f (xk ) 2 .
2
Vì ∇2 f (xk ) ≥ I (điều kiện hàm lồi mạnh, xem công thức (1.32) phần
1.4) nên
≤
∇2 f (xk )
−1
−1
≤
có nghĩa là
k+1
∇f (x
∇2 f (xk )
I và
) ≤
L
−1
≤
−1
,
−2
2
∇f (xk ) 2 .
Lặp lại bất đẳng thức này, ta có:
2 2
k
∇f (x ) ≤
L
L
∇f (x0 )
2 2
2k
2 2 2k
=
q .
L
Áp dụng công thức (1.36) phần 1.4, định lý được chứng minh.
Vũ Thị Yến
23
K37C-SPT ĐHSP Hà Nội 2
Khóa luận tốt nghiệp
GVHD: Th.s Phùng Đức Thắng
Định lí 3.2.2. ([1, THEOREM 2,p.30]) Cho f (x) khả vi hai lần tại
lân cận U của điểm cực tiểu không suy biến x∗ , ∇2 f (x) thỏa mãn
điều kiện Lipschitz trên U . Khi đó, ∃ε > 0 : x0 − x∗ ≤ ε để phương
pháp (2.2) hội tụ tại x∗
Định lí 3.2.3. ([4, THEOREM 3.7,p.52]) Giả sử f khả vi hai lần và
Hessian ∇2 f (x) là hội tụ Lipschitz tại lân cận của x∗ mà tại đó các
điều kiện đủ được thỏa mãn. Xét việc lặp lại xk+1 = xk + pk , trong
2 −1
đó pk được cho bởi công thức pN
k = −∇ fk ∇fk . Thì
1. Nếu điểm bắt đầu x0 đủ gần tới x∗ , dãy lặp hội tụ đến x∗ .
2. Tốc độ hội tụ của {xk } là bậc hai.
3. Dãy chuẩn Gradient { fk } hội tụ bậc hai tới 0.
Chứng minh. Từ định nghĩa của phương pháp Newton và điều kiện
∇f∗ = 0, ta có
∗
∗
2 −1
2 −1
xk +pN
∇2 fk (xk − x∗ ) − (∇fk − ∇f∗ ) .
k −x = xk −x −∇ fk ∇fk = ∇ fk
(3.7)
Vì
1
∇fk − ∇f∗ =
∇2 f (xk + t(x∗ − xk )) (xk − x∗ )dt
0
, nên
∇2 f (xk )(xk − x∗ ) − (∇fk − ∇f (x∗ ))
1
=
0
1
≤
∇2 f (xk ) − ∇2 f (xk + t(x∗ − xk )) (xk − x∗ )dt
∇2 f (xk ) − ∇2 f (xk + t(x∗ − xk ))
xk − x∗ dt
0
1
∗
≤ xk − x
0
1
Ltdt = L xk − x∗ 2 .
2
(3.8)
trong đó L là hệ số Lipschitz của ∇2 f (xk ), x → x∗ .
Vì ∇2 f (x∗ ) không suy biến và ∇2 fk → ∇2 f (x∗ ) ta có
∇2 fk−1 ≤ 2 ∇2 f (x∗ )−1 , ∀k đủ nhỏ.
Từ (3.7) và 3.8 ta có
∗
x k + pN
≤ L ∇2 f (x∗ )−1
k −x
Vũ Thị Yến
24
xk − x∗
2
= L xk − x∗ 2 . (3.9)
K37C-SPT ĐHSP Hà Nội 2
Khóa luận tốt nghiệp
GVHD: Th.s Phùng Đức Thắng
trong đó L = L ∇2 f (x∗ )−1 .
Sử dụng bất đẳng thức trên, nếu điểm bắt đầu đủ gần tới x∗ thì dãy
lặp hội tụ đến x∗ và tốc độ hội tụ là bậc hai.
2
N
Từ xk+1 − xk = pN
k và ∇fk + ∇ fk pk = 0 ta có
∇f (xk+1 ) = ∇f (xk+1 ) − ∇fk − ∇2 f (xk )pN
k
1
2
N
∇2 f (xk + tpN
k )(xk+1 − xk )dt − ∇ f (xk )pk
=
0
1
2
∇2 f (xk + tpN
k ) − ∇ f (xk
≤
pN
k dt
0
1
≤ L pN
k
2
2
1
≤ L ∇2 f (xk )−1 2 ∇fk 2
2
≤ 2L ∇2 f (x∗ )−1 2 ∇fk 2 .
có nghĩa là các chỉ tiêu Grradient hội tụ bậc hai tới 0.
3.3
Phương pháp Newton trong việc giải các
phương trình
Phương pháp Newton có thể được sử dụng để giải quyết các bài toán
cực tiểu như các phương trình phi tuyến tổng quát
g(x) = 0, g : Rn → Rn .
(3.10)
Phương pháp Newton dựa trên khái niệm về xấp xỉ tuyến tính: một
phương trình tuyến tính
g(xk ) + g (xk )(x − xk ) = 0
được giải quyết bằng cách lặp đi lặp lại k , ta có
xk+1 = xk − g (xk )−1 g(xk ).
(3.11)
Định lí 3.3.1. ([1, THEOREM 3,p.31]) Cho phương trình (3.7) có
nghiệm x∗ , hàm số g : Rn → Rn khả vi tại lân cận của x∗ và g (x)
thỏa mãn điều kiện Lipschitz trên lân cận này. Cho ma trận g (x∗ )
không suy biến thì ∃ε > 0 : với x0 − xk ≤ ε, phương pháp (2.7) hội
tụ tại x∗ với tỉ lệ bậc hai.
Vũ Thị Yến
25
K37C-SPT ĐHSP Hà Nội 2
Khóa luận tốt nghiệp
GVHD: Th.s Phùng Đức Thắng
Chứng minh. Tương tự định lý 3.2.2 (vì định lý 3.2.2 là một trường
hợp đặc biệt của định lý 3.2.3 với g(x) = ∇f (x) ).
Vũ Thị Yến
26
K37C-SPT ĐHSP Hà Nội 2
Khóa luận tốt nghiệp
GVHD: Th.s Phùng Đức Thắng
KẾT LUẬN
Trên đây là toàn bộ nội dung khóa luận " Phương pháp Gradient và Phương pháp Newton". Khóa luận trình bày các nội dung
sau
Trước hết, khóa luận giới thiệu một số kiến thức chuẩn bị. Đó là
những kiến thức
• Đạo hàm của hàm vô hướng.
• Đạo hàm của hàm vecto.
• Đạo hàm bậc hai.
• Các hàm số lồi.
• Các điều kiện về cực trị.
Tiếp theo, khóa luận trình bày về phương pháp Gradient
• Nội dung của phương pháp.
• Tính hôi tụ.
Cuối cùng, khóa luận trình bày về phương pháp Newton
• Nội dung của phương pháp.
• Tính hội tụ.
• Phương pháp Newton trong việc giải các phương trình.
Do thời gian ngiên cứu và năng lực còn hạn chế nên khóa luận mới
chỉ đạt được một số kết quả nhất định. Em rất mong các thầy cô, các
bạn góp ý và nhận xét để khóa luận này được đầy đủ và hoàn thiện
hơn.
Trước khi kết thúc khóa luận này, một lần nữa em xin bày tỏ lòng
biết ơn sâu sắc đối với các thầy cô trong trường, đặc biệt là thầy
Phùng Đức Thắng đã tận tình giúp đỡ em hoàn thành khóa luận này.
Hà Nội, tháng 05 năm 2015
Sinh viên
Vũ Thị Yến
Vũ Thị Yến
27
K37C-SPT ĐHSP Hà Nội 2
Tài liệu tham khảo
[1] B. T. Polyak, Introduction to Optimization, Publications Division, New York , 1987.
[2] D. Kinderlehrer, G. Stampacchia, An Introduction to Variational Inequalities and Their Applications, Academic Press, New
York, 1980.
[3] G. M. Lee, N. N. Tam, and N. D. Yen, Quadratic Programming and Affine Variational Inequalities: A Qualitative Study,
Springer Verlag, New York, 2005.
[4] J. Nocedal, S. J. Wright, Numerical Optimization, SpringerVerlag, New York, 1999.
[5] A. Ruszczynski, Nonlinear Optimization, Princeton University
Press, Princeton, New Jersey, 2005.
[6] N. N. Tam, N. D. Yen, Continuity properties of the KarushKuhn-Tucker point set in quadratic programming problems, Math.
Program., 2 (1999), 193–206.
28
[...]... K37C-SPT ĐHSP Hà Nội 2 Chương 3 Phương pháp Newton 3.1 Nội dung của phương pháp Trong phương pháp Gradient, khái niệm xấp xỉ tuyến tính địa phương của hàm mục tiêu f (x) là căn bản Nếu hàm số có khả vi hai lần thì có thể sử dụng xấp xỉ bậc hai tại điểm xk , có nghĩa là hàm số fk (x) = f (xk ) + ∇f (xk ), x − xk + ∇2 f (xk )(x − xk ), x − xk 2 (3.1) Trong phương pháp Gradient xấp xỉ tiếp theo xk+1 được... Gradient và Phương pháp Newton" Khóa luận trình bày các nội dung sau Trước hết, khóa luận giới thiệu một số kiến thức chuẩn bị Đó là những kiến thức • Đạo hàm của hàm vô hướng • Đạo hàm của hàm vecto • Đạo hàm bậc hai • Các hàm số lồi • Các điều kiện về cực trị Tiếp theo, khóa luận trình bày về phương pháp Gradient • Nội dung của phương pháp • Tính hôi tụ Cuối cùng, khóa luận trình bày về phương pháp Newton. .. (3.2) Điểm cực tiểu là nghiệm của hệ phương trình ∇f (x) = 0 (3.3) Một trong những phương pháp căn bản cho việc giải các bài toán như vậy là phương pháp Newton Phương pháp này bao gồm việc tuyến tính hóa các phương trình tại điểm xk và giải quyết hệ thống tuyến tính đó ( xem phần 3.3 dưới đây ) Hệ thống tuyến tính hóa có dạng: ∇f (xk ) + ∇2 f (xk )(x − xk ) = 0 (3.4) và cách giải xk+1 được cho bởi công... tụ Cuối cùng, khóa luận trình bày về phương pháp Newton • Nội dung của phương pháp • Tính hội tụ • Phương pháp Newton trong việc giải các phương trình Do thời gian ngiên cứu và năng lực còn hạn chế nên khóa luận mới chỉ đạt được một số kết quả nhất định Em rất mong các thầy cô, các bạn góp ý và nhận xét để khóa luận này được đầy đủ và hoàn thiện hơn Trước khi kết thúc khóa luận này, một lần nữa em xin... không xác định dương) thì x∗ không là điểm cực tiểu Vũ Thị Yến 14 K37C-SPT ĐHSP Hà Nội 2 Chương 2 Phương pháp Gradient 2.1 Nội dung của phương pháp Giả sử tại điểm x bất kì có thể tính được đạo hàm của hàm số ∇f (x) Trong trường hợp này cách đơn giản nhất để tính cực tiểu của hàm số f (x) là phương pháp Gradient bằng cách bắt đầu từ xấp xỉ gần đúng x0 để tạo thành chuỗi lặp xk+1 = xk − γk ∇f (xk ),... xk+1 − xk = pN k và ∇fk + ∇ fk pk = 0 ta có ∇f (xk+1 ) = ∇f (xk+1 ) − ∇fk − ∇2 f (xk )pN k 1 2 N ∇2 f (xk + tpN k )(xk+1 − xk )dt − ∇ f (xk )pk = 0 1 2 ∇2 f (xk + tpN k ) − ∇ f (xk ≤ pN k dt 0 1 ≤ L pN k 2 2 1 ≤ L ∇2 f (xk )−1 2 ∇fk 2 2 ≤ 2L ∇2 f (x∗ )−1 2 ∇fk 2 có nghĩa là các chỉ tiêu Grradient hội tụ bậc hai tới 0 3.3 Phương pháp Newton trong việc giải các phương trình Phương pháp Newton có thể được... hợp đơn giản của phương pháp Gradient, tại γk ≡ γ : xk+1 = xk − γ∇f (xk ) (2.4) Định lí 2.2.1 ([1, THEOREM 1,p.21]) Cho f (x) khả vi trên Rn , đạo hàm của f (x) thỏa mãn điều kiện Lipschitz: ∇f (x) − ∇f (y) ≤ L x − y , (2.5) cho f (x) bị chặn dưới: f (x) ≥ f ∗ > −∞, (2.6) và γ thỏa mãn điều kiện: 0 q ∗ thì xk −x∗ giảm chậm hơn so với (q ∗ )k Nhưng q = max {|1 − |, |1 − γL|} ≤ q ∗ với γ = γ ∗ và |1 − γ ∗ | = |1 − γ ∗ L| = q ∗ và xk − x∗ = (q ∗ )k x0 − x∗ Định lí 2.2.7 ([1, THEOREM 4,p.27]) Cho x∗ là điểm cực tiểu địa phương không suy biến của f (x) 2 , phương pháp (2.4) hội tụ địa phương tới x∗ Với 0 < γ < 2 ∇ f (x∗ ) với tốc độ của cấp số hình học (thuật ngữ tiếng anh là: the rate of... ε, phương pháp (2.7) hội tụ tại x∗ với tỉ lệ bậc hai Vũ Thị Yến 25 K37C-SPT ĐHSP Hà Nội 2 Khóa luận tốt nghiệp GVHD: Th.s Phùng Đức Thắng Chứng minh Tương tự định lý 3.2.2 (vì định lý 3.2.2 là một trường hợp đặc biệt của định lý 3.2.3 với g(x) = ∇f (x) ) Vũ Thị Yến 26 K37C-SPT ĐHSP Hà Nội 2 Khóa luận tốt nghiệp GVHD: Th.s Phùng Đức Thắng KẾT LUẬN Trên đây là toàn bộ nội dung khóa luận " Phương pháp Gradient ... nghiên cứu cách toàn diện nhờ phương pháp định tính định lượng phương pháp miền tin cậy, phương pháp nhân tử Lagrange, Trong phương pháp Gradient phương pháp Newton phương pháp số để giải toán tối... trình bày phương pháp Gradient • Nội dung phương pháp • Tính hôi tụ Cuối cùng, khóa luận trình bày phương pháp Newton • Nội dung phương pháp • Tính hội tụ • Phương pháp Newton việc giải phương trình... hai tới 3.3 Phương pháp Newton việc giải phương trình Phương pháp Newton sử dụng để giải toán cực tiểu phương trình phi tuyến tổng quát g(x) = 0, g : Rn → Rn (3.10) Phương pháp Newton dựa khái