Dự thảo tóm tắt Luận án Tiến sĩ Toán học: Một số dạng phương trình vi phân ngẫu nhiên trong bài toán thời điểm dừng tối ưu

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang	33
Dung lượng	477,73 KB

Nội dung

Luận án được chia thành 3 chương với bố cục như sau: Kiến thức chuẩn bị, thời điểm dừng tối ưu cho bài toán quảng cáo, thời điểm dừng tối ưu cho bài toán bán tài sản. Mời các bạn cùng tham khảo!

ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN Nguyễn Thành Trung MỘT SỐ DẠNG PHƯƠNG TRÌNH VI PHÂN NGẪU NHIÊN TRONG BÀI TỐN THỜI ĐIỂM DỪNG TỐI ƯU Chuyên ngành: Lý thuyết xác suất thống kê Toán học Mã số: 62 46 01 06 (DỰ THẢO) TĨM TẮT LUẬN ÁN TIẾN SĨ TỐN HỌC Hà Nội – 2019 Cơng trình hồn thành tại: Trường Đại học Khoa học Tự nhiên - ĐHQGHN Người hướng dẫn khoa học: PGS TS Phan Viết Thư Phản biện: Phản biện: Phản biện: Luận án bảo vệ trước Hội đồng cấp Đại học Quốc gia chấm luận án tiến sĩ họp vào hồi ngày tháng năm 2019 Có thể tìm hiểu luận án tại: - Thư viện Quốc gia Việt Nam - Trung tâm Thông tin - Thư viện, Đại học Quốc gia Hà Nội i MỤC LỤC MỤC LỤC i MỞ ĐẦU CHƯƠNG KIẾN THỨC CHUẨN BỊ 1.1 Tích phân ngẫu nhiên 1.2 Phương trình vi phân ngẫu nhiên 1.3 Bài toán thời điểm dừng tối ưu 1.3.1 Khái niệm thời điểm dừng 1.3.2 Bài toán thời điểm dừng tối ưu 1.4 1.5 Mạng nơ-ron 10 1.4.1 Tổng quan mạng nơ-ron 11 1.4.2 Huấn luyện mạng nơ-ron 12 1.4.3 Phương pháp xây dựng mạng nơ-ron MLP 12 Kết luận chương 12 CHƯƠNG THỜI ĐIỂM DỪNG TỐI ƯU CHO BÀI TOÁN QUẢNG CÁO 14 2.1 Mơ hình tốn quảng cáo 14 2.2 Giải phương trình vi phân ngẫu nhiên 15 2.3 Xấp xỉ thời điểm dừng tối ưu mạng nơ-ron 17 2.4 Giải thuật giải toán thời điểm dừng tối ưu 17 2.5 Kết mô 19 2.6 Kết luận chương 19 ii CHƯƠNG THỜI ĐIỂM DỪNG TỐI ƯU CHO BÀI TỐN BÁN TÀI SẢN 21 3.1 Bài tốn bán tài sản tối ưu lời giải 21 3.2 Xấp xỉ thời điểm dừng tối ưu mạng nơ-ron 23 3.3 Kết mô 25 3.4 Kết luận chương 25 KẾT LUẬN 27 CÁC CƠNG TRÌNH KHOA HỌC ĐÃ CÔNG BỐ 28 MỞ ĐẦU Trong lĩnh vực mang tính xác suất ngẫu nhiên thời điểm dừng tối ưu mang ý nghĩa quan trọng Những người chơi trị chơi Poker thường nói "thắng thua việc hồn tồn bình thường, khơng có lạ lẫm Nếu bạn khơng kiểm sốt rủi ro, bạn bị rủi ro kiểm soát" Biết rủi ro khơng thể kiểm sốt, khơng thể dự liệu trước, chi ta cố gắng tránh nó, khơng phải kiểm sốt Việc xác lập thời điểm dừng tối ưu việc làm cần thiết để tránh thất bại nặng nề tình trạng kiểm sốt ưu khơng nằm phía Đặc biệt, "trị chơi kinh tế" chứng khốn, điều hành kinh tế thời điểm dừng tối ưu phải tính tốn cân nhắc thận trọng nên tiếp tục thực biện pháp dài hạn để thu lợi nhuận cao nhất, bền vững lâu dài Những tiến máy tính đầu năm 1950 giúp cho việc mơ hình hóa ngun lý lý thuyết liên quan tới cách thức người suy nghĩ trở thành thực Nathanial Rochester sau nhiều năm làm việc phịng thí nghiệm nghiên cứu IBM có nỗ lực để mơ mạng nơ-ron Trong thời kì tính tốn truyền thống đạt thành công rực rỡ nghiên cứu nơ-ron cịn giai đoạn sơ khai Mặc dù người ủng hộ triết lý “thinking machines” (các máy biết suy nghĩ) tiếp tục bảo vệ cho lập trường Năm 1956 dự án Dartmouth nghiên cứu trí tuệ nhân tạo (Artificial Intelligence) mở thời kỳ phát triển lĩnh vực trí tuệ nhân tạo lẫn mạng nơ-ron Tác động tích cực thúc đẩy quan tâm nhà khoa học trí tuệ nhân tạo q trình xử lý mức đơn giản mạng nơ-ron não người Bài toán thời điểm dừng tối ưu nhiều tác giả xem xét chủ yếu lĩnh vực tài giải thơng qua việc giải phương trình vi phân đạo hàm riêng Trong luận án xem xét cách tiếp cận khác cho toán thời điểm dừng tối ưu tiếp cận học máy Mỗi định dừng hay tiếp tục thời điểm t biểu diễn hàm (gọi hàm định) nhận giá trị tập {0, 1}, giá trị tiếp tục chiến dịch, giá trị dừng lại Chúng tiếp tục xấp xỉ hàm định mạng nơ-ron nhiều lớp Sau huấn luyện mạng nơ-ron, cho liệu qua mạng ta nhận định dừng hay tiếp tục Bố cục luận án: Ngoài phần mở đầu phần kết luận, kiến nghị, Luận án chia thành chương với bố cục sau: Chương KIẾN THỨC CHUẨN BỊ Chương chúng tơi trình bày cách tóm lược số kiến thức giải tích ngẫu nhiên bao gồm tích phân ngẫu nhiên, phương trình vi phân ngẫu nhiên, tốn thời điểm dừng tối ưu Nội dung chương chủ yếu trích dẫn từ tài liệu [0], [0], [0], [0], [0] Trong chương giới thiệu vấn đề mạng nơ-ron, gồm khái niệm mạng nơ-ron nhân tạo, lịch sử phát triển, mơ hình mạng phương pháp xây dựng huấn luyện mạng Trong sâu vào việc xây dựng mạng nơ-ron truyền thẳng MLP thuật toán huấn luyện lan truyền ngược Chương THỜI ĐIỂM DỪNG TỐI ƯU CHO BÀI TOÁN QUẢNG CÁO Trong chương chúng tơi xem xét tốn thực tế xác định thời điểm dừng tối ưu cho chiến dịch quảng cáo Thị phần (tiềm năng) công ty xét sản phẩm A mơ tả phương trình vi phân ngẫu nhiên tác động chiến dịch quảng cáo thông qua truyền thông truyền miệng khách hàng có cơng ty Hàm mục tiêu hàm liên tục xác định thời gian t thị phần đạt chiến dịch quảng cáo Trong chương việc giải mơ hình chúng tơi xem xét cách tiếp cận khác cho tốn thời điểm dừng tối ưu tiếp cận học máy Chương THỜI ĐIỂM DỪNG TỐI ƯU CHO BÀI TOÁN BÁN TÀI SẢN Trong chương chúng tơi xem xét tốn tốn tìm thời điểm dừng tối ưu cho trình bán tài sản với tốc độ tăng giá trình Markov rời rạc hai trạng thái (tăng giá giảm giá) Kết tìm ngưỡng cố định cho trình xác suất hậu nghiệm Nếu trình xác suất hậu nghiệm vượt qua ngưỡng ta định bán tài sản Các kết thu khả quan kiểm tra liệu mô cho thấy tính đắn kết tìm Cũng chương 2, chương xem xét cách tiếp cận khác cho tốn thời điểm dừng tối ưu tiếp cận học máy Xấp xỉ hàm định mạng nơ-ron nhiều lớp, sau huấn luyện mạng nơ-ron, cho liệu qua mạng ta nhận định bán tài sản CHƯƠNG KIẾN THỨC CHUẨN BỊ Chương chúng tơi trình bày cách tóm lược số kiến thức giải tích ngẫu nhiên bao gồm tích phân ngẫu nhiên, phương trình vi phân ngẫu nhiên, tốn thời điểm dừng tối ưu Nội dung chương chủ yếu trích dẫn từ tài liệu [0], [0], [0], [0], [0] 1.1 Tích phân ngẫu nhiên 1.1.1 Tích phân ngẫu nhiên Itơ 1.1.2 Cơng thức Itơ Định lý 1.1 (Công thức Itô) Cho u(t, x) hàm xác định [0, T ] × R có đạo hàm riêng ut , ux , uxx liên tục Cho Xt q trình Itơ với vi phân ngẫu nhiên dXt = f (t, ω)dt + g(t, ω)dWt Khi q trình Yt = u (t, Xt ) q trình Itơ với vi phân ngẫu nhiên dYt = du (t, Xt ) = ut (t, Xt ) + ux (t, Xt ) f (t) + uxx (t, Xt ) g (t) dt +ux (t, Xt ) g(t)dWt Ta viết công thức Itô dạng dễ nhớ sau dYt = ut (t, Xt ) dt + ux (t, Xt ) dXt + uxx (t, Xt ) (dXt )2 tính (dXt )2 ta quy ước (dt)2 = dtdWt = 0, (dWt )2 = dt Ta có cơng thức Itơ suy rộng sau Định lý 1.2 (Công thức Itô mở rộng) Quá trình Yt = u (t, X1 (t), X2 (t), , Xn (t)) trình Itô với vi phân ngẫu nhiên cho n dYt = ut dt + i=1 uxi dXi + n n uxi xj dXi dXj i=1 i=1 tích dXi dXj tính theo quy ước sau (dt)2 = dW dt = dtdW = 0, (dWt )2 = dt Như dXi dXj = gi gj dt n dYt = ut + i=1 uxi fi + n n n uxi xj gi gj dt + i=1 i=1 uxi gi dWt i=1 1.2 Phương trình vi phân ngẫu nhiên Phương trình vi phân ngẫu nhiên đóng vai trị quan trọng kĩ thuật, vật lý, kinh tế số ngành khoa học khác Sự đời xuất phát từ nhu cầu xác định mối quan hệ bên đại lượng biến thiên liên tục với bên độ biến thiên đại lượng Các mối quan hệ xuất thường xuyên ứng dụng thực tế Định lý 1.3 Giả sử hàm b (t, x) σ (t, x) thỏa mãn điều kiện sau |b(t, x)| + |σ(t, x)| ≤ C(1 + |x|), x ∈ R, t ∈ [0, T ] với C số |b(t, x) − b(t, y)| + |σ(t, x) − σ(t, y)| ≤ D|x − y| với D số Gọi Z đại lượng ngẫu nhiên độc lập với Wt , t EZ < ∞ Khi phương trình vi phân ngẫu nhiên dXt = b (t, Xt ) dt + σ (t, Xt ) dWt ; X0 = c (1.1) có nghiệm 1.3 Bài tốn thời điểm dừng tối ưu 1.3.1 Khái niệm thời điểm dừng Lý thuyết Martingale bắt nguồn từ trò chơi cờ bạc trở thành loại trình ngẫu nhiên có nhiều ứng dụng lý thuyết thực tiễn, đặc biệt công cụ thiếu tính tốn ngẫu nhiên tốn học tài Một cơng cụ quan trọng lý thuyết Martingale ứng dụng chúng thời điểm dừng Thí dụ, muốn dừng Martingale trước nhận giá trị lớn Tuy nhiên, dừng nên thực cho đối tượng dừng lại Martingale thực có ý nghĩa quan trọng Cho không gian xác suất đầy đủ (Ω, F, P ), tức F chứa tất tập có xác suất (Tập N gọi tập có xác suất tồn A ∈ F cho N ⊂ A) Một họ Ft , t ∈ R+ σ - trường F gọi lọc Fs ⊂ Ft s < t Lọc Ft , t ∈ R+ gọi liên tục phải với t ∈ R+ F t = F t+ = Fs s>t Để cho gọn nói lọc (Ft ) ta hiểu xét lọc Ft , t ∈ R+ Định nghĩa 1.1 Một hàm T : Ω → [0, ∞) gọi thời điểm Markov lọc (Ft ) F - đo với t ta có {T ≤ t} ∈ Ft (1.2) Nếu P (T < ∞) = (T hữu hạn hầu chắn) thời điểm Markov T gọi 15 công ty giới thiệu khuyến cáo người tiêu dùng chưa phải khách hàng nên khơng nên mua mặt hàng A, biến động khách hàng công ty xác định bởi: dn(t) = E(N − n(t)) + M n(t)(N − n(t)) dt (2.1) E đại diện cho hiệu chiến dịch truyền thông M đại diện cho chất lượng sản phẩm A Đặt X(t) = n(t) N ∈ [0, 1], phương trình (2.1) trở thành dX(t) = E(1 − X(t)) + M N X(t)(1 − X(t)) = E(1 − x(t)) + M N X(t)(1 − X(t)) (2.2) dt Đặt b = M N phân rã E thành hai thành phần, thành phần tất định a thành phần ngẫu nhiên tỉ lệ với a σa Khi phương trình (2.1) trở thành dX(t) = [a(1 − X(t)) + bX(t)(1 − X(t))]dt + σa(1 − X(t))dW (t) (2.3) Giả sử X(t) nghiệm phương trình vi phân (2.3) Gọi F = (Ft )t∈[0,T ] lọc sinh X(t) Xét hàm liên tục g : [0, T ] × R → R, g (t, Xt ) hàm thời gian t thị phần Xt Bài toán đặt cần xác định thời điểm τ ∗ , nghiệm toán sau f (τ ∗ , Xτ ∗ ) = sup E [g (τ, Xτ )] τ τ : Ω → [0, T ] F - thời điểm dừng 2.2 Giải phương trình vi phân ngẫu nhiên Xét phương trình vi phân ngẫu nhiên (2.3) dX(t) = [a(1 − X(t)) + bX(t)(1 − X(t))]dt + σa(1 − X(t))dW (t) 16 Đặt − X(t) = Z(t) ta có −dX(t) = dZ(t) dZ(t) = −Z(t)[a + b(1 − Z(t))]dt + σaZ(t)dW (t) hay dZ(t) = bZ (t) − (a + b)Z(t) dt − σaZ(t)dW (t) (2.4) Để giải phương trình (2.4) ta giải phương trình sau dZ(t) = αZ (t) + βZ(t) dt + λZ(t)dW (t) (2.5) α, β λ tham số trình ngẫu nhiên X(t) Đặt Y (t) = Z −1 (t) = Z (t) Theo cơng thức Itơ ([0]) ta có: dY (t) = − =− Z (t) dZ(t) + Z (t) =− α+ = λ2 Z (t)dt Z (t) αZ (t) + βZ(t) dt + λZ(t)dW (t) + β Z(t) dt − λ2 dt Z(t) λ λ2 dW (t) + dt Z(t) Z(t) λ2 − β λ − α dt − dW (t) Z(t) Z(t) Vì trình ngẫu nhiên Y (t) thỏa mãn phương trình sau: dY (t) = λ2 − β Y (t) − α dt − λY (t) dW (t) (2.6) Phương trình cho (2.6) phương trình vi phân ngẫu nhiên tuyến tính giải Định lý 2.1 Nghiệm phương trình (2.4) có dạng: −1 Z (t) = φ (t) −b Z (0) t ds φ (s) −1 (2.7) 17 φ (t) = exp σ a2 + a + b t + σaW (t) 2.3 Xấp xỉ thời điểm dừng tối ưu mạng nơ-ron N k−1 Định lý 2.2 Đặt Vn = sup Eg (τ, Xτ ), với τn+1 = τ ∈Tn (1 − αj (Xj )) kαk (Xk ) k=n+1 j=n cho trước, tồn hàm αn : R → {0, 1} cho với thời điểm dừng τn = nαn (Xn )+ τn+1 (1 − αn (Xn )) bất đẳng thức sau thỏa mãn Vn − Eg (τn , Xτn ) Vn+1 − Eg (τn+1 , Xτn+1 ) Định lý 2.3 Với n ∈ {0, 1, · · · , N − 1} thời điểm dừng τn+1 ∈ Tn+1 cho trước Khi với số ε > cho trước, tồn hàm n αnθn = I[0,∞) ◦ aθIn ◦ ϕqI−1 ◦ aθI−1 ◦ · · · ◦ ϕq1 ◦ aθ1n (2.8) cho sup E g (n, Xn ) αnθn (Xn ) + g (τn+1 , Xτn+1 ) − αnθn (Xn ) θn ∈Rq sup E [g (n, Xn ) α (Xn ) + g (τn+1 , Xτn+1 ) (1 − α (Xn ))] − α∈M ε N M tập tất hàm đo α : R → {0, 1}, q tổng số tham số hàm αnθn N Hệ 2.1 Thời điểm dừng τ1 ∈ T1 cho τ1 = kαkθk (Xk ) k=1 k−1 − αjθj (Xj ) j=1 thỏa mãn g (τ1 , Xτ1 ) sup E [g (τ, Xτ )] − ε τ ∈T 2.4 Giải thuật giải toán thời điểm dừng tối ưu 18 Thuật toán 2.1 Xấp xỉ lời giải cho toán thời điểm dừng tối ưu INPUT: • Mơ K thể trình X(t) Xtin+1 = Xtin + a − Xtin + bXtn − Xtin (tn+1 − tn ) +σa − Xtin (wtn+1 − wtn ) với i = 1, K ; n = 0, N − • Khởi tạo θN chọn cho αNθN ≡ 1 N θ OUTPUT: θ1 , θ2 , , θN −1 α1θ , α2θ , , αN 1: for n = N − to 2: Ln := 0; Khởi tạo θn,1 ; 3: for j = to Jm n,j n,j n,j n,j 4: Tạo lập mạng nơ-ron Φθ = ψ ◦ aθI ◦ ϕqI−1 ◦ aθI−1 ◦ · · · ◦ ϕq1 ◦ aθ1 ; 5: for i = to K n,j n,j i , xi xin − Φθ xin + g τn+1 6: Tính πni θn,j = g n, xin Φθ τi ; n+1 7: 8: 9: Ln := Ln + πni θn,j ; end for Ln := LKn ; θn,j+1 := θn,j + η∇θ Ln ; 10: 11: end for 12: θn := θn,Jm n n n n 13: Đặt mạng nơ-ron αnθ (x) = I[0,∞) ◦ aθI ◦ ϕqI−1 ◦ aθI−1 ◦ · · · ◦ ϕq1 ◦ aθ1 (x); 14: end for θN 15: Trả θ , θ2 , , θ N −1 α1θ , α2θ , , αN 19 2.5 Kết mơ Hình 2.1: Thời điểm dừng thu τ ∗ = 137; X (τ ∗ ) = 0.321177633918076 2.6 Kết luận chương Trong chương chúng tơi tìm lời giải dạng phương trình vi phân ngẫu nhiên xấp xỉ định dừng tối ưu mạng nơ-ron nhiều lớp thơng qua q trình huấn luyện mạng thực mô Monte-Carlo Chúng chứng minh kết thu từ xấp xỉ mạng nơ-ron sai khác giá trị ε > tùy ý so với giá trị tối ưu lý thuyết Chúng tiến hành mơ q trình ngẫu nhiên thể thị phần sản phẩm cơng ty lấy mục tiêu cực đại thị phần cho chiến dịch quảng cáo Kết cho thấy định thu tiệm cận tới thời điểm tối ưu Tuy nhiên có thực tế đặt để có độ xác cao phải rời rạc hóa trình ngẫu nhiên “mịn” (N tăng) cần nhiều mạng nơ-ron (số lượng mạng nơ ron N ) số tham số mạng phải tăng lên (q tăng dần vô cùng), việc xấp xỉ định 20 nơ-ron nhân tạo cần phải có máy tính tốc độ cao có hệ thống liệu lớn để huấn luyện mạng tốt 21 CHƯƠNG THỜI ĐIỂM DỪNG TỐI ƯU CHO BÀI TOÁN BÁN TÀI SẢN Trong chương chúng tơi xem xét tốn thời điểm dừng tối ưu mơ tả tốn lý tài sản với độ dịch chuyển biến ngẫu nhiên rời rạc kết tìm chiến lược tối ưu để bán tài sản lần giá tài sản rơi vào đường bao tất định phụ thuộc thời gian Hơn nữa, đường bao biểu diễn hàm đơn điệu tăng, liên tục thỏa mãn phương trình tích phân phi tuyến Các kết thu khả quan kiểm tra liệu mơ cho thấy tính đắn kết tìm Cũng chương 2, chương xem xét cách tiếp cận khác cho tốn thời điểm dừng tối ưu tiếp cận học máy Xấp xỉ hàm định mạng nơ-ron nhiều lớp, sau huấn luyện mạng nơ-ron, cho liệu qua mạng ta nhận định bán tài sản 3.1 Bài toán bán tài sản tối ưu lời giải Giả sử giá bán tài sản trình ngẫu nhiên Xt mơ hình hóa chuyển động Brown hình học phương trình dXt = µXt dt + σXt dWt , t ≥ (3.1) {Wt } chuyển động Brown tiêu chuẩn giả sử q trình Xt độc lập với µ không gian xác suất (Ω, F, P ) Chúng ta giả sử độ trượt µ biến ngẫu nhiên nhận hai giá trị µ1 µ2 thỏa mãn điều kiện µ1 < r < µ2 , r ≥ hệ số lãi suất X0 giá tài sản lúc ban đầu Giả sử chủ tài sản muốn bán tài sản khơng biết tốc độ tăng trưởng giá µ1 hay µ2 biết phân bố lúc ban đầu Bảng 3.1 22 Bảng 3.1: Phân bố ban đầu độ trượt µ Xác suất µ1 π µ2 1-π Mục đích chủ sở hữu muốn bán với giá có kỳ vọng cao mục đích toán Về mặt toán học ta ký hiệu FtX t∈[0;∞) σ -trường sinh X chủ sở hữu chọn F X - thời điểm dừng τ với t ∈ [0; ∞) V = sup E e−rτ Xτ (3.2) τ ∈T đạt thời điểm dừng xác định Với t ≥ 0, đặt πt = P µ = µ1 |FtX xác suất có điều kiện mà độ trượt nhận giá trị nhỏ thời điểm t, − πt = P µ = µ2 |FtX Theo Định lý 7.12 Định lý 9.1 [0], trình giá Xt mơ hình hóa phương trình vi phân ngẫu nhiên sau dXt = [µ1 πt + (1 − πt ) µ2 ] Xt dt + σXt dW t trình niềm tin πt thỏa mãn phương trình dπt = −ωπt (1 − πt ) dW t ω = (µ2 − µ1 ) /σ W , F x P - chuyển động Brown định nghĩa dW t = dWt + Hệ 3.1 Đặt φ = π 1−π µ(t) − (1 − πt ) µ2 − πt µ1 dt σ (3.3) Khi hàm giá trị V cho công thức  (C1 φr +C2 φr2 )  x (1+B) ,0 < φ < B r r C1 B +C2 B 1+φ V =  x, φ≥B Hơn nữa, thời điểm dừng τB := inf t ≥ : πt ≥ toán (3.1) B 1+B thời điểm dừng tối ưu 23 3.2 Xấp xỉ thời điểm dừng tối ưu mạng nơ-ron Xét xích Markov rời rạc X = {Xn : n ≥ 0} không gian trạng thái X Mục đích xác định thời điểm dừng τ , để cực đại trung bình hàm thu hoạch sau τ −1 β t c(Xt ) + β τ C(Xτ ) E (3.4) t=0 Trong c : X → R thu hoạch thời kì trung gian, C : X → R thu hoạch trạng thái cuối, β ∈ (0, 1) hệ số chiết khấu Kí hiệu {Fn : n ≥ 0} lọc sinh X Gọi P toán tử biến hàm J thành hàm (P J) xác định (P J)(x) = P (x, dy)J(y) Tính chất Markov cho ta h : X → R E [h (Xt+1 ) |Ft , Xt = x] = P (x, dy)h(y) = (P h)(x) Thời điểm dừng τ : Ω → [0, ∞) biến ngẫu nhiên nhận giá trị ngun khơng âm thỏa mãn tính chất {ω : τ (ω) ≤ t, ω ∈ Ω} ∈ Ft với n ≥ Ta quy ước C (Xτ ) = τ = ∞ Ta xây dựng hàm định φ : X → {0, 1} định nghĩa thời điểm dừng τ φ = {n ≥ : φ (Xn ) = 1} (3.5) Giá trị tối ưu kỳ vọng (3.4) thời điểm dừng với x ∈ X ký hiệu z−1 ∗ z β t c (Xt ) + β z C (Xz ) |X0 = x β c (Xt ) + β C (Xz ) |X0 = x = E h (x) = sup E x z−1 t t=0 t=0 (3.6) Ta định nghĩa toán tử T xác định T h = max{C, c + βP h} 24 Định lý 3.1 Với giả thiết thích hợp, mệnh đề sau đúng: Tồn hàm h∗ ∈ L2 (π) thỏa mãn h∗ = T h∗ Thời điểm dừng τ ∗ xác định τ ∗ = {t|C (xt ) ≥ h∗ (xt )} thời điểm dừng tối ưu h∗ = hτ ∗ Lập hàm Qθ (x) := θT ψ(x), x∈X (3.7) ψ := [ψ1 , , ψd ]T với ψi : X → R, ψi ∈ L2 (π), ≤ i ≤ d hàm sở Thuật toán 3.1 Xấp xỉ lời giải cho toán thời điểm dừng tối ưu INPUT: Khỏi tạo θ0 ∈ Rd OUTPUT: θ = θN 1: repeat 2: Cập nhật vectơ θt+1 = θt + γt+1 ψ (xt ) [c (xt ) + α max {Qs (xt+1 ) , C (xt+1 )} − Qs (xt )] 3: t := t + 1; 4: until t ≥ N Sau có θ τ˜ = t ≥ 0|C (xt ) ≥ Qθ (xt ) xấp xỉ thời điểm dừng τ ∗ 25 3.3 Kết mơ Hình 3.1: Thời điểm bán giá bán tối ưu τB = 1; X (τB ) = 6.98267216610124 3.4 Kết luận chương Trong chương chúng tơi xem xét tốn tìm thời điểm dừng tối ưu cho trình bán tài sản với tốc độ tăng giá trình Markov rời rạc hai trạng thái (tăng giá giảm giá) Kết tìm ngưỡng cố định cho trình xác suất hậu nghiệm Nếu trình xác suất hậu nghiệm vượt qua ngưỡng ta định bán tài sản Các kết thu khả quan kiểm tra liệu mô cho thấy tính đắn kết tìm Cũng chương 2, chương xem xét cách tiếp cận khác cho toán thời điểm dừng tối ưu tiếp cận học máy Xấp xỉ hàm định mạng nơ-ron nhiều lớp, sau huấn luyện mạng nơ-ron, cho 26 liệu qua mạng ta nhận định bán tài sản 27 KẾT LUẬN Những đóng góp luận án: Luận án xem xét hai tốn thực tế là: Bài tốn xác định thời điểm dừng tối ưu cho chiến dịch quảng cáo Thị phần (tiềm năng) công ty xét sản phẩm A mơ tả phương trình vi phân ngẫu nhiên tác động chiến dịch quảng cáo thông qua truyền thông truyền miệng khách hàng có cơng ty Hàm mục tiêu hàm liên tục xác định thời gian t thị phần đạt chiến dịch quảng cáo Bài tốn tìm thời điểm dừng tối ưu cho q trình bán tài sản với tốc độ tăng giá trình Markov rời rạc hai trạng thái (tăng giá giảm giá) Tiến hành giải mơ hình kiểm tra liệu mơ cho thấy tính đắn kết tìm Xem xét cách tiếp cận khác cho toán thời điểm dừng tối ưu tiếp cận học máy 28 CÁC CƠNG TRÌNH KHOA HỌC ĐÃ CƠNG BỐ [CT1] Nguyen Khac Minh, Nguyen Thanh Trung, Pham Van Khanh (2018), “THE OPTIMAL STOPPING TIME FOR SELLING AN ASSET WHEN IT IS UNCERTAIN WHETHER THE PRICE PROCESS IS INCREASING OR DECREASING WHEN THE HORIZON IS INFINITE”, American Journal of Operations Research, 8, pp 82-91 [CT2] Nguyen Thanh Trung (2018), “MODELING ELECTION PROBLEM BY A STOCHASTIC DIFERENTIAL EQUATION”, American Journal of Operations Research, 8, pp 441-447 [CT3] Nguyễn Thành Trung, Phan Viết Thư, Phạm Văn Khánh, “SỬ DỤNG TIẾP CẬN HỌC MÁY ĐỂ XÁC ĐỊNH THỜI ĐIỂM DỪNG TỐI ƯU CHO MỘT CHIẾN DỊCH QUẢNG CÁO”, Tạp chí Ứng dụng Tốn học, (đã nhận đăng) 29 ... Kết luận chương 19 ii CHƯƠNG THỜI ĐIỂM DỪNG TỐI ƯU CHO BÀI TOÁN BÁN TÀI SẢN 21 3.1 Bài toán bán tài sản tối ưu lời giải 21 3.2 Xấp xỉ thời điểm dừng tối ưu. .. BỊ 1.1 Tích phân ngẫu nhiên 1.2 Phương trình vi phân ngẫu nhiên 1.3 Bài toán thời điểm dừng tối ưu 1.3.1 Khái niệm thời điểm dừng ... CHUẨN BỊ Chương trình bày cách tóm lược số kiến thức giải tích ngẫu nhiên bao gồm tích phân ngẫu nhiên, phương trình vi phân ngẫu nhiên, toán thời điểm dừng tối ưu Nội dung chương chủ yếu trích

Ngày đăng: 26/05/2021, 23:46