Phân tích dữ liệu đa biến và một số ứng dụng

122 32 0
Phân tích dữ liệu đa biến và một số ứng dụng

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

ĐẠI HỌC QUỐC GIA TP HỒ CHÍ MINH TRƯỜNG ĐẠI HỌC BÁCH KHOA LÊ HUỲNH NHƯ PHÂN TÍCH DỮ LIỆU ĐA BIẾN VÀ MỘT SỐ ỨNG DỤNG Chuyên ngành : TOÁN ỨNG DỤNG Mã số: 60460112 LUẬN VĂN THẠC SĨ TP HỒ CHÍ MINH - Tháng năm 2018 ĐẠI HỌC QUỐC GIA TP HỒ CHÍ MINH TRƯỜNG ĐẠI HỌC BÁCH KHOA LÊ HUỲNH NHƯ PHÂN TÍCH DỮ LIỆU ĐA BIẾN VÀ MỘT SỐ ỨNG DỤNG Chuyên ngành : TOÁN ỨNG DỤNG Mã số: 60460112 LUẬN VĂN THẠC SĨ TP HỒ CHÍ MINH - Tháng năm 2018 CƠNG TRÌNH ĐƯỢC HOÀN THÀNH TẠI TRƯỜNG ĐẠI HỌC BÁCH KHOA –ĐHQG -HCM Cán hướng dẫn khoa học : TS Nguyễn Tiến Dũng Cán chấm nhận xét : PGS TS Nguyễn Bích Huy Cán chấm nhận xét : TS Nguyễn Bá Thi Luận văn thạc sĩ bảo vệ Trường Đại học Bách Khoa, ĐHQG Tp HCM ngày 17 tháng 07 năm 2018 Thành phần Hội đồng đánh giá luận văn thạc sĩ gồm: Chủ tịch: PGS TS Nguyễn Đình Huy Thư ký: TS Đặng Văn Vinh Phản biện 1: PGS TS Nguyễn Bích Huy Phản biện 2: TS Nguyễn Bá Thi Ủy viên: PGS TS Nguyễn Huy Tuấn Xác nhận Chủ tịch Hội đồng đánh giá LV Trưởng Khoa quản lý chuyên ngành sau luận văn sửa chữa (nếu có) CHỦ TỊCH HỘI ĐỒNG PGS.TS NGUYỄN ĐÌNH HUY TRƯỞNG KHOA PGS.TS HUỲNH QUANG LINH ĐẠI HỌC QUỐC GIA TP.HCM CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM TRƯỜNG ĐẠI HỌC BÁCH KHOA Độc lập - Tự - Hạnh phúc NHIỆM VỤ LUẬN VĂN THẠC SĨ Họ tên học viên: Lê Huỳnh Như Ngày, tháng, năm, sinh: 03/09/1987 MSHV: 7140275 Nơi sinh: Long An Chuyên ngành: Toán Ứng Dụng Mã số: 60460112 I TÊN ĐỀ TÀI: PHÂN TÍCH DỮ LIỆU ĐA BIẾN VÀ MỘT SỐ ỨNG DỤNG II NHIỆM VỤ VÀ NỘI DUNG: - Kiến thức chuẩn bị - Phân tích liệu đa biến - Ứng dụng III NGÀY GIAO NHIỆM VỤ: 15/01/2018 IV NGÀY HOÀN THÀNH NHIỆM VỤ: 17/06/2018 V CÁN BỘ HƯỚNG DẪN: TS NGUYỄN TIẾN DŨNG Tp HCM, ngày 17 tháng năm 2018 CÁN BỘ HƯỚNG DẪN CHỦ NHIỆM BỘ MƠN ĐÀO TẠO TS NGUYỄN TIẾN DŨNG PGS.TS NGUYỄN ĐÌNH HUY TRƯỞNG KHOA PGS.TS HUỲNH QUANG LINH LỜI CẢM ƠN Luận văn thực Trường Đại học Bách Khoa Tp.HCM hướng dẫn Thầy TS Nguyễn Tiến Dũng Trước hết, tơi xin bày tỏ lịng biết ơn sâu sắc đến Thầy - người động viên hết lịng hướng dẫn tơi hồn thành luận văn Tôi xin chân thành cảm ơn q thầy giáo mơn Tốn Ứng Dụng khoa Khoa học Ứng Dụng giảng dạy nhiệt tình, cung cấp kiến thức cho tơi q trình học tập trường Tơi xin chân thành cảm ơn Phịng đào tạo Sau đại học Trường Đại học Bách Khoa Tp.HCM tạo điều kiện thuận lợi để tơi hồn thành chương trình đào tạo an tâm học tập trường Cuối cùng, xin gửi lời cám ơn đến gia đình, bạn bè, người ln bên tơi, động viên khuyến khích tơi hồn thành luận văn Tôi xin chân thành cảm ơn! Tp.HCM, ngày 17 tháng năm 2018 Học viên thực Lê Huỳnh Như TÓM TẮT LUẬN VĂN Luận văn bao gồm chương Chương trình bày khái niệm Chương trình bày cách phân tích mơ hình hồi quy tuyến tính đa biến ứng dụng Chương trình bày mơ hình copula ứng dụng ABSTRACT The thesis contains three chapters Chapter presents the basic concept Chapter presents the multivariate linear regression analysis and application Chapter presents the copula model and application LỜI CAM ĐOAN Tôi tên Lê Huỳnh Như, MSHV: 7140275, học viên cao học chuyên ngành Toán ứng dụng Trường Đại học Bách Khoa TP.HCM khóa 2014 Tơi xin cam đoan rằng, ngoại trừ kết tham khảo từ cơng trình khác ghi rõ luận văn, cơng việc trình bày luận văn tơi thực hướng dẫn TS Nguyễn Tiến Dũng Tp.HCM, ngày 17 tháng năm 2018 Học viên thực Lê Huỳnh Như Mục lục Mở đầu 11 Bảng ký hiệu 13 Kiến thức chuẩn bị 14 1.1 Hiệp phương sai biến ngẫu nhiên hai chiều 14 1.2 Tương quan biến ngẫu nhiên hai chiều 15 1.3 Ma trận hiệp phương sai 15 1.4 Ma trận tương quan 16 Mơ hình hồi quy tuyến tính đa biến 2.1 Phân tích tương quan tuyến tính (Linear Correlation) 18 2.1.1 Đồ thị phân tán 18 2.1.2 Hệ số tương quan tập hợp (The Population Correlation 18 2.1.3 Hệ số tương quan mẫu 19 2.1.4 Kiểm định giả thuyết ρ 20 Phân tích nhân tố 20 2.2.1 Mơ hình EFA 20 2.2.2 Các bước thực EFA 21 2.2.3 Kích thước mẫu 21 2.2.4 Kiểm tra độ tin cậy thang đo hệ số Cronbach’s alpha 22 2.2.5 Điều kiện để áp dụng EFA 23 Coefficient) 2.2 18 2.3 2.4 2.2.6 Hệ số tải nhân tố 24 2.2.7 Loại bỏ biến xấu 24 Hồi quy tuyến tính đa biến 25 2.3.1 Hàm hồi quy tổng thể 25 2.3.2 Các giả thuyết 26 2.3.3 Ước lượng tham số 26 2.3.4 Hệ số xác định hồi quy bội 28 2.3.5 Ma trận tương quan 29 2.3.6 Ma trận hiệp phương sai 30 2.3.7 Khoảng tin cậy kiểm định giả thiết 30 2.3.8 Hiện tượng đa cộng tuyến 32 Ứng dụng mơ hình hồi quy tuyến tính đa biến để đánh giá hài lòng học sinh khối 12 năm học 2017 - 2018 trường THPT Gò Đen, Bến Lức, Long An 35 2.4.1 Giới thiệu trường THPT Gò Đen, Bến Lức, Long An 35 2.4.2 Quy trình nghiên cứu 36 2.4.3 Nghiên cứu định tính 36 2.4.4 Nghiên cứu định lượng 36 2.4.5 Bảng khảo sát 37 2.4.6 Kết sau chạy hồi quy đa biến 46 Mơ hình copula 3.1 3.2 63 Một vài định nghĩa tính chất Copula 63 3.1.1 Các hàm phân phối đồng thời Fréchet - Hoeffding 68 3.1.2 Copula biến ngẫu nhiên 71 Các khái niệm phụ thuộc 73 3.2.1 Tương quan tuyến tính 73 3.2.2 Độ đo tương thích 74 3.2.3 Độ đo phụ thuộc 77 3.2.4 3.3 3.4 3.5 Những khái niệm phụ thuộc khác 78 Sơ lược hàm copula 82 3.3.1 Phân phối elliptic 82 3.3.2 Copula liên quan đến phân phối elliptic 83 3.3.3 Copula Archimedean 87 3.3.4 Giá trị cực trị copula 88 Các kết luận thống kê copula 90 3.4.1 Kỹ thuật mô 90 3.4.2 Ước lượng không tham số 91 3.4.3 Ước lượng tham số 93 Ứng dụng copula đo lường rủi ro tài 98 3.5.1 Tổn thất tổng hợp phân tích giá trị rủi ro 98 3.5.2 Giá trị cực trị nhiều chiều rủi ro thị trường 105 3.5.3 Tần số tương quan tính tốn rủi ro 117 Kết luận 120 Lý lịch trích ngang 122 10 Để cực trị copula, ta sử dụng phụ thuộc độ đo A(ω) đơn giản: τ = I (1 − ω)d ln A(ω) δ = 12 I [A(ω)+1] dω − (3.114) Khi cực trị độc lập, có A(ω) = 1, (α = cho copula Gumbel) τ = δ = Trường hợp phụ thuộc đầy đủ tương ứng A(ω) = max(ω, 1−ω) dẫn ln u1 đến copula Fréchet hay C(u1 , u2 ) = exp ln(u1 , u2 ) max( ln(u , ln u2 ) = ,u2 ) ln(u1 ,u2 ) min(u1 , u2 ) Phương trình (3.112) sử dụng để kiểm tra độc lập cực trị Ví dụ −α − α1 xét copula Kimeldorf - Sampson C(u1 , u2 ) = (u−α với + u2 − 1) α ≥ 0, có 1−C((1−u)ω ,(1−u)1−ω ) u u→0 = lim u+0(u) = 1 u→0 lim −α(1−ω) 1−((1−u)−αω +(1−u) u u→0 = lim −1)− α 1−(1+αu+0(u))− α u u→0 = lim A(u) dần đến 1, copula Kimeldorf - Sampson thuộc miền C ⊥ d Họ tham số copula cực trị Các tham số copula đóng vai trị chính, bảng sau bao gồm nhiều cực trị copula hàm phụ thuộc: với ϑ(u1 , u2 ; α) = Φ α u1 + 21 α ln ln ln u2 ξ(ω, α) = Φ Hàm phụ thuộc có đồ thị hình 3.2 Hình 3.2: Hàm phụ thuộc A(ω) 108 α ln ω + 12 α ln ln(1−ω) Chúng ta ý copula có tính chất đối xứng, biến ngẫu nhiên tỉ giá đối hoái mà giả định Chúng ta dùng kỹ thuật không đối xứng Giả sử A1 A2 hai hàm phụ thuộc (p1 , p2 ) ∈ [0, 1]2 Ta xác định hàm phụ thuộc A: p1 ω p1 ω+p2 (1−ω) + (1−p1 )ω ω))A2 (1−p1 )ω+(1−p )(1−ω) A(ω) = (p1 ω + p2 (1 − ω))A1 ((1 − p1 )ω + (1 − p2 )(1 − (3.115) p1 = p2 = p, thu A(ω) = pA1 (ω)+(1−p)A2 (ω) Trường hợp này, copula xác định đối xứng Với hàm phụ thuộc A1 A2 Gumbel tích copula, thu được: α α α α +pα (1−ω) ] ω)) [p1(pω1 ω+p (1−ω)) A(ω) = (p1 ω + p2 (1 − +((1 − p1 )ω + (1 − p2 )(1 − ω)) = [pα1 ω α + pα2 (1 − ω)α ] α + (p2 − p1 )ω + (1 − p2 ) (3.116) Dẫn đến copula tương ứng cho bởi: C(u1 , u2 ) = exp −(pα1 u˜α1 + pα2 u˜α2 ) α − (1 − p1 )˜ u1 − (1 − p2 )˜ u2 = C G (up11 , up22 )C ⊥ (u1−p , u1−p ) (3.117) Hệ thức (3.117) tổng quát thu liên kết với (3.115): C(u1 , u2 ) = C1 (up11 , up22 )C2 (u1−p , u1−p ) (3.118) Chẳng hạn, copula Marshall - Olkin tổ hợp tích copula copula Fréchet trên: C(u1 , u2 ) = C ⊥ (u1−α , u1−α )C + (uα1 , uα2 ) (3.119) Chúng ta thu hàm phụ thuộc là: α2 (1−ω) α1 ω , ) A(ω) = (α1 ω + α2 (1 − ω)) max( (α1 ω+α (1−ω)) (α ω+α 2 (1−ω)) +((1 − α1 )ω + (1 − α2 )(1 − ω)) = max(1 − α1 ω, − α2 (1 − ω)) (3.120) ý giới hạn để α tiến đến ∞ copula logistic không đối xứng Bây xét trường hợp nhiều chiều, ta bắt đầu với copula Gumbel, cách tổng quát tự nhiên N > xác định bởi: C(u1 , , un , , uN ) = exp[−(˜ uα1 + + u˜αn + ˜ uαN ) α ] Hàm phụ thuộc tương ứng B(ω) = N α n=1 ωn α (3.121) Đầu tiên tổng quát hóa dẫn đến copula Archimedean, nhiên khơng liên quan gì, 109 mở rộng phân phối nhiều chiều tham số hóa đơn Phần dư N (N2−1) giống tất lề hai chiều Có thể mởα rộng phương pháp đa hợp, chẳng 1 hạn, C(u1 , u2 , u3 ) = exp[−((˜ uα1 + u˜α2 ) α2 + u˜α3 ) α1 ] cực trị copula α1 α2 > α1 ≥ Hàm phụ thuộc B(ω) = ((ω1α2 + ω2α2 ) α2 + ω3α1 ) α1 Tuy nhiên, tham số khó thực tổng quát thứ hai Các phương pháp ước lượng a Phép xấp xỉ không tham số U1 −1 Xét phân phối Z = ln Uln1 +ln U2 thỏa mãn F (z) = z + (1 − z)A (z)∂z A(z), hai phân phối đồng thời U1 U2 xác định cực trị copula u1 C∗ (u1 , u2 ) = exp[ln(u1 , u2 )A( ln uln1 +ln u2 )] Bởi vì, A(0) = A(1) = 1, trở ω thành A(ω) = exp F (z)−z 1−z d(z) A(ω) = exp ω F (z)−z 1−z d(z) Chúng ta thu hai ước lượng không tham số A(ω) phân phối thực nghiệm Fˆ lý thuyết phân phối F Sử dụng hệ thức (3.112), xét ước lượng khác dựa sở mẫu biến ban đầu (X1 , X2 ), không mẫu biến cực đại (X1+ , X2+ ) b Phép xấp xỉ tham số Trong dạng toán cực đại theo điểm, Phân phối G ứng dụng phương pháp M L G(X1+ , , Xn+ , , XN+ ) = C∗ (G1 (X1+ ), , Gn (Xn+ ), , GN (XN+ )) (3.122) C∗ copula cực trị Gn GEV phân phối GEV (µ, σ, ξ) xác định bởi: x−µ ξ )] (x) = exp −[1 + ξ( σ (3.123) xác định giá ∆ = {x : + ξ( x−µ σ )} Ba kiểu phân phối chiều không tham số tổ hợp họ giá trị cực trị tổng quát có tương ứng ξ = α−1 > 0, ξ = −α−1 < ξ → cho phân phối liên quan Fréchet, Weibull, Gumbel Phương pháp IF M CM L sử dụng ước lượng tham số (3.112) để rút gọn thời gian tính tốn Trong trường hợp này, log - hợp lý lề chiều là: l(Xn+ ; θ) 1+ξ Xn+ − µ Xn+ − µ − 1ξ = − ln σ − ( ) ln(1 + ξ( )) − [1 + ξ( )] ξ σ σ (3.124) 110 Một điểm quan trọng liên quan đến giá trị ban đầu ước lượng copula Ta thu nghịch đảo phụ thuộc tiêm cận đuôi tương thích độ đo τ Kendall c Phép xấp xỉ trình điểm Thay sử dụng cực đại theo điểm, phép xấp xỉ theo điểm có ảnh hưởng tới liệu tần suất lớn Quá trình điểm cách tự nhiên để thực ước lượng Giả sử {(X1,t , , Xn,t , , XN,t ), t = 1, , T } mẫu thời điểm T với phân phối lề Fn biến đổi Fréchet Yn,t biến Xn,t Yt tương ứng véctơ (Yn,t )N Chúng ta xét trình điểm Nt = (Y1 , , YT ) N R+ Dưới vài giả thiết, NT hội tụ tới trình Poisson N với độ đo Λ, mà thỏa mãn tính chất Λ([0, y]c ) = tΛ([0, ty]c ) với N [0, y]c = R+ \[0, y] Chúng ta có P { T1 Yt ∈ / [0, y]c } → exp(−Λ([0, y]c )) Hàm log - hợp lý là: T c l(θ) = −Λ([0, y] ) + t=1 1[ yt ∈[0,y]c ] λ( yt ) T T (3.125) N c với hàm λ liên kết cường độ xác định λ(y) = (−1)N ∂y(1), ,y(N ) Λ([0, y] ) với y = y(1), , y(N ) yt , t = 1, , T mẫu quan sát liệu trình Yt Bằng giả thiết đuôi Xn Pareto GP (σn , ξn ), biến đổi Fréchet từ dạng: yn,t = −1 t− n (xn , t) = − ln (Fn (xn , t)) t+ n (xn , t) = − ln(1 − (1 − (Fn (xn ))(1 + − 1ξ n −1 ξn ( (xn ,t)−x )) + ) σn x ≤x xn,t > xn Thật n,t n hàm log - hợp lý trở thành: T c l(θ) = −Λ([0, y] ) + t=1 1[ yt ∈[0,y]c ] [λ( yt )ςt ] T T (3.126) − c với [0, y]c = ([0, t− (x1 )] × × [0, tN (xN )] ) ςt = T N 1+ξn 1 (1 − Fn (x, t))−ξn yn,t (1 − exp(− )) exp( ) σ y y n n,t n,t n=1 (3.127) Lựa chọn Λ để làm thành lớp cực trị copula với Λ([0, y]c ) = − ln C(exp(− 1 ), , exp(− ), , exp(− )) y(1) y(n) y(N ) 111 (3.128) Ứng dụng với liệu LME Chúng ta ước lượng phân phối GEV cho cực đại cực tiểu Đối ngược với cực tiểu −X − , thu ước lượng tham số sau: Tham số Al Al - 15 Cu Ni Pb µ 0.022 0.018 0.028 0.031 0.033 σ 0.007 0.006 0.013 0.012 0.012 ξ 0.344 0.275 0.095 0.363 0.424 Phân phối tương ứng biểu đồ hình 3.3, sử dụng giá trị ước lượng xây dựng chương trình kiểm tra ứng xuất chiều cách lựa chọn trường hợp xấu tương lai cho chu kỳ chuỗi thời gian (Legras [1999]) Thời gian chờ (trong năm) Al Al - 15 -6.74 -4.82 10 -8.57 -5.90 25 -11.75 -7.68 50 -11.91 -9.36 75 -17.14 -10.49 100 -18.92 -11.38 Cu -8.03 -9.35 -11.23 -12.76 -13.70 -14.39 Ni -11.01 -14.27 -20.02 -25.83 -29.97 -33.29 Pb -12.25 -16.35 -23.96 -32.03 -37.97 -42.85 Bảng 3.5: Mức biến thiên cho vị trí dài Trong trường hợp cực đại X + , thu kết sau: Tham số Al Al - 15 Cu Ni Pb µ 0.024 0.018 0.029 0.034 0.032 σ 0.010 0.008 0.011 0.015 0.011 ξ 0.188 0.229 0.142 0.026 0.405 Thời gian chờ (trong năm) Al Al - 15 6.96 5.79 10 8.53 7.10 25 10.46 9.20 50 12.32 11.12 75 13.52 12.39 100 11.43 13.38 Cu 7.53 8.82 10.73 12.34 13.36 14.12 Ni 8.46 9.59 11.10 12.26 12.95 13.45 Bảng 3.6: Mức biến thiên cho vị trí ngắn 112 Pb 11.13 14.65 21.07 27.76 32.64 36.63 Chúng ta xét trường hợp hai chiều, giả định hàm phụ thuộc cho copula Gumbel Sử dụng phương pháp IF M , giá trị ước lượng tham số α tương ứng ứng với τ Kendall xác định với bảng 3.6 Hơn có báo cáo tỷ lệ hợp lý khơng chứa giả thiết tích copula Với mức tin cậy 99%, không bác bỏ phụ thuộc copula cực đại (Al, Cu), (Al,Pb), (Al - 15, Cu), (Al - 15, Ni), (Al - 15, Pb), (Cu,Ni),(Cu,Pb) (Ni,Pb) Đối với cực tiểu, phụ thuộc không bác bỏ cho (Al, Al - 15), (Al, Ni), (Al, Pb), (Al - 15, Ni) (Ni,Pb) Hình 3.3: Mật độ GEV cho cực tiểu Hình 3.4: Mật độ GEV cho cực đại Chú ý 3.8 Chúng ta quan sát trường hợp đối lập cực đại cực tiểu, cực tiểu xuất nhiều cực đại Quan điểm kinh tế, phương pháp thị trường "bear" khả quan thị trường "bull" Thị trường bull: theo chiều giá lên, dạng thị trường tài mà giá loại chứng khốn (chủ yếu cổ phiếu) tăng nhanh mức bình quân lịch sử chúng, thời gian dài (vài tháng) với lượng mua bán lớn Thị trường bear: ngược lại với thị 113 trường bull, giá loại chứng khoán giảm cách đột ngột, liên tục kéo dài Al - 15 Cu Ni Pb Al 0.668 0.061 0.226 0.104 Al - 15 0.039 0.149 0.032 Cu 0.097 0.104 Ni 0.162 Bảng 3.7: Ước lượng hai chiều Trường hợp hai chiều dạng " diện tích hỏng", tức xác suất là: P {X1+ > X1 , X2+ > X2 } = − P {X1+ ≤ X1 } − P {X2+ ≤ X2 } + P {X1+ ≤ X1 , X2+ ≤ X2 } = − F1 (X1 ) − F2 (X2 ) + C(F1 (X1 ), F2 (X2 )) = C(F1 (X1 ), F2 (X2 )) với C hàm sống sót đồng thời, giả sử T thời gian chờ Diện tích hỏng xác định {(X1 , X2 ) ∈ R2 |u1 = F1 (X1 ), u2 = F2 (X2 ), C(F1 (X1 ), F2 (X2 )) < 1t } Chúng ta có biểu diễn hình 3.5 3.6 diện tích hỏng (Al, Al - 15) (Al, Cu) cực đại, trường hợp hai chiều cho danh mục đầu tư ngắn hai lợi suất tài sản Chúng ta thấy hai hình có kết khác giá trị tham số α 114 Chú ý phương pháp luận bao gồm danh mục dài cho lợi nhuận thứ hai Bằng tính tốn diện tích hỏng cho bốn góc phần tư, thu hình 3.7 cho cặp (Al, Al - 15) Giả định chu kỳ lợi nhuận tài sản năm, diện tích hỏng so sánh trường hợp độc lập Hình 3.5: Diện tích hỏng (Al, Al - 15) cực đại Hình 3.6: Diện tích hỏng (Al, Cu) cực đại 115 Hình 3.7: Diện tích hỏng cặp (Al, Al - 15) thời gian chờ năm Chúng ta ý mơ hình giá trị cực trị nhiều chiều, đầu tiên, copula Gumbel lựa chọn tốt Đôi xuất copula không đối xứng thích hợp, chẳng hạn copula khơng đối xứng logistic tốt cho cặp cực tiểu (Al, Al - 15) (hình 3.8) Hình 3.8: Ước lượng M L copula logistic không đối xứng cho cặp cực tiểu (Al, Al - 15) Mở rộng copula nhiều chiều tổng quát việc gộp lại phương pháp, bao gồm vài giới hạn cấu trúc phụ thuộc Chúng ta xét mơ hình cặp cực đại, với kết hai chiều giả định copula nhiều α α2 α2 α21 N chiều có dạng C (u1 , u2 , u3 , u4 , u5 ) = exp[−((˜ u1 + u˜2 ) + u˜α4 ) α1 − u˜3 − u˜5 ] Ước lượng M L α ˆ = 1.049 α ˆ = 3.943 kiểm định giả thiết LR tích copula bác bỏ Tuy nhiên, copula bao gồm phân phối lề hai chiều 116 (Al, Ni) (Al, Al - 15) C N (u1 , 1, 1, u4 , 1) = exp[−(˜ uα1 + u˜α4 ) α1 ] C N (1, u2 , 1, u4 , 1) = exp[−(˜ uα2 + u˜α4 ) α1 ], cấu trúc phụ thuộc (Al, Ni) (Al, Al - 15) phải Điều kéo theo trực tiếp phương pháp luận copula đa hợp 3.5.3 Tần số tương quan tính tốn rủi ro Phương pháp luận để tính tốn rủi ro xác định kiện sau: • Giả sử ξ biến ngẫu nhiên mô tả tổn thất Chúng ta định nghĩa ξ (t) trình ngẫu nhiên ξ cho tính tốn rủi ro k(k = 1, K) k • Mỗi rủi ro, giả thiết số biến cố thời gian t biến ngẫu nhiên Nk (t) • Quá trình tổn thất σ(t) định nghĩa sau: K σ(t) = k=1 K Nk (t) = k=1 j=1 σ k (t) (3.129) ξjk (t) • Vốn tài với mức tin cậy α thường xác định sau: EC = F−1 (α) (3.130) Nếu phương pháp luận đơn giản, nhiều vấn đề nảy sinh thực tiễn Một vấn đề khác tính toán rủi ro: tương quan tần số kiểu rủi ro khác E[Nk1 (t)Nk2 (t)] = E[Nk1 (t)] × E[Nk2 (t)] (3.131) Nk (t) giả thiết chung từ biến ngẫu nhiên Poisson P với giá trị trung bình λk Ý tưởng mở rộng phân phối Poisson nhiều chiều (Johnson, Kotz Balakrishnan [1997]) Giả sử N11 , N12 N22 ba biến ngẫu nhiên Poisson độc lập với giá trị trung bình λ11 , λ12 λ22 Trong trường hợp hai chiều, phân phối đồng thời dựa biến N1 = N11 + N12 N2 = N22 + N12 Chúng ta có N1 ∼ P (λ1 = λ11 + λ12 ) N2 ∼ P (λ2 = λ22 + λ12 ) Tuy nhiên xác suất đồng 117 thời là: min(n1 ,n2 ) P (N1 = n1 , N2 = n2 ) = n=0 λn111 −n λn122 −n λn12 e−(λ11 +λ12 +λ22 ) (n1 − n)!(n2 − n)!n! (3.132) Tương quan Pearson N1 N2 ρ = λ12 [(λ11 + λ12 )(λ22 + λ12 )]− trở thành λ11 + λ12 , λ22 + λ12 ρ = 0, λ22 + λ12 λ11 + λ12 (3.133) Với cấu trúc có phụ thuộc dương Trong hoạt động rủi ro, tương đương với hai rủi ro làm ảnh hưởng tới đặc trưng hệ thống rủi ro Tuy nhiên, người chịu trách nhiệm rủi ro hoạt động ngân hàng có kinh nghiệm với cách tiếp cận quen thuộc với khái niệm tương quan Sử dụng phép xấp xỉ này, ta làm nghịch đảo hệ thức trước Trong trường hợp có: √ λ12 = ρ λ1 λ√ (3.134) λ11 = λ1 − ρ√λ1 λ2 λ22 = λ2 − ρ λ1 λ2 Trong trường hợp K - chiều, có tổng quát hóa trường hợp - chiều cách xét K biến ngẫu nhiên độc lập phân phối Poisson Tuy nhiên, tương ứng với phân phối Poisson nhiều chiều khơng dễ dàng tính tốn hệ số tương quan phức tạp Một khả sử dụng copula C , trường hợp hàm khối lượng xác suất cho mật độ Radon - Nikodym hàm phân phối: P {N1 = n1 , , Nk = nk , , NK = nK } = 2 i1 =1 i1 + +iK (−1) iK =1 n1 C( n=0 n+1−i1 −λ e λ1 n! nK , , n=0 n+1−iK −λ e K λK n! ) (3.135) Giả định copula Gauss, ý phân phối P (λ, ρ) Poisson nhiều chiều tạo thành copula Gauss với tham số ρ phân phối Poisson chiều P (λk ) Chúng ta ý tham số copula Gauss ρ không ma trận tương quan Pearson, chúng kín (hình 3.9) Vốn kinh tế với mức tin cậy α cho hoạt động rủi ro tính giả thiết N = {N1 , , Nk , , NK } phân phối Poisson nhiều chiều P (λ, ρ) Hơn nữa, tính khơng khó, ước lượng tham số λ ρ không phức tạp phân phối dễ dàng thu với phương pháp Monte Carlo 118 Hình 3.9: Hệ thức tham số copula tương quan Pearson 119 KẾT LUẬN Luận văn trình bày số kiến thức liên quan đến phân tích liệu đa biến số ứng dụng Trong chương luận văn, tác giả trình bày phương pháp phân tích hồi quy tuyến tính đa biến Phương pháp đơn giản mang lại hiệu cao phân tích số liệu Ứng dụng phương pháp hồi quy đa biến dùng để đánh giá hài lòng học sinh khối 12 năm học 2017 - 2018 trường Trung học phổ thơng Gị Đen, ngơi trường mà tác giả công tác Kết nghiên cứu tìm nhân tố tác động lớn đến việc đánh giá hài lòng học sinh học trường là: Đội ngũ giáo viên nhiệt tình cơng tác, tận tâm với nghề; Chương trình đào tạo sở vật chất; Việc hỗ trợ học sinh kịp thời giáo viên, công nhân viên trường học Trong chương luận văn, tác giả trình bày mơ hình copula: phân tích ứng dụng Copula khái niệm cịn mẽ có tài liệu tham khảo nó, sách tham khảo Tiếng Việt Đối với ứng dụng copula tổn thất tổng hợp phân tích giá trị rủi ro, giá trị cực trị nhiều rủi ro thị trường, tần số tương quan giá trị rủi ro; tác giả dừng lại phương pháp luận • Hạn chế hướng phát triển nghiên cứu Như đề tài nghiên cứu nào, nghiên cứu có hạn chế đề xuất hướng nghiên cứu tiếp theo: Thứ nhất, nghiên cứu tập trung nghiên cứu phạm vi hẹp đánh giá hài lịng học sinh trường Trung học phổ thơng Gị Đen Do để khái qt cao ví dụ trường phổ thơng tồn tỉnh Long An hay nước cần có nghiên cứu lặp lại Đây hướng cho nghiên cứu Thứ hai, nghiên cứu đánh giá thang đo phương pháp hệ số tin cậy Cronbach Alpha phương pháp phân tích nhân tố khám phá EFA, mơ hình lý thuyết kiểm định phương pháp phân tích hồi qui tuyến tính bội Để đo lường, đánh giá thang đo kiểm định mơ hình lý thuyết tốt cần sử dụng phương pháp, công cụ đại Thứ ba, ứng dụng copula dừng lại phương pháp luận, chưa có ứng dụng cụ thể Hướng tới tác giả tiếp tục nghiên cứu để phát triển thành ứng dụng thực tế Do thời gian trình độ cịn hạn chế, chắn luận văn tránh khỏi thiếu sót, kính mong nhận góp ý q thầy, bạn bè để luận văn hồn thiện Xin chân thành cảm ơn! 120 Tài liệu tham khảo [1] Alvin C Rencher, William F Christensen, Methods of multivariate analysis, Interscience publication, 2012 [2] Carey V, Rosner B, Analysis of longitudinally observed irregularly timed multivariate outcomes: regression with focus on cross-component correlation, Stat Med, 2001 [3] Davidson R, Mackinnon J, Estimation and inference in Econometrics, Oxford, 1993 [4] Eric Bouyé, Copulas for Finance: A Reading Guide ans some Applications, London, 2000 [5] Genest C, Mackay J, The joy of copulas: Bivariate distributions with uniform marginals, American Statistician, 1986 [6] Genz A, Bretz F, Numerical computation of multivariate t - probabilities, Washington State University, 1999 [7] Hoàng Trọng, Chu Nguyễn Mộng Ngọc, Phân tích liệu nghiên cứu với SPSS, tập I, II, NXB Hồng Đức, 2005 [8] Joe H, Multivariate models and dependence concepts, London, 1997 [9] Jorgensen B, Lauritzen S.L, Multivariate dispersion models, Research Report, 1998 [10] Nelsen R, An introduction to copulas, New York, 1998 [11] Sklar, Fonctions de repartition an dimensions et leurs marges, Publications de I’Institut de Statistique de I’Université de Paris, 1959 [12] Song P, Multivariate dispersion models generated from Gaussian copula , Zurich, 2000 [13] Verbeke, Fieuws, Molenberghs, Davidian, The analysis of multivariate longitudinal data: A review, New York, 2014 [14] Verbeke G, Molenberghs G, Linear mixed models for longitudinal data Springer Series in Statistics, New York, 2000 [15] Verzani J, Simple R – Using R for Introductory Statistics, New York, 2005 [16] Wang S.S, Aggregation of correlated risk portfolios: models and algorithms, CAS Committee on Theory of Risk, 1999 121 LÝ LỊCH TRÍCH NGANG Họ tên: Lê Huỳnh Như Ngày, tháng, năm sinh: 03/09/1987 Nơi sinh: Long An Địa liên lạc: 17/2 Nguyễn Hữu Thọ, Khu phố 3, Thị trấn Bến Lức, Bến Lức, Long An QUÁ TRÌNH ĐÀO TẠO - Từ năm 2005 đến năm 2010, sinh viên trường Đại Học Đồng Tháp, chuyên ngành Khoa học máy tính - Từ năm 2014 đến nay, học viên Cao học ngành Toán Ứng Dụng trường Đại Học Bách Khoa TP.HCM Q TRÌNH CƠNG TÁC - Từ năm 2010 đến nay, Giáo viên trường THPT Gò Đen, xã Phước Lợi, Bến Lức, Long An 122 ... Chuyên ngành: Toán Ứng Dụng Mã số: 60460112 I TÊN ĐỀ TÀI: PHÂN TÍCH DỮ LIỆU ĐA BIẾN VÀ MỘT SỐ ỨNG DỤNG II NHIỆM VỤ VÀ NỘI DUNG: - Kiến thức chuẩn bị - Phân tích liệu đa biến - Ứng dụng III NGÀY GIAO... GIA TP HỒ CHÍ MINH TRƯỜNG ĐẠI HỌC BÁCH KHOA LÊ HUỲNH NHƯ PHÂN TÍCH DỮ LIỆU ĐA BIẾN VÀ MỘT SỐ ỨNG DỤNG Chuyên ngành : TOÁN ỨNG DỤNG Mã số: 60460112 LUẬN VĂN THẠC SĨ TP HỒ CHÍ MINH - Tháng năm... nghiên cứu: Mơ hình phân tích kết đo số ứng dụng IV Phương pháp nghiên cứu - Tìm hiểu mơ hình hồi quy đa biến, mơ hình copula - Xem xét khả ứng dụng phương pháp báo vào một vài liệu đặc thù Việt

Ngày đăng: 21/04/2021, 11:03

Từ khóa liên quan

Mục lục

  • M u

  • Bang ký hiu

  • Kin thc chun bi

    • Hip phuong sai cua bin ngu nhiên hai chiu

    • Tuong quan cua bin ngu nhiên hai chiu

    • Ma trn hip phuong sai

    • Ma trn tuong quan

    • Mô hình hi quy tuyn tính a bin

      • Phân tích tuong quan tuyn tính (Linear Correlation)

        • Ð thi phân tán

        • H s tuong quan cua tp hp chính (The Population Correlation Coefficient)

        • H s tuong quan cua mu

        • Kim inh gia thuyt v

        • Phân tích nhân t

          • Mô hình EFA

          • Các buc thc hin EFA

          • Kích thuc mu

          • Kim tra tin cy thang o bng h s Cronbach’s alpha

          • Ðiu kin áp dung EFA

          • H s tai nhân t

          • Loai bo bin xu

          • Hi quy tuyn tính a bin

            • Hàm hi quy tng th

            • Các gia thuyt

            • Uc lung các tham s

Tài liệu cùng người dùng

Tài liệu liên quan