Phân tích dữ liệu đa biến và một số ứng dụng

89 190 0
Phân tích dữ liệu đa biến và một số ứng dụng

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Phân tích dữ liệu đa biến dựa trên nguyên tắc thống kê số liệu đa biến, trong đó bao gồm việc quan sát và phân tích kết quả thống kê của nhiều hơn một biến đã và đang thu hút sự quan tâm của nhiều nhà thống kê cũng như của nhiều nhà khoa học trong các ngành thực nghiệm. Một trong những điểm mạnh của phương pháp này là nó có thể được sử dụng để thực hiện các nghiên cứu trong rất nhiều lĩnh vực liên quan đến yêu cầu xem xét tác động của nhiều nhân tố trên những biến phản hồi Y (xem ’). Trong số các phương pháp phân tích đa biến thì phân tích hồi quy có nhiều ưu điểm vì đó là một phân tích thống kê để xác định xem các biến độc lập có quan hệ như thế nào với các biến phụ thuộc. Đây là một phương pháp thống kê mà giá trị kỳ vọng của một hay nhiều biến ngẫu nhiên được dự đoán dựa vào điều kiện của các biến ngẫu nhiên (đã tính toán) khác. Phân tích hồi quy có nhiều mô hình như mô hình hồi qui tuyến tính, hồi qui logic, hồi qui Poisson...Luận văn này sẽ tập trung nghiên cứu và ứng dụng mô hình hồi quy tuyến tính đa biến (xem ).

ĐẠI HỌC QUỐC GIA TP HỒ CHÍ MINH TRƯỜNG ĐẠI HỌC BÁCH KHOA LÊ HUỲNH NHƯ PHÂN TÍCH DỮ LIỆU ĐA BIẾN VÀ MỘT SỐ ỨNG DỤNG Chuyên ngành : TOÁN ỨNG DỤNG Mã số: 60460112 LUẬN VĂN THẠC SĨ TP HỒ CHÍ MINH - Tháng năm 2018 ĐẠI HỌC QUỐC GIA TP HỒ CHÍ MINH TRƯỜNG ĐẠI HỌC BÁCH KHOA LÊ HUỲNH NHƯ PHÂN TÍCH DỮ LIỆU ĐA BIẾN VÀ MỘT SỐ ỨNG DỤNG Chuyên ngành : TOÁN ỨNG DỤNG Mã số: 60460112 LUẬN VĂN THẠC SĨ TP HỒ CHÍ MINH - Tháng năm 2018 CƠNG TRÌNH ĐƯỢC HOÀN THÀNH TẠI TRƯỜNG ĐẠI HỌC BÁCH KHOA -ĐHQG -HCM Cán hướng dẫn khoa học : TS Nguyễn Tiến Dũng Cán chấm nhận xét : PGS TS Nguyễn Bích Huy Cán chấm nhận xét : TS Nguyễn Bá Thi Luận văn thạc sĩ bảo vệ Trường Đại học Bách Khoa, ĐHQG Tp HCM ngày 17 tháng 07 năm 2018 Thành phần Hội đồng đánh giá luận văn thạc sĩ gồm: Chủ tịch: PGS TS Nguyễn Đình Huy Thư ký: TS Đặng Văn Vinh Phản biện 1: PGS TS Nguyễn Bích Huy Phản biện 2: TS Nguyễn Bá Thi ủy viên: PGS TS Nguyễn Huy Tuấn Xác nhận Chủ tịch Hội đồng đánh giá LV Trưởng Khoa quản lý chuyên ngành sau luận văn sửa chữa (nếu có) CHỦ TỊCH HỘI ĐỒNG PGS.TS NGUYỄN ĐÌNH HUY TRƯỞNG KHOA PGS.TS HUỲNH QUANG LINH ĐẠI HỌC QUỐC GIA TP.HCM CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM TRƯỜNG ĐẠI HỌC BÁCH KHOA Độc lập - Tự - Hạnh phúc NHIỆM VỤ LUẬN VĂN THẠC SĨ Họ tên học viên: Lê Huỳnh Như MSHV: 7140275 Ngày, tháng, năm, sinh: 03/09/1987 Chuyên ngành: Nơi Toán sinh: ứng LongDụng An MãVÀ số:MỘT 60460112 I TÊN ĐỀ TÀI: PHÂN TÍCH DŨ LIỆU ĐA BIẾN SỐ ỨNG DỤNG II NHIỆM VỤ VÀ NỘI DUNG: - Kiến thức chuẩn bị - Phân tích liệu đa biến - ứng dụng III NGÀY GIAO NHIỆM VỤ: 15/01/2018 IV NGÀY HOÀN THÀNH NHIỆM VỤ: 17/06/2018 V CÁN BỘ HƯỚNG DẪN: TS NGUYỄN TIẾN DŨNG Tp HCM, ngày 17 tháng năm 2018 CÁN BỘ HƯỚNG DẪN TS NGUYỄN TIẾN DŨNG CHỦ NHIỆM BỘ MƠN ĐÀO TẠO PGS.TS NGUYEN ĐÌNH HUY TRƯỞNG KHOA PGS.TS HUỲNH QUANG LINH LỜI CẢM ƠN Luận văn thực Trường Đại học Bách Khoa Tp.HCM hướng dẫn Thầy TS Nguyễn Tiến Dũng Trước hết, tơi xin bày tỏ lòng biết ơn sâu sắc đến Thầy - người động viên hết lòng hướng dẫn tơi hồn thành luận văn Tơi xin chân thành cảm ơn quý thầy cô giáo mơn Tốn ứng Dụng khoa Khoa học ứng Dụng giảng dạy nhiệt tình, cung cấp kiến thức cho tơi q trình học tập trường Tơi xin chân thành cảm ơn Phòng đào tạo Sau đại học Trường Đại học Bách Khoa Tp.HCM tạo điều kiện thuận lợi để tơi hồn thành chương trình đào tạo an tâm học tập trường Cuối cùng, tơi xin gửi lời cám ơn đến gia đình, bạn bè, người bên tôi, động viên khuyến khích tơi hồn thành luận văn Tơi xin chân thành cảm ơn! Tp.HCM, ngày 17 tháng năm 2018 Học viên thực Lê Huỳnh Như TÓM TẮT LUẬN VĂN Luận văn bao gồm chương Chương trình bày khái niệm Chương trình bày cách phân tích mơ hình hồi quy tuyến tính đa biến ứng dụng Chương trình bày mơ hình copula ứng dụng ABSTRACT The thesis contains three chapters Chapter presents the basic concept Chapter presents the multivariate linear regression analysis and application Chapter presents the copula model and application LỜI CAM ĐOAN Tôi tên Lê Huỳnh Như, MSHV: 7140275, học viên cao học chuyên ngành Toán ứng dụng Trường Đại học Bách Khoa TP.HCM khóa 2014 Tơi xin cam đoan rằng, ngoại trừ kết tham khảo từ cơng trình khác ghi rõ luận văn, cơng việc trình bày luận văn tơi thực hướng dẫn TS Nguyễn Tiến Dũng Tp.HCM, ngày 17 tháng năm 2018 Học viên thực Lê Huỳnh Như 2.2.4chuẩn Kiểmđịnh tra cậy thang Kiến thức bịjđộgiảtinthuyết 2.1.4 Kiểm p đo hệ số Cronbach’s alpha Mục2.2.5 lcDiu kin ỏp dng EFA 14 ô 1.12.2 Hiptớch phương sai biến ngẫu nhiên hai chiều Phân nhân tốl 14 1.2 Tương quanhình củaEFA1 biến ngẫu nhiên hai chiềul 12.2.1 Mõ 15 1.3 Ma trậnCác hiệp phương Í2Ĩ2.2 bưóc thực sai hiên EFA| 15 Met đầul |1.4 Ma trận tương qưanỊ 12.2.3 Kích mail] Coefficien 2.1hình Phân tích tương qưan tưỵến (Linear Correlation) 2Bảng Mõ 2.1.3 hồi Hệ quy số tương tuyến quan tính đatính mẫu biến 2.1.2 tập hợp (The Population ký hiêu 2.1.1 Dồ thịthưóc phân tán 11 16 13 18 23 22 21 20 18 19 2.2.6 Hệ số tải nhân tố| 24 24 25 25 26 26 28 29 30 30 32 2.4 ứng dụng mơ hình hồi quy tuyến tính đa biến để đánh giá hài lòng học sinh khối 12 năm học 2017 - 2018 trường THPT Gò Đen, Bến Lức, Long An 35 2.4.1 Giới thiệu trường THPT Gò Đen, Bến Lức, Long An| 2.4.2 Quỵ trình nghiên cứu 2.4.3 Nghiên cứu định tínhỊ 2.4.4 Nghiên cứu định lượng 35 36 36 36 2.4.5 Bảng khảo sát| 37 2.4.6 Kết sau 46 chạy hồi quỵ đa biến Mõ hình copula 3.1 3.2 Một vài định nghĩa tính chất Copula 3.1.1 Các hàm phân phối đồng thòi Préchet - Hoeffding 3.1.2 Copula biến ngẫu nhiên Các khái niệm phụ thuộcỊ 3.2.1 Tương quan tuyến tính 3.2.2 Dộ đo tương thích 3.2.3 Dộ đo phụ thưộc 63 63 68 71 73 73 74 77 3.2.4 Những khái niệm phụ thuộc khác 3.3 Sơ lược hàm copula 78 82 3.3.1 Phân phối elliptic 82 3.3.2 Copula liên quan đến phân phối elliptic 83 87 88 90 90 91 93 3.5 ứng dụng copula đo lường rủi ro tài 3.5.1 Tốn thất tống hợp phân tích giá trị rủi ro 3.5.2 Giá trị cực trị nhiều chiều rủi ro thị trưởng 3.5.3 Tim sỗ tương quan tính tốn rủi ro Kết luận Lý lịch trích ngang 98 117 120 122 Hình 1.12: Điểm phân vị - phụ thuộc độ đo A(ư) với hàm copula Student (v=5) Tất nhiên, cường độ phụ thuộc giảm, bậc tự tăng, xét hình 1.11 1.12 cho ỡ > Chứng minh Cỹ phụ thuộc tiệm cận đuôi với A > phụ thuộc tiệm cân với A = Lời giải: ta có C(u,u) — 2u + C(u,u) — 2u + exp(21/ớ lnu) — 2u + u21/9 1—u 1—u 1—u 1—u ta có: lim £^1 = - Um 2'ZV1'’-1 = - 21/’ u—>1 — u lí—>1 Từ suy điều phải chứng minh 3.3Sơ lược hàm copula 3.3.1 Phân phối elliptic Định nghĩa 3.10 Nếu X véctơ ngẫu nhiên n - chiều, p, E R n ma trận đối xứng 52 cấp nxn xác định không ăm, hàm đặc trưng X — Ị1 hàm có dạng tồn phương tT^2t> = ộ{tT , nói X có phấn phối elliptic với tham số /X, 52 ộ viết X Khi n = 1, lớp phân phối elliptic trùng với lớp phân phối đối xứng chiều Hàm ộ định nghĩa gọi hàm sinh đặc trưng Định lý 3.12 X En(/J,, 52, 0) với rank(^y) = k tồn biến ngẫu nhiên R > độc lập với u, véctơ ngẫu nhiên k - chiều phân phối siêu cầu đơn vị {z G Rk \zTz = 1}; ma trận A cd n X k với AAT = 52 cho X=dỊj> + RAU Ví dụ 3.6 Giả sử véctơ ngẫu nhiên n - chiều X ~ 7Vn(0, In),với thành phần Xỉ ~ N(ữ,i),ỉ = 1, ,n độc lập hàm đặc trưng Xị exp(—1^/2), hàm đặc trưng X là: exp{-2Ơ? + -+in)} = exp{-^íTí} Từ định lý thấy X En(0,In, ỷ), 0(ư) = exp(-u/2) Nếu X ~ En(jx, 52, 0), 52 ma trận đường chéo, X có thành phần khơng tương quan (nếu < Var(Xị) < oo) Nếu X có thành phần độc lập, X ~ Nn(jx, 52)- Chú ý phân phối chuẩn nhiều chiều phân phối elliptic, thành phần không tương quan kéo theo thành phần độc lập Một véctơ ngẫu nhiên X En(ụ,Y,,) khơng cần thiết có hàm mật độ Nếu X có hàm mật độ có dạng|52|_1/25((Jf-/z'r)52_1(Jf-/z)) cho hàm g khơng âm biến vơ hướng Hơn đường chu tuyến có mật độ dạng ellipsoid Rn Cho phân phối X, biểu diễn En(fi, 52, 0) không Tham số /Ả xác định tham số 52 ộ xác định số dương Một cách xác, X En(ix,^,ộ) X ~ En(fj,*, 52*, 0*) ự* = = c 52,0*0 = 0(-/c) với số c > Để tìm biểu diễn cho Cov(x) = 52; sử dụng định lý thu được: Cov(x) = Cov^ + RAU) = AE(R2)Cov(U)AT với điều kiện E(R2) < 00 Giả sử y ~ 7Vn(0, In) Khi y=d ||y|| V, ||y|| u độc lập Hơn |y||2 ~ X2, i(||y||2) = n Từ đó>Cov(Y) = In, thấy u phân phối siêu cầu đơn vị Rn, Cov(ư) = ỉn/n, Cov(x) = AATE(R2)/n Chọn hàm sinh đặc trưng ộ*(s) = ộ{s/c), c = E(R2)/n, có Cov(x) = 52- Từ phân phối elliptic mô tả đầy đủ /Ẳ, 52 0, ộ chọn cho Cov(x) = 52 (nếu Cov(x) xác định) Nếu Cov(x) thu phân phối X xác định E(x), Cov(x) phân phối lề chiều, phân phối chuẩn phân phối student bậc Định lý 3.13 Giả sử X En(jẲ, 52; 0); giả sử B ma trận cd q X n bÈRn Kht đo _ _ , _ V 'A rp , b + BX ~ Eq(b + B/a,Bỵ2BT,ộ) Chứng minh: Từ định lý 3.10, b + BX có biểu diễn ngẫu nhiên: b + BX=db + B/Ẳ + RBAU Giả sử ta có phân hoạch X fj,, 52 sau: Xỵ /21 véctơ cd r X 5211 ma trận cd r X r Ta có định lý sau: Định lý 3.14 Giả sử X ~ En(n,Ỵ2,ộ)- Khi Xi ~ -Eị^i, 5211 y 0) ĩ KQ ~ En—r(jl2y 52223 với < u < ự?(u) gọi hàm sinh copula Các copula Archimedean đóng vai trò quan trọng, chúng đòi hỏi vài tính chất (ơ đối xứng, kết hợp, ) Tuy nhiên copula Archimedean tính tốn đơn giản Ví dụ 3.8 Xét độ đo tương thích T Kendall cho bởi: 1'Aỉ (3.40) Chúng ta ( copnln p(nỊ G(ÍH,U2) — Lti u |-lou)a Cí «1 mill *1 Joe Kimeldorí-Sampson ( -lnl - (1 ĩi-n - ] (nr+ar- ■■ Giả sử ĩu(tt) = exp(—7?(u)), ý phương trình (3.39) viết dạng: N w(C(ui, ,un, ,UNỴ) = ỊJw(ưn) (3.41) 7Ỉ=1 Ap dụng (p cho hai phân phối đồng thời phân phối lề, phân phối trở nên độc lập Chúng ta ý copula Archimedean liên quan đến tạo thành nhiều phân phối nhiều chiều Giả sử véctơ chứa tham số tạo thành hàm phân phối đồng thời r với phân phối lề rn H phân phối nhiều chiều Chúng ta ký hiệu F1, ,FN N - phân phối chiều, ta chứng tỏ rằng: F(xi, ,xn, ,XN) = Ị Ị H(H^(x ), , ^"(xn), ,lỉ^v(xJv)ưr(7i, ,7n, ,7JV)) (3.42) phân phối nhiều chiều với lề F1, , FN, có: Hn(xn) = exp(-

Ngày đăng: 24/12/2019, 11:21

Từ khóa liên quan

Mục lục

  • Mục lục

    • 2.1 Phân tích nhân tố

    • 2.2 Hồi quy tuyến tính đa biến

    • PHÂN TÍCH DỮ LIỆU ĐA BIẾN và một SỐ ỨNG DỤNG

      • CHỦ TỊCH HỘI ĐỒNG TRƯỞNG KHOA

      • NHIỆM VỤ LUẬN VĂN THẠC SĨ

      • II. NHIỆM VỤ VÀ NỘI DUNG:

      • III. NGÀY GIAO NHIỆM VỤ: 15/01/2018

      • IV. NGÀY HOÀN THÀNH NHIỆM VỤ: 17/06/2018

      • V. CÁN BỘ HƯỚNG DẪN: TS. NGUYỄN TIẾN dũng

      • CÁN BỘ HƯỚNG DẪN CHỦ NHIỆM BỘ MÔN ĐÀO TẠO

      • TS. NGUYỄN TIẾN DŨNG PGS.TS. NGUYEN ĐÌNH HUY

      • TRƯỞNG KHOA

      • PGS.TS. HUỲNH QUANG LINH

      • LỜI CẢM ƠN

      • TÓM TẮT LUẬN VĂN

      • ABSTRACT

      • LỜI CAM ĐOAN

        • Kết luận

        • Lý lịch trích ngang

        • MỞ ĐẦU

          • I. Lý do chọn đề tài

          • II. Mục đích nghiên cứu

          • III. Đối tượng và phạm vi nghiên cứu

Tài liệu cùng người dùng

Tài liệu liên quan