1. Trang chủ
  2. » Luận Văn - Báo Cáo

Tóm tắt Luận văn Thạc sĩ Khoa học: Phân tích thành phần chính, phân tích nhân tố và ứng dụng

25 150 1

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 25
Dung lượng 377,32 KB

Nội dung

Mục đích và nhiệm vụ nghiên cứu: Tìm hiểu, nghiên cứu kỹ các tài liệu từ nhiều nguồn khác nhau, cố gắng lĩnh hội được các kiến thức về phân tích thành phần chính, phân tích nhân tố cũng như ứng dụng của nó. Hy vọng luận văn có thể được sử dụng như một tài liệu tham khảo bổ ích cho sinh viên các trường Đại học, Cao đẳng.

BỘ GIÁO DỤC VÀ ĐÀO TẠO ĐẠI HỌC ĐÀ NẴNG NGUYỄN THỊ HUYỀN MY PHÂN TÍCH THÀNH PHẦN CHÍNH, PHÂN TÍCH NHÂN TỐ VÀ ỨNG DỤNG Chuyên ngành: Phương pháp Tốn sơ cấp Mã số: 60.46.01.13 TĨM TẮT LUẬN VĂN THẠC SĨ KHOA HỌC Đà Nẵng - Năm 2016 Công trình hồn thành ĐẠI HỌC ĐÀ NẴNG Người hướng dẫn khoa học: TS LÊ VĂN DŨNG Phản biện 1: TS NGUYỄN NGỌC CHÂU Phản biện 2: GS.TSKH NGUYỄN VĂN MẬU Luận văn bảo vệ Hội đồng chấm Luận văn tốt nghiệp thạc sĩ khoa học họp Đại học Đà Nẵng vào ngày 13 tháng năm 2016 Có thể tìm Luận văn tại: - Trung tâm Thông tin - Học liệu, Đại học Đà Nẵng - Thư viện trường Đại học sư phạm, Đại học Đà Nẵng MỞ ĐẦU Lý chọn đề tài Dưới tác động cách mạng khoa học công nghệ đem lại thay đổi to lớn mang tính bước ngoặt phát triển xã hội, với lượng thơng tin khổng lồ đặt giới trước vấn đề tìm hiểu xử lý thơng tin vơ khó khăn phức tạp Việc phân tích xử lý số liệu thông tin yêu cầu cấp thiết hàng đầu xã hội, đặc biệt ngành phân tích thống kê với chức nghiên cứu, phân tích, giải thích, trình bày tổ chức liệu lĩnh vực khác khoa học, công nghiệp, giáo dục vấn đề xã hội Phương pháp phân tích thành phần với phương pháp phân tích nhân tố phương pháp xử lý liệu phân tích thống kê sử dụng phổ biến Cùng với hướng dẫn TS Lê Văn Dũng, chọn nghiên cứu đề tài " PHÂN TÍCH THÀNH PHẦN CHÍNH, PHÂN TÍCH NHÂN TỐ VÀ ỨNG DỤNG" cho luận văn thạc sỹ 2 Mục đích nhiệm vụ nghiên cứu Tìm hiểu, nghiên cứu kỹ tài liệu từ nhiều nguồn khác nhau, cố gắng lĩnh hội kiến thức phân tích thành phần chính, phân tích nhân tố ứng dụng Hy vọng luận văn sử dụng tài liệu tham khảo bổ ích cho sinh viên trường Đại học, Cao đẳng Đối tượng phạm vi nghiên cứu Đối tượng nghiên cứu là: Phân tích thành phần chính, phân tích nhân tố ứng dụng liên quan Phạm vi nghiên cứu luận văn sâu tìm hiểu khái niệm, định nghĩa, đính lý liên quan, từ đưa ứng dụng liên quan đến phân tích thành phần chính, phân tích nhân tố Phương pháp nghiên cứu Luận văn nghiên cứu dựa phương pháp giải tích Ý nghĩa khoa học thực tiễn đề tài Trong phân tích thống kê thơng thường phải nghiên cứu, tìm hiểu, phân tích lượng liệu lớn Phân tích thành phần với phân tích nhân tố phương pháp phân tích liệu nhiều biến đơn giản Giả sử ta có quan sát p biến ngẫu nhiên, tìm p biến khơng tương quan với biểu diễn tuyến tính thơng qua biến cũ Dĩ nhiên, thay đổi biến số không làm thông tin biến ban đầu Mục đích phân tích thành phần rút gọn số liệu, biểu diễn giải thích tập số liệu Còn mục đích phân tích nhân tố mơ tả "cái chung", thể dạng mối quan hệ tương quan nhiều biến thơng qua số biến Các biến không quan sát gọi nhân tố Luận văn giúp bạn sinh viên xem tài liệu tham khảo kiến thức liên quan đến phân tích thành phần chính, phân tích nhân tố q trình học tập mơn Phân tích thống kê Tổng quan tài liệu nghiên cứu Ngoài phần mở đầu, kết luận, tài liệu tham khảo, luận văn trình bày hai chương: Chương trình bày khái niệm vectơ ma trận, vectơ ngẫu nhiên, phân bố chuẩn nhiều chiều, vectơ trung bình mẫu, ma trận hiệp phương sai mẫu, ước lượng khơng chệch, phân bố mẫu trung bình mẫu, nhận dạng phân bố chuẩn nhiều chiều, kiểm định giả thiết vectơ trung bình, giá trị mẫu tổ hợp tuyến tính biến Chương trình bày cấu trúc thành phần chính, thành phần chuẩn hóa, thành phần ma trận hiệp phương sai với cấu trúc đặc biệt, phân tích thành phần dựa mẫu, biểu đồ thành phần chính, mơ hình nhân tố trực giao phương pháp ước lượng Cũng chương này, trình bày ứng dụng cách đưa số ví dụ liên quan đến việc phân tích thành phần chính, phân tích nhân tố 5 CHƯƠNG KIẾN THỨC CHUẨN BỊ 1.1 VECTƠ VÀ MA TRẬN 1.1.1 Vectơ Cho x = (x1 , x2 , , xn ) ∈ Rn Ta viết dạng ma trận x sau:   x1  x2  T  x=   x = [x1 , x2 , , xn ] xn Các phép toán: Phép cộng, phép nhân với số, tích vơ hướng Hệ trực chuẩn 1.1.2 Ma trận Ma trận A = [aij ]n×p bảng số hình chữ nhật gồm n hàng p cột có dạng sau  a11 a12  a21 a22 A =  an1 an2  a1p a2p   anp Các phép toán: Tổng hai ma trận A B, tích số với ma trận, tích hai ma trận Các loại ma trận: Ma trận hàng, ma trận vuông, ma trận chuyển vị , ma trận đối xứng, ma trận nghịch đảo, ma trận chéo, ma trận trực giao , ma trận xác định không âm, ma trận xác định dương Giá trị riêng vectơ riêng Vết ma trận Định lý 1.1.1 Nếu A ≥ giá trị riêng A số thực không âm Định lý 1.1.2 Nếu ma trận An×n có n cặp giá trị riêng - vectơ riêng (λ1 ; e1 ), (λ2 ; e2 ), , (λn ; en ) với {e1 , e2 , , en } hệ trực chuẩn ta có phân tích phổ: A = λ1 e1 eT1 + λ2 e2 eT2 + + λn en eTn 1.1.3 Căn bậc hai ma trận 1.1.4 Các bất đẳng thức ma trận maximum Bất đẳng thức Cauchy-Schwatz, bất đẳng thức CauchySchwatz mở rộng, maximum dạng thức toàn phương hình cầu đơn vị 1.2 VECTƠ NGẪU NHIÊN Định nghĩa 1.2.1 Một không gian xác suất ba (Ω, F, P ), với Ω tập bất kỳ, F σ−đại số tập Ω, P : F → [0, 1] độ đo xác suất F thỏa mãn: P (Ω) = (và P (φ) = 0) 7 Với A1 , , An , ∈ F cho Ai ∩ Aj = φ, i = j : P Ai i = P (Ai ) i Tập Ω gọi không gian mẫu, tập rỗng φ, phần tử F gọi biến cố, phần tử Ω gọi biến cố sơ cấp Định nghĩa 1.2.2 Cho không gian xác suất (Ω, F, P ) Ánh xạ X : Ω → R gọi biến ngẫu nhiên ∀a ∈ R: X −1 ((−∞, a)) ∈ F Định nghĩa 1.2.3 Cho X1 , X2 , , Xn biến ngẫu nhiên xác định khơng gian xác suất (Ω, F, P ) Kí hiệu X = (X1 , X2 , , Xn ) gọi vectơ ngẫu nhiên n chiều Dạng ma trận X  sau X1  X2  X =   X T = [X1 , X2 , , Xn ] Xn Định nghĩa 1.2.4 Cho Xij với i = 1, 2, , m; j = 1, 2, , n mn biến ngẫu nhiên xác định không gian xác suất (Ω, F, P ) X = [Xij ]m×n gọi ma trận ngẫu nhiên Định nghĩa 1.2.5 X gọi biến ngẫu nhiên rời rạc X có hàm phân phối F hàm bước nhảy Định nghĩa 1.2.6 X gọi biến ngẫu nhiên liên tục X có hàm phân phối F hàm liên tục tuyệt độ đo Lebesgue đường thẳng 8 1.2.1 Hàm xác suất đồng thời 1.2.2 Vectơ trung bình ma trận hiệp phương sai 1.2.3 Chia khối ma trận hiệp phương sai 1.2.4 Vectơ trung bình ma trận hiệp phương sai tổ hợp tuyến tính vectơ ngẫu nhiên 1.3 PHÂN BỐ CHUẨN NHIỀU CHIỀU Định nghĩa 1.3.1 Vectơ ngẫu nhiên X = [X1 , X2 , , Xp ]T gọi có phân bố chuẩn p chiều với tham số µT = [µ1 , µ2 , , àp ] v = [ij ]pìp ( > 0) X có hàm mật độ xác suất đồng thời 1 f (x) = exp − (x − µ)T Σ−1 (x − µ) p/2 1/2 (2π) |Σ| Kí hiệu X ∼ Np (µ; Σ) Mệnh đề 1.3.2 Nếu Σ xác định dương Σ−1 tồn tại, (λ; e) cặp giá trị riêng - vectơ riêng Σ (λ−1 ; e) cặp giá trị riêng - vectơ riêng Σ−1 Tính chất 1.1 Nếu X có phân bố chuẩn p chiều Np (µ; Σ) thành phần X X1 , X2 , , Xp có phân bố chuẩn chiều Tính chất 1.2 Nếu X có phân bố chuẩn Np (µ; Σ) với aT = [a1 , a2 , , ap ] ta có aT X = a1 X1 + a2 X2 + + ap Xp ∼ N (aT µ; aT Σa) Ta có aT X = a1 X1 +a2 X2 + +ap Xp ∼ N (aT µ; aT Σa) 9 với aT = [a1 , a2 , , ap ] X có phân bố chuẩn Np (µ; Σ) Tính chất 1.3 Nếu X có phân bố chuẩn Np (µ; Σ) với A = [aij ]nìp ta cú AX N (Aà; AAT ) Mnh đề 1.3.3 Nếu X có phân bố chuẩn p chiều Np (µ; Σ) χ2 = (X − µ)T Σ−1 (X − µ) có phân bố χ2p (phân bố bình phương p bậc tự do) Do đó, với mức ý nghĩa α, ta có P ((X − µ)T Σ−1 (X − µ) > χ2p (α)) = α 1.3.1 Lấy mẫu từ phân bố chuẩn nhiều chiều 1.3.2 Ước lượng hợp lý cực đại 1.4 VECTƠ TRUNG BÌNH MẪU, MA TRẬN HIỆP PHƯƠNG SAI MẪU Giả sử x1 , x2 , ,xn mẫu chọn ngẫu nhiên từ tổng thể X T = [X1 , X2 , , Xp ], xTi = [xi1 , xi2 , , xip ] Kí hiệu  T   x1 x11 x12 x1p  T   x21 x22 x2p  x = x2  =   T x x n1 n2 xnp xn Đặt xj = (x1j + x2j + + xnj ), j = 1, 2, , p n sij n sij = k=1 (xki − xi )(xkj − xj ) rij = √ n−1 sii sjj - Vectơ xT = [x1 , x2 , , xp ] gọi vectơ trung bình mẫu  s11 s12 s21 s22 S =  sp1 sp2  s1p s1p   spp 10 gọi ma trận hiệp phương sai mẫu   r11 r12 r1p r21 r22 r2p  R =   rp1 rp2 rpp gọi ma trận hệ số tương quan mẫu 1.5 ƯỚC LƯỢNG KHÔNG CHỆCH Cho X = [Xij ]n×p mẫu ngẫu nhiên X T = [X1 , X2 , , Xp ] với E(X) = µ Cov(X) = Σ Khi E(X) = µ; E(S) = Σ Như X ước lượng khơng chệch µ, S ước lượng khơng chệch Σ 1.6 PHÂN BỐ MẪU TRUNG BÌNH MẪU Định lý 1.6.1 Cho X = [Xij ]n×p mẫu ngẫu nhiên tổng thể X có phân bố chuẩn p chiều Np (µ; Σ) Khi X có phân Σ bố chuẩn Np (µ; ) n Định lý 1.6.2 (Định lí giới hạn trung tâm) Cho X = [Xij ]n×p mẫu ngẫu nhiên tổng thể X có E(X) = µ cov(X) = Σ Khi với n đủ lớn, X có xấp xỉ phân bố chuẩn Σ Np (µ; ) n 1.7 NHẬN DẠNG PHÂN BỐ CHUẨN NHIỀU CHIỀU Giả sử  T  x1 x11 xT2   x21 x =   =  xn1 xTn mẫu chọn ngẫu nhiên x12 x22 xn2  x1p x2p   xnp X T = [X1 , X2 , , Xp ] 11 Dựa vào mẫu số liệu để kiểm tra xem X có phân bố chuẩn không? 1.7.1 Sử dụng biểu đồ xác suất chuẩn 1.7.2 Kiểm định chi bình phương 1.8 KIỂM ĐỊNH GIẢ THUYẾT VỀ VECTƠ TRUNG BÌNH Định lý 1.8.1 Cho x = [xij ]n×p mẫu ngẫu nhiên tổng thể X có phân bố chuẩn p chiều Np (µ; Σ) Khi n(n − p) (x − µ)T S −1 (x − µ) T2 = p(n − 1) có phân bố Fisher Fp,n−p 1.9 GIÁ TRỊ MẪU CỦA TỔ HỢP TUYẾN TÍNH CÁC BIẾN Trong nhiều hàm đa biến, xét tổ hợp tuyến tính : cT X = c1 X1 + c2 X2 + + cp Xp giá trị quan sát thứ j cT xj = c1 xj1 + c2 xj2 + + cp xjp , j = 1, 2, , n cT x1 + cT x2 + + cT xn Trung bình mẫu = cT x n Vì (cT xj − cT x)2 = (cT (xj − x))2 = cT (xj − x)(xj − x)T c (cT x1 − cT x)2 + (cT x2 − cT x)2 + + (cT xn − cT x)2 Phương sai mẫu n−1 (cT (x1 − x)(x1 − x)T c) + + (cT (xn − x)(xn − x)T c) = n−1 T + + (x − x)(x − x)T (x − x)(x − x) 1 n n = cT [ ]c n−1 12 phương sai mẫu cT X = cT Sc Tổ hợp tuyến tính thứ hai bT X = b1 X1 + b2 X2 + + bp Xp giá trị thứ j : bT xj = b1 xj1 + b2 xj2 + + bp xjp , j = 1, 2, , n Trung bình mẫu bT X = bT x, phương sai mẫu bT X = bT Sb Hiệp phương sai mẫu bT X cT X (bT x1 − bT x)(cT x1 − cT x) + + (bT xn − bT x)(cT xn − cT x) = n−1 bT (x1 − x)(x1 − x)T c + + bT (xn − x)(xn − x)T c = n−1 = bT [ (x1 − x)(x1 − x)T + + (xn − x)(xn − x)T ]c n−1 hiệp phương sai mẫu bT X cT X = bT Sc Hệ 1.9.1 Tổ hợp tuyến tính bT X = b1 X1 + b2 X2 + + bp Xp , cT X = c1 X1 + c2 X2 + + cp Xp có trung bình mẫu, phương sai mẫu, hiệp phương sai mẫu liên quan đến x S : Trung bình mẫu bT X = bT x, trung bình mẫu cT X = cT x Phương sai mẫu bT X = bT Sb, phương sai mẫu cT X = cT Sc Hiệp phương sai mẫu bT X cT X = bT Sc Hệ 1.9.2 q tổ hợp tuyến tính AX có ma trận vectơ trung bình mẫu Ax ma trận hiệp phương sai mẫu ASAT 13 CHƯƠNG PHÂN TÍCH THÀNH PHẦN CHÍNH VÀ PHÂN TÍCH NHÂN TỐ 2.1 CẤU TRÚC CỦA CÁC THÀNH PHẦN CHÍNH Cho vectơ ngẫu nhiên p chiều X = (X1 , , Xp ) có ma trận hiệp phương sai cov(X) = Σ vectơ trung bình µ = E(X) Xét p tổ hợp tuyến tính Y1 = aT1 X = a11 X1 + a12 X2 + + a1p Xp Y2 = aT2 X = a21 X1 + a22 X2 + + a2p Xp Yp = aTp X = ap1 X1 + ap2 X2 + + app Xp Ta có V ar(Yi ) = aTi Σai , cov(Yi , Yj ) = aTi Σaj Định nghĩa 2.1.1 Thành phần vectơ X tổ hợp tuyến tính Y1 ,Y2 , ,Yp cho cov(Yi , Yj ) = với i = j V ar(Yi ) lớn Như vậy, - Thành phần thứ tổ hợp tuyến tính Y1 cho V ar(Y1 ) đạt giá trị lớn tập {a1 : aT1 a1 = 1} 14 - Thành phần thứ hai tổ hợp tuyến tính Y2 cho V ar(Y2 ) đạt giá trị lớn tập {a2 : aT2 a2 = 1, aT1 Σa2 ) = 0} - Thành phần thứ k tổ hợp tuyến tính Yk cho V ar(Yk ) đạt giá trị lớn tập {ak : aTk ak = 1, aTk Σaj ) = với j < k} Định lý 2.1.2 Nếu ma trận hiệp phương sai Σ vectơ X có p cặp giá trị riêng - vectơ riêng (λ1 , e1 ), (λ2 , e2 )„ ,(λp , ep ) cho λ1 ≥ λ2 ≥ ≥ λp e1 , e2 , ,ep hệ trực chuẩn thành phần thứ i xác định Yi = eTi X, i = 1, 2, , p Như cov(Yi , Yj ) = ∀i = j ta có V ar(Yi ) = λi , Định lý 2.1.3 Cho X có ma trận hiệp phương sai Σ với p cặp giá trị riêng - vectơ riêng, λ1 ≥ λ2 ≥ ≥ λp , Yi = eTi X thành phần thứ i, i = 1, 2, , p Khi p σ11 + σ22 + + σpp = p V ar(Xi ) = λ1 + + λp = i=1 V ar(Yi ) i=1 λi gọi tỉ λ1 + + λp lệ phương sai thành phần thứ i phương sai tổng Định nghĩa 2.1.4 Đại lượng thể X Nếu tổng λ1 + λ2 + + λm ≥ 90% λ1 + + λp ta cần sử dụng m thành phần mà thơng 15 tin liệu ban đầu không nhiều Định lý 2.1.5 Hiệp phương sai hệ số tương quan thành phần Yi thành phần Xk vectơ X là: cov(Yi , Xk ) = eij λk , √ eik λk , i, k = 1, 2, , p ρ(Yi , Xk ) = √ σkk eik tọa độ thành phần thứ k ei = (ei1 , , eik , , eip ), Yi = eTi X , (λi , ei ) cặp giá trị riêng, vectơ riêng 2.2 CÁC THÀNH PHẦN CHÍNH ĐÃ CHUẨN HĨA Định lý 2.2.1 Cho Z = (Z1 , , Zp ) vectơ ngẫu nhiên chuẩn hóa có ma trận hiệp phương sai ρ Nếu ρ có p cặp giá trị riêng - vectơ riêng (λ1 , e1 ), , (λp , ep ) với λ1 ≥ ≥ λp thành phần Z xác định Yi = eTi Z, Hơn i = 1, 2, , p p V ar(Yi ) = p, i=1 ρ(Yi , Zk ) = eik λi , eik thành phần tọa độ thứ k ei 16 2.3 THÀNH PHẦN CHÍNH ĐỐI VỚI MA TRẬN HIỆP PHƯƠNG SAI VỚI CẤU TRÚC ĐẶC BIỆT 2.4 PHÂN TÍCH THÀNH PHẦN CHÍNH DỰA TRÊN MẪU Định lý 2.4.1 Nếu ma trận hiệp phương sai mẫu S có p ˆ , eˆ1 ), , (λ ˆ p , eˆp ) với λ ˆ1 ≥ λ ˆ1 ≥ cặp giá trị riêng - vectơ riêng (λ ˆ p Khi ước lượng thành phần dựa mẫu x ≥ λ Yˆi = eˆTi X, i = 1, 2, , p Hơn nữa, ước lượng phương sai hiệp phương sai V ar(Yˆi ) = λi , cov(Yˆi , Yˆj ) = ∀i = j Ước lượng phương sai tổng cộng p ˆ1 + λ ˆ + + λ ˆp V ar(Xi ) = λ i=1 Ước lượng hệ số tương quan ˆi eˆik λ rˆYˆi ,Xk = √ skk eˆik tọa độ thành phần thứ k eˆi = (ˆ ei1 , , eˆik , , eˆip ) 2.4.1 Số lượng thành phần 2.4.2 Chuẩn hóa thành phần mẫu 2.5 BIỂU ĐỒ THÀNH PHẦN CHÍNH Tóm tắt ý kiến: 1) Để giúp kiểm tra giả thiết chuẩn, xây dựng sơ đồ phân tán cho cặp vài thành phần đầu tiên, 17 thực biểu đồ Q-Q từ giá trị mẫu tạo thành phần 2) Xây dựng sơ đồ phân tán biểu đồ Q-Q cho vài thành phần lại 2.6 MƠ HÌNH PHÂN TÍCH NHÂN TỐ TRỰC GIAO Cho vectơ ngẫu nhiên quan sát X = (X1 , X2 , , Xp ) có vectơ kì vọng E(X) = µ ma trận hiệp phương sai cov(X) = Σ Mơ hình nhân tố giả định X tổ hợp tuyến tính số biến ngẫu nhiên khơng quan sát F1 , F2 , , Fm (m < p) gọi nhân tố chung p biến ngẫu nhiên cộng thêm ε1 , ε2 , , εp Tức X1 − µ1 = l11 F1 + l12 F2 + + l1m Fm + ε1 X2 − µ2 = l21 F1 + l22 F2 + + l2m Fm + ε2 Xp − µp = lp1 F1 + lp2 F2 + + lpm Fm + εp Hoặc dạng ma trận X = L ì F + Phn t lij ma trận L gọi tải trọng biến Xi đặt lên nhân tố Fj Các giả thiết mơ hình 18 - Đối với nhân tố F : E(F ) = 0, cov(F ) = E(F F T ) = I - Đối với sai số ngẫu nhiên ε: E(ε) = 0, cov(ε) = E(εεT ) = ψ = diag(ψ1 , , ψp ) -F ε không tương quan: cov(F ; ε) = Nếu giả thiết thỏa mãn cov(X) = Σ = LLT + ψ Ta có 2 V ar(Xi ) = σii = li1 + li2 + + lim + ψi + l2 + + l2 gọi phương sai chung, ψ Đại lượng h2i = li1 i i2 im gọi phương sai xác định Như σii = h2i + ψi 2.7 PHƯƠNG PHÁP ƯỚC LƯỢNG 2.7.1 Ước lượng dựa phân tích thành phần Cho X = (X1 , X2 , , Xp ) có vectơ trung bình E(X) = µ ma trận hiệp phương sai Σ Giả sử (λ1 ; e1 ), (λ2 ; e2 ), , (λp , ep ) p cặp giá trị riêng - vectơ riêng Σ Khi Σ = λ1 e1 eT1 + λp e2 eT2 + + λp ep eTp = √ √ λ1 e1 λ2 e2 λp ep × √ √ λ1 e1 λ2 e2 T λp ep 19 Giả sử ta muốn phân tích Σ với m = p nhân tố Σ = L × LT + 0, L = √ √ λ1 e1 λ2 e2 λp ep p×p Nếu p − m giá trị riêng λm+1 , λm+2 , , λp có tổng λm+1 + λm+2 + + λp nhỏ bỏ qua p − m nhân tố cuối, tức Σ ≈ L × LT , L = √λ1 e1 √λ2 e2 √λm em Đặt ψ = diag(ψ1 , , ψp ) với ψi = σii − p×m m l i=1 ii lii phần tử nằm đường chéo ma trận LLT ta Σ ≈ L × LT + ψ Ta chuẩn hóa vectơ ngẫu nhiên X = (X1 , X2 , , Xp ): Xi − µi Zi = √ σii Khi ta thực tương tự ma trận tương quan ρ Giả sử có n quan sát độc lập vectơ ngẫu nhiên X = (X1 , X2 , , Xp ):  x11 x12  x21 x22 x =  xn1 xn2  x1p x2p   xnp Để ước lượng L ψ dựa mẫu số liệu ta thực sau: - Tìm p cặp giá trị riêng - vectơ riêng ma trận hiệp ˆ ; eˆ1 ); (λ ˆ ; eˆ2 ), ,(λ ˆ m ; eˆp ) phương sai mẫu S : (λ 20 - Chọn m giá trị riêng Ước lượng L ˆ = ˆlij L p×m = ˆ eˆ1 λ ˆ eˆ2 λ ˆ m eˆm λ - Ước lượng ma trận hiệp phương sai sai số ngẫu nhiên ψ: ψˆ = diag(ψˆ1 , ψˆ2 , , ψˆp ), với ψˆi = sii − m ˆ2 i lii Ta chuẩn hóa mẫu số liệu x: xij − xj zij = √ , i = 1, 2, , n; j = 1, 2, , p sjj Khi ma trận hiệp phương sai mẫu R z = [zij ]n×p ma trận tương quan mẫu x = [xij ]n×p Phân tích nhân tố thành phần R tương tự S 2.7.2 Phương pháp ước lượng hợp lí cực đại Nếu nhân tố chung F nhân tố có phân bố đồng thời chuẩn ta sử dụng phương pháp hợp lý cực ước lượng ma trận tải trọng L ma trận phương sai xác định ψ Giả sử ta có phân tích nhân tố X − µ = LF + Khi n quan sát X1 , X2 , , Xn có phân tích Xj − µ = LFj + j, = 1, n Ta có hàm hợp lý: L(à, ) = nk/2 ||n/2 ì exp{ tr[Σ−1 n (Xj −X)(Xj −X)T +n(X−µ)(X−µ)T ]} (2.1) j=1 21 mà phụ thuộc vào L ψ qua Σ = LLT + ψ Mơ hình chưa xác định L xác định sai khác ma trận trực giao nhân với Vì để tiện cho việc tính tốn, người ta buộc thêm điều kiện LT µψ −1 L = ∆ (2.2) ma trận chéo ˆ ψˆ nhận cách Khi ước lượng hợp lý cực đại L, cực đại hóa (2.1) với điều kiện (2.2) Định lý 2.7.1 Giả sử X1 , X2 , , Xn mẫu ngẫu nhiên từ phân bố chuẩn Np (µ, Σ), Σ = LLT + ψ ma trận hiệp phương sai m nhân tố chung Khi ước lượng hợp lý ˆ µ ˆ ψˆ−1 L ˆ cực đại L, ˆ µ ˆ = X cực đại hóa (2.2) với điều kiện L đường chéo ˆ = ˆl2 + + Ước lượng hợp lý cực đại phương sai chung là: h i i ˆ , i = 1, k h i Như tỷ lệ phương sai mẫu nhân tố thứ j tổng cộng +ˆ + + ˆ /(s + + s ) phương sai mẫu ˆl1j l2j lkj 11 kk 2.8 ỨNG DỤNG Ví dụ 2.8.1 Nghiên cứu điểm thi khối A1 năm 2015 thí sinh thi cụm thi Đại học Đà Nẵng chủ trì Bằng phương pháp chọn mẫu ngẫu nhiên, chúng tơi chọn ngẫu nhiên 96 thí sinh 22 để phân tích thành phần Ví dụ 2.8.2 Trong phần nghiên cứu điểm tổng kết năm học 2015-2016 mơn Tốn, Vật lý, Hóa học, Sinh học, Ngữ văn, Lịch sử, Địa lí Tiếng Anh học sinh khối 12 trường THPT Lương Văn Can (tp Hồ Chí Minh), số liệu điểm tổng kết học sinh Nhà trường đưa lên địa chỉ: http://thptluongvancan.hcm.edu.vn/DataEschool/ DiemTongKetLopm.aspx Ví dụ 2.8.3 Tỷ lệ lợi nhuận hàng tuần cho năm cổ phiếu (JP Morgan, Citibank, Wells Fargo, Royal Dutch Shell ExxonMobil) niêm yết sàn chứng khoán New York xác định giai đoạn từ ngày 30 tháng 05 năm 2014 đến ngày 23 tháng 05 năm 2016 Tỷ lệ lợi nhuận hàng tuần xác định (giá đóng tuần - giá đóng tuần trước)/(giá đóng tuần trước) điều chỉnh chia tách cổ phiếu cổ tức Quan sát 104 tuần liên tiếp xuất để phân phối độc lập, tỷ suất lợi nhuận cổ phiếu có tương quan, mong chờ, cổ phiếu có xu hướng di chuyển để đáp ứng với tổng hợp điều kiện kinh tế Hãy phân tích thành phần phân tích nhân tố dựa phương pháp phân tích thành phần 23 KẾT LUẬN Sau thời gian tìm hiểu, học hỏi từ tài liệu Thầy giáo TS Lê Văn Dũng cung cấp, tơi hồn thành đề tài Luận văn Phân tích thành phần chính, phân tích nhân tố ứng dụng giải vấn đề sau: Hệ thống tính chất vectơ ngẫu nhiên, ma trận ngẫu nhiên mẫu nhiều chiều Đưa phương pháp phân tích liệu : Phân tích thành phần phương pháp nhân tố Xét ứng dụng liên quan đến phân tích thành phần phân tích nhân tố Mặc dù cố gắng thời gian khả có hạn nên chắn luận văn có thiếu sót Vì thế, chúng tơi mong nhận nhiều ý kiến đóng góp q thầy cơ, bạn bè, đồng nghiệp để luận văn hoàn thiện ... phân tích nhân tố phương pháp xử lý liệu phân tích thống kê sử dụng phổ biến Cùng với hướng dẫn TS Lê Văn Dũng, chọn nghiên cứu đề tài " PHÂN TÍCH THÀNH PHẦN CHÍNH, PHÂN TÍCH NHÂN TỐ VÀ ỨNG DỤNG"... pháp phân tích thành phần 23 KẾT LUẬN Sau thời gian tìm hiểu, học hỏi từ tài liệu Thầy giáo TS Lê Văn Dũng cung cấp, tơi hồn thành đề tài Luận văn Phân tích thành phần chính, phân tích nhân tố ứng. .. giải tích Ý nghĩa khoa học thực tiễn đề tài Trong phân tích thống kê thơng thường phải nghiên cứu, tìm hiểu, phân tích lượng liệu lớn Phân tích thành phần với phân tích nhân tố phương pháp phân tích

Ngày đăng: 15/01/2020, 08:45

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN