1. Trang chủ
  2. » Giáo án - Bài giảng

Luận văn Một số bài toán trong thống kê toán học

77 421 1

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 77
Dung lượng 586,86 KB

Nội dung

Luận văn Một số bài toán trong thống kê toán học Luận văn Một số bài toán trong thống kê toán học Luận văn Một số bài toán trong thống kê toán học Luận văn Một số bài toán trong thống kê toán học Luận văn Một số bài toán trong thống kê toán học Luận văn Một số bài toán trong thống kê toán học Luận văn Một số bài toán trong thống kê toán học Luận văn Một số bài toán trong thống kê toán học Luận văn Một số bài toán trong thống kê toán học Luận văn Một số bài toán trong thống kê toán học Luận văn Một số bài toán trong thống kê toán học Luận văn Một số bài toán trong thống kê toán học Luận văn Một số bài toán trong thống kê toán học Luận văn Một số bài toán trong thống kê toán học Luận văn Một số bài toán trong thống kê toán học Luận văn Một số bài toán trong thống kê toán học Luận văn Một số bài toán trong thống kê toán học Luận văn Một số bài toán trong thống kê toán học Luận văn Một số bài toán trong thống kê toán học Luận văn Một số bài toán trong thống kê toán học Luận văn Một số bài toán trong thống kê toán học Luận văn Một số bài toán trong thống kê toán học Luận văn Một số bài toán trong thống kê toán học Luận văn Một số bài toán trong thống kê toán học Luận văn Một số bài toán trong thống kê toán học Luận văn Một số bài toán trong thống kê toán học Luận văn Một số bài toán trong thống kê toán học Luận văn Một số bài toán trong thống kê toán học Luận văn Một số bài toán trong thống kê toán học Luận văn Một số bài toán trong thống kê toán học Luận văn Một số bài toán trong thống kê toán học Luận văn Một số bài toán trong thống kê toán học Luận văn Một số bài toán trong thống kê toán học Luận văn Một số bài toán trong thống kê toán học Luận văn Một số bài toán trong thống kê toán học Luận văn Một số bài toán trong thống kê toán học Luận văn Một số bài toán trong thống kê toán học Luận văn Một số bài toán trong thống kê toán học Luận văn Một số bài toán trong thống kê toán học Luận văn Một số bài toán trong thống kê toán học Luận văn Một số bài toán trong thống kê toán học Luận văn Một số bài toán trong thống kê toán học Luận văn Một số bài toán trong thống kê toán học Luận văn Một số bài toán trong thống kê toán học Luận văn Một số bài toán trong thống kê toán học Luận văn Một số bài toán trong thống kê toán học Luận văn Một số bài toán trong thống kê toán học Luận văn Một số bài toán trong thống kê toán học Luận văn Một số bài toán trong thống kê toán học Luận văn Một số bài toán trong thống kê toán học Luận văn Một số bài toán trong thống kê toán học Luận văn Một số bài toán trong thống kê toán học Luận văn Một số bài toán trong thống kê toán học Luận văn Một số bài toán trong thống kê toán học Luận văn Một số bài toán trong thống kê toán học Luận văn Một số bài toán trong thống kê toán học Luận văn Một số bài toán trong thống kê toán học Luận văn Một số bài toán trong thống kê toán học Luận văn Một số bài toán trong thống kê toán học Luận văn Một số bài toán trong thống kê toán học Luận văn Một số bài toán trong thống kê toán học Luận văn Một số bài toán trong thống kê toán học Luận văn Một số bài toán trong thống kê toán học Luận văn Một số bài toán trong thống kê toán học Luận văn Một số bài toán trong thống kê toán học Luận văn Một số bài toán trong thống kê toán học Luận văn Một số bài toán trong thống kê toán học Luận văn Một số bài toán trong thống kê toán học Luận văn Một số bài toán trong thống kê toán học Luận văn Một số bài toán trong thống kê toán học Luận văn Một số bài toán trong thống kê toán học Luận văn Một số bài toán trong thống kê toán học Luận văn Một số bài toán trong thống kê toán học Luận văn Một số bài toán trong thống kê toán học Luận văn Một số bài toán trong thống kê toán học Luận văn Một số bài toán trong thống kê toán học Luận văn Một số bài toán trong thống kê toán học Luận văn Một số bài toán trong thống kê toán học Luận văn Một số bài toán trong thống kê toán học Luận văn Một số bài toán trong thống kê toán học Luận văn Một số bài toán trong thống kê toán học Luận văn Một số bài toán trong thống kê toán học Luận văn Một số bài toán trong thống kê toán học Luận văn Một số bài toán trong thống kê toán học Luận văn Một số bài toán trong thống kê toán học Luận văn Một số bài toán trong thống kê toán học Luận văn Một số bài toán trong thống kê toán học Luận văn Một số bài toán trong thống kê toán học Luận văn Một số bài toán trong thống kê toán học Luận văn Một số bài toán trong thống kê toán học Luận văn Một số bài toán trong thống kê toán học Luận văn Một số bài toán trong thống kê toán học Luận văn Một số bài toán trong thống kê toán học Luận văn Một số bài toán trong thống kê toán học Luận văn Một số bài toán trong thống kê toán học Luận văn Một số bài toán trong thống kê toán học Luận văn Một số bài toán trong thống kê toán học Luận văn Một số bài toán trong thống kê toán học Luận văn Một số bài toán trong thống kê toán học Luận văn Một số bài toán trong thống kê toán học Luận văn Một số bài toán trong thống kê toán học Luận văn Một số bài toán trong thống kê toán học Luận văn Một số bài toán trong thống kê toán học Luận văn Một số bài toán trong thống kê toán học Luận văn Một số bài toán trong thống kê toán học Luận văn Một số bài toán trong thống kê toán học Luận văn Một số bài toán trong thống kê toán học Luận văn Một số bài toán trong thống kê toán học Luận văn Một số bài toán trong thống kê toán học Luận văn Một số bài toán trong thống kê toán học Luận văn Một số bài toán trong thống kê toán học Luận văn Một số bài toán trong thống kê toán học Luận văn Một số bài toán trong thống kê toán học Luận văn Một số bài toán trong thống kê toán học Luận văn Một số bài toán trong thống kê toán học Luận văn Một số bài toán trong thống kê toán học Luận văn Một số bài toán trong thống kê toán học

BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC SƯ PHẠM HÀ NỘI THONGCHANH VONGLATHSAMY MỘT SỐ BÀI TOÁN TRONG THỐNG KÊ TOÁN HỌC LUẬN VĂN THẠC SĨ TOÁN HỌC Hà Nội, 2015 BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC SƯ PHẠM HÀ NỘI ———————o0o——————– THONGCHANH VONGLATHSAMY MỘT SỐ BÀI TOÁN TRONG THỐNG KÊ TOÁN HỌC Chuyên ngành: Lý thuyết Xác suất Thống kê Toán học Mã số: 60.46.01.06 LUẬN VĂN THẠC SĨ TOÁN HỌC Người hướng dẫn khoa học: TS NGUYỄN HỒNG HẢI Hà Nội, 2015 Lời cảm ơn Tôi xin chân thành bày tỏ lòng biết ơn sâu sắc tới NCVCC TS NGUYỄN HỒNG HẢI, người thầy nhiệt huyết truyền thụ kiến thức, hướng đề tài bảo tận tình, giúp đỡ hoàn thành luận văn Qua luận văn này, muốn gửi lời cảm ơn tới gia đình, thầy cô, anh chị đồng nghiệp bạn bè thông cảm, động viên giúp đỡ tạo điều kiện cho trình làm luận văn Do khả hạn chế nên luận văn khó tránh khỏi thiếu sót khuyết điểm Tôi mong đóng góp ý kiến quý thầy cô giáo bạn để luận văn hoàn chỉnh Tôi xin chân thành cảm ơn! Hà Nội, tháng 10 năm 2015 Học viên Thongchanh VONGLATHSAMY Mục lục Lời cảm ơn i Mục lục i Lý chọn đề tài iv Mô hình hồi quy tuyến tính bội 1.1 1.2 1.3 Giới thiệu tổng quan hồi quy tuyến tính 1.1.1 Mô hình hồi quy tuyến tính cổ điển 1.1.2 Mô hình hồi quy tuyến tính bội 1.1.3 Hồi quy tương quan tuyến tính bội Phương pháp ước lượng bình phương tối thiểu(ước lượng bình phương nhỏ nhất) 17 1.2.1 Tính chất ước lượng phương pháp bình phương cực tiểu 21 1.2.2 Định lý Gauss ước lượng bình phương cực tiểu 23 1.2.3 Hệ số xác định R 24 1.2.4 Khoảng tin cậy hệ số hồi quy βi 24 1.2.5 Kiểm định giả thiết hệ số hồi quy 31 1.2.6 Ước lượng hàm HQTT 33 Giới thiệu số tiêu chuẩn kiểm tra phù hợp mô hình 35 1.3.1 Tiêu chuẩn F 36 1.3.2 Khảo sát phần dư 37 1.3.3 Khảo sát tính đa cộng tuyến X1 , , Xk 43 ii Phân tích thành phần Phân tích nhân tố 44 2.1 Cấu trúc thành phần 45 2.2 Các thành phần biến chuẩn hóa 49 2.3 Phân tích thành phần dựa mẫu 52 2.4 Các kết luận thống kê dựa mẫu lớn 55 2.5 Mô hình phân tích nhân tố trực giao 58 2.6 Các phương pháp phân tích nhân tố trực giao 60 2.6.1 Phương pháp dựa phân tích thành phần 61 2.6.2 Phương pháp hợp lý cực đại 66 Kết luận 70 Tài liệu tham khảo 71 iii MỞ ĐẦU Thống kế toán học lĩnh vực lớn quan trọng lý thyuết xác suất thống kế toán học Nó lĩnh vực có nhiều ứng dụng thực tiễn Lĩnh vực lĩnh vực rộng lớn, khuôn khổ luận văn thạc sĩ trình bày vài kết toán quan trọng Cụ thể trình bày mô hình hồi quy tuyến tính bội; phương pháp phân tích thành phần phân tích nhân tố Chương Mô hình hồi quy tuyến tính bội Phân tích hồi quy phương pháp phân tích thống kê để dự đoán giá trị biến phụ thuộc (biến đáp ứng) theo tập hợp biến độc lập (các biến dùng để dự báo) Nó vận dụng để đánh giá hiệu tác động biến độc lập biến phụ thuộc 1.1 1.1.1 Giới thiệu tổng quan hồi quy tuyến tính Mô hình hồi quy tuyến tính cổ điển Giả sử X1 , , Xk k biến độc lập dùng để dự báo Y biến phụ thuộc cần dự báo Ví dụ, ta giả sử Y giá nhà hành Khi Y phụ thuộc chủ yếu vào yếu tố sau: • X1 diện tích sử dụng (m2 ), • X2 vị trí vùng (thành phố), • X3 giá năm qua, • X4 chất lượng xây dựng (giá xây dựng m2 ) Sự phụ thuộc biến Y theo biến X1 , , Xk nói chung phức tạp Tuy nhiên có số trường hợp phụ thuộc tương đối đơn giản Mô hình hồi quy tuyến tính cổ điển khẳng định Y phụ thuộc tuyến tính vào Xi (nghĩa Y biểu thức bậc X1 , , Xk ) sai số ngẫu nhiên ε Như vậy, Y = β0 + β1 X1 + · · · + βk Xk + ε, (1.1) βi , i = ÷ k hệ số chưa biết Bây ta tiến hành n quan sát độc lập đồng thời k + biến X1 , · · · , Xk , Y Giả sử số liệu quan sát tuân theo mô hình sau: y1 = β0 + β1 x11 + · · · + βk x1k + ε1 y2 = β0 + β1 x21 + · · · + βk x2k + ε2 (1.2) yn = β0 + β1 xn1 + · · · + βk xnk + εn , sai số ε1 , · · · , εn thỏa mãn điều kiện sau: 1) E(εj ) = (việc đo đạc không chịu sai lệch hệ thống ), 2) D(εj ) = σ (phương sai không đổi độ chuẩn xác đo đạc nhau) 3) cov(εi , εj ) = với i = j = ÷ n (các sai lệch bước không ảnh hưởng đến nhau) Mô hình 1.2 viết dạng ma trận sau:         y1 y2 yn         =       xn1 xn2    ε β         x2k   β1   ε2  +      ,    ···        εn βk xnk x11 x12 x1k x21 x22  hoặc, đơn giản Y (n×1) = X β (n×(k+1)) (k+1×1) + ε , (n×1) (1.3) với     X=    x11 x12 x1k x21 x22 x2k xn1 xn2 xnk      (được gọi ma trận thiết kế)    Y = [y1 , y2 , , yn ] ; β = [β0 , β1 , , βk ] ; ε = [ε1 , ε2 , , εn ] , 1.1.2 E(ε) = cov(ε) = (εεT ) = σ In (1.4) Mô hình hồi quy tuyến tính bội 1.1.2.1 Mô hình hồi quy tuyến tính với nhiều biến phụ thuộc Nhiều lúc, biến dự báo X1 , X2 , , Xk ta quan tâm nhiều biến phụ thuộc Thí dụ lượng phân bón, giống trồng ta không quan tâm đến suất lúa mà quan tâm đến độ bạc màu đất Trong phần ta nghiên cứu mối quan hệ tuyến tính m biến phụ thuộc (biến đáp ứng) Y1 , Y2 , , Ym với biến dự báo X1 , , Xk mô hình đây: Y1 = β01 + β11 X1 + · · · + βk1 Xk + η1 , Y2 = β02 + β12 X1 + · · · + βk2 Xk + η2 , (1.5) Ym = β0m + β1m X1 + · · · + βkm Xk + ηm , Trong véc-tơ sai số η = [η1 , · · · , ηm ] có E(η) = 0, cov(η) = Σ Như σij = cov(ηi , ηj ) khác không i = j Bây giả sử ta có n quan sát (xj1 , xj2 , , xjk , yj1 , , yjm ), j = ÷ n véc-tơ (X1 , , Xk , Y1 , , Ym ) Sai số quan sát thứ j εj = [εj1 , εj2 , , εjm ] , εji = yji − (β0i + β1i xj1 + · · · + βki xjk ); i = ÷ m Giả sử Yj = [yj1 , , yjm ] quan sát thứ j biến đáp ứng [Y1 , , Ym ] Y(i) = [y1i , y2i , , yni ] quan sát biến phụ thuộc Yi ; i = ÷ m Đặt  y11 y12 y1m    y21 y22 · · · y2m Y =  n×m   yn1 yn2 · · · ynm  x11 x1k    x21 · · · x2k X =  (n×k+1)   xn1 · · · xnk  ε11 ε12      = [Y(1) Y(2) · · · Y(m) ]      β β β0m   01 02     β11 β12 · · · β1m ; β  =    (k+1×m)    βk1 βk2 · · · βkm ε1m    ε21 ε22 · · · ε2m ε =  (n×m)   εn1 εn2 · · · εnm              = [ε(1) ε(2) · · · ε(m) ]    Khi mô hình hồi quy tuyến tính số đo biểu diễn phương trình ma trận sau: (với ý Y(1) , , Y(m) , ε(1) , , ε(m) véc-tơ cột ma trận Y ε) Y = Xβ + ε, (1.6) với giả thiết sau ma trận sai số: E(ε(j) ) = 0, cov(ε(i) , ε(j) ) = σij In j, i = 1, 2, , m, (1.7) tức với thứ tự quan sát sai số εli εlj (i = j) có tương quan, với thứ tự quan sát khác εli , εji (l = j) không tương quan với nhau; β Σ = [σij ] ma trận tham số chưa biết 1.1.2.2 Ước lượng tham số chưa biết mô hình Đầu tiên ta xét mô hình riêng lẻ Y(i) = Xβ(i) + ε(i) , i = ÷ m, (1.8) 3.981 < λ1 < 26.741 0.14 + 1.96 2/14 < λ5 < 0.14 − 1.96 2/14 , 0.08 < λ5 < 0.54 B PHÂN TÍCH NHÂN TỐ Ý tưởng phân tích nhân tố nêu K Pearson C Spearman vào đầu kỷ Vào năm 1904 C Spearman công bố báo tiếng xem quan điểm khởi đầu cho lý thuyết phân tích nhân tử Spearman xem xét điểm kiểm tra học sinh tiếng Pháp, tiếng Anh, Toán, Âm nhạc đặc trưng cho yếu tố "thông minh" học sinh, nhóm điểm số khác tương ứng với nhân tố khác phát có hiệu ứng hệ thống tromg ma trận tương quan điểm số Ông nhận kết từ 33 học sinh tiểu học tính thành ma trận tương quan sau 1.Văn học − 2.Pháp văn 83 3.Anh văn 83 78 70 .66 63 − 67 67 65 57 78 67 − 5.Toán học 70 67 64 64 45 51 − 45 51 4.Thể chất 66 65 54 45 − 40 5.Âm nhạc 63 58 51 51 40 − Trên bảng có chủ ý thứ tự môn theo giảm dần hệ số tương quan (từ trái sang phải) Khi đó, Spearman nhận xét giá trị giảm dần theo dòng ước chừng độ rộng Ông cho kiện giải thích điểm số thứ i bao gồm hai thành phần xi = f + εi , f biến ngẫu nhiên chung cho tất xi (chỉ độ "thông minh" sinh viên) εi nét đặc trưng biến xi (chỉ khiếu, khả dạy dỗ môn học) Vì vậy, mục đích phân tích nhân tố mô tả "cái chung" Nó thể dạng mối quan hệ tương quan nhiều biến thông qua số 57 biến Các biến không quan sát gọi nhân tố (factors) 2.5 Mô hình phân tích nhân tố trực giao Xét véc-tơ ngẫu nhiên quan sát X = (X1 , , Xk ) có E(X) = µ cov(X) = Σ Mô hình nhân tố giả định X tổ hợp tuyến tính số biến ngẫu nhiên không quan sát F1 , , Fm (m < k) gọi nhân tố chung k biến cộng thêm ε1 , , εk gọi sai số nhân tố xác định Cụ thể hơn: X1 − µ1 = l11 F1 + l12 F2 + · · · + l1m Fm + ε1 , X2 − µ2 = l21 F1 + l22 F2 + · · · + l2m Fm + ε2 , (2.21) Xk − µk = lk1 F1 + lk2 F2 + · · · + lkm Fm + εk Hoặc dạng ma trận X −µ= (k×1) L × F + ε (k×m) (m×1) (2.22) (k×1) Phân tử lij ma trận L gọi tải trọng biến thứ i Xi , đặt lên nhân tố thứ j Fj Sai số εi gắn với biến thứ i Như vậy, X1 − µ1 , , Xk − µk biểu diễn qua m + k biến F1 , , Fm ε1 , , εk Việc tìm F1 , , Fm ε1 , , εk toán không giải Tuy nhiên, giả thiết thêm E(F ) = 0, cov(F ) = E(F F ) = I E(ε) = 0; cov(ε) = E(εε ) = ψ = diag(ψ1 , , ψk ), F, ε không tương quan, tức cov(ε, F ) = E(εF ) = (k×m) toán có lời giải 58 Như ta cần xét mô hình nhân tố trực giao đây: X = µ + LF + ε, với µi = EXi , εi nhân tố xác định thứ i, Fj nhân tố chung thứ j, lij tải trọng biến Xi đặt lên nhân tố Fj với giả thiết E(F ) = 0; E(ε) = 0, cov(F ) = I, cov(ε) = ψ = diag(ψ1 , , ψk ), cov(ε, F ) = (2.23) Nếu có mô hình trực giao nói cov(X) = Σ = LL + ψ (2.24) Thật E(X − µ)(X − µ ) = cov(X) = cov(LF + ε) = cov(LF ) + cov(L F, ε) + cov(ε, LF ) + cov(ε) = L cov(F )L + + + ψ = LL + ψ Như vậy, việc tìm cấu trúc mô hình nhân tố trực giao đưa đến việc tách ma trận hiệp phương sai dạng ( 2.24) Chú ý L thỏa mãn (2.24) với ma trận trực giao T ta có L∗ = LT thỏa mãn (2.24) Thật vậy, Σ = LL + ψ = LT T L + ψ = L∗ L∗ + ψ Như vậy, hệ thức phân tích (2.23) xác định L sai khác phép biến đổi trực giao Từ (2.24) ta có: 2 D(Xi ) = li1 + · · · + lim + ψi = σii cov(Xi , Xj ) = li1 lj1 + · · · + lim ljm = σij cov(Xi , Fj ) = lij 2 Đại lượng h2i = li1 + · · · + lim gọi phương sai chung, ψi gọi phương sai xác định Như 2 σii = li1 + · · · + lim + D(Xi ) phương sai chung 59 ψi phương sai xác định Tóm lại, ứng với mô hình nhân tố trực giao, ta có cấu trúc sau hiệp phương sai cov(X) = Σ = LL + ψ, 2 + ψi + · · · + lim D(Xi ) = li1 cov(Xi , Xj ) = li1 lj1 + · · · + lim ljm (2.25) cov(X, F ) = L cov(Xi , Fj ) = lij Ví dụ 2.5.1 Xét ma trận hiệp phương sai sau:  19 30 12    30 57 23 Σ=   38 47  12 23 47 68         Dễ thấy rằng:     Σ=   −1           −1  +    0    0 0    0      = LL + ψ h21 = 42 + 12 = 17, ψ1 = Như vậy: σ11 = 19 = 17 + = h21 + ψ1 2.6 Các phương pháp phân tích nhân tố trực giao Cho n quan sát độc lập X1 , , Xn véc-tơ ngẫu nhien X Chúng ta cần phải trả lời câu hỏi sau: 1) Mô hình (2.23) với m nhỏ có phù hợp với thực tế không? 2) Mô hình phân tích ma trận hiệp phương sai (2.25) có thích hợp không? 60 Thực chất ta cần phải vấn đề 2) Nếu phần tử sii ma trận hiệp sai mẫu S tỏ vượt trội so với phần tử đường chéo chính, điều có nghĩa phần tử đường chéo R gần không (rij ≈ ∀i = j) việc phân tích nhân tố tỏ không cần thiết Nếu trường hợp không xảy việc phân tích nhân tố chung tỏ cần thiết toán đặt ước lượng số m nhân tố chung ước lượng tham số tải trọng lij phương sai xác định ψi Hai phương pháp thông dụng để giải vấn đề nói phương pháp phân tích thành phần phương pháp hợp lý cực đại 2.6.1 Phương pháp dựa phân tích thành phần Giả sử (λ1 , e1 ), , (λk , ek ) k cặp giá trị riêng véc-tơ riêng ma trận cov(X) = Σ Khi Σ = λ1 e1 e1 + · · · + λk ek ek = [ λ1 e1 · · · λk ek ][ λ1 e1 · · · λk ek ] Như vậy, thực phân tích phổ Σ với m = k nhân tố Σ = L (k×k) L +0 = LL , (2.26) (k×k) (k×k) √ √ L = [ λ1 e1 · · · λk ek ] Mặc dù phân tích (2.26) xác ích thực tế m = k Người ta muốn có phân tích (2.26) với m < k Một cách tiếp cận k − m giá trị riêng λm+1 , , λk nhỏ phân tích (2.26) đại lượng λm+1 em+1 em+1 + · · · + λk ek ek bỏ qua vậy: Σ=[ λ1 e1 · · · λm em ] [ λ1 e1 · · · L λm em ] = LL (2.27) L Giả sử ψ ma trận chéo có phần tử đường chéo ψi σii trừ 61 phần tử đường chéo LL Khi Σ = LL + ψ = [ λ1 e1 · · · m ψi = σii − λ1 e1 · · · λm em ][ λm em ] + diag(ψ1 , , ψk ) (2.28) ; i = ÷ k lij j=1 Ta áp dụng kỹ thuật phân tích (2.28) với dãy quan sát X1 , , Xn theo thông lệ dãy quy tâm Nói cách khác thay xét dãy X1 , , Xn ta xét dãy:     Xj − X =     xj1       xj2      −      xjk x1 x2 xk      xj1 − x1   =     xjk − xk    ,j = ÷ n  (2.29) Dãy X1 , , Xn dãy (2.29) có ma trận hiệp phương sai mẫu S Tương tự mẫu (2.29), người ta xét mẫu chuẩn hóa  1/2 (xj1 − x1 )/s11   1/2  (xj2 − x2 )/s22  Zj =    1/2 (xjk − xk )/skk      ; j = ÷ n    (2.30) Dãy Zj có ma trận hiệp phương sai R ma trận tương quan mẫu mẫu X1 , X2 , , Xn Tiếp ta thực phân tích tương tự (2.28) cho ma trận S R Sau giải pháp phân tích thành phần cho mô hình nhân tố trực giao: Phân tích ma trận S = λ1 eˆ1 e1 + · · · + λk eˆk ek , (λ1 , e1 ), , (λk , ek ) k cặp giá trị riêng véc-tơ riêng S Giả sử λm+1 , , λk bé Khi giả sử m số nhân tố ta muốn phân tích Khi ma trận tải trọng nhân tố [lij ] ước lượng L = [ λ1 e1 · · · 62 λm em ] (2.31) Các phương sai xác định ψi ước lượng phần tử đường chéo ma trận S − LL : m lij ψ = diag(ψ1 , , ψm ) với ψi = sii − (2.32) j=1 Các phương sai chung ước lượng 2 h2i = li1 + · · · + lim (2.33) Phân tích nhân tố thành phần ma trận tương quan mẫu thực tương tự cách thay S R ˆ + ψ) Người ta chứng minh (xem Xét ma trận dư S − (LL tập 4.5 [1]): tổng bình phương phần tử S − (LL + ψ) bé λ2m+1 + · · · + λ2k Như vậy, λm+1 + · · · + λ2k đủ bé coi S = LL + ψ Ví dụ 2.6.1 Để nghiên cứu sở thích khách hàng, mẫu nghiên cứu khách hàng vấn để phân loại đặc tính sản phẩm Các câu hỏi tính chất sản phẩm, tính chất vấn cấp độ khác Kết người ta thu ma trận tương quan mẫu sau đây:            1.00 0.02 0.96 0.42 0.01    1.00 0.13 0.71 0.85    1.00 0.50 0.11    1.00 0.79   1.00 Nhìn vào ma trận tương quan mẫu ta thấy biến tạo thành nhóm biến (2,4,5) tạo thành nhóm khác Hai thành phần ứng với λ1 = 2.85; λ2 = 1.81 hai giá trị riêng 63 lớn Khi λ1 + λ2 2.85 + 1.81 = = 0.93 k Như λ1 , λ2 chiếm 93% phương sai tổng cộng k = chuẩn hóa Từ (2.31), ta có λ1 e1 λ2 e2  0.56    0.78    0.65    0.94  0.80 LL + ψ =       +     0.02 0 0.82      0.56 0.78 0.65 0.94 0.8 −0.53      0.82 −0.53 0.75 −0.10 −0.54 0.75    −0.10   −0.54 0 0.12 0 0 0.02 0 0 0.11 0 0 0.07             =         1.00 0.1 0.97 0.44 0.00    1.00 0.11 0.79 0.91    1.00 0.53 0.11  ,   1.00 0.81   1.00 kết ≈ R Người ta sử dụng phương pháp phân tích nhân tố thành phần cải biên sau: Nếu mô hình nhân tố trực giao ρ = LL + ψ xác định xác với m nhân tố chung ρii = = h2i + ψi ρ − ψ = LL Bây giờ, giả sử ψi∗ giá trị thử phương sai xác định ψi Khi thay phần tử thứ i đường chéo R − ψi∗ ta nhận 64 ma trận tương quan mẫu bị giảm thiểu là:  h∗1 r12 r1k   R∗ =      h∗2 r2k   ∗2 hk Khi R∗ cần phải tính đến m nhân tố, tức ta phải có R∗ = L∗ L∗ L∗ = [lij ] ước lượng ma trận tải trọng, tức là: L∗ = [ λ∗1 e∗1 , , λ∗m e∗m ] m ψi∗ ∗2 lij , =1− j=1 (λ∗i , e∗i ), i = ÷ m cặp giá trị riêng véc-tơ riêng R∗ Tiếp phương sai chung ước lượng lại m h˜∗2 i = ∗2 lij j=1 ˜ ∗2 giá trị ước lượng ban đầu Việc tiếp tực lặp lại trình với h i phương sai chung Điều phức tạp nảy sinh gặp phải giá trị riêng λ∗i âm ước lượng phương sai chung ban đầu Nói chung số nhân tố chung hạng ma trận ρ Đáng tiếc rank(ρ) nói chung người ta phải đoán trước Thông thường người ta chọn ước lượng ban đầu ψi ψi∗ = 1/rii , rii phần tử thứ i đường chéo R−1 65 2.6.2 Phương pháp hợp lý cực đại Nếu nhân tố chung F nhân tố ε có phân bố đồng thời chuẩn ta sử dụng phương pháp hợp lý cực ước lượng ma trận tải trọng L ma trận phương sai xác định ψ Giả sử ta có phân tích nhân tố X − µ = LF + ε Khi n quan sát X1 , , Xn có phân tích Xj − µ = LFj + εj , j = ÷ n Khi đó, theo công thức (3.2.6) [1], ta có hàm hợp lý L(µ, Σ) = 2π −nk/2 |Σ|−n/2 ∗ n ∗ exp − trΣ−1 ( (Xj − X)(Xj − X) + n(X − µ)(X − µ) ) j=1 (2.34) mà phụ thuộc vào L ψ qua Σ = LL + ψ Mô hình chưa xác định L xác định sai khác ma trận trực giao nhân với Vì vậy, để tiện cho việc tính toán người ta buộc thêm điều kiện: L ψ −1 L = ∆ ma trận chéo (2.35) Khi ước lượng hợp lý cực đại L, ψ nhận cách cực đại hóa (2.34) với điều kiện (2.35) Ta có mệnh đề sau: Mệnh đề 2.6.2 Giả sử X1 , , Xn mẫu ngẫu nhiên từ phân bố chuẩn Nk (µ, Σ), Σ = LL + ψ ma trận hiệp phương sai m nhân tố chung Khi ước lượng hợp lý cực đại L, ψ µ = X cực đại hóa (2.35) với điều kiện Lψ −1 L đường chéo Ước lượng hợp lý cực đại phương sai chung 2 h2i = li1 + · · · + lim ,i = ÷ k (2.36) Như vậy, tỷ lệ phương sai mẫu nhân tố thứ j tổng cộng phương sai 66 mẫu 2 l1j + l2j + · · · + lkj /(s11 + · · · + skk ) (2.37) Chứng minh Do tính chất bất biến ước lượng hợp lý cực đại hàm L ψ 2 ước lượng hàm L ψ, cụ thể phương sai chung hi = li1 + · · · + lim 2 ước lượng li1 + · · · + lim Nhận xét Ta có kết tương tự thay Σ ρ Người ta có chương trình hiệu để tìm dễ dàng ước lượng hợp lý cực đại L, ψ Ví dụ 2.6.3 Các số liệu giá chứng khoán gồm n = 100 lãi suất chứng khoán k = loại chứng khoán công ty khác Sau phân tích thành phần ma trận tương quan mẫu R người ta giữ lại thành phần để giải toán phân tích nhân tố Kết cho bảng 2.2 Lời giải với m = nhân tố Các biến (Công ty) Ước lượng tải trọng Ước lượng phương sai F1 F2 xác định ψi = − h2i Ct hóa học Allied 0.783 -0.217 0.34 CT cầu 0.733 -0.458 0.19 Liên đoàn Carbide 0.794 -0.234 0.31 CT Exxon 0.713 0.472 0.27 CT Texaco 0.712 0.542 0.22 Tỉ lệ tích lũy phương sai 0.571 0.733 mẫu thành phần với tổng phương sai ((λ1 + λ2 )/5) Bảng 2.2: Sau ma trận dư thừa ứng với phân tích hai nhân tố 67   −0.127 −0.164 −0.069 0.017      −0.122 0.055 0.012     ˆ −ψ = R − LL  −0.019 −0.017       −0.232    Bảng 2.3 cho ta kết phân tích nhân tố phương pháp hợp lý cực đại Ma trận phần dư: Ước lượng hợp lý cực đại Các biến (công ty) Ước lượng tải trọng Ước lượng phương sai F1 xác định ψi = − h2i F2 Ct hóa học Allied 0.684 0.189 0.50 CT cầu 0.694 0.517 0.25 Liên đoàn Carbide 0.681 0.248 0.47 CT Exxon 0.621 -0.073 0.61 CT Texaco 0.792 -0.442 0.18 Tỉ lệ tích lũy phương sai 0.485 0.598 mẫu nhân tố tổng số phương sai mẫu Bảng 2.3:   0.005 −0.004 −0.024 −0.004      −0.003 −0.004 0.000      R − LL − ψ =  0.031 −0.004       −0.000    Như phần dư ma trận nhỏ đáng kể so với phần tử ma trận dư nhận phương pháp phân tích thành phần Trong tỷ lệ tích lũy phương sai giải thích thành phần lớn tỉ lệ tương ứng 68 nhận phương pháp hợp lý cực đại, điều đáng ngạc nhiên phương pháp phân tích thành phần đảm bảo tính chất tối ưu phương sai Ta thấy tất biến có tải trọng dương xấp xỉ nhân tố F1 Ta gọi nhân tố nhân tố thị trường Còn nhân tố thứ hai F2 gọi nhân tố công nghiệp Nhân tố thể rõ tải trọng F2 biến Ảnh hưởng nhân tố làm rõ ta thực phép quay, tức thay xét L ta xét L∗ = LT T phép biến đổi trực giao bảng 2.4 Các biến (Công ty) ƯL hợp lý cực ƯL tải trọng Phương sai xác đại tải trọng qua phép quay định ψi = − h2i F1 F2 F1∗ F2∗ Ct hóa học Allied 0.684 0.189 0.601 0.377 0.50 CT cầu 0.694 0.517 0.850 0.164 0.25 Liên đoàn Carbide 0.681 0.248 0.643 0.335 0.47 CT Exxon 0.621 -0.073 0.365 0.507 0.61 CT Texaco 0.792 -0.443 0.208 0.883 0.18 Tỉ lệ tích lũy phương 0.485 0.598 0.335 0.598 sai mẫu nhân tố tổng số phương sai mẫu Bảng 2.4: Cij ước lượng không chệch cov(Ui , Uj ) ma trận C = n (Cij ) n−1 ước lượng không chệch ma trận (cov(Ui , Uj )) Người ta chứng minh U có phân bố chuẩn Np (µ, A) véc-tơ U độc lập với ma trận C 69 KẾT LUẬN Luận văn trình bày gồm hai nội dung mặt thực chất nội dung thứ bổ trợ cho việc trình bày nội dung thứ hai (là mục tiêu chính) luận văn • Nội dung thứ trình bày lý thuyết hồi qui Ở tập trung chủ yếu trình bày hồi qui tuyến tính bội • Nội dung thứ hai trình bày vấn đề phân tích thành phần phân tích nhân tố Đây vấn đề (bài toán) quan trọng Thống kê Toán học Tuy nhiên với khuôn khổ luận văn thạc sỹ, trình bày vấn đề quan trọng kết chủ yếu Luận văn trình bày nhiều ví dụ cụ thể minh họa Tài liệu tham khảo [1] Nguyễn Văn Hữu Nguyễn Hữu Dư, Phân tích thống kê dự báo, NXB Đại học Quốc gia Hà Nội, 2003 [2] Phạm Văn Kiều, Giáo trình thống kê toán học, Đề tài nghiên cứu khoa học cấp bộ, Trương Đại học Sư Phạm Hà Nội, 2002 [3] Phạm Văn Kiều, Giáo trình xác suất thống kê, NXB giáo dục Việt Nam, 2004 [4] Đào Hữu Hồ, Nguyễn Văn Hữu, Hoàng Hữu Như Thống kê toán (1985) [5] Cramer H.,Mathematical Methods in Statistics, Princeton, 1948 71 ... ĐẠI HỌC SƯ PHẠM HÀ NỘI ———————o0o——————– THONGCHANH VONGLATHSAMY MỘT SỐ BÀI TOÁN TRONG THỐNG KÊ TOÁN HỌC Chuyên ngành: Lý thuyết Xác suất Thống kê Toán học Mã số: 60.46.01.06 LUẬN VĂN THẠC SĨ TOÁN... thành luận văn Qua luận văn này, muốn gửi lời cảm ơn tới gia đình, thầy cô, anh chị đồng nghiệp bạn bè thông cảm, động viên giúp đỡ tạo điều kiện cho trình làm luận văn Do khả hạn chế nên luận văn. .. lý cực đại 66 Kết luận 70 Tài liệu tham khảo 71 iii MỞ ĐẦU Thống kế toán học lĩnh vực lớn quan trọng lý thyuết xác suất thống kế toán học Nó lĩnh vực có nhiều ứng dụng thực

Ngày đăng: 02/04/2017, 13:15

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w