Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 29 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
29
Dung lượng
1,49 MB
Nội dung
Cơng trình hồn thành ĐẠI HỌC ĐÀ NẴNG GV hướng dẫn: TS Lê Văn DũngPhản biện: ThS Nguyễn Thị Hải Yến Khóa luận bảo vệ trước hội đồng chấm Khóa luận tốt nghiệp cử nhân họp Đại học Sư phạm Đà Nẵng vào ngày 27 tháng năm 2019 Có thể tìm hiểu khóa luận Thư viện trường Đại học Sư phạm, Đại học Đà Nẵng MỤC LỤC PHẦN MỞ ĐẦU Tính cấp thiết đề tài 2 Mục tiêu nghiên cứu Đối tượng phạm vi nghiên cứu Phương pháp nghiên cứu Bố cục đề tài Tổng quan tài liệu nghiên cứu CHƯƠNG CƠ SỞ LÝ THUYẾT 1.1 VECTƠ NGẪU NHIÊN VÀ MA TRẬN 1.1.1 Vectơ ma trận a Vectơ b Ma trận c Căn bậc hai ma trận 1.1.2 Vectơ ngẫu nhiên a Vectơ trung bình ma trận hiệp phương sai b Chia khối ma trận c Hàm mật độ xác suất đồng thời d Vectơ trung bình ma trận hiệp phương sai tổ hợp tuyến tính vectơ ngẫu nhiên 1.1.3 Phân bố chuẩn nhiều chiều a Định nghĩa b Tính chất 1.2 ƯỚC LƯỢNG VÀ KIỂM ĐỊNH 1.2.1 Vectơ trung bình mẫu, ma trận hiệp phương sai mẫu 1.2.2 Phân bố mẫu trung bình mẫu 1.2.3 Nhận dạng phân bố chuẩn nhiều chiều 1.2.4 Kiểm định giả thuyết vectơ trung bình CHƯƠNG PHÂNTÍCHTHÀNHPHẦNCHÍNHVÀPHÂNTÍCHNHÂNTỐ VỚI PHẦNMỀM MINITAB 10 2.1 PHÂNTÍCHTHÀNHPHẦNCHÍNH 10 2.1.1 Cấu trúc thànhphần 10 2.1.2 Các thànhphần chuẩn hóa 13 2.1.3 Phântíchthànhphần dựa mẫu 13 2.2 PHÂNTÍCHNHÂNTỐ 16 2.2.1 Mơ hình phântíchnhântố trực giao 16 2.2.2 Phương pháp ước lượng 17 2.2.3 Xoay nhântố 18 2.3 ỨNG DỤNGPHẦNMỀM MINITAB 20 2.3.1 Phântíchthànhphần 20 2.3.2 Phântíchnhântố 20 KẾT LUẬN 28 PHẦN MỞ ĐẦU Tính cấp thiết đề tài Một vấn đề quan trọng đặt việc nghiên cứu phântích xử lý số liệu thu thập Nếu bảng số liệu thu thập lớn việc tìm hiểu thơng tin từ khó khăn phức tạp Mục tiêu nghiên cứu Phântích liệu cụ thể từ đề tài thực tế đưa nhận xét, đánh giá liệu xử lý Đối tượng phạm vi nghiên cứu Mỗi liệu thu thập tiến hành nghiên cứu, thí nghiệm thường thể dạng bảng giá trị số nhiều cá thể Chúng tạo thành “đám mây số liệu” phức tạp Các số liệu cần phântích xử lí để rút nhận xét, đánh giá thích hợp Phương pháp nghiên cứu Hai phương pháp đơn giản PhântíchthànhphầnPhântíchnhântốsửdụngthôngquaphầnmềm Minitab Bố cục đề tài Bài báo cáo trình bày hai phương pháp nói thống kê nhiều chiều Sau đưa ví dụ phântích cụ thể số liệu từ đề tài khoa học Đây hai phương pháp đơn giản có tính hiệu cao số nhiều phương pháp phântích số liệu đưa nhà thống kê, nhiên việc ứng dụng chúng nghiên cứu thực nghiệm, đề tài thuộc lĩnh vực khoa học hạn chế Bài báo cáo phần giúp ta thấy hữu ích việc áp dụng kiến thức thống kê việc nghiên cứu Tổng quan tài liệu nghiên cứu Phântíchthànhphần kĩ thuật biểu diễn số liệu dựa theo tiêu chuẩn đại số hình học mà khơng đòi hỏi giả thuyết thống kê hay mơ hình đặc biệt Lĩnh vực áp dụngphântíchthànhphần rộng, nơng nghiệp, kinh tế, khoa học Phântíchnhântố kĩ thuật ghép điểm quan sát lại thành nhóm theo tiêu chí đó, tương tự cách phân loại sinh học Việc phântích có thuật tốn đơn giản, đồng thời đem lại nhìn trực quan phân loại thu nên dễ nhà chuyên môn ngành khoa học khác chấp nhận CHƯƠNG CƠ SỞ LÝ THUYẾT 1.1 VECTƠ NGẪU NHIÊN VÀ MA TRẬN 1.1.1 Vectơ ma trận a Vectơ x1 x Cho x ( x1, x2 , , xn ) Ta viết dạng ma trận x sau: xT [ x1 , x2 , , xn ] xn Các phép toán: Cho c x1 y1 x y , y 2 vectơ: x xn yn x1 y1 x y 2 - Phép cộng: x y xn yn cx1 cx 2 cx - Phép nhân với số: cxn - Tích vơ hướng: xT y x1 y1 x2 y2 xn yn - Độ dài vectơ: Lx x12 x22 xn2 xT y - Góc hai vectơ: cos Lx Ly Hệ trực chuẩn p vectơ e1 , e2 , , e p không gian vectơ p gọi hệ trực chuẩn ei với i ei e j với i j b Ma trận Ma trận A [aij ]n p bảng số hình chữ nhật gồm n hàng p cột Các phép toán: Cho c ma trận A [aij ]n p , B [bij ]n p , C [cij ] pq - Cộng hai ma trận: A B [aij bij ]n p - Tích số với ma trận: cA [caij ]n p - Nhân hai ma trận: AC [dij ]nq với dij p a k 1 c ik kj Ma trận chuyển vị ma trận A [aij ]nn kí hiệu AT ma trận xác định A [bij ] với T bij a ji Ma trận đối xứng: ma trận vuông A [aij ]nn ma trận đối xứng aij a ji Ma trận đường chéo: A ma trận đường chéo aij với i j Khi A kí hiệu A diag (aii ) Ma trận đơn vị ma trận đường chéo có phần tử đường chéo Kí hiệu I n ma trận đơn vị cấp n 1 1 Ma trận nghịch đảo: Nếu tồn ma trận A1 cho A A A A I n A1 gọi ma trận nghịch đảo ma trận A Ma trận trực giao: ma trận vuông A ma trận trực giao AT A1 Giá trị riêng vectơ riêng ma trận vuông Cho A ma trận vuông cấp n , tồn vectơ x số thực cho Ax x gọi giá trị riêng x gọi vectơ riêng ứng với d Vết ma trận tổng phần tử nằm đường chéo ma trận vng Ma trận xác định không âm x Ann x với x n Kí hiệu: A Ma trận xác định dương x Ann x với x n , x Ann x x (0, ,0) T T T n Kí hiệu: A0 Định lý 1.1 Nếu A giá trị riêng A số thực không âm Định lý 1.2 Nếu ma trận Ap p có p cặp giá trị riêng - vectơ riêng (1; e1 ) , (2 ; e2 ) , , ( p ; e p ) với e1 , e2 , , e p hệ trực chuẩn A 1e1e1T 2e2e2T pepeTp c Căn bậc hai ma trận Cho Ap p ma trận đối xứng, xác định không âm Đặt PT [e1 , e2 , , ep ] , diag (1 , , p ) , 1/2 diag ( , , p ) Khi ma trận A1/2 P1/2 PT thỏa mãn A1/2 A1/2 A Do ta gọi ma trận A1/2 bậc ma trận A Ta có hệ thức sau: (1) ( A ) A 1/2 T 1/2 1 1/2 1/2 (2) ( A ) P 1.1.2 PT nên kí hiệu ( A1/2 )1 A1/2 Vectơ ngẫu nhiên Cho X1 , X , , X n biến ngẫu nhiên xác định không gian xác suất (, X ( X1, X , , X n ) gọi vectơ ngẫu nhiên n chiều Dạng ma trận X sau , P ) Kí hiệu X1 X X T [ X1 , X , , X n ] Xn Tương tự, cho X ij với i 1, 2, , m ; j 1, 2, , n mn biến ngẫu nhiên xác định khơng gian , P ) X [ X ij ]mn gọi ma trận ngẫu nhiên xác suất (, a Vectơ trung bình ma trận hiệp phương sai Cho vectơ ngẫu nhiên X ( X1 , X , , X n ) Giả sử E( X i ) i cov( X i ; X j ) ij Khi đó, 11 12 [1 , 2 , , n ]T gọi vectơ trung bình, 21 22 n1 n 1n n gọi ma trận hiệp nn phương sai Gọi ij ij ii jj 11 12 22 21 hệ số tương quan X i X j Khi đó, n1 n 1n 2 n nn gọi ma trận tương quan b Chia khối ma trận Chia vectơ ngẫu nhiên X ( X1 , X , , X n ) thành hai vectơ p chiều n p chiều sau: X (1) X1 X p X (2) X p 1 X n X (1) Khi ta viết: X X (2) (1) 1 p 1 (1) (2) Với cách kí hiệu ta có , với , (2) p n Mặt khác ( X (1) (1) )( X (1) (1) )T ( X )( X )T ( X (2) (2) )( X (1) (1) )T ( X (1) (1) )( X (1) (1) )T ma trận cấp p p ( X (1) (1) )( X (2) (2) )T (2) (2) (2) (2) T ( X )( X ) ( X (1) (1) )( X (2) (2) )T ma trận cấp p (n p) ( X (2) (2) )( X (1) (1) )T ma trận cấp (n p) p ( X (2) (2) )( X (2) (2) )T ma trận cấp (n p) (n p) Ma trận hiệp phương sai chia khối sau 11 21 11 E ( X (1) 12 , 22 (1) )( X (1) (1) )T 12 E ( X (1) (1) )( X (2) (2) )T 21 E ( X (2) (2) )( X (1) (1) )T 22 E ( X (2) (2) )( X (2) (2) )T c Hàm mật độ xác suất đồng thời Nếu X ( X1, X , , X n ) vectơ ngẫu nhiên rời có rạc miền giá trị X () {xi ( x1i , x2i , , xni ) : i 1} hàm xác suất đồng thời X hàm p : X () xác định p( xi ) P( X xi ) Nếu X ( x1, X , , X n ) gồm n biến ngẫu nhiên liên tục tồn hàm số không âm f ( x) xác định n cho với A [a1; b1 ] [an ; bn ] n , P( X A) A f ( x)dx f ( x) gọi làm mật độ xác suất đồng thời X Định lý 1.3 Nếu X1 , X , , X n biến ngẫu nhiên độc lập có hàm mật độ xác suất f1 ( x1 ) , f2 ( x2 ) , , fn ( xn ) hàm mật độ xác suất đồng thời X f ( x) f1 ( x1 ) f ( x2 ) f n ( xn ), x ( x1, x2 , , xn ) n d Vectơ trung bình ma trận hiệp phương sai tổ hợp tuyến tính vectơ ngẫu nhiên Nếu X1 X hai biến ngẫu nhiên, a b số thực thì: (1) E(aX1 bX ) aE( X1 ) bE( X ) (2) Var (aX1 bX ) a Var ( X1 ) b Var ( X ) 2ab12 2 T Đặt C [a, b] , X [ X1 , X ] ,ta có: aX1 bX C X Và đó: T T E (CT X ) CT E ( X ) Var (CT X ) CT cov( X )C Một cách tổng quát, C [c1 , c2 , , cn ] vectơ số X [ X1 , X , , X n ] vectơ ngẫu T T nhiên E(C X ) C E( X ) C T T T Var (C X ) C cov( X )C C C T T T Nếu C [cij ]mn ma trận số c11 X1 c12 X c1n X n c X c X c X 2n n CX 21 22 cm1 X1 cm X cmn X n T Khi đó, E (CX ) CE ( X ) , cov(CX ) Ccov( X )C 1.1.3 Phân bố chuẩn nhiều chiều a Định nghĩa Định nghĩa 1.1 Vectơ ngẫu nhiên X ( X1 , X , , X p ) gọi có phân bố chuẩn p chiều với T tham số T (1, 2 , , p )T [ ij ] p p ( ) X có hàm mật độ xác suất đồng thời: ( x) e (2 ) p /2 | |1/2 ( x )T 1 ( x ) Kí hiệu X ~ N p ( ; ) b Tính chất Tính chất 1.1 Nếu X có phân bố chuẩn p chiều N p ( ; ) thànhphần X X1 , X , , X p có phân bố chuẩn chiều T Tính chất 1.2 Nếu X có phân bố chuẩn N p ( ; ) với a [a1 , a2 , , a p ] ta có aT X a1 X1 a2 X a p X p ~ N (aT ; aT a) Ta có a X a1 X1 a2 X a p X p ~ N (a T T ; aT a) với aT [a1 , a2 , , a p ] X có phân bố chuẩn N p ( ; ) T Tính chất 1.3 Nếu X có phân bố chuẩn N p ( ; ) với A [aij ]n p , ta có: AX ~ N ( A; AA ) Tính chất 1.4 Nếu xác định dương 1 tồn tại, ( ; e) cặp giá trị riêng - vectơ riêng ( ; e) cặp giá trị riêng - vectơ riêng 1 1 Tính chất 1.5 Nếu X có phân bố chuẩn p chiều N p ( ; ) ( X )T ( X ) có phân bố p2 (phân bố bình phương p bậc tự do) Do đó, với mức ý nghĩa , ta có: P(( X )T ( X ) p2 ( )) 1.2 ƯỚC LƯỢNG VÀ KIỂM ĐỊNH 1.2.1 Vectơ trung bình mẫu, ma trận hiệp phương sai mẫu Giả sử x1 , x2 , , xn mẫu chọn ngẫu nhiên từ tổng thể X [ X1 , X , , X p ] , T xiT [ xi1 , xi , , xip ] x1T x11 T x x 21 Kí hiệu: x T xn xn1 Đặt x j x1 p x2 p xnp x12 x22 xn s 1 n ( x1 j x2 j xnj ), j 1, 2, , p, sij ( xki xi )( xkj x j ), rij ij n n k 1 sii s jj - Vectơ x [ x1 , x2 , , x p ] gọi vectơ trung bình mẫu T s11 s12 s s12 11 - Ma trận S s p1 s p s1 p s1 p gọi ma trận hiệp phương sai mẫu s pp r11 r12 r r12 11 - Ma trận R rp1 rp 1.2.2 r1 p r1 p gọi ma trận hệ số tương quan mẫu rpp Phân bố mẫu trung bình mẫu Định lý 1.4 Cho x [ xij ]n p mẫu ngẫu nhiên tổng thể X có phân bố chuẩn p chiều N p ( ; ) n Khi x có phân bố chuẩn N p ( ; ) Định lý 1.5 (Định lí giới hạn trung tâm) Cho x [ xij ]n p mẫu ngẫu nhiên tổng thể X có E ( X ) cov( X ) Khi với n đủ lớn, x có xấp xỉ phân bố chuẩn N p ( ; ) n 1.2.3 Nhận dạng phân bố chuẩn nhiều chiều Giả sử x1T x11 T x x 21 x 2 T xn xn1 x12 x22 xn x1 p x2 p xnp mẫu chọn ngẫu nhiên X [ X1 , X , , X p ] T Dựa vào mẫu số liệu để kiểm tra xem X có phân bố chuẩn khơng? Sửdụng biểu đồ xác suất chuẩn Ta có tính chất: X có phân bố chuẩn p chiều N p ( ; ) thànhphần X X1 , X , , X p có phân bố chuẩn chiều Do từ biểu đồ xác suất chuẩn thànhphần x1 , x2 , , x p chấp nhận X1 , X , , X p có phân bố chuẩn chiều lúc ta chấp nhận X có phân bố chuẩn 1.2.4 Kiểm định giả thuyết vectơ trung bình Định lý 1.6 Cho x [ xij ]n p mẫu ngẫu nhiên tổng thể X có phân bố chuẩn p chiều N p ( ; ) Khi T n(n p) ( x )T S 1 ( x ) có phân bố Fisher Fp ,n p p(n 1) 9 Ví dụ 1.3 Cho mẫu số liệu X [ X1 , X ] sau: 10 6 3 T Giả sử X có phân bố chuẩn chiều Với mức ý nghĩa 5% thực kiểm định H0 : 0 H1 : 0 0T [9,5] Giải Miền bác bỏ H0 : W [ f 2,1 (0.05); ) [18.51; ) Giá trị kiểm định thống kê T2 n(n p) ( x 0 )T S 1 ( x 0 ) 0.19 W nên chưa có sở bác bỏ p(n 1) Hoặc tính P-giá trị: P-giá tri P( F2,1 0,19) 0,85 0.05 H0 14 Giả sửthànhphần ( X1 , X , , X p ) Y1 a1T X a11 X a12 X a1 p X p Y2 a2T X a21 X a22 X a2 p X p Yp aTp X a p1 X a p X a pp X p Mục đích mục tìm ước lượng thànhphần Y1 , Y2 , , Yp dựa ước lượng vectơ trung bình E ( X ) x ước lượng ma trận hiệp phương sai cov( X ) S a1T (a11, a12 , , a1p ) Với p , xét tổ hợp tuyến tính a1T xi a11 xi1 a12 xi a1 p xip , i 1, 2, , n T T T T Khi (a1 x1 , , a1 xn ) quan sát biến ngẫu nhiên a X nên ước lượng E (a1 X ) trung bình T T T mẫu a x ước lượng phương sai Var (a1 X ) a Sa Hơn nữa, với a1 , a2 T T p T T hai biến ngẫu nhiên (a1 X ) (a2 X ) có ước lượng hiệp phương sai phương T sai mẫu a Sb Vì vậy, thànhphần ( X1 , , X p ) dựa mẫu x định nghĩa sau: T - Ước lượng thànhphần thứ tổ hợp tuyến tính Yˆ1 a1 X cho a1 Sa1 đạt lớn T {a1 p : a1T a1 1} T T - Ước lượng thànhphần thứ hai tổ hợp tuyến tính Yˆ2 a2 X cho a2 Sa2 đạt lớn {a1 p : a1T a1 1, a1T Sa2 0} T T - Ước lượng thànhphần thứ n tổ hợp tuyến tính Yˆn a1 X cho an San đạt lớn {an p : anT an anT Sai 0i n} Định lý 2.5 Nếu ma trận hiệp phương sai mẫu S có p cặp giá trị riêng - vectơ riêng (ˆ1 , eˆ1 ) , , (ˆp , eˆ p ) T với ˆ1 ˆ1 ˆp Khi ước lượng thànhphần dựa mẫu x Yˆi eˆi X , i 1, 2, , p Hơn nữa, ước lượng phương sai hiệp phương sai Var (Yˆi ) i , cov(Yˆi , Yˆj ) i j p Ước lượng phương sai tổng cộng: Var( X ) ˆ ˆ i i 1 Ước lượng hệ số tương quan: rˆYˆ , X i eˆi (eˆi1 , , eˆik , , eˆip ) k eˆik i skk ˆ1 , eˆik tọa độ thànhphần thứ k 15 Ví dụ 2.4 Điểm tổng kết năm học mơn Tốn, tiếng Anh, Lịch sử, Địa lí, Hóa học Vật lý học sinh sau: Mơn học Tốn Tiếng Anh Lịch sử Địa lý Hoá học Vật lý A 6.0 7.0 7.5 5.8 5.3 4.2 B 8.0 6.5 6.6 7.5 7.0 7.6 C 5.3 6.0 5.0 4.8 4.5 4.3 D 8.5 7.9 7.1 7.7 6.8 7.9 E 4.5 8.0 8.0 8.4 4.4 4.6 HS Phântíchthànhphần theo ma trận hiệp phương sai ta có: Hình 3.3: dg g Ta thấy cần giữ thànhphầnthông tin giữ lại đến 94% PC1 0.556Toán 0.085Anh 0.073Sử 0.292Đòa 0.415Hóa 0.64Lí C1 PC2 0.282Toán 0.411Anh 0.561Sử 0.643Đòa 0.133Hóa 0.075Lí C2 Do C1 C2 số nên ta bỏ qua Ở thànhphần thứ PC1 tương quan dương với tất môn học tương quan dương mạnh môn Lý, đến Tốn đến Hóa Thànhphần thứ PC2 tương quan âm mạnh môn Địa, đến Sử đến Anh Bây ta tiến hành chiếu lên hệ trục O.PC1PC2 16 Hình 3.4: dg g Như xếp theo lực học mơn Tốn, Lý Hóa ta có thứ tự học sinh sau: D, B, A, E, C Còn xếp theo lực học mơn Sử, Địa Anh ta có thứ tự học sinh là: E, D, A, B, C 2.2 PHÂNTÍCHNHÂNTỐ 2.2.1 Mơ hình phântíchnhântố trực giao Cho vectơ ngẫu nhiên quan sát X ( X1 , X , , X p ) có vectơ kì vọng E ( X ) ma trận hiệp phương sai Var ( X ) Mơ hình nhântố giả định X tổ hợp tuyến tính số biến ngẫu nhiên không quan sát F1 , F2 , , Fm ( m p ) gọi nhântố chung p biến ngẫu nhiên cộng thêm 1 , , , p Tức X1 mu1 l11F1 l12 F2 l1m Fm 1 X mu2 l21F1 l22 F2 l2 m Fm X p p l p1F1 l p F2 l pm Fm p Hoặc dạng ma trận: X mu L F Phần tử lij ma trận L gọi tải trọng biến X i đặt lên nhât tố F j Các giả thiết mơ hình: - Đối với nhântố F : E( F ) 0, cov( F ) E(FF ) I T - Đối với sai số ngẫu nhiên : E( ) 0, cov( ) E( ) diag ( 1, , p ) T - F không tương quan: cov( F ; ) Nếu giả thiết thỏa mãn cov( X ) LL T Ta có: Var ( X i ) ii li1 li lim i 2 Đại lượng hi li1 li lim gọi phương sai chung, i gọi phương sai xác định Như 2 17 ii hi2 i Ví dụ 2.5 Cho X ( X1, X , X , X ) có ma trận hiệp phương sai 19 30 12 30 57 23 38 47 12 23 47 68 Giả sử X tổ hợp tuyến tính hai nhântố trực giao Tìm F1 , F2 2.2.2 Phương pháp ước lượng Ước lượng dựa phântíchthànhphần Cho X ( X1 , X , , X p ) có vectơ trung bình E ( X ) ma trận hiệp phương sai Giả sử (1; e1 ) , (2 ; e2 ) , , ( p , e p ) p cặp giá trị riêng - vectơ riêng Khi 1e1e1T p e2e2T p e p eTp 1 e1 2 e2 p e p 1 e1 2 e2 p e p T Giả sử ta muốn phântích với m p nhântố L L 0, T L 1 e1 2 e2 Nếu p m giá trị riêng p e p m1 , m2 , , p p p có tổng T nhântố cuối, tức L L , L m1 m p nhỏ bỏ qua p m 1 e1 2 e2 m em p m m Đặt diag ( , , p ) với i ii lii lii phần tử nằm đường chéo i 1 ma trận LLT , ta L L T Ta chuẩn hóa vectơ ngẫu nhiên X ( X1 , X , , X p ) : Zi X i i ii Khi ta thực tương tự ma trận tương quan Giả sử có n quan sát độc lập vectơ ngẫu nhiên X ( X1 , X , , X p ) : x11 x 21 x xn1 x12 x22 xn x1 p x2 p xnp Để ước lượng L dựa mẫu số liệu ta thực sau: - Tìm p cặp giá trị riêng - vectơ riêng ma trận hiệp phương sai mẫu S : (ˆ1; eˆ1 ) ; (ˆ2 ; eˆ2 ) , , (ˆm ; eˆ p ) 18 ˆˆ pm 1 e1 - Chọn m giá trị riêng Ước lượng L bởi: Lˆ lˆij ˆ2 eˆ2 ˆm eˆm - Ước lượng ma trận hiệp phương sai sai số ngẫu nhiên : ˆ diag (ˆ1 ,ˆ , ,ˆ p ), với m ˆ i sii lˆii2 i ˆ ˆ ˆ gọi ma trận phần dư Ma trận S LL T Ta chuẩn hóa mẫu số liệu x : zij xij x j s jj , i 1, 2, , n; j 1, 2, , p Khi ma trận hiệp phương sai mẫu R z zij x xij n p n p ma trận tương quan mẫu Phântíchnhântốthànhphần R tương tự S Ví dụ 2.6 Cho ước lượng ma trận hiệp phương sai điểm thi THPT Quốc gia mơn Tốn, Tiếng Anh Vật lý thí sinh tham dự tuyển sinh vào trường đại học sau: Toán Anh Toán 2.9830 Anh 0.0665 0.7570 Vật lý 2.971 0.3305 Vật lý 3.467 Phântíchnhântố phương pháp thànhphần X1 1 0.492F1 0.217 F2 1 X 2 0.130F1 0.985F2 X 3 0.503F1 0.043F2 2.2.3 Xoay nhântố Trong phântíchnhântố ta quan tâm đến làm tối đa lượng thơng tin giữ lại tính trực giao nhântố mà chưa quan tâm đến tính tương quan biến nhântốChính tải trọng biến lên nhântố chưa thật tối ưu nên khó giải thích ảnh hưởng nhântố lên biến Phép xoay nhântố nhằm mục đích làm tải trọng số biến đặt nhântố gần với giá trị 1 biến lại có tải trọng gần Phép xoay trực giao phép xoay khơng làm thay đổi tính trực giao nhântố Nếu Q ma trận T phép xoay trực giao, ta có Q Q I Gọi Lˆ ma trận ma trận tải trọng ước lượng từ mẫu số T * ˆ Khi đó, ta có: LL ˆ ˆT LQQ ˆ T LˆT L* L* Do liệu, ma trận tải trọng sau quay L LQ ma trận phần dư không thay đổi thực phép quay Q Trong trường hợp hai nhântố F1 F2 , ta có: 19 Cos Sin T Cos Sin Sin quay ngược chiều kim đồng hồ Cos Sin Cos quay chiều kim đồng hồ Hình 4.1: dg g Một số phép xoay nhântố trực giao thường sửdụng là: Varimax, Quatimax Equimax Còn xem nhântố có tương quan với ta sửdụng phép quay Promax Ví dụ 2.7 Trong nghiên cứu Lawley Maxwell điểm tổng kết môn học Thể thao, Tiếng Anh, Lịch sử, Số học, Đại số Hình học 220 học sinh, tác giả tính ma trận hệ số tương quan mẫu sau Thể thao Tiếng Anh Lòch Sử Số học Đại số Hình học 0.439 0.410 0.288 0.329 0.248 1.000 0.439 1.000 0.351 0.354 0.320 0.329 0.351 1.000 0.164 0.190 0.181 0.410 0.288 0.354 0.164 1.000 0.595 0.470 0.320 0.190 0.595 1.000 0.464 0.329 0.248 0.329 0.181 0.470 0.464 1.000 Tiến hành phântíchnhân tố, khơng xoay nhântố ta kết sau F1 F2 Thể thao 0.658 -0.449 Tiếng Anh 0.688 -0.29 Lịch sử 0.517 -0.637 Số học 0.738 0.413 Đại số 0.744 0.375 Hình học 0.678 0.355 Nhìn vào kết tải trọng F1 lớn tải trọng F2 nhỏ hơn, tải trọng khác khơng đáng kể nên khó giải thích ảnh hưởng nhântố lên biến 20 Bây ta tiến hành xoay nhântố Varimax: F1 F2 Thể thao 0.225 -0.764 Tiếng Anh 0.349 -0.66 Lịch sử -0.003 -0.821 Số học 0.833 -0.147 Đại số 0.814 -0.18 Hình học 0.75 -0.154 Như sau xoay nhân tố, tải trọng phù hợp hơn, nhântố F1 tương quan dương mạnh với biến Số học, Đại số Hình học; nhântố F2 tương quan âm mạnh với biến Thể thao, Tiếng Anh Lịch sử Do đó, học sinh có nhântố F1 lớn có thiên hướng mơn tốn (Số học, Đại số Hình học) học sinh có nhântố F1 nhỏ có thiên hướng với môn xã hội (Thể thao, Tiếng Anh Lịch sử) 2.3 ỨNG DỤNGPHẦNMỀM MINITAB 2.3.1 Phântíchthànhphần Các bước thực Minitab: Stat → Multivariate → Principal Components Analysis → Variables: thànhphần cần phân → Kích chọn Covariance → OK 2.3.2 Phântíchnhântố Các bước thực Minitab: Stat → Multivariate → Factor Analysis → Variables: nhântố cần phân tích→ Number of factor to extract: số thànhphần cần giữ lại phântíchthànhphần → Method of Extraction: Principal components → Type of Rotation: Varimax → OK 21 Ví dụ 1: Phântích điểm trung bình Tốn, Lý, Hóa, Sinh, Văn, Sử, Địa, Anh học sinh lớp 12A2 Bước 1: Phântíchthànhphần Nhập điểm trung bình mơn Tốn, Lý, Hóa, Sinh, Văn, Sử, Địa, Anh học sinh lớp 12A2 vào Minitab Thực phântíchthànhphần 22 Bước 2: PhântíchnhântốNhận xét: - Từ bảng kết phântíchthànhphần chính, ta thấy, dựa vào mức tích lũy ta cần giữ lại thànhphầnthơng tin giữ lại đến 91.7% PC1 0.380 Toán+ 0.393 Lý+ 0.372 Hoá+ 0.328 Sinh+ 0.125 Văn+ 0.188 Sử+ 0.183 Đòa+ 0.609 Anh PC2 0.252 Toán 0.450 Lý 0.497 Hoá+ 0.137 Sinh+ 0.409 Văn+ 0.140 Sử+ 0.198 Đòa+0.491Anh PC3 0.061 Toán 0.227 Lý 0.335Hoá+0.356Sinh+ 0.281 Văn 0.412 Sử 0.427 Đòa 0.524 Anh PC4 0.289 Toán 0.295 Lý 0.212 Hoá+ 0.545 Sinh 0.522 Văn 0.422 Sử 0.116 Đòa 0.151Anh Ở thànhphần thứ 𝑃𝐶1 tương quan dương với tất môn học tương quan dương mạnh tới mơn Anh, Lý, Tốn đến Hóa Thànhphần thứ hai 𝑃𝐶2 tương quan âm mạnh với mơn Hóa Thành thứ ba 𝑃𝐶3 tương quan âm mạnh với mơn Anh Thành thứ tư 𝑃𝐶4 tương quan dương mạnh với môn Sinh, Lý - Sau phântíchthànhphần chính, ta giữ lại thànhphần để phântíchnhântố Từ bảng kết phântíchnhântố điểm trung bình học sinh lớp 12A2 trên, ta thấy F1 tương quan dương mạnh với biến Tốn, Lý, Hóa Do học sinh F1 có xu hướng học mơn khoa học tự 23 nhiên (Tốn, Lý, Hóa Các học sinh F2 có xu hướng học môn khoa học xã hội (Văn, Sử, Địa) Các học sinh F3 có su hướng học mơn Sinh Và học sinh F4 có su hướng học mơn Anh Nhưng nói chung, đa số học sinh lớp 12A2 có su hướng học tốt mơn Tốn, Lý, Hóa Ví dụ 2: Để khảo sát hài lòng bệnh nhân (BN) bệnh viện, câu hỏi soạn sẵn với 20 câu hỏi (biến) sau: Trang thiết bị phục vụ khám chữa bệnh bệnh viện có đầy đủ, đại? Phòng điều trị, phòng chờ khám bệnh có đầy đủ thiết bị? Nhà vệ sinh có đặt nơi thuận tiện? Bệnh viện có làm cho anh/ chị cảm thấy an tâm lựa chọn điều trị đây? Bác sĩ, điều dưỡng có ln quan tâm sẵn sàng giúp đỡ, giải vấn đề anh/chị? Anh/chị có tin tưởng vào kết chẩn đốn phương pháp điều trị bệnh viện? Anh/chị có tin tưởng vào bác sĩ điều trị bệnh viện? Bệnh viện có cung cấp dịch vụ khám chữa bệnh nhanh chóng mà khơng cần nhiều thời gian chờ đợi? Bệnh viện có cung cấp đầy đủ thơng tin tình trạng sức khoẻ anh/chị? 10 Bác sĩ có lắng nghe giúp đỡ anh/chị tận tình chu đáo? 11 Khi anh/chị cần, bệnh viện có đáp ứng điều trị kịp thời, nhanh chóng? 12 Mọi thủ tục từ nhập viện đến xuất viện có giải nhanh chóng? 13 Những câu hỏi liên quan đến tình hình sức khoẻ anh/chị nhân viên trả lời đầy đủ, rõ ràng? 14 Bác sĩ, điều dưỡng bệnh viện có lịch thân thiện trình khám chữa bệnh cho anh/chị? 15 Anh/chị có thấy nhân viên bệnh viện vui vẻ phục vụ? 16 Bác sĩ có giải thích xảy với bệnh nhân trước đưa điều trị? 17 Bác sĩ nói với bệnh nhân chẩn đốn bệnh họ? 18 Bác sĩ có sẵn sàng trả lời câu hỏi tình trạng sức khoẻ anh/chị? 19 Bác sĩ, điều dưỡng có đủ kiến thức để trả lời câu hỏi anh/chị? 20 Trình độ chun mơn bác sĩ có đáp ứng nhu cầu khám chữa bệnh anh/chị? Dùng thang điểm Likert với: Hoàn toàn đồng ý (5 điểm), đồng ý (4 điểm), không ý kiến (3 điểm), khơng đồng ý (2 điểm), hồn tồn khơng đồng ý (1 điểm) 24 Kết khảo sát (n= 200 bệnh nhân) với 20 câu hỏi: Bước 1: Phântíchthànhphần 25 Bước 2: Phântíchnhântố Từ phântíchthànhphần chính, có giá trị riêng lớn nên ta chọn nhântố để phântích 26 Nhận xét: - Từ bảng kết phântíchthànhphần bước 1, ta thấy, dựa vào mức tích lũy ta cần giữ lại thànhphầnthơng tin giữ lại đến 55.8% - Sau phântíchthànhphần chính, ta giữ lại thànhphần để phântíchnhântố Từ bảng kết phântíchnhântố bước 2, ta thấy rằng: + Nhântố F1 tương quan mạnh với Q7, Q6, Q4, Q1, Q20 Tức là, nhântố F1 quan tâm đến câu hỏi: Q7 Anh/chị có tin tưởng vào bác sĩ điều trị bệnh viện? Q6 Anh/chị có tin tưởng vào kết chẩn đoán phương pháp điều trị bệnh viện? Q4 Bệnh viện có làm cho anh/ chị cảm thấy an tâm lựa chọn điều trị đây? 27 Q1 Trang thiết bị phục vụ khám chữa bệnh bệnh viện đầy đủ, đại? Q20 Trình độ chun mơn bác sĩ có đáp ứng nhu cầu khám chữa bệnh anh/chị? Cả câu hỏi (biến) liên quan đến chất lượng điều trị, ta đặt nhântố F1 Chất lượng điều trị bệnh viện + Nhântố F2 tương quan mạnh với Q16, Q17, Q18, Q12 Tức là, nhântố F2 quan tâm đến câu hỏi: Q16 Bác sĩ giải thích xảy với bệnh nhân trước đưa điều trị Q17 Bác sĩ nói với bệnh nhân chẩn đốn họ Q18 Bác sĩ sẵn sàng trả lời câu hỏi tình trạng sức khoẻ anh/chị Q12 Mọi thủ tục từ nhập viện đến xuất viện giải nhanh chóng Cả câu hỏi (biến) liên quan đến việc cung cấp thông tin bệnh tật cho BN, ta đặt nhântố F2 Cung cấp thông tin + Nhântố F3 tương quan mạnh với Q10, Q15, Q9, Q14, Q5 Tức là, nhântố F3 quan tâm đến câu hỏi: Q10 Bác sĩ có lắng nghe giúp đỡ anh/chị tận tình chu đáo Q15 Anh/chị có thấy nhân viên bệnh viện vui vẻ phục vụ Q9 Bệnh viện cung cấp đầy đủ thơng tin tình trạng sức khoẻ anh/chị Q14 Bác sĩ, điều dưỡng bệnh viện có lịch thân thiện trình khám chữa bệnh cho anh/chị Q5 Bác sĩ, điều dưỡng bệnh viện quan tâm sẵn sàng giúp đỡ, giải vấn đề anh/chị Cả câu hỏi (biến) liên quan vấn đề giao tiếp nhân viên bệnh nhân, đặt nhântố F3 Kỹ giao tiếp + Nhântố F4 tương quan mạnh với Q8, Q3, Q2 Tức là, nhântố F4 quan tâm đến câu hỏi: Q8 Bệnh viện cung cấp dịch vụ khám chữa bệnh nhanh chóng mà khơng cần nhiều thời gian chờ đợi Q3 Nhà vệ sinh đặt nơi thuận tiện Q2 Phòng điều trị, phòng chờ khám bệnh đầy đủ thiết bị Cả câu hỏi (biến) liên quan đến việc cung cấp dịch vụ, đặt tên nhântố F4 Phương tiện dịch vụ Tóm lại, hài lòng BN bệnh viện tập trung vào nhân tố: (1) Chất lượng điều trị (2) Kỹ giao tiếp (3) Cung cấp thông tin (4) Phương tiện dịch vụ Sự hài lòng cao bệnh nhân bệnh viện nhântố Chất lượng điều trị (F1) 28 KẾT LUẬN Trong suốt thời gian làm khóa luận vừa qua, tìm hiểu, học tập, nghiên cứu môn thống kê, em học hỏi nhiều kinh nghiệm quý báo cho thân sau Về mặt lý luận, báo cáo khóa luận phản ánh rõ trình làm khóa luận nghiên cứu thực nào? Chính điều làm em nhận thấy, việc học nghiên cứu môn Thống kê thật quan trọng sinh viên khoa Tốn Về mặt thực tiễn, thời gian làm khóa luận vừa qua làm em lớn lên nhiều mặt tư tưởng, ý thức mục đích Điều làm em thêm u thích việc học Tốn Trong thời gian qua, cố gắng nhiều kiến thức kinh nghiệm hạn chế nên khơng tránh khỏi sai sót, kính mong nhận ý kiến đóng góp q thầy để rút kinh nghiệm cho lần khác Em xin chân thành cảm ơn! Một lần em xin bày tỏ lòng biết ơn sâu sắc đến quý thầy khoa Tốn nói chung thầy Lê Văn Dũng nói riêng trang bị cho em hành trang nguồn kiến thức vơ bổ ích q giá Bài khóa luận chắn khơng tránh khỏi thiểu sót, kính mong q thầy góp ý bổ sung để báo cáo hoàn thiện ... 0,19) 0,85 0.05 H0 10 CHƯƠNG PHÂN TÍCH THÀNH PHẦN CHÍNH VÀ PHÂN TÍCH NHÂN TỐ VỚI PHẦN MỀM MINITAB 2.1 PHÂN TÍCH THÀNH PHẦN CHÍNH 2.1.1 Cấu trúc thành phần Cho vectơ ngẫu nhiên p chiều X... kết phân tích thành phần bước 1, ta thấy, dựa vào mức tích lũy ta cần giữ lại thành phần thơng tin giữ lại đến 55.8% - Sau phân tích thành phần chính, ta giữ lại thành phần để phân tích nhân tố. .. sát (n= 200 bệnh nhân) với 20 câu hỏi: Bước 1: Phân tích thành phần 25 Bước 2: Phân tích nhân tố Từ phân tích thành phần chính, có giá trị riêng lớn nên ta chọn nhân tố để phân tích 26 Nhận xét: