1. Trang chủ
  2. » Cao đẳng - Đại học

Phân tích thành phần chính và Phân tích nhân tố được sử dụng thông qua phần mềm Minitab.

29 176 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 29
Dung lượng 1,49 MB

Nội dung

Cơng trình hồn thành ĐẠI HỌC ĐÀ NẴNG GV hướng dẫn: TS Lê Văn Dũng Phản biện: ThS Nguyễn Thị Hải Yến Khóa luận bảo vệ trước hội đồng chấm Khóa luận tốt nghiệp cử nhân họp Đại học phạm Đà Nẵng vào ngày 27 tháng năm 2019 Có thể tìm hiểu khóa luận Thư viện trường Đại học phạm, Đại học Đà Nẵng MỤC LỤC PHẦN MỞ ĐẦU Tính cấp thiết đề tài 2 Mục tiêu nghiên cứu Đối tượng phạm vi nghiên cứu Phương pháp nghiên cứu Bố cục đề tài Tổng quan tài liệu nghiên cứu CHƯƠNG CƠ SỞ LÝ THUYẾT 1.1 VECTƠ NGẪU NHIÊN MA TRẬN 1.1.1 Vectơ ma trận a Vectơ b Ma trận c Căn bậc hai ma trận 1.1.2 Vectơ ngẫu nhiên a Vectơ trung bình ma trận hiệp phương sai b Chia khối ma trận c Hàm mật độ xác suất đồng thời d Vectơ trung bình ma trận hiệp phương sai tổ hợp tuyến tính vectơ ngẫu nhiên 1.1.3 Phân bố chuẩn nhiều chiều a Định nghĩa b Tính chất 1.2 ƯỚC LƯỢNG KIỂM ĐỊNH 1.2.1 Vectơ trung bình mẫu, ma trận hiệp phương sai mẫu 1.2.2 Phân bố mẫu trung bình mẫu 1.2.3 Nhận dạng phân bố chuẩn nhiều chiều 1.2.4 Kiểm định giả thuyết vectơ trung bình CHƯƠNG PHÂN TÍCH THÀNH PHẦN CHÍNH PHÂN TÍCH NHÂN TỐ VỚI PHẦN MỀM MINITAB 10 2.1 PHÂN TÍCH THÀNH PHẦN CHÍNH 10 2.1.1 Cấu trúc thành phần 10 2.1.2 Các thành phần chuẩn hóa 13 2.1.3 Phân tích thành phần dựa mẫu 13 2.2 PHÂN TÍCH NHÂN TỐ 16 2.2.1 Mơ hình phân tích nhân tố trực giao 16 2.2.2 Phương pháp ước lượng 17 2.2.3 Xoay nhân tố 18 2.3 ỨNG DỤNG PHẦN MỀM MINITAB 20 2.3.1 Phân tích thành phần 20 2.3.2 Phân tích nhân tố 20 KẾT LUẬN 28 PHẦN MỞ ĐẦU Tính cấp thiết đề tài Một vấn đề quan trọng đặt việc nghiên cứu phân tích xử lý số liệu thu thập Nếu bảng số liệu thu thập lớn việc tìm hiểu thơng tin từ khó khăn phức tạp Mục tiêu nghiên cứu Phân tích liệu cụ thể từ đề tài thực tế đưa nhận xét, đánh giá liệu xử lý Đối tượng phạm vi nghiên cứu Mỗi liệu thu thập tiến hành nghiên cứu, thí nghiệm thường thể dạng bảng giá trị số nhiều cá thể Chúng tạo thành “đám mây số liệu” phức tạp Các số liệu cần phân tích xử lí để rút nhận xét, đánh giá thích hợp Phương pháp nghiên cứu Hai phương pháp đơn giản Phân tích thành phần Phân tích nhân tố sử dụng thông qua phần mềm Minitab Bố cục đề tài Bài báo cáo trình bày hai phương pháp nói thống kê nhiều chiều Sau đưa ví dụ phân tích cụ thể số liệu từ đề tài khoa học Đây hai phương pháp đơn giản có tính hiệu cao số nhiều phương pháp phân tích số liệu đưa nhà thống kê, nhiên việc ứng dụng chúng nghiên cứu thực nghiệm, đề tài thuộc lĩnh vực khoa học hạn chế Bài báo cáo phần giúp ta thấy hữu ích việc áp dụng kiến thức thống kê việc nghiên cứu Tổng quan tài liệu nghiên cứu Phân tích thành phần kĩ thuật biểu diễn số liệu dựa theo tiêu chuẩn đại số hình học mà khơng đòi hỏi giả thuyết thống kê hay mơ hình đặc biệt Lĩnh vực áp dụng phân tích thành phần rộng, nơng nghiệp, kinh tế, khoa học Phân tích nhân tố kĩ thuật ghép điểm quan sát lại thành nhóm theo tiêu chí đó, tương tự cách phân loại sinh học Việc phân tích có thuật tốn đơn giản, đồng thời đem lại nhìn trực quan phân loại thu nên dễ nhà chuyên môn ngành khoa học khác chấp nhận CHƯƠNG CƠ SỞ LÝ THUYẾT 1.1 VECTƠ NGẪU NHIÊN MA TRẬN 1.1.1 Vectơ ma trận a Vectơ  x1  x  Cho x  ( x1, x2 , , xn )  Ta viết dạng ma trận x sau:   xT  [ x1 , x2 , , xn ]      xn  Các phép toán: Cho c   x1   y1  x  y    , y   2 vectơ: x           xn   yn   x1  y1  x  y  2 - Phép cộng: x  y        xn  yn   cx1  cx   2 cx  - Phép nhân với số:     cxn  - Tích vơ hướng: xT y  x1 y1  x2 y2   xn yn - Độ dài vectơ: Lx  x12  x22   xn2 xT y - Góc hai vectơ: cos   Lx Ly Hệ trực chuẩn p vectơ e1 , e2 , , e p không gian vectơ p gọi hệ trực chuẩn ei  với i ei e j  với i  j b Ma trận Ma trận A  [aij ]n p bảng số hình chữ nhật gồm n hàng p cột Các phép toán: Cho c  ma trận A  [aij ]n p , B  [bij ]n p , C  [cij ] pq - Cộng hai ma trận: A  B  [aij  bij ]n p - Tích số với ma trận: cA  [caij ]n p - Nhân hai ma trận: AC  [dij ]nq với dij  p a k 1 c ik kj Ma trận chuyển vị ma trận A  [aij ]nn kí hiệu AT ma trận xác định A  [bij ] với T bij  a ji Ma trận đối xứng: ma trận vuông A  [aij ]nn ma trận đối xứng aij  a ji Ma trận đường chéo: A ma trận đường chéo aij  với i  j Khi A kí hiệu A  diag (aii ) Ma trận đơn vị ma trận đường chéo có phần tử đường chéo Kí hiệu I n ma trận đơn vị cấp n 1 1 Ma trận nghịch đảo: Nếu tồn ma trận A1 cho A A  A A  I n A1 gọi ma trận nghịch đảo ma trận A Ma trận trực giao: ma trận vuông A ma trận trực giao AT  A1 Giá trị riêng vectơ riêng ma trận vuông Cho A ma trận vuông cấp n , tồn vectơ x  số thực  cho Ax   x  gọi giá trị riêng x gọi vectơ riêng ứng với  d Vết ma trận tổng phần tử nằm đường chéo ma trận vng Ma trận xác định không âm x Ann x  với x  n Kí hiệu: A  Ma trận xác định dương x Ann x  với x  n , x Ann x   x  (0, ,0)  T T T n Kí hiệu: A0 Định lý 1.1 Nếu A  giá trị riêng A số thực không âm Định lý 1.2 Nếu ma trận Ap p có p cặp giá trị riêng - vectơ riêng (1; e1 ) , (2 ; e2 ) , , ( p ; e p ) với e1 , e2 , , e p hệ trực chuẩn A  1e1e1T  2e2e2T   pepeTp c Căn bậc hai ma trận Cho Ap p ma trận đối xứng, xác định không âm Đặt PT  [e1 , e2 , , ep ] ,   diag (1 , ,  p ) , 1/2  diag (  , ,  p ) Khi ma trận A1/2  P1/2 PT thỏa mãn A1/2 A1/2  A Do ta gọi ma trận A1/2 bậc ma trận A Ta có hệ thức sau: (1) ( A )  A 1/2 T 1/2 1 1/2 1/2 (2) ( A )  P 1.1.2 PT nên kí hiệu ( A1/2 )1  A1/2 Vectơ ngẫu nhiên Cho X1 , X , , X n biến ngẫu nhiên xác định không gian xác suất (, X  ( X1, X , , X n ) gọi vectơ ngẫu nhiên n chiều Dạng ma trận X sau , P ) Kí hiệu  X1  X    X T  [ X1 , X , , X n ]     Xn  Tương tự, cho X ij với i  1, 2, , m ; j  1, 2, , n mn biến ngẫu nhiên xác định khơng gian , P ) X  [ X ij ]mn gọi ma trận ngẫu nhiên xác suất (, a Vectơ trung bình ma trận hiệp phương sai Cho vectơ ngẫu nhiên X  ( X1 , X , , X n ) Giả sử E( X i )  i cov( X i ; X j )   ij Khi đó, 11 12     [1 , 2 , , n ]T gọi vectơ trung bình,    21 22    n1  n 1n   n  gọi ma trận hiệp    nn  phương sai Gọi ij   ij  ii jj  11 12  22 21 hệ số tương quan X i X j Khi đó,       n1 n 1n  2 n    nn  gọi ma trận tương quan b Chia khối ma trận Chia vectơ ngẫu nhiên X  ( X1 , X , , X n ) thành hai vectơ p chiều n  p chiều sau: X (1)  X1       X p    X (2)  X p 1      X n   X (1)    Khi ta viết: X     X (2)      (1)   1    p 1        (1) (2) Với cách kí hiệu ta có     , với     ,       (2)   p     n      Mặt khác  ( X (1)   (1) )( X (1)   (1) )T  ( X   )( X   )T   ( X (2)   (2) )( X (1)   (1) )T  ( X (1)   (1) )( X (1)   (1) )T ma trận cấp p  p ( X (1)   (1) )( X (2)   (2) )T    (2) (2) (2) (2) T  ( X   )( X   )  ( X (1)   (1) )( X (2)   (2) )T ma trận cấp p  (n  p) ( X (2)   (2) )( X (1)   (1) )T ma trận cấp (n  p)  p ( X (2)   (2) )( X (2)   (2) )T ma trận cấp (n  p)  (n  p) Ma trận hiệp phương sai chia khối sau  11    21 11  E ( X (1) 12  ,  22    (1) )( X (1)   (1) )T 12  E ( X (1)   (1) )( X (2)   (2) )T 21  E ( X (2)   (2) )( X (1)   (1) )T 22  E ( X (2)   (2) )( X (2)   (2) )T c Hàm mật độ xác suất đồng thời Nếu X  ( X1, X , , X n ) vectơ ngẫu nhiên rời có rạc miền giá trị X ()  {xi  ( x1i , x2i , , xni ) : i  1} hàm xác suất đồng thời X hàm p : X ()  xác định p( xi )  P( X  xi ) Nếu X  ( x1, X , , X n ) gồm n biến ngẫu nhiên liên tục tồn hàm số không âm f ( x) xác định n cho với A  [a1; b1 ]  [an ; bn ]  n , P( X  A)   A f ( x)dx f ( x) gọi làm mật độ xác suất đồng thời X Định lý 1.3 Nếu X1 , X , , X n biến ngẫu nhiên độc lập có hàm mật độ xác suất f1 ( x1 ) , f2 ( x2 ) , , fn ( xn ) hàm mật độ xác suất đồng thời X f ( x)  f1 ( x1 ) f ( x2 ) f n ( xn ), x  ( x1, x2 , , xn )  n d Vectơ trung bình ma trận hiệp phương sai tổ hợp tuyến tính vectơ ngẫu nhiên Nếu X1 X hai biến ngẫu nhiên, a b số thực thì: (1) E(aX1  bX )  aE( X1 )  bE( X ) (2) Var (aX1  bX )  a Var ( X1 )  b Var ( X )  2ab12 2 T Đặt C  [a, b] , X  [ X1 , X ] ,ta có: aX1  bX  C X đó: T T E (CT X )  CT E ( X ) Var (CT X )  CT cov( X )C Một cách tổng quát, C  [c1 , c2 , , cn ] vectơ số X  [ X1 , X , , X n ] vectơ ngẫu T T nhiên E(C X )  C E( X )  C T T T  Var (C X )  C cov( X )C  C C T T T Nếu C  [cij ]mn ma trận số  c11 X1  c12 X   c1n X n   c X  c X   c X  2n n  CX   21 22     cm1 X1  cm X   cmn X n  T Khi đó, E (CX )  CE ( X ) , cov(CX )  Ccov( X )C 1.1.3 Phân bố chuẩn nhiều chiều a Định nghĩa Định nghĩa 1.1 Vectơ ngẫu nhiên X  ( X1 , X , , X p ) gọi có phân bố chuẩn p chiều với T tham số T  (1, 2 , ,  p )T   [ ij ] p p (   ) X có hàm mật độ xác suất đồng thời:  ( x)  e (2 ) p /2 |  |1/2  ( x   )T 1 ( x   ) Kí hiệu X ~ N p ( ; ) b Tính chất Tính chất 1.1 Nếu X có phân bố chuẩn p chiều N p (  ; ) thành phần X X1 , X , , X p có phân bố chuẩn chiều T Tính chất 1.2 Nếu X có phân bố chuẩn N p (  ; ) với a  [a1 , a2 , , a p ] ta có aT X  a1 X1  a2 X   a p X p ~ N (aT ; aT a) Ta có a X  a1 X1  a2 X   a p X p ~ N (a T T ; aT a) với aT  [a1 , a2 , , a p ] X có phân bố chuẩn N p (  ; ) T Tính chất 1.3 Nếu X có phân bố chuẩn N p (  ; ) với A  [aij ]n p , ta có: AX ~ N ( A; AA ) Tính chất 1.4 Nếu  xác định dương 1 tồn tại, ( ; e) cặp giá trị riêng - vectơ riêng  ( ; e) cặp giá trị riêng - vectơ riêng 1 1 Tính chất 1.5 Nếu X có phân bố chuẩn p chiều N p (  ; )   ( X  )T ( X  ) có phân bố  p2 (phân bố bình phương p bậc tự do) Do đó, với mức ý nghĩa  , ta có: P(( X   )T ( X   )   p2 ( ))   1.2 ƯỚC LƯỢNG KIỂM ĐỊNH 1.2.1 Vectơ trung bình mẫu, ma trận hiệp phương sai mẫu Giả sử x1 , x2 , , xn mẫu chọn ngẫu nhiên từ tổng thể X  [ X1 , X , , X p ] , T xiT  [ xi1 , xi , , xip ]  x1T   x11  T  x x 21 Kí hiệu: x          T   xn   xn1 Đặt x j  x1 p  x2 p    xnp  x12 x22 xn s 1 n ( x1 j  x2 j   xnj ), j  1, 2, , p, sij   ( xki  xi )( xkj  x j ), rij  ij n n k 1 sii s jj - Vectơ x  [ x1 , x2 , , x p ] gọi vectơ trung bình mẫu T  s11 s12 s s12 11 - Ma trận S      s p1 s p s1 p  s1 p  gọi ma trận hiệp phương sai mẫu   s pp   r11 r12 r r12 11 - Ma trận R      rp1 rp 1.2.2 r1 p  r1 p  gọi ma trận hệ số tương quan mẫu   rpp  Phân bố mẫu trung bình mẫu Định lý 1.4 Cho x  [ xij ]n p mẫu ngẫu nhiên tổng thể X có phân bố chuẩn p chiều N p (  ; )  n Khi x có phân bố chuẩn N p (  ; ) Định lý 1.5 (Định lí giới hạn trung tâm) Cho x  [ xij ]n p mẫu ngẫu nhiên tổng thể X có  E ( X )   cov( X )   Khi với n đủ lớn, x có xấp xỉ phân bố chuẩn N p (  ; ) n 1.2.3 Nhận dạng phân bố chuẩn nhiều chiều Giả sử  x1T   x11  T  x x 21 x 2     T   xn   xn1 x12 x22 xn x1 p  x2 p    xnp  mẫu chọn ngẫu nhiên X  [ X1 , X , , X p ] T Dựa vào mẫu số liệu để kiểm tra xem X có phân bố chuẩn khơng? Sử dụng biểu đồ xác suất chuẩn Ta có tính chất: X có phân bố chuẩn p chiều N p (  ; ) thành phần X X1 , X , , X p có phân bố chuẩn chiều Do từ biểu đồ xác suất chuẩn thành phần x1 , x2 , , x p chấp nhận X1 , X , , X p có phân bố chuẩn chiều lúc ta chấp nhận X có phân bố chuẩn 1.2.4 Kiểm định giả thuyết vectơ trung bình Định lý 1.6 Cho x  [ xij ]n p mẫu ngẫu nhiên tổng thể X có phân bố chuẩn p chiều N p (  ; ) Khi T  n(n  p) ( x   )T S 1 ( x   ) có phân bố Fisher Fp ,n  p p(n  1)  9 Ví dụ 1.3 Cho mẫu số liệu X  [ X1 , X ] sau: 10 6    3 T Giả sử X có phân bố chuẩn chiều Với mức ý nghĩa 5% thực kiểm định H0 :   0 H1 :   0 0T  [9,5] Giải Miền bác bỏ H0 : W  [ f 2,1 (0.05); )  [18.51;  ) Giá trị kiểm định thống kê T2  n(n  p) ( x  0 )T S 1 ( x  0 )  0.19   W nên chưa có sở bác bỏ p(n 1) Hoặc tính P-giá trị: P-giá tri  P( F2,1  0,19)  0,85  0.05 H0 14 Giả sử thành phần ( X1 , X , , X p ) Y1  a1T X  a11 X  a12 X   a1 p X p Y2  a2T X  a21 X  a22 X   a2 p X p Yp  aTp X  a p1 X  a p X   a pp X p Mục đích mục tìm ước lượng thành phần Y1 , Y2 , , Yp dựa ước lượng vectơ trung bình E ( X ) x ước lượng ma trận hiệp phương sai cov( X ) S a1T  (a11, a12 , , a1p )  Với p , xét tổ hợp tuyến tính a1T xi  a11 xi1  a12 xi   a1 p xip , i  1, 2, , n T T T T Khi (a1 x1 , , a1 xn ) quan sát biến ngẫu nhiên a X nên ước lượng E (a1 X ) trung bình T T T mẫu a x ước lượng phương sai Var (a1 X ) a Sa Hơn nữa, với a1 , a2  T T p T T hai biến ngẫu nhiên (a1 X ) (a2 X ) có ước lượng hiệp phương sai phương T sai mẫu a Sb Vì vậy, thành phần ( X1 , , X p ) dựa mẫu x định nghĩa sau: T - Ước lượng thành phần thứ tổ hợp tuyến tính Yˆ1  a1 X cho a1 Sa1 đạt lớn T {a1  p : a1T a1  1} T T - Ước lượng thành phần thứ hai tổ hợp tuyến tính Yˆ2  a2 X cho a2 Sa2 đạt lớn {a1  p : a1T a1  1, a1T Sa2  0} T T - Ước lượng thành phần thứ n tổ hợp tuyến tính Yˆn  a1 X cho an San đạt lớn {an  p : anT an  anT Sai  0i  n} Định lý 2.5 Nếu ma trận hiệp phương sai mẫu S có p cặp giá trị riêng - vectơ riêng (ˆ1 , eˆ1 ) , , (ˆp , eˆ p ) T với ˆ1  ˆ1   ˆp Khi ước lượng thành phần dựa mẫu x Yˆi  eˆi X , i  1, 2, , p Hơn nữa, ước lượng phương sai hiệp phương sai Var (Yˆi )  i , cov(Yˆi , Yˆj )  i  j p Ước lượng phương sai tổng cộng: Var( X )  ˆ  ˆ i i 1 Ước lượng hệ số tương quan: rˆYˆ , X  i eˆi  (eˆi1 , , eˆik , , eˆip ) k eˆik i skk   ˆ1 , eˆik tọa độ thành phần thứ k 15 Ví dụ 2.4 Điểm tổng kết năm học mơn Tốn, tiếng Anh, Lịch sử, Địa lí, Hóa học Vật lý học sinh sau: Mơn học Tốn Tiếng Anh Lịch sử Địa lý Hoá học Vật lý A 6.0 7.0 7.5 5.8 5.3 4.2 B 8.0 6.5 6.6 7.5 7.0 7.6 C 5.3 6.0 5.0 4.8 4.5 4.3 D 8.5 7.9 7.1 7.7 6.8 7.9 E 4.5 8.0 8.0 8.4 4.4 4.6 HS Phân tích thành phần theo ma trận hiệp phương sai ta có: Hình 3.3: dg g Ta thấy cần giữ thành phần thông tin giữ lại đến 94% PC1  0.556Toán  0.085Anh  0.073Sử  0.292Đòa  0.415Hóa  0.64Lí  C1  PC2  0.282Toán  0.411Anh  0.561Sử  0.643Đòa  0.133Hóa  0.075Lí  C2 Do C1 C2 số nên ta bỏ quathành phần thứ PC1 tương quan dương với tất môn học tương quan dương mạnh môn Lý, đến Tốn đến Hóa Thành phần thứ PC2 tương quan âm mạnh môn Địa, đến Sử đến Anh Bây ta tiến hành chiếu lên hệ trục O.PC1PC2 16 Hình 3.4: dg g Như xếp theo lực học mơn Tốn, Lý Hóa ta có thứ tự học sinh sau: D, B, A, E, C Còn xếp theo lực học mơn Sử, Địa Anh ta có thứ tự học sinh là: E, D, A, B, C 2.2 PHÂN TÍCH NHÂN TỐ 2.2.1 Mơ hình phân tích nhân tố trực giao Cho vectơ ngẫu nhiên quan sát X  ( X1 , X , , X p ) có vectơ kì vọng E ( X )   ma trận hiệp phương sai Var ( X )   Mơ hình nhân tố giả định X tổ hợp tuyến tính số biến ngẫu nhiên không quan sát F1 , F2 , , Fm ( m  p ) gọi nhân tố chung p biến ngẫu nhiên cộng thêm 1 ,  , ,  p Tức X1  mu1  l11F1  l12 F2   l1m Fm  1 X  mu2  l21F1  l22 F2   l2 m Fm   X p   p  l p1F1  l p F2   l pm Fm   p Hoặc dạng ma trận: X  mu  L  F   Phần tử lij ma trận L gọi tải trọng biến X i đặt lên nhât tố F j Các giả thiết mơ hình: - Đối với nhân tố F : E( F )  0, cov( F )  E(FF )  I T - Đối với sai số ngẫu nhiên  : E( )  0, cov( )  E( )    diag ( 1, , p ) T - F  không tương quan: cov( F ;  )  Nếu giả thiết thỏa mãn cov( X )    LL  T Ta có: Var ( X i )   ii  li1  li   lim  i 2 Đại lượng hi  li1  li   lim gọi phương sai chung,  i gọi phương sai xác định Như 2 17  ii  hi2  i Ví dụ 2.5 Cho X  ( X1, X , X , X ) có ma trận hiệp phương sai 19 30 12  30 57 23    38 47    12 23 47 68  Giả sử X tổ hợp tuyến tính hai nhân tố trực giao Tìm F1 , F2  2.2.2 Phương pháp ước lượng Ước lượng dựa phân tích thành phần Cho X  ( X1 , X , , X p ) có vectơ trung bình E ( X )   ma trận hiệp phương sai  Giả sử (1; e1 ) , (2 ; e2 ) , , ( p , e p ) p cặp giá trị riêng - vectơ riêng  Khi   1e1e1T   p e2e2T    p e p eTp   1 e1 2 e2  p e p    1 e1 2 e2  p e p  T Giả sử ta muốn phân tích  với m  p nhân tố   L  L  0, T L   1 e1 2 e2 Nếu p  m giá trị riêng  p e p  m1 , m2 , ,  p p p có tổng T nhân tố cuối, tức   L  L , L   m1  m    p nhỏ bỏ qua p  m 1 e1 2 e2 m em  p m m Đặt   diag ( , , p ) với  i   ii   lii lii phần tử nằm đường chéo i 1 ma trận LLT , ta   L  L  T Ta chuẩn hóa vectơ ngẫu nhiên X  ( X1 , X , , X p ) : Zi  X i  i  ii Khi ta thực tương tự ma trận tương quan  Giả sử có n quan sát độc lập vectơ ngẫu nhiên X  ( X1 , X , , X p ) :  x11 x 21 x    xn1 x12 x22 xn x1 p  x2 p    xnp  Để ước lượng L  dựa mẫu số liệu ta thực sau: - Tìm p cặp giá trị riêng - vectơ riêng ma trận hiệp phương sai mẫu S : (ˆ1; eˆ1 ) ; (ˆ2 ; eˆ2 ) , , (ˆm ; eˆ p ) 18  ˆˆ   pm   1 e1 - Chọn m giá trị riêng Ước lượng L bởi: Lˆ  lˆij  ˆ2 eˆ2 ˆm eˆm   - Ước lượng ma trận hiệp phương sai sai số ngẫu nhiên  : ˆ  diag (ˆ1 ,ˆ , ,ˆ p ), với m ˆ i  sii   lˆii2 i ˆ ˆ ˆ gọi ma trận phần dư Ma trận S  LL T Ta chuẩn hóa mẫu số liệu x : zij  xij  x j s jj , i  1, 2, , n; j  1, 2, , p Khi ma trận hiệp phương sai mẫu R z   zij  x   xij  n p n p ma trận tương quan mẫu Phân tích nhân tố thành phần R tương tự S Ví dụ 2.6 Cho ước lượng ma trận hiệp phương sai điểm thi THPT Quốc gia mơn Tốn, Tiếng Anh Vật lý thí sinh tham dự tuyển sinh vào trường đại học sau: Toán Anh Toán 2.9830 Anh 0.0665 0.7570 Vật lý 2.971 0.3305 Vật lý 3.467 Phân tích nhân tố phương pháp thành phần X1  1  0.492F1  0.217 F2  1 X  2  0.130F1  0.985F2   X  3  0.503F1  0.043F2   2.2.3 Xoay nhân tố Trong phân tích nhân tố ta quan tâm đến làm tối đa lượng thơng tin giữ lại tính trực giao nhân tố mà chưa quan tâm đến tính tương quan biến nhân tố Chính tải trọng biến lên nhân tố chưa thật tối ưu nên khó giải thích ảnh hưởng nhân tố lên biến Phép xoay nhân tố nhằm mục đích làm tải trọng số biến đặt nhân tố gần với giá trị 1 biến lại có tải trọng gần Phép xoay trực giao phép xoay khơng làm thay đổi tính trực giao nhân tố Nếu Q ma trận T phép xoay trực giao, ta có Q Q  I Gọi Lˆ ma trận ma trận tải trọng ước lượng từ mẫu số T * ˆ Khi đó, ta có: LL ˆ ˆT   LQQ ˆ T LˆT   L* L*  Do liệu, ma trận tải trọng sau quay L  LQ ma trận phần dư không thay đổi thực phép quay Q Trong trường hợp hai nhân tố F1 F2 , ta có: 19  Cos   Sin  T  Cos   Sin  Sin   quay ngược chiều kim đồng hồ Cos Sin  Cos  quay chiều kim đồng hồ Hình 4.1: dg g Một số phép xoay nhân tố trực giao thường sử dụng là: Varimax, Quatimax Equimax Còn xem nhân tố có tương quan với ta sử dụng phép quay Promax Ví dụ 2.7 Trong nghiên cứu Lawley Maxwell điểm tổng kết môn học Thể thao, Tiếng Anh, Lịch sử, Số học, Đại số Hình học 220 học sinh, tác giả tính ma trận hệ số tương quan mẫu sau  Thể thao Tiếng Anh Lòch Sử Số học Đại số Hình học   0.439 0.410 0.288 0.329 0.248   1.000  0.439 1.000 0.351 0.354 0.320 0.329    0.351 1.000 0.164 0.190 0.181   0.410  0.288 0.354 0.164 1.000 0.595 0.470    0.320 0.190 0.595 1.000 0.464   0.329  0.248 0.329 0.181 0.470 0.464 1.000   Tiến hành phân tích nhân tố, khơng xoay nhân tố ta kết sau F1 F2 Thể thao 0.658 -0.449 Tiếng Anh 0.688 -0.29 Lịch sử 0.517 -0.637 Số học 0.738 0.413 Đại số 0.744 0.375 Hình học 0.678 0.355 Nhìn vào kết tải trọng F1 lớn tải trọng F2 nhỏ hơn, tải trọng khác khơng đáng kể nên khó giải thích ảnh hưởng nhân tố lên biến 20 Bây ta tiến hành xoay nhân tố Varimax: F1 F2 Thể thao 0.225 -0.764 Tiếng Anh 0.349 -0.66 Lịch sử -0.003 -0.821 Số học 0.833 -0.147 Đại số 0.814 -0.18 Hình học 0.75 -0.154 Như sau xoay nhân tố, tải trọng phù hợp hơn, nhân tố F1 tương quan dương mạnh với biến Số học, Đại số Hình học; nhân tố F2 tương quan âm mạnh với biến Thể thao, Tiếng Anh Lịch sử Do đó, học sinh có nhân tố F1 lớn có thiên hướng mơn tốn (Số học, Đại số Hình học) học sinh có nhân tố F1 nhỏ có thiên hướng với môn xã hội (Thể thao, Tiếng Anh Lịch sử) 2.3 ỨNG DỤNG PHẦN MỀM MINITAB 2.3.1 Phân tích thành phần Các bước thực Minitab: Stat → Multivariate → Principal Components Analysis → Variables: thành phần cần phân → Kích chọn Covariance → OK 2.3.2 Phân tích nhân tố Các bước thực Minitab: Stat → Multivariate → Factor Analysis → Variables: nhân tố cần phân tích→ Number of factor to extract: số thành phần cần giữ lại phân tích thành phần → Method of Extraction: Principal components → Type of Rotation: Varimax → OK 21 Ví dụ 1: Phân tích điểm trung bình Tốn, Lý, Hóa, Sinh, Văn, Sử, Địa, Anh học sinh lớp 12A2 Bước 1: Phân tích thành phần Nhập điểm trung bình mơn Tốn, Lý, Hóa, Sinh, Văn, Sử, Địa, Anh học sinh lớp 12A2 vào Minitab Thực phân tích thành phần 22 Bước 2: Phân tích nhân tố Nhận xét: - Từ bảng kết phân tích thành phần chính, ta thấy, dựa vào mức tích lũy ta cần giữ lại thành phần thơng tin giữ lại đến 91.7%  PC1  0.380 Toán+ 0.393 Lý+ 0.372 Hoá+ 0.328 Sinh+ 0.125 Văn+ 0.188 Sử+ 0.183 Đòa+ 0.609 Anh   PC2  0.252 Toán 0.450 Lý 0.497 Hoá+ 0.137 Sinh+ 0.409 Văn+ 0.140 Sử+ 0.198 Đòa+0.491Anh   PC3  0.061 Toán 0.227 Lý  0.335Hoá+0.356Sinh+ 0.281 Văn  0.412 Sử  0.427 Đòa 0.524 Anh PC4  0.289 Toán 0.295 Lý  0.212 Hoá+ 0.545 Sinh 0.522 Văn 0.422 Sử  0.116 Đòa  0.151Anh Ở thành phần thứ 𝑃𝐶1 tương quan dương với tất môn học tương quan dương mạnh tới mơn Anh, Lý, Tốn đến Hóa Thành phần thứ hai 𝑃𝐶2 tương quan âm mạnh với mơn Hóa Thành thứ ba 𝑃𝐶3 tương quan âm mạnh với mơn Anh Thành thứ tư 𝑃𝐶4 tương quan dương mạnh với môn Sinh, Lý - Sau phân tích thành phần chính, ta giữ lại thành phần để phân tích nhân tố Từ bảng kết phân tích nhân tố điểm trung bình học sinh lớp 12A2 trên, ta thấy F1 tương quan dương mạnh với biến Tốn, Lý, Hóa Do học sinh F1 có xu hướng học mơn khoa học tự 23 nhiên (Tốn, Lý, Hóa Các học sinh F2 có xu hướng học môn khoa học xã hội (Văn, Sử, Địa) Các học sinh F3 có su hướng học mơn Sinh học sinh F4 có su hướng học mơn Anh Nhưng nói chung, đa số học sinh lớp 12A2 có su hướng học tốt mơn Tốn, Lý, Hóa Ví dụ 2: Để khảo sát hài lòng bệnh nhân (BN) bệnh viện, câu hỏi soạn sẵn với 20 câu hỏi (biến) sau: Trang thiết bị phục vụ khám chữa bệnh bệnh viện có đầy đủ, đại? Phòng điều trị, phòng chờ khám bệnh có đầy đủ thiết bị? Nhà vệ sinh có đặt nơi thuận tiện? Bệnh viện có làm cho anh/ chị cảm thấy an tâm lựa chọn điều trị đây? Bác sĩ, điều dưỡng có ln quan tâm sẵn sàng giúp đỡ, giải vấn đề anh/chị? Anh/chị có tin tưởng vào kết chẩn đốn phương pháp điều trị bệnh viện? Anh/chị có tin tưởng vào bác sĩ điều trị bệnh viện? Bệnh viện có cung cấp dịch vụ khám chữa bệnh nhanh chóng mà khơng cần nhiều thời gian chờ đợi? Bệnh viện có cung cấp đầy đủ thơng tin tình trạng sức khoẻ anh/chị? 10 Bác sĩ có lắng nghe giúp đỡ anh/chị tận tình chu đáo? 11 Khi anh/chị cần, bệnh viện có đáp ứng điều trị kịp thời, nhanh chóng? 12 Mọi thủ tục từ nhập viện đến xuất viện có giải nhanh chóng? 13 Những câu hỏi liên quan đến tình hình sức khoẻ anh/chị nhân viên trả lời đầy đủ, rõ ràng? 14 Bác sĩ, điều dưỡng bệnh viện có lịch thân thiện trình khám chữa bệnh cho anh/chị? 15 Anh/chị có thấy nhân viên bệnh viện vui vẻ phục vụ? 16 Bác sĩ có giải thích xảy với bệnh nhân trước đưa điều trị? 17 Bác sĩ nói với bệnh nhân chẩn đốn bệnh họ? 18 Bác sĩ có sẵn sàng trả lời câu hỏi tình trạng sức khoẻ anh/chị? 19 Bác sĩ, điều dưỡng có đủ kiến thức để trả lời câu hỏi anh/chị? 20 Trình độ chun mơn bác sĩ có đáp ứng nhu cầu khám chữa bệnh anh/chị? Dùng thang điểm Likert với: Hoàn toàn đồng ý (5 điểm), đồng ý (4 điểm), không ý kiến (3 điểm), khơng đồng ý (2 điểm), hồn tồn khơng đồng ý (1 điểm) 24 Kết khảo sát (n= 200 bệnh nhân) với 20 câu hỏi: Bước 1: Phân tích thành phần 25 Bước 2: Phân tích nhân tố Từ phân tích thành phần chính, có giá trị riêng lớn nên ta chọn nhân tố để phân tích 26 Nhận xét: - Từ bảng kết phân tích thành phần bước 1, ta thấy, dựa vào mức tích lũy ta cần giữ lại thành phần thơng tin giữ lại đến 55.8% - Sau phân tích thành phần chính, ta giữ lại thành phần để phân tích nhân tố Từ bảng kết phân tích nhân tố bước 2, ta thấy rằng: + Nhân tố F1 tương quan mạnh với Q7, Q6, Q4, Q1, Q20 Tức là, nhân tố F1 quan tâm đến câu hỏi: Q7 Anh/chị có tin tưởng vào bác sĩ điều trị bệnh viện? Q6 Anh/chị có tin tưởng vào kết chẩn đoán phương pháp điều trị bệnh viện? Q4 Bệnh viện có làm cho anh/ chị cảm thấy an tâm lựa chọn điều trị đây? 27 Q1 Trang thiết bị phục vụ khám chữa bệnh bệnh viện đầy đủ, đại? Q20 Trình độ chun mơn bác sĩ có đáp ứng nhu cầu khám chữa bệnh anh/chị? Cả câu hỏi (biến) liên quan đến chất lượng điều trị, ta đặt nhân tố F1 Chất lượng điều trị bệnh viện + Nhân tố F2 tương quan mạnh với Q16, Q17, Q18, Q12 Tức là, nhân tố F2 quan tâm đến câu hỏi: Q16 Bác sĩ giải thích xảy với bệnh nhân trước đưa điều trị Q17 Bác sĩ nói với bệnh nhân chẩn đốn họ Q18 Bác sĩ sẵn sàng trả lời câu hỏi tình trạng sức khoẻ anh/chị Q12 Mọi thủ tục từ nhập viện đến xuất viện giải nhanh chóng Cả câu hỏi (biến) liên quan đến việc cung cấp thông tin bệnh tật cho BN, ta đặt nhân tố F2 Cung cấp thông tin + Nhân tố F3 tương quan mạnh với Q10, Q15, Q9, Q14, Q5 Tức là, nhân tố F3 quan tâm đến câu hỏi: Q10 Bác sĩ có lắng nghe giúp đỡ anh/chị tận tình chu đáo Q15 Anh/chị có thấy nhân viên bệnh viện vui vẻ phục vụ Q9 Bệnh viện cung cấp đầy đủ thơng tin tình trạng sức khoẻ anh/chị Q14 Bác sĩ, điều dưỡng bệnh viện có lịch thân thiện trình khám chữa bệnh cho anh/chị Q5 Bác sĩ, điều dưỡng bệnh viện quan tâm sẵn sàng giúp đỡ, giải vấn đề anh/chị Cả câu hỏi (biến) liên quan vấn đề giao tiếp nhân viên bệnh nhân, đặt nhân tố F3 Kỹ giao tiếp + Nhân tố F4 tương quan mạnh với Q8, Q3, Q2 Tức là, nhân tố F4 quan tâm đến câu hỏi: Q8 Bệnh viện cung cấp dịch vụ khám chữa bệnh nhanh chóng mà khơng cần nhiều thời gian chờ đợi Q3 Nhà vệ sinh đặt nơi thuận tiện Q2 Phòng điều trị, phòng chờ khám bệnh đầy đủ thiết bị Cả câu hỏi (biến) liên quan đến việc cung cấp dịch vụ, đặt tên nhân tố F4 Phương tiện dịch vụ Tóm lại, hài lòng BN bệnh viện tập trung vào nhân tố: (1) Chất lượng điều trị (2) Kỹ giao tiếp (3) Cung cấp thông tin (4) Phương tiện dịch vụ Sự hài lòng cao bệnh nhân bệnh viện nhân tố Chất lượng điều trị (F1) 28 KẾT LUẬN Trong suốt thời gian làm khóa luận vừa qua, tìm hiểu, học tập, nghiên cứu môn thống kê, em học hỏi nhiều kinh nghiệm quý báo cho thân sau Về mặt lý luận, báo cáo khóa luận phản ánh rõ trình làm khóa luận nghiên cứu thực nào? Chính điều làm em nhận thấy, việc học nghiên cứu môn Thống kê thật quan trọng sinh viên khoa Tốn Về mặt thực tiễn, thời gian làm khóa luận vừa qua làm em lớn lên nhiều mặt tư tưởng, ý thức mục đích Điều làm em thêm u thích việc học Tốn Trong thời gian qua, cố gắng nhiều kiến thức kinh nghiệm hạn chế nên khơng tránh khỏi sai sót, kính mong nhận ý kiến đóng góp q thầy để rút kinh nghiệm cho lần khác Em xin chân thành cảm ơn! Một lần em xin bày tỏ lòng biết ơn sâu sắc đến quý thầy khoa Tốn nói chung thầy Lê Văn Dũng nói riêng trang bị cho em hành trang nguồn kiến thức vơ bổ ích q giá Bài khóa luận chắn khơng tránh khỏi thiểu sót, kính mong q thầy góp ý bổ sung để báo cáo hoàn thiện ...  0,19)  0,85  0.05 H0 10 CHƯƠNG PHÂN TÍCH THÀNH PHẦN CHÍNH VÀ PHÂN TÍCH NHÂN TỐ VỚI PHẦN MỀM MINITAB 2.1 PHÂN TÍCH THÀNH PHẦN CHÍNH 2.1.1 Cấu trúc thành phần Cho vectơ ngẫu nhiên p chiều X... kết phân tích thành phần bước 1, ta thấy, dựa vào mức tích lũy ta cần giữ lại thành phần thơng tin giữ lại đến 55.8% - Sau phân tích thành phần chính, ta giữ lại thành phần để phân tích nhân tố. .. sát (n= 200 bệnh nhân) với 20 câu hỏi: Bước 1: Phân tích thành phần 25 Bước 2: Phân tích nhân tố Từ phân tích thành phần chính, có giá trị riêng lớn nên ta chọn nhân tố để phân tích 26 Nhận xét:

Ngày đăng: 10/06/2019, 14:12

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w