Phân tích phương sai với SPSS và ứng dụng

79 68 0
Phân tích phương sai với SPSS và ứng dụng

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

TRƯỜNG ĐẠI HỌC SƯ PHẠM HÀ NỘI KHOA TOÁN TRẦN THỊ NGỌC MAI PHÂN TÍCH PHƯƠNG SAI VỚI SPSS VÀ ỨNG DỤNG KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC Chuyên ngành: Toán ứng dụng Hà Nội - 2017 TRƯỜNG ĐẠI HỌC SƯ PHẠM HÀ NỘI KHOA TOÁN TRẦN THỊ NGỌC MAI PHÂN TÍCH PHƯƠNG SAI VỚI SPSS VÀ ỨNG DỤNG KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC Chuyên ngành: Toán ứng dụng Người hướng dẫn khoa học PGS TS Trần Trọng Nguyên Hà Nội - 2017 LỜI CẢM ƠN Trước tiên em xin bày tỏ lòng biết ơn sâu sắc tới PGS TS Trần Trọng Nguyên tận tình hướng dẫn, giúp đỡ em suốt trình thực đề tài Em xin trân trọng cảm ơn thầy giáo tổ tốn ứng dụng giảng dạy ban chủ nhiệm khoa Toán tạo điều kiện cho em hồn thành tốt khóa luận Em xin trân trọng cảm ơn! Hà Nội, tháng năm 2017 Sinh viên Trần Thị Ngọc Mai LỜI CAM ĐOAN Khóa luận tốt nghiệp trình học tập, nghiên cứu nỗ lực thân em bảo thầy, cô giáo, đặc biệt bảo, hướng dẫn tận tình thầy giáo Trần Trọng Ngun Khóa luận tốt nghiệp với đề tài: “Phân tích phương sai với SPSS ứng dụng” khơng có trùng lặp với khóa luận khác kết thu để tài hồn tồn xác thực, có kế thừa số tài liệu khác Hà Nội, tháng năm 2017 Sinh viên Trần Thị Ngọc Mai MỤC LỤC Trang MỞ ĐẦU 1 Lí chọn đề tài Mục đích nghiên cứu Đối tượng phạm vi nghiên cứu Phương pháp nghiên cứu Cấu trúc khóa luận NỘI DUNG CHƯƠNG MỘT SỐ KIẾN THỨC CƠ SỞ 1.1 Biến ngẫu nhiên 1.1.1 Khái niệm 1.1.2 Phân loại 1.1.2.1 Biến ngẫu nhiên rời rạc 1.1.2.2 Biến ngẫu nhiên liên tục 1.1.3 Đặc trưng biến ngẫu nhiên 1.1.3.1 Kỳ vọng 1.1.3.2 Phương sai 1.1.3.3 Phân vị, trung vị 1.2 Hàm phân phối 1.2.1 Khái niệm 1.2.2 Tính chất 1.2.3 Một số hàm phân phối thường gặp 1.2.3.1 Phân phối chuẩn 1.2.3.2 Phân phối  1.2.3.3 Phân phối Student 1.2.3.4 Phân phối Fisher 1.3 Mẫu ngẫu nhiên 1.3.1 Khái niệm 1.3.2 Đặc trưng mẫu 10 1.3.2.1 Trung bình mẫu 10 1.3.2.2 Phương sai mẫu 10 1.4 Bài toán kiểm định giả thuyết 11 1.4.1 Khái niệm 11 1.4.2 Tiêu chuẩn kiểm định 11 1.4.3 Miền bác bỏ giả thuyết 12 1.4.4 Giá trị quan sát tiêu chuẩn kiểm định 12 1.4.5 Sai lầm toán kiểm định 12 1.5 Mơ hình hồi quy 13 1.5.1 Hàm hồi quy 13 1.5.2 Hồi quy tổng thể hồi quy mẫu 13 1.5.3 Hồi quy tuyến tính 14 1.5.4 Hồi quy đơn hồi quy bội 14 1.5.5 Mơ hình hồi quy với biến giả 15 1.6 Phương pháp bình phương cực tiểu 15 KẾT LUẬN CHƯƠNG 17 CHƯƠNG PHÂN TÍCH PHƯƠNG SAI 18 2.1 Bài tốn phân tích phương sai 18 2.1.1 Bài toán phân tích phương sai cổ điển 18 2.1.2 Bài tốn phân tích phương sai 19 2.2 Phương pháp chung 20 2.3 Phân loại phân tích phương sai 21 2.3.1 Phân tích phương sai nhân tố 21 2.3.1.1 Phân tích phương sai nhân tố hiệu xác định 21 2.3.1.2 Phân tích phương sai nhân tố hiệu ngẫu nhiên 38 2.3.2 Phân tích phương sai hai nhân tố hiệu xác định 39 2.3.2.1 Mơ hình phân tích phương sai hai nhân tố tác động riêng rẽ 39 2.3.2.2 Kĩ thuật phân tích kiểm định 40 2.3.2.3 Mơ hình phân tích phương sai hai nhân tố tác động đồng thời42 KẾT LUẬN CHƯƠNG 45 CHƯƠNG SPSS VỚI PHÂN TÍCH PHƯƠNG SAI 46 KẾT LUẬN CHƯƠNG 52 KẾT LUẬN 53 TÀI LIỆU THAM KHẢO 54 MỞ ĐẦU Lí chọn đề tài Xác suất thống kê môn học đưa vào giảng dạy hầu hết trường đại học, cao đẳng hay trung cấp Nó ngành khoa học nghiên cứu tượng ngẫu nhiên có phát triển vượt bậc kỉ XX Đầu tiên xác suất xuất trị chơi giải trí cách vài kỉ, ngày có nhiều nhà tốn học nghiên cứu lĩnh vực Blaise Pascal, James Bernoulli, Pierre Simon Laplace, Ngày ngành khoa học người biết đến không ngành tốn học chặt chẽ lí thuyết mà cịn có ứng dụng rộng rãi nhiều ngành khác kinh tế, kĩ thuật, quản lí xã hội, khoa học tự nhiên… Ở nước ta nay, q trình cơng nghiệp hóa, đại hóa, kinh tế có nhiều biến động khái niệm liên quan đến xác suất thống kê như: dự báo, chuẩn đoán, kiểm định tăng giảm giá thị trường,… ngày trở nên quen thuộc Chính xác suất thống kê trở thành công cụ hữu ích để giải nhiều vấn đề sống Phân tích phương sai nội dung quan trọng thống kê phân tích Nội dung mặt kĩ thuật tìm cách phân chia tổng sai số bình phương biến ngẫu nhiên X thành phận khác mà phận phản ánh tổng bình phương sai số X theo đặc trưng Đặc trưng xác định tùy thuộc mục đích nghiên cứu thống kê Vì với mong muốn tìm hiểu sâu phân tích phương sai, hướng dẫn thầy giáo Trần Trọng Nguyên em chọn đề tài: "Phân tích phương sai với SPSS ứng dụng" để hồn thành khóa luận tốt nghiệp Mục đích nghiên cứu - Nghiên cứu tốn phân tích phương sai - Nghiên cứu cách sử dụng phần mềm SPSS phân tích phương sai Đối tượng phạm vi nghiên cứu - Đối tượng nghiên cứu: Các kiến thức phân tích phương sai, phần mềm SPSS - Phạm vi nghiên cứu: Phân tích phương sai thống kê phân tích Phương pháp nghiên cứu - Đọc hiểu tài liệu - Đánh giá, phân tích tổng hợp Cấu trúc khóa luận Ngoài phần mở đầu, kết luận tài liệu tham khảo, khóa luận gồm chương: Chương Một số kiến thức sở Chương Phân tích phương sai Chương SPSS với phân tích phương sai NỘI DUNG Chương MỘT SỐ KIẾN THỨC CƠ SỞ Trong chương 1, khóa luận trình bày số kiến thức sở biến ngẫu nhiên, mẫu ngẫu nhiên, hàm phân phối,… để làm tảng kiến thức cho chương sau 1.1 Biến ngẫu nhiên 1.1.1 Khái niệm Một đại lượng (hay biến) nhận giá trị với xác suất tương ứng gọi đại lượng ngẫu nhiên hay biến ngẫu nhiên Ta thường ký hiệu biến ngẫu nhiên chữ X, Y, Z,…  , , , Các giá trị mà biến ngẫu nhiên nhận thường viết chữ nhỏ x, y, z,… 1.1.2 Phân loại Căn vào giá trị mà biến ngẫu nhiên nhận ta phân biến ngẫu nhiên làm loại chính: biến ngẫu nhiên rời rạc biến ngẫu nhiên liên tục 1.1.2.1 Biến ngẫu nhiên rời rạc Nếu tập giá trị mà biến ngẫu nhiên nhận tập gồm số hữu hạn điểm vơ hạn đếm được, biến ngẫu nhiên gọi biến ngẫu nhiên rời rạc Giả sử biến ngẫu nhiên X nhận giá trị x1, x2 , , xn , P X  xi   , i = 1, 2,… pi Để mô tả (hoặc xác định) biến ngẫu nhiên rời rạc X ta dùng bảng sau: … P … p …p …  Trong pi  , i pi  i  1, 2, Từ ta có:    j k X ijk  X    i j k i X  * j X     X j k k  X  i  *   X ijk  X  X k  X i j 2 j  k j X   k i  j * j  k *  X X  X  X X  j k k   X ijk j  X  X X  ijk  k * X  X X 2 i  X X k   j X 2 i * j  k Với biến đổi chi tiết ta có kết sau:   i j  X ijk  X  k  p  nj X j  X  j1 p q * n jk  q n X k k 1 k   X 2   X ijk  X  X k  X j1 k 1 i1 * j Hay: TSS = GSSR + GSSC + SSE Trong đó: GSSR tổng sai lệch bình phương theo nhân tố F (dịng) với df = p – GSSC tổng sai lệch bình phương theo nhân tố G (cột) với df = q – SSE tổng sai lệch bình phương sai số ngẫu nhiên với df = (p – 1)(q – 1)  Kiểm định tác động nhân tố + Kiểm định giả thuyết H0 :  H1 :  với Tiêu chuẩn kiểm định là: F  GSSR /  p 1 SSE /  p 1 q 1 Miền bác bỏ tương ứng mức ý nghĩa α:  W  F : Fqs  F  p 1,  p 1 q 1  + Kiểm định giả thuyết H0 :bi  với H1 : bi  0 Tiêu chuẩn kiểm định là: F   GSSC /  q 1 SSE /  p 1 q 1 Miền bác bỏ tương ứng mức ý nghĩa α: W  F : F qs  F  p 1,  p 1 q 1   2.3.2.3 Mơ hình phân tích phương sai hai nhân tố tác động đồng thời Trong điều kiện hai nhân tố tác động đồng thời ta có mơ hình: X ijk  m  a j  bk  c jk  uijk Trong đó: c jk  E  X ijk / F  Fj ,G  Gk  , U phân phối chuẩn Nhân tố F có P dấu hiệu, nhân tố G có Q dấu hiệu Trường hợp mẫu cân (phép thử lặp) Mỗi cặp dấu hiệu ( Fj ,Gk ) có M quan sát Như với mơ hình phải có sơ đồ mẫu sau đây: Khn dạng liệu G … Q … F K K … h h X …X … … … …X …X 1 1X … 1X … … …X …X … 2… … 2… … … … 2… … 2… … …… … …………… … P X …X P P … … …X …X P P Trong khối phải có cá thể mẫu khác theo dấu hiệu F G Trong trường hợp F, G tác động riêng rẽ biến X ij mơ hình trung bình mẫu dịng i khối j Ta gọi phần giao dòng i khối j (ơ(i, j)) Ta ký hiệu trung bình sau: Q P X Trung bình chung:  PQM * Xj  M  X ijk k 1 i 1 QM P M  X ijk j 1 i 1 Xk  Trung bình khối k: X ijk j 1 k 1 i 1 Q Trung bình dịng j: M PM M X jk  Trung bình (i, j): X ijk i 1 M Khai triển tổng bình phương sai lệch so với trung bình chung với mẫu kích thước n = PQM ta có: P Q M    P  *  Q X ijk  X  MQ X j  X  MP i1 j1 k 1 i1 P Q  Xk  X  j1  *  M  X jk  X j  X k  X  i1 j1 Q   X P M i1 j1 k 1 Hay: TSS = GSSR + GSSC + ISS + SSE Với ISS tổng bình phương sai lệch ô ijk  X jk  Các tiêu chuẩn kiểm định miền bác bỏ + Trung bình theo biến dịng: FR  GSSR /  P 1 SSE / PQ  M 1 Miền bác bỏ: FRqs  F  P 1, PQ  M 1  + Trung bình theo biến cột: FC  GSSC /  Q 1 SSE / PQ  M 1 Miền bác bỏ: FCqs  F  Q 1, PQ  M 1  + Trung bình theo ơ: FI  ISS /   P  1  Q  1 SSE / PQ  M 1  P 1 Q 1 , PQ  M 1 Miền bác bỏ: F  Iqs F Trường hợp mẫu không cân Mỗi cặp ( Fj ,Gk ) có n jk quan sát Dấu hiệu Fj có n j quan sát; dấu hiệu Gk có mk quan sát Các tổng bình phương sai số tương ứng tính theo cơng thức sau: TSS    X i, j,k  X , GSSR  p  nj X j  X  , GSSC  Q    mk X k  X k 1 * j1 i, j,k ISS  j,k n jk  X jk  X j  Xk * X  TSS  GSSR  GSSC   , SSE ISS Thí dụ 2.3: Quan sát cơng nhân đào tạo sở đào tạo, có bậc thợ, làm việc 10 máy loại 10 sở khác chế tạo Người ta có số liệu số sản phẩm ca (X) sau: M y 11 21 31 41 51 61 71 81 91 11 02 Công nhân A T1 B 1 1 4, 1 1 5, 1 1 6, 1 1 3, 1 1 3, 1 1 6, 1 1 6, 1 1 3, 1 1 7, 1 1 3, Công nhân B T1 B 1 1 6, 1 1 6, 1 1 5, 1 1 3, 1 1 5, 1 1 5, 1 1 5, 1 1 7, 1 1 5 4, 1 1 6, TB cột 14,9 TB cột 15,47 Công T nhân C B T Bd 1 1 5, 5, 1 1 4, 5, 1 1 6, 6, 1 1 4, 3, 1 1 6, 5, 1 1 6, 5, 1 1 5, 5, 1 1 5, 5, 1 1 5, 5, 1 1 4, 4, T B TB cột 15,50 Có thể kết luận số sản phẩm trung bình theo sở chế tạo máy, theo sở đào tạo công nhân theo hai yếu tố với mức ý nghĩa 5%? Ta tính được: GSSR = 36,944; GSSC = 7,62; ISS = 68,82; SSE = 300,66 Ta có: F0,05(9,60) = 2,04; F0,05(2,60) = 3,15; F0,05(18,60) = 1,77 Ta thấy giả thuyết trung bình theo dịng, cột hay theo không bị bác bỏ KẾT LUẬN CHƯƠNG Căn vào việc nghiên cứu tổng hợp tài liệu, chương 2, khóa luận trình bày tương đối đầy đủ khái niệm tốn phân tích phương sai, cách phân loại cách kiểm định giả thuyết dùng phân tích phương sai Từ giúp người đọc thấy ứng dụng phân tích phương sai tốn phân tích số liệu Chương 3: SPSS VỚI PHÂN TÍCH PHƯƠNG SAI SPSS (viết tắt Statistical Package for the Social Sciences) phần mềm máy tính phục vụ cơng tác phân tích thống kê SPSS sử dụng phổ biến cho nghiên cứu điều tra xã hội học kinh tế lượng Nó có giao diện thân thiện với người dùng, dễ sử dụng sử dụng chủ yếu thao tác click chuột dựa công cụ (tool) mà dùng lệnh SPSS mạnh cho phân tích kiểm định phi tham số, thống kê mơ tả, phân tích tương quan,… Trong chương 3, khóa luận trình bày cách sử dụng phần mềm SPSS phân tích phương sai nhân tố Để đơn giản việc sử dụng phần mềm sử dụng tệp liệu từ www.mfe.edu.vn/thuvien/dulieu  Phân tích phương sai nhân tố Thủ tục nhận từ lệnh analyze\compare means\One way anova Bảng chọn có dạng sau: Từ bảng chọn chọn hay số biến cần phân tích chọn nhân tố, nhân tố phải có từ giá trị trở lên Hãy chọn biến wrkstat (tình trạng việc làm) marital (tình trạng nhân) làm biến phụ thuộc relig (tín ngưỡng) làm nhân tố phân tích Trong bảng chọn ta muốn kết hợp so sánh trung bình cặp chọn nút Post Hoc Bảng chọn Post Hoc sau: Với bảng chọn chọn vài tiêu chuẩn so sánh phù hợp để so sánh cặp (chọn LSD Scheffe) biến chọn làm nhân tố phân tích có từ giá trị trở lên Ví dụ, phân tích phương sai hai biến wrkstat, marital theo relig, chọn mức ý nghĩa 5% Với việc so sánh trung bình cặp nhờ tiêu chuẩn LSD Scheffe từ GSS93 ta có kết sau: ANOVA S M u e d FSi m a f g 24 00 2 La bor Fo rce Be 4 tw ee M ari tal Be tw ee n 15 3 00 5 Kết rút gọn so sánh cặp (I De pe V ar La Sc bo hef Fo rce St atu s M ari St atu R el Pr ef P r M e RD S e iff t Pr ( E S ef I r i C a 1 J e 4 N o O t LP C Sr a J e N o O t Sc P C - he r a 0 J e N - o O - t LP C - Sr a J e N - o O - 2difference * Thetmean is significant at the 05 level Kết cho thấy, tình trạng nhân tình trạng việc làm khác theo tín ngưỡng, nhiên với kết so sánh cặp khác có số tín ngưỡng Kết nhận từ chương trình: ONEWAY wrkstat marital BY relig /MISSING ANALYSIS /POSTHOC=SCHEFFE LSD ALPHA(0.05) SPSS cho phép kiểm định phương sai, chọn từ option mục Homogeneity of variance có thêm kết sau: Test of Homogeneity of Variances L Se La bo M ari ta d d S f f i Trong số phân tích phương sai, biến dùng làm nhân tố phân tích lại biến đo mức tiêu thức đó, xuất vấn đề trung bình khác có kết hợp tuyến tính hay khơng? One way anova cho phép tiến hành kiểm định Với GSS93.sav ta xét phân tích phương sai số mong muốn (chldidel) thể hệ (agecat4) Sau kết tương đối đầy đủ thủ tục + Phân tích phương sai có kiểm định kết hợp tuyến tính ANOVA Ideal Number of Children S Su d q Be (C f3 tw G Lm 61 r i T 1 e D 62 Wi thi T 32 69 ot3 M Se F Si q .g .2 + Kiểm định tính phương sai Test of Homogeneity of Variances Ideal Number of Children L e d d S v f f i + Mơ tả phân nhóm tự động Ideal Number of Children Scheffea,b A g -1 -4 - S u Means for groups in homogeneous subsets are displayed a Uses Harmonic Mean Sample Size = 227.868 b The group sizes are unequal The harmonic mean of the group sizes is used Type I error levels are not guaranteed + So sánh cặp tiêu chuẩn Scheffe LSD Multiple Comparisons Dependent Variable: Ideal Number of Children M (I) Ag e Sc (J) he Ag L S e S a t n d 4D - - 1 - - - 1 01 11 - 1 31 41 21 01 95% Conf iden ce S Inter i val g - - - - - - - - - - 0 - - 40 - - - - - - 40 - - - - - 01 30 - 11 - - 1 31 30 41 40 - difference is significant at the 0.05 level * The mean Kết nhận từ chương trình ONEWAY chldidel BY agecat4 /POLYNOMIAL=1 /STATISTICS DESCRIPTIVES HOMOGENEITY /MISSING ANALYSIS /POSTHOC=SCHEFFE LSD ALPHA(0.05) KẾT LUẬN CHƯƠNG Trong chương 3, khóa luận trình bày cách sử dụng SPSS phân tích phương sai nhân tố SPSS cung cấp thủ tục phân tích phương sai cấu thành phương sai thực đơn statistic (hoặc analyse) Với SPSS phân tích thực trạng, tìm nhân tố ảnh hưởng để đưa định xác, giải vấn đề nhanh chóng đạt kết tốt KẾT LUẬN Khóa luận em trình bày khái niệm mơ hình phân tích phương sai, phân tích phương sai gồm có loại có ứng dụng đời sống, đặc biệt cách sử dụng phần mềm SPSS phân tích phương sai Tuy nhiên thời gian có hạn chưa có nhiều kinh nghiệm cơng tác nghiên cứu khoa học nên vấn đề mà em trình bày khóa luận khơng tránh khỏi thiếu sót Vì em mong nhận đóng góp ý kiến thầy, để khóa luận em hồn thiện Em xin chân thành xảm ơn! TÀI LIỆU THAM KHẢO [1] Nguyễn Văn Hữu Nguyễn Hữu Dư (2000), Phân tích thống kê dự báo, Nhà xuất Đại học Quốc gia Hà Nội [2] Đào Hữu Hồ (1999), Xác suất thống kê, Nhà xuất Đại học Quốc gia Hà Nội [3] Đào Hữu Hồ (1999), Hướng dẫn giải toán xác suất thống kê, Nhà xuất Đại học Quốc gia Hà nội [4] Lê Bá Long (2009), Lý thuyết xác suất thống kê, Nhà xuất Thông tin truyền thông [5] Đặng Hùng Thắng (1997), Mở đầu lý thuyết xác suất ứng dụng, Nhà xuất Giáo dục [6] Ngô Văn Thứ TS Nguyễn Mạnh Thế (2015), Thống kê thực hành, Nhà xuất Đại học Kinh tế Quốc dân ... toán phân tích phương sai cổ điển 18 2.1.2 Bài tốn phân tích phương sai 19 2.2 Phương pháp chung 20 2.3 Phân loại phân tích phương sai 21 2.3.1 Phân tích phương sai nhân... "Phân tích phương sai với SPSS ứng dụng" để hồn thành khóa luận tốt nghiệp 2 Mục đích nghiên cứu - Nghiên cứu tốn phân tích phương sai - Nghiên cứu cách sử dụng phần mềm SPSS phân tích phương sai. .. thức chương sau Chương PHÂN TÍCH PHƯƠNG SAI Phân tích phương sai nội dung thống kê phân tích Nội dung phân tích phương sai mặt kĩ thuật tìm cách phân chia tổng sai số bình phương biến ngẫu nhiên

Ngày đăng: 13/08/2020, 16:09

Tài liệu cùng người dùng

Tài liệu liên quan