Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 54 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
54
Dung lượng
1,7 MB
Nội dung
TRƢỜNG ĐẠI HỌC SƢ PHẠM HÀ NỘI KHOA TOÁN ************ ĐỒN THỊ THE PHƢƠNG PHÁP PHÂN TÍCH THÀNH PHẦN CHÍNH VÀ ỨNG DỤNG VỚI SPSS KHĨA LUẬN TỐT NGHIỆP ĐẠI HỌC Chuyên ngành: Toán Ứng dụng HÀ NỘI - 2018 TRƢỜNG ĐẠI HỌC SƢ PHẠM HÀ NỘI KHOA TỐN ************ ĐỒN THỊ THE PHƢƠNG PHÁP PHÂN TÍCH THÀNH PHẦN CHÍNH VÀ ỨNG DỤNG VỚI SPSS KHĨA LUẬN TỐT NGHIỆP ĐẠI HỌC Chuyên ngành: Toán ứng dụng Ngƣời hƣớng dẫn khoa học PGS.TS.TRẦN TRỌNG NGUYÊN HÀ NỘI - 2018 LỜI CẢM ƠN Để hồn thành tốt khóa luận tốt nghiệp với đề tài “Phương pháp phân tích thành phần ứng dụng với spss”, tơi nhận nhiều hướng dẫn, giúp đỡ tận tình thầy cô, bạn bè Tôi chân thành cảm ơn thầy giáo – PGS.TS Trần Trọng Nguyên Thầy trực tiếp bảo, tận tình hướng dẫn tơi suốt q trình nghiên cứu, thực đề tài Tơi chân thành cảm ơn q Thầy, Cơ Khoa Tốn, Trường Đại học Sư phạm Hà nội 2, đặc biệt tổ Ứng dụng tạo điều kiện thời gian cho tơi suốt q trình nghiên cứu Thầy người truyền đạt cho kiến thức tảng để thực khóa luận Tơi xin cảm ơn người thân, bạn bè bên tơi, động viên tơi học tập hồn thành khóa luận Do lần làm quen với công tác nghiên cứu khoa học thời gian kiến thức chun mơn hạn chế nên có nhiều cố gắng song khóa luận khơng tránh khỏi thiếu sót, tơi mong góp ý, bảo thêm quý thầy cô bạn sinh viên Tôi xin chân thành cảm ơn! Sinh viên Đồn Thị The LỜI CAM ĐOAN Tơi xin cam đoan cơng trình nghiên cứu độc lập cá nhân với cố vấn thầy giáo PGS.TS Trần Trọng Nguyên Tất nguồn tài liệu cơng bố đầy đủ, nội dung khóa luận trung thực Sinh viên Đoàn Thị The MỤC LỤC LỜI MỞ ĐẦU Chƣơng Kiến thức chuẩn bị 1.1 Momen quán tính .3 1.1.1 Momen quán tính chất điểm, hệ chất điểm tâm 1.1.2 Momen quán tính chất điểm, hệ chất điểm đường thẳng 1.2 Tích vơ hƣớng hai vectơ .3 1.3 Biến ngẫu nhiên đặc trƣng biến ngẫu nhiên 1.3.1 Biến ngẫu nhiên 1.3.2 Các đặc trưng số biến ngẫu nhiên 1.3.3 Ma trận hiệp phương sai, ma trận hệ số tương quan 1.4 Giá trị riêng, vectơ riêng, vết ma trận vuông 1.4.1 Giá trị riêng, vectơ riêng ma trận .7 1.4.2 Vết ma trận (Trace A) Chƣơng Lý thuyết phân tích thành phần (PCA) 2.1 Mô tả số liệu 2.1.1 Số liệu đặc trưng 2.1.2 Không gian cá thể ( E ) 11 2.1.3 Không gian biến ( F ) 12 2.2 p n Tạo biến – phép chiếu lên khơng gian tuyến tính 12 2.2.1 Tạo biến 12 2.2.2 Phép chiếu lên khơng gian tuyến tính 13 2.3 Phƣơng pháp phân tích thành phần 14 2.3.1 Phép chiếu lên không gian .14 2.3.2 Trục chính, nhân tố thành phần .15 2.3.3 Xác định chọn số thành phần 16 2.4 Phân tích thành phần với ma trận hệ số tƣơng quan 17 2.5 Phân tích kết phân tích thành phần .18 2.5.1 Các kiểm định chung 18 2.5.2 Tương quan thành phần biến ban đầu định danh thành phần 19 2.5.3 Phép quay trục không gian ảnh .20 2.5.4 Các hệ số phản ánh liên hệ cá thể thành phần 21 2.5.5 Phân tích biến R 22 2.6 n Tiêu chuẩn chọn số thành phần cho phân tích .23 Chƣơng SPSS ứng dụng phân tích thành phần 25 3.1 Giới thiệu phần mềm SPSS .25 3.1.1 Tổng quan .25 3.1.2 Giới thiệu phần mềm SPSS 25 3.2 Phân tích thành phần với SPSS .29 Bài toán .29 Bài toán .41 KẾT LUẬN 47 TÀI LIỆU THAM KHẢO 48 LỜI MỞ ĐẦU Lý chọn đề tài Trong công tác nghiên cứu thực nghiệm, ta thu thập liệu thường thể dạng bảng giá trị số nhiều cá thể Chúng tạo thành “đám mây số liệu” phức tạp việc tìm hiểu thơng tin từ gặp khó khăn Một phương pháp hiệu xử lý số liệu nhiều chiều phương pháp phân tích thành phần – Principal component analysis (PCA) Ý tưởng phương pháp là: + Giúp giảm số chiều liệu + Thay giữ lại trục tọa độ không gian cũ, PCA xây dựng không gian chiều hơn, lại có khả biểu diễn liệu tốt tương đương không gian cũ + Các trục tọa độ không gian tổ hợp tuyến tính khơng gian cũ + Trong khơng gian liên kết tiềm ẩn liệu khám phá, mà đặt không gian cũ khó phát PCA áp dụng để phân tích liệu nhiều lĩnh vực nông nghiệp, kinh tế, y tế ngành khoa học khác Với mong muốn tìm hiểu sâu lý thuyết phân tích thành phần cách thức phân tích liệu phương pháp phân tích thành phần spss tơi chọn đề tài “Phương pháp phân tích thành phần ứng dụng với spss” Mục đích nghiên cứu Tìm hiểu phương pháp phân tích liệu thống kê nhiều chiều Nhiệm vụ nghiên cứu Nghiên cứu ý tưởng phương pháp phân tích thành phần ứng dụng mơ hình kết hợp sử dụng phần mềm thống kê SPSS để phân tích số liệu cụ thể Phƣơng pháp nghiên cứu Một số phương pháp nghiên cứu sử dụng khóa luận là: Phân tích, tổng hợp tài liệu phương pháp phân tích thành phần Thu thập xử lý liệu nhiều chiều phương pháp phân tích thành phần SPSS Cấu trúc khóa luận Nội dung khóa luận gồm chương: Chương 1: “Các kiến thức chuẩn bị” trình bày khái niệm tốn học, thống kê có liên quan đến phân tích thành phần Chương 2: “ Lý thuyết phân tích thành phần chính” thể ý tưởng phương pháp phân tích thành phần phân tích kết phân tích thành phần Chương 3: “SPSS ứng dụng phân tích thành phần chính” giới thiệu phần mềm SPSS bước thực phân tích thành phần với số tốn phân tích liệu cụ thể Chƣơng Kiến thức chuẩn bị 1.1 Momen quán tính 1.1.1 Momen quán tính chất điểm, hệ chất điểm tâm Momen quán tính chất điểm m tâm O đại lượng định nghĩa M m/O md ,trong đó: m khối lượng chất điểm, d khoảng cách từ chất điểm m đến tâm O Momen quán tính hệ chất điểm { mi } tâm O M mi /O mi di ,trong đó: mi khối lượng chất điểm thứ i, d i khoảng cách từ chất điểm mi đến tâm O Trọng tâm G hệ chất điểm vị trí thỏa mãn hệ thức m M G , i i i đó: M i vị trí chất điểm thứ i M mi /G mi di 1.1.2 Momen quán tính chất điểm, hệ chất điểm đường thẳng Momen quán tính chất điểm m đường thẳng d M m/(d) md ,trong đó: m khối lượng chất điểm, d khoảng cách từ chất điểm m đến đường thẳng d Momen quán tính hệ chất điểm mi đường thẳng d M mi /(d) mi di ,trong đó: mi khối lượng chất điểm thứ i, d i khoảng cách từ chất điểm mi đến đường thẳng (d) 1.2 Tích vơ hƣớng hai vectơ Định nghĩa 1.1 Cho hai vectơ u v khác , góc hợp u v Tích vơ hướng hai vectơ u v ký hiệu u.v số, xác định u.v | u || v | cos Nếu u v u.v Nếu u || v u.v | u || v | Biểu thức tọa độ tích vơ hướng: + Trong không gian chiều: u (u1 ,u ) , v (v1 , v2 ) u.v u1v1 u2v2 Trong mặt phẳng Ox1 x2 , cho điểm M x1 , x2 , đường thẳng có vectơ phương u (1 , ) , || u || G hình chiếu M xuống Hình 1.1 Khi đó: OG OM U | OM | cos x11 x2 + Trong không gian p chiều: M x1 , x2 ,., x p , U (1 , , , p ) OG OM U | OM | cos x11 x2 x p p Chú ý: Nếu vectơ u v hai vectơ đơn vị u.v cos Do khơng gian p chiều với u (1 , , , p ) v (1 , 2 , , p ) vectơ đơn vị, góc hợp u v cos 11 2 p p 1.3 Biến ngẫu nhiên đặc trƣng biến ngẫu nhiên 1.3.1 Biến ngẫu nhiên Định nghĩa 1.2 (biến ngẫu nhiên chiều): Cho không gian xác suất (,P) Một biến ngẫu nhiên với giá trị thực hàm số đo không gian xác suất, X : (,P) R Định nghĩa 1.3 (biến ngẫu nhiên nhiều chiều): Cho X1 , X , , X n biến ngẫu nhiên chiều xác định không gian xác suất (,P) Với , ta làm phép tương ứng với điểm X ( ) ( X1 (), X (), , X n ()) không gian Ơ-clit n chiều Options: Hình 3.15 Nhấn OK Khi SPSS phân tích cho ta liệu đầu Hình 3.16 34 Ý nghĩa số liệu kết quả: Bảng 3.2 Giá trị trung bình độ lệch chuẩn biến phân tích Bảng 3.3 Ma trận hệ số tương quan biến Từ ma trận hệ số tương quan ta nhận thấy biến có tương quan chặt chẽ o FOR-EFI 0,979, FOR-PAR 0,947, FOR-EFS 0,933, FOR-ALC 0,88 o RES-PUB 0,859, RES-VOL 0,861, RES-PSY 0,891 Biểu đồ 3.1 Biểu đồ giá trị riêng 35 Biểu đồ Scree Plot biểu diễn giá trị riêng tướng ứng thành phần Từ biểu đồ ta thấy từ giá trị thứ trở sai khác chúng khơng đáng kể Do theo tiêu chuẩn Kaiser nên chọn thành phần cho phân tích Bảng 3.4 Bảng tổng phương sai Từ bảng 3.4 ta có thành phần tương ứng với giá trị riêng lớn 5,677 3,054 Có 56,769% qn tính đám mây số liệu phản ánh thành phần thứ 30,544% phản ánh thành phần thứ hai Với hai thành phần ta thu đám mây ảnh giải thích 87,313% đặc tính số liệu ban đầu Định danh thành phần chính: Bảng 3.5 Tọa độ biến trục chính-(hệ số tương quan biến trục chính) 36 Bảng 3.6 Toạ độ biến trục sau phép quay Để loại bỏ hệ số tương quan < 0,3 ta thực thao tác : Factor Analysis >Options> Tích vào hai ô vuông Sorted by size Suppress absolute values less than Sau chọn giá trị 0,3>Continue>OK ta thu kết bảng 3.8 Bảng 3.8 Thành phần thứ thể đặc tính lý hóa loại bia (yếu tố bên trong) 37 Thành phần thứ hai thể yếu tố bên ngồi tác động đến thị trường tiêu thụ (quảng cáo, phân phối, thể tích) Biểu đồ 3.2 Biểu đồ biến mặt phẳng chiếu Biểu đồ 3.2 vị trí biến mặt phẳng tọa độ với trục thành phần Xét trục, biến PUB (quảng cáo) biến đổi ngược chiều với biến khác Các biến EFI, FOR, EFS có quan hệ chặt chẽ với Bảng 3.9 Hệ số tổ hợp biến (các vectơ nhân tố chính) Đây bảng hệ số cấu thành hệ số nhân tố cá thể Hai nhân tố ký hiệu FAC1_1, FAC2_2 Khi cá thể có thêm hai giá trị tọa độ chúng theo nhân tố (xem bảng 3.10) 38 Bảng 3.10 Tọa độ cá nhân trục Ta lập biểu đồ biểu diễn cá thể mặt phẳng cách thực thao tác sau: Vào menu Graphs Scatter Simple Scatterplot Difine xuất hộp thoại Hình 3.17 39 Ta chuyển FAC2_2 FAC1_1 vào Y Axis X Axis chuyển biến tên cột loại bia vào khung Label Cases by Sau chọn Option, tích vào mục Exclude cases listwise, Display groups defined by missing values, Display chart with cases labels Continue OK ta biểu đồ Biểu đồ 3.3 Biểu diễn cá thể mặt phẳng Từ bảng ta nhận thấy loại bia HAM, TIG chiếm lĩnh thị trường chất lượng bia dịch vụ quảng cáo Chiến lược để loại bia thâm nhập vào thị trường : Các hãng bia BTH, HEI, 333, GUI việc nâng cao chất lượng bia phải quan tâm nhiều đến hoạt động quảng cáo Bia SMI cần nâng cao chất lượng Yếu tố giá PRI có quan hệ chặt chẽ với chất lượng bia giá thành sản phẩm phụ thuộc nhiều vào chất lượng nó, liên quan đến hoạt động maketing 40 Bài toán Dưới điểm số mơn học (tính theo thang điểm 4) kỳ học 45 sinh viên chuyên ngành toán (Bảng 3.11) Bảng 3.11 Bảng điểm số học phần sinh viên kỳ học ĐSC HSC KNPTCT NN3 PPDH THSP XSTKNC SV1 4 3,5 4 SV2 4 3,5 4 SV3 3,5 3,5 4 SV4 3,5 4 4 SV5 4 4 4 SV6 3,5 4 4 SV7 4 3,5 4 SV8 4 3,5 4 SV9 3,5 3,5 3,5 4 SV10 3,5 4 4 SV11 4 3,5 3,5 SV12 4 4 SV13 4 3,5 3,5 4 SV14 4 3,5 4 SV15 4 3,5 SV16 4 3,5 4 SV17 4 3,5 3,5 SV18 3,5 3,5 3,5 3,5 SV19 4 3,5 3,5 SV20 2,5 4 SV21 3,5 3 SV22 4 3 3,5 SV23 4 3,5 41 SV24 1,5 4 4 SV25 4 3,5 2,5 4 SV26 4 3,5 3,5 SV27 3,5 3,5 4 SV28 4 3,5 4 SV29 3,5 4 3,5 SV30 4 3,5 SV31 2,5 3,5 2,5 3,5 SV32 2,5 2,5 SV33 2,5 2,5 3,5 SV34 2,5 2,5 3,5 SV35 3,5 3,5 SV36 4 2,5 3,5 2,5 SV37 2,5 2,5 3,5 SV38 3,5 3,5 3,5 3,5 SV39 2,5 3,5 3,5 2,5 3,5 SV40 1,5 1,5 3,5 SV41 1,5 4 SV42 2,5 1,5 3,5 SV43 3,5 0,5 3,5 3,5 2,5 SV44 1,5 3,5 3,5 1,5 SV45 0,5 3,5 2,5 Các học phần : ĐSC - Đại sơ cấp, HSC – Hình sơ cấp, KNPTCT – Kỹ phát triển chương trình, NN3 – Ngoại ngữ 3, PPDH – Phương pháp dạy học, THSP – Thực hành sư phạm, XSTKNC – Xác suất thống kê nâng cao Từ bảng số liệu đánh giá kết học tập sinh viên tổ hợp mơn, tìm cá thể ưu tú cá thể cá biệt 42 Áp dụng mơ hình phân tích thành phần chính, thực phân tích thành phần SPSS ta thu kết Bảng 3.13 Bảng 3.14 Biểu đồ 3.4 Biểu đồ giá trị riêng 43 Bảng 3.15 Từ bảng 3.15 ta có thành phần tương ứng với giá trị riêng lớn 3,212 1,148 Có 45,888% quán tính đám mây số liệu phản ánh thành phần thứ 16,399% phản ánh thành phần thứ hai Với hai thành phần ta thu đám mây ảnh giải thích 62,287% đặc tính số liệu ban đầu Ma trận r (X,c) : Bảng 3.16 Ma trận r (X,c) sau phép quay hệ trục tọa độ: Bảng 3.17 44 Định danh thành phần chính: Thành phần thứ bao gồm môn KNPTCT, THSP, PPDH đại diện cho tổ phương pháp Thành phần thứ hai gồm môn NN3 thể khả ngoại ngữ sinh viên Biểu diễn biến mặt phẳng chiếu Biểu đồ 3.5 Từ biểu đồ ta nhận thấy điểm mơn ngoại ngữ ngược chiều với mơn học khác Xét trục thứ điểm môn KNPTCT, THSP, PPDH biến đổi chiều có quan hệ chặt chẽ với Biểu đồ 3.6 Biểu đồ cá thể mặt phẳng 45 Qua biểu đồ 3.6 ta nhận thấy sinh viên sau có điểm số ngược chiều so với đại đa số sinh viên lớp SV45, SV44, SV42, SV41… Các cá thể trội đồng môn SV 14, SV15, SV5… Các cá thể học lệch: SV42 giỏi môn ngoại ngữ kém, cá thể SV45, SV44, SV43 học tốt ngoại ngữ mơn tốn hay phương pháp yếu Nói chung, sức học cá thể lớp đồng 46 KẾT LUẬN Sau q trình nghiên cứu hồn thành khóa luận: “Phương pháp phân tích thành phần ứng dụng với spss”, thu kết sau đây: Một là, khóa luận nêu bật ý tưởng, vai trò ứng dụng phương pháp phân tích thành phần phân tích liệu thống kê nhiều chiều Hai là, tìm hiểu tổng quan phần mềm thống kê SPSS thao tác phần mềm để phân tích thành phần với liệu cụ thể, từ phân tích kết phát mối tương quan biến, cá thể Những kết đạt khóa luận cho thấy phấn đấu, nỗ lực thân giúp đỡ nhiệt tình thầy giáo Tơi hi vọng khóa luận góp phần nhỏ bé giúp người hiểu phương pháp phân tích liệu thống kê cách thức thực phần mềm SPSS Một lần xin chân thành cảm ơn tất quý thầy cô giáo tồn thể bạn, thư viện giúp đỡ tơi suốt q trình nghiên cứu hồn thiện khóa luận Rất mong nhận quan tâm, đóng góp ý kiến thầy bạn để khóa luận hồn thiện, xác 47 TÀI LIỆU THAM KHẢO [1] Nguyễn Văn Hữu, Nguyễn Hữu Dư (2003), Phân tích thống kê dự báo (chương 5), Nxb ĐHQG HN [2] Ngô Văn Thứ, Nguyễn Mạnh Thế (2015), Thống kê thực hành (chương 7), Nxb ĐHKTQD [3] http://www4.hcmut.edu.vn/~nguyenthong/download/PPDLuong/Chuong8PTDL_Phan%20tich%20thanh%20phan%20chinh.pdf [4] http://rces.info/sinh-vien-kinh-te-nckh/gioi-thieu-phan-mem-spss/ [5] https://toc.123doc.org/document/375415-dung-spss-trong-phan-tich-thanhphan-chinh.htm 48 ... đến phân tích thành phần Chương 2: “ Lý thuyết phân tích thành phần chính thể ý tưởng phương pháp phân tích thành phần phân tích kết phân tích thành phần Chương 3: SPSS ứng dụng phân tích thành. .. cứu ý tưởng phương pháp phân tích thành phần ứng dụng mơ hình kết hợp sử dụng phần mềm thống kê SPSS để phân tích số liệu cụ thể Phƣơng pháp nghiên cứu Một số phương pháp nghiên cứu sử dụng khóa... cá thể thành phần 21 2.5.5 Phân tích biến R 22 2.6 n Tiêu chuẩn chọn số thành phần cho phân tích .23 Chƣơng SPSS ứng dụng phân tích thành phần 25 3.1 Giới thiệu phần mềm SPSS