1. Trang chủ
  2. » Luận Văn - Báo Cáo

Ứng dụng phân tích phương sai trong phần mềm spss

47 23 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Ứng Dụng Phân Tích Phương Sai Trong Phần Mềm SPSS
Tác giả Lê Hữu Nhất
Người hướng dẫn Tiến Sĩ Nguyễn Trung Hòa
Trường học Trường Đại Học Vinh
Chuyên ngành Lý Thuyết Xác Suất Và Thống Kê Toán
Thể loại Luận Văn Thạc Sĩ
Năm xuất bản 2014
Thành phố Vinh
Định dạng
Số trang 47
Dung lượng 2,2 MB

Nội dung

BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƢỜNG ĐẠI HỌC VINH LÊ HỮU NHẤT ỨNG DỤNG PHÂN TÍCH PHƢƠNG SAI TRONG PHẦN MỀM SPSS LUẬN VĂN THẠC SỸ TOÁN HỌC Vinh, 2014 BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƢỜNG ĐẠI HỌC VINH LÊ HỮU NHẤT ỨNG DỤNG PHÂN TÍCH PHƢƠNG SAI TRONG PHẦN MỀM SPSS Chuyên ngành: Lý thuyết Xác suất thống kê toán Mã số: 60.46.01.06 LUẬN VĂN THẠC SĨ TOÁN HỌC Ngƣời hƣớng dẫn khoa học: Tiến sĩ Nguyễn Trung Hòa Vinh, 2014 MỤC LỤC Mở đầu CHƯƠNG KIẾN THỨC CHUẨN BỊ 1.1 Mẫu ngẫu nhiên mẫu quan sát 1.1.1 Định nghĩa 1: 1.1.2 Định nghĩa 2: 1.2 Véctơ ngẫu nhiên 1.2.1 Định nghĩa 1.2.2 Ví dụ: 1.3 Trung bình mẫu phương sai mẫu 1.3.1 Trung bình mẫu 1.3.2 Phươg sai mẫu 1.4 Phân tích phương sai 1.4.1 Khái niệm 1.4.2 Nguyên lý phân tích phương sai 1.4.3 So sánh giá trị trung bình 10 CHƯƠNG PHÂN TÍCH PHƯƠNG SAI MỘT CHIỀU TRONG SPSS 12 2.1 Giới thiệu phần mềm SPSS 12 2.1.1 Cài đặt phần mềm SPSS 12 2.1.2 Các dạng hình Phần mềm SPSS 22 2.1.3 Chức SPSS 23 2.1.4 Nội dung chủ yếu SPSS 24 2.1.5 Một số lĩnh vực ứng dụng SPSS 24 2.2 Cấu trúc, tổ chức liệu SPSS 25 2.2.1 Dữ liệu đầu vào xử lý thô 25 2.2.2 Kiểm tra hiệu đính liệu 25 2.2.3 Mã hoá liệu 28 2.2.4 Làm liệu 29 2.3 Phân tích ANOVA 32 2.3.1 Phân tích phương sai chiều (One way ANOVA) 32 2.3.2 Kỹ thuật hậu kiểm (Post hoc procedures) 39 2.3.3 Ứng dụng phân tích phương sai (Anova) điều tra giáo dục 39 KẾT LUẬN 45 TÀI LIỆU THAM KHẢO 46 Mở đầu Khoa học thống kê lĩnh vực khoa học toán học liên quan tới việc thu thập, phân tích diễn giải hay giải thích trình bày số liệu Các nhà thống kê giúp cải thiện chất lƣợng số liệu với việc thiết kế thực nghiệm lấy mẫu nghiên cứu Xác suất thống kê cung cấp cơng cụ để dự đốn dự báo việc sử dụng số liệu mơ hình thống kê Xác suất thống kê đƣợc ứng dụng vào nhiều lĩnh vực học thuật khác nhau, bao gồm khoa học tự nhiên xã hội, quản lý phủ kinh doanh Các phƣơng pháp thống kê đƣợc sử dụng để tóm tắt hay mơ tả tập hợp số liệu, gọi thống kê mô tả (descriptive statistics) Điều hữu ích nghiên cứu, nhà nghiên cứu muốn phổ biến kết nghiên cứu thực nghiệm họ Hơn nữa, mẫu số liệu đƣợc mơ hình hóa theo cách mà kiểm sốt đƣợc tính ngẫu nhiên tính khơng chắc quan sát, sau đƣợc sử dụng để đƣa suy luận trình hay tổng thể (population) đƣợc nghiên cứu; đƣợc gọi thống kê suy luận (inferential statistics) Suy luận thiếu đƣợc khoa học khách quan mang lại dự đốn (dựa số liệu) cách lơgic Nhằm xác định tính xác dự đốn này, ƣớc đoán đƣợc kiểm tra, phần phƣơng pháp khoa học Các nhà nghiên cứu giáo dục học khoa học xã hội cần biết sử dụng xác suất thống kê, nhƣng họ không cần biết q sâu tốn học Vì chƣơng trình phần mềm xác suất thống kê ngày phổ biến mạnh mẽ (nhƣ SPSS, SAS STATA), cơng thức tính đƣợc lập trình sẵn, u cầu khả tốn học khơng phải chủ chốt Nhƣng phần mềm giúp đƣợc việc lên kế hoạch nghiên cứu, lựa chọn kỹ thuật phù hợp diễn giải kết Vì vậy, nhà nghiên cứu, hiểu ý nghĩa thuật tốn mơ hình thống kê khác khung cảnh khác điều quan trọng Trong số nhiều phần mềm đƣợc sử dụng cho mục đích thống kê, phần mềm SPSS cho thấy ƣu điểm SPSS chƣơng trình mà nhiều ngƣời sử dụng u thích dễ sử dụng SPSS có giao diện ngƣời máy cho phép sử dụng menu thả xuống để chọn lệnh thực Khi thực phân tích đơn giản chọn thủ tục cần thiết chọn biến phân tích bấm OK có kết hình để xem xét SPSS có ngơn ngữ cú pháp học cách dán cú pháp lệnh vào cửa sổ cú pháp từ lệnh vừa chọn thực hiện, nhƣng nói chung phức tạp không trực giác Với nhiều toán thuộc phạm trù thống kê đƣợc thiết lập thuật toán phần mềm này, SPSS giúp ta nhanh chóng có đƣợc kết phân tích thống kê cách xác, hiệu Để hiểu phần mềm ứng dụng phân tích phƣơng sai, khn khổ luận văn thạc sĩ định chọn đề tài “ỨNG DỤNG PHÂN TÍCH PHƢƠNG SAI TRONG PHẦN MỀM SPSS” Mục tiêu nghiên cứu đề tài là:  Trình bày kiến thức lý thuyết xác suất liên quan đến tốn phân tích phƣơng sai  Trình bày thuật tốn phân tích phƣơng sai yếu tố  Trình bày hiểu biết phần mềm SPSS  Trình bày chi tiết bƣớc tiến hành giải tốn phân tích phƣơng sai yếu tố phần mềm SPSS  Trình bày tốn thực tế đọc kết kết xuất từ phần mềm Về phƣơng pháp nghiên cứu, đề tài đƣợc sử dụng phƣơng pháp sau:  Phân tích tổng hợp tài liệu  Tìm hiểu phần mềm  Suy luận tốn học  Mơ hình hóa thuật tốn Nội dung luận văn gồm chƣơng: Chương I: Kiến thức chuẩn bị Trong chƣơng tơi trình bày kiến thức Xác suất thống kê cần thiết cho việc thể nội dung chƣơng Chương II: Phân tích phương sai chiều SPSS Đây phần thể nội dung luận văn Trong chƣơng tơi trình bày hiểu biết phần mềm SPSS ứng dụng phân tích phƣơng sai yếu tố (One way Anova) phần mềm để thực việc kiểm nghiệm kết học tập học sinh trƣờng phổ thông Cuối kết luận nội dung nghiên cứu đề tài Để hồn thành đƣợc Luận văn này, tơi xin bày tỏ lòng biết ơn sâu sắc tới TS Nguyễn Trung Hồ giao đề tài tận tình hƣớng dẫn, quan tâm, tạo điều kiện giúp đỡ suốt trình nghiên cứu thực Luận văn Đồng thời xin chân thành cảm ơn Ban Giám hiệu, Phòng Sau Đại học, Ban chủ nhiệm khoa Tốn, thầy giáo cán trƣờng ĐH Vinh truyền thụ cho kiến thức, kinh nghiệm q báu giúp tơi hồn thành tốt luận văn Tôi xin chân thành cảm ơn thầy cô giáo em học sinh trƣờng THPT Nam Tiền Hải, huyện Tiền Hải, tỉnh Thái Bình giúp đỡ tạo điều kiện để tơi hồn thành Luận văn Tôi xin gửi lời cảm ơn tới gia đình, bạn bè đồng nghiệp động viên, giúp đỡ tơi suốt q trình học tập thực Luận văn Nghệ An, tháng 10 năm 2014 CHƢƠNG KIẾN THỨC CHUẨN BỊ Mẫu ngẫu nhiên mẫu quan sát 1.1 1.1.1 Định nghĩa 1: Mẫu ngẫu nhiên kích thước n biến ngẫu nhiên X tập hợp n biến ngẫu nhiên X1, X2, , Xn độc lập, có phân phối xác suất với X, ký hiệu W=(X1, X2, , Xn) Biến ngẫu nhiên X đƣợc gọi biến ngẫu nhiên gốc Các biến ngẫu nhiên Xi đƣợc gọi X 1.1.2 Định nghĩa 2: Mẫu quan sát thể cụ thể mẫu ngẫu nhiên W=(X1, X2, , Xn), tập hợp số liệu cụ thể, gọi tắt số liệu thực nghiệm  Phƣơng pháp nghiên cứu khơng tồn phƣơng pháp nghiên cứu thơng qua mẫu ngẫu nhiên mẫu quan sát Véctơ ngẫu nhiên 1.2 1.2.1 Định nghĩa Cho U = (X1, X2, ,Xn) véc tơ thuộc không gian thực Rn Nếu Xi biến ngẫu nhiên U gọi véc tơ ngẫu nhiên n chiều, biến X1, X2, ,Xn thành phần ngẫu nhiên véc tơ ngẫu nhiên U 1.2.2 Ví dụ: Chọn ngẫu nhiên ngƣời từ đám đông Gọi X chiều cao, Y trọng lƣợng ngƣời đƣợc chọn Véc tơ U = (X, Y) véc tơ ngẫu nhiên hai chiều  Nếu thành phần Xi véc tơ ngẫu nhiên U(X1, , Xn) biến ngẫu nhiên rời rạc U(X1, , Xn) gọi véc tơ ngẫu nhiên rời rạc Nếu thành phần biến ngẫu nhiên liên tục U(X1, , Xn) gọi véc tơ ngẫu nhiên liên tục 1.3 Trung bình mẫu phƣơng sai mẫu 1.3.1 Trung bình mẫu 1.3.1.1 Trung bình mẫu (ngẫu nhên) Định nghĩa Giả sử (X1, X2, , Xn ) mẫu ngẫu nhiên kích thước n, trung bình mẫu ký hiệu X xác định bởi: n X X= i i 1 n Trung bình mẫu biến ngẫu nhiên, mang tính lý thuyết Vì Xi BNN gốc X nên chúng có kỳ vọng phƣơng sai với X, X có kỳ vọng m phƣơng sai  kỳ vọng phƣơng sai trung bình mẫu là: E ( X )  m, D( X )  2 n Nhận xét: Trung bình mẫu phƣơng pháp đo đƣợc sử dụng phổ biến đế xác định vị trí trung tâm thống kê Điểm yếu trung bình mẫu bị ảnh hƣởng ngƣợc lại gíá trị cực trị 1.3.1.2 Trung bình mẫu quan sát Định nghĩa: Trung bình mẫu quan sát số cụ thể, ký hiệu x, thể trung bình mẫu Cách tính: Với số liệu (mẫu) quan sát w=(x1,x2,…,xn), n x   xi ; Nếu chƣa thu gọn thì: n i 1 Nếu bảng thu gọn k x N n 1 x n … x … n i i … x … n k k trung bình mẫu quan sát đƣợc tính theo cơng thức: x  n k n x i 1 i i 1.3.2 Phƣơg sai mẫu 1.3.2.1 Phƣơng sai mẫu (ngẫu nhiên) Giả sử (X1, X2, , Xn ) mẫu ngẫu nhiên kích thước n với trung bình mẫu X , phương sai mẫu ký hiệu S2 xác định bởi: n S2  (X i 1 i  X )2 n 1 S biến ngẫu nhiên 1.3.2.2 Phƣơng sai mẫu quan sát Với số liệu (mẫu) quan sát thu gọn giá trị quan sát S qs S tính theo cơng thức S2  k ni ( xi  x )  n  i 1 1.4 Phân tích phƣơng sai 1.4.1 Khái niệm Phân tích phƣơng sai nhƣ tên gọi, số phƣơng pháp phân tích thống kê mà trọng điểm phƣơng sai (thay trung bình) Thay xem xét trực tiếp giá trị trung bình, ta phân tích phƣơng sai từ kết luận giá trị trung bình mẫu quan sát Phân tích phƣơng sai cung cấp cơng cụ thức để biện minh cho phán đoán trực giác Phân tích phƣơng sai đƣợc sử dụng nhƣ cơng cụ để thăm dị giải thích Cơ sở lý thuyết phƣơng pháp thƣờng đƣợc xây dựng dựa lý thuyết vectơ toán Những lý thuyết vƣợt kiến thức toán đƣợc trang bị cho ngƣời đƣợc đào tạo theo chuyên ngành kinh tế Do đó, chất phƣơng pháp khó đƣợc lĩnh hội, việc vận dụng xác 1.4.2 Nguyên lý phân tích phƣơng sai ANOVA xem xét biến thiên tất quan sát với số đại trung bình phân chúng làm 2: biến thiên nội nhóm biến thiên nhóm Nếu số trung bình nhóm khác nhiều biến thiên chúng đại trung bình (biến thiên nhóm) đáng kể so với biến thiên quan sát nhóm với trung bình nhóm (biến thiên nội nhóm) Nếu số trung bình nhóm khơng khác nhiều biến thiên nhóm khơng lớn so với biến thiên nội nhóm Phép kiểm định giả thuyết phƣơng sai, F-test, đƣợc sử dụng để kiểm định tỉ số phƣơng sai nhóm phƣơng sai nội nhóm Giả thuyết F-test cho phƣơng sai nhau; H0 (giả thuyết trung bình nhóm nhau) có nghĩa biến thiên nhóm khơng lớn so với biến thiên nội nhóm Trong tình này, khơng thể kết luận trung bình khác lẫn (khơng có cặp trung bình khác nhau) Ngƣợc lại, từ chối đƣợc H kết luận đƣợc khơng phải tất trung bình (có cặp trung bình khác nhau) Thí dụ minh họa: Thời gian nằm viện bệnh nhân đƣợc tiểu phẫu khơng có biến chứng đƣợc so sánh với theo ba bác sĩ điều trị (A, B, C) Chọn mẫu ngẫu nhiên bao gồm bệnh án cho bác sĩ, số liệu nhƣ sau: Bảng Thời gian nằm viện bệnh nhân theo bác sĩ điều trị A 5 6 ∑A = 39 A  4,875 A2 16 25 25 16 36 36 16 25 ∑A = 195 B 4 3 ∑B = 31 B2 16 25 16 16 25 9 ∑B = 125 B  3,875 C 3 3 ∑C = 29 C2 25 9 9 16 25 ∑C = 111 C  3, 625 X  4,125 Dùng bảng phối hợp hay biến Analyze / Tables / Custom Tables… Rows: đƣa biến thứ 1; Columns: đƣa biến thứ Ví dụ: Lập bảng kết hợp biến tuổi nghề nghiệp Analyze / Tables / Custom Tables… Rows: đƣa biến tuổi vào; Columns: đƣa biến nghề nghiệp Chẳng hạn, thấy xuất trƣờng hợp tuổi có 13 mà nghề nghiệp ghi giáo viên 2.3 Phân tích ANOVA 2.3.1 Phân tích phƣơng sai chiều (One way ANOVA) Trong phần phƣơng pháp kiểm định mở rộng cho trƣờng hợp so sánh trung bình nhiều tổng thể đƣợc xây dựng việc xem xét biến thiên (phƣơng sai) giá trị quan sát nội nhóm (mẫu) nhóm (mẫu) với Ở ta đề cập đến phân tích phƣơng sai yếu tố trƣờng hợp có yếu tố (biến kiểm soát) đƣợc xem xét nhằm xác định ảnh hƣởng đến yếu tố khác Yếu tố đƣợc xem xét ảnh hƣởng đƣợc dùng để phân loại quan sát thành nhóm nhỏ khác Một cách tổng quát, giả sử ta có k nhóm (mẫu) n 1, n2, …, nk quan sát đƣợc chọn ngẫu nhiên độc lập từ k tổng thể (n1, n2, …, nk khác kích thƣớc) Gọi 1, 2, …, k lần lƣợt trung bình k tổng thể, Xij quan sát thứ j nhóm thứ i Ta mơ tả quan sát k nhóm nhƣ sau: Nhóm … K X11 X21 … XK1 X12 X22 … XK2 32 … … … … X1n1 X2n2 … XKnK Với giả định tổng thể có phân phối chuẩn, có phƣơng sai nhau, sai số độc lập với nhau, phân tích phƣơng sai yếu tố kiểm nghiệm giả thuyết ban đầu nhƣ sau: H0: 1 = 2 = … = k Ta thấy việc so sánh giá trị trung bình, phân tích phƣơng sai nghe nhƣ sai sót Tuy nhiên việc phân tích phƣơng sai dựa thơng số thống kê F, với F tỷ số biến thiên trung bình nhóm với biến thiên quan sát nội nhóm: Biến thiên trung bình nhóm F= Biến thiên giá trị quan sát nội nhóm Nếu giá trị trung bình nhóm khác biệt nhiều, đặc biệt mối quan hệ với biến thiên nội nhóm, giá trị F thu đƣợc lớn giả thuyết H0: 1 = 2 = … = k bị từ chối Và ta quan sát việc phân tích phƣơng sai yếu tố cho hai nhóm kết thống kê F tính đƣợc bình phƣơng kết thống kê t kiểm nghiệm t cho hai mẫu độc lập Các bƣớc phân tích phƣơng sai yếu tố để kiểm nghiệm ngang giá trị trung bình k tổng thể Phân tích phƣơng sai yếu tố để kiểm nghiệm giả thuyết H0: 1 = 2 = … = k đƣợc tiến hành thơng qua bƣớc sau: Bước 1: Tính giá trị trung bình xi cho nhóm x chung cho tất nhóm 33 ni xi  x i 1 ij ni (i  1, 2, , k ), x  k ni i 1 j 1  x n ij , k x  n x i i 1 n i k (n   ni ) i 1 Bước 2: Tính đại lƣợng thể biến thiên nội nhóm (SSW) nhóm (SSG) Gọi SSi đại lƣợng thể biến thiên nội nhóm, ta có: ni SSi   ( xij  xi ) j 1 Ta có tổng cộng biến thiên nội nhóm là: k ni SSW  SS1  SS2   SS k   ( xij  xi ) i 1 j 1 Nói cách đơn giản SSW tổng bình phƣơng chênh lệch quan sát với trung bình nhóm mà quan sát thuộc (within-groups sum of squares) SSW biến thiên không yếu tố kiểm soát (yếu tố dùng để phân chia nhóm) gây Đại lƣợng thể biến thiên nhóm (between-groups sum of squares) đƣợc tính cơng thức: SSG  ni  n (x i 1 i i  x )2 SSG thể biến thiên khác nhóm, tức biến thiên yếu tố kiểm sốt gây Gọi STT tổng bình phƣơng chênh lệch quan sát với trung bình tất quan sát ta có: k ni SST   ( xij  x ) i 1 j 1 34 Đã chứng minh đƣợc SST = SSW + SSG cơng thức sở phƣơng pháp phân tích phƣơng sai yếu tố với biến thiên quan sát so với giá trị trung bình tổng cộng biến thiên đƣợc giải thích yếu tố kiểm sốt (SSG) biến thiên yếu tố khác yếu tố kiểm sốt SSW Bước 3: Tính ƣớc lƣợng cho phƣơng sai chung k tổng thể, MSW MSG, cách chia SSW SSG cho số bậc tự tƣơng ứng, ta có: SSW MSW = (Within-groups mean square), n-k SSG MSG = (Between-groups mean square) k-1 Tỷ số đƣợc dùng để kiểm nghiệm giả thuyết H0 Nếu H0 đúng, nghĩa trung bình k tổng thể tỷ số MSG/MSW gần với giá trị Ngƣợc lại, trung bình k tổng thể khơng nhau, MSG lớn MSW, tỷ số MSG/MSW lớn Mức độ lớn đƣợc xem “đủ lớn” (tuỳ thuộc vào độ tin cậy) để ta bác bỏ H0 Ở bƣớc 4, với việc tính gia trị kiểm định F lý giải điều Bước 4: Tính giá trị kiểm định F: MSG F = MSW Ta bác bỏ H0 mức ý nghĩa α (thƣờng 0.05), giá trị p-value nhỏ mức ý nghĩa, tƣơng ứng với tỷ số F=MSG/MSW lớn Fk-1, n-k, , với Fk-1, n-k,  có phân phối F với k-1 n-k bậc tự tƣơng ứng tử mẫu số Kết phân tích phƣơng sai yếu tố thƣờng đƣợc thể dƣới dạng bảng sau: Biến thiên (Variance) Tổng Bậc chệnh lệch tự bình phƣơng (df) (Sum of Trung bình chênh lệch bình phƣơngPhƣơng sai (Mean square) Giá trị Pkiểm value định Sig 35 squares) Giữa nhóm (Between Groups) Trong nội nhóm SSG k-1 SSW n-k SST n-1 MSG=SSG/k-1 F=MSG/ MSW MSW=SSW/n-k (Within Groups) Tổng cộng (Total) So sánh cặp trung bình tổng thể Một định đƣợc khác biệt tồn giá trị trung bình (bác bỏ H0), hiển nhiên nảy sinh câu hỏi trung bình tổng thể khác nhau, tổng thể có trung bình lớn nhỏ Để trả lời câu hỏi SPSS cung cấp kiểm nghiệm post hoc range pairwise multiple comparisons định đƣợc giá trị trung bình khác biệt Range tests xác định nhóm giá trị trung bình đồng khơng tồn khác biệt giá trị trung bình Kiểm nghiệm Pairwise multiple comparisons kiểm nghiệm khác biệt cặp giá trị trung bình đƣa ma trận đánh dấu hoa thị nhóm giá trị trung bình có khác biệt đáng kể mức độ tin cậy 5% Đối với giả thuyết cân phƣơng sai đƣợc chấp nhận (thơng qua kiểm nghiệm Levene) ta có phƣơng pháp kiểm nghiệm thống kê sau để so sánh trung bình mẫu: - The least significant difference (LSD): phép kiểm nghiệm tƣơng đƣơng với việc sử dụng phƣơng pháp kiểm nghiệm t riêng biệt cho toàn cặp biến Yếu điểm phƣơng pháp khơng chỉnh lý độ tin cậy cho tƣơng thích với việc kiểm nghiệm nhiều so sánh lúc Do dẫn đến độ tin cậy khơng cao Các kiểm nghiệm khác đƣợc tham khảo sau loại bỏ đƣợc yếu điểm cách điều chỉnh độ tin cậy cho so sánh nhiều thành phần 36 - Phƣơng pháp kiểm nghiệm Bonferroni Tukey’s honestly significant difference đƣợc sử dụng cho hầu hết kiểm nghiệm so sánh đa bội Kiểm nghiệm Sidak’s t test đƣợc sử dụng tƣơng tự nhƣ phƣơng pháp Bonferroni nhiên cung cấp giới hạn chặt chẽ Khi tiến hành kiểm nghiệm số lƣợng lớn cặp trung bình Tukey’s honestly significant difference test có tác động mạnh Bonferroni test Và ngƣợc lại Bonferroni thích hợp cho kiểm nghiệm có số lƣợng cặp so sánh - Hochberg’s GT2 giống nhƣ Tukey’s honestly significant difference test nhƣng thông thƣờng Tukey’s test có tác dụng tốt Gabriel’s pairwise comparisons test giống nhƣ Hochberg’s GT2 nhƣng thƣờng đƣợc sử dụng kích cỡ mẫu kiểm nghiệm có sai biệt lớn - Phƣơng pháp kiểm nghiệm Dunnett’s pairwise đƣợc dùng để so sánh giá trị trung bình mẫu với giá trị trung bình cụ thể đƣợc lấy từ tập mẫu so sánh Thơng thƣờng mặc định nhóm mẫu cuối làm nhóm kiểm sốt, ta lựa chọn nhóm làm nhóm kiểm sốt, lúc giá trị trung bình nhóm biến độc lập đƣợc so sánh với giá trị trung bình nhóm nhóm sau biến độc lập - Ryan, Einot, Gabriel and Welsch (R-E-G-W) đƣa hai bƣớc kiểm nghiệm Đầu tiên tiến hành kiểm nghiệm tồn giá trị trung bình ngang hay khơng Sau bƣớc thứ hai kiểm nghiệm khác biệt nhóm nhỏ với để tìm nhóm thật khác biệt không khác biệt giá trị trung bình Tuy nhiên việc kiểm nghiệm khơng nên thực trƣờng hợp kích cỡ mẫu nhóm khơng ngang - Thơng thƣờng kích thƣớc mẫu khơng ngang nhóm Bonferroni Scheffé hai phƣơng pháp kiểm nghiệm đƣợc lựa chọn phƣơng pháp Tukey - Duncan’s multiple range test, Student-Newman-Keuls (S-N-K) Tukey’s-b tƣơng tự nhiên đƣợc sử dụng nhƣ phƣơng pháp 37 - Kiểm nghiệm Waller-Duncan t đƣợc sử dụng kích thƣớc mẫu khơng - Phƣơng pháp kiểm nghiệm Scheffé cho phép kết hợp tuyến tính giá trị trung bình đƣợc kiểm nghiệm, khơng so sánh cặp Chính kết kiểm nghiệm Scheffé thƣờng thận trọng phƣơng pháp kiểm nghiệm khác, đòi hỏi khác biệt lớn giá trị trung bình quan sát đƣợc để bảo đảm tính thật khác biệt phép kiểm nghiệm Đối với trƣờng hợp giả thuyết cân phƣơng sai mẫu không đƣợc chấp nhận ta sử dụng phƣơng pháp kiểm nghiệm sau để tiến hành so sánh giá trị trung bình nhóm: Tamhane’s T2, Dunnett’s T3, Games-Howell, Dunnett’s C Ví dụ nhƣ, nông nghiệp ngƣời ta muốn biết ngũ cốc phát triển nhƣ sử dụng loại phân bón khác Nhà nghiên cứu muốn biết liệu tất loại phân bón có ảnh hƣởng ngang đến phát triển ngũ cốc hay vài loại phân bón có tác dụng tốt vài loại khác Để kiểm nghiệm điều ngƣời ta dùng ANOVA đề kiểm nghiệm tốc độ phát triển trung bình (có thể trọng lƣợng ngũ cốc thu hoạch, chiều cao cây, số lƣợng trái trung bình thu hoạch đƣợc, …) giá trị trung bình đƣợc sử dụng thống kê ANOVA thơng thƣờng kiểm nghiệm số lƣợng mẫu lớn hai, số lƣợng mẫu ta dùng phƣơng pháp tƣơng đối đơn giản kiểm nghiệm t hai mẫu nhƣ đề cập phần ANOVA đƣợc sử dụng rộng rãi thực tế ta gặp nhiều trƣờng hợp đòi hỏi ta phải kiểm nghiệm nhiều mẫu lúc Chú ý, ta kiểm nghiệm theo cặp lần lƣợt phƣơng pháp kiểm nghiệm t hai mẫu lần kiểm nghiệm độ sai lệch 5% (tuỳ thuộc vào mức tin cậy mà ta mong muốn) Do kiểm nghiệm tất cặp mẫu lần lƣợt tỷ lệ sai sót tăng lên theo lần Còn 38 ANOVA cho phép ta kiểm nghiệm tất mẫu mức độ sai sót 5% kiểm nghiệm lần Để thực kiểm nghiệm ANOVA, liệu đòi hỏi phải thỏa mãn số giả thuyết sau: - Các mẫu kiểm nghiệm phải độc lập mang tính ngẫu nhiên; - Các mẫu sử dụng kiểm nghiệm phải có phân phối chuẩn kích thƣớc mẫu đủ lớn để đƣợc xem gần nhƣ phân phối chuẩn (Có nhiều cách để đánh giá phân phối chuẩn SPSS: Đơn giản xem biểu đồ với đường cong chuẩn (Histograms with normal curve) với dạng hình chuông đối xứng với tần số cao nằm tần số thấp dần nằm hai bên; giá trị trung bình (mean) giá trị trung vị (mediane) gần độ xiên (Skewness) gần zero (khơng)); - Phƣơng sai mẫu phải ngang (có thể kiểm nghiệm điều phép kiểm nghiệm phương sai Levene) Nếu nhƣ mẫu nghiên cứu ta không thỏa mãn điều kiện ta dùng phép kiểm nghiệm phi tham số (nonparametric) nhƣ phép kiểm nghiệm Kruskal-Wallis 2.3.2 Kỹ thuật hậu kiểm (Post hoc procedures) Kết ANOVA không cho biết cặp μ khác Việc tiến hành kỹ thuật hậu kiểm giúp kết luận việc SPSS cho ta cơng cụ để thực phép hậu kiểm thƣờng gặp là: Tukey’s HSD test (Honestly Significant Difference) sử dụng cho trƣờng hợp mẫu nhau, Scheffes test sử dụng cho trƣờng hợp mẫu không 2.3.3 Ứng dụng phân tích phƣơng sai (Anova) điều tra giáo dục Kiểm nghiệm kết học tập 200 học sinh trƣờng THPT Nam Tiền Hải, huyện Tiền Hải, tỉnh Thái Bình có phụ huynh làm việc ngành nghề khác rút kết luận thống kê có ích Trong phần tập 39 lấy kết học tập môn học cụ thể để kiểm nghiệm, môn học khác ta tiến hành tƣơng tự Các bƣớc tiến hành: Mở file SPSS: Vào phần khai báo biến Variable View khai báo biến nhƣ sau: Các biến đƣợc mã hố cụ thể là: Biến Giới tính đƣợc mã hoá việc gán: số Nam, số Nữ Biến Quê quán đƣợc mã hoá việc gán: số “Nam Trung, Tiền Hải, Thái Bình”; số “Nam Chính, Tiền Hải, Thái Bình”; số “Nam Hồng, Tiền Hải, Thái Bình”; “số Nam Hà, Tiền Hải, Thái Bình”; số “Nam Hải, Tiền Hải, Thái Bình”; số “Bắc Hải, Tiền Hải, Thái Bình”; số “Nam Thanh, Tiền Hải, Thái Bình”; số “Nam Hƣng, Tiền Hải, Thái Bình”; số “Nam Phú, Tiền Hải, Thái Bình”; số 10 “Nam Thắng, Tiền Hải, Thái Bình”; số 11 “Nam Cƣờng, Tiền Hải”, Thái Bình; số 12 “Nam Thịnh, Tiền Hải, Thái Bình”; số 13 “Tây Tiến, Tiền Hải, Thái Bình” Biến Nghề nghiệp Bố(Mẹ) đƣợc mã hoá việc gán: số “Công chức, viên chức nhà nƣớc”; số “Công nhân khu công nghiệp Tiền Hải”; số “Thợ thủ công”; số “Kinh doanh buôn bán”; số “Nuôi trồng thuỷ sản”; số “Đi làm ăn xa”; số “Làm ruộng” 40 Các biến Điểm tổng kết môn học đƣợc mã hoá cách gán: số điểm từ “8.0 đến 10”; số điểm từ “6.5 đến 7.9”; số điểm từ “5.0 đến 6.4”; số điểm từ “3.5 đến 4.9”; số điểm “dƣới 3.5” Chuyển sang thẻ Data View nhập vào số liệu thực tế thu thập đƣợc nhƣ sau: Tiếp theo ta sử dụng thao tác phân tích phƣơng sai (ANOVA) để kiểm nghiệm điểm trung bình học tập mơn Văn học sinh có hồn cảnh gia đình (công việc bố mẹ) khác với giả thiết đối thiết là: H0: điểm trung bình mơn Văn học sinh có hồn cảnh gia đình (cơng việc bố mẹ) khác nhau; H1: điểm trung bình mơn Văn học sinh có hồn cảnh gia đình (cơng việc bố mẹ) khác không Chọn Analyze → Compare Means → One-Way ANOVA 41 Xuất hộp thoại: Chọn biến cần phân tích (định lƣợng) Điểm trung bình môn văn (ô Dependent List), biến phân loại Nghề nghiệp bố (mẹ) (ô Factor) 42 Nhấn Post Hoc để chọn loại kiểm định nhằm xác định cụ thể khác biệt nhóm (nhóm khác với nhóm nào) Chúng ta chọn Bonferroni Tukey’s-b (hai thống kê cho kết quả) thƣờng đƣợc sử dụng cho mục đích Nếu phƣơng sai nhóm cần so sánh khơng nhau, chọn Tamhane’s T2 (ứng dụng cho kiểm định t cặp phƣơng sai chúng không nhau) Significance level mức ý nghĩa giả thuyết thống kê, ta chọn mặc định 0.05 (tức 5%) Nhấn Continue, sau nhấn Option để thiết đặt lựa chọn Trong Homogeneity-of-variance để kiểm định phƣơng sai nhóm, 43 Means plot để làm cho xuất thêm hình minh họa Ta hiển thị thêm thống kê mô tả cách chọn Descriptive Nhấn Continue cuối Ok, ta có bảng kết kiểm nghiệm sau: Trong bảng Test of Homogeneity of Variances ta thấy Sig.=0.058 >0.05 nên ta khẳng định phƣơng sai nhóm nhau, thỏa mãn điều kiện phân tích ANOVA Ở bảng thứ hai bảng ANOVA ta thấy, F=1.074 Sig.=0.379>0.05 nên chƣa có sở để ta bác bỏ giả thiết H0 hay chấp nhận đối thiết H1 Kết kết xuất từ phần mềm giúp ta kết luận rằng, nghề nghiệp bố mẹ không ảnh hƣởng trực tiếp đến kết học tập môn văn học sinh Đây kết luận có ích cho q trình dạy học 44 KẾT LUẬN Ứng dụng phân tích phƣơng sai phần mềm SPSS giúp kiểm nghiệm, đánh giá đƣợc phần kết học tập học sinh đƣợc điều tra Kết kết xuất từ phần mềm giúp ta kết luận rằng, nghề nghiệp bố mẹ không ảnh hƣởng trực tiếp đến kết học tập học sinh, cụ thể môn văn nhƣ phần tập Nhƣ vậy, khác biệt học lực chủ yếu ý thức, thái độ, tính chun cần trí thơng minh học sinh Kết luận giúp giáo viên ổn định lại tâm lý cho học sinh Không phải em gia đình có điều kiện kinh tế khó khăn học tập đi, mà khó khăn vất vả cha mẹ lại nguồn động lực để em có chí hƣớng phấn đấu học tập tốt hơn; em gia đình giả có nhiều điều kiện học tập thuận lợi học tập tốt Tóm lại luận văn thực đƣợc nhiệm vụ sau đây:  Trình bày số khái niệm Lý thuyết xác suất;  Trình bày hiểu biết phần mềm SPSS ứng dụng phân tích phƣơng sai yếu tố có phần mềm;  Sử dụng phần mềm SPSS để thực việc điều tra, kiểm nghiệm kết học tập dạy học trƣờng phổ thông qua tập thực nghiệm Từ kết thu đƣợc cho phép xác nhận mục đích nghiên cứu hồn thành Tuy nhiên q trình nghiên cứu cịn hạn chế chun môn thời gian nên không tránh khỏi thiếu sót, mong nhận đƣợc đóng góp thầy bạn đồng nghiệp để Luận văn hồn thiện Trong thời gian tới có điều kiện tiếp tục nghiên cứu, nghiên cứu thêm ứng dụng thực tế bổ ích khác có phần mềm SPSS Ứng dụng phân tích phƣơng sai nhiều yếu tố ƣu tiên nghiên cứu 45 TÀI LIỆU THAM KHẢO [1] Nguyễn Cao Văn, Trần Thái Ninh, Lý thuyết xác suất thống kê toán, NXB Đại học Kinh tế quốc dân, 2008 [2] Nguyễn Văn Quảng, Xác suất nâng cao, NXB Đại học Quốc gia Hà Nội, 2008 [3] Nguyễn Duy Tiến, Các mơ hình xác suất ứng dụng, NXB Quốc gia Hà Nội, 2001 [4] Trần Ngoc Vũ, Hướng dẫn sử dung SPSS [5] http://timtailieu.vn/tai-lieu/cong-thuc-xac-suat-thong-ke-9308/ [6] http://www.ykhoa.net/r/R/Chuong%2011.%20%20Phan%20tich%20phuon g%20sai.pdf [7] https://www.youtube.com/watch?v=JcjwEdh1-Ms 46 ... Chương II: Phân tích phương sai chiều SPSS Đây phần thể nội dung luận văn Trong chƣơng tơi trình bày hiểu biết phần mềm SPSS ứng dụng phân tích phƣơng sai yếu tố (One way Anova) phần mềm để thực... CHƯƠNG PHÂN TÍCH PHƯƠNG SAI MỘT CHIỀU TRONG SPSS 12 2.1 Giới thiệu phần mềm SPSS 12 2.1.1 Cài đặt phần mềm SPSS 12 2.1.2 Các dạng hình Phần mềm SPSS 22 2.1.3 Chức SPSS ... toán phần mềm này, SPSS giúp ta nhanh chóng có đƣợc kết phân tích thống kê cách xác, hiệu Để hiểu phần mềm ứng dụng phân tích phƣơng sai, khuôn khổ luận văn thạc sĩ định chọn đề tài ? ?ỨNG DỤNG PHÂN

Ngày đăng: 09/09/2021, 20:44

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w