CÁC KHÁI NIỆM ĐẶC TRƯNG CƠ BẢN tiếp4 06/08/2024 Trung vị của một tập hợp đo lường là trị số rơi vào chính giữa khi các số đo lường ấy được xếp đặt theo thứ tự độ lớn của chúng Công thức
Trang 1BÀI GIẢNG SPSS SUY LUẬN CƠ BẢN TRONG THỐNG KÊ
(Basic Inferential Statistics)
THS LÊ VĂN HÙNG
ĐT: 0906238311 – Email: hungolympia2001@gmail.com
Trang 31 CÁC KHÁI NIỆM ĐẶC TRƯNG CƠ BẢN
Biến độc lập là một đặc tính được lựa chọn để nghiên cứu Biến độc lập được giả thuyết là một biến không phụ thuộc vào biến khác, sự biến đổi của nó có ảnh hưởng chi phối hoặc gây
ra những biến đổi kéo theo ở một biến khác.
Biến phụ thuộc là một biến mà sự biến đổi của nó chịu sự chi phối (đáp ứng) của 1 biến khác Một biến được gọi là biến phụ thuộc khi giá trị của nó tuỳ thuộc vào giá trị của biến độc lập
Nó chính là hiệu quả giả định của biến độc lập
Trang 41 CÁC KHÁI NIỆM ĐẶC TRƯNG CƠ BẢN (tiếp)
4 06/08/2024
Trung vị của một tập hợp đo lường là trị số rơi vào chính giữa khi các
số đo lường ấy được xếp đặt theo thứ tự độ lớn của chúng
Công thức tính trung vị = số hạng thứ1/2* (N+1)
Nếu có số chẵn quan sát thì lấy giá trị trung bình của thứ hạng đứng trường và sau.
Trang 51 CÁC KHÁI NIỆM ĐẶC TRƯNG CƠ BẢN (tiếp)
Trung bình mẫu (ký hiệu là , hoặc EX hoặc), được xác định theo công thức:
Nếu cho dạng ghép lớp thì dùng trung
điểm của đoạn làm giá trị đại diện
Nếu cho dạng ghép lớp thì dùng trung
điểm của đoạn làm giá trị đại diện
Trang 61 CÁC KHÁI NIỆM ĐẶC TRƯNG CƠ BẢN (tiếp)
6 06/08/2024
Hiệp phương sai là độ đo sự biến thiên cùng nhau của hai
biến ngẫu nhiên (phân biệt với phương sai - đo mức độ biến thiên của một biến)
Nếu 2 biến có xu hướng thay đổi cùng nhau (nghĩa là, khi một biến có giá trị cao hơn giá trị kỳ vòng thì biến kia có xu hướng cũng cao hơn giá trị kỳ vọng), thì hiệp phương sai giữa hai biến này có giá trị dương Mặt khác, nếu một biến nằm trên giá trị kì vọng còn biến kia có xu hướng nằm dưới giá trị kì vọng, thì hiệp phương sai của hai biến này có giá trị âm
Trang 71 CÁC KHÁI NIỆM ĐẶC TRƯNG CƠ BẢN (tiếp)
Phương sai dùng để đo lường mức độ phân tán của dữ liệu Nếu phương sai lớn thì dữ liệu phân tán, không đồng đều Ngược lại nếu phương sai mà nhỏ thì dữ liệu tập trung, ít phân tán.
8 Độ lệch chuẩn (Standard deviation)
Độ lệch chuẩn là căn bậc 2 của phương sai Có ý nghĩa tương
tự như phương sai.
Trang 82 KIỂM NGHIỆM CHI-SQUARE
8 06/08/2024
Analyze/Descriptive statistics/ Crosstabs sau đó chọn statistics
Trang 92 KIỂM NGHIỆM CHI-SQUARE
Là một công cụ thông kê sử dụng để kiểm nghiệm giả thuyết cho rằng các biến trong hàng và cột thì độc lập với nhau (H0)
Phương pháp kiểm nghiệm này chỉ cho ta biết được liệu một biến này có quan hệ hay không với một biến khác
Phương pháp kiểm nghiệp này không chỉ ra cường độ của mối quan hệ giữa hai biến mạnh hay yếu (nếu có quan hệ), cũng như không chỉ ra hướng thuận hay nghịch của mối quan hệ này (nếu có quan hệ)
Trang 102 KIỂM NGHIỆM CHI-SQUARE
10 06/08/2024
Giả thuyết H0 (Null hypothesis): “ Không có mối liên hệ nào giữa hai biến” ( Hay ta hiểu hai biến độc lập với nhau)
Đối thiết H1: Hai biến có quan hệ với nhau
Tính toán:
Tìm giá trị giới hạn với df = (r-1).(c-1) là bậc tự do (degree of
freedom)
Kết luận:
Nếu X2> giá trị giới hạn thì bác bỏ H0, ngược lại thì chấp nhận H0.
( Hoặc sử dụng Sig (mức ý nghĩa quan sát_Observed significane level)
để tránh dùng bảng tra : nếu sig>
E
E
O X
1 1
2
Trang 112 KIỂM NGHIỆM CHI-SQUARE
ể việc kiểm nghiệm này là đáng tin cậy thì các số liệu trong bảng chéo giữa hai biến đang khảo sát phải thỏa mãn một số điều kiện nhất định sau:
mong đợi nhỏ hơn 1.
Không vượt quá 20% lượng ô giao nhau giữa hai biến đang khảo sát trong bảng chéo có giá trị nhỏ hơn 5 (đối với bảng 2x2-bảng mà mỗi biến trong bảng chéo chỉ có hai giá trị, phần trăm giới hạn này là 0%)
Trang 122 KIỂM NGHIỆM CHI-SQUARE – VÍ DỤ
12 06/08/2024
T menu ch n ừ menu chọn ọn Analyze/Descritipve Statistics/ Crosstabs
Trang 132 KIỂM NGHIỆM CHI-SQUARE – VÍ DỤ
Nhấn vào Statistics, nhấn Chi-square rồi nhấn continue
Các đại lượng kiểm định dùng cho trường hợp
2 biến dạng thứ bậc
Các đại lượng
kiểm định dành
cho trường hợp
2 biến định danh
Trang 142 KIỂM NGHIỆM CHI-SQUARE – VÍ DỤ
14 06/08/2024
Nhấn vào cell nhằm xác định các đại lượng thống kê
Trang 152 KIỂM NGHIỆM CHI-SQUARE – VÍ DỤ
Trang 162 KIỂM NGHIỆM CHI-SQUARE – VÍ DỤ
16 06/08/2024
Dịng cuối cùng thơng báo Số ơ cĩ tần số <5
Đối với dạng bảng chéo có hai cột và hai dòng (2X2 tables) – mỗi biến trong bảng chỉ có hai giá trị, ta dùng các chỉ số Yate’s corrected chi-square hay còn gọi là
Continuity Correction đánh giá mối tương quan giữa hai biến trong bảng
Likelihood Ratio tương tự như pearson Chi-square
Linear-by-Linear Association: Đo lường mối quan hệ tuyến tính giữa hai biến, chỉ số này chỉ cĩ ý nghĩa khi số liệu trong hàng và cột đã được sắp xếp theo thứ tự tăng dần
Trang 173 CORRELATION (SỰ TƯƠNG QUAN)
Dùng để đo lường mối tương quan giữa hai biến thứ t hoặc khoảng cáchï ự hoặc khoảng cáchï Việc đo lường mối tương quan giữa hai biến thứ tự này chủ yếu dự vào hai hệ số Spearman’s correlation coefficient rho và Pearson correlation coefficient
Spearman’s rho được dùng để đo lường mối quan hệ giữa hai biến thứ tự (các biến này hầu hết đều được xắp xếp từ thấp nhất đến cao nhất)
Khi các biến trong bảng là các biến định lượng ta sử dụng hệ số Pearson correlation coefficient để đo lường mối quan hệ tuyến tính giữa các biến này
Các giá trị của hệ số tương quan biến thiên từ –1 đến 1, dấu cộng hoặc trừ chỉ ra hương tương quan giữa các biến (thuận hay nghịch), giá trị tuyệt đối của chỉ số này cho biết cường độ tương quan giữa hai biến, giá trị này càng lớn mối tương quan càng mạnh.
Trang 183 CORRELATION (SỰ TƯƠNG QUAN)
18 06/08/2024
Dùng để đo lường mối tương quan giữa hai biến thứ tư hoặc khoảng cáchï Việc đo lường mối tương quan giữa hai biến thứ tự này chủ yếu dự vào hai hệ số Spearman’s correlation coefficient rho và Pearson correlation coefficient
Spearman’s rho được dùng để đo lường mối quan hệ giữa hai biến thứ tự (các biến này hầu hết đều được xắp xếp từ thấp nhất đến cao nhất)
Khi các biến trong bảng là các biến định lượng ta sử dụng hệ số Pearson correlation coefficient để đo lường mối quan hệ tuyến tính giữa các biến này
Các giá trị của hệ số tương quan biến thiên từ –1 đến 1, dấu cộng hoặc trừ chỉ ra hương tương quan giữa các biến (thuận hay nghịch), giá trị tuyệt đối của chỉ số này cho biết cường độ tương quan giữa hai biến, giá trị này càng lớn mối tương quan càng mạnh.
Trang 193 CORRELATION (SỰ TƯƠNG QUAN)
Giữa hai biến định danh:
Để đo lường mối quan hệ giữa hai biến biểu danh Sử dụng các hệ số Phi
(coefficient) và Cramer’s V, Contingency coefficient để đo lường nếu dựa vào
kết quả kiểm nghiệm Chi-bình phương Ở đây các hệ số này sẽ bằng 0 nếu và
chỉ nếu hệ số Pearson chi bình phương bằng 0 Do đó người ta sử dụng các
thông số này để kiểm nghiệm giả thuyết cho rằng các hệ số này đều bằng 0 - điều này tương đương với giả thuyết độc lập giữa hai biến, hay hai biến không có môí quan hệ với nhau Ta sẽ từ chối giả thuyết này
Phi: Chỉ dùng cho dạng bảng 2x2 tables, hệ số phi coefficient này biến thiên
từ -1 đến +1 Do đó hệ số này ngoài khả năng chỉ ra mối quan hệ và cường độ của mối quan hệ nó còn chỉ ra hướng của mối quan hệ đo
Cramer's V và Contingency coefficient (hệ số liên h p): ợp): Được sử dụng cho
bảng mà số cột và hàng là bất kỳ, giá trị kiểm nghiệm biến thiên từ 0 đến 1, với giá trị 0 chỉ ra không có mối quan hệ giữa các biến
Trang 203 CORRELATION (SỰ TƯƠNG QUAN)
20 06/08/2024
Lambda (symmetric and asymmetric lambdas and Goodman and Kruskal’s tau), và Uncertainty coefficient Là các đo lường không dựa vào giá trị Chi- square để tính toán, và không quan tâm đến tính đối xứng của phân phối chuẩn
Các giá trị của hệ số này cũng biến thiên từ 0 đế 1 và được dùng để đo lường khả năng dự báo của một biến (biến độc lập) đối với một biến khác (biến phụ thuộc)
Với giá trị 0: chỉ ra khơng cĩ mối liên hệ giữa các biến nhận được có ý nghĩa rằng những kiến thức về biến độc lập không giúp ích gì cho việc dự báo những khả năng xảy ra của biến phụ thuộc,
Giá trị 1 cho biết khi ta biết được những thông tin về biến độc lập thì nó sẽ giúp ta xác định được một cách hoàn hảo các khả năng xảy ra cho biến phụ thuộc
Trang 214 SỬ DỤNG SPSS TRONG TƯƠNG QUAN
Xét 2 biến c19.3 (mức độ quan tâm đến chủ đề gia đình)
và dotuoi (nhóm tuổi)
Vào Analyze/Descritipve Statistics/ Crosstabs
Đưa c19.3 vào Row và dotuoi vào column
Trang 224 SỬ DỤNG SPSS TRONG TƯƠNG QUAN
22 06/08/2024
Trang 234 SỬ DỤNG SPSS TRONG TƯƠNG QUAN
Trang 245 TƯƠNG QUAN VÀ HỒI QUY
24 06/08/2024
5.1 TƯƠNG QUAN TUYẾN TÍNH
R để đo mức độ chặt chẽ của mối quan hệ tuyến tính giữa 2 biến định lượng
cho chúng ta biết mức độ chặt chẽ của mối liên hệ tuyến tính Nếu tiến gần đến 1 thì mối tương quan tuyến tính chặt chẽ.
R=0 thì 2 biến không có mối liên hệ tuyến tính.
Trang 255.1 HỆ SỐ TƯƠNG QUAN
Vào Analyze/Correlate/Bivariate…
Hệ số tương quan hạng
Two– tailed:
Kiểm định 2
phía
Trang 265.1 HỆ SỐ TƯƠNG QUAN
26 06/08/2024
Mean and standard deviations : Cho biết giá trị trung bình và độ lệch chuẩn của từng biến.
Cross – product deviation and covariances : Cho biết tổng các tích mômen chéo và hiệp phương sai của từng cặp
Exclude cases pairwise: Các trường hợp dữ liệu thiếu của biến đang dùng
được loại bỏ
Exclude cases listwise: Các trường hợp dữ liệu của bất kỳ biến nào thiếu sẽ bị loại bỏ
Trang 275.1.1 HỆ SỐ TƯƠNG QUAN
Trang 285.2 HỒI QUY TUYẾN TÍNH
28 06/08/2024
Nghiên cứu mối liên hệ, sự ảnh hưởng, tác động của một số biến độc lập lên biến phụ thuộc cần quan tâm Đưa ra mô hình hồi qui
Ví dụ: Tiền lương (Y) phụ thuộc vào Bằng cấp (X1) Thâm niên (kinh nghiệm)
(X2) Chức vụ (X3)
Các bê ta gọi là hệ số hồi quy
3 3
3 2
1 1
Trang 295.2 HỒI QUY TUYẾN TÍNH
Phân loại hồi quy:
Hồi qui đơn
Hồi qui bội
Hồi qui tuyến tính
Hồi qui phi tuyến
Tuyến tính nghĩa là khi biến độc lập tăng 1 đơn vị, thì giá trị
phụ thuộc tăng thêm 1 giá trị không đổi là Tham Số
Trang 305.2 HỒI QUY TUYẾN TÍNH
30 06/08/2024
Trang 315.2 HỒI QUY TUYẾN TÍNH
5.2.1 HỒI QUY TUYẾN TÍNH ĐƠN
= B0 + B1*Xi
Yi là giá trị đúng của biến Y ở quan sát thứ i
Sử dụng phương pháp OLS (Bình phương cực tiểu nhỏ nhất _
Trong spss ta vào Analyze/Regression/Linear…
Sig.(F) Kiểm tra ý nghĩa mô hình
● Sig.(F) >= 0.05 Mô hình ko có ý nghĩa thống kê (các biến độc lập
không giải thích được …)
● Sig.(F) < 0.05 Mô hình có ý nghĩa
● Sig.(t) < 0.05 Có phụ thuộc biến … đó
Trang 325.2 HỒI QUY TUYẾN TÍNH
32 06/08/2024
Hệ số hồi qui chưa chuẩn hóa Bêta Giải thích ý nghĩa tác động của biến
độc lập lên biến phụ thuộc
Hệ số hồi qui đã chuẩn hóa B So sánh tác động hơn – kém của biến độc
lập lên biến phụ thuộc
R-Square Biến độc lập giải thích được bao nhiêu phần trăm trong tổng
biến thiên của biến phụ thuộc
R-Square hiệu chỉnh Cân nhắc nên đưa thêm 1 biến độc lập nữa vào mô
hình hay không?
Hệ số xác định = R^2 = R Square R = Hệ số tương quan (0.7 Tốt)
Hệ số hiệu chỉnh Adjusted R Square
1
* ) 1
k n R
R
Trang 335.2 HỒI QUY TUYẾN TÍNH
5.2.2 HỒI QUY TUYẾN TÍNH BỘI
i i
i i
i i
i
i
U X
X Y
U X
X Y
2 2
Trang 34C¸c gi¶ thiÕt cña m« h×nh
tham sè.
Trang 355.2 HỒI QUY TUYẾN TÍNH
5.2.2 HỒI QUY TUYẾN TÍNH BỘI
Ma trận hệ số tương quan: Vào correlate/Bivariate