1. Trang chủ
  2. » Công Nghệ Thông Tin

Bài giảng SPSS suy luận cơ bản trong thống kê ths lê văn hùng

35 745 1

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 35
Dung lượng 745,54 KB

Nội dung

CÁC KHÁI NIỆM ĐẶC TRƯNG CƠ BẢN tiếp4 06/08/2024 Trung vị của một tập hợp đo lường là trị số rơi vào chính giữa khi các số đo lường ấy được xếp đặt theo thứ tự độ lớn của chúng Công thức

Trang 1

BÀI GIẢNG SPSS SUY LUẬN CƠ BẢN TRONG THỐNG KÊ

(Basic Inferential Statistics)

THS LÊ VĂN HÙNG

ĐT: 0906238311 – Email: hungolympia2001@gmail.com

Trang 3

1 CÁC KHÁI NIỆM ĐẶC TRƯNG CƠ BẢN

Biến độc lập là một đặc tính được lựa chọn để nghiên cứu Biến độc lập được giả thuyết là một biến không phụ thuộc vào biến khác, sự biến đổi của nó có ảnh hưởng chi phối hoặc gây

ra những biến đổi kéo theo ở một biến khác.

Biến phụ thuộc là một biến mà sự biến đổi của nó chịu sự chi phối (đáp ứng) của 1 biến khác Một biến được gọi là biến phụ thuộc khi giá trị của nó tuỳ thuộc vào giá trị của biến độc lập

Nó chính là hiệu quả giả định của biến độc lập

Trang 4

1 CÁC KHÁI NIỆM ĐẶC TRƯNG CƠ BẢN (tiếp)

4 06/08/2024

Trung vị của một tập hợp đo lường là trị số rơi vào chính giữa khi các

số đo lường ấy được xếp đặt theo thứ tự độ lớn của chúng

Công thức tính trung vị = số hạng thứ1/2* (N+1)

Nếu có số chẵn quan sát thì lấy giá trị trung bình của thứ hạng đứng trường và sau.

Trang 5

1 CÁC KHÁI NIỆM ĐẶC TRƯNG CƠ BẢN (tiếp)

Trung bình mẫu (ký hiệu là , hoặc EX hoặc), được xác định theo công thức:

Nếu cho dạng ghép lớp thì dùng trung

điểm của đoạn làm giá trị đại diện

Nếu cho dạng ghép lớp thì dùng trung

điểm của đoạn làm giá trị đại diện

Trang 6

1 CÁC KHÁI NIỆM ĐẶC TRƯNG CƠ BẢN (tiếp)

6 06/08/2024

Hiệp phương sai là độ đo sự biến thiên cùng nhau của hai

biến ngẫu nhiên (phân biệt với phương sai - đo mức độ biến thiên của một biến)

 Nếu 2 biến có xu hướng thay đổi cùng nhau (nghĩa là, khi một biến có giá trị cao hơn giá trị kỳ vòng thì biến kia có xu hướng cũng cao hơn giá trị kỳ vọng), thì hiệp phương sai giữa hai biến này có giá trị dương Mặt khác, nếu một biến nằm trên giá trị kì vọng còn biến kia có xu hướng nằm dưới giá trị kì vọng, thì hiệp phương sai của hai biến này có giá trị âm

Trang 7

1 CÁC KHÁI NIỆM ĐẶC TRƯNG CƠ BẢN (tiếp)

Phương sai dùng để đo lường mức độ phân tán của dữ liệu Nếu phương sai lớn thì dữ liệu phân tán, không đồng đều Ngược lại nếu phương sai mà nhỏ thì dữ liệu tập trung, ít phân tán.

8 Độ lệch chuẩn (Standard deviation)

Độ lệch chuẩn là căn bậc 2 của phương sai Có ý nghĩa tương

tự như phương sai.

Trang 8

2 KIỂM NGHIỆM CHI-SQUARE

8 06/08/2024

Analyze/Descriptive statistics/ Crosstabs sau đó chọn statistics

Trang 9

2 KIỂM NGHIỆM CHI-SQUARE

 Là một công cụ thông kê sử dụng để kiểm nghiệm giả thuyết cho rằng các biến trong hàng và cột thì độc lập với nhau (H0)

 Phương pháp kiểm nghiệm này chỉ cho ta biết được liệu một biến này có quan hệ hay không với một biến khác

 Phương pháp kiểm nghiệp này không chỉ ra cường độ của mối quan hệ giữa hai biến mạnh hay yếu (nếu có quan hệ), cũng như không chỉ ra hướng thuận hay nghịch của mối quan hệ này (nếu có quan hệ)

Trang 10

2 KIỂM NGHIỆM CHI-SQUARE

10 06/08/2024

 Giả thuyết H0 (Null hypothesis): “ Không có mối liên hệ nào giữa hai biến” ( Hay ta hiểu hai biến độc lập với nhau)

 Đối thiết H1: Hai biến có quan hệ với nhau

 Tính toán:

 Tìm giá trị giới hạn với df = (r-1).(c-1) là bậc tự do (degree of

freedom)

Kết luận:

Nếu X2> giá trị giới hạn thì bác bỏ H0, ngược lại thì chấp nhận H0.

( Hoặc sử dụng Sig (mức ý nghĩa quan sát_Observed significane level)

để tránh dùng bảng tra : nếu sig>

E

E

O X

1 1

2

Trang 11

2 KIỂM NGHIỆM CHI-SQUARE

ể việc kiểm nghiệm này là đáng tin cậy thì các số liệu trong bảng chéo giữa hai biến đang khảo sát phải thỏa mãn một số điều kiện nhất định sau:

mong đợi nhỏ hơn 1.

 Không vượt quá 20% lượng ô giao nhau giữa hai biến đang khảo sát trong bảng chéo có giá trị nhỏ hơn 5 (đối với bảng 2x2-bảng mà mỗi biến trong bảng chéo chỉ có hai giá trị, phần trăm giới hạn này là 0%)

Trang 12

2 KIỂM NGHIỆM CHI-SQUARE – VÍ DỤ

12 06/08/2024

T menu ch n ừ menu chọn ọn Analyze/Descritipve Statistics/ Crosstabs

Trang 13

2 KIỂM NGHIỆM CHI-SQUARE – VÍ DỤ

Nhấn vào Statistics, nhấn Chi-square rồi nhấn continue

Các đại lượng kiểm định dùng cho trường hợp

2 biến dạng thứ bậc

Các đại lượng

kiểm định dành

cho trường hợp

2 biến định danh

Trang 14

2 KIỂM NGHIỆM CHI-SQUARE – VÍ DỤ

14 06/08/2024

Nhấn vào cell nhằm xác định các đại lượng thống kê

Trang 15

2 KIỂM NGHIỆM CHI-SQUARE – VÍ DỤ

Trang 16

2 KIỂM NGHIỆM CHI-SQUARE – VÍ DỤ

16 06/08/2024

 Dịng cuối cùng thơng báo Số ơ cĩ tần số <5

Đối với dạng bảng chéo có hai cột và hai dòng (2X2 tables) – mỗi biến trong bảng chỉ có hai giá trị, ta dùng các chỉ số Yate’s corrected chi-square hay còn gọi là

Continuity Correction đánh giá mối tương quan giữa hai biến trong bảng

 Likelihood Ratio tương tự như pearson Chi-square

Linear-by-Linear Association: Đo lường mối quan hệ tuyến tính giữa hai biến, chỉ số này chỉ cĩ ý nghĩa khi số liệu trong hàng và cột đã được sắp xếp theo thứ tự tăng dần

Trang 17

3 CORRELATION (SỰ TƯƠNG QUAN)

 Dùng để đo lường mối tương quan giữa hai biến thứ t hoặc khoảng cáchï ự hoặc khoảng cáchï Việc đo lường mối tương quan giữa hai biến thứ tự này chủ yếu dự vào hai hệ số Spearman’s correlation coefficient rho và Pearson correlation coefficient

 Spearman’s rho được dùng để đo lường mối quan hệ giữa hai biến thứ tự (các biến này hầu hết đều được xắp xếp từ thấp nhất đến cao nhất)

 Khi các biến trong bảng là các biến định lượng ta sử dụng hệ số Pearson correlation coefficient để đo lường mối quan hệ tuyến tính giữa các biến này

Các giá trị của hệ số tương quan biến thiên từ –1 đến 1, dấu cộng hoặc trừ chỉ ra hương tương quan giữa các biến (thuận hay nghịch), giá trị tuyệt đối của chỉ số này cho biết cường độ tương quan giữa hai biến, giá trị này càng lớn mối tương quan càng mạnh.

Trang 18

3 CORRELATION (SỰ TƯƠNG QUAN)

18 06/08/2024

 Dùng để đo lường mối tương quan giữa hai biến thứ tư hoặc khoảng cáchï Việc đo lường mối tương quan giữa hai biến thứ tự này chủ yếu dự vào hai hệ số Spearman’s correlation coefficient rho và Pearson correlation coefficient

 Spearman’s rho được dùng để đo lường mối quan hệ giữa hai biến thứ tự (các biến này hầu hết đều được xắp xếp từ thấp nhất đến cao nhất)

 Khi các biến trong bảng là các biến định lượng ta sử dụng hệ số Pearson correlation coefficient để đo lường mối quan hệ tuyến tính giữa các biến này

Các giá trị của hệ số tương quan biến thiên từ –1 đến 1, dấu cộng hoặc trừ chỉ ra hương tương quan giữa các biến (thuận hay nghịch), giá trị tuyệt đối của chỉ số này cho biết cường độ tương quan giữa hai biến, giá trị này càng lớn mối tương quan càng mạnh.

Trang 19

3 CORRELATION (SỰ TƯƠNG QUAN)

Giữa hai biến định danh:

Để đo lường mối quan hệ giữa hai biến biểu danh Sử dụng các hệ số Phi

(coefficient) và Cramer’s V, Contingency coefficient để đo lường nếu dựa vào

kết quả kiểm nghiệm Chi-bình phương Ở đây các hệ số này sẽ bằng 0 nếu và

chỉ nếu hệ số Pearson chi bình phương bằng 0 Do đó người ta sử dụng các

thông số này để kiểm nghiệm giả thuyết cho rằng các hệ số này đều bằng 0 - điều này tương đương với giả thuyết độc lập giữa hai biến, hay hai biến không có môí quan hệ với nhau Ta sẽ từ chối giả thuyết này

Phi: Chỉ dùng cho dạng bảng 2x2 tables, hệ số phi coefficient này biến thiên

từ -1 đến +1 Do đó hệ số này ngoài khả năng chỉ ra mối quan hệ và cường độ của mối quan hệ nó còn chỉ ra hướng của mối quan hệ đo

Cramer's V và Contingency coefficient (hệ số liên h p): ợp): Được sử dụng cho

bảng mà số cột và hàng là bất kỳ, giá trị kiểm nghiệm biến thiên từ 0 đến 1, với giá trị 0 chỉ ra không có mối quan hệ giữa các biến

Trang 20

3 CORRELATION (SỰ TƯƠNG QUAN)

20 06/08/2024

Lambda (symmetric and asymmetric lambdas and Goodman and Kruskal’s tau), và Uncertainty coefficient Là các đo lường không dựa vào giá trị Chi- square để tính toán, và không quan tâm đến tính đối xứng của phân phối chuẩn

Các giá trị của hệ số này cũng biến thiên từ 0 đế 1 và được dùng để đo lường khả năng dự báo của một biến (biến độc lập) đối với một biến khác (biến phụ thuộc)

Với giá trị 0: chỉ ra khơng cĩ mối liên hệ giữa các biến nhận được có ý nghĩa rằng những kiến thức về biến độc lập không giúp ích gì cho việc dự báo những khả năng xảy ra của biến phụ thuộc,

Giá trị 1 cho biết khi ta biết được những thông tin về biến độc lập thì nó sẽ giúp ta xác định được một cách hoàn hảo các khả năng xảy ra cho biến phụ thuộc

Trang 21

4 SỬ DỤNG SPSS TRONG TƯƠNG QUAN

Xét 2 biến c19.3 (mức độ quan tâm đến chủ đề gia đình)

và dotuoi (nhóm tuổi)

Vào Analyze/Descritipve Statistics/ Crosstabs

Đưa c19.3 vào Row và dotuoi vào column

Trang 22

4 SỬ DỤNG SPSS TRONG TƯƠNG QUAN

22 06/08/2024

Trang 23

4 SỬ DỤNG SPSS TRONG TƯƠNG QUAN

Trang 24

5 TƯƠNG QUAN VÀ HỒI QUY

24 06/08/2024

5.1 TƯƠNG QUAN TUYẾN TÍNH

 R để đo mức độ chặt chẽ của mối quan hệ tuyến tính giữa 2 biến định lượng

 cho chúng ta biết mức độ chặt chẽ của mối liên hệ tuyến tính Nếu tiến gần đến 1 thì mối tương quan tuyến tính chặt chẽ.

 R=0 thì 2 biến không có mối liên hệ tuyến tính.

Trang 25

5.1 HỆ SỐ TƯƠNG QUAN

Vào Analyze/Correlate/Bivariate…

Hệ số tương quan hạng

Two– tailed:

Kiểm định 2

phía

Trang 26

5.1 HỆ SỐ TƯƠNG QUAN

26 06/08/2024

Mean and standard deviations : Cho biết giá trị trung bình và độ lệch chuẩn của từng biến.

Cross – product deviation and covariances : Cho biết tổng các tích mômen chéo và hiệp phương sai của từng cặp

 Exclude cases pairwise: Các trường hợp dữ liệu thiếu của biến đang dùng

được loại bỏ

 Exclude cases listwise: Các trường hợp dữ liệu của bất kỳ biến nào thiếu sẽ bị loại bỏ

Trang 27

5.1.1 HỆ SỐ TƯƠNG QUAN

Trang 28

5.2 HỒI QUY TUYẾN TÍNH

28 06/08/2024

Nghiên cứu mối liên hệ, sự ảnh hưởng, tác động của một số biến độc lập lên biến phụ thuộc cần quan tâm  Đưa ra mô hình hồi qui

Ví dụ: Tiền lương (Y) phụ thuộc vào Bằng cấp (X1) Thâm niên (kinh nghiệm)

(X2) Chức vụ (X3)

Các bê ta gọi là hệ số hồi quy

3 3

3 2

1 1

Trang 29

5.2 HỒI QUY TUYẾN TÍNH

Phân loại hồi quy:

 Hồi qui đơn

 Hồi qui bội

 Hồi qui tuyến tính

 Hồi qui phi tuyến

Tuyến tính nghĩa là khi biến độc lập tăng 1 đơn vị, thì giá trị

phụ thuộc tăng thêm 1 giá trị không đổi là Tham Số

Trang 30

5.2 HỒI QUY TUYẾN TÍNH

30 06/08/2024

Trang 31

5.2 HỒI QUY TUYẾN TÍNH

5.2.1 HỒI QUY TUYẾN TÍNH ĐƠN

= B0 + B1*Xi

Yi là giá trị đúng của biến Y ở quan sát thứ i

Sử dụng phương pháp OLS (Bình phương cực tiểu nhỏ nhất _

Trong spss ta vào Analyze/Regression/Linear…

Sig.(F)  Kiểm tra ý nghĩa mô hình

● Sig.(F) >= 0.05 Mô hình ko có ý nghĩa thống kê (các biến độc lập

không giải thích được …)

● Sig.(F) < 0.05 Mô hình có ý nghĩa

● Sig.(t) < 0.05 Có phụ thuộc biến … đó

Trang 32

5.2 HỒI QUY TUYẾN TÍNH

32 06/08/2024

Hệ số hồi qui chưa chuẩn hóa  Bêta  Giải thích ý nghĩa tác động của biến

độc lập lên biến phụ thuộc

Hệ số hồi qui đã chuẩn hóa  B  So sánh tác động hơn – kém của biến độc

lập lên biến phụ thuộc

R-Square  Biến độc lập giải thích được bao nhiêu phần trăm trong tổng

biến thiên của biến phụ thuộc

R-Square hiệu chỉnh  Cân nhắc nên đưa thêm 1 biến độc lập nữa vào mô

hình hay không?

Hệ số xác định = R^2 = R Square  R = Hệ số tương quan (0.7  Tốt)

Hệ số hiệu chỉnh Adjusted R Square

1

* ) 1

k n R

R

Trang 33

5.2 HỒI QUY TUYẾN TÍNH

5.2.2 HỒI QUY TUYẾN TÍNH BỘI

i i

i i

i i

i

i

U X

X Y

U X

X Y

2 2

Trang 34

C¸c gi¶ thiÕt cña m« h×nh

tham sè.

Trang 35

5.2 HỒI QUY TUYẾN TÍNH

5.2.2 HỒI QUY TUYẾN TÍNH BỘI

Ma trận hệ số tương quan: Vào correlate/Bivariate

Ngày đăng: 04/12/2015, 07:52

TỪ KHÓA LIÊN QUAN

w