1. Trang chủ
  2. » Công Nghệ Thông Tin

Bài giảng tin học ứng dụng phân tích dữ liệu nghiên cứu với SPSS bài 6 phân tích dữ liệu

91 557 2

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 91
Dung lượng 7,54 MB

Nội dung

MỐI LIÊN HỆ GIỮA HAI BIẾN ĐỊNH TÍNH • Kiểm định mối liên hệ giữa hai biến định danh hoặc định danh – thứ bậc – Giả thuyết • Ho: Không tồn tại mối liên hệ giữa hai biến • H1: Hai biến c

Trang 1

PHÂN TÍCH DỮ LIỆU NGHIÊN

CỨU VỚI SPSS

TIN HỌC ỨNG DỤNG

Trang 2

Hiểu và áp dụng được các phương pháp phân tích

dữ liệu phù hợp với yêu cầu nghiên cứu

Tổ chức và làm việc nhóm phân tích dữ liệu

nghiên cứu; làm báo cáo và trình bày kết quả nghiên cứu

Trang 3

• Phân tích phương sai

• Tương quan tuyến tính

• Hồi quy tuyến tính

Trang 4

MỐI LIÊN HỆ GIỮA HAI BIẾN ĐỊNH TÍNH

• Kiểm định mối liên hệ giữa hai biến định danh hoặc định danh – thứ bậc

• Kiểm định mối liên hệ giữa hai biến thứ bậc

Trang 5

MỐI LIÊN HỆ GIỮA HAI BIẾN ĐỊNH TÍNH

Lý thuyết Chi-bình phương

– Bước 1: Đặt giả thuyết Ho: “Không có mối liên hệ giữa hai biến” hay “Hai biến độc lập với nhau”

– Bước 2: Thực hiện kiểm định 2

– Bước 3: So sánh giá trị p-value với giá trị 

• Chấp nhận Ho nếu p-value >

• Bác bỏ Ho nếu p-value 

– P-value là xác suất phạm sai lầm khi loại bỏ giả thuyết Ho, xác suất này càng cao thì hậu quả của việc phạm sai lầm khi loại bỏ giả thuyết Ho càng

Trang 6

MỐI LIÊN HỆ GIỮA HAI BIẾN ĐỊNH TÍNH

• Kiểm định mối liên hệ giữa hai biến định danh hoặc định danh – thứ bậc

– Giả thuyết

• Ho: Không tồn tại mối liên hệ giữa hai biến

• H1: Hai biến có liên hệ với nhau

Trang 10

MỐI LIÊN HỆ GIỮA HAI BIẾN ĐỊNH DANH

Các đại lượng kiểm

định dành cho hai

biến định danh

Các đại lượng kiểm định dành cho hai biến thứ bậc

Trang 13

MỐI LIÊN HỆ GIỮA HAI BIẾN ĐỊNH TÍNH

• Kiểm định mối liên hệ giữa hai biến thứ bậc

– Giả thuyết

• Ho: Không tồn tại mối liên hệ giữa hai biến

• H1: Hai biến có liên hệ với nhau

– Phương pháp

• Sử dụng kiểm định tau-b của Kendall, kiểm định d của Some, kiểm định gamma của Goodman và Kruskal với mức ý nghĩa 

Trang 16

Trang 17

• So sánh trị trung bình của hai nhóm tổng thể riêng

• So sánh trị trung bình của hai nhóm tổng thể riêng biệt có đặc điểm các phần tử của hai nhóm có sự tương đồng từng đôi một

• So sánh trị trung bình của nhiều nhóm tổng thể độc

Trang 25

PHÂN TÍCH TRẮC NGHIỆM GIẢ THIẾT

• Mục tiêu của trắc nghiệm giả thiết là nhằm quyết định tính chính xác của giả thiết dựa trên các số liệu mẫu thu thập được Chúng ta đánh giá tính chính xác của các giả thiết bằng cách áp dụng các kỹ thuật thống kê; và đánh giá tầm quan trọng của sự khác biệt có ý nghĩa thống kê

• Cách tiếp cận cổ điển hay là lý thuyết lấy mẫu thể hiện cách nhìn mục tiêu theo xác suất dựa trên phân tích dữ liệu mẫu Một giả thiết được xây dựng, nó sẽ bị bác bỏ hoặc chấp nhận dựa trên mẫu dữ liệu thu thập

Trang 27

KIỂM ĐỊNH TRỊ TRUNG BÌNH CỦA HAI TỔNG THỂ

• Kiểm định trị trung bình của hai tổng thể - trường hợp mẫu độc lập

• Kiểm định trị trung bình của hai mẫu phụ thuộc hoặc phối hợp từng cặp

Trang 30

Sig < 5% => phương sai hai mẫu

khác nhau => sử dụng “Equal

variances not assumed”

Sig > 5% => phương sai hai mẫu

bằng nhau => sử dụng “Equal

variances assumed”

GIẢ THUYẾT H 0 : Tuổi trung bình giữa nam và nữ là bằng nhau

Trang 31

Kết quả kiểm định sự bằng nhau

về trị trung bình của hai mẫu

Sig > 5% => phương sai hai mẫu

bằng nhau => sử dụng “Equal

variances assumed”

Sig < 5% => Bác bỏ giả thuyết H0

GIẢ THUYẾT H 0 : Tuổi trung bình giữa nam và nữ là bằng nhau

Trang 32

• Nếu Sig ≥ 0.05 thì phương sai của 2 tổng thể không khác nhau, ta sử dụng kết quả kiểm định t ở dòng Equal variances assumed

Trang 33

• Nếu Sig của kiểm định t ≤ α (mức ý nghĩa)  có sự phác biệt có ý nghĩa về trung bình của 2 tổng thể

• Nếu Sig > α (mức ý nghĩa)  không có sự khác biệt có ý nghĩa về trung bình của 2 tổng thể

Trang 34

KIỂM ĐỊNH TRỊ TRUNG BÌNH CỦA HAI TỔNG THỂ -

TRƯỜNG HỢP MẪU PHỐI HỢP TỪNG CẶP

• Nguyên lý

– Dữ liệu ở dạng thang đo khoảng cách hoặc tỷ lệ

– Tính toán chênh lệch trên từng cặp quan sát

– Kiểm định giả thuyết H0 “chênh lệch trung bình của tổng thể bằng 0”

• Ví dụ

– Cảm nhận của khách hàng trước và sau khi Ngân hàng triển khai Cam kết chất lượng dịch vụ (SLAs)

Trang 35

KIỂM ĐỊNH TRỊ TRUNG BÌNH CỦA HAI TỔNG THỂ -

TRƯỜNG HỢP MẪU PHỐI HỢP TỪNG CẶP

• Quy trình thực hiện

– Gọi chức năng Analye > Compare Means > Samples T Test

Paired-– Cung cấp cặp biến phối hợp

– Điều chỉnh độ tin cậy (nếu cần)

Trang 36

KIỂM ĐỊNH TRỊ TRUNG BÌNH CỦA HAI TỔNG THỂ -

TRƯỜNG HỢP MẪU PHỐI HỢP TỪNG CẶP

Trang 37

KIỂM ĐỊNH TRỊ TRUNG BÌNH CỦA HAI TỔNG THỂ -

TRƯỜNG HỢP MẪU PHỐI HỢP TỪNG CẶP

GIẢ THUYẾT H 0 : Cảm nhận của khách hàng là không đổi

Sig < 5% => Bác bỏ giả thuyết H0

Trang 38

– Mở rộng kiểm định t – kiểm định nhiều nhóm mẫu cùng một lúc

– Các nhóm mẫu phải có cùng phương sai

• Phân loại

– ANOVA một yếu tố (một biến phân loại)

– ANOVA nhiều yếu tố (nhiều biến phân loại)

Trang 39

– Cung cấp biến phụ thuộc, biến phân loại

– Thiết lập các tính toán thống kê mô tả, kiểm định sự bằng nhau của các nhóm

Trang 41

PHÂN TÍCH PHƯƠNG SAI MỘT YẾU TỐ

GIẢ THUYẾT H 0 : Không có sự khác nhau về thanh toán bằng thẻ

Kiểm tra điều kiện áp dụng ANOVA: phương sai bằng nhau

giữa các nhóm mẫu Sig > 0.05 => phủ định H

0 => phương sai bằng nhau

Sig > 5% => Chấp nhận giả

thuyết H0

Trang 42

PHÂN TÍCH PHƯƠNG SAI MỘT YẾU TỐ

• Phân tích sâu ANOVA

– Kiểm định trước (Contrasts)

• Kiểm định các giả định về trung bình nhóm trước khi phân tích ANOVA

– Kiểm định sau (Post Hoc)

• Kiểm định các giả định về trung bình nhóm sau khi phân tích ANOVA

Trang 43

PHÂN TÍCH PHƯƠNG SAI MỘT YẾU TỐ

Thực hiện kiểm định t cho từng

cặp trung bình nhóm

Giống LSD, tiến hành so sánh bội trên số lần tiến hành so sánh

Sử dụng bảng phân phối Studentizze range distribution

Kiểm định lại toàn bộ các trị trung bình

nhóm Nếu không bằng nhau thì kiểm

Trang 44

PHÂN TÍCH PHƯƠNG SAI MỘT YẾU TỐ

Trị trung bình của 4 nhóm đầu bằng với nhóm cuối cùng

Trang 46

PHÂN TÍCH PHƯƠNG SAI HAI YẾU TỐ

Giả định phương sai các nhóm bằng nhau không bị vi phạm => kiểm định ANOVA có ý nghĩa

Chấp nhận giả thuyết H0

GIẢ THUYẾT H 0 : Không có sự khác nhau về thanh toán bằng thẻ

KẾT LUẬN: Không có sự khác nhau về thanh toán bằng thẻ

Trang 48

TƯƠNG QUAN TUYẾN TÍNH

• Hệ số tương quan đơn (r)

– Tên đầy đủ Pearson Correlation Coefficient

– Áp dụng trong trường hợp tổng thể có phân phối chuẩn

– Lượng hóa mức độ chặt chẽ của mối liên hệ tuyến tính giữa hai biến định lượng

– Mối liên hệ giữa hai biến có thể

Trang 49

– Gọi chức năng Analyze > Correlate > Bivariate

– Lựa chọn hai hay nhiều biến định lượng để phân tích

– Lựa chọn một (số) hệ số tính toán

– Lựa chọn loại kiểm định mức ý nghĩa

• Ví dụ

Trang 52

TƯƠNG QUAN TUYẾN TÍNH

Hệ số tương quan giữa hai biến là 0.67 ở mức ý nghĩa nhỏ hơn 1%

Trang 53

TƯƠNG QUAN TUYẾN TÍNH

• Hệ số tương quan hạng Spearman

– Tên đầy đủ Rank Correlation Coefficient

– Áp dụng trong trường hợp tổng thể không có phân phối chuẩn

Trang 54

HỒI QUY TUYẾN TÍNH

• Khái niệm và ý nghĩa của Hồi qui

• Xây dựng mô hình hồi qui

• Kiểm định mô hình (giả thiết về sự phụ thuộc)

Trang 55

– Thu nhập và tiêu dùng

– Các yếu tố đầu vào và kết quả của quá trình sản xuất

Trang 56

– Hồi quy tuyến tính đơn

– Hồi quy tuyến tính bội

• Ví dụ

– Tác động của kết quả tuyển sinh đầu vào đối với điểm trung bình học tập toàn khóa của sinh viên

Trang 58

– X i là giá trị quan sát thứ i của biến độc lập

là giá trị dự đoán thứ icủa biến phụ thuộc

– Bo và B1 là hệ số hồi quy; phương pháp bình phương nhỏ nhất (OLS) xác định hai hệ số này

= + ∗

Trang 61

– Giả sử chúng ta có một mẫu gồm n cặp quan sát (Yi,Xi), i = 1÷ n Theo phương pháp bình phương nhỏ nhất, ta phải tìm Y^ sao cho nó càng gần với giá trị

Trang 62

– Giả sử chúng ta có một mẫu gồm n cặp quan sát (Yi,Xi),

i = 1÷ n Theo phương pháp bình phương nhỏ nhất, ta phải tìm Y^ sao cho nó càng gần với giá trị thực (Yi) càng tốt, tức phần dư:

– ei = Yi – Yi^ = Yi – B0 - B1 *Xi càng nhỏ càng tốt

– Do ei ( i=1,n ) có thể dương, có thể âm, nên ta cần tìm SRF sao cho tổng bình phương của các phần dư đạt cực tiểu

Trang 63

– Các giá trị của Y độc lập với nhau

– Các giá trị trung bình nằm trên một đường thẳng

– Phần dư

• Quy trình thực hiện

– Gọi thực hiện Analyze > Regression > Linear …

= − = − ( + ∗ )

Trang 65

HỒI QUY TUYẾN TÍNH ĐƠN

Đo lường mức độ phù hợp của mô

hình đối với mẫu

Kiểm định mức độ phù hợp của

mô hình đối với tổng thể (F lớn,

Sig < 0.05)

Kiểm định ý nghĩa của các hệ số

hồi quy (Sig < 0.05)

Hệ số hồi quy

Trang 66

– Cho biết mức độ (%) sự biến thiên của biến phụ thuộc

được giải thích bởi biến độc lập

– Giá trị của Sig( P-value) của bảng ANOVA dùng để đánh giá sự phù hợp (tồn tại) của mô hình Giá trị Sig nhỏ (thường <5%) thì mô hình tồn tại

Trang 67

ĐO LƯỜNG MỨC ĐỘ PHÙ HỢP CỦA MÔ HÌNH

• Để có thể biết mô hình giải thích được như thế nào hay % biến động của biến phụ thuộc, người ta sử dụng R2 (0 ≤ R2 ≤ 1)

Trang 68

HỒI QUY TUYẾN TÍNH ĐƠN

• Kiểm tra các giả định

– Giả định liên hệ tuyến tính

– Giả định Các sai số ngẫu nhiên trong hàm hồi qui tổng thể có phương sai của sai số không đổi

– Giả định về phân phối chuẩn của phần dư

– Giả định về tính độc lập của sai số

Trang 70

PHƯƠNG SAI CỦA SAI SỐ KHÔNG ĐỔI

GIẢ THUYẾT H 0 : Phương sai của sai số không đổi

GIẢ THUYẾT H 0 : Hệ số tương quan hạng Spearman cho hai biến

Input_Score và ABSres bằng 0

Sig < 0.05 => Bác bỏ giả thuyết H0

=> Phương sai của sai số thay đổi

KẾT LUẬN: Mô hình hồi quy tuyến tính không có giá trị

Trang 72

(quá nhỏ hoặc quá lớn)

Giả thuyết: Hệ số tương quan tổng thể của sai số bằng 0

Trang 73

Chấp nhận giả thuyết không có tự tương quan chuỗi bậc nhất

Không có kết luận

Có tự tương quan nghịch

(âm)

Trang 74

– X ki là giá trị quan sát thứ i của biến độc lập thứ k

là giá trị dự đoán thứ i của biến phụ thuộc

– i là các hệ số hồi quy riêng phần

– Phần dư e i là biến độc lập ngẫu nhiên N(0,2 )

Trang 76

– Đánh giá độ phù hợp của mô hình

– Kiểm định độ phù hợp của mô hình

– Giải thích các hệ số hồi quy riêng trong mô hình

– Xác định tầm quan trọng của các biến trong mô hình – Lựa chọn biến cho mô hình

– Dò tìm các vi phạm giả định cần thiết

Trang 77

XEM XÉT MA TRẬN HỆ SỐ TƯƠNG QUAN

Hệ số tương quan giữa hai biến độc lập thấp

Hệ số tương quan giữa

biến phụ thuộc với các

biến độc lập tương đối cao

Trang 79

KIỂM ĐỊNH CÁC GIẢ THUYẾT

Mô hình giải thích được 71% các trường hợp được ghi nhận => độ phù hợp CAO

Sig < 0.01 chứng tỏ các hệ số hồi quy không đồng nhất 0, mô hình

có thể sử dụng được

Trang 80

TẦM QUAN TRỌNG CỦA CÁC BIẾN

Hai biến này có ảnh hưởng đối với mô hình lớn hơn các

biến còn lại

Trang 84

– Giả định liên hệ tuyến tính

– Giả định phương sai của sai số không đổi

– Giả định về phân phối chuẩn của phần dư

– Giả định về tính độc lập của sai số

– Giả định về hiện tượng đa cộng tuyến

Trang 86

PHƯƠNG SAI CỦA SAI SỐ KHÔNG ĐỔI

KẾT LUẬN: Phương sai của sai số không đổi

Chấp nhận giả thuyết H0

GIẢ THUYẾT H 0 : Phương sai của sai số không đổi

Trang 89

Chấp nhận giả thuyết không có tự tương quan chuỗi bậc nhất

Không có kết luận

Có tự tương quan nghịch

(âm)

Trang 90

HIỆN TƯỢNG ĐA CỘNG TUYẾN

KẾT LUẬN: Không xảy ra hiện tượng đa cộng tuyến

Trang 91

• Phân tích phương sai

• Tương quan tuyến tính

• Hồi quy tuyến tính

Ngày đăng: 29/04/2016, 07:42

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w