HƯỚNG DẪN THỰC HÀNH SPSS CƠ BẢN
Trang 1SPSS 16.0
CÁCH THỨC TIẾN HÀNH LỆNH FREQUENCIES
(Tính tần số)
1 Sau khi mở file dữ liệu, vào menu Analyze Descriptive Statistics Frequencies
Màn hình sẽ xuất hiện hộp thoại sau:
2 Chọn biến muốn tính tần số (biến Place V1) bằng cách click chuột vào tên biến rồi đưa sang khung Variable(s)
3 Click Ok Trường hợp muốn vẽ biểu đồ thực hiện thêm bước 4 trước khi click Ok
4 Để vẽ biểu đồ click chuột vào ô Charts… Chọn dạng biểu đồ ở Chart type, chọn giá trị thể hiện trên biểu đồ là số đếm (frequencies) hay phần trăm (percentages) Click Continue để trở lại hộp thoại Frequencies Ok để thực hiện lệnh
Vẽ biểu đồ
Trang 2CÁCH THỨC TIẾN HÀNH LỆNH DESCRIPTIVES
(Tính điểm trung bình)
1 Vào menu Analyze Descriptive Statistics Descriptives…, xuất hiện hộp thoại
2 Chọn 1 hay nhiều biến (định lượng) muốn tính điểm trung bình đưa vào khung Variable(s)
3 Click vào ô Options… để xuất hiện hộp thoại Descriptive Options Chọn các đại lượng thống kê muốn tính toán bằng cách click vào ô vuông cần thiết
4 Chọn cách sắp xếp kết quả tính toán theo thứ tự danh sách biến (Variable list), thứ tự Alphabetic của nhãn biến, thứ tự tăng dần (Ascending list), và thứ tự giảm dần (Descending list)
5 Click Continue để trở về hộp thoại Descriptive Ok để thực hiện lệnh
Trang 3Ý nghĩa của từng giá trị trung bình đối với thang đo khoảng
(Interval Scale)
Giá trị khoảng cách = (Maximum - Minimum) / n
= (5 -1) / 5 = 0.8
1.00 - 1.80 Rất không đồng ý/Rất không hài lòng/Rất không quan trọng1.81 - 2.60 Không đồng ý/Không hài lòng/ Không quan trọng
3.41 - 4.20 Đồng ý/ Hài lòng/ Quan trọng
4.21 - 5.00 Rất đồng ý/ Rất hài lòng/ Rất quan trọng
Trang 4CÁCH THỨC TIẾN HÀNH PHÂN TÍCH BẢNG CHÉO
(CROSSTABULATION)
Phân tích bảng chéo dùng để kiểm định mối quan hệ giữa các biến định tính với nhau bằng cách dùng kiểm định Chi – bình phương (Chi-square) Cách thức tiến hành với SPSS như sau:
1 Vào menu Analyze Descriptive Statistics Crosstabs…,
2 Xuất hiện hộp thoại sau:
3 Chọn và đưa các biến vào khung Row(s) (dòng) và Column(s) (cột) và Layer 1 of 1 (đối với trường hợp trên 2 biến)
Trang 54 Click vào ô Statistics, xuất hiện hộp thoại sau:
5 Chọn các kiểm định cần thiết Trong trường hợp này ta dùng kiểm định Chi – bình phương (Chi-square)
- Các kiểm định ở ô Norminal dùng để kiểm định mối liên hệ giữa các biến biểu danh
- Các kiểm định ở ô Ordinal dùng để kiểm định mối liên hệ giữa các biến thứ tự
6 Click vào continue để trở lại hộp thoại Crosstabs Click vào ô Cells, hộp thoại sau xuất hiện:
hiện tần số mong đợi chọn Expected
8 Chọn cách thể hiện phần trăm theo dòng hay theo cột ở ô Percentages
9 Click Continue để trở lại hộp thoại Crosstabs Ok để thực hiện lệnh
Trang 6Khi thực hiện kiểm định, ta có 2 giả thuyết.
H0: không có mối quan hệ giữa các biến
H1: có mối quan hệ giữa các biến
Để kết luận là chấp nhận hay bác bỏ giả thuyết H0, ta sẽ dùng các kiểm định phù hợp
Dựa vào giá trị P (p-value) (SPSS viết tắt p-value là sig.) để kết luận là chấp nhận hay bác
bỏ giả thuyết H0
p-value (sig.) ≤ α (mức ý nghĩa) bác bỏ giả thuyết H0 Có nghĩa là có mối quan hệ
có ý nghĩa giữa các biến cần kiểm định
p-value (sig.) > α (mức ý nghĩa) chấp nhận H0 Không có mối quan hệ giữa các biến cần kiểm định
ĐỐI VỚI KIỂM ĐỊNH CHI – BÌNH PHƯƠNG
Hàng đầu tiên của bảng Chi-square tests thể hiện giá trị P
a 8 cells (44.4%) have expected count less than 5 The minimum expected count is 1.69.
Cuối bảng Chi-Square tests SPSS sẽ đưa ra dòng thông báo cho biết % số ô có tần suất mong đợi dưới 5 Kiểm định Chi-bình phương chỉ có ý nghĩa khi số quan sát đủ lớn, nếu có quá 20% số ô trong bảng chéo có tần số lý thuyết nhỏ hơn 5 thì giá trị chi-bình phương không còn đáng tin cậy
Trong ví dụ trên có đến 44.4% số ô có tần số mong đợi dưới 5, biện pháp cho trường hợp này là ta sẽ gom các biểu hiện trên các biến lại để tăng số quan sát trong mỗi nhóm
CÁCH THỨC TIẾN HÀNH KIỂM ĐỊNH GIẢ THUYẾT VỀ TRỊ TRUNG BÌNH
CỦA 2 TỔNG THỂ ĐỘC LẬP (Independent Samples T-test)
p-value
Trang 71 Vào menu Analyze Compare Means Independent-samples T-test
2 Chọn biến định lượng cần kiểm định trị trung bình đưa vào khung Test Variable(s) Chọn biến định tính chia số quan sát thành 2 nhóm mẫu để so sánh giữa 2 nhóm này với nhau đưa vào khung Grouping Variable
3 Chọn Define Groups… để nhập mã số của 2 nhóm Click Continue để trở lại hộp thoại chính Click Ok để thực hiện lệnh
Trong kiểm định Independent-samples T-test, ta cần dựa vào kết quả kiểm định sự bằng nhau của 2 phương sai tổng thể (kiểm định Levene) Phương sai diễn tả mức độ đồng đều hoặc không đồng đều (độ phân tán) của dữ liệu quan sát
Trang 8Independent Samples Test
A.Cleanliness and comfort of
room Equal variances assumed
Equal variances not assumed
Levene's Test for Equality of
Nếu Sig của kiểm định t ≤ α (mức ý nghĩa) có sự phác biệt có ý nghĩa về trung bình của 2 tổng thể
Nếu Sig > α (mức ý nghĩa) không có sự khác biệt có ý nghĩa về trung bình của 2 tổng thể
Trong VD trên sig = 0.002 < 0.05 có sự khác biệt có ý nghĩa về trung bình của 2 tổng thể
CÁCH THỨC TIẾN HÀNH KIỂM ĐỊNH GIẢ THUYẾT VỀ TRỊ TRUNG BÌNH
CỦA 2 TỔNG THỂ PHỤ THUỘC HAY PHỐI HỢP TỪNG CẶP
(Paired-Samples T-test)
Trang 91 Vào menu Analyze Compare means Paired-samples T-test
2 Chọn cặp biến muốn so sánh (nhấn giữ phím ctrl để chọn 2 biến) đưa vào khung Paired Variable(s) Có thể chọn nhiều cặp để so sánh cùng 1 lúc
3 Có thể chỉnh lại độ tin cậy bằng cách click vào ô Option, nhập độ tin cậy vào khung Confidence Interval
4 Click Ok để thực hiện lệnh
5 Xem cách đọc kết quả kierm định ở phần trên Cũng dùng giá trị Sig
CÁCH THỨC TIẾN HÀNH PHÂN TÍCH PHƯƠNG SAI
(ANOVA – Analysis of Variance)
Phân tích phương sai ANOVA là phương pháp so sánh trị trung bình của 3 nhóm trở lên Có 2 kỹ thuật phân tích phương sai: ANOVA 1 yếu tố (một biến yếu tố để phân loại các quan sát thành các nhóm khác nhau) và ANOVA nhiều yếu tố(2 hay nhiều biến để phân loại) Ở phần thực hành cơ bản chỉ đề cập đến phân tích phương sai 1 yếu tố (One-way ANOVA)
Một số giả định đối với phân tích phương sai một yếu tố:
- Các nhóm so sánh phải độc lập và được chọn một cách ngẫu nhiên
- Các nhóm so sánh phải có phân phối chuẩn hoặc cỡ mẫu phải đủ lớn để được xem như tiệm cận phân phối chuẩn
- Phương sai của các nhóm so sánh phải đồng nhất
Trang 101 Từ menu Analyze Compare Means One-Way ANOVA, xuất hiện hộp thoại
sau:
2 Đưa biến định lượng (trị trung bình) vào khung Dependent list
Đưa biến phân loại xác định các nhóm cần so sánh với nhau vào khung Factor
3 Click vào nút Option để mở hộp thoại One-Way ANOVA Options
Trong hộp thoại One-way ANOVA Options:
- Click chọn ô Descriptive để tính đại lượng thống kê mô tả (tính trị trung bình)
theo từng nhóm so sánh
- Click chọn ô Homogeneity of variance test để kiểm định sự bằng nhau của các
phương sai nhóm (thực hiện kiểm định Levene)
4 Click chọn Continue để trở lại hộp thoại ban đầu click Ok để thực hiện lệnh
2 kỹ thuật dùng để kiểm định sâu ANOVA
Trang 115 Dựa vào kết quả kiểm định ANOVA, nếu H0 được chấp nhận thì kết luận không có
sự khác biệt có ý nghĩa giữa các nhóm với nhau Nếu H0 bị bác bỏ có sự khác biệt
có ý nghĩa giữa các nhóm trở lại hộp thoại One – way ANOVA để thực hiện kiểm định sâu ANOVA nhằm xác định cụ thể trung bình của nhóm nào khác với nhóm nào, nghĩa là tìm xem sự khác biệt của các nhóm xảy ra ở đâu
6 Tuy nhiên có thể thực hiện kiểm định ANOVA và sâu ANOVA cùng lúc với nhau Dựa vào sự chấp nhận hay bác bỏ giả thuyết H0 để quan tâm hay không quan tâm đến kết quả kiểm định sâu ANOVA
Phân tích sâu ANOVA – Xác định chỗ khác biệt
Có 2 phương pháp để phân tích sâu ANOVA, đó là kiểm định “trước” (kiểm định Priori Contrasts) và kiểm định “sau” (kiểm định Post-Hoc test) Phương pháp kiểm định gần với phương pháp nghiên cứu thực là Post-Hoc test Nên trong phần này ta sẽ sử dụng Post-Hoc test để thực hiện kiểm định sâu ANOVA nhằm tìm ra chỗ khác biệt
Các phương pháp kiểm định thống kê của Post-Hoc test thường được sử dụng:
- LSD: đây là phép kiểm định dùng kiểm định t lần lượt cho từng cặp trung bình
nhóm, do vậy nhược điểm của nó là độ tin cậy không cao vì làm gia tăng mức độ phạm sai lầm tương ứng với việc so sánh nhiều nhóm cùng một lúc
- Bonferroni: giống quy tắc của LSD nhưng điều chỉnh được mức ý nghĩa khi tiến
hành so sánh bội dựa trên số lần tiến hành so sánh Đây là một trong những thủ
tục kiểm định đơn giản nhất và hay được sử dụng cho mục tiêu này.
- Tukey: cũng được sử dụng phổ biến cho việc tìm kiếm các trung bình các nhóm
khác biệt Nó sử dụng bảng phân phối Studentizze range distribution Tukey hiệu quả hơn Bonferroni khi số lượng các cặp trung bình cần so sánh khá nhiều.
- R-E-G-W: thực hiện 2 bước kiểm định, đầu tiên tiến hành kiểm định lại toàn bộ
các giá trị trung bình nhóm xem có bằng nhau không; nếu không bằng thì bước kế tiếp nó sẽ kiểm định để tìm các nhóm nào khác biệt thật sự với nhau về trị trung
bình Nhưng kiểm định này không phù hợp khi kích cỡ các nhóm mẫu không bằng nhau.
- Dunnett: là thủ tục cho phép chọn so sánh các trị trung bình của các nhóm mẫu
còn lại với trị trung bình của một nhóm mẫu cụ thể nào đó được chọn ra so sánh
(nhóm điều khiển), SPSS mặc định chọn nhóm cuối (last) để làm nhóm điều
khiển
Sử dụng kiểm định nào là tuỳ thuộc vào mục đích của nhà nghiên cứu và tình hình thực tế nghiên cứu
Trang 12Đọc kết quả phân tích phương sai
1 Bảng đầu tiên thể hiện các đại lượng thống kê mô tả
Bound
Upper Bound
Test of Homogeneity of Variances
Trang 134 Bảng thứ 4 thể hiện kết quả kiểm định sâu ANOVA (dùng kiểm định LSD).
Std Error Sig. 95% Confidence Interval
Lower Bound Upper Bound
* The mean difference is significant at the 0.05 level.
Dựa vào kết quả kiểm định LSD này, ta có thể kết luận chỉ có hai nhóm đã kết hôn và độc thân là có sự khác nhau về mức độ sẵn lòng giới thiệu Trong VD này nhóm đã kết hôn
sẽ sẵn lòng giới thiệu hơn nhóm độc thân (xem bảng thống kê mô tả)
MÔ HÌNH HỒI QUY TUYẾN TÍNH BỘI
1 Từ menu Analyze Regression Linear…
Trang 142 Xuất hiện hộp thoại sau:
- Đưa biến phụ thuộc vào khung Dependent(s)
- Đưa biến độc lập vào khung Independent(s)
3 Chọn phương pháp đưa biến vào ở ô Method
- Mặc định SPSS sẽ chọn phương pháp đưa biến vào là Enter Đây là phương pháp
mà SPSS sẽ xử lý tất cả các biến độc lập mà nhà nghiên cứu muốn đưa vào mô hình
- Phương pháp đưa vào dần (forward selection) Biến độc lập đầu tiên được xem
xét để đưa vào mô hình là biến có tương quan lớn nhất với biến phụ thuộc Tiếp tục SPSS sẽ xét điều kiện để đưa các biến độc lập còn lại vào mô hình Nếu biến đầu tiên không thoả điều kiện vào thì thủ tục này sẽ chấm dứt, không có biến nào được đưa vào mô hình
- Phương pháp loại trừ dần (backward elimination) Đầu tiên tất cả các biến độc
lập được đưa vào mô hình, biến có hệ số tương quan nhỏ nhất sẽ được kiểm tra đầu tiên, nếu không thoả điều kiện sẽ bị loại ra Lúc này mô hình này sẽ được tính toán lại mà không có biến độc lập vừa loại Tiếp theo SPSS sẽ lặp lại thủ tục trên cho đến khi nào giá trị F của biến có hệ số tương quan nhỏ nhất lớn hơn điều kiện thì quá trình này sẽ dừng lại
ô Tham khảo điều kiện để đưa vào và loại ra PIN, FIN, FOUT, POUT
Trang 15- Phương pháp chọn từng bước (stepwise selection) là sự kết hợp của phương pháp
đưa vào dần vào loại trừ dần và là phương pháp được sử dụng thông thường nhất
ô Sử dụng phương pháp đưa biến vào nào phụ thuộc vào tính chất của cuộc nghiên cứu Và phương pháp được sử dụng nhiều nhất là phương pháp chọn từng bước (stepwise selection)
4 Click vào ô Statistics…, để mở hộp thoại sau:
- Click chọn ô Collinearity diagnostics để kiểm tra hiện tượng Đa cộng tuyến (Multicollinearity) Độ chấp nhận của biến (Tolerances) và hệ số phóng đại phương sai (Variance inflation factor – VIF) được dùng để phát hiện hiện tượng
đa cộng tuyến Quy tắc là khi VIF vượt quá 10 là dấu hiệu của đa cộng tuyến
5 Click Continue để trở lại hộp thoại Linear Regressions click Ok để thực hiện lệnh
Các bước đánh giá mô hình
VD: sử dụng stepwsise để đưa các biến độc lập vào mô hình
Mô hình: sự hài lòng của DK về điểm đến = α + β1 (sự hài lòng về dịch vụ lưu trú)
+ β2 (sự hài lòng về dịch vụ ăn uống)+ β3 (sự hài lòng về dịch vụ mua sắm)+ β4 (sự hài lòng về dịch vụ vận chuyển)Giá trị Tolerances và VIF ở bảng số 3 (bảng Coefficients) cho thấy không hiện diện hiện tượng đa cộng tuyến của các biến tiếp tục đánh giá mô hình
1 Đánh giá độ phù hợp của mô hình
Hệ số xác định R2 và R2 hiệu chỉnh (Adjusted R square) được dùng để đánh giá độ phù
Trang 16chỉnh sẽ an toàn hơn khi đánh giá độ phù hợp của mô hình R2 hiệu chỉnh càng lớn thể hiện
độ phù hợp của mô hình càng cao
Model Summary
Adjusted R Square
Std Error of the Estimate
R2 hiệu chỉnh của mô hình số 4 là 0.463 46.3% sự biến thiên của mức độ hài lòng của
DK về điểm đến được giải thích bởi mối liên hệ tuyến tính của các biến độc lập Mức độ phù hợp của mô hình tương đối cao Tuy nhiên sự phù hợp này chỉ đúng với dữ liệu mẫu
Để kiểm định xem có thể suy diễn mô hình cho tổng thể thực hay không ta phải kiểm định
Trang 17Giá trị sig của trị F của mô hình số 4 rất nhỏ (< mức ý nghĩa) bác bỏ giả thuyết H0
mô hình phù hợp với tập dữ liệu và có thể suy rộng ra cho toàn tổng thể
3 Ý nghĩa các hệ số hồi quy riêng phần trong mô hình
- Ý nghĩa của hệ số riêng phần là βk đo lường sự thay đồi giá trị trung bình Y khi
Xk thay đổi 1 đơn vị, giữ các biến độc lập còn lại không đổi
Coefficients a
Model
Unstandardized Coefficients
Standardized Coefficients t Sig. Collinearity Statistics
Trang 18- Ở VD này ta có thể viết lại mô hình như sau:
Hài lòng về điểm đến = 1.172 + 0.300(hài lòng về lưu trú) + 0.168(hài lòng về vận chuyển)
+ 0.139(hài lòng về ăn uống) + 0.103(hài lòng về mua sắm)
Giải thích mô hình: Phương trình hồi quy bội được phương pháp stepwise ước
lượng cho thấy sự hài lòng của du khách về 4 dịch vụ: lưu trú, vận chuyển, ăn uống, và mua sắm có tác động tỷ lệ thuận với sự hài lòng chung của du khách về điểm đến Trong đó sự hài lòng về dịch vụ lưu trú có tác động mạnh nhất đến sự hài lòng về điểm đến
MỘT SỐ BIỆN PHÁP KHẮC PHỤC HIỆN TƯỢNG ĐA CỘNG TUYẾN TRONG
MÔ HÌNH HỒI QUY TUYẾN TÍNH
(Đề nghị tham khảo chi tiết hơn trong giáo trình Kinh tế lượng của Tiến sĩ Mai Văn Nam)
1 Sử dụng thông tin tiên nghiệm
Thông tin tiên nghiệm có thể từ các công việc thực tế trước đây trong đó đã xảy ra hiện tượng cộng tuyến nhưng ít nghiêm trọng hoặc từ các lý thuyết tương ứng trong lĩnh vực nghiên cứu
2 Loại trừ một biến giải thích ra khỏi mô hình
Bước 1: Xem cặp biến có quan hệ chặc chẽ Giả sử X3 và X4 có tương quan chặc chẽ với nhau
Bước 2: Tính R2 đối với các hàm hồi quy: có mặt cả 2 biến; không có mặt 1 trong 2 biến.Bước 3: Loại biến mà giá trị R2 tính được khi không có mặt biến đó lớn hơn
VD: R2 của hàm có mặt 2 biến là 0.94; R2 của mô hình không có biến X 3 là 0.92; R2 của mô
hình không có biến X 4 là 0.87 loại biến X 3 ra khỏi mô hình
3 Thu thập thêm số liệu hoặc lấy mẫu mới
Trang 19Vấn đề đa cộng tuyến là một đặc tính của mẫu, có thể là trong một mẫu khác, các biến cộng tuyến có thể không nghiêm trọng như trong mẫu đầu tiên Vì vậy, tăng cỡ mẫu có thể làm giảm bớt vấn đề cộng tuyến.
CÁCH THỨC TIẾN HÀNH PHÂN TÍCH NHÂN TỐ
1 Từ menu Analyze Data Reduction Factor
2 Xuất hiện hộp thoại sau: