hướng dẫn các bước làm cơ bản về phân tích spss cho sinh viên đại học và người đang học spss, các dạng bài spss cơ bản và thường dùng. về các nhập dữ liệu,. sử lý số liệu, chạy chương trình, và đọc kết quả
Trang 1Phần 2: xác định tuổi bình quân của người hút thuốc:
Câu lệnh: Analyze/ Despcriptive Statistics/ Descriptives
> Cửa sổ Descriptives chọn biến Tuoi vào Variable(s) / OK
Trang 2Câu lệnh: Analyze/ Custom Tables/ Custom tables-> Cửa sổ
Cửa sổ Custom Tables gắp các biến Tuoi vào cột Columns, Thoi quen hut thuoc và Gioi tinh vào cột Rows/ Nhấn Categories and total-> tích vào Total và Label nhập: “ Bình quân”-> apply ; Nhấn Summary Statistics Chọn Maximum, Minimum, Std.Deviation đưa sang cột Display -> Apply to Selection/ OK
Kết quả:
Custom Tables
Table 1
TuổiMean Maximum Minimum Standard
DeviationThói quen hút
3 Có sự khác biệt đáng kể về tuổi theo giới tính và thói quen hút thuốc hay không?
-Câu lệnh: Analyze/ Descriptive Statistics/ Crosstabs
Trang 3> Cửa sổ crosstabs gắp biến Gioi Tinh vào Row(s) , Thoi quen hut thuoc vào Column(s); tích chọn Display clustered bar charts; Nhấn Statistics và chọn Chi-square -> continue -> OK
Crosstabs
Case Processing Summary
Cases
Trang 6Phần 3: Tính các giá trị trung bình của mẫu về mức tiêu thụ xăng? Câu lệnh: Analyze/ Descriptive Statistics / Descriptive
Đưa biến mức tiêu thụ xăng[xangtieuthu] sang Variable(s) / OK Kết quả
Descriptives
Descriptive Statistics
Trang 7N Minimum Maximum Mean Std.
Câu lệnh: Analyze/ Custom Tables/ Custom Tables
> Gắp biến mức tiêu thụ xăng[xangtieuthu] vào cột Columns; Biến loai xe vào cột Rows; Nhấn Categories and Total -> tích vào Total và Label nhập: “ Bình quân”-> apply / OK
Kết quả:
Custom Tables
Table 1
mức tiêuthụ xăng
Trang 8H1 , H2 , H3 là mức tiêu thụ xăng tương ứng với 3 loại xe A , B , C
Công thức Analyze / compare means/ one way anova => cửa sổ
Maximum
LowerBound
UpperBound
Trang 9e (I-J)
Std
Error Sig
95% ConfidenceIntervalLowerBound
UpperBound
xe A xe B -2.3000* 4450 000 -3.235 -1.365
xe C -1.9429* 4450 000 -2.878 -1.008
xe B xe A 2.3000* 4450 000 1.365 3.235
Trang 10xe C 3571 4450 433 -.578 1.292
xe C xe A 1.9429* 4450 000 1.008 2.878
xe B -.3571 4450 433 -1.292 578
sánh mức tiêu thụ xăng của các loại xe :
Loại xe A có mức tiêu thụ xăng BQ thấp hơn đáng kể so với xe B và CMức tiêu thụ xăng của xe B và C không có khác biệt đáng kể
Trang 12Mức thu nhập của khối hộ gia đình thái độ du lịch của nhóm hộ 1 có sự thấp hơn đáng kể so với nhóm hộ gia đình 3 và 4.
Đồng thời nhóm hộ 2 có sự thấp hơn đáng kể so với mức 4
Chi phí quảng cáo
Câu lệnh: Graphs/ legacy dialogs/ histogram
2, viết phương trình hồi quy
Trang 13Pt1: Y = ^β0+ ^β1+ X
Trong đó X là chi phí quảng cáo
Y là doanh số bán hàng
3, chạy phương trình hồi quy:
Câu lệnh : Analyze/ regression / linear Cửa sổ
4, kiểm định sự tồn tại của mô hình
Muốn mô hình tồn tại ta có giả thuyết
a Dependent Variable: doanh số bán (tr.đ)
b Predictors: (Constant), chi phí quảng cáo (tr.đ)
Sig Anova= 0.001 < ∝ =0.05 ta có thể bác bỏ H0 ta chấp nhận H1 suy ra ^β 1 khác 0 suy ra mô hình luôn tồn tại.
Trang 145, kiểm định sự phù hợp của mô hình
Model Summary
Adjusted RSquare
Std Error ofthe Estimate
Suy ra mô hình tương đối phù hợp
6,kiểm tra sự tồn tại của các hệ số hồi quy:
Căn cứ vào bảng:
Coefficients a
Model
UnstandardizedCoefficients
StandardizedCoefficients
a Dependent Variable: doanh số bán (tr.đ)
Cột sig (dòng chi phí quảng cáo)
Vì giá trị cột sig= 0.001 < α=0.05 suy ra có cơ sở bác bỏ H0 và khẳng định rằng hệ số ^β 1khác 0 và cho ta thấy
chi phí quảng cáo có ảnh hưởng đáng kể đến doanh số bán hàng
7,viết pt của mô hính hồi quy
Căn cứ vào bảng:
Coefficients a
Model
UnstandardizedCoefficients
StandardizedCoefficients
Trang 15Căn cứ vào cột B của bảng : hệ số hồi quy chưa được chuẩn hóa :
Phần 2: kiểm định chi bình phương ( chi-quare)
-Câu lệnh: Analyze/ Descriptive Statistics/ Crosstabs
Cửa sổ:
:
Trang 16> Cửa sổ crosstabs gắp biến Gioi Tinh vào Row(s) , Thoi quen hut thuoc vào Column(s); tích chọn Display clustered bar charts; Nhấn Statistics và chọn Chi-square -> continue -> OK
Kết quả:
Case Processing Summary
Cases
đô tuổi * mức đô quan
Trang 1712 cells (100.0%) have expected count less than 5 The minimum expected count is 1.25.
n: Kết Kết Kết luận: Sig = 0.156> α= 0,05 , value : 9.333 , df : 6
Suy ra: Với mức độ tin cậy là 95% nên có bằng chứng cho thấy hai biếnnày độc lập với nhau Do đó kết luận giữa độ tuổi và mức độ quan tâm đến chủ đề gia đình trên báo Sài Gòn tiếp thị không có mối quan hệ với nhau
Bài 6
Phần 1 nhập dữ liệu
Trang 18Phần 2: Phân tích phương sai :
Câu lệnh:Analyze/ general Linier Modle/ univariate / cửa sổ:
Tùy chọn options: Nhấn vào
Chọn Descriptive Statistics,và Estimates of effect size và Homogeneity tests
Tùy chọn Post Hoc
• Từ danh sách Factors bên trái, chọn biến “thoigiantuhoc” và “ngheyeuthich” và đưa vào ô bên phải Post Hoc Tests
Trang 20Tests the null hypothesis that the error
variance of the dependent variable is equal
Tests of Between-Subjects Effects
Dependent Variable: điểm trung bình HT
Source
Type III Sum
Partial EtaSquared
a R Squared = 966 (Adjusted R Squared = 952)
Chúng ta nhìn vào dòng ngheyeuthich*thoigiantuhoc với giá trị kiểm định sig= 0.05 =α = 0.05 do đó ảnh
hưởng tương tác là có , điều đó chỉ ra rằng không có sự khác biệt trong ảnh hưởng của thời gian tư học và yêu thích ngành nghề lên sự điểm trung bình HT
Vì cột sig = 0.002 (ngheyeuthich) và sig = 0.00 (thoigiantuhoc) > α=0.05 suy ra 2 yếu tố yêu thích ngành nghề
và thời gian tự học đều ảnh hưởng tương đương đau đến điểm trung bình HT
Suy ra mối quan hệ giữa điểm trung bình HT của sv liên quan đến mức độ yêu thích và thời gian tự học của sinhviên không có sự khác nhau nhiều
Bài 7
Phần 1: nhập dữ liệu:
Trang 21Phần 2: vẽ đồ thị hình lá và biểu đồ hình hộp:
1, đồ thị hình lá:
câu lệnh : Analyze/ Descriptive/ Explore/ cửa sổ
Tùy chọn Plots:
trong ô Descriptive ta chọn Stem-and-leaf
trong ô Boxplot ta có thể chọn Dependents Together
kết quả:
Case Processing Summary
ngành hoc
Cases
Descriptives
Trang 22ngành hoc Statistic
Std.Errortuổi kế toán, kiểm
toán
95% Confidence Interval for Mean
Trang 23Từ đó ta thấy: sinh viên học nhiều nhất từ khoảng 26 đến 32 tuổi
Sinh viên học ngành quản trị kinh doanh có độ tuổi tập chung chủ yếu từ 26 đến 37 Và ngành này có độ tuổi trung bình của sinh viên là 30.9 tuôi
Sinh viên học ngành kế toán, kiểm toán có độ tuổi chủ yếu từ 22 đến 31
Độ tuổi trung bình của sinh viên ngành này là 26,93
Suy ra ta thấy ngành kế toán kiểm tuổi của sinh viên tham gia học thấp hơn ngành quản trị kinh doanh
Trang 24Paired Samples Correlations
N Correlation Sig
Trang 25Pair 1 thunhapnam &
(2-Std
Deviation
Std
ErrorMean
95% ConfidenceInterval of theDifferenceLower UpperPair
Trang 26giới tính * thói quen hút
giới tính * thói quen hút thuốc Crosstabulation
thói quen hút thuốc
Totalkhông hút hút
Expected Count
Trang 27Exact Sig sided)
(2-Exact Sig sided)
a 2 cells (50.0%) have expected count less than 5 The minimum expected count is 2.80
b Computed only for a 2x2 table
Trang 28Ta thấy: : giá trị chi square là 9.377, giá trị bậc tự do df là 1, giá trị sig là 0.04 < α= 0.05 loại bỏ H0 Chấp nhậnH1.suy ra ta có bằng chứng cho thấy giới tính và thói quen hút thuốc có quan hệ với nhau Và giữa giới tính nam có tỉ lệ hút thuốc nhiều hơn giới tính nữ.
Trang 291 khu vực, chi
phí quảng cáo
(tr.đ)b
Enter
a Dependent Variable: doanh số (tr.đ)
b All requested variables entered
Model Summary
Adjusted RSquare
Std Error ofthe Estimate
a Dependent Variable: doanh số (tr.đ)
b Predictors: (Constant), khu vực, chi phí quảng cáo (tr.đ)
Coefficients a
Model
UnstandardizedCoefficients
StandardizedCoefficients
a Dependent Variable: doanh số (tr.đ)
Căn cứ vào cột Sig(ANOVA) =0,00 < α= 0.05 suy ra ta có cơ sở bác bỏ H0 chấp nhận H1
Suy ra ^β1 khác 0 nên mô hình luôn tồn tại
Trang 30Thay số liệu vào phương trình ta có:
y=179.017+4.388 x1+256.436 x2
Cả hai nhân tố chi phí quảng cáo và khu vực đều ảnh hưởng đến doanh số bán hàng
Vì giá trị cột Sig(coeficents) = 0.027< α= 0.05 suy ra ta có sơ sở để bác bỏ Ho chấp nhận H1
Ta có cơ sở để khẳng định có ít nhất 1 ^β j khác 0 và cho thấy chi phí quảng cáo và khu vực có ảnh hưởng đến doanh số bán hàng
Trong trường hợp các nhân tố khác koong đổi chi phí quảng cáo tăng lên 1 triệu thì doanh thu tăng lên 4,388 trieeujvaf ngược lại
Trong trường hợp các nhân tố khác k đổi, khu vực chuyển từ thành thị về nông thôn doanh thu sẽ giảm 256.436 triệu và ngược lại
Căn cứ vào kết quả y,dự báo x1=25triệu( khu vực nông thôn.)
x1=65 triệu (khu vực thành thị)Suy ra: doanh thu khu vực nông thôn =288.717 triệu
Doanh thu khu vực thành thị: 720.673 triệu
Bài 11
Nhập dữ liệu:
Phần 1: xây dựng mô hình hồi qui bội thể hiện tương quan của các biến:
Câu lệnh : Analyze > Regression > Linear
Cửa sổ:
Trang 31a Dependent Variable: số máy (cylander)
b All requested variables entered
Trang 32Model Summary b
Adjusted RSquare
Std Error ofthe Estimate
Watson
a Predictors: (Constant), dung tích động cơ (lít), mức tiêu thụ xăng
(km/lít), công suất động cơ (HP), trọng lượng xe (kg)
b Dependent Variable: số máy (cylander)
5 biến độc lập đưa vào ảnh hưởng 89.1% sự thay đổi của biến phụ thuộc, còn lại 10.9% là do các biến ngoài
mô hình và sai số ngẫu nhiên.
a Dependent Variable: số máy (cylander)
b Predictors: (Constant), dung tích động cơ (lít), mức tiêu thụ xăng (km/lít), công
suất động cơ (HP), trọng lượng xe (kg)
giá trị sig (ANOVA) là 0.000 < α=0.05 Như vậy, mô hình hồi quy tuyến tính xây dựng được phù hợp với tổng thể.
Coefficients a
Model
UnstandardizedCoefficients
StandardizedCoefficients
CollinearityStatistics
Trang 33dung tích động cơ
a Dependent Variable: số máy (cylander)
Phần 2 Dự báo mức tiêu thụ xăng
Bài 12
Nhập dữ liệu:
Kiểm định One sample T-test:
Giả thuyết H0: là điểm trung bình học tập
Trang 34Câu lệnh : Analyze/ compare means/ one sample T-test
95% Confidence Interval ofthe Difference
Với H0=8 với mức độ tin cậy 95% chúng ta có thể khẳng định điểm thực trung bình của học sinh thấp hơn đáng
kể so với điểm dự báo
Với H0 =7 điểm thực thấp hơn điểm dự báo không đáng kể
Trang 36Intercept Pillai's Trace 999 6284.621b 2.000 17.000 000
Type III Sum
a R Squared = 769 (Adjusted R Squared = 756)
b R Squared = 274 (Adjusted R Squared = 234)
Từ đó cho ta thấy:tuổi trung bình của học sinh ở vùng 1(thành thị) 119.2 tháng Thấp hơn tuổi của học sinh vùng khu vực 2( nông thôn) 137.0 tháng
Mà chiều cao trung bình của học sinh ở khu vực 1(146.790 cm) cao hơn chiều cao cảu học sinh ở khu vực 2(136.590 cm)
Suy ra ta thấy ở khu vưc nông thôn(2) học sinh thường có số tháng tuổi nhiều hơn nhưng chiều cao lại thấp hơn học sinh ở khu vực thành thị(1)
Trang 37Bài 14:nhập dữ liệu
Câu lệnh: Analyze/ Scale/ Reliability Analysis / cửa sổ:
Tùy chọn Statistic chọn Vtem, scale , scale if item deleted.Kết quả:
Trang 38Item-Total Statistics
Scale Mean ifItem Deleted
ScaleVariance ifItem Deleted
CorrectedItem-TotalCorrelation
Cronbach'sAlpha if ItemDeleted
a The value is negative due to a negative average covariance among items This
violates reliability model assumptions You may want to check item codings
Scale Statistics
Mean Variance Std Deviation N of Items
Dựa vào bảng Item-Total Statistics cột Corrected Item-Total Correlation
Muốn đảm bảo chất lượng thang đo của các biến, giá trị quan sát cột Corrected Item-Total Correlation phải lớn hơn 0,3 Suy ra loại biến HADN2
Hệ số Anpha để đảm bảo chất lượng thang đo phải lớn hơn 0,6 x=0.829>0.6
Suy ra chỉ có 3 biến quan sát HADN1, HADN2, HADN3 là đảm bảo chất lượng thang đo
Cá biến còn lại chạy tương tự
Các biến CTVG1,CTVG2,CTVG3 và MDHL1,MDHL2 là đảm bảo chất lượng thang do
Phân tích nhân tố khám phá:
Câu lệnh: analyze/ dimension Reduction / Facto
Tùy chọn: Descriptivers : chọn cofficients, KMO and barlett’s
Tuy chọn Extration chọn Screeplot,
Trang 39Tuy chọn Rotation chọn Varimax
Tuy chọn Scores chọn Save as variable, display…
Tuy chọn options chọn Sorte by size, suppress small
Trong tùy điền 0,75 vào ô.( absolute value belovo)
Kết quả:
Correlation Matrix
giữ chữtín
marketinghiệu quả
chiến lượcphát triển
lãi suấtcạnh tranh
chi phíhợp lý
giá trị linhhoạtCorrelati
KMO and Bartlett's Test
Kaiser-Meyer-Olkin Measure of Sampling
giá trị linh hoạt 1.000 785
Extraction Method: Principal Component
Analysis
Trang 40Rotated Component Matrix a
Extraction Method: Principal Component
Analysis
Rotation Method: Varimax with Kaiser
Normalization
a Rotation converged in 3 iterations
Dựa vào bảng Rotated Component Matrix loại bỏ những biến không có hệ số hoặc có hệ số từ 2 cột trở lên( loại bỏ biến HADN1, và CTVG1)
Chạy lại mô hình khám phá:
Kết quả ta nhận được thêm biến mới
Trang 41Mô hình hồi quy :
FAC1_2 = ^β0 + ^β1* FAC1_1 + ^β2 * FAC2_1 HL=^β0 + ^β1*HADN + ^β2 * CTVG
Chạy mô hình hồi quy:
Câu lệnh :Analyze /Regression/linea / cửa sổ
Trang 42Std Error ofthe Estimate
a Predictors: (Constant), REGR factor score 2 for
analysis 1, REGR factor score 1 for analysis 1
a Dependent Variable: REGR factor score 1 for analysis 2
b Predictors: (Constant), REGR factor score 2 for analysis 1, REGR factor
score 1 for analysis 1
Coefficients a
Model
UnstandardizedCoefficients
StandardizedCoefficients
Trang 43REGR factor score 1