1. Trang chủ
  2. » Giáo Dục - Đào Tạo

BÀI THỰC HÀNH TIN học ỨNG DỤNG SPSS

43 901 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 43
Dung lượng 1,41 MB

Nội dung

hướng dẫn các bước làm cơ bản về phân tích spss cho sinh viên đại học và người đang học spss, các dạng bài spss cơ bản và thường dùng. về các nhập dữ liệu,. sử lý số liệu, chạy chương trình, và đọc kết quả

Trang 1

Phần 2: xác định tuổi bình quân của người hút thuốc:

Câu lệnh: Analyze/ Despcriptive Statistics/ Descriptives

> Cửa sổ Descriptives chọn biến Tuoi vào Variable(s) / OK

Trang 2

Câu lệnh: Analyze/ Custom Tables/ Custom tables-> Cửa sổ

Cửa sổ Custom Tables gắp các biến Tuoi vào cột Columns, Thoi quen hut thuoc và Gioi tinh vào cột Rows/ Nhấn Categories and total-> tích vào Total và Label nhập: “ Bình quân”-> apply ; Nhấn Summary Statistics Chọn Maximum, Minimum, Std.Deviation đưa sang cột Display -> Apply to Selection/ OK

Kết quả:

Custom Tables

Table 1

TuổiMean Maximum Minimum Standard

DeviationThói quen hút

3 Có sự khác biệt đáng kể về tuổi theo giới tính và thói quen hút thuốc hay không?

-Câu lệnh: Analyze/ Descriptive Statistics/ Crosstabs

Trang 3

> Cửa sổ crosstabs gắp biến Gioi Tinh vào Row(s) , Thoi quen hut thuoc vào Column(s); tích chọn Display clustered bar charts; Nhấn Statistics và chọn Chi-square -> continue -> OK

Crosstabs

Case Processing Summary

Cases

Trang 6

Phần 3: Tính các giá trị trung bình của mẫu về mức tiêu thụ xăng? Câu lệnh: Analyze/ Descriptive Statistics / Descriptive

Đưa biến mức tiêu thụ xăng[xangtieuthu] sang Variable(s) / OK Kết quả

Descriptives

Descriptive Statistics

Trang 7

N Minimum Maximum Mean Std.

Câu lệnh: Analyze/ Custom Tables/ Custom Tables

> Gắp biến mức tiêu thụ xăng[xangtieuthu] vào cột Columns; Biến loai xe vào cột Rows; Nhấn Categories and Total -> tích vào Total và Label nhập: “ Bình quân”-> apply / OK

Kết quả:

Custom Tables

Table 1

mức tiêuthụ xăng

Trang 8

H1 , H2 , H3 là mức tiêu thụ xăng tương ứng với 3 loại xe A , B , C

Công thức Analyze / compare means/ one way anova => cửa sổ

Maximum

LowerBound

UpperBound

Trang 9

e (I-J)

Std

Error Sig

95% ConfidenceIntervalLowerBound

UpperBound

xe A xe B -2.3000* 4450 000 -3.235 -1.365

xe C -1.9429* 4450 000 -2.878 -1.008

xe B xe A 2.3000* 4450 000 1.365 3.235

Trang 10

xe C 3571 4450 433 -.578 1.292

xe C xe A 1.9429* 4450 000 1.008 2.878

xe B -.3571 4450 433 -1.292 578

sánh mức tiêu thụ xăng của các loại xe :

Loại xe A có mức tiêu thụ xăng BQ thấp hơn đáng kể so với xe B và CMức tiêu thụ xăng của xe B và C không có khác biệt đáng kể

Trang 12

Mức thu nhập của khối hộ gia đình thái độ du lịch của nhóm hộ 1 có sự thấp hơn đáng kể so với nhóm hộ gia đình 3 và 4.

Đồng thời nhóm hộ 2 có sự thấp hơn đáng kể so với mức 4

Chi phí quảng cáo

Câu lệnh: Graphs/ legacy dialogs/ histogram

2, viết phương trình hồi quy

Trang 13

Pt1: Y = ^β0+ ^β1+ X

Trong đó X là chi phí quảng cáo

Y là doanh số bán hàng

3, chạy phương trình hồi quy:

Câu lệnh : Analyze/ regression / linear Cửa sổ

4, kiểm định sự tồn tại của mô hình

Muốn mô hình tồn tại ta có giả thuyết

a Dependent Variable: doanh số bán (tr.đ)

b Predictors: (Constant), chi phí quảng cáo (tr.đ)

Sig Anova= 0.001 < ∝ =0.05 ta có thể bác bỏ H0 ta chấp nhận H1 suy ra ^β 1 khác 0 suy ra mô hình luôn tồn tại.

Trang 14

5, kiểm định sự phù hợp của mô hình

Model Summary

Adjusted RSquare

Std Error ofthe Estimate

Suy ra mô hình tương đối phù hợp

6,kiểm tra sự tồn tại của các hệ số hồi quy:

Căn cứ vào bảng:

Coefficients a

Model

UnstandardizedCoefficients

StandardizedCoefficients

a Dependent Variable: doanh số bán (tr.đ)

Cột sig (dòng chi phí quảng cáo)

Vì giá trị cột sig= 0.001 < α=0.05 suy ra có cơ sở bác bỏ H0 và khẳng định rằng hệ số ^β 1khác 0 và cho ta thấy

chi phí quảng cáo có ảnh hưởng đáng kể đến doanh số bán hàng

7,viết pt của mô hính hồi quy

Căn cứ vào bảng:

Coefficients a

Model

UnstandardizedCoefficients

StandardizedCoefficients

Trang 15

Căn cứ vào cột B của bảng : hệ số hồi quy chưa được chuẩn hóa :

Phần 2: kiểm định chi bình phương ( chi-quare)

-Câu lệnh: Analyze/ Descriptive Statistics/ Crosstabs

Cửa sổ:

:

Trang 16

> Cửa sổ crosstabs gắp biến Gioi Tinh vào Row(s) , Thoi quen hut thuoc vào Column(s); tích chọn Display clustered bar charts; Nhấn Statistics và chọn Chi-square -> continue -> OK

Kết quả:

Case Processing Summary

Cases

đô tuổi * mức đô quan

Trang 17

12 cells (100.0%) have expected count less than 5 The minimum expected count is 1.25.

n: Kết Kết Kết luận: Sig = 0.156> α= 0,05 , value : 9.333 , df : 6

Suy ra: Với mức độ tin cậy là 95% nên có bằng chứng cho thấy hai biếnnày độc lập với nhau Do đó kết luận giữa độ tuổi và mức độ quan tâm đến chủ đề gia đình trên báo Sài Gòn tiếp thị không có mối quan hệ với nhau

Bài 6

Phần 1 nhập dữ liệu

Trang 18

Phần 2: Phân tích phương sai :

Câu lệnh:Analyze/ general Linier Modle/ univariate / cửa sổ:

Tùy chọn options: Nhấn vào

Chọn Descriptive Statistics,và Estimates of effect size và Homogeneity tests

Tùy chọn Post Hoc

• Từ danh sách Factors bên trái, chọn biến “thoigiantuhoc” và “ngheyeuthich” và đưa vào ô bên phải Post Hoc Tests

Trang 20

Tests the null hypothesis that the error

variance of the dependent variable is equal

Tests of Between-Subjects Effects

Dependent Variable: điểm trung bình HT

Source

Type III Sum

Partial EtaSquared

a R Squared = 966 (Adjusted R Squared = 952)

Chúng ta nhìn vào dòng ngheyeuthich*thoigiantuhoc với giá trị kiểm định sig= 0.05 =α = 0.05 do đó ảnh

hưởng tương tác là có , điều đó chỉ ra rằng không có sự khác biệt trong ảnh hưởng của thời gian tư học và yêu thích ngành nghề lên sự điểm trung bình HT

Vì cột sig = 0.002 (ngheyeuthich) và sig = 0.00 (thoigiantuhoc) > α=0.05 suy ra 2 yếu tố yêu thích ngành nghề

và thời gian tự học đều ảnh hưởng tương đương đau đến điểm trung bình HT

Suy ra mối quan hệ giữa điểm trung bình HT của sv liên quan đến mức độ yêu thích và thời gian tự học của sinhviên không có sự khác nhau nhiều

Bài 7

Phần 1: nhập dữ liệu:

Trang 21

Phần 2: vẽ đồ thị hình lá và biểu đồ hình hộp:

1, đồ thị hình lá:

câu lệnh : Analyze/ Descriptive/ Explore/ cửa sổ

Tùy chọn Plots:

trong ô Descriptive ta chọn Stem-and-leaf

trong ô Boxplot ta có thể chọn Dependents Together

kết quả:

Case Processing Summary

ngành hoc

Cases

Descriptives

Trang 22

ngành hoc Statistic

Std.Errortuổi kế toán, kiểm

toán

95% Confidence Interval for Mean

Trang 23

Từ đó ta thấy: sinh viên học nhiều nhất từ khoảng 26 đến 32 tuổi

Sinh viên học ngành quản trị kinh doanh có độ tuổi tập chung chủ yếu từ 26 đến 37 Và ngành này có độ tuổi trung bình của sinh viên là 30.9 tuôi

Sinh viên học ngành kế toán, kiểm toán có độ tuổi chủ yếu từ 22 đến 31

Độ tuổi trung bình của sinh viên ngành này là 26,93

Suy ra ta thấy ngành kế toán kiểm tuổi của sinh viên tham gia học thấp hơn ngành quản trị kinh doanh

Trang 24

Paired Samples Correlations

N Correlation Sig

Trang 25

Pair 1 thunhapnam &

(2-Std

Deviation

Std

ErrorMean

95% ConfidenceInterval of theDifferenceLower UpperPair

Trang 26

giới tính * thói quen hút

giới tính * thói quen hút thuốc Crosstabulation

thói quen hút thuốc

Totalkhông hút hút

Expected Count

Trang 27

Exact Sig sided)

(2-Exact Sig sided)

a 2 cells (50.0%) have expected count less than 5 The minimum expected count is 2.80

b Computed only for a 2x2 table

Trang 28

Ta thấy: : giá trị chi square là 9.377, giá trị bậc tự do df là 1, giá trị sig là 0.04 < α= 0.05 loại bỏ H0 Chấp nhậnH1.suy ra ta có bằng chứng cho thấy giới tính và thói quen hút thuốc có quan hệ với nhau Và giữa giới tính nam có tỉ lệ hút thuốc nhiều hơn giới tính nữ.

Trang 29

1 khu vực, chi

phí quảng cáo

(tr.đ)b

Enter

a Dependent Variable: doanh số (tr.đ)

b All requested variables entered

Model Summary

Adjusted RSquare

Std Error ofthe Estimate

a Dependent Variable: doanh số (tr.đ)

b Predictors: (Constant), khu vực, chi phí quảng cáo (tr.đ)

Coefficients a

Model

UnstandardizedCoefficients

StandardizedCoefficients

a Dependent Variable: doanh số (tr.đ)

Căn cứ vào cột Sig(ANOVA) =0,00 < α= 0.05 suy ra ta có cơ sở bác bỏ H0 chấp nhận H1

Suy ra ^β1 khác 0 nên mô hình luôn tồn tại

Trang 30

Thay số liệu vào phương trình ta có:

y=179.017+4.388 x1+256.436 x2

Cả hai nhân tố chi phí quảng cáo và khu vực đều ảnh hưởng đến doanh số bán hàng

Vì giá trị cột Sig(coeficents) = 0.027< α= 0.05 suy ra ta có sơ sở để bác bỏ Ho chấp nhận H1

Ta có cơ sở để khẳng định có ít nhất 1 ^β j khác 0 và cho thấy chi phí quảng cáo và khu vực có ảnh hưởng đến doanh số bán hàng

Trong trường hợp các nhân tố khác koong đổi chi phí quảng cáo tăng lên 1 triệu thì doanh thu tăng lên 4,388 trieeujvaf ngược lại

Trong trường hợp các nhân tố khác k đổi, khu vực chuyển từ thành thị về nông thôn doanh thu sẽ giảm 256.436 triệu và ngược lại

Căn cứ vào kết quả y,dự báo x1=25triệu( khu vực nông thôn.)

x1=65 triệu (khu vực thành thị)Suy ra: doanh thu khu vực nông thôn =288.717 triệu

Doanh thu khu vực thành thị: 720.673 triệu

Bài 11

Nhập dữ liệu:

Phần 1: xây dựng mô hình hồi qui bội thể hiện tương quan của các biến:

Câu lệnh : Analyze > Regression > Linear

Cửa sổ:

Trang 31

a Dependent Variable: số máy (cylander)

b All requested variables entered

Trang 32

Model Summary b

Adjusted RSquare

Std Error ofthe Estimate

Watson

a Predictors: (Constant), dung tích động cơ (lít), mức tiêu thụ xăng

(km/lít), công suất động cơ (HP), trọng lượng xe (kg)

b Dependent Variable: số máy (cylander)

5 biến độc lập đưa vào ảnh hưởng 89.1% sự thay đổi của biến phụ thuộc, còn lại 10.9% là do các biến ngoài

mô hình và sai số ngẫu nhiên.

a Dependent Variable: số máy (cylander)

b Predictors: (Constant), dung tích động cơ (lít), mức tiêu thụ xăng (km/lít), công

suất động cơ (HP), trọng lượng xe (kg)

giá trị sig (ANOVA) là 0.000 < α=0.05 Như vậy, mô hình hồi quy tuyến tính xây dựng được phù hợp với tổng thể.

Coefficients a

Model

UnstandardizedCoefficients

StandardizedCoefficients

CollinearityStatistics

Trang 33

dung tích động cơ

a Dependent Variable: số máy (cylander)

Phần 2 Dự báo mức tiêu thụ xăng

Bài 12

Nhập dữ liệu:

Kiểm định One sample T-test:

Giả thuyết H0: là điểm trung bình học tập

Trang 34

Câu lệnh : Analyze/ compare means/ one sample T-test

95% Confidence Interval ofthe Difference

Với H0=8 với mức độ tin cậy 95% chúng ta có thể khẳng định điểm thực trung bình của học sinh thấp hơn đáng

kể so với điểm dự báo

Với H0 =7 điểm thực thấp hơn điểm dự báo không đáng kể

Trang 36

Intercept Pillai's Trace 999 6284.621b 2.000 17.000 000

Type III Sum

a R Squared = 769 (Adjusted R Squared = 756)

b R Squared = 274 (Adjusted R Squared = 234)

Từ đó cho ta thấy:tuổi trung bình của học sinh ở vùng 1(thành thị) 119.2 tháng Thấp hơn tuổi của học sinh vùng khu vực 2( nông thôn) 137.0 tháng

Mà chiều cao trung bình của học sinh ở khu vực 1(146.790 cm) cao hơn chiều cao cảu học sinh ở khu vực 2(136.590 cm)

Suy ra ta thấy ở khu vưc nông thôn(2) học sinh thường có số tháng tuổi nhiều hơn nhưng chiều cao lại thấp hơn học sinh ở khu vực thành thị(1)

Trang 37

Bài 14:nhập dữ liệu

Câu lệnh: Analyze/ Scale/ Reliability Analysis / cửa sổ:

Tùy chọn Statistic chọn Vtem, scale , scale if item deleted.Kết quả:

Trang 38

Item-Total Statistics

Scale Mean ifItem Deleted

ScaleVariance ifItem Deleted

CorrectedItem-TotalCorrelation

Cronbach'sAlpha if ItemDeleted

a The value is negative due to a negative average covariance among items This

violates reliability model assumptions You may want to check item codings

Scale Statistics

Mean Variance Std Deviation N of Items

Dựa vào bảng Item-Total Statistics cột Corrected Item-Total Correlation

Muốn đảm bảo chất lượng thang đo của các biến, giá trị quan sát cột Corrected Item-Total Correlation phải lớn hơn 0,3 Suy ra loại biến HADN2

Hệ số Anpha để đảm bảo chất lượng thang đo phải lớn hơn 0,6 x=0.829>0.6

Suy ra chỉ có 3 biến quan sát HADN1, HADN2, HADN3 là đảm bảo chất lượng thang đo

Cá biến còn lại chạy tương tự

Các biến CTVG1,CTVG2,CTVG3 và MDHL1,MDHL2 là đảm bảo chất lượng thang do

Phân tích nhân tố khám phá:

Câu lệnh: analyze/ dimension Reduction / Facto

Tùy chọn: Descriptivers : chọn cofficients, KMO and barlett’s

Tuy chọn Extration chọn Screeplot,

Trang 39

Tuy chọn Rotation chọn Varimax

Tuy chọn Scores chọn Save as variable, display…

Tuy chọn options chọn Sorte by size, suppress small

Trong tùy điền 0,75 vào ô.( absolute value belovo)

Kết quả:

Correlation Matrix

giữ chữtín

marketinghiệu quả

chiến lượcphát triển

lãi suấtcạnh tranh

chi phíhợp lý

giá trị linhhoạtCorrelati

KMO and Bartlett's Test

Kaiser-Meyer-Olkin Measure of Sampling

giá trị linh hoạt 1.000 785

Extraction Method: Principal Component

Analysis

Trang 40

Rotated Component Matrix a

Extraction Method: Principal Component

Analysis

Rotation Method: Varimax with Kaiser

Normalization

a Rotation converged in 3 iterations

Dựa vào bảng Rotated Component Matrix loại bỏ những biến không có hệ số hoặc có hệ số từ 2 cột trở lên( loại bỏ biến HADN1, và CTVG1)

Chạy lại mô hình khám phá:

Kết quả ta nhận được thêm biến mới

Trang 41

Mô hình hồi quy :

FAC1_2 = ^β0 + ^β1* FAC1_1 + ^β2 * FAC2_1 HL=^β0 + ^β1*HADN + ^β2 * CTVG

Chạy mô hình hồi quy:

Câu lệnh :Analyze /Regression/linea / cửa sổ

Trang 42

Std Error ofthe Estimate

a Predictors: (Constant), REGR factor score 2 for

analysis 1, REGR factor score 1 for analysis 1

a Dependent Variable: REGR factor score 1 for analysis 2

b Predictors: (Constant), REGR factor score 2 for analysis 1, REGR factor

score 1 for analysis 1

Coefficients a

Model

UnstandardizedCoefficients

StandardizedCoefficients

Trang 43

REGR factor score 1

Ngày đăng: 24/11/2018, 03:57

TỪ KHÓA LIÊN QUAN

w