Nghiên cứu sơ bộ Nghiên cứu định tính ® Nghiên cứu chính thức Nghiên cứu định lượng 1.4 Cửa số làm việc của SPSS Từ Start Menu chọn ->Programs rồi chọn -> SPSS for Windows 21.0, mản hìn
Trang 1OF HOCHIMINH CITY BỘ CÔNG THƯƠNG
TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP TP HỎ CHÍ MINH
KHOA QUẢN TRỊ KINH DOANH
Trang 2CHUONG 1 2
GIOI THIEU VE CO SO DU LIEU, PHAN LOAI DU LIEU, MA HOA VA
Trang 3
CHUONG 1
GIOI THIEU VE CO SO DU LIEU, PHAN LOAI DU LIEU, MA
HOA VA NHAP LIEU 1.1 Phân loại dữ liệu
Dữ liệu nghiên cứu có thể phân thành hai loại chính là dữ liệu định tính và dữ liệu đỉnh lượng
Cac dữ liệu này được thu thập băng 4 thang đo co ban theo so do sau:
Thang do Khoang cach
Thang do Tilé
Khác nhau cơ bản giữa dữ liệu định tính và dữ liệu định lượng:
" Dữ liệu định lượng: phản ảnh mức độ, mức độ hơn kém, tính được trị trung bình
1.2 Các loại thang đo
1.2.1 Thang do danh nghia (thang do phan logi) - Nominal scale:
Các con số chỉ đùng đề phân loại các đối tượng, chúng không mang ý nghĩa nào khác
Trang 41.2.2 Thang đo thứ bậc - Ordinal scale:
Các con số được dùng đề ghi thứ bậc (sự hơn kém)
Ví dụ:
Hãy xếp hạng các chủ đề sau đây trên flyer tùy theo mưc độ quan tâm của Anh/chư/ông/bà ‹ đối
với từng loại chủ đề? (chủ đề nào quan tâm nhất thì ghi số I, quan tâm thứ nhì thì ghi số 2,
quan tâm thứ ba thì ghi sô 3)
® Mua sam
1.2.3 Thang do khoang - Interval scale:
La thang đo thứ bậc và cho biết được khoảng cách giữa các thứ bậc Thông thường thang đo
khoảng cách có dạng là một dãy các chữ số liên tục và đều đặn từ 1 đến 5, từ 1 đến 7 hay từ I
đến 10 Dãy số này có 2 cực ở hai đầu thé hign 2 trang thái đối nghịch nhau Vi du: như 1là
rât ghét, 5 là rât thích, I là không đông ý, 5 là rất đông ý, l là rât không hai long, 5 la rat hai
lòng
1.2.4 Thang do ti lé - Ratio scale:
Thang đo khoảng cách cho phép tính tỉ lệ đê so anh, thang đo tỉ lệ thu thập đữ liệu là số thực,
như trọng lượng, chiều cao, cân nặng, doanh thu, chi phi
Vi dụ:
Nếu gia đình Anh/chị/ông/bà có thường di xem phim tai cum rap Mega Start, thì số lượng
người thông thường đi xem phim trong gia đình trung bình là bao nhiêu người (kê cả
Anh/chị/ông/bà)? Trong đó số người thường xuyên xem phim là bao nhiêu người?
Trang 51.3 Quy trình thực hiện nghiên cứu
Thang do chính thức
—_ Loại các biến không thỏa tiêu chí kiểm định
hệ số Cronbachs Alpha, loại n biến chạy lại kiểm dinh Cronbach’s Alpha n fan
— Kiểm tra hệ số Cronbach”s Alpha
Phân tích nhân tố khám phá —_ Loại các biến có trọng số EFA nhò
(EFA- Exploratory Factor + —* —_ Kiểm tra các yếu tố trích được
Analysis} —_ Kiểm tra phương sai trích được
— Kiểm định Cronbachs Alpha cho các biến quan sát trong các nhóm nhân tố tạo thành
—_ Loại các biến không thòa tiêu chí kiểm định
hệ số Cronbachs Alpha, loại n biến chạy lại kiểm dinh Cronbach’s Alpha n [an
—_ Kiểm tra hệ số Cronbach”s Alpha
Cronbach”s Alpha
Thang đo hoàn chỉnh
Phân tích hồi quy '——> ĐỀ Xuố, cácgiỏl pháp
và kiến nghị
Hình: Quy trình thực hiện nghiên cứu
® Nghiên cứu sơ bộ (Nghiên cứu định tính)
® Nghiên cứu chính thức (Nghiên cứu định lượng)
1.4 Cửa số làm việc của SPSS
Từ Start Menu chọn ->Programs rồi chọn -> SPSS for Windows 21.0, mản hình đữ liệu
SPSS sẽ hiện ra như sau:
Trang 65_ = c2a2 | Numeric | INumeric 15 5 ' : Menu: Chứa lệnh xử lý và các lệnh phân tích “ ^ AT ^ a z '
10 c2a7 | _Numẹric_5 _ O DS Dror oye seg wns mem SI ISOS SITIES ST Te rovercococorerssc,
11 c2a8 A Ke on 2 “ ^ + 13 17A z ¬— ge
42 cao Cột: Môi cột trong bảng chứa một loại dữ liệu (Ví dụ: gidi tinh)
13 ®crr— Dòng: Mỗi dòng trong bảng chứa các đữ liệu của một đối tượng khảo sát
1 '
14 c2b2¡ =2œœbpe = 5= == =2C= == =2 1 '2G pacar, 2 cay pose 5 Sa Seman wk ' > — NƠIE TT” ĐT T—T—— =Txtữ<nr =Ð; ~~ ~~œnommai” °
czc1i 2 A ^ TA bi jone = Rig! iominal
17c Data View: Cửa S0 nhập liệu bi None 4 = Right & Nominal lel
IBM SPSS Statstcs Processor is ready
(ie we ve as et bei)
1.5 Tạo khuôn nhập liệu
1.5.1 Thay đổi một số mặc định của chương trình
Mở chương trình SPSS, từ file tập tin trắng chưa nhập liệu, vào Menu chọn: Edit Options,
hộp thoại Options xuât hiện:
® - Tại tab General chọn như hình sau:
> Display names: Hién nhan bién hay hién tén bién
> Unicode (universal character set): Bang ma Unicode gé tiéng việt
> File: chon thir ty xuat hiện của các biến trong hộp thoại lệnh xử lý
~> Measurement System: Thay đối đơn vị đo lường đề điều chỉnh định dạng
" —
Variable Lists:
© Display labels | No scientiic notation for small numbers in tables:
} Display names; [Apply locale’s digit grouping format to numeric values
@ File
To Save hme, some dialogs allow the use of predefined
‘field roles to automatically assign variables (Neids) to lists & Raise vewor window
© Scroll to new output
® Use predefined roles =
© Character Encoding for Data and Stax
| © Locale'’s writing system Windows: | © Unicode (universal character set)
Look and feel ÍgPS8landad + ‘Character encoding cannot be changed when any
non-empty datasets are open
| Open syntax window at startup
‘User Interface:
] Open only one dataset at a time `
( s )(emed) apsy L nep )
Trang 7
Transformation and Marge Options Sot Cantury Range for 2-Digit Years
@ Calculate values immediately @ Automatic
© Calculate values before used Beginyear 1945
End year: 2044
Display Format for New Numeric Variables © custom
Width: Fe} Decimal Places Đegin year 94
Randpm Number Generator \
N
o period Mersenng ‘ has
Sô lượng sô lẻ
£ Assigiing ¬ Measurement| của biên 1 1Ô
number for unig Ea RE
Ins do nat apply, variables that meet or exceed the cut-off number for unique
> Ấ , |) Measurement level Variables thal do Not will be assigned the nominal
BiueYetiowContrast BiueYeliowContrastatternate Boxed
Table Rendenng
© Aajust for labels only
@ Aajust for labels and cata for ali tables
> Boxed: Chon kiéu bang hién thị kết quả trong cửa sô Output
Các điều chỉnh này sẽ ảnh hưởng đến thuộc tính của tất cả các biến được tạo ra sau khi chỉnh
xong Options
Sau đó nhân nút Apply, rồi nhan nut OK
Khi nhắn nút Apply, chương trình có thê đưa ra một số lưu ý nói rằng các hiệu chỉnh nảy chỉ
có hiệu lực sau khi mở lại file hay khởi động lại chương trình SPSS
1.5.2 Tạo biến mới
Dé tao biên mới phải làm bên cửa số Variable View, có màn hình như sau:
Trang 8File Eat View Data Transform Analyze Direct Marketing Graphs Utilities Add-ons Window Help
SEiR et eH AEE BPR 4AOe %
Name Type Width | Decimals Label | Values Missing | Columns | Align | Measure
1 stt Numeric 5 0 số thứ tự None None 4 = Right # Scale
2 tp Numeric 5 0 Thành phố {1, Hà Nội) 9 4 = Right & Nominal
3 c1 Numeric 5 0 Đọc báo {1, Hầu như k None 4 = Right i Ordinal
4 c2a1 Numeric 5 0 Báo thường đọc trong 6 {1, HN mới} None 4 = Right & Nominal
5 c2a2 Numeric 5 0 {1, HN mới} None 4 = Right & Nominal
6 c2a3 Numeric 5 0 Báo thường đọc trong 6 {1, HN mới} None 4 = Right # Nominal
7 c2a4 Numeric 5 0 Báo thường đọc trong 6 {1, HN mới} None 4 = Right # Nominal
8 c2a5 Numeric 5 0 Bao thường đọc trong 6 {1, HN mới} None 4 = Right & Nominal
9 c2a6 Numeric 5 0 Đáo thường đọc trong 6 {1, HN mới} None 4 = Right # Nominal
10 c2a7 Numeric 5 0 Báo thường đọc trong 6 {1, HN mới} None 4 = Right # Nominal
11 c2a8 Numeric 5 0 Báo thường đọc trong 6 {1, HN mới} None 4 = Right & Nominal
12 c2a9 Numeric 5 0 Báo thường đọc trong 6 {1, HN mới} None 4 = Right & Nominal
13 c2b1 Numeric 5 0 Các tờ báo thích đọc n {1, HN mới} None 5 = Right # Nominal
14 c2b2 Numeric 5 0 Các tờ báo thích đọc n {1, HN mới} None 5 = Right & Nominal
15 c2b3 Numeric 5 0 Các tờ báo thích đọc n {1, HN mới} None 5 = Right & Nominal
16 c2c1 Numeric 5 0 Các tờ báo GÐ thường {1, HN mới} None 4 = Right # Nominal
17 c2c2 Numeric 5 0 Các tờ báo GĐ thường {1, HN mới} None 4 = Right & Nominal lel
IBM SPSS Statstcs Processor is ready ies Die
Name: gõ tên biến cần đặt (không có ký tự khoảng trắng, không có ký tự đặc biệt, phải bắt
đầu bằng một ký tự không được bắt đầu bằng một ký số)
Sau khi đặt tên biến, ta phải khai báo các thuộc tính cơ bản, muốn khai báo thuộc tính nào của
biên, hãy nhân chuột vào nút của thuộc tính đó Sau khi khai bảo xong một thuộc tinh bam
O Restricted Numeric (integer with leading zeros)
The Numeric type honors the digit grouping setting, while the Restricted Numeric never uses digit grouping
Khai báo loại biến kiêu số (Numeric) hay kiểu chudi (String), s6 lượng ký số/ ký tự tối đa
(Width) có thê nhập vào, số lượng số thap phan (Decimal Places)
Hai biến thường dùng ở hình trên là:
> Numeric: biến kiểu số
> String: bién kiéu chuỗi (chỉ dùng trong trường hợp cần nhập họ tên, địa chi người trả lời và các thông tin dưới dạng ký tự khác)
Label: Khai báo ý nghĩa của biến hay ý chính của câu hỏi
Value: Khai bao gia trị của biến, các nhãn giá trị cần thiết (nêu có)
Trang 93 = "Thường xuyên (tuần 3-7 tờ)"
— 4 = "Rất thường xuyên (trên 7 tờ/ tuần)”
Value: Mã nhập các thang đo định tính, phải bằng số
Label: Nhãn giải thích của mã nhập
Add: Khai bảo xong một mã giả trỊ
Changc: Thay đối mã giá trị
Vv Remove: X6a m gia tri
MI Missing: Khai bao cac gia trị khuyết (nêu cần) Trong SPSS cho phép khai báo được 3
giả trị khuyết trong hộp thoại Missing Values
Sau đây là hộp thoại khai báo giá trị khuyết, giúp phân loại thiếu số liệu cho từng loại nguyên
Ví dụ: Ta gặp tình huống với câu hỏi về trình độ học vấn có những người được điều tra vì lý
do tế nhị nào đó đã từ chối trả lời thì trong Value Label: ta quy ước giá trị 99 có nhãn là
“Không trả lời”, sau đó sang Missing Value: ta phải khai báo 99 là giá trị khuyết đê sau đó
khi tính toán các lệnh thống kê ví như tính tần số thì máy sẽ loại giá trị khuyết này ra khi tính
phân trăn hợp lệ
Trang 10© Discrete missing values
Hình trên cho biết, trong file Data thực hành các biên c29a1 đến c29e có khai bao Missing
Value là 8 hoặc 9 là số người không trả lời (không ý kiến)
M Columns: Khai bao độ rộng của cột biến khi ta nhập liệu trong cửa số Data, thường
chon là 8
M Align: Vi tri dir ligu duge nhập trong cột trong cửa sô Data, thường chọn là Right
™ Measure: Chọn loại thanh đo thể hiện dữ liệu: Ordinal (thang do thứ bậc), Norminal
(thang đo danh nghĩa) và Scale (gồm cả thanh đo khoảng cách và thanh đo tỉ lệ)
r
Luu y:
Chung ta vẫn có thê sử đụng lệnh Copy và Paste trong quá trình tạo biến mới Ví dụ như Tyle
(kiêu biến) hay Value (Mã hoá) Bấm tô hợp phím Ctrl + C rồi dùng trỏ chuột chọn vùng
muốn Copy thuộc tính tương ứng đến và nhấn tô hợp phím Ctrl + V
1.5.3 Lưu tập tin dữ liệu
Đề lưu lại tập tin dữ liệu chúng ta phải có khai báo biến trước thì chương trình mới cho lưu,
trong màn hình Data, từ Menu chọn File/ Save, hộp thoại sau sẽ xuât hiện:
Look in: |): Du tieu bai giang \ytnuyetsPssmoi > gq GJ EE f=
@ Phan tich biet so (moi)1.sav
Ñ Phan tịch biet so (moi}2.sav
Keeping 158 of 168 variables Vanables ]
Save as ype [SPSS Statstes (*.sav) x _ Pasle _ |
tee)
a Encrypt file with password
Trong hộp thoại này, chọn ỗ đĩa, thư mục, đặt tên tap tin (tên nên đặt không dau) và nhắn nút
Save Phân mở rộng tên tập tin dữ liệu SPSS là sav
Trang 111.5.4 Nhập liệu trong SPSS
1.5.4.1 Cách nhập trực tiếp vao SPSS
Sao khi khai báo tên biến trong cửa số Variable View đề nhập dữ liệu nghiên cứu vào SPSS,
click chuột vào biêu tượng Data View năm phía dưới màn hình của chương trình SPSS,
chương trình sẽ hiện ra cửa sô đê nhập đữ liệu trực tiếp vào chương trình như trong hình sau:
Fie Edn View Data Transform Anale CDirectMarceing Grapns LĐeS Addons Window Help
a8 5 w +x FEhSB HAR BPE #O% %
Mỗi dòng nhập liệu trong cửa số Data View là một quan sát (hay là một phiếu trả lời khảo sát
của một người), mỗi cột trong của số Data View là một biến (hay còn gọi là một câu hỏi)
Dữ liệu nhập vào cho từng biến chủ yếu là kiểu số (Numeric), vẫn có thé nhập vào đữ liệu
kiêu chuỗi nếu trong cửa số khai báo biến (Variable View) bạn có khai báo kiêu dữ liệu nhập
vào trong cột Tyle là String
Trong một biến quan sát nào đó nếu người khảo sát không trả lời thì phải nhập giá trị Missing
mà bạn đã khai báo ở cửa số khai báo biến (Variable View) Ngoài ra, đối với câu hỏi nhiều
trả lời thì không cần nhập giá trị Missing, chỉ nhập những giá trị mà người sát đã chọn còn các
giá trị không chọn ta đê trông
Đề hiển thị nhãn của giả trị mà bạn nhập liệu vào trong cửa số Data View, click nút Value
Labels trén Menu như trong hình sau:
Trang 121.5.4.2 Cach Insert dit liéu tir Excel
Trong chương trình SPSS có chức năng Insert dữ liệu từ những dữ liệu đã có trong một file
Excel, cách làm như sau:
Bước 1: Mở SPSS lên rồi vào Menu File -> Open -> Data như trong hình sau:
@ Read Cognos Data @ Script
Bước 2: Hộp thoại "Open Data" hiện lên các bạn chọn đến thư mục chứa file Excel Lưu ý là
mặc định SPSS sẽ chỉ hiện các file của SPSS (*.sav), muốn hiện file Excel thì các bạn chọn
Files of type la Excel (*.xls, *xIsx ) chon ding file excel can import dé load vao SPSS (nhu
hình minh họa)
J) Bai giang SPSS )) bai giang spss cua thay trong
.} Bai giang SPSS englIsh
a Bai giang Thay Ho _)) NUYEN VU VAN ANH
JD pinkk J) Tu tuong quan va tuong quan chuoi
Chi voi | thao tác đơn giản như trên nhưng sẽ giúp ích được cho các bạn rất nhiều vấn đề trở
ngại về nhập liệu với kích cỡ mẫu nhiều
- Mã hóa và nhập liệu trên Excel sẽ đơn giản hơn trong SPSS rất nhiều
- Bạn nên mã hóa và nhập vào excel chỉ bao gồm các con só, vd: nữ: 1; nam: 2, cũng như các
thang do Likert 5: 1,2,3,4,5 thi khi import vao SPSS sé ty khai báo biên cho bạn, tiết kiệm
thời gian và công sức cho bạn rât nhiêu
- Sau cùng bạn sẽ không phải lo gặp các vấn đề về font chữ, lỗi khai báo biến or số lượng biến
nhiều
Bước 3: Một hộp thoại hiện ra yêu cầu bạn muốn lấy tiêu đề của các cột trong Excel làm tên
biên trong SPSS, roi nhan OK Hinh minh họa như sau:
Trang 13
D:\Data\Trong quang\SPSS\Bai Giang\du lieu dua vao spss.xlsx
iv ¡Read variable names from the first row of data
Maximum width for string columns: 32767
Bước 4: Dữ liệu đã được Insert vào SPSS, tiếp tục mã hóa và khai báo cho một vài biến định
tính cân sử dụng Hình mình họa như sau:
File Edf View Da Transform Analyze DirectMarketing Graphs UHiỦes Add-ons Window Help
:i § r3 Ek#fl H f3 5áñm dò 5
| stt hon MMI giớHh họcực thunhập mứcđộhàiòng
1; 10 nguyễn văn A 20.0 nam khá 1.0 1.0
2 | 20nguyễnvănB 30.0 nt — trungbinh 2.0 2.0
4 4.0 nguyén van D 26.0nam —gidi 40 40
7 T.0 nguyễn văn G 23.0 nam kha 40 5.0
8 8.0 nguyén van H 35.0 nữ giỏi 20 40
_ 9 |, 90 nguyễn văn l 24.0 nam giỏi 3.0 3.0
_ 10 100nguyễn van J 28.0nam — giỏi 40 20
Câu hỏi ôn tập chương 1
Hãy thu thập đữ liệu dựa trên mô hình nghiên cứu của từng cả nhân
Trang 14Khoa Quatin Trd Kinh Doanh Phân tích dữ liệu trong kinh doanh
CHƯƠNG 2 LÀM SẠCH DỮ LIỆU 2.1 Lý do
Dữ liệu sau khi nhập xong chưa thê đưa ngay vào xử lý và phân tích vì con nhiều lỗi do:
se Chất lượng của phỏng vấn: phỏng vấn viên hiểu sai và thu thập sai, phỏng vấn viên ghi nhậm
® - Nhập liệu: sai, sót, thừa
2.2 Các biện pháp ngăn ngừa
* Chọn lọc và huấn luyện phỏng vấn viên kỹ lưỡng, điều tra phỏng vấn thử trước khi phỏng van that dé thong nhất tránh sai sót
© - Các bảng câu hỏi sau khi phỏng vấn phải được đọc soát kiêm lỗi, chỉnh sửa trước khi
® Nhược điểm: thủ công, phát hiện ít lỗi, chỉ phù hợp với các bảng câu hỏi đơn giản
2.3.2 Dùng bảng phối hợp hai biến hay ba biến
+ Lap bang 2 bién (Crosstabs hay Custom Tables) dựa vào các quan hệ hợp lý (logic)
đê phát hiện ra lỗi Ví du: nhu lập bảng kết hợp biến tuổi vả nghề nghiệp, phát hiện thay có trường hợp tuổi chỉ có 13 mà nghề nghiệp ghi là giáo viên
14
Trang 15Khoa Quatin Trd Kinh Doanh Phân tích dữ liệu trong kinh doanh
n Anahze Direct Marketing Graphs Utilities Add-ons V
Compare Means [EE Multiple Response Sets
+ Dùng lệnh Data-> Select case để lọc ra các trường hợp có lỗi Tiếp theo vi dụ trên, ta lọc ra trường hợp thoả điều kiện tuổi =13 và nghệ = giáo viên (ví dụ mã nghệ giáo viên là =2)
File Edit View = Transform Analyze Direct Marketing
@ & fy!) Asorcases
® - Ưu điêm: phát hiện được nhiều lỗi hơn, phù hợp với các bảng câu hỏi phức tạp
© Nhược điểm: phức tạp, cần nhiều thời gian, người thực hiện cần nhiều kinh nghiệm
Câu hỏi ôn tập chương 2
Hãy nhập liệu từ đữ liệu thu thập được của mỗi cá nhân để tạo thành database cho riêng minh
15
Trang 16Khoa Quatin Trd Kinh Doanh Phân tích dữ liệu trong kinh doanh
Bảng tần số có thê được thực hiện với tất cả các biến kiêu số (định tính và định lượng) Trong
trường hợp biên định lượng liên tục có quá nhiều giá trị, bảng tân sô sẽ rất dài, chúng ta có thê phân tô (băng lệnh Recode, sẽ được trỉnh bày trong phân sau) trước khi lập bảng tân sô
Sau khi mở file Data thuc hanh, vào Menu Analyze > Descriptive Statistics >
Frequencies Hộp thoại Frequencies xuât hiện:
3) c1 = 4 Models ' EA Reto bc bao {1, Hâu như
4 c2a1 Correlate » | MEP Riots o thường đọ {1, HN mới}
Trang 17Khoa Quatn Tré Kinh Doanh Phân tích dữ liệu trong kinh doanh
vào ô Variable(s) sau đó nhân nút OK, ta được 2 bảng tân số kết quả cho hai biến đã chọn
¢ Dong Valid cho biết số quan sat hợp lệ (số người có trả lời)
® - Dòng Missing cho biết số quan sát bị thiếu dữ liệu (số người không trả lời) Trong 2 bảng tần số bên dưới, mỗi bảng có 4 cột số liệu:
se - Cột Frequency: tần số
* Cét Percent: tan suất phan tram
se Cột Vali Percent: phần trăm hợp lệ, tính trên số quan sát có thông tin trả lời
Sử dụng khi có Missing Value
s - Cột Cumulafive Percent: phần trăm tích luỹ, cộng dồn các phân trăm hợp lệ
3.3 Cac dai lwong théng ké mé ta
Cac dai lượng thông kê mô tả chỉ được tính đối với các biến định lượng Nếu ta tính các đại
lượng này đối với các biến định tính thì các kết quả sẽ không có ý nghĩa
Vao Menu Analyze > Descriptive Statistics > Descriptives , hop thoai sau sẽ xuất hiện:
17
Trang 18Khoa Quatin Trd Kinh Doanh Phân tích dữ liệu trong kinh doanh
2 tp General Linear Model > FE crosstabs anh phé {1, Hà Nội)
5 c2a2 Regression Ra {1, HN mới)
t^-En^-e
o thường đọ
o thường đọ
x Variable(s): {Qptions }
8) Bean
( Save standardized values as variables
(ox_) paste ) Reset (cancer || He |
+ Chọn một (hay nhiều biến định lượng) trong danh sách biến ở phía bên trái hợp thoại
băng cách nhập chuột vào biên đó (vi dụ chọn biện c3), sau đó nhập vào mũi tên qua
phải đề đưa các biên này vào ô Variable(s)
+ Bam vao nut Options va hop thoại kề tiếp xuất hiện:
@® Variable list Alphabetic
© Ascending means Descending means
Hợp thoại nảy cho phép chọn các đại lượng thống kê cần tính để mô tả các biến đã chọn ở
phân trước bằng cách nhấp chuột vào các ô vuông cân thiết Các đại lượng thống kê mô tả
thường dùng là:
s - Mean: Trung bình cộng
s Sum: Tổng cộng (sử dụng khi điều tra toàn bộ)
18
Trang 19Khoa Quatin Trd Kinh Doanh Phân tích dữ liệu trong kinh doanh
se _ Std.Deviadion: Độ lệch chuẩn
se - Minimum: Giá trị nhỏ nhất
se Maximum: Gia trị lớn nhất
¢ SE mean: Sai số chuân khi ước lượng TB tông thê Trong trường hợp tính toán cho nhiều biến cùng lúc, có thê chọn | trong 4 cach sap xép thứ tự
kêt quả tính toán của các biến này Thông thường là dùng trật tự tăng dan (Acending means)
hay giảm dân (Descending means)
Sau đó bấm vao nut Continue dé trở lại hợp thoại trước, rồi nhắn nút OK Bảng kết quả sau
3.4 Lập bảng tần số đồng thời tính toán các đại lượng thống kê mô tả
Vao Menu Analyze > Descriptive Statistics > Frequencies lan nay chon bién ¢3 dé lập
bang tân sô và tính các đại ‘Sree thông kê mô tả
Variable(s):
re
v Display frequency tables
( ok ) Easte Rese (Caneelj, Ha
19
Trang 20VRange MISE meari
(contoue) _cancel (Help
Trong hộp thoại Chart nảy, nhấp chuột vào các ô đề chọn loại biêu đồ cần vẽ Có thé chon 1
trong 3 loại biếu đồ sau:
1 Bar: biêu đồ dạng thanh (dùng cho biến có giá trị rời rạc)
2 Pie: biéu dé hình tròn (dùng cho biến rời rạc có ít giá trị)
3 Histograms: biêu đồ phân phối tân số (dùng cho biến có các giá trị liên tục)
Sau khi chọn loại biểu đồ, nhấp chuột vào nút Continue để trở về hộp thoại Frequencies, và
nhân nút OK Kệt quả hiện ra như sau:
Trang 21
Khoa Quatin Trd Kinh Doanh Phân tích dữ liệu trong kinh doanh
Số lượng người đọc báo trong GD
Trang 22Khoa Quatin Trd Kinh Doanh Phân tích dữ liệu trong kinh doanh
Histogram
Mean =3.47 Std Dev = 1.788 N= 868
5 10 15 20
Số lượng người doc bao trong GD
3.5 Mã hoá lại biến
Trong ví dụ nảy tuôi biến thiên từ 18-60, ta có thê chia thành 4 nhóm là:
8 8 & BH ©] B compute variable Lñ 4 Se %|
1 st " Variables 0 số thứ tự None
2_ tp 0 Thành phô {1, Hà Nội}
| (optional case selection condition) |
(eset) [Cancel _ Help )
1 Trong hép thoai Recode nay, chon bién can ma hoa lai (tudi) trong danh sách biến bên
tay trải đưa vào ô giữa
Trang 23Khoa Quatn Tré Kinh Doanh Phân tích dữ liệu trong kinh doanh
2 Gõ tên của biễn mới (vi du là tuoi4nh) muốn tạo ra trong ô Output Variable Name roi
nhan nut Change
3 Nhắn vào nút Old and New Values, để xác định các giả trị cũ và chỉ định mã mới
tương ứng, hộp thoại sau xuât hiện:
Trang 24
© Range, LOWEST through value:
© Range, value through HIGHEST
@ value: |4 New Value
{5 Output variables are strings
©All other values
(continue) (cancel }(_Haip_]
Em m ©€31 £478 © BB Sth 40 *%
Name Type Width | Decimals Label Values
151 dotuoi Numeric 5 0 Độ tuổi {1, 18-25)
152 gtinh {1, Nam)
183 tncn -Value Labels {1, Không}
Kết quả sau khi mã hóa xong biến này sẽ biến thành biến định tính và thực hiện bảng thống kê
theo biên định tính ta thu được kêt quả như sau:
Trang 25
Khoa Quatin Trd Kinh Doanh Phân tích dữ liệu trong kinh doanh
Nhóm tuôi của khách hàng
3.6.1 Bang tan số I biến phân loại hay thứ bậc
Có 3 cấp bậc đo lường của biến là:
® - Nominal: dữ liệu từ thang đo định danh
¢ Ordinal: di ligu ti thang do thir bac
® - Scale: dữ liệu từ thang đo khoảng cách và thang đo tỉ lệ
Chon Analyze\ Tables \ Custom Tables hộp thoại Custom Tables hiện ra:
152 gtinh General Linear Model r U ry
Generalized Linear Models >
Trong ví dụ nảy, chúng ta muốn xem thử có bao nhiêu người trong mẫu khảo
sát ở Hà Nội và có bao nhiêu người trong mầu khảo sát ở TPHCM Biên cân dùng là biên tp
25
Trang 27
EiNEMILcmmj [Ci.¬-j
[RENO | onnah nnn
Thành pho TPHCM | — onnn} nnn a
data are scanned
r Totals and Subtotals Appear
© Aboye categories to which
Trang 28
Khoa Quatin Trd Kinh Doanh Phân tích dữ liệu trong kinh doanh
Nhấp nút OK lệnh thực hiện và bảng kết quả sau xuất hiện:
Ý nghĩa của từng giá trị trung bình đối với thang đo khoảng (Interval Scale)
Giá trị khoảng cách = (Maximum - Minimum) /n
=(5-1)/5
=0.8
1.81 ->2.60 _ Không đồng ý/Không hải lòng/ Không quan trọng
4.21 -> 5.00 Rất đồng ý/ Rất hai long/ Rat quan trong
3.6.4 Xử lý câu hồi chọn nhiều trả lời
3.6.4.1 Siw dung bang Custom Tables
Đối với câu hỏi có thê chọn nhiều tra lời, do người trả lời chọn nhiều ý nên khi nhập vào sẽ có nhiều biến Nếu tóm tắt các biến này bằng những lệnh thông thường như bảng tần số (Analyze
> Descriptive Statistics > Frequencies) hay bảng tùy biến (Analyze > Tables > Custom Tables) thi ứng với 1 câu hỏi loại này, có nhiều biến thì sẽ ra nhiều bảng tần số rời rạc, ít có ý nghĩa nêu không cộng các bảng này lại với nhau Đề có bảng tóm tắt hoàn chỉnh, chúng ta cần kết hợp các biến này lại Đi kèm với Custom Tables, SPSS cung cấp lệnh kết hợp biến nảy
Từ menu chon Analyze > Tables > Multiple Response Sets
3.6.4.2 Sir dung lénh chay bang Multiple Response
Đầu tiên chúng ta phải kết hợp các biến của cùng một câu hỏi, rồi sau đó chạy bảng Từ Menu chọn Analyze > Multiple Response
28
Trang 29
Ví dụ: ta cân lập bảng thông kê về thu nhập hộ gia đình ( tngd) phân tích cho từng thành phố (tp) được điều tra Đưa lần lượt biến tp vào ô Columns (ô cột ) và biến tngd vào 6 Row (6 dòng) Hình minh họa như sau:
Trong hộp thoại Summary Statistics chọn các hàm thống kê trong ô Statistics bên tay trái Đối với biến định tính, các hàm thường dùng là: Count (tần số), Row% (phần trăm theo dòng), Col% (phần trăm theo cột)
Trong vi dy nay, ta lần lượt chọn hàm Count và Hàm Column N % rồi nhấp vào nút mũi
tên đê đưa hàm đang chọn vào ô Display bên tay phai, nhap Apply to selection Hinh
minh họa như sau:
Ø
Selected Variable: TN hé TB thang
Statistics: Display:
Unweighted Count 3 | Statistics |Labet Format | Decimals |
29
Trang 30Khoa Quatin Trd Kinh Doanh Phân tích dữ liệu trong kinh doanh cho từng thang đo (ví dụ, hình tròn và đồ thị dạng thanh bar) Bạn xây dựng một biêu đồ bằng cách kéo và thả các biến trong danh sách qua hộp thoại Builder Tương ứng với các mẫu đồ
thị đã được chọn và xem hình dạng của đồ thị được vẽ trong hộp thoại Builder
Đề vẽ đồ thị trong SPSS chúng ta cần phải hiệu rõ 4 bước đề thực hiện
=> Bước l: xác định dạng đồ thị thích hợp
~> Bước 2: xác định vùng dữ liệu và cầu trúc dữ liệu (theo hàng hay theo cột)
> Buwéc 3: các chỉ tiết của đỗ thị: tên đồ thị, tên trục đồ thị, đường lưới toa độ, vị trí phân chú thích của đồ thị, hiện nhãn giả trị
~> Bước 4: chỉnh sửa đồ thị phù hợp với mục đích nghiên cứu
Câu hỏi ôn tập chương 3
1) Sử dụng dữ liệu data cá nhân tiễn hành thực hiện các bảng thống kê và đồ thị tương
ứng với môi loại thang do sau:
+ Thang do dinh danh (Nominal Scale); Thang do thir bac (Ordinal Scale);
+ Thang do khoang cach (Interval Scale); Thang do ti lé (Ratio Scale) 2) Sử dụng dữ liệu data cá nhân tiến hành thực hiện các bảng thống kê kết hợp và đồ thị
tương ứng với môi loại dữ liệu sau:
+ Biến định tính kết hợp với biến định tính; Biến định lượng kết hợp với biến định tính; Biên định lượng kết hợp với biên định lượng
30
Trang 31Khoa Quatin Trd Kinh Doanh Phân tích dữ liệu trong kinh doanh
CHƯƠNG 4 PHAN TICH DU LIEU ĐỊNH TÍNH 4.1, Kiém dinh Chi - Square
° Kiếm định Ch¡-Square: được sử dụng dé kiém dinh xem có tổn tại mối quan hệ giữa
hai yêu tô đang nghiên cứu trong tông thê Kiêm định này còn gọi lá kiêm định tính độc lập Kiếm định này phù hợp khi hai yêu tô này biên định
*ˆ : đại lượng Chi-Square dùng để kiêm định
0; : tần số quan sát thực tế trong các ô của bảng chéo
Ej : tần số quan sát lý thuyết trong các ô của bảng chéo
J được tính theo công thức sau:
i: tong sO quan sat của dòng thứ ¡
i: tong s6 quan sat cột thứ j
Đại lượng kiêm dinh nay cé phan phéi Chi - Square (Khi bình phương) Tra bảng phân phối
2 này ta sẽ có giá trị giới hạn với mức ý nghĩa œ và số bậc tự do bằng (r-1) x (c-1): No-one
- - Chấp nhận Họ nếu: Ý < Äứ-be-Da ; sigœ > 0.05
Ví dụ: nghiên cứu môi liên hệ giữa trình độ học van va cách đọc các tờ báo của người đọc Ta
lập bảng chéo đề tìm hiệu môi quan hệ nảy
31
Trang 32Khoa Quaũn Trò Kinh Doanh
Tir Menu, chon Analyze -> Descriptive Statistics -> Crosstabs như sau:
E đi * [Ey Frequencies Label
—= L [i Descriptives ¬ oe Compare Means | a ctor ai trí khi rãnh
General Linear Model ' 'Effassap ải trí khi rãnh
Generalized Linear Models > a bee Ds oe
- Ratio
waxed Mads ' Ratio ải trí khi rãnh
Reoression + | RleePlœs tân
Lệnh này mở ra hộp thoại Crosstabs như hình sau:
Trang 33Trong bảng kết quả nảy, có vẻ như học vấn càng cao thì cảng đọc báo theo kiêu “xem lướt các
đề mục, đọc các mục ưa thích trước” Đề kiếm định giả thuyết này, ta đặt giả thuyết
H 0 học vấn không có liên hệ tới cách đọc bảo
(cách đọc báo không chịu ảnh hưởng của học vấn)
Mở lại hộp thoại Crosstabs, từ trong hộp thoại Crosstabs, ta nhân nút Statistics, hộp thoại Crosstab: Statistics sau xuat hién:
"] Uncertainty coefficient _1 Kendall's tau-c
Nominal by Interval 1 ‘| Kappa
Eta Risk
~| Cochran's and Mantel-Haenszel statistics
Trong hộp thoại này ta đánh dấu chọn đại lượng Chỉ-Square, nhân nút Continue dé tro vé
hộp thoại trước Trong hộp thoại nảy nhân tiệp nút Cells để xác định các đại lượng thê hiện trong từng ô rồi nhân nut Continue, OK Ket quả sẽ hiện ra như trong trang sau:
Counts z-test
# Observed Expected A
~] Hide small counts
| Compare column proportions
@© Round cell counts © Round case weights
© Truncate cell counts © Truncate case weights
O No adjustments
33
Trang 34Khoa Quatin Trd Kinh Doanh Phân tích dữ liệu trong kinh doanh Thay vì phải tra bảng Chỉ-Square tìm giá trị giới hạn ở bậc tự do 9 và mức ý nghĩa 0,05 (ứng với độ tin cậy 95%); rồi so sánh giá trị Chi-Square 22,098 với giá trị giới hạn này Chương trình SPSS da tính ngược lại mức ý nghĩa quan sat voi gia tri Chi - Square 22,098 Mirc y nghĩa quan sát này thuong duoc goi la P-Value hay Sig (Observed Significance Level), hay van tat la œ Với tốc độ tin cậy 95%, nguyên tắc quyết định là:
Trong vi du nay, sig = 0.009 < a = 0.05, ta bac bo gia thuyết H 0, Ta kết luận rằng đã có đủ
bằng chứng để nói rằng trình độ học vấn có liên hệ tới cách đọc báo Chúng ta có thể dựa vào các tỉ lệ % theo cột trong bảng chéo để mô tả sự liên hệ hay sự khác biệt về cách đọc báo giữa các nhóm học vẫn
Cach doc cac to bao noi chung * Hoc vAn Crosstabulation
DH Cach Count 37 147 36 57 277 đọc các | Đọc theo thứ tự từ|%
Trang 35Khoa Quatin Trd Kinh Doanh Phân tích dữ liệu trong kinh doanh
Count 14 40 21 15 90 Chỉ đọc các trang
Xem các tin dang |%
4.2 Kiểm định trong trường hợp dữ liệu thứ tự
Trong trường hợp hai yếu tố nghiên cứu là hai biến thu thập tir thang do thir bac, thay vi ding đại lượng Chi-Square, chúng ta có thê dùng một trong các đại lượng sau: Tau của Kendall, d của Somer, Gamma của Goodman và Kruskal Các đại lượng này giúp phát hiện ra môi liên
hé tot hon Chi - Square
Gia sử chúng ta cần nghiên cứu nối liên hệ giữa học vấn với múc độ quan tâm đối với chủ đề
gia đỉnh trên bảo Sai Gon Tiệp Thị Vì cả hai yêu tô này đều là dữ liệu cấp bậc:
® - Học vấn: cấp 1-2, cấp 3- trung học chuyên nghiệp, tốt nghiệp CĐ- học ĐH, tốt nghiệp ĐH
se Mức độ quan tâm đến chủ đề gia đình: quan tâm nhất, quan tân thứ nhì, quan tâm thứ ba
Giả thuyết Hà, : học vẫn không có liên hệ tới mức độ quan tâm đến chủ đề gia đình trên bảo SGTT (hay mức độ quan tâm đến chủ đè gia đình không khác nhau giữa các nhóm học vấn)
35
Trang 36Đề kiêm định giả thiết này, mở lại hộp thoại Crosstab Trong hộp thoại này đưa biến e19.3 (mức độ quan tâm đến chủ đề gia đình) vào ô Row và biến nhomhv (nhóm học vấn) vào ô
Column Rồi chọn Statistics
(ox _) paste} Reset cancel Hein |
Trong hộp thoại Statistics, ta chọn các đại lượng kiểm định như trong hình dưới Sau đó nhấp Continue trở về hộp thoại Crosstab và nhập OK
~] Cochran's and Mantel-Haenszel statistics
(contove)|_ cancer Help)
từng nhóm học vấn để mô tả sự liên hệ hay sự khác biệt về cách đọc báo giữa các nhóm học
£ A
van
36
Trang 37Khoa Quatin Trd Kinh Doanh Phân tích dữ liệu trong kinh doanh
Case Processing Summary
N Percent N Percent N Percent
van
Gia dinh * Hoc van Crosstabulation
Hoc van Total
a | cells (8.3%) have expected count less than 5 The
minimum expected count is 3.42,
Directional Measures
Valu | Asymp Std | Approx | Approx
e€ Error* TP Sig
Ordinal by |Somers' | Symmetric -.125 060 -2.061 039
37