1. Trang chủ
  2. » Luận Văn - Báo Cáo

Bài giảng môn học phân tích dl trong kd

74 1 0
Tài liệu được quét OCR, nội dung có thể không chính xác
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Phân Tích Dữ Liệu Trong Kinh Doanh
Người hướng dẫn Th.S. Nguyễn Vũ Võn Anh
Trường học Trường Đại Học Cơng Nghiệp Tp Hồ Chí Minh
Chuyên ngành Quản Trị Kinh Doanh
Thể loại Bài Giảng
Thành phố Thành Phố Hồ Chí Minh
Định dạng
Số trang 74
Dung lượng 7,13 MB

Nội dung

Nghiên cứu sơ bộ Nghiên cứu định tính ® Nghiên cứu chính thức Nghiên cứu định lượng 1.4 Cửa số làm việc của SPSS Từ Start Menu chọn ->Programs rồi chọn -> SPSS for Windows 21.0, mản hìn

Trang 1

OF HOCHIMINH CITY BỘ CÔNG THƯƠNG

TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP TP HỎ CHÍ MINH

KHOA QUẢN TRỊ KINH DOANH

Trang 2

CHUONG 1 2

GIOI THIEU VE CO SO DU LIEU, PHAN LOAI DU LIEU, MA HOA VA

Trang 3

CHUONG 1

GIOI THIEU VE CO SO DU LIEU, PHAN LOAI DU LIEU, MA

HOA VA NHAP LIEU 1.1 Phân loại dữ liệu

Dữ liệu nghiên cứu có thể phân thành hai loại chính là dữ liệu định tính và dữ liệu đỉnh lượng

Cac dữ liệu này được thu thập băng 4 thang đo co ban theo so do sau:

Thang do Khoang cach

Thang do Tilé

Khác nhau cơ bản giữa dữ liệu định tính và dữ liệu định lượng:

" Dữ liệu định lượng: phản ảnh mức độ, mức độ hơn kém, tính được trị trung bình

1.2 Các loại thang đo

1.2.1 Thang do danh nghia (thang do phan logi) - Nominal scale:

Các con số chỉ đùng đề phân loại các đối tượng, chúng không mang ý nghĩa nào khác

Trang 4

1.2.2 Thang đo thứ bậc - Ordinal scale:

Các con số được dùng đề ghi thứ bậc (sự hơn kém)

Ví dụ:

Hãy xếp hạng các chủ đề sau đây trên flyer tùy theo mưc độ quan tâm của Anh/chư/ông/bà ‹ đối

với từng loại chủ đề? (chủ đề nào quan tâm nhất thì ghi số I, quan tâm thứ nhì thì ghi số 2,

quan tâm thứ ba thì ghi sô 3)

® Mua sam

1.2.3 Thang do khoang - Interval scale:

La thang đo thứ bậc và cho biết được khoảng cách giữa các thứ bậc Thông thường thang đo

khoảng cách có dạng là một dãy các chữ số liên tục và đều đặn từ 1 đến 5, từ 1 đến 7 hay từ I

đến 10 Dãy số này có 2 cực ở hai đầu thé hign 2 trang thái đối nghịch nhau Vi du: như 1là

rât ghét, 5 là rât thích, I là không đông ý, 5 là rất đông ý, l là rât không hai long, 5 la rat hai

lòng

1.2.4 Thang do ti lé - Ratio scale:

Thang đo khoảng cách cho phép tính tỉ lệ đê so anh, thang đo tỉ lệ thu thập đữ liệu là số thực,

như trọng lượng, chiều cao, cân nặng, doanh thu, chi phi

Vi dụ:

Nếu gia đình Anh/chị/ông/bà có thường di xem phim tai cum rap Mega Start, thì số lượng

người thông thường đi xem phim trong gia đình trung bình là bao nhiêu người (kê cả

Anh/chị/ông/bà)? Trong đó số người thường xuyên xem phim là bao nhiêu người?

Trang 5

1.3 Quy trình thực hiện nghiên cứu

Thang do chính thức

—_ Loại các biến không thỏa tiêu chí kiểm định

hệ số Cronbachs Alpha, loại n biến chạy lại kiểm dinh Cronbach’s Alpha n fan

— Kiểm tra hệ số Cronbach”s Alpha

Phân tích nhân tố khám phá —_ Loại các biến có trọng số EFA nhò

(EFA- Exploratory Factor + —* —_ Kiểm tra các yếu tố trích được

Analysis} —_ Kiểm tra phương sai trích được

— Kiểm định Cronbachs Alpha cho các biến quan sát trong các nhóm nhân tố tạo thành

—_ Loại các biến không thòa tiêu chí kiểm định

hệ số Cronbachs Alpha, loại n biến chạy lại kiểm dinh Cronbach’s Alpha n [an

—_ Kiểm tra hệ số Cronbach”s Alpha

Cronbach”s Alpha

Thang đo hoàn chỉnh

Phân tích hồi quy '——> ĐỀ Xuố, cácgiỏl pháp

và kiến nghị

Hình: Quy trình thực hiện nghiên cứu

® Nghiên cứu sơ bộ (Nghiên cứu định tính)

® Nghiên cứu chính thức (Nghiên cứu định lượng)

1.4 Cửa số làm việc của SPSS

Từ Start Menu chọn ->Programs rồi chọn -> SPSS for Windows 21.0, mản hình đữ liệu

SPSS sẽ hiện ra như sau:

Trang 6

5_ = c2a2 | Numeric | INumeric 15 5 ' : Menu: Chứa lệnh xử lý và các lệnh phân tích “ ^ AT ^ a z '

10 c2a7 | _Numẹric_5 _ O DS Dror oye seg wns mem SI ISOS SITIES ST Te rovercococorerssc,

11 c2a8 A Ke on 2 “ ^ + 13 17A z ¬— ge

42 cao Cột: Môi cột trong bảng chứa một loại dữ liệu (Ví dụ: gidi tinh)

13 ®crr— Dòng: Mỗi dòng trong bảng chứa các đữ liệu của một đối tượng khảo sát

1 '

14 c2b2¡ =2œœbpe = 5= == =2C= == =2 1 '2G pacar, 2 cay pose 5 Sa Seman wk ' > — NƠIE TT” ĐT T—T—— =Txtữ<nr =Ð; ~~ ~~œnommai” °

czc1i 2 A ^ TA bi jone = Rig! iominal

17c Data View: Cửa S0 nhập liệu bi None 4 = Right & Nominal lel

IBM SPSS Statstcs Processor is ready

(ie we ve as et bei)

1.5 Tạo khuôn nhập liệu

1.5.1 Thay đổi một số mặc định của chương trình

Mở chương trình SPSS, từ file tập tin trắng chưa nhập liệu, vào Menu chọn: Edit Options,

hộp thoại Options xuât hiện:

® - Tại tab General chọn như hình sau:

> Display names: Hién nhan bién hay hién tén bién

> Unicode (universal character set): Bang ma Unicode gé tiéng việt

> File: chon thir ty xuat hiện của các biến trong hộp thoại lệnh xử lý

~> Measurement System: Thay đối đơn vị đo lường đề điều chỉnh định dạng

" —

Variable Lists:

© Display labels | No scientiic notation for small numbers in tables:

} Display names; [Apply locale’s digit grouping format to numeric values

@ File

To Save hme, some dialogs allow the use of predefined

‘field roles to automatically assign variables (Neids) to lists & Raise vewor window

© Scroll to new output

® Use predefined roles =

© Character Encoding for Data and Stax

| © Locale'’s writing system Windows: | © Unicode (universal character set)

Look and feel ÍgPS8landad + ‘Character encoding cannot be changed when any

non-empty datasets are open

| Open syntax window at startup

‘User Interface:

] Open only one dataset at a time `

( s )(emed) apsy L nep )

Trang 7

Transformation and Marge Options Sot Cantury Range for 2-Digit Years

@ Calculate values immediately @ Automatic

© Calculate values before used Beginyear 1945

End year: 2044

Display Format for New Numeric Variables © custom

Width: Fe} Decimal Places Đegin year 94

Randpm Number Generator \

N

o period Mersenng ‘ has

Sô lượng sô lẻ

£ Assigiing ¬ Measurement| của biên 1 1Ô

number for unig Ea RE

Ins do nat apply, variables that meet or exceed the cut-off number for unique

> Ấ , |) Measurement level Variables thal do Not will be assigned the nominal

BiueYetiowContrast BiueYeliowContrastatternate Boxed

Table Rendenng

© Aajust for labels only

@ Aajust for labels and cata for ali tables

> Boxed: Chon kiéu bang hién thị kết quả trong cửa sô Output

Các điều chỉnh này sẽ ảnh hưởng đến thuộc tính của tất cả các biến được tạo ra sau khi chỉnh

xong Options

Sau đó nhân nút Apply, rồi nhan nut OK

Khi nhắn nút Apply, chương trình có thê đưa ra một số lưu ý nói rằng các hiệu chỉnh nảy chỉ

có hiệu lực sau khi mở lại file hay khởi động lại chương trình SPSS

1.5.2 Tạo biến mới

Dé tao biên mới phải làm bên cửa số Variable View, có màn hình như sau:

Trang 8

File Eat View Data Transform Analyze Direct Marketing Graphs Utilities Add-ons Window Help

SEiR et eH AEE BPR 4AOe %

Name Type Width | Decimals Label | Values Missing | Columns | Align | Measure

1 stt Numeric 5 0 số thứ tự None None 4 = Right # Scale

2 tp Numeric 5 0 Thành phố {1, Hà Nội) 9 4 = Right & Nominal

3 c1 Numeric 5 0 Đọc báo {1, Hầu như k None 4 = Right i Ordinal

4 c2a1 Numeric 5 0 Báo thường đọc trong 6 {1, HN mới} None 4 = Right & Nominal

5 c2a2 Numeric 5 0 {1, HN mới} None 4 = Right & Nominal

6 c2a3 Numeric 5 0 Báo thường đọc trong 6 {1, HN mới} None 4 = Right # Nominal

7 c2a4 Numeric 5 0 Báo thường đọc trong 6 {1, HN mới} None 4 = Right # Nominal

8 c2a5 Numeric 5 0 Bao thường đọc trong 6 {1, HN mới} None 4 = Right & Nominal

9 c2a6 Numeric 5 0 Đáo thường đọc trong 6 {1, HN mới} None 4 = Right # Nominal

10 c2a7 Numeric 5 0 Báo thường đọc trong 6 {1, HN mới} None 4 = Right # Nominal

11 c2a8 Numeric 5 0 Báo thường đọc trong 6 {1, HN mới} None 4 = Right & Nominal

12 c2a9 Numeric 5 0 Báo thường đọc trong 6 {1, HN mới} None 4 = Right & Nominal

13 c2b1 Numeric 5 0 Các tờ báo thích đọc n {1, HN mới} None 5 = Right # Nominal

14 c2b2 Numeric 5 0 Các tờ báo thích đọc n {1, HN mới} None 5 = Right & Nominal

15 c2b3 Numeric 5 0 Các tờ báo thích đọc n {1, HN mới} None 5 = Right & Nominal

16 c2c1 Numeric 5 0 Các tờ báo GÐ thường {1, HN mới} None 4 = Right # Nominal

17 c2c2 Numeric 5 0 Các tờ báo GĐ thường {1, HN mới} None 4 = Right & Nominal lel

IBM SPSS Statstcs Processor is ready ies Die

Name: gõ tên biến cần đặt (không có ký tự khoảng trắng, không có ký tự đặc biệt, phải bắt

đầu bằng một ký tự không được bắt đầu bằng một ký số)

Sau khi đặt tên biến, ta phải khai báo các thuộc tính cơ bản, muốn khai báo thuộc tính nào của

biên, hãy nhân chuột vào nút của thuộc tính đó Sau khi khai bảo xong một thuộc tinh bam

O Restricted Numeric (integer with leading zeros)

The Numeric type honors the digit grouping setting, while the Restricted Numeric never uses digit grouping

Khai báo loại biến kiêu số (Numeric) hay kiểu chudi (String), s6 lượng ký số/ ký tự tối đa

(Width) có thê nhập vào, số lượng số thap phan (Decimal Places)

Hai biến thường dùng ở hình trên là:

> Numeric: biến kiểu số

> String: bién kiéu chuỗi (chỉ dùng trong trường hợp cần nhập họ tên, địa chi người trả lời và các thông tin dưới dạng ký tự khác)

Label: Khai báo ý nghĩa của biến hay ý chính của câu hỏi

Value: Khai bao gia trị của biến, các nhãn giá trị cần thiết (nêu có)

Trang 9

3 = "Thường xuyên (tuần 3-7 tờ)"

— 4 = "Rất thường xuyên (trên 7 tờ/ tuần)”

Value: Mã nhập các thang đo định tính, phải bằng số

Label: Nhãn giải thích của mã nhập

Add: Khai bảo xong một mã giả trỊ

Changc: Thay đối mã giá trị

Vv Remove: X6a m gia tri

MI Missing: Khai bao cac gia trị khuyết (nêu cần) Trong SPSS cho phép khai báo được 3

giả trị khuyết trong hộp thoại Missing Values

Sau đây là hộp thoại khai báo giá trị khuyết, giúp phân loại thiếu số liệu cho từng loại nguyên

Ví dụ: Ta gặp tình huống với câu hỏi về trình độ học vấn có những người được điều tra vì lý

do tế nhị nào đó đã từ chối trả lời thì trong Value Label: ta quy ước giá trị 99 có nhãn là

“Không trả lời”, sau đó sang Missing Value: ta phải khai báo 99 là giá trị khuyết đê sau đó

khi tính toán các lệnh thống kê ví như tính tần số thì máy sẽ loại giá trị khuyết này ra khi tính

phân trăn hợp lệ

Trang 10

© Discrete missing values

Hình trên cho biết, trong file Data thực hành các biên c29a1 đến c29e có khai bao Missing

Value là 8 hoặc 9 là số người không trả lời (không ý kiến)

M Columns: Khai bao độ rộng của cột biến khi ta nhập liệu trong cửa số Data, thường

chon là 8

M Align: Vi tri dir ligu duge nhập trong cột trong cửa sô Data, thường chọn là Right

™ Measure: Chọn loại thanh đo thể hiện dữ liệu: Ordinal (thang do thứ bậc), Norminal

(thang đo danh nghĩa) và Scale (gồm cả thanh đo khoảng cách và thanh đo tỉ lệ)

r

Luu y:

Chung ta vẫn có thê sử đụng lệnh Copy và Paste trong quá trình tạo biến mới Ví dụ như Tyle

(kiêu biến) hay Value (Mã hoá) Bấm tô hợp phím Ctrl + C rồi dùng trỏ chuột chọn vùng

muốn Copy thuộc tính tương ứng đến và nhấn tô hợp phím Ctrl + V

1.5.3 Lưu tập tin dữ liệu

Đề lưu lại tập tin dữ liệu chúng ta phải có khai báo biến trước thì chương trình mới cho lưu,

trong màn hình Data, từ Menu chọn File/ Save, hộp thoại sau sẽ xuât hiện:

Look in: |): Du tieu bai giang \ytnuyetsPssmoi > gq GJ EE f=

@ Phan tich biet so (moi)1.sav

Ñ Phan tịch biet so (moi}2.sav

Keeping 158 of 168 variables Vanables ]

Save as ype [SPSS Statstes (*.sav) x _ Pasle _ |

tee)

a Encrypt file with password

Trong hộp thoại này, chọn ỗ đĩa, thư mục, đặt tên tap tin (tên nên đặt không dau) và nhắn nút

Save Phân mở rộng tên tập tin dữ liệu SPSS là sav

Trang 11

1.5.4 Nhập liệu trong SPSS

1.5.4.1 Cách nhập trực tiếp vao SPSS

Sao khi khai báo tên biến trong cửa số Variable View đề nhập dữ liệu nghiên cứu vào SPSS,

click chuột vào biêu tượng Data View năm phía dưới màn hình của chương trình SPSS,

chương trình sẽ hiện ra cửa sô đê nhập đữ liệu trực tiếp vào chương trình như trong hình sau:

Fie Edn View Data Transform Anale CDirectMarceing Grapns LĐeS Addons Window Help

a8 5 w +x FEhSB HAR BPE #O% %

Mỗi dòng nhập liệu trong cửa số Data View là một quan sát (hay là một phiếu trả lời khảo sát

của một người), mỗi cột trong của số Data View là một biến (hay còn gọi là một câu hỏi)

Dữ liệu nhập vào cho từng biến chủ yếu là kiểu số (Numeric), vẫn có thé nhập vào đữ liệu

kiêu chuỗi nếu trong cửa số khai báo biến (Variable View) bạn có khai báo kiêu dữ liệu nhập

vào trong cột Tyle là String

Trong một biến quan sát nào đó nếu người khảo sát không trả lời thì phải nhập giá trị Missing

mà bạn đã khai báo ở cửa số khai báo biến (Variable View) Ngoài ra, đối với câu hỏi nhiều

trả lời thì không cần nhập giá trị Missing, chỉ nhập những giá trị mà người sát đã chọn còn các

giá trị không chọn ta đê trông

Đề hiển thị nhãn của giả trị mà bạn nhập liệu vào trong cửa số Data View, click nút Value

Labels trén Menu như trong hình sau:

Trang 12

1.5.4.2 Cach Insert dit liéu tir Excel

Trong chương trình SPSS có chức năng Insert dữ liệu từ những dữ liệu đã có trong một file

Excel, cách làm như sau:

Bước 1: Mở SPSS lên rồi vào Menu File -> Open -> Data như trong hình sau:

@ Read Cognos Data @ Script

Bước 2: Hộp thoại "Open Data" hiện lên các bạn chọn đến thư mục chứa file Excel Lưu ý là

mặc định SPSS sẽ chỉ hiện các file của SPSS (*.sav), muốn hiện file Excel thì các bạn chọn

Files of type la Excel (*.xls, *xIsx ) chon ding file excel can import dé load vao SPSS (nhu

hình minh họa)

J) Bai giang SPSS )) bai giang spss cua thay trong

.} Bai giang SPSS englIsh

a Bai giang Thay Ho _)) NUYEN VU VAN ANH

JD pinkk J) Tu tuong quan va tuong quan chuoi

Chi voi | thao tác đơn giản như trên nhưng sẽ giúp ích được cho các bạn rất nhiều vấn đề trở

ngại về nhập liệu với kích cỡ mẫu nhiều

- Mã hóa và nhập liệu trên Excel sẽ đơn giản hơn trong SPSS rất nhiều

- Bạn nên mã hóa và nhập vào excel chỉ bao gồm các con só, vd: nữ: 1; nam: 2, cũng như các

thang do Likert 5: 1,2,3,4,5 thi khi import vao SPSS sé ty khai báo biên cho bạn, tiết kiệm

thời gian và công sức cho bạn rât nhiêu

- Sau cùng bạn sẽ không phải lo gặp các vấn đề về font chữ, lỗi khai báo biến or số lượng biến

nhiều

Bước 3: Một hộp thoại hiện ra yêu cầu bạn muốn lấy tiêu đề của các cột trong Excel làm tên

biên trong SPSS, roi nhan OK Hinh minh họa như sau:

Trang 13

D:\Data\Trong quang\SPSS\Bai Giang\du lieu dua vao spss.xlsx

iv ¡Read variable names from the first row of data

Maximum width for string columns: 32767

Bước 4: Dữ liệu đã được Insert vào SPSS, tiếp tục mã hóa và khai báo cho một vài biến định

tính cân sử dụng Hình mình họa như sau:

File Edf View Da Transform Analyze DirectMarketing Graphs UHiỦes Add-ons Window Help

:i § r3 Ek#fl H f3 5áñm dò 5

| stt hon MMI giớHh họcực thunhập mứcđộhàiòng

1; 10 nguyễn văn A 20.0 nam khá 1.0 1.0

2 | 20nguyễnvănB 30.0 nt — trungbinh 2.0 2.0

4 4.0 nguyén van D 26.0nam —gidi 40 40

7 T.0 nguyễn văn G 23.0 nam kha 40 5.0

8 8.0 nguyén van H 35.0 nữ giỏi 20 40

_ 9 |, 90 nguyễn văn l 24.0 nam giỏi 3.0 3.0

_ 10 100nguyễn van J 28.0nam — giỏi 40 20

Câu hỏi ôn tập chương 1

Hãy thu thập đữ liệu dựa trên mô hình nghiên cứu của từng cả nhân

Trang 14

Khoa Quatin Trd Kinh Doanh Phân tích dữ liệu trong kinh doanh

CHƯƠNG 2 LÀM SẠCH DỮ LIỆU 2.1 Lý do

Dữ liệu sau khi nhập xong chưa thê đưa ngay vào xử lý và phân tích vì con nhiều lỗi do:

se Chất lượng của phỏng vấn: phỏng vấn viên hiểu sai và thu thập sai, phỏng vấn viên ghi nhậm

® - Nhập liệu: sai, sót, thừa

2.2 Các biện pháp ngăn ngừa

* Chọn lọc và huấn luyện phỏng vấn viên kỹ lưỡng, điều tra phỏng vấn thử trước khi phỏng van that dé thong nhất tránh sai sót

© - Các bảng câu hỏi sau khi phỏng vấn phải được đọc soát kiêm lỗi, chỉnh sửa trước khi

® Nhược điểm: thủ công, phát hiện ít lỗi, chỉ phù hợp với các bảng câu hỏi đơn giản

2.3.2 Dùng bảng phối hợp hai biến hay ba biến

+ Lap bang 2 bién (Crosstabs hay Custom Tables) dựa vào các quan hệ hợp lý (logic)

đê phát hiện ra lỗi Ví du: nhu lập bảng kết hợp biến tuổi vả nghề nghiệp, phát hiện thay có trường hợp tuổi chỉ có 13 mà nghề nghiệp ghi là giáo viên

14

Trang 15

Khoa Quatin Trd Kinh Doanh Phân tích dữ liệu trong kinh doanh

n Anahze Direct Marketing Graphs Utilities Add-ons V

Compare Means [EE Multiple Response Sets

+ Dùng lệnh Data-> Select case để lọc ra các trường hợp có lỗi Tiếp theo vi dụ trên, ta lọc ra trường hợp thoả điều kiện tuổi =13 và nghệ = giáo viên (ví dụ mã nghệ giáo viên là =2)

File Edit View = Transform Analyze Direct Marketing

@ & fy!) Asorcases

® - Ưu điêm: phát hiện được nhiều lỗi hơn, phù hợp với các bảng câu hỏi phức tạp

© Nhược điểm: phức tạp, cần nhiều thời gian, người thực hiện cần nhiều kinh nghiệm

Câu hỏi ôn tập chương 2

Hãy nhập liệu từ đữ liệu thu thập được của mỗi cá nhân để tạo thành database cho riêng minh

15

Trang 16

Khoa Quatin Trd Kinh Doanh Phân tích dữ liệu trong kinh doanh

Bảng tần số có thê được thực hiện với tất cả các biến kiêu số (định tính và định lượng) Trong

trường hợp biên định lượng liên tục có quá nhiều giá trị, bảng tân sô sẽ rất dài, chúng ta có thê phân tô (băng lệnh Recode, sẽ được trỉnh bày trong phân sau) trước khi lập bảng tân sô

Sau khi mở file Data thuc hanh, vào Menu Analyze > Descriptive Statistics >

Frequencies Hộp thoại Frequencies xuât hiện:

3) c1 = 4 Models ' EA Reto bc bao {1, Hâu như

4 c2a1 Correlate » | MEP Riots o thường đọ {1, HN mới}

Trang 17

Khoa Quatn Tré Kinh Doanh Phân tích dữ liệu trong kinh doanh

vào ô Variable(s) sau đó nhân nút OK, ta được 2 bảng tân số kết quả cho hai biến đã chọn

¢ Dong Valid cho biết số quan sat hợp lệ (số người có trả lời)

® - Dòng Missing cho biết số quan sát bị thiếu dữ liệu (số người không trả lời) Trong 2 bảng tần số bên dưới, mỗi bảng có 4 cột số liệu:

se - Cột Frequency: tần số

* Cét Percent: tan suất phan tram

se Cột Vali Percent: phần trăm hợp lệ, tính trên số quan sát có thông tin trả lời

Sử dụng khi có Missing Value

s - Cột Cumulafive Percent: phần trăm tích luỹ, cộng dồn các phân trăm hợp lệ

3.3 Cac dai lwong théng ké mé ta

Cac dai lượng thông kê mô tả chỉ được tính đối với các biến định lượng Nếu ta tính các đại

lượng này đối với các biến định tính thì các kết quả sẽ không có ý nghĩa

Vao Menu Analyze > Descriptive Statistics > Descriptives , hop thoai sau sẽ xuất hiện:

17

Trang 18

Khoa Quatin Trd Kinh Doanh Phân tích dữ liệu trong kinh doanh

2 tp General Linear Model > FE crosstabs anh phé {1, Hà Nội)

5 c2a2 Regression Ra {1, HN mới)

t^-En^-e

o thường đọ

o thường đọ

x Variable(s): {Qptions }

8) Bean

( Save standardized values as variables

(ox_) paste ) Reset (cancer || He |

+ Chọn một (hay nhiều biến định lượng) trong danh sách biến ở phía bên trái hợp thoại

băng cách nhập chuột vào biên đó (vi dụ chọn biện c3), sau đó nhập vào mũi tên qua

phải đề đưa các biên này vào ô Variable(s)

+ Bam vao nut Options va hop thoại kề tiếp xuất hiện:

@® Variable list Alphabetic

© Ascending means Descending means

Hợp thoại nảy cho phép chọn các đại lượng thống kê cần tính để mô tả các biến đã chọn ở

phân trước bằng cách nhấp chuột vào các ô vuông cân thiết Các đại lượng thống kê mô tả

thường dùng là:

s - Mean: Trung bình cộng

s Sum: Tổng cộng (sử dụng khi điều tra toàn bộ)

18

Trang 19

Khoa Quatin Trd Kinh Doanh Phân tích dữ liệu trong kinh doanh

se _ Std.Deviadion: Độ lệch chuẩn

se - Minimum: Giá trị nhỏ nhất

se Maximum: Gia trị lớn nhất

¢ SE mean: Sai số chuân khi ước lượng TB tông thê Trong trường hợp tính toán cho nhiều biến cùng lúc, có thê chọn | trong 4 cach sap xép thứ tự

kêt quả tính toán của các biến này Thông thường là dùng trật tự tăng dan (Acending means)

hay giảm dân (Descending means)

Sau đó bấm vao nut Continue dé trở lại hợp thoại trước, rồi nhắn nút OK Bảng kết quả sau

3.4 Lập bảng tần số đồng thời tính toán các đại lượng thống kê mô tả

Vao Menu Analyze > Descriptive Statistics > Frequencies lan nay chon bién ¢3 dé lập

bang tân sô và tính các đại ‘Sree thông kê mô tả

Variable(s):

re

v Display frequency tables

( ok ) Easte Rese (Caneelj, Ha

19

Trang 20

VRange MISE meari

(contoue) _cancel (Help

Trong hộp thoại Chart nảy, nhấp chuột vào các ô đề chọn loại biêu đồ cần vẽ Có thé chon 1

trong 3 loại biếu đồ sau:

1 Bar: biêu đồ dạng thanh (dùng cho biến có giá trị rời rạc)

2 Pie: biéu dé hình tròn (dùng cho biến rời rạc có ít giá trị)

3 Histograms: biêu đồ phân phối tân số (dùng cho biến có các giá trị liên tục)

Sau khi chọn loại biểu đồ, nhấp chuột vào nút Continue để trở về hộp thoại Frequencies, và

nhân nút OK Kệt quả hiện ra như sau:

Trang 21

Khoa Quatin Trd Kinh Doanh Phân tích dữ liệu trong kinh doanh

Số lượng người đọc báo trong GD

Trang 22

Khoa Quatin Trd Kinh Doanh Phân tích dữ liệu trong kinh doanh

Histogram

Mean =3.47 Std Dev = 1.788 N= 868

5 10 15 20

Số lượng người doc bao trong GD

3.5 Mã hoá lại biến

Trong ví dụ nảy tuôi biến thiên từ 18-60, ta có thê chia thành 4 nhóm là:

8 8 & BH ©] B compute variable Lñ 4 Se %|

1 st " Variables 0 số thứ tự None

2_ tp 0 Thành phô {1, Hà Nội}

| (optional case selection condition) |

(eset) [Cancel _ Help )

1 Trong hép thoai Recode nay, chon bién can ma hoa lai (tudi) trong danh sách biến bên

tay trải đưa vào ô giữa

Trang 23

Khoa Quatn Tré Kinh Doanh Phân tích dữ liệu trong kinh doanh

2 Gõ tên của biễn mới (vi du là tuoi4nh) muốn tạo ra trong ô Output Variable Name roi

nhan nut Change

3 Nhắn vào nút Old and New Values, để xác định các giả trị cũ và chỉ định mã mới

tương ứng, hộp thoại sau xuât hiện:

Trang 24

© Range, LOWEST through value:

© Range, value through HIGHEST

@ value: |4 New Value

{5 Output variables are strings

©All other values

(continue) (cancel }(_Haip_]

Em m ©€31 £478 © BB Sth 40 *%

Name Type Width | Decimals Label Values

151 dotuoi Numeric 5 0 Độ tuổi {1, 18-25)

152 gtinh {1, Nam)

183 tncn -Value Labels {1, Không}

Kết quả sau khi mã hóa xong biến này sẽ biến thành biến định tính và thực hiện bảng thống kê

theo biên định tính ta thu được kêt quả như sau:

Trang 25

Khoa Quatin Trd Kinh Doanh Phân tích dữ liệu trong kinh doanh

Nhóm tuôi của khách hàng

3.6.1 Bang tan số I biến phân loại hay thứ bậc

Có 3 cấp bậc đo lường của biến là:

® - Nominal: dữ liệu từ thang đo định danh

¢ Ordinal: di ligu ti thang do thir bac

® - Scale: dữ liệu từ thang đo khoảng cách và thang đo tỉ lệ

Chon Analyze\ Tables \ Custom Tables hộp thoại Custom Tables hiện ra:

152 gtinh General Linear Model r U ry

Generalized Linear Models >

Trong ví dụ nảy, chúng ta muốn xem thử có bao nhiêu người trong mẫu khảo

sát ở Hà Nội và có bao nhiêu người trong mầu khảo sát ở TPHCM Biên cân dùng là biên tp

25

Trang 27

EiNEMILcmmj [Ci.¬-j

[RENO | onnah nnn

Thành pho TPHCM | — onnn} nnn a

data are scanned

r Totals and Subtotals Appear

© Aboye categories to which

Trang 28

Khoa Quatin Trd Kinh Doanh Phân tích dữ liệu trong kinh doanh

Nhấp nút OK lệnh thực hiện và bảng kết quả sau xuất hiện:

Ý nghĩa của từng giá trị trung bình đối với thang đo khoảng (Interval Scale)

Giá trị khoảng cách = (Maximum - Minimum) /n

=(5-1)/5

=0.8

1.81 ->2.60 _ Không đồng ý/Không hải lòng/ Không quan trọng

4.21 -> 5.00 Rất đồng ý/ Rất hai long/ Rat quan trong

3.6.4 Xử lý câu hồi chọn nhiều trả lời

3.6.4.1 Siw dung bang Custom Tables

Đối với câu hỏi có thê chọn nhiều tra lời, do người trả lời chọn nhiều ý nên khi nhập vào sẽ có nhiều biến Nếu tóm tắt các biến này bằng những lệnh thông thường như bảng tần số (Analyze

> Descriptive Statistics > Frequencies) hay bảng tùy biến (Analyze > Tables > Custom Tables) thi ứng với 1 câu hỏi loại này, có nhiều biến thì sẽ ra nhiều bảng tần số rời rạc, ít có ý nghĩa nêu không cộng các bảng này lại với nhau Đề có bảng tóm tắt hoàn chỉnh, chúng ta cần kết hợp các biến này lại Đi kèm với Custom Tables, SPSS cung cấp lệnh kết hợp biến nảy

Từ menu chon Analyze > Tables > Multiple Response Sets

3.6.4.2 Sir dung lénh chay bang Multiple Response

Đầu tiên chúng ta phải kết hợp các biến của cùng một câu hỏi, rồi sau đó chạy bảng Từ Menu chọn Analyze > Multiple Response

28

Trang 29

Ví dụ: ta cân lập bảng thông kê về thu nhập hộ gia đình ( tngd) phân tích cho từng thành phố (tp) được điều tra Đưa lần lượt biến tp vào ô Columns (ô cột ) và biến tngd vào 6 Row (6 dòng) Hình minh họa như sau:

Trong hộp thoại Summary Statistics chọn các hàm thống kê trong ô Statistics bên tay trái Đối với biến định tính, các hàm thường dùng là: Count (tần số), Row% (phần trăm theo dòng), Col% (phần trăm theo cột)

Trong vi dy nay, ta lần lượt chọn hàm Count và Hàm Column N % rồi nhấp vào nút mũi

tên đê đưa hàm đang chọn vào ô Display bên tay phai, nhap Apply to selection Hinh

minh họa như sau:

Ø

Selected Variable: TN hé TB thang

Statistics: Display:

Unweighted Count 3 | Statistics |Labet Format | Decimals |

29

Trang 30

Khoa Quatin Trd Kinh Doanh Phân tích dữ liệu trong kinh doanh cho từng thang đo (ví dụ, hình tròn và đồ thị dạng thanh bar) Bạn xây dựng một biêu đồ bằng cách kéo và thả các biến trong danh sách qua hộp thoại Builder Tương ứng với các mẫu đồ

thị đã được chọn và xem hình dạng của đồ thị được vẽ trong hộp thoại Builder

Đề vẽ đồ thị trong SPSS chúng ta cần phải hiệu rõ 4 bước đề thực hiện

=> Bước l: xác định dạng đồ thị thích hợp

~> Bước 2: xác định vùng dữ liệu và cầu trúc dữ liệu (theo hàng hay theo cột)

> Buwéc 3: các chỉ tiết của đỗ thị: tên đồ thị, tên trục đồ thị, đường lưới toa độ, vị trí phân chú thích của đồ thị, hiện nhãn giả trị

~> Bước 4: chỉnh sửa đồ thị phù hợp với mục đích nghiên cứu

Câu hỏi ôn tập chương 3

1) Sử dụng dữ liệu data cá nhân tiễn hành thực hiện các bảng thống kê và đồ thị tương

ứng với môi loại thang do sau:

+ Thang do dinh danh (Nominal Scale); Thang do thir bac (Ordinal Scale);

+ Thang do khoang cach (Interval Scale); Thang do ti lé (Ratio Scale) 2) Sử dụng dữ liệu data cá nhân tiến hành thực hiện các bảng thống kê kết hợp và đồ thị

tương ứng với môi loại dữ liệu sau:

+ Biến định tính kết hợp với biến định tính; Biến định lượng kết hợp với biến định tính; Biên định lượng kết hợp với biên định lượng

30

Trang 31

Khoa Quatin Trd Kinh Doanh Phân tích dữ liệu trong kinh doanh

CHƯƠNG 4 PHAN TICH DU LIEU ĐỊNH TÍNH 4.1, Kiém dinh Chi - Square

° Kiếm định Ch¡-Square: được sử dụng dé kiém dinh xem có tổn tại mối quan hệ giữa

hai yêu tô đang nghiên cứu trong tông thê Kiêm định này còn gọi lá kiêm định tính độc lập Kiếm định này phù hợp khi hai yêu tô này biên định

*ˆ : đại lượng Chi-Square dùng để kiêm định

0; : tần số quan sát thực tế trong các ô của bảng chéo

Ej : tần số quan sát lý thuyết trong các ô của bảng chéo

J được tính theo công thức sau:

i: tong sO quan sat của dòng thứ ¡

i: tong s6 quan sat cột thứ j

Đại lượng kiêm dinh nay cé phan phéi Chi - Square (Khi bình phương) Tra bảng phân phối

2 này ta sẽ có giá trị giới hạn với mức ý nghĩa œ và số bậc tự do bằng (r-1) x (c-1): No-one

- - Chấp nhận Họ nếu: Ý < Äứ-be-Da ; sigœ > 0.05

Ví dụ: nghiên cứu môi liên hệ giữa trình độ học van va cách đọc các tờ báo của người đọc Ta

lập bảng chéo đề tìm hiệu môi quan hệ nảy

31

Trang 32

Khoa Quaũn Trò Kinh Doanh

Tir Menu, chon Analyze -> Descriptive Statistics -> Crosstabs như sau:

E đi * [Ey Frequencies Label

—= L [i Descriptives ¬ oe Compare Means | a ctor ai trí khi rãnh

General Linear Model ' 'Effassap ải trí khi rãnh

Generalized Linear Models > a bee Ds oe

- Ratio

waxed Mads ' Ratio ải trí khi rãnh

Reoression + | RleePlœs tân

Lệnh này mở ra hộp thoại Crosstabs như hình sau:

Trang 33

Trong bảng kết quả nảy, có vẻ như học vấn càng cao thì cảng đọc báo theo kiêu “xem lướt các

đề mục, đọc các mục ưa thích trước” Đề kiếm định giả thuyết này, ta đặt giả thuyết

H 0 học vấn không có liên hệ tới cách đọc bảo

(cách đọc báo không chịu ảnh hưởng của học vấn)

Mở lại hộp thoại Crosstabs, từ trong hộp thoại Crosstabs, ta nhân nút Statistics, hộp thoại Crosstab: Statistics sau xuat hién:

"] Uncertainty coefficient _1 Kendall's tau-c

Nominal by Interval 1 ‘| Kappa

Eta Risk

~| Cochran's and Mantel-Haenszel statistics

Trong hộp thoại này ta đánh dấu chọn đại lượng Chỉ-Square, nhân nút Continue dé tro vé

hộp thoại trước Trong hộp thoại nảy nhân tiệp nút Cells để xác định các đại lượng thê hiện trong từng ô rồi nhân nut Continue, OK Ket quả sẽ hiện ra như trong trang sau:

Counts z-test

# Observed Expected A

~] Hide small counts

| Compare column proportions

@© Round cell counts © Round case weights

© Truncate cell counts © Truncate case weights

O No adjustments

33

Trang 34

Khoa Quatin Trd Kinh Doanh Phân tích dữ liệu trong kinh doanh Thay vì phải tra bảng Chỉ-Square tìm giá trị giới hạn ở bậc tự do 9 và mức ý nghĩa 0,05 (ứng với độ tin cậy 95%); rồi so sánh giá trị Chi-Square 22,098 với giá trị giới hạn này Chương trình SPSS da tính ngược lại mức ý nghĩa quan sat voi gia tri Chi - Square 22,098 Mirc y nghĩa quan sát này thuong duoc goi la P-Value hay Sig (Observed Significance Level), hay van tat la œ Với tốc độ tin cậy 95%, nguyên tắc quyết định là:

Trong vi du nay, sig = 0.009 < a = 0.05, ta bac bo gia thuyết H 0, Ta kết luận rằng đã có đủ

bằng chứng để nói rằng trình độ học vấn có liên hệ tới cách đọc báo Chúng ta có thể dựa vào các tỉ lệ % theo cột trong bảng chéo để mô tả sự liên hệ hay sự khác biệt về cách đọc báo giữa các nhóm học vẫn

Cach doc cac to bao noi chung * Hoc vAn Crosstabulation

DH Cach Count 37 147 36 57 277 đọc các | Đọc theo thứ tự từ|%

Trang 35

Khoa Quatin Trd Kinh Doanh Phân tích dữ liệu trong kinh doanh

Count 14 40 21 15 90 Chỉ đọc các trang

Xem các tin dang |%

4.2 Kiểm định trong trường hợp dữ liệu thứ tự

Trong trường hợp hai yếu tố nghiên cứu là hai biến thu thập tir thang do thir bac, thay vi ding đại lượng Chi-Square, chúng ta có thê dùng một trong các đại lượng sau: Tau của Kendall, d của Somer, Gamma của Goodman và Kruskal Các đại lượng này giúp phát hiện ra môi liên

hé tot hon Chi - Square

Gia sử chúng ta cần nghiên cứu nối liên hệ giữa học vấn với múc độ quan tâm đối với chủ đề

gia đỉnh trên bảo Sai Gon Tiệp Thị Vì cả hai yêu tô này đều là dữ liệu cấp bậc:

® - Học vấn: cấp 1-2, cấp 3- trung học chuyên nghiệp, tốt nghiệp CĐ- học ĐH, tốt nghiệp ĐH

se Mức độ quan tâm đến chủ đề gia đình: quan tâm nhất, quan tân thứ nhì, quan tâm thứ ba

Giả thuyết Hà, : học vẫn không có liên hệ tới mức độ quan tâm đến chủ đề gia đình trên bảo SGTT (hay mức độ quan tâm đến chủ đè gia đình không khác nhau giữa các nhóm học vấn)

35

Trang 36

Đề kiêm định giả thiết này, mở lại hộp thoại Crosstab Trong hộp thoại này đưa biến e19.3 (mức độ quan tâm đến chủ đề gia đình) vào ô Row và biến nhomhv (nhóm học vấn) vào ô

Column Rồi chọn Statistics

(ox _) paste} Reset cancel Hein |

Trong hộp thoại Statistics, ta chọn các đại lượng kiểm định như trong hình dưới Sau đó nhấp Continue trở về hộp thoại Crosstab và nhập OK

~] Cochran's and Mantel-Haenszel statistics

(contove)|_ cancer Help)

từng nhóm học vấn để mô tả sự liên hệ hay sự khác biệt về cách đọc báo giữa các nhóm học

£ A

van

36

Trang 37

Khoa Quatin Trd Kinh Doanh Phân tích dữ liệu trong kinh doanh

Case Processing Summary

N Percent N Percent N Percent

van

Gia dinh * Hoc van Crosstabulation

Hoc van Total

a | cells (8.3%) have expected count less than 5 The

minimum expected count is 3.42,

Directional Measures

Valu | Asymp Std | Approx | Approx

e€ Error* TP Sig

Ordinal by |Somers' | Symmetric -.125 060 -2.061 039

37

Ngày đăng: 03/01/2025, 21:44

HÌNH ẢNH LIÊN QUAN

Hình  trên  cho  biết,  trong  file  Data  thực  hành  các  biên  c29a1  đến  c29e  có  khai  bao  Missing - Bài giảng   môn học   phân tích dl trong kd
nh trên cho biết, trong file Data thực hành các biên c29a1 đến c29e có khai bao Missing (Trang 10)
Hình  minh  họa) - Bài giảng   môn học   phân tích dl trong kd
nh minh họa) (Trang 12)
Bảng  tần  số  có  thê  được  thực  hiện  với  tất  cả  các  biến  kiêu  số  (định  tính  và  định  lượng) - Bài giảng   môn học   phân tích dl trong kd
ng tần số có thê được thực hiện với tất cả các biến kiêu số (định tính và định lượng) (Trang 16)
Vào  ô  Variable(s)  sau  đó  nhân  nút  OK,  ta  được  2  bảng  tân  số  kết  quả  cho  hai  biến  đã  chọn - Bài giảng   môn học   phân tích dl trong kd
o ô Variable(s) sau đó nhân nút OK, ta được 2 bảng tân số kết quả cho hai biến đã chọn (Trang 17)
3.6.2  Bảng  kết  hợp  2  biến  phân  loại  hay  thứ  bậc - Bài giảng   môn học   phân tích dl trong kd
3.6.2 Bảng kết hợp 2 biến phân loại hay thứ bậc (Trang 28)
Bảng  câu  hỏi  sau  dựa  trên  thang  đo  Likert,  vì  đây  có  tính  chất  lý  thuyết  nên  tác  giả  chỉ  lấy  ra  not  phan  cua  ket  qua  khao  sát  thu  thập  được  từ  nhân  viên  như  sau: - Bài giảng   môn học   phân tích dl trong kd
ng câu hỏi sau dựa trên thang đo Likert, vì đây có tính chất lý thuyết nên tác giả chỉ lấy ra not phan cua ket qua khao sát thu thập được từ nhân viên như sau: (Trang 48)
Bảng  câu  hỏi:  anh/  chị  vui  lòng  đánh  giá  mức  độ  đông  ý  đối  với  mỗi  phát  biêu  dưới  đây - Bài giảng   môn học   phân tích dl trong kd
ng câu hỏi: anh/ chị vui lòng đánh giá mức độ đông ý đối với mỗi phát biêu dưới đây (Trang 48)
Bảng  Ma  trận  nhân  tố  đã  xoay  trong  két  qua  EFA  lan  1 - Bài giảng   môn học   phân tích dl trong kd
ng Ma trận nhân tố đã xoay trong két qua EFA lan 1 (Trang 56)
Bảng  Ma  trận  nhân  tố  đã  xoay  trong  kết  quả  EFA  lần  2 - Bài giảng   môn học   phân tích dl trong kd
ng Ma trận nhân tố đã xoay trong kết quả EFA lần 2 (Trang 57)
Hình  Partial  Regression  Plot - Bài giảng   môn học   phân tích dl trong kd
nh Partial Regression Plot (Trang 64)
Hình  2:  Đường  hồi  quy  của  doanh  số  và  chỉ  phí  chào  hàng. - Bài giảng   môn học   phân tích dl trong kd
nh 2: Đường hồi quy của doanh số và chỉ phí chào hàng (Trang 64)
Hình  1:  Hệ  số  hồi  quy - Bài giảng   môn học   phân tích dl trong kd
nh 1: Hệ số hồi quy (Trang 70)
Bảng  kết  quả  đánh  giá  đồ  phù  hợp  của  mé  hinh  héi  quy  (Model  Summary’  )  cho  thay,  su  dung  gia  trị  thống  kê  Adjusted  R  Square  đề  giải  thích  mức  độ  phù  hợp  của  mô  hình,  giá  trị  Adjusted  R  Square  của  mô  hình  =  0.4 - Bài giảng   môn học   phân tích dl trong kd
ng kết quả đánh giá đồ phù hợp của mé hinh héi quy (Model Summary’ ) cho thay, su dung gia trị thống kê Adjusted R Square đề giải thích mức độ phù hợp của mô hình, giá trị Adjusted R Square của mô hình = 0.4 (Trang 70)
Bảng  kết  quả  phân  tích  ANOVA  cho  thấy,  với  độ  tin  cậy  99.08%  (Sig  =  0.00  &lt;  0.05)  điều  đó  nói  lên  ý  nghĩa  mô  hình  lý  thuyết  phù  hợp  với  dữ  liệu  thực  tế  nghiên  cứu,  các  biến - Bài giảng   môn học   phân tích dl trong kd
ng kết quả phân tích ANOVA cho thấy, với độ tin cậy 99.08% (Sig = 0.00 &lt; 0.05) điều đó nói lên ý nghĩa mô hình lý thuyết phù hợp với dữ liệu thực tế nghiên cứu, các biến (Trang 71)

TỪ KHÓA LIÊN QUAN

w