1. Trang chủ
  2. » Thể loại khác

Bài giảng 7 phương pháp phân tích dữ liệu

68 439 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 68
Dung lượng 1,9 MB

Nội dung

Mã hóa dữ liệu Data Coding  Là một tiến trình của việc nhóm và quy định những giá trị số học cho những hồi đáp trong bảng câu hỏi.. Nhập dữ liệu Data Entry  Tạo một bảng tính spreadsh

Trang 1

Phương pháp phân tích dữ liệu

Trang 3

Sơ đồ tổng quát về chuẩn bị và phân tích dữ liệu

Chuẩn hóa

Hiệu chỉnh và

Mã hóa Nhập liệu

Tóm tắt dữ liệu

Phân tích dữ

liệu

Phân tích thống kê

Phân tích đơn biến, nhị biến

Phân tích

đa biến

Diễn dịch

Chuẩn bị dữ liệu Phát

hiện lỗi

Trang 4

Xác nhận tính hợp lý của dữ liệu (Data validation)

 Là quy trình xác định cuộc khảo sát, phỏng vấn

hoặc quan sát có được thực hiện đúng hay không

và không có gian lận cũng như sai lệch

 Tiếp xúc lại mẫu phỏng vấn nếu trong trường hợp

bị sai lệch để làm cho hợp lý tiến trình thu thập

dữ liệu.

Trang 5

Hiệu chỉnh dữ liệu (Data Editing)

 Là tiến trình kiểm tra các lỗi của dữ liệu

Chính

xác Đối tượng nghiên cứu có thật sự trả lời bảng câu hỏi không?

Hợp lệ Đối tượng nghiên cứu có hiểu hướng dẫn

của bảng câu hỏi

Hoàn

thành

Đối tượng nghiên cứu có trả lời tất cả những câu hỏi trong bảng câu hỏi không?

Trang 6

Quan điểm của bạn về bia Heineken là gì?

Rất không

có hương

vị

Rất có hương vị

Trang 7

 Anh/chị có kế hoạch chi tiêu như thế nào về các loại thức uống cho một tuần? (tổng số bằng

Trang 8

Mã hóa dữ liệu (Data Coding)

 Là một tiến trình của việc nhóm và quy định những

giá trị số học cho những hồi đáp trong bảng câu hỏi

- Hợp nhất những loại hồi đáp

- Quy định mỗi loại hợp nhất

1 giá trị số học

Trang 11

Nhập dữ liệu (Data Entry)

 Tạo một bảng tính (spreadsheet) trong SPSS để nhập dữ

liệu

Questionnaire number: cho mỗi bảng câu hỏi

một con số

Name: “Q1”

Type: số hoặc chuỗi (numeric or string)

Label: mô tả biến

Value: quy định những giá trị số học cho các biến mô tả

Missing values: giá trị (“9” or “99”) quy định cho biến

Trang 12

Tóm tắt dữ liệu dạng bảng (Data Tabulation)

 Đây là một quá trình đơn giản của việc đếm số

lượng các quan sát mà các quan sát này được

phân loại thành các hạng mục nào đó

 Bảng đơn(One-way tabulation): sự phân loại

của một biến đơn

 Bảng chéo (Cross tabulation): sự phân loại của những biến kép

Trang 13

Bảng đơn

Mức độ thích

thương hiệu

Tần số tuyệt đối

Tần số tương đối (%)

Tần số tích lũy (%)

Trang 15

Tóm tắt dữ liệu dạng đồ thị

Tiệm tạp hóa 15%

Chợ 25%

Siêu thị 35%

Online

25%

Nơi thường mua dầu gội

Trang 16

Sơ đồ tổng quát về chuẩn bị và phân tích dữ liệu

Chuẩn hóa

Hiệu chỉnh và

Mã hóa Nhập liệu

Đưa dữ liệu vào bảng Phân tích dữ

liệu

Phân tích thống kê

Phân tích đơn biến, nhị biến

Phân tích

đa biến

Diễn dịch

Chuẩn bị dữ liệu Phát

hiện lỗi

Trang 17

Các loại phân tích thống kê

Thống kê mô tả (Descriptive analysis)

mô tả những đặc điểm chính của dữ liệu

Kiểm định sự khác biệt (Test of Differences) kiểm định sự khác biệt của

Trang 18

Phân tích mô tả

Trang 19

Phân tích mô tả

Trang 20

Đo lường khuynh hướng trung tâm

Mức độ đo lường càng cao

Nhiều phân tích hơn được sử

Trang 21

Đo lường khuynh hướng tập trung: Mode

Mode (chủ yếu sử dụng cho thang đo Định danh, cũng có thể

được sử dụng cho thang đo thứ tự, khoảng, tỉ lệ)

Mode là giá trị xuất hiện trong phân phối thường xuyên nhất

Trang 22

Đo lường khuynh hướng tập trung: Mode

cũng có thể sử dụng cho thang đo thứ tự, khoảng, tỉ lệ)

Trang 23

Đo lường khuynh hướng tập trung: Mode

 Mode là giá trị xuất hiện trong phân phối thường xuyên nhất

1, 2, 1, 1, 1, 2, 1,1, 1, 2, 1, 1, 2, 1, 1, 2

20, 20, 21, 22, 20, 24, 20, 23, 20, 20, 20

Trang 24

Đo lường khuynh hướng tập trung: Median

Median (sử dụng chủ yếu cho thang đo thứ tự; cũng có thể được sử dụng cho thang đo tỉ lệ và thang đo khoảng)

Median là giá trị ở giữa của bảng phân phối, phân nữa hồi đáp ở trên và phân nữa hồi đáp ở dưới

X

Trang 25

Đo lường khuynh hướng tập trung: Median

Median ( sử dụng chủ yếu cho thang đo thứ tự; cũng

có thể được sử dụng cho thang đo tỉ lệ và thang đo khoảng )

Trang 26

Đo lường khuynh hướng tập trung:Median

Trang 27

Đo lường khuynh hướng tập trung: Mean

Mean là giá trị trung bình của phân phối

X

X

Trang 28

Đo lường khuynh hướng trung tâm: Mean

 Mean được sử dụng cho thang đo khoảng và tỉ lệ

 Mean là giá trị trung bình của phân phối

µ: trung bình tổng thể : trung bình mẫu X

Bạn bao nhiêu tuổi? _

Trang 29

Đo lường sự biến thiên/phân tán

lường khuynh hướng tập trung (i.e Sự giống nhau của hồi đáp)

Phân phối tần số theo từng hạng mục (Frequency distribution)

Khoảng biến thiên (Range)

Độ lệch chuẩn (Standard deviation)

Trang 30

Đo lường sự biến thiên: Frequency

Frequency distribution chủ yếu được sử dụng cho thang đo

Trang 31

Đo lường sự biến thiên: Range

Range chủ yếu được sử dụng cho thang đo thứ tự

nhất

1, 3, 2, 6, 2, 2, 2, 5, 3, 1, 7, 2, 4, 5, 3, 3 Range = 7 – 1 = 6

Trang 32

Đo lường sự biến thiên: Standard Deviation

 Standard deviation được sử dụng cho thang đo khoảng

1

2

Trang 33

Tóm tắt: Phân tích mô tả

Mức độ đo

lường

Đo lường khuynh hướng trung tâm

Đo lường sự biến thiên

Thang đo Định

Thang đo

khoảng và tỉ lệ Mean

Standard Deviation

Trang 34

Ứng dụng SPSS – Phân tích mô tả

 Đo lường khuynh hướng trung tâm

Analyse  Descriptive Statistics  Frequencies  Statistics

 Đo lường sự biến thiên

Analyse  Descriptive Statistics  Frequencies  Statistics

Trang 35

Bài tập

 Mã hóa dữ liệu

 Nhập dữ liệu

 Phân tích mô tả

Trang 36

Sơ đồ tổng quát về chuẩn bị và phân tích dữ liệu

Chuẩn hóa

Hiệu chỉnh và

Mã hóa Nhập liệu

Đưa dữ liệu vào bảng Phân tích dữ

liệu

Phân tích thống kê

Phân tích đơn biến, nhị biến

Phân tích

đa biến

Diễn dịch

Chuẩn bị dữ liệu Phát

hiện lỗi

Trang 37

Kiểm định giả thuyết (Hypothesis Testing)

 Một giả thuyết là sự dự đoán của nhà nghiên cứu về 1) những đặc tính của một biến; hoặc

2) mối quan hệ giữa các biến được kiểm định trong nghiên cứu

Giả thuyết không

dự đoán hoặc mong đợi

Giả thuyết thay thế

(Alternative Hypothesis)

 Ký hiệu: H1/Ha

 Những gì nhà nghiên cứu dự đoán hoặc mong đợi

Trang 39

Chắc chắn không giới thiệu 1 2 3 4 5 6 7 Chắc chắn giới thiệu

“Khả năng bạn giới thiệu thương hiệu B với 1 người bạn như thế nào ?”

Chắc chắn không giới thiệu 1 2 3 4 5 6 7 Chắc chắn giới thiệu

Trang 41

Ý nghĩa thống kê (Statistical Significance)

Mức ý nghĩa (Level of significance): xác suất của việc tạo ra

sai lầm loại I (α), thường là 5%

Độ tin cậy (Confidence level): 1- α

Trang 42

Các bước kiểm định 1 giả thuyết

Bước 1: Bắt đầu với giả thuyết (Ho, Ha) dựa trên giả

định hoặc nghiên cứu trước đây (kiểm định một đuôi

Vs Kiểm định 2 đuôi)

 Bước 2: Chọn 1 mức ý nghĩa (5% hoặc 1%)

 Bước 3: Xác định phép kiểm định thích hợp và tính giá trị thống kê kiểm định (p value; ý nghĩa thống kê thật sự của kết quả)

 Bước 4: Xác định giá trị tới hạn của phép kiểm định

 Bước 5: So sánh giá trị kiểm định với giá trị tới hạn

để ra quyết định (từ chối hay bác bỏ giả thuyết)

Nếu p >α: Chấp nhận Ho (bác bỏ Ha) Nếu p < α : từ chối Ho (chấp nhận Ha)

Trang 43

Phân tích khác biệt

Thương hiệu nào có chất lượng tốt hơn?

Trang 44

Phân tích khác biệt

 Kiểm định sự khác biệt giữa những giá trị trung bình

của các nhóm nhỏ trong 1 đo lường; hoặc giữa giá trị trung bình của cùng nhóm nhỏ trong những lần đo lường lặp

 Nhóm 1: Bạn thích iPhone như thế nào?

Nhóm 2: Bạn thích iPhone như thế nào?

Nhóm 1: Bạn thích iPhone như thế nào?

Bạn thích Samsung Galaxy như thế nào?

Nhóm 1: Bạn thích iPhone như thế nào? (tháng đầu) Bạn thích iPhone như thế nào (tháng thứ 2)

Trang 45

Những loại kiểm định trong phân tích khác biệt

Loại kiểm

One Sample

T-Test

Independent

Samples T-Test

Paired Samples

T-Test

Trang 46

One Sample T-Test

Trang 49

Sig (1-tailed) = Sig (2-tailed)/2 = 0.059

P value = 0.059

Trang 50

Independent Samples T-Tests

Example: H0: mean (nam) = mean (nữ)

Ha: mean (nam) ≠ mean (nữ)

Trang 51

Independent Samples T-Tests

 Example: H0: mean (nam) = mean (nữ)

Ha: mean (nam) ≠ mean (nữ)

2 nhóm; thang đo khoảng

 independent sample t-test

Mức ý nghĩa: 5%

Biến kểm định: khả năng bay

Biến nhóm: giới tính (nam vs nữ)

Trang 54

Ho: variances (nam) = variances (nữ) Ha: variances (nam) ≠ variances (nữ)

Trang 55

Paired Samples T-Tests

 Example: H0: mean (lần 1) >= mean (lần 2)

Ha: mean (lần 1) < mean (lần 2)

Đo lường cùng đáp viên 2 lần:

lần đầu : tháng 2 lần 2 : tháng 7

Trang 58

Sig.(1-tailed) = Sig (2-tailed) / 2

Trang 59

ANOVA Tests

 Example: H0: mean (N1) = mean (N2) = mean (N3)

Ha: mean (N1) ≠ mean (N2) ≠ mean (N3) (Bất kỳ của 3 nhóm này là khác nhau)

Trang 65

Bài tập

 Sài Gòn Bakery được thành lập cách đây 5 năm ở

Tp.HCM Tiệm bánh bán đa dạng bánh mì Việt và bánh

mì Ý

 Để biết khách hàng cảm thấy như thế nào khi họ mua bánh mì tại Sài Gòn Backery Người quản lý thuê bạn để thực hiện một cuộc khảo sát nhỏ

 Để làm nghiên cứu, bạn đã khảo sát 45 đối tượng bằng cách phỏng vấn những khách hàng đến cửa hàng vào

tháng 5/ 2013

Trang 66

Bài tập

Mỗi đối tượng được hỏi 4 câu hỏi:

1) Bạn đánh giá như thế nào về chất lượng của bánh mì?

Trang 67

Bài tập

 Giữa tháng 5 và tháng 7, người quản lý đã thay đổi một vài thứ trong tiệm bánh Vì vậy vào tháng 7, quản lý yêu cầu bạn làm một cuộc khảo sát nhỏ với cùng các đối tượng nghiên

cứu một lần nữa Lần này, bạn chỉ đo lường sự hài lòng của

họ với tiệm bánh

 Vì vậy tổng cộng, bạn sẽ thấy 6 biến trong dữ liệu Sài Gòn Backery 6 biến này là “id”; “chất lượng”; “sự hài lòng”; “ưa thích”; “tần số”; “sự hài lòng-lặp lại”

Trang 68

Bài tập

 Câu 1: Phân tích thống kê mô tả các biến nghiên cứu

 Câu hỏi 2: Kiểm định xem có hay không những khách

hàng thích bánh mì Ý có đánh giá về chất lượng tốt hơn và hài lòng về tiệm bánh hơn những khách hàng thích bánh

bì Việt

 Câu hỏi 3: Kiểm định có hay không những khách hàng có

số lần mỗi tuần đến tiệm bánh khác nhau thì đánh giá chất lượng và sự hài lòng khác nhau về tiệm bánh

 Câu hỏi 4: Kiểm định có hay không việc khách hàng thay đổi sự hài lòng của họ về tiệm bánh từ tháng 5 đến tháng 7

Ngày đăng: 15/02/2017, 11:33

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w