Mã hóa dữ liệu Data Coding Là một tiến trình của việc nhóm và quy định những giá trị số học cho những hồi đáp trong bảng câu hỏi.. Nhập dữ liệu Data Entry Tạo một bảng tính spreadsh
Trang 1Phương pháp phân tích dữ liệu
Trang 3Sơ đồ tổng quát về chuẩn bị và phân tích dữ liệu
Chuẩn hóa
Hiệu chỉnh và
Mã hóa Nhập liệu
Tóm tắt dữ liệu
Phân tích dữ
liệu
Phân tích thống kê
Phân tích đơn biến, nhị biến
Phân tích
đa biến
Diễn dịch
Chuẩn bị dữ liệu Phát
hiện lỗi
Trang 4Xác nhận tính hợp lý của dữ liệu (Data validation)
Là quy trình xác định cuộc khảo sát, phỏng vấn
hoặc quan sát có được thực hiện đúng hay không
và không có gian lận cũng như sai lệch
Tiếp xúc lại mẫu phỏng vấn nếu trong trường hợp
bị sai lệch để làm cho hợp lý tiến trình thu thập
dữ liệu.
Trang 5Hiệu chỉnh dữ liệu (Data Editing)
Là tiến trình kiểm tra các lỗi của dữ liệu
Chính
xác Đối tượng nghiên cứu có thật sự trả lời bảng câu hỏi không?
Hợp lệ Đối tượng nghiên cứu có hiểu hướng dẫn
của bảng câu hỏi
Hoàn
thành
Đối tượng nghiên cứu có trả lời tất cả những câu hỏi trong bảng câu hỏi không?
Trang 6Quan điểm của bạn về bia Heineken là gì?
Rất không
có hương
vị
Rất có hương vị
Trang 7 Anh/chị có kế hoạch chi tiêu như thế nào về các loại thức uống cho một tuần? (tổng số bằng
Trang 8Mã hóa dữ liệu (Data Coding)
Là một tiến trình của việc nhóm và quy định những
giá trị số học cho những hồi đáp trong bảng câu hỏi
- Hợp nhất những loại hồi đáp
- Quy định mỗi loại hợp nhất
1 giá trị số học
Trang 11Nhập dữ liệu (Data Entry)
Tạo một bảng tính (spreadsheet) trong SPSS để nhập dữ
liệu
Questionnaire number: cho mỗi bảng câu hỏi
một con số
Name: “Q1”
Type: số hoặc chuỗi (numeric or string)
Label: mô tả biến
Value: quy định những giá trị số học cho các biến mô tả
Missing values: giá trị (“9” or “99”) quy định cho biến
Trang 12Tóm tắt dữ liệu dạng bảng (Data Tabulation)
Đây là một quá trình đơn giản của việc đếm số
lượng các quan sát mà các quan sát này được
phân loại thành các hạng mục nào đó
Bảng đơn(One-way tabulation): sự phân loại
của một biến đơn
Bảng chéo (Cross tabulation): sự phân loại của những biến kép
Trang 13
Bảng đơn
Mức độ thích
thương hiệu
Tần số tuyệt đối
Tần số tương đối (%)
Tần số tích lũy (%)
Trang 15Tóm tắt dữ liệu dạng đồ thị
Tiệm tạp hóa 15%
Chợ 25%
Siêu thị 35%
Online
25%
Nơi thường mua dầu gội
Trang 16Sơ đồ tổng quát về chuẩn bị và phân tích dữ liệu
Chuẩn hóa
Hiệu chỉnh và
Mã hóa Nhập liệu
Đưa dữ liệu vào bảng Phân tích dữ
liệu
Phân tích thống kê
Phân tích đơn biến, nhị biến
Phân tích
đa biến
Diễn dịch
Chuẩn bị dữ liệu Phát
hiện lỗi
Trang 17Các loại phân tích thống kê
Thống kê mô tả (Descriptive analysis)
mô tả những đặc điểm chính của dữ liệu
Kiểm định sự khác biệt (Test of Differences) kiểm định sự khác biệt của
Trang 18Phân tích mô tả
Trang 19Phân tích mô tả
Trang 20Đo lường khuynh hướng trung tâm
Mức độ đo lường càng cao
Nhiều phân tích hơn được sử
Trang 21Đo lường khuynh hướng tập trung: Mode
Mode (chủ yếu sử dụng cho thang đo Định danh, cũng có thể
được sử dụng cho thang đo thứ tự, khoảng, tỉ lệ)
Mode là giá trị xuất hiện trong phân phối thường xuyên nhất
√
√
Trang 22Đo lường khuynh hướng tập trung: Mode
cũng có thể sử dụng cho thang đo thứ tự, khoảng, tỉ lệ)
Trang 23Đo lường khuynh hướng tập trung: Mode
Mode là giá trị xuất hiện trong phân phối thường xuyên nhất
1, 2, 1, 1, 1, 2, 1,1, 1, 2, 1, 1, 2, 1, 1, 2
20, 20, 21, 22, 20, 24, 20, 23, 20, 20, 20
Trang 24Đo lường khuynh hướng tập trung: Median
Median (sử dụng chủ yếu cho thang đo thứ tự; cũng có thể được sử dụng cho thang đo tỉ lệ và thang đo khoảng)
Median là giá trị ở giữa của bảng phân phối, phân nữa hồi đáp ở trên và phân nữa hồi đáp ở dưới
X
√
Trang 25Đo lường khuynh hướng tập trung: Median
Median ( sử dụng chủ yếu cho thang đo thứ tự; cũng
có thể được sử dụng cho thang đo tỉ lệ và thang đo khoảng )
Trang 26Đo lường khuynh hướng tập trung:Median
Trang 27Đo lường khuynh hướng tập trung: Mean
Mean là giá trị trung bình của phân phối
X
X
Trang 28Đo lường khuynh hướng trung tâm: Mean
Mean được sử dụng cho thang đo khoảng và tỉ lệ
Mean là giá trị trung bình của phân phối
µ: trung bình tổng thể : trung bình mẫu X
√
Bạn bao nhiêu tuổi? _
√
Trang 29Đo lường sự biến thiên/phân tán
lường khuynh hướng tập trung (i.e Sự giống nhau của hồi đáp)
Phân phối tần số theo từng hạng mục (Frequency distribution)
Khoảng biến thiên (Range)
Độ lệch chuẩn (Standard deviation)
Trang 30
Đo lường sự biến thiên: Frequency
Frequency distribution chủ yếu được sử dụng cho thang đo
Trang 31Đo lường sự biến thiên: Range
Range chủ yếu được sử dụng cho thang đo thứ tự
nhất
1, 3, 2, 6, 2, 2, 2, 5, 3, 1, 7, 2, 4, 5, 3, 3 Range = 7 – 1 = 6
Trang 32Đo lường sự biến thiên: Standard Deviation
Standard deviation được sử dụng cho thang đo khoảng
1
2
Trang 33Tóm tắt: Phân tích mô tả
Mức độ đo
lường
Đo lường khuynh hướng trung tâm
Đo lường sự biến thiên
Thang đo Định
Thang đo
khoảng và tỉ lệ Mean
Standard Deviation
Trang 34Ứng dụng SPSS – Phân tích mô tả
Đo lường khuynh hướng trung tâm
Analyse Descriptive Statistics Frequencies Statistics
Đo lường sự biến thiên
Analyse Descriptive Statistics Frequencies Statistics
Trang 35Bài tập
Mã hóa dữ liệu
Nhập dữ liệu
Phân tích mô tả
Trang 36Sơ đồ tổng quát về chuẩn bị và phân tích dữ liệu
Chuẩn hóa
Hiệu chỉnh và
Mã hóa Nhập liệu
Đưa dữ liệu vào bảng Phân tích dữ
liệu
Phân tích thống kê
Phân tích đơn biến, nhị biến
Phân tích
đa biến
Diễn dịch
Chuẩn bị dữ liệu Phát
hiện lỗi
Trang 37Kiểm định giả thuyết (Hypothesis Testing)
Một giả thuyết là sự dự đoán của nhà nghiên cứu về 1) những đặc tính của một biến; hoặc
2) mối quan hệ giữa các biến được kiểm định trong nghiên cứu
Giả thuyết không
dự đoán hoặc mong đợi
Giả thuyết thay thế
(Alternative Hypothesis)
Ký hiệu: H1/Ha
Những gì nhà nghiên cứu dự đoán hoặc mong đợi
Trang 39Chắc chắn không giới thiệu 1 2 3 4 5 6 7 Chắc chắn giới thiệu
“Khả năng bạn giới thiệu thương hiệu B với 1 người bạn như thế nào ?”
Chắc chắn không giới thiệu 1 2 3 4 5 6 7 Chắc chắn giới thiệu
Trang 41
Ý nghĩa thống kê (Statistical Significance)
Mức ý nghĩa (Level of significance): xác suất của việc tạo ra
sai lầm loại I (α), thường là 5%
Độ tin cậy (Confidence level): 1- α
Trang 42Các bước kiểm định 1 giả thuyết
Bước 1: Bắt đầu với giả thuyết (Ho, Ha) dựa trên giả
định hoặc nghiên cứu trước đây (kiểm định một đuôi
Vs Kiểm định 2 đuôi)
Bước 2: Chọn 1 mức ý nghĩa (5% hoặc 1%)
Bước 3: Xác định phép kiểm định thích hợp và tính giá trị thống kê kiểm định (p value; ý nghĩa thống kê thật sự của kết quả)
Bước 4: Xác định giá trị tới hạn của phép kiểm định
Bước 5: So sánh giá trị kiểm định với giá trị tới hạn
để ra quyết định (từ chối hay bác bỏ giả thuyết)
Nếu p >α: Chấp nhận Ho (bác bỏ Ha) Nếu p < α : từ chối Ho (chấp nhận Ha)
Trang 43Phân tích khác biệt
Thương hiệu nào có chất lượng tốt hơn?
Trang 44Phân tích khác biệt
Kiểm định sự khác biệt giữa những giá trị trung bình
của các nhóm nhỏ trong 1 đo lường; hoặc giữa giá trị trung bình của cùng nhóm nhỏ trong những lần đo lường lặp
Nhóm 1: Bạn thích iPhone như thế nào?
Nhóm 2: Bạn thích iPhone như thế nào?
Nhóm 1: Bạn thích iPhone như thế nào?
Bạn thích Samsung Galaxy như thế nào?
Nhóm 1: Bạn thích iPhone như thế nào? (tháng đầu) Bạn thích iPhone như thế nào (tháng thứ 2)
Trang 45Những loại kiểm định trong phân tích khác biệt
Loại kiểm
One Sample
T-Test
Independent
Samples T-Test
Paired Samples
T-Test
Trang 46One Sample T-Test
Trang 49Sig (1-tailed) = Sig (2-tailed)/2 = 0.059
P value = 0.059
Trang 50Independent Samples T-Tests
Example: H0: mean (nam) = mean (nữ)
Ha: mean (nam) ≠ mean (nữ)
Trang 51Independent Samples T-Tests
Example: H0: mean (nam) = mean (nữ)
Ha: mean (nam) ≠ mean (nữ)
2 nhóm; thang đo khoảng
independent sample t-test
Mức ý nghĩa: 5%
Biến kểm định: khả năng bay
Biến nhóm: giới tính (nam vs nữ)
Trang 54Ho: variances (nam) = variances (nữ) Ha: variances (nam) ≠ variances (nữ)
Trang 55Paired Samples T-Tests
Example: H0: mean (lần 1) >= mean (lần 2)
Ha: mean (lần 1) < mean (lần 2)
Đo lường cùng đáp viên 2 lần:
lần đầu : tháng 2 lần 2 : tháng 7
Trang 58Sig.(1-tailed) = Sig (2-tailed) / 2
Trang 59ANOVA Tests
Example: H0: mean (N1) = mean (N2) = mean (N3)
Ha: mean (N1) ≠ mean (N2) ≠ mean (N3) (Bất kỳ của 3 nhóm này là khác nhau)
Trang 65Bài tập
Sài Gòn Bakery được thành lập cách đây 5 năm ở
Tp.HCM Tiệm bánh bán đa dạng bánh mì Việt và bánh
mì Ý
Để biết khách hàng cảm thấy như thế nào khi họ mua bánh mì tại Sài Gòn Backery Người quản lý thuê bạn để thực hiện một cuộc khảo sát nhỏ
Để làm nghiên cứu, bạn đã khảo sát 45 đối tượng bằng cách phỏng vấn những khách hàng đến cửa hàng vào
tháng 5/ 2013
Trang 66Bài tập
Mỗi đối tượng được hỏi 4 câu hỏi:
1) Bạn đánh giá như thế nào về chất lượng của bánh mì?
Trang 67Bài tập
Giữa tháng 5 và tháng 7, người quản lý đã thay đổi một vài thứ trong tiệm bánh Vì vậy vào tháng 7, quản lý yêu cầu bạn làm một cuộc khảo sát nhỏ với cùng các đối tượng nghiên
cứu một lần nữa Lần này, bạn chỉ đo lường sự hài lòng của
họ với tiệm bánh
Vì vậy tổng cộng, bạn sẽ thấy 6 biến trong dữ liệu Sài Gòn Backery 6 biến này là “id”; “chất lượng”; “sự hài lòng”; “ưa thích”; “tần số”; “sự hài lòng-lặp lại”
Trang 68Bài tập
Câu 1: Phân tích thống kê mô tả các biến nghiên cứu
Câu hỏi 2: Kiểm định xem có hay không những khách
hàng thích bánh mì Ý có đánh giá về chất lượng tốt hơn và hài lòng về tiệm bánh hơn những khách hàng thích bánh
bì Việt
Câu hỏi 3: Kiểm định có hay không những khách hàng có
số lần mỗi tuần đến tiệm bánh khác nhau thì đánh giá chất lượng và sự hài lòng khác nhau về tiệm bánh
Câu hỏi 4: Kiểm định có hay không việc khách hàng thay đổi sự hài lòng của họ về tiệm bánh từ tháng 5 đến tháng 7