Các công cụ trực quan thường dùng nhất là các biểu đồ s* Phân loại: 2 loại Thống kê trung bình: thường được sử dụng với các biến định lượng, dùng đề thống kê các chỉ số phân tích như giá
Trang 1CHƯƠNG 7
PHUONG PHAP THONG KE MO TA VA PHAN TiCH DU
LIEU DINH LUQNG
GIẢNG VIÊN HƯỚNG DÂN: Nguyễn Giác Trí
Đồng Tháp, tháng 01/2024
Trang 2
MỤC LỤC
BANG ĐÁNH GIÁ CÁC THÀNH VIÊN 5s cse+vsvsrsertettrserssrsrsrrssssrsrvee 7.1 Một Số Phương Pháp Thống Kê Mơ Tả - se 2 se sseesseeseessersersessrs 7.1.1 Thống kê tần SuẤT: s- se set +sSzseYsEYSeEseEvsEEseEvseTseErsersetrsvsessersereree
7.1.1.1 Đầu tiên chúng ta bắt đầu với bang tần suất đạng tơng hợp (Frequeneies) -. -‹s«‹:
7.1.1.3 Phân tích bảng tần suất theo từng nhĩm như thé m0? .cc.ccscecscessccssssessesscssuessesseseesesseseesssneee 11 7.1.2 Thơng kê tần số: 12 7.1.2.1 Định nghĩa thốnng kê tần số: ¿525252 SE E 2 SYEE1111111111111111111111111111111111111 1 1c 12 7.1.2.2 Cách thức thực hiện thống kê tần số bằng SPSS 13 7.1.2.3 Phân tích kết quả thống kê tan số trong phần mém SPSS 1ĩ 7.1.3 Thống kê trị trung bình 18
7.1.3.3 Các bước chạy thống kê 19
7.1.4 Bảng chéo (Cross- TabuÌatÏOn) ‹ c co 0.1 4 HH Y nh nh n1 vip 21
7.1.4.1 Khái niệm của bảng chéo: 21
7.1.4.2 Cách thức tiễn hành phân tích bảng chéo erosstabulation 2
7.1.4.3 Cách đọc kết quả kiêm định bảng chéo 24 7,2 Phương Pháp Phân Tích Dữ Liệu Định Lurợng 5< 55c 5 55s s3 3s ss<+ 24 7.2.1 Kiểm định độ tin cậy cronbach'*s alpba 5s s se sccseseecseessesescse 24
7.2.1.1 Bản chất cronbach aÏpha: - 6-5: 5252 2+ 2 211112112 111111111111111111111111111111111 111111111 24
7.2.1.1.1 Định ng hÏa: 5 <6 c5 1v HH HT Tu HH HH HH TH the 24 7.2.1.1.2 Mục đích 25
7.2.1.1.3 Tính chất và giá trị 26 7.2.1.1.4 Điều kiện sử dụng 26
7.2.1.1.5 Cách tính Cronbachs aÌppha - - «6 «k1 1 3 TH TH Tu Hà nhe 27
7.2.1.1.6 Hạn chế của Cronbach’s alpha 29 7.2.1.2 Vi du vé Cronbach’s Alphha LH HT HT HH TH TH HH TH ni HE 29
7.2.1.3 Các bước chạy Cronbach”s Alpha chỉ tiẾt - ác 5c 56 xe x21 1121121121111111111111 111,1 31
7.2.1.4 Hướng dẫn cách đọc kết qua 33
7.2.1.5 Bốn vấn đề cần lưu ý khi sử dụng Cronbach's alpha 5c + 562 xxx ky sk, 34
Trang 37.2.1.5.2 Xác định số lượng mục cần thiết cho bộ câu hỏi
7.2.2.Phân tích nhân tổ khám phá
7.2.2.5 Mục tiêu của chay EFA
7.2.4 Phân tích hồi quy bội
7.2.4.1 Tìm hiểu về hồi quy bội
7.2.4.1.1 Hồi quy bội là gì?
7.2.4.1.3.1 Phương trình hồi quy bội:
7.2.4.2.3.1 Phương trình hồi quy đơn
7.2.4.2.3.3 Kiểm định giả thuyết:
7.2.4.2.3.4 Hệ số R-bình phương:
34
7.2.1.5.3 Phân tích hệ số tương quan giữa các mục 34
7.2.1.5.4 Kiểm tra tính đồng nhất của một mục 34
— 34 7.2.2.1 Phân tích nhân tố khám phá EFA là gì? 34 7.2.2.2 Các tiêu chí trong phân tích E.E A s- 5 2à 3H HH HH TH HH nh 3ó 7.2.2.3 So sanh gitra EFA va CFA (Confirmatory Factor AnaÌySIS) che 38
7.2.2.4 Hướng dẫn thực hiện EFA trong SPSS «cà HT HT ghe 40
44
sex, 45
45 cenneseanes 45
7.2.3.1 Hệ số tương quan Pearson (R) là gì? 45
7.2.3.2 Yêu cầu về dữ liệu SPSS khi phân tích tương quan Pearson - c5 5seccxcexxccxeex 4ó 7.2.3.3 Lý thuyết về trơng quan Pearson 47 7.2.3.4 Cách chạy tương quan Pearson bằng SPSS 50 7.2.3.5 Đọc kết quả tương quan Pearson -‹ -6-5scScc + E12 1311111111111111111111 1.11111111111111 tr Hy 51
7.2.3.5.1 Tương quan giữa biến độc lập với biến phụ thuộc - các 5c 5xx s2 s, 51
7.2.3.5.2 Tương quan giữa các biến độc lập với nhau 52 7.2.3.5 Hệ số trơng quan hạng (Rank correlation coefficient) 52
¬ 53 53
53 7.2.4.1.2 Mục đích phân tích hồi quy bội - 6-5: ©5252 E1 x2 S11112111111112111111 1111111111111 ct, 53
54
¬" 54 cesses 57
¬" 57 sees 57
57
57
"¬ 58
58
Trang 47.2.4.3 So sánh hồi quy bội và hồi quy đơn
7.2.4.3.1 Điêm giống nhau
7.2.4.4.4 Ước lượng hỏi quy tuyến tinh bang OLS
7.2.4.4.5 Độ phù hợp của mô hình và phần dư
— 60
60
" ó1 ó1 ó1
7.2.4.6.4 Kiêm định đa cộng tuyến
7.2.4.7 Giả thuyết ý nghĩa hệ số hồi quy
Trang 5BANG DANH GIA CÁC THÀNH VIÊN
Họ và tên MSSV Nhiệm vụ Nhận xét của nhóm
trưởng Huỳnh Thị Km | 0022411825 - Tìm kiếm nội dung | - Hoàn thành tốt nhiệm
100% - Làm phiếu đề xuất | - Tích cực tham gia thảo
luận
- Nộp bài đúng hạn
Nguyễn Ngọc 0022411940 - Tìm kiếm nội đung | - Hoàn thành tốt nhiệm
100% - Power poin - Tích cực tham gia thao
- Làm phiếu đề xuất luận
100% - Làm phiếu đề xuất | - Tích cực tham gia thảo
luận
- Nộp bài đúng hạn
Nguyễn Thị 0022412179 -Tìm kiếm nội dung | - Hoàn thành tốt nhiệm
100% - Làm phiếu đề xuất | - Tích cực tham gia thảo
Trang 6100% - Làm phiếu đề xuất | - Tích cực tham gia thảo
luận
- Nộp bài đúng hạn
Trang 7
CHƯƠNG 7 PHƯƠNG PHÁP THONG KE MO TA VA PHAN TICH DU LIEU DINH LUQNG
7.1 Một Số Phương Pháp Thống Kê Mô Ta
s* Khái niệm:
Thong ké m6 ta (Descriptive Statistics) la cac phuong phap str dụng đề tóm tắt hoặc mô tả một tập hợp dữ liệu, một mẫu nghiên cứu dưới dạng số hay biêu đồ trực quan Các công cụ số dùng đề mô tả thường dùng nhất là trung bình cộng và độ lệch chuẩn Các công cụ trực quan thường dùng nhất là các biểu đồ
s* Phân loại: 2 loại
Thống kê trung bình: thường được sử dụng với các biến định lượng, dùng đề thống
kê các chỉ số phân tích như giá trị trung bình (mean), giá trị lớn nhất, nhỏ nhất (max,
min), độ lệch chuẩn (standard deviation),
Thống kê tần số: thường được áp dụng cho các biến định tính, đùng đề đọc mức độ (tần số) các chỉ số xuất hiện trong tập mẫu Thông thường, các biến ở đây sẽ là những đặc
điểm nhân khẩu học như độ tuôi,giới tính, nghề nghiệp, bộ phận làm việc, thâm niên, học
vấn, thu nhập
Mục đích:
Cung cấp các thông tin cơ bản liên quan đến tập mẫu
Làm nôi bật các mối quan hệ có thê có giữa các biến
đồ thị histopram nhưng không có đường cong phân phối chuân)
Explore: thông tin phân tích được hiền thị riêng rẻ cho mỗi biến và hiển thị đỗ thị
boxplot
7.1.1.1 Đầu tiên ching ta bắt đầu với bảng tần suất dạng tông hop (Frequencies) Chon Analyze —> Descriptive Statistics —-> Frequencies
Chuyền các biến vào cửa số “Variable(s)”
Bam “Statistics” va chon nhimg chi tiéu ma ban muén phan tich
Trang 8histogram, ban co thé chon Histograms: va danh dau muc Show normal curve on
Statistics aq8 edu liborcon sex
sex
Cumulative Frequency Percent Valid Percent Percent Valid male 76 23.2 23.5 235
Tiếp đến là đồ thị histograms Kết quả bên dưới là đồ thị histogram cho biến age
và sex Mục đích chọn 2 biến này nhằm giúp các bạn phân biệt đồ thị histopgram của một biên liên tục và một biên phân loại
Trang 9
18 Sở đĩ như vậy là vì đối tượng nghiên của dữ liệu trong độ tuôi từ 18 tuổi trở lên Nếu bạn double-click vào đồ thị histogram thì một cửa số mới mở ra với rất nhiều menu số xuống đề điều chính cách hiển thị của đồ thị Tương tự như Excel, SPSS cho
phép thay đôi đồ thị theo ý muốn của bạn
7.1.1.2 Explore
Chon Analyze —> Descriptive Statistics —> Explore
Chuyén các biến cần phân tích vao ctra s6 “Dependent List:”
Bam “Plots” và bỏ chon muc “Stem-and-leaf”
Bam “Options” va chon “Exclude cases pairwise”
Bam OK
Kết quả phân tích bằng tần suất bằng câu lệnh Explore cho 4 bién (age, edu,
liborcon, và sex) được thể hiện ở bảng bên dưới
Bang “Case Processing Summary” cho biét s6 cac quan sat co giá trị hợp lý, giá trị rỗng và tông các quan sát
Trang 10for Mean Upper Bound 3974 ‘or Mean Upper Bound 645
5% Trimmed Mean 37.99 5% Trimmed Mean 647
for Mean Upper Bound BI for keen Upper Bound 181
6% Trimmed Mean 3.07 5% Trimmed Mean 179
Trang 11Đồ thị boxplot cho mỗi biến được trình bày như bên dưới Ví dụ, đỗ thị boxplot
của biến “edu” cho thay 5 diém di biét cứng và một quan sát có giá trị dị biệt cực mạnh
re 7.1.1.3 Phan tich bang tần suất theo từng nhóm như thế nào?
Ví dụ, chúng ta muốn tìm hiểu về thành tích học tập môn Kinh tế lượng của các
sinh viên khoa Tài chính, với biến phụ thuộc là điểm tông kết của môn Kinh tế lượng Ngoài việc thống kê mô tả điểm số chung cho toàn khoa, các bạn cũng muốn biết thêm thông tin cụ thể cho từng lớp hoặc cho từng nhóm sinh viên (nam/nữ, thành thị/nông thôn )
Đề thực hiện thống kê mô tả trong từng nhóm, chúng ta làm như sau:
Sử dụng ñle Phân tích dữ liệu, xem biến giới tính (sex) là bién phân nhóm:
Chon Analyze —> Descriptive Statistics —> Explore
Chuyén cac bién can phan tich vao khung “Dependent List:”
Chuyén bién “sex” vao khung “Factor List”
Bam “Statistics”, va chon “Outliers”
Trang 12Bam OK
Kết quá bảng tần suất cho mỗi nhóm nam/nữ cho biến “system1” như sau: Bảng “Descriptives” cho biết kết quả thống kê mô tả cho biến Ở đây đề ý rằng, biến system! lan lượt được thể hiện ở nhóm nam (male) và nữ (female) như sau:
Case Processing Summary
Interquartile Range 3 Skewness -1.277 276 Kurtosis 1.720 545 female Mean 7.25 131 95% Confidence Interval Lower Bound 6.99
for Mean Upper Bound 7.50
5% Trimmed Mean ?.1a Median 8.00 Variance 4.267 Std Deviation 2.066
Interquartile Range 3 Skewness -.673 185 Kurtosis 129 308
7.1.2 Thống kê tần số:
7.1.2.1 Định nghĩa thốnng kê tần số:
Thống kê tần số là phương pháp phân tích dữ liệu đề đưa ra các con số thê hiện tan
suât xuât hiện của các giá trị trong dữ liệu Cụ thê, thông kê tân sô cho biết so lan xuat
Trang 13hiện của mỗi giá trị trong một biến Bạn có thê sử dụng thông kê tần số để đánh giá phân phối của đữ liệu và tìm hiểu những thông tin cơ bản về dữ liệu
7.1.2.2 Cách thức thực hiện thống kê tần số bằng SPSS
Thống kê tần số thường được áp dụng cho các biến định tính như độ tuổi, giới tính, nghé nghiép , dùng để cung cấp thông tin mức độ (tần số) các chỉ số xuất hiện trong tập mẫu
Ở đây, chúng ta sẽ thực hiện phân tích thông kê tần số các biến định tính (giới tính,
độ tuôi, học vấn, thời gian công tác) của một file dữ liệu SPSS như hình 1, theo tuần tự
Độ tuổi
Trinh độ học vân Thời gian công
Lãnh đạo có tả
Lãnh đạo truyề
Lãnh đao cúa t Lãnh đao của t Lãnh đạo của t Tôi căm thấy rằ
Cơ quan khuyé Tôi được đảo t
Cơ quan có qu
n a Bo
Values None {1 Nam}
{1, Dưới 25 tuỗi) {1, Trung hoc phỗ thông) {1, Dưới 3 năm) None None None None None None None
Hình Các quan
được
dụng phân thống
(rung
Trang 14Bước 1: Đề phân tích thống kê tần số trên SPSS, chúng ta truy cập vào Analyze -> Descriptive Statistics -> Frequencies
Eile Edit View Data Transform “Analyze | Marketing Graphs Utilities Add-ons Window
Mixed Models
Correlate Regression Loglinear
Neural Networks
Classify Dimension Reduction Scale
Nonparametric Tests
Forecasting Survival
None
Hình 2: Các bước truy cập vào chức năng thống kê tân sé trén phan mém SPSS Bước 2: Giao điện cửa số sẽ hiện như Hình 3 Đưa các biến cần chạy thống kê tần
số từ mục bên trái sang mục bên phải Variable(s)
Trong hộp thoại Frequencies, có thể chọn các tùy chọn sau:
Variables: Danh sách các biến cần phân tích
Statistics: Cac thong kê cơ bản như số lượng, trung bình, độ lệch chuẩn, giá trị
cận, và tông
Charts: Biéu do tan suat, biêu đồ boxplot và biểu đồ histogram
Format: Định dạng kết quả
Trang 15Hình 3: Đưa các biến cần chạy thống kê tân số vào ô Variable(s)
Bước 3: Tiếp tục, nhấp vào tùy chọn Charts ở bên phải
Tại Chart Type, chúng ta sẽ chọn loại biểu đồ hiền thị cho các biến định tính (Bar
charts - biều đồ cột, Pie charts - biểu đồ tròn, Histograms - biêu đỗ phân phối chuẩn) Tai Chart Values, chung ta sé chon hién thi tan s6 (Frequencies) hay phan tram ty
lệ (Percentages) Néu vé biéu d6 cét (Bar charts) nén chon Frequencies, néu vé biéu dé
tron (Pie charts) nén chon Percentages Cu thể ở ví dụ này, chúng ta sé chon biéu dé tron
va hién thi phan tram Percentages
Trang 16Hinh 5: Két qua bang tan số của biển Giới tinh
« Cột Frequency: Thẻ hiện tần số của từng nhóm giới tính
+ Cột Percent: Tý lệ phần trăm của từng nhóm giới tính
« Cột Valid Percent: Tỷ lệ phần trăm hợp lệ của từng nhóm giới tính
« Cột Cumulative Percent: Phan trăm cộng dồn
Ví dụ cụ thê ở biến Giới tính, đối tượng khảo sát chủ yêu là nữ với 118/190 người,
chiếm tỷ lệ 62,1% Còn lại là nam với 72/190 người, chiếm tý lệ 37,9%
Kem voi bang tần số là biểu đồ tròn thẻ hiện cơ cấu, để hiện ra tỷ lệ phan tram,
chúng ta click d6i vao hinh vé biéu d6 trong file output cua SPSS Tiép tuc nhap vao biéu tượng được khoanh tròn màu đỏ, biêu đỗ sẽ hiển thị con số tỷ lệ phần trăm của các nhóm giới tính
7.1.2.3 Phân tích kết quả thống kê tần số trong phần mềm SPSS
Sau khi đã chạy thành công thống kê tần số trong phần mềm SPSS, ban can phan tích kết qua dé hiểu rõ hơn về dữ liệu
s% Phân tích phân phối của dữ liệu
Phân tích phân phối của dữ liệu là việc kiểm tra xem đữ liệu có phân phối chuẩn hay không Phân phối chuẩn là một phân phối đặc biệt có các đặc tính sau:
Trung tâm của phân phối nằm ở giữa
Phân phối có dạng hình chuông
Độ lệch chuẩn bằng 1.
Trang 17Để phân tích phân phối của dữ liệu, chúng ta có thê sử dụng biểu đồ tần số và biêu
đồ histogram trong kết quả thống kê tần số Nếu biêu đồ tần số hoặc histogram có dang hình chuông, thì có thể xem là đữ liệu có phân phối chuẩn
“~ Phân tích giá trị cận của dữ liệu
Giá trị cận của đữ liệu là những giá trị nằm rất xa so với trung tâm của phân phối Các giá trị này có thể được xem như các ngoại lệ (outliers) và có thê ảnh hưởng đến kết
quả phân tích dữ liệu Để phân tích giá trị cận của dữ liệu, bạn có thể xem các gia tri
Minimum va Maximum trong kết quả thống kê tần số Nếu các giá trị này quá thấp hoặc
quá cao so với các giá trị còn lại, thì có thê xem là đữ liệu có nhiều giá trị cận
s Phân tích tương quan giữa các biến
Tương quan giữa các biên là môi liên hệ giữa các biên trong đữ liệu
002 Drect Bateto be Utilities Add-ons Window Help
She ee eres Bi O% = RPR es Be+> +— 8B
Trang 187.1.3 Thống kê trị trung bình
7.1.3.1 Khái niệm
Thống kê trị trung bình, hay còn gọi là thống kê trung bình, là một đại lượng thông
kê được sử dụng dé mô tả mức độ trung tâm của một tập dữ liệu
Mức độ trung tâm của một tập đữ liệu là vị trí "trung bình” của các giá trị trong tập
dữ liệu đó Nó giúp ta có cái nhìn tổng quan về xu hướng chung của dữ liệu và so sánh
các tập dữ liệu khác nhau
7.1.3.2 Noi dung
Thống kê trung bình thường được sử dụng với các biến định lượng, dùng đề thống
kê các chỉ số phân tích như giá trị trung bình (Mean), lỗi chuẩn trung bình (Standard Error
of Mean), trung vi (Median), gia tri t6i da, t6i thiéu (maximum, minimum), độ lệch chuẩn (Standard deviation), Trong do:
$
s Giá trị trung bình (Mean):
+ La tong gia trị của tất cả các phần tử chia cho số lượng phần tử
* Được ký hiệu la Mean
« Thẻ hiện giá trị "trung bình" của tập dữ liệu
“~ Lỗi chuẩn trung bình (Standard Error of Mean):
« Biểu thị độ chính xác của giá trị trung bình ước tính so với giá trị trung bình thực
tế của tập đữ liệu
bình
* Được ký hiệu là Std Error Mean
« Giá trị nhỏ cho thấy độ tin cậy cao của giá trị trung bình
% Trung vi (Median):
« Giá tri nằm ở vị trí chính giữa khi sắp xếp dữ liệu theo thứ tự từ nhỏ đến lớn
* Được ký hiệu là Median
« Ít nhạy cảm với outliers hơn so với trung bình
& Dé léch chuan (Standard Deviation):
« Biểu thị mức độ biến thiên của các giá trị trong tập đữ liệu so với giá trị trung
* Được ký hiệu là Std Deviation
« Giá trị nhỏ cho thấy đữ liệu tập trung quanh giá trị trung bình
Trang 19Dựa trên kết quả thống kê trung bình, chúng ta sẽ biết được phạm vi giá trị của
`,
od
biến thông qua giá trị nho nhat/gia trị lớn nhất Dựa vào đây, chúng ta sẽ đánh giá khoảng
giá trị đó có phù hợp với tính chất bài nghiên cứu hay không
Thống kê trung bình thường được sử dụng và áp dụng trong một
+ Danh gia danh myc dau tu bang cach ude tính lợi nhuận trung bình của nó trong
một khoảng thời gian nhất định
7.1.3.3 Các bước chạy thống kê
Ví dụ: Có điểm kiêm tra (trên 100) cho bốn bài kiểm tra xếp lớp: Tiếng Anh, Đọc,
Toán và Viết So sánh thống kê tóm tắt của bốn bài kiểm tra này đề có thê xác định bài kiêm tra nào học sinh có xu hướng làm tốt nhất và kém nhất
Thông qua 5 bước sau đây chúng ta sẽ chạy thành công thống kê trung bình trong SPSS, cụ thể bao gồm:
Bước 1: Trên thanh công cụ, chon vao Analyze — Descriptive Statistics - Descriptives
Trang 20Descriptives mở ra, đưa các biến cần thống kê (Tiếng Anh, Đọc, Toán và Viết) từ bên trái vào ô Variable(s) bên phải
Bước 3: Nhắn chọn Option, tích vào các ô Mean, Deviation, Maximum, Minimum
và chon Continue dé quay lai man hinh
Trang 217.1.3.4 Nhận xét
« Một số học sinh bị thiếu điểm cho bài kiểm tra tiếng Anh
« Điểm tối đa quan sát được trong bài kiêm tra Tiếng Anh và Đọc vượt qua 100
điểm, được cho là điểm tối đa có thể đạt được Điều nảy có thê chỉ ra sự cố với việc nhập
dữ liệu hoặc có thê chỉ ra sự cố với phương pháp tính điêm
« Điểm Toán tối thiểu (35.32) thấp hơn nhiều so với điểm tối thiêu của các phần khác trong bài kiểm tra
« Điểm trung bình của điểm Tiếng Anh và Đọc rất gần nhau (82.7265 — 82.0394)
« Môn Toán có điểm trung bình thấp nhất (65.4512) trong 4 phần nhưng lại có độ
lệch chuẩn cao nhất (8.29165)
7.1.4 Bảng chéo (Cross- Tabulation)
7.1.4.1 Khái niệm của bảng chéo:
Bảng chéo dùng để phân tích, so sánh, xác định mối quan hệ, số lượng giữa các
biến định tính, hoặc định lượng với nhau là một kỹ thuật dùng đề khảo sát phân phối của
các quan sát từ hai hoặc nhiều hơn biến định tính Báng chéo sử dụng các bảng có các cột
và dòng thể hiện các mức độ hoặc các giá trị mã hóa của từng biến phân loại hoặc danh
nghĩa
Bảng chéo là bước đầu tiên để xác định các quan hệ giữa các biến dựa trên việc
xem xét phân phối các quan sát theo hai hoặc nhiều hơn biến định tinh
Dir ligu chéo (cross sectional data) trong thông kê kinh tế là dạng dữ liệu được thu thập bằng cách quan sát nhiều đối tượng, phù hợp với những nghiên cứu với quy mô lớn cần sự đặc trưng của từng cá thể (cá nhân, công ty, quốc gia hoặc vùng) tại cùng một địa
điểm, có thể khác biệt về thời gian, nhiều đơn vị hoặc địa điểm mẫu (Vd: Số bệnh viện
tại TPHCM, Cần Thơ, Đà Nẵng vào năm 2017)
Dữ liệu chuỗi thời gian là đữ liệu của một hay nhiều biến được tổng hợp tại các thời điểm khác nhau (ngày, tháng năm ) nhưng cùng một địa điểm (Vd: đữ liệu về số
bệnh viện tại Đà Lạt từ năm 2006 đến 2017).
Trang 22Dữ liệu bảng chéo là sự kết hợp của chuỗi thời gian và dữ liệu chéo, vì thế mà đữ liệu bảng có thê ước lượng đến sự không đồng nhất qua việc xem xét các biến số có tính đặc trưng của từng cá nhân
Nhờ sự kết hợp với dữ liệu chuỗi thời gian mà đữ liệu bảng chéo có được nhiều
thông tin da dang hon, ít xuất hiện cộng tuyến giữa các biến số, nhiều bậc tự do Ngoài ra
dữ liệu bảng còn có khá năng thực hiện tốt hơn các nghiên cứu về những thay đổi xảy ra liên tục, hành vi phức tạp như lợi thế kinh tế theo quy mô, tỷ lệ thất nghiệp
7.1.4.2 Cách thức tiến hành phân tích bảng chéo crosstabulation
Phân tích bảng chéo dùng để kiểm định mối quan hệ giữa các biến định tính với nhau bằng cách dùng kiêm định Chi — bình phương (Chi-square) Cách thức tiễn hành với
Chon va dua cac bién vao khung Row(s) (dòng) và Column(s) (cột) và Layer 1 of
1 (đối với trường hợp trên 2 biến)
Click vào ô Statistics, xuất hiện hộp thoại sau:
Trang 23
v Ehi-square) Correlations
| p Nominal Ordinal
| Cortingercy coefficerd Gamma
Phi and Cramer's V Somers’ d
Lambda Kendall's teu-b
) Uncertainty coefficient [_Ì Kendaffs tau-c
' Continue J Cancel Heip
Chọn các kiểm định cần thiết Trong trường hợp này ta đùng kiểm định Chi — bình phuong (Chi-square)
Các kiểm định ở khung Norminal dùng để kiểm định mối liên hệ giữa các biến
định danh
Các kiểm định ở khung Ordinal ding dé kiém định mối liên hệ giữa các biến thứ
tự
Click vao continue dé tré lai hộp thoại Crosstabs va Click vao 6 Cells, hép thoai
sau xuat hién:
>) Round cell counts Round case weights
1 Truncate ce# counts Truncete case weights
Í No adjustments
Contrue Ì( Cancel Help
G 6 Counts chon Observed (thé hiện tần số quan sát) Trong trường hợp muốn thé
hiện tần số mong đợi chọn Expected
Chon cách thề hiện phần trăm theo dòng hay theo cột ở ô Percentages
Trang 247.1.4.3 Cách đọc kết quả kiểm định bảng chéo
- Khi thực hiện kiểm định, ta có 2 giả thuyết
H0: không có mối quan hệ giữa các biến
HI: có mối quan hệ giữa các biến
Đề kết luận là chấp nhận hay bác bỏ giả thuyết H0, ta sẽ dùng các kiểm định phù hợp
« Để kết luận bác bỏ hay chấp nhận giả thuyết Ho, người nghiên cứu sẽ cần dựa vào giá trị P (p-value) theo 2 trường hợp như sau:
Nếu P (sig) < ơ (mức ý nghĩa) sẽ bác bỏ giả thuyết Ho, kết luận có mối quan hệ giữa các biến cần kiểm định
Nếu P > ơ (mức ý nghĩa), sẽ chấp nhận giả thuyết Ho, kết luận giữa các biến không
có mỗi quan hệ cần kiểm định
- ơ (Mức ý nghĩa) thường sẽ được hiệu là 5% hoặc 0.05, trong các bài tập phân tích crosstab on SPSS đều cho giả thuyết này Liên quan đến œ = 5% trong thống kê, nó được xem là hệ số tin cậy có sự liên quan đến khoảng tin cậy (Confdence Interval-CI) nhưng không giống nhau hoàn toàn vì CI là thuật ngữ dùng đề ước lượng, đo lường sự không chắc chắn, có thể đưa ra bất kỳ con số xác suất nào, độ tin cậy phô biến nhất sẽ nằm trong hai gia tri 95% hoặc 99%
7.2 Phwong Phap Phân Tích Dữ Liệu Định Lượng
7.2.1 Kiếm định độ tin cậy cronbach's alpha
7.2.1.1 Bản chất cronbach alpha:
7.2.1.1.1 Định nghĩa:
Cronbach”s alpha là một chỉ số được Lee Cronbach tạo ra vào năm 1952, ông là
một giáo sư về tâm lý giáo dục Cronbach”s alpha được hiểu là chỉ số đo lường tính nhất quán nội tại của thang đo Thường được sử dụng với các thang đo Likert với 5 lựa chọn (có thể 2-10 lựa chọn)
Cronbach alpha spss là một công cụ đo độ tin cậy trong phân tích đa chiều, được
sử dụng để đánh giá mức độ đồng nhất của các mục trong một bộ câu hỏi Nó thường được sử dụng đề kiểm tra tính đồng nhất của các câu hỏi trong các bảng điều tra, cuộc khảo sát hoặc bai kiém tra vi vay cronbach’s alpha là gì được nhiều bạn quan tâm
Trang 25Cronbach alpha spss được tính bằng cách so sánh phương sai của điểm số thực tế
của mỗi mục với phương sai của điểm số dự đoán của mỗi mục dựa trên các mục khác
trong bộ câu hỏi Độ tin cậy của bộ câu hỏi tăng khi giá trị của Cronbach alpha gần với l Vậy nhiệm vụ của cronbach's alpha là gì? Nó cũng được sử dụng đề kiểm tra tính đồng nhất của các mục trong một thang đo đánh giá hoặc một chỉ tiêu đo lường Khi các mục trong một thang đo có mức độ đồng nhất cao, ta có thê tin tưởng vào
độ chính xác của kết quả đo lường của thang đo đó
Cronbach's alpha có thể được viết dưới đạng một hàm của 36 lượng mục kiểm tra
và mối tương quan trung bình giữa các mục Công thức đề tính hệ số cronbach alpha: Hình: Cong thire Cronbach’s Alpha
Trong đó:
- Nlà số lượng mặt hàng
- € là hiệp phương sai trung bình giữa các cặp vật phẩm
- Ÿ là phương sai trung bình
7,2.1.1.2 Mục đích
Kiểm định cronbach's alpha là gì? Kiểm định này để nhằm phân tích và đánh giá
được độ tin cậy của thang đó Mục đích của việc này là tìm hiểu xem các biến quan sát có cùng đo lường cho khái niệm cần đo hay không
Thông qua hệ số tương quan biến tông Corrected Item - Total Correlation ta có thể biết được giá trị đóng góp nhiều hay ít
Qua đó, cho phép ta lược bỏ bớt những biến không phù hợp trong đề tài nghiên
cứu của mình
Trang 267.2.1.1.3 Tính chất và giá trị
Ở phần trên ta đã biết được hệ số cronbach alpha là gì Vậy tính chat va giá trị của
hệ số cronbach alpha được hiểu như thế nào?
Hệ số Cronbach alpha đo lường tính nhất quán bên trong hoặc độ tin cậy của một
tập hợp các mục khảo sát
Sử dụng thống kê này để giúp xác định xem một tập hợp các mục có đo lường cùng một đặc điểm hay không
Tinh chat cronbach’s alpha là gì? Cronbach alpha định lượng mức độ đồng ý trên
thang điểm từ 0 đến 1 được chuẩn hóa Giá trị cao hơn cho thay thỏa thuận cao hơn giữa các mục
Giá trị Cronbach”s alpha là gì sẽ đánh giá mức độ phản hồi, trường hợp giá trị cao cho biết rằng các giá trị phản hồi cho từng người tham gia trong một bộ câu hỏi là nhất quán
Ví dụ: khi những người tham gia đưa ra phản hồi cao cho một trong các mục, họ cũng có khả năng đưa ra phản hồi cao cho các mục khác Tính nhất quán này chỉ ra rằng các phép đo là đáng tin cậy và các mục có thể đo cùng một đặc tính
Tại sao hệ số cronbach alpha thấp?
Giá trị thấp cho biết tập hợp các mục không đo lường cùng một cầu trúc một cách dang tin cay
Cau trả lời cao cho một câu hỏi không có nghĩa là người tham gia đánh giá cao các mục khác
Do đó, các câu hỏi như là tại sao hệ số cronbach alpha thấp không có khả năng đo lường cùng một thuộc tính vì các phép đo không đáng tin cậy
7.2.1.1.4 Điều kiện sử dụng
Để có thê sử dụng được Cronbach alpha yêu cầu một số điều kiện phải được đáp ứng trước Yêu câu tổ then chốt bao gồm:
- Tuyến tính và phương sai đồng nhất của sai số
- Một lượng nhỏ lỗi đo lường và hiệu chính cho sự suy giảm của cả phương sai và hiệp phương sai
- Phân phối giống nhau giữa các mặt hàng
Trang 27- Tính một chiều
- Không có nguồn lỗi hệ thống
- Tính độc lập của các khoản mục về mặt nội dung
7,2.,1.1.5 Cách tính Cronbach?s alpha
Tổng hợp đữ liệu: Thu thập tất cả dữ liệu của bộ câu hỏi và tính tổng điểm cho mỗi
mục trong bộ câu hỏi
Ví dụ: Bộ câu hỏi bao gồm 10 mục, mỗi mục có điểm từ I đến 5 Tổng điểm của mỗi mục sẽ là tổng tat cả các điểm được trả lời cho mục đó
Tính tổng điểm cho toàn bộ bộ câu hỏi: Tính tong điểm của tất cả các mục trong bộ
câu hỏi cho từng người được khảo sát
Tính tổng số mục: Đếm số lượng mục trong bộ câu hỏi
Tính Cronbach's alpha: Cronbach's alpha được tính bằng cách sử dụng công thức
- ơ là giá trị Cronbach's alpha
- n là số lượng mục trong bộ câu hỏi
- >ø”, là tông phương sai của tất cả các mục
- ø? là phương sai của tông điểm của toàn bộ bộ câu hỏi
Hệ số Cronbach's Alpha có giá trị biến thiên trong đoạn [0,1] Về lý thuyết, hệ số này càng cao thang đo càng có độ tin cậy cao Tuy nhiên khi hệ số Cronbach's Alpha quá lớn (khoảng từ 0.95 trở lên) cho thấy có nhiều biến trong thang đo không có khác biệt nhau, hiện tượng này gọi là trùng lắp trong thang đo
*Hé s6 Cronbach Alpha co gia trị lớn hơn hoặc bằng 0,9 thê hiện thang đo lường rất tốt
-Hệ số Cronbach Alpha có giá trị từ 0,8 đến 0,9 thê hiện thang đo lường sử dụng tốt
*Hé sé Cronbach Alpha có giá trị từ 0,7 đến 0,8 thì thang đo này chấp nhận được
*Hé sé Cronbach Alpha co gia trị từ 0,6 đến 0,7 thì thang đo này cần xem lại
Trang 28*Hé s6 Cronbach Alpha co giá trị nhỏ hơn 0,5 thì thang đo này không chấp nhận
được
«>= 0.95: Chấp nhận được nhưng không tốt, nên xét xét các biến quan sát có thể
có hiện tượng “trùng biến” Tức là có khả năng xuất hiện biến quan sát thừa ở trong thang
đo Nó tương tự như trường hợp đa cộng tuyến trong hỗi quy, khi đó biến thừa nên được loại bỏ
Nhìn chung, giá trị Cronbach Alpha càng lớn, thang đo càng có giá trị Tuy nhiên,
hệ số Cronbach Alpha > 0.7 thì thang đo có thê được chấp nhận Ngoài ra, vẫn có một số
tác giả lại đề xuất giá trị cao hơn từ 0,9 - 0,95
Bảng Quy tắc chung hệ sé Cronbach’s alpha
Theo Nunnally (1978) , một thang đo tốt nên có độ tin cay Cronbach’s Alpha tir
0.7 tro 1én Hair va céng sự (2009) cũng cho rằng, một thang đo đảm bảo tính đơn hướng
và đạt độ tin cậy nên đạt ngưỡng Cronbach”s Alpha từ 0.7 trở lên, tuy nhiên, với tính chất
là một nghiên cứu khám phá sơ bộ, ngưỡng Cronbach's Alpha là 0.6 có thể chấp nhận
được Hệ số Cronbach's Alpha càng cao thể hiện độ tin cậy của thang đo cảng cao
Một chỉ số quan trọng khác đó là Corrected Item — Total Correlation Giá trị này biểu thị mối tương quan giữa từng biến quan sát với các biến còn lại trong thang đo Nếu biến quan sát có sự tương quan thuận cảng mạnh với các biên khác trong thang đo, giá trị Corrected Item — Total Correlation cảng cao, biến quan sát đó càng tốt Cristobal và cộng
sự (2007) cho rằng, một thang đo tốt khi các biến quan sát có giá tri Corrected Item — Total Correlation ttr 0.3 trở lên
Trang 297,2.1.1.6 Hạn chế của Cronbachs alpha
Cronbach's alpha là một phép đo rất phố biến và hữu ích đề đo độ đồng nhất của các mục trong một bộ câu hỏi Tuy nhiên, phương pháp này cũng có một số hạn chế cần
được lưu ý:
- Giới hạn về tính khả đoán: Giá trị Cronbach's alpha chỉ đo được tính đồng nhất
trong bộ câu hỏi, không thê đo được sự chính xác hay tính khả đoán của bộ câu hỏi
- Giới hạn về tính ôn định: Cronbach's alpha được tính toán dựa trên một lần lấy
mau, do đó, giá trị có thê thay đôi nều lây mẫu khác nhau
- Giới hạn về cách phân tích: Phương pháp tính toán Cronbach alpha giả sử rằng các mục trong bộ câu hỏi đóng góp như nhau vào tính đồng nhất của bộ câu hỏi Tuy nhiên, nêu một số mục ảnh hưởng nhiều hơn đến độ đồng nhất của bộ câu hỏi thì phương pháp này có thể không chính xác
- Giới hạn về tính phân tích: Giá trị Cronbach's alpha không giúp phân tích được những nguyên nhân cụ thê của sự bất đồng nhất giữa các mục trong bộ câu hỏi
- Giới hạn về tính mô tả: Cronbach alpha chỉ cho biết độ đồng nhất của bộ câu hỏi,
không đánh giá được tính mô tả của bộ câu hỏi
- Giới hạn về tính đa đạng: Cronbach's alpha không phù hợp cho các bộ câu hỏi có
tính đa dạng về nội dung hoặc định lượng khác nhau
=> Vì vậy, trong khi Cronbach's alpha là một công cụ hữu ích trong việc đánh giá tính đồng nhất của bộ câu hỏi, người sử dụng cần hiểu rõ các giới hạn và hạn chế của phương pháp này đề sử dụng một cách hiệu quả và chính xác
Trang 307.2.1.2 Ví dụ về Cronbach°s Alpha
Lay ví dụ về đữ liệu cần phân tích trong một bài luận văn là “Mức độ hài lòng của sinh viên đối với dịch vụ đào tạo của trường ĐH Kinh tế - Đại học Mở Hà Nội” Thực tế trong bài luận văn, giá trị chất lượng của dịch vụ đảo tạo tại tường ĐH
Kinh tế bị ảnh hưởng bởi nhiều nhân tố Nhưng do bản chất xem xét tính tương quan giữa các biến trong một nhân tô, nên chúng ta chỉ xem xét việc tính toán Cronbach Alpha với
các mục câu hỏi của một khía cạnh trong dịch vụ, đó là giá trị chức năng (GTƠN)
Các câu hỏi liên quan đến đo lường nhân tô khía cạnh chức năng như sau: Hình: Nhân tổ phân tích Cronbach°s Alpha
GTCN1 kiếm được thu nhập cao sau khi ra trường 1 é 3 ó 5
GTCNz | Kiến thức từ trường ĐH Kinh tế sẽ giúp tôi dễ 1 2 3 4 5
dang thang tién trong nghé nghiép
Tôi tin rằng các doanh nghiệp rất cần những
GTCN3 | sinh viên tốt nghiệp từ trường tôi đang học 1 2 8 4 Š GTCN4 Bằng cá có được từ trường ĐH Kinh tế là sự 1 2 3 4 5
đâu tư tôt của tôi cho tương lai
GTCN5 Bang dai hoc kinh té bao dam viéc lam trong 1 2 3 Ạ 5 tương lai
Bằng cấp của trường ĐH Kinh tế giúp tôi dễ
GTCN6 | dàng tìm được việc đúng ngành nghề sau khi ra 1 2 3 4 5
trường
Ghi chú:
- Hệ số Cronbachˆs Alpha nằm trong khoảng 0 đến |
- Hệ số càng gần I thì mức độ nhất quán bên trong của các biến trong thang đo càng lớn
Trong ví dụ trên, sau khi khởi chạy thì kết quả thu về như sau:
Hình: Kết quả kiểm định độ tin cậy
Trang 31Cronbach's Alpha N of Items
935 6
Item-Total Statistics
Scale Mean if | Scale Variance | Corrected Item- | Cronbach's Alpha
Item Deleted if Item Deleted | Total Correlation if Item Deleted
GTCN1 27.58 19.249 748 930 GTCN2 27.63 18.128 831 920 GTCN3 27.77 18.658 844 918 GTCN4 27.67 18.782 823 921 GTCN5 27.70 18.949 787 925 GTCN6 27.58 19.288 812 922
Dựa vào quy tác được đề cập ở trên, hệ số Cronbach’s Alpha = 9.935 (lớn hơn
0.9), chứng tỏ thang đo lường rất tốt
Đồng thời, kết quả kiểm định cho thấy các biến quan sát đều có hệ số tương quan biến tông phù hợp (Corrected Item - Total Correlation > 0.3) và không có biến nào có hệ s6 Cronbach’s Alpha if Item Deleted 16n hon hé s6 Cronbach’s Alpha tong, ching té cac
bién déu dat chat lượng tốt
7.2.1.3 Các bước chạy Cronbach°s Alpha chi tiết
Để chạy Cronbach's alpha, bạn cần có các dữ liệu về các câu hỏi hoặc biến đo
lường trong bài kiểm tra hoặc scale đo lường của bạn Nếu bạn sử dụng phần mềm thống
kê như SPSS, R hoặc Stata, bạn có thể sử dụng các lệnh hoặc chức năng được tích hợp
sẵn đề tính toán Cronbach alpha Dưới đây là cách chạy cronbach alpha trong spss: Bước 1: Tại thanh công cụ ở trên, chọn Analyze, tiếp đến chọn Scale, sau đó chọn Reliability Analysis
Hình: Chọn thẻ Analysis rồi nhấn vao Reliability Analysis
ˆ 1 "
Trang 32
Bước 2: Xuất hiện một hộp thoại Reliability Analysls Tại đây, kéo toàn bộ các
biến cần phân tích vào cột bên trái
Hình: Kéo toàn bộ các biên cần phân tích sang trái
z ( Ðesciptves for Inter-Rem ¬
sẽ thay hộp |r-Jem Correjatons thoại Reliability
| Scale Covariances
Analysis: LE ae ree eee | | Statistics
Summaries ANOVA Table
Hinh: | Means © tone Hộp thoai Reliability
| © Yanances OE test
[ interrater Agreement Fleiss’ Kappa
ịR
l=
Missing
© Exciude poth user-missing and system missing values
| © User-missing values are treated as valid
© Hotetting’s T-square Tukey's test of addithty inyaciass correlation coeficent
Trang 33Bước 5: An chon item, scale,
¥ Scale ifitem deleted
Summaries ANOVA Table Means © None
Variances OE test
Covariances © Frieaman chi-square
Cochran chi-square
© Exciude both user-missing and system missing values
© User-missing values are treated as valid Hotelling’s T-square Tukey's test of additivity
intraclass correlation coefficient
Continue Điều này sẽ đưa bạn trở lại hộp thoại Reliability Analysis Cuối cùng, bạn hãy
nhân vào nút OK dé tao dau ra
7.2.1.4 Hướng dẫn cách đọc kết quả
Để có thể đọc được kết quả sau làm theo các bước trong cách chạy cronbach alpha trong spss, bạn cần phải tìm hiểu và trả lời một số câu sau đây:
- Giá trị cronbach’s alpha là gì khi nằm trong khoảng từ 0 đến 1? Giá trị càng gần |
thì độ đồng nhất của bộ câu hỏi càng cao
- Nếu giá trị Cronbach's alpha lớn hơn hoặc bằng 0,7, bộ câu hỏi được xem là có
độ đồng nhất cao
Trang 34- Nếu giá trị Cronbach's alpha thấp hơn 0,7, có thê có sự bất đồng nhất giữa các mục trong bộ câu hỏi và cần kiểm tra lại tính đồng nhất của bộ câu hỏi
- Giá trị Cronbach's alpha càng thấp, thì bộ câu hỏi càng không đồng nhất
- Giá trị Cronbach's alpha không thê vượt quá I, vì không có sự đồng nhất tuyệt
đối giữa các mục trong bộ câu hỏi
- Nếu giá trị Cronbach's alpha quá cao (trên 0,9), có thê cho thấy rằng một số mục trong bộ câu hỏi là trùng lặp hoặc không cần thiết
7.2.1.5 Bốn vấn đề cần lưu ý khi sử dụng Cronbach'*s alpha
7,2.1.5.1 Đảm bao tinh đồng nhất của các mục
Nó có thể cho biết liệu các câu trả lời có nhất quán giữa các mục hay không (độ tin cậy), nhưng nó không thê xác định liệu các mục có đo lường khái niệm chính xác (giá trị) hay không
7.2.1.5.2 Xác định số lượng mục cần thiết cho bộ câu hỏi
Cronbach alpha là thước đo phô biến của tính nhất quán bên trong Nó thường được sử dụng trong bài khảo sát hoặc bảng câu hỏi đề tạo thành một thang đo và xác định xem thang đo đó có tin cậy không vì vậy cronbach’s alpha la gi được quan tâm đông đảo Tùy theo mục đích nghiên cứu của từng đề tài, chúng ta có thể sử dụng số lượng câu hỏi khác nhau nhằm thu thập thêm thông tin của đối tượng mà ta khảo sát
7.2.1.5.3 Phân tích hệ số tương quan giữa các mục
Hệ số Cronbach”s alpha là gì? Là hệ số cho phép đánh giá nếu các biến quan sát thuộc về một nghiên cứu thì nó có phù hợp không Hệ số tương quan biến tổng là hệ số cho biết mức độ liên kết giữa một biến quan sát nhân tô với các biến còn lại
Nó phản ánh mức độ đóng góp khái niệm của nhân tố của một biến quan sát cụ thê khi xét cronbach’s alpha là gì Tiêu chuẩn đề đánh giá một biến có thực sự đóng góp hay
không là hệ số tương quan biến tổng phải lớn hơn 0.3 Nếu nhỏ hơn 0.3 thì phải loại nó ra khỏi nhân tô đánh giá
7.2.1.5.4 Kiểm tra tính đồng nhất của một mục
Cronbach Alpha không chỉ đo lường được sự phù hợp của các biến mà nó còn được sử dụng để kiêm định tính nhất quán của từng biến so với thang đo