Thực hành bài tập tình huống với Stata

Ví dụ về phân tích sự hài lòng của bệnh nhân đối với bệnh viện trong file suhailong.xls trên Stata

Bước 1: Nhập dữ liệu trên Stata: Vào Data editor => Copy toàn bộ file dữ liệu

Trong đó Q1- Q20 có nội dung như sau:

1 Trang thiết bị phục vụ khám chữa bệnh của bệnh viện có đầy đủ, hiện đại?

2 Phòng điều trị, phòng chờ khám bệnh có sạch sẽ và đầy đủ thiết bị?

3 Nhà vệ sinh có sạch sẽ và đặt ở nơi thuận tiện?

4 Bệnh viện có làm cho anh/ chị cảm thấy an tâm khi lựa chọn điều trị tại đây?

Bác sĩ, điều dưỡng có luôn quan tâm và sẵn sàng giúp đỡ, giải quyết các vấn đề của anh/chị?

6 Anh/chị có tin tưởng vào kết quả chẩn đoán và phương pháp điều trị của bệnh viện?

7 Anh/chi có tin tưởng vào bác sĩ điều trị tại bệnh viện?

Bệnh viện có cung cấp dịch vụ khám chữa bệnh nhanh chóng mà không cần nhiều thời gian chờ đợi?

9 Bệnh viện có cung cấp đầy đủ thông tin về tình trạng sức khoẻ của anh/chị?

10 Bác sĩ có lắng nghe và giúp đỡ anh/chị tận tình và chu đáo ?

11 Khi anh/chị cần, bệnh viện có đáp ứng điều trị kịp thời, nhanh chóng?

12 Mọi thủ tục từ khi nhập viện đến khi xuất viện có được giải quyết nhanh chóng?

Những câu hỏi liên quan đến tình hình sức khoẻ của anh/chị đều được nhân viên trả lời đầ đủ,

Bác sĩ, điều dưỡng bệnh viện có lịch sự và thân thiện trong quá trình khám chữa bệnh cho anh/chị?

15 Anh/chị có thấy nhân viên bệnh viện vui vẻ trong phục vụ?

16 Bác sĩ có giải thích những gì đã xảy ra với bệnh nhân trước khi đưa ra điều trị?

17 Bác sĩ nói với bệnh nhân về chẩn đoán bệnh của họ?

18 Bác sĩ có sẵn sàng trả lời các câu hỏi nào về tình trạng sức khoẻ của anh/chị?

19 Bác sĩ, điều dưỡng có đủ kiến thức để trả lời các câu hỏi của anh/chị?

20 Trình độ chuyên môn của bác sĩ có đáp ứng được nhu cầu khám chữa bệnh của anh/chị ?

Bước 2: Kiểm định Cronbach alpha bằng lệnh alpha q1 q2 q3 q4 q5 q6 q7 q8 q9 q10 q11 q12 q13 q14 q15 q16 q17 q18 q19 q20. Kết quả như sau

Test scale = mean(unstandardized items) Average interitem covariance: .1996408 Number of items in the scale: 20 Scale reliability coefficient: 0.8758

Alpha lớn hơn 0,7 => Thang đo có độ tin cậy => tiến hành bước tiếp theo

Bước 3. Statistics > Multivariate analysis > Factor and principal component analysis > Factor analysis

Bước 4: Đưa tất cả các câu hỏi vào trong ô variables

Bước 5: Tiếp tục nhấn vào tab model 2 để chọn loại phân tích Principal-Component Factor,đồng thời chọn mục Minimum Value of Eigenvalues to be retained, gõ vào số 1. Điều này có nghĩa là nhân tố nào có eigenvalue lớn hơn 1 mới được giữ lại

Bước 6: Nhấn OK, Kết quả hiện lên như sau:

Bước 7: Xem Cột Eigenvalues , dòng thứ 4 là giá trị Eigenvalues bé nhất mà lớn hơn 1,có nghĩa là có 4 nhân tố được tạo ra( do ngưỡng Eigenvalues >1). Cột Cumulative dòng thứ 4 là 0.5497, đó là giá trị tổng phương sai trích,ý nghĩa là 4 nhân tố này giải thích 54,97% biến thiên của dữ liệu

Ý nghĩa của các cột khác trong bảng:

Difference: Sự khác biệt giữa giá trị riêng và giá trị tiếp theo: Ví dụ giá trị Factor 1 là 6,18535, difference giữa 1 và 2 là 4,18281 => Eigenvalue của 2 là 2,00254.

Proportion: Vì tổng giá trị riêng = tổng số biến. Proportion chỉ ra trọng số tương đối của từng yếu tố trong tổng phương sai. Ví dụ: Proportion của factor 1 = 6,18535/20

= 0,3093 hay yếu tố đầu tiên giải thích 30,93% tổng sự thay đổi.

Bước 7: Xoay nhân tố: Statistics > Multivariate analysis > Factor and principal component analysis > Postestimation > Rotate loadings,chọn varimax( default) và check vào Apply Kaiser normalization như hình dưới

Bước 8: Tiếp theo nhấn vào tab report , chọn Display loading as blank when |loading|< #, nhập vào giá trị 0.5, mục đích là trong bảng ma trận xoay không hiện thị các fatorloading bé hơn 0.5 để dễ nhìn. Theo Hair và các cộng sự (2009, trang 116) thì hệ số tải bằng +/-0,3 là điều kiện tối thiểu để biến quan sát được giữ lại. Hệ số tải bằng +/-0,5 biến quan sát có ý nghĩa thống kê tốt và hệ số tải lớn hơn hoặc bằng +/-0,7 là biến quan sát có ý nghĩa thống kê rất tốt

Bước 9: Nhấn OK sẽ được kết quả như sau

Cột Uniqueness: là phương sai ‘duy nhất đối với biến và không được chia sẻ với các biến khác. Nó bằng 1 - tính cộng đồng (phương sai được chia sẻ với các biến khác). Ví dụ, 46,99% phương sai trong ‘q1”, không chia sẻ với các biến khác trong mô hình nhân tố tổng thể. Ngược lại, q4 có phương sai thấp không được tính bởi các biến khác (29,95%). Lưu ý rằng ‘tính duy nhất càng lớn thì mức độ liên quan của biến trong mô hình nhân tố càng thấp.

Factor rotation matrix: Là ma trận chuyển đổi để ước tính hệ số tải đã được xoay nhân tố (RFL)

RFL = Hệ số tải nhân tố* Hệ số xoay nhân tố

Bước 10: Kiểm định thêm KMO và Bartlett's Test of Sphericity

- KMO: Dùng lệnh: estat kmo, novar => Kết quả

Kaiser-Meyer-Olkin measure of sampling adequacy (overall) = 0.8458

-Bartlett's Test of Sphericity: Dùng lệnh factortest => Kết quả như sau

Determinant of the correlation matrix Det = 0.001

Bartlett test of sphericity

Degrees of freedom = 190 p-value = 0.000

H0: variables are not intercorrelated

Kaiser-Meyer-Olkin Measure of Sampling Adequacy KMO = 0.846

Kết quả cho thấy hệ số Sig của Ballet test < 5% và hệ số KMO = 0,846 > 0,7 nên mô hình phù hợp để phân tích nhân tố khám phá.

Chú ý: Trong thực tế có những lúc không tìm được KMO: EFA bị lỗi "This matrix is not positive definite", không có bảng KMO . Một lỗi khá phổ biến khi chạy phân tích nhân tố khám phá là không hiện bảng KMO và thay vào vị trí đó là dòng chữ "This matrix is not positive definite".Lý do xuất hiện lỗi này thường là vì trong dữ liệu của các bạn có sự chồng chéo giữa các nhân tố độc lập với nhau. Giá trị các biến quan sát của nhân tố độc lập 1 khá giống với giá trị các biến quan sát 2, 3, 4.. Sự trùng lắp này quá nhiều làm cho tính phân biệt trong EFA bị loại bỏ, nên sẽ nhận được thông báo như trên.

Cách xử lý: Các bạn hãy tìm và loại bớt các biến có tương quan mạnh với nhau như thế, vì đây gần như là có sự trùng lắp dữ liệu. Nếu các câu hỏi đó là quan trọng và không được loại bỏ, chỉ còn cách bạn phải thay đổi số liệu, đừng để số liệu biến quan sát trong nhân tố này lại giống đến hơn 70% số liệu biến quan sát trong nhân tố khác.Thủ thuật để nhận biết biến nào đang trùng lắp dữ liệu với biến khác đó là sử dụng tương quan Pearson. Thực hiện phân tích tương quan giữa các nhân tố độc lập, nhìn ở các giá trị sig nhỏ hơn 0.05, cặp nhân tố nào có tương quan r từ 0.6 trở lên thì khả năng lớn sẽ có đa cộng tuyến giữa 2 biến này, đồng nghĩa giữa 2 biến đang có sự trùng lặp dữ liệu đáng kể.

Bước 11: Tính nhân số : Để chạy hồi quy có thể tính nhân số chuẩn hoá bằng

lệnh Predict hoặc có thể tạo biến mới dùng lệnh trung bình.

Predict factor 1 factor 2 ...

Hoặc tạo biến mới nếu dùng lệnh trung bình Bài tập

1: Thiết kế bảng hỏi và xây dựng mô hình cho đề tài sau: Nghiên cứu các nhân

tố ảnh hưởng đến kết quả học tập môn phân tích định lượng trong kinh tế tại trường Đại học Thăng Long.

Gợi ý: Tìm hiểu khái niệm về kết quả học tập => Đưa ra các tiêu chí đo lường kết quả học tập

Tìm hiểu nhóm nhân tố ảnh hưởng đến kết quả học tập ví dụ như cơ sở vật chất, phương pháp học tập, năng lực giảng viên, ảnh hưởng của bạn bè....

2. Tính toán và xác định cỡ mẫu cho nghiên cứu ở bài 1 3. Tiến hành điều tra theo cỡ mẫu đã xác định

4. Sử dụng phân tích nhân tố để giải thích các kết quả của mô hình Tài liệu tham khảo

1. Bruce Thompson (2004), Exploratory and confirmatory factor analysis, American Psychological Association, Washington DC, Chương 1,2,3

2. Ngô Văn Thứ (2015), Giáo trình thống kê thực hành, NXB Đại học Kinh tế quốc dân

Thực hành bài tập tình huống với Stata

CÁC PHƯƠNG PHÁP CHỌN MẪU

Xác định cỡ (kích thước) mẫu