Việc đầu tiên cần thực hiện sau khi đã làm sạch dữ liệu là tóm tắt thống kê cho mẫu, thực hiện việc tóm tắt thống kê bằng cách sử dụng thông tin trong phần 1 của phiếu khảo sát. Tóm tắt thống kê thông qua đo lường mức độ tập trung như trung bình, trung vị, hay mức độ phân tán của dữ liệu. Việc thống kê có ý nghĩa trình bày phân phối dữ liệu của một biến nằm trong phần thông tin của mẫu.
Đo lường mức độ tập trung của mẫu thông qua việc thống kê mô tả với ba đại lượng thường sử dụng đo lường mức độ tập trung của các biến là trung bình, trung vị và mode. Trung vị là số nằm giữa (nếu số lượng dãy số trong dãy là lẻ) hay trung bình các cấp số nằm giữa (nếu số lượng dãy số trong dãy là chẵn) của một dãy số được sắp xếp thứ tự từ nhỏ đến lớn hoặc ngược lại. Mode là giá trị có tần suất xuất hiện lớn nhất của
Chương 4: Thiết kế nghiên cứu
một tập hợp các số đo (N.Đ Thọ, 2011). Với bài nghiên cứu này việc đo lường mức độ tập trung chỉ thực hiện giá trị trung bình do việc thực hiện trung vị không thích hợp (không xem xét dãy số đo) và không cần thiết thực hiện mode.
Đo lường mức độ phân tán trong nghiên cứu kiểm định lý thuyết khoa học với hai đại lượng thường được sử dụng là phương sai và khoảng biến thiên. Phương sai đo lường mức độ phân tán của một tập số đo xung quanh trung bình của nó. Căn bậc hai của phương sai gọi là độ lệch chuẩn. Khoảng biến thiên là khoảng cách giữa giá trị lớn nhất và giá trị nhỏ nhất của một tập đo (N.Đ Thọ, 2011). Các đại lượng được sử dụng cho thang đo khoảng trong công cụ sử dụng SPSS như sau:
Mean Thể hiện giá trị trung bình cộng
Sum Tổng cộng, cộng tất cả các dữ liệu trong biến quan sát Std. Deviation Độ lệch chuẩn
Maximum Giá trị lớn nhất
Minimum Giá trị nhỏ nhất
Trong bài nghiên cứu này, đo lường mức độ tập trung của biến sử dụng giá trị trung bình (mean) nhằm để tính giá trị trung bình của phát biểu và thực hiện so sánh các giá trị quan tâm của khách hàng dành cho các yếu tố. Đại lượng sum nhằm xem xét tổng quan về dữ liệu thu thập được. Ngoài ra, hai đại lượng maximum và minimum dùng để kiểm tra sai sót trong nhập dữ liệu cũng như giá trị lớn nhất và giá trị nhỏ nhất của biến đo lường (Thọ N.Đ, 2011).
Bảng thống kê mô tả cho các biến thực hiện các giá trị như sau:
Frequency Tần số biểu hiện cho giá trị xuất hiện trong dữ liệu khảo sát. Percent Tần số biểu hiện cho giá trị xuất hiện trong dữ liệu khảo sát. Valid percent Là phần trăm tính trên tổng số quan sát thông tin trả lời. Cumulative percent Là phần trăm tích lũy của biến đang quan sát
(Nguồn: Nghiên cứu khoa học trong kinh doanh, Thọ N.Đ, 2011)
4.5.2 Phân tích nhân tố
Thực hiện phân tích nhân tố của thang đo nhằm xem xét số lượng nhân tố trích cho phù hợp với giả thuyết ban đầu về số lượng thành phần của thang đo nếu thang đo đa hướng. Số lượng nhân tố có thể trích không phù hợp lớn hơn hoặc nhỏ hơn giả thuyết đều có thể xảy ra, lúc này cần xem xét nguyên nhân và thực hiện hiệu chỉnh tên biến phù hợp với nhân tố. Bên cạnh đó, phân tích nhân tố nhằm xem xét các biến trong bối cảnh nghiên cứu có phù hợp với giả thuyết đề ra. Trường hợp một số biến trong giả thuyết đo lường một khái niệm nhưng kết quả cho thấy một yếu tố khác, khi đó biến nhóm không đúng vào nhân tố cần thực hiện kiểm tra lại lý thuyết và sử dụng kết quả nghiên cứu định tính. Nếu các biến không đo lường khái niệm cần đo thì loại, ngược lại nếu các biến đo lường khái niệm mà nó đang đo thì hiệu chỉnh lại thang đo trong phần thiết kế nghiên cứu (Thọ N.Đ, 2011). Sử dụng phép trích Principal Axis Factoring với
Chương 4: Thiết kế nghiên cứu
phép quay Promax vì nó phản ánh cấu trúc dữ liệu chính xác hơn phương pháp trích Principle Component với phép quay Varimax (Gerbing & Anderson, 1998).4
Các tiêu chuẩn dùng để áp dụng cho phân tích nhân tố bao gồm như sau:
Phân tích nhân tố dựa trên mối quan hệ giữa các biến vì vậy trước khi sử dụng phân tích nhân tố cần xem xét mối quan hệ giữa các biến đo lường, sử dụng ma trận hệ số tương quan để nhận biết mức độ quan hệ giữa các biến. Nếu hệ số tương quan nhỏ (<0.3) sử dụng không phù hợp.
Kiểm định KMO (Kaiser-Meyer-Olkin) là chỉ số dùng để so sánh độ lớn của hệ số tương quan giữa hai biến với độ lớn của hệ số tương quan phần riêng của chúng (Norusis, 1994), KMO càng lớn càng tốt vì phần chung giữa các biến càng lớn. Kaiser (1974) đề nghị KMO ≥ 0.6 tạm được, KMO ≥ 0.7 được, KMO ≥ 0.8 tốt, KMO ≥ 0.9 rất tốt. Hệ số KMO là một chỉ số dùng để xem xét sự thích hợp của phân tích nhân tố, trị số này lớn hơn 0.5 và nhỏ hơn 1 là điều kiện để phân tích nhân tố là thích hợp.
Kiểm định theo tiêu chí Eigenvalue là một tiêu chí sử dụng phổ biến trong xác định số lượng nhân tố, với tiêu chuẩn này số lượng nhân tố được xác định ở nhân tố có eigenvalue tối thiểu bằng 1 (≥ 1).
Đánh giá thang đo là nhân tố trọng số và tổng phương sai trích, với thang đo đơn biến hay nhiều biến đo lường trong thực tiễn nghiên cứu lớn hơn hay bằng 0.5 là chấp nhận được, tức là tổng phương sai trích không nhỏ hơn 50 (Gerbing và Anderson, 1988). Hệ số tải nhân tố (được gọi là factor loading) của biến quan sát cho thấy biến nào nhỏ hơn 0.4 sẽ bị loại. Theo Hair và cộng sự (1998) hệ số tải nhân tố là chỉ tiêu để đảm bảo mức ý nghĩa thiết thực của nhân tố xét theo mô hình EFA (Exploratory Factor Analysis), hệ số tải trọng số lớn hơn 0.4 được xem là quan trọng và nếu lớn hơn 0.5 được xem là có ý nghĩa thiết thực. Hair và cộng sự (1998,111) cũng khuyên bạn đọc như sau: nếu chọn tiêu chuẩn factor loading > 0.3 thì cỡ mẫu của bạn ít nhất phải là 350, nếu cỡ mẫu của bạn khoảng 100 thì nên chọn tiêu chuẩn factor loading > 0.55, nếu cỡ mẫu của bạn khoảng 50 thì Factor loading phải > 0.75
Khác biệt hệ số tải nhân tố của một biến quan sát giữa các nhân tố ≥ 0.3 để đảm bảo giá trị phân biệt giữa các nhân tố5
Sau khi chạy nhân tố, thỏa điều kiện như KMO lớn hơn 0.5 và nhỏ hơn 1, phương sai trích lớn hơn 50%, hệ số Eigenvalue không nhỏ hơn 1. Bước kế tiếp là thực hiện kiểm định giả thuyết nhân tố, xem xét số lượng nhóm nhân tố và các biến đã đúng với nhóm theo lý thuyết hay không, đúng thì xem xét nguyên nhân gây ra sai lệch so với giả thuyết.
4.5.3 Phân tích độ tin cậy
Phân tích độ tin cậy với hệ số Cronbach Alpha là một phép kiểm định thống kê dùng để kiểm tra sự chặt chẽ và tương quan giữa các biến quan sát, hệ số Alpha cao thể hiện tính đồng nhất của các biến đo lường. Cần chú ý là hệ số Cronbach Alpha chỉ đo lường
4 Thọ N.Đ & Mai Trang N.Đ, Chất lượng dịch vụ siêu thị, dẫn từ Gerbing & Anderson, 1998
Chương 4: Thiết kế nghiên cứu
độ tin cậy của thang đo (bao gồm từ ba biến trở lên), không tính được độ tin cậy cho từng biến quan sát.
Một thang đo có độ tin cậy tốt khi nó biến thiên trong khoảng 0.7 đến 0.8, tuy nhiên nếu hệ số Cronbach Alpha ≥ 0.6 là thang đo có thể chấp nhận được về độ tin cậy (Nunnally và Bernstein, 1994). Bên cạnh đó, hệ số tương quan – tổng biến hiệu chỉnh (corrected item – total correlation) phải lớn hơn hay bằng 0.3 thì biến đó đạt yêu cầu (Nunnally và Bernstein, 1994).
4.5.4 Phân tích hồi quy
Sau khi phân tích nhân tố và kiểm tra độ tin cậy ta phân tích tương quan để kiểm định mức độ tương quan của các nhân tố độc lập này. Nếu các nhân tố này tương quan yếu sẽ là điều kiện để phân tích hồi quy. Vì kiểm định tương quan giữa các biến định lượng (thang metric) nên ta sẽ thực hiện tương quan hệ số Pearson với ý nghĩa của hệ số tương quan r như sau:
- Nếu Trị tuyệt đối của r > 0.8: tương quan giữa 2 biến rất mạnh. - Nếu Trị tuyệt đối của r = 0.6-0.8: Tương quan giữa 2 biến mạnh. - Nếu Trị tuyệt đối của r =0.4-0.6: Tương quan giữa 2 biến trung bình. - Nếu Trị tuyệt đối của r =0.2-0.4: Tương quan giữa 2 biến yếu.
- Nếu Trị tuyệt đối của r <0.2: không có tương quan giữa 2, hoặc có thì rất yếu6 Cuối cùng ta phân tích hồi quy để xác định mối quan hệ giữa các yếu tố
Mô hình phân tích hồi quy bội biểu diễn mối quan hệ giữa hai biến hay nhiều biến độc lập với một biến phụ thuộc định lượng (Thọ N.Đ , 2011). Do vậy, bài nghiên cứu thuộc phân tích hồi quy bội. Điểm chú ý là giả định này là không quan hệ hoàn toàn với nhau.
Tuy nhiên, trong thực tiễn nghiên cứu các biến trong mô hình thường có quan hệ với nhau nhưng phải phân biệt nhau (đạt giá trị phân biệt), chính vì vậy khi ước lượng mô hình nghiên cứu hồi quy bội phải kiểm tra giả thuyết này thông qua kiểm tra hiện tượng đa cộng tuyến. Đa cộng tuyến (Multicolinearity): là trạng thái trong đó các biến độc lập có tương quan chặt chẽ với nhau và nó cung cấp cho mô hình những thông tin rất giống nhau và khó tách ảnh hưởng của từng biến một.
Để kiểm tra hiện tượng đa cộng tuyến, chỉ số thường dùng là hệ số phóng đại phương sai VIF (Variance Inflation Factor). Theo lý thuyết nếu VIF > 10 thì biến này hầu như không có giá trị giải thích biến thiên trong mô hình hồi quy bội MLR (Hair và các cộng sự, 2006).
Ngoài ra, để sử dụng mô hình hồi quy bội cần xem xét điều kiện: có một biến phụ thuộc và phải định lượng, với nhiều biến độc lập có thể định lượng. Ngoài ra, xem xét các giả định để có kết quả tin cậy, kiểm tra mối quan hệ tuyến tính giữa biến phụ thuộc và các biến độc lập cũng như hiện tượng phương sai thay đổi, bằng cách xây dựng mối quan hệ giữa phần dư và giá trị quy về hồi quy (Thọ N.Đ , 2011).
Chương 4: Thiết kế nghiên cứu
Sau khi chạy hồi quy cần quan tâm đến các thông số sau:
Hệ số R2 hiệu chỉnh: phản ánh mức độ phù hợp của mô hình hồi quy đa biến. Hệ số này có thể thay đổi từ 0 đến 1. Vì R2 sẽ tăng khi đưa thêm biến độc lập vào mô hìnhnên dùng R2 hiệu chỉnh sẽ an toàn hơn khi đánh giá độ phù hợp của mô hình. R2 hiệuchỉnh càng lớn thể hiện độ phù hợp của mô hình càng cao. Tuy nhiên sự phù hợp này chỉ đúng với dữ liệu mẫu. Để kiểm định xem có thể suy diễn mô hình cho tổng thể thực hay không ta phải kiểm định độ phù hợp của mô hình thông qua kiểm định F
Hệ số sig. trong kiểm định F (kiểm định Anova): kiểm định F để kiểm tra tính phù hợp của mô hình với tập dữ liệu gốc. Nếu mức ý nghĩa của kiểm định <0.05 thì ta có thể kết luận mô hình hồi quy phù hợp với tập dữ liệu, nghĩa là tồn tại mối liên hệ tuyến tính giữa các biến độc lập với biến phụ thuộc (bác bỏ giả thuyết H0, chấp nhận giả thuyết H1: có ít nhất một giá trị beta khác 0)
Hệ số sig trong kiểm định t: dựa vào bảng kiểm định hệ số hồi quy nếu hệ số sig. <0.05 thì hệ số beta tương ứng sẽ được chọn để xem xét sự ảnh hưởng của các biến độc lập lên biến phụ thuộc
Hệ số Beta: Hệ số hồi quy chuẩn hoá cho phép so sánh trực tiếp giữa các hệ số dựa trên mối quan hệ giải thích của chúng với biến phụ thuộc. Trong phân tích hồi quy bội, sử dụng hệ số beta chuẩn hóa cho kết quả chính xác hơn hệ số hồi quy chưa chuẩn hóa. Hệ số Tolerance và VIF : Được sử dụng để đo lường tính tuyến tính và đa cộng tuyến, giá trị tolerance của biến i (TOLi) là 1- R2*i với R2*i là hệ số khẳng định choviệc dự báo biến i bởi các biến độc lập khác. Khi giá trị Tolerance của một biến càng nhỏ thì biến này càng bị cộng tuyến với các biến độc lập khác. Cũng tương tự như hệ số Tolerance, hệ số phóng đại phương sai VIF cũng đo lường tính tuyến tính và đa cộng tuyến. Hệ số VIF càng gần 1 càng tốt.
Tóm tắt chương 4
Thiết kế nghiên cứu bao gồm quá trình nghiên cứu định tính và nghiên cứu định lượng, kết quả của nghiên cứu định tính là cho ra phiếu khảo sát gồm 33 biến, mẫu nghiên cứu là các bệnh nhân khám ngoại trú tại các phòng khám tư Tp.HCM cỡ mẫu là khoảng 250, đồng thời đề ra một số phương pháp xử lý dữ liệu sẽ được áp dụng trong chương 5
Chương 5: Phân tích kết quả
CHƯƠNG 5 PHÂN TÍCH KẾT QUẢ
Sau khi dữ liệu được kiểm tra xong, ta tiến hành mã hóa biến và nhập dữ liệu vào phần mềm SPSS 20.0. Thông qua công cụ thống kê của phần mềm SPSS để xử lý những thông tin bị sai sót trong quá trình nhập liệu. Lập bảng tần số cho tất cả các biến, các giá trị Min, Max, thống kê các giá trị trống (missing) rồi chỉnh sửa lại cho phù hợp. (Bảng mã hóa biến đính kèm ở phụ lục).
5.1 THỐNG KÊ MÔ TẢ
Số lượng bảng câu hỏi phát ra là 280 bảng. Sau khi lọc và làm sạch dữ liệu còn 246 bảng đạt yêu cầu đưa vào phân tích dữ liệu. Tỉ lệ hồi đáp là 246/280 = 87.9%.
Về giới tính: Theo bảng thống kê các biến định tính ta thấy mẫu được phân bố khá tốt ở biến giới tính: tỉ lệ nam chiếm 51.2% và tỉ lệ nữ là 48.8%. Vì đề tài nghiên cứu trong phạm vi là các phòng khám đa khoa với đối tượng là các bệnh nhân nên không có độ lệch đáng kể giữa nam và nữ, thể hiện được đặc thù của ngành dịch vụ khám chữa bệnh (không phân biệt giới tính).
Về độ tuổi: Có sự chênh lệch không nhiều giữa các nhóm tuổi cho thấy mẫu phân bố khá tốt theo nhóm tuổi. Tỷ lệ khảo sát theo nhóm tuổi cao nhất là từ 18– 25 tuổi chiếm 28.9%, kế tiếp là 21.1% từ 31 – 40 tuổi, 19.5% cho nhóm tuổi từ 26 – 30 tuổi, 14.6% từ 41 – 50 tuổi và trên 55 tuổi chiếm 15.9%.
Hình 5.5 Biểu đồ độ tuổi
Về nghề nghiệp: Kết quả thống kê mẫu cho thấy có đến 51.2% các đối tượng là nhân viên văn phòng, kế đến là các ngành nghề khác như: nội trợ, nghề tự do, sinh viên… chiếm 33.3%, 12.7% là doanh nhân/nhà quản lý, ít nhất là công nhân chỉ chiếm 2.8%. Mẫu tập trung vào các đối tượng là các nhân viên văn phòng. Điều này cũng dễ hiểu vì các đối tượng này có thu nhập khá và thường bận rộn, thời gian làm việc cố định, không linh động nên họ thường chọn khám chữa bệnh tại các phòng khám tư nhân để có thể thuận tiện hơn cho công việc. Tỉ lệ thấp nhất là công nhân, điều này có thể lý giải do trung tâm thành phố nên không tập trung nhiều công nhân và thu nhập của họ cũng không dư giả để đi khám tư.
Chương 5: Phân tích kết quả
Về thu nhập: Mẫu được lấy cao nhất theo mức thu nhập từ 5 triệu – dưới 10 triệu đồng là 40.7%, tiếp đến mức thu nhập từ 2 triệu đồng – dưới 5 triệu đồng là 28.9%, thu nhập trên10 triệu đồng chiếm tỉ lệ 20.3%, mức thu nhập dưới 2 triệu đồng có tỉ lệ thấp nhất 10.1%. Mức thu nhập chiếm tỉ lệ cao nhất là 5- dưới 10 triệu đồng, xấp xỉ với tỉ lệ nghề nghiệp nhân viên văn phòng, điều này là khá hợp lý.
Về trình độ học vấn: Kết quả thống kê mẫu cho thấy có 22.8% đối tựợng có trình độ dưới lớp 12, 67.4% đối tượng có trình độ đại học/cao đẳng, 9.8% đối tượng có trình độ