5. Kết cấu của luận văn
2.3.3. Phương pháp xử lý, phân tích số liệu
2.3
Phương pháp này trình bày một bức tranh tổng quát về dịch vụ ngân hàng của địa bàn nghiên cứu để phân tích và đánh giá thực trạng về dịch vụ. Các đại lượng được sử dụng trong thống kê mô tả là số tuyệt đối, số tương đối, số trung bình, độ lệch chuẩn, số lớn nhất, nhỏ nhất, tần suất và phần trăm để phân tích thực trạng.
- Trung bình mẫu (mean): Là một đại lượng mô tả thống kê, được tính ra bằng cách lấy tổng giá trị của toàn bộ các quan sát trong tập chia cho số lượng các quan sát trong tập.
- Số trung vị (median): Là một số tách giữa nửa lớn hơn và nửa bé hơn của một mẫu, một quần thể, hay một phân bố xác suất. Nó là giá trị giữa trong một phân bố, mà số số nằm trên hay dưới con số đó là bằng nhau. Điều đó có nghĩa rằng 1/2 quần thể sẽ có các giá trị nhỏ hơn hay bằng số trung vị, và một nửa quần thể sẽ có giá trị bằng hoặc lớn hơn số trung vị.
một tập dữ liệu đã được lập thành bảng tần số. Có thể tính ra độ lệch chuẩn bằng cách lấy căn bậc hai của phương sai.
Nếu gọi X là giá trị của công cụ tài chính, m = E(X) là trung bình động của X, S là phương sai, d là độ lệch chuẩn thì độ lệch chuẩn sẽ được tính toán như sau:
S = E[(X – m)2] d = S
- Tần suất và biểu đồ phân bổ tần suất: tần suất là số lần suất hiện của biện quan sát trong tổng thể, giá trị các biến qua sát có thể hội tụ, phân tán, hoặc phân bổ theo một mẫu hình nào đó, quy luật nào đó.
Khi hai tập dữ liệu có cùng giá trị trung bình cộng, tập nào có độ lệch chuẩn lớn hơn là tập có dữ liệu biến thiên nhiều hơn. Trong trường hợp hai tập dữ liệu có giá trị trung bình cộng không bằng nhau, thì việc so sánh độ lệch chuẩn của chúng không có ý nghĩa.Độ lệch chuẩn còn được sử dụng khi tính sai số chuẩn. Khi lấy độ lệch chuẩn chia cho căn bậc hai của số lượng quan sát trong tập dữ liệu, sẽ có giá trị của sai số chuẩn.
2.3.3.2. Đánh giá độ tin cậy của thang đo và độ tin cậy của biến đo lường
Một thang đo được coi là có giá trị khi nó đo lường đúng cái cần đo. Hay nói cách khác đo lường đó vắng mặt cả hai loại sai lệch: sai lệch hệ thống và sai lệch ngẫu nhiên. Điều kiện cần để một thang đo đạt giá trị là thang đo đó phải đạt độ tin cậy, nghĩa là cho cùng một kết quả khi đo lặp đi lặp lại.
Độ tin cậy của thang đo được đánh giá bằng phương pháp nhất quán nội tại thông qua hệ số Cronbach Alpha và hệ số tương quan biến tổng
Hệ số Cronbach’s Alpha
Phương pháp này cho phép người phân tích loại bỏ những biến không phù hợp và hạn chế các biến rác trong mô hình nghiên cứu vì nếu không chúng ta không thể biết được chính xác độ biến thiên cũng như độ lỗi của các biến. Theo đó, chỉ những biến có Hệ số tương quan tổng biến phù hợp (Corrected Item-Total Correlation) lớn hơn 0.3 và có hệ số Alpha nếu bỏ biến đó ra khỏi
mô hình (Alpha If Item Deleted) nhỏ hơn hệ số Alpha thì hợp lý. Đồng thời, biến đó cũng phải có hệ số Alpha lớn hơn 0.6 mới được xem là chấp nhận được và thích hợp đưa vào phân tích những bước tiếp theo (Nunnally và BernStein, 1994). Cũng theo nhiều nhà nghiên cứu, nếu Cronbach’s alpha đạt từ 0,8 trở lên thì thang đo lường là tốt và mức độ tương quan sẽ càng cao hơn. Hệ số Alpha nên đạt từ 0,6 đến 0,9. Nếu độ tin cậy cao quá thì các câu hỏi thiết kế gần như giống hệt nhau. Nếu độ tin cậy thấp quá thì chứng tỏ 1 trong 2 khả năng: Khả năng thứ nhất là thiết kế bộ câu hỏi không hợp lý, các câu hỏi không liên quan đến nhau nêu khách hàng đánh kết quả khác nhau; khả năng thứ hai là mặc dù bảng câu hỏi thiết kế đúng nhưng khách hàng không chú tâm trả lời bảng câu hỏi vì vậy chất lượng thu được thấp.
Hệ số tương quan biến tổng (item-total correclation)
Hệ số tương quan biến tổng là hệ số tương quan của một biến với điểm trung bình của các biến khác trong cùng một thang đo, do đó hệ số này càng cao thì sự tương quan của biến này với các biến khác trong nhóm càng cao. Trong nghiên cứu này, các biến có hệ số tương quan biến tổng nhỏ hơn 0.3 được coi là biến rác và sẽ bị loại khỏi thang đo.
2.3.3.3. Phân tích nhân tố
Phân tích nhân tố hay phân tích nhân tố khám phá (Exploratory Factor Analysis - EFA) là một kỹ thuật phân tích nhằm thu nhỏ và tóm tắt các dữ liệu rất có ích cho việc xác định các tập hợp biến cần thiết cho vấn đề nghiên cứu. Ví dụ, EFA dùng để rút gọn một tập hợp k biến quan sát thành 1 tập hợp f các nhân tố có ý nghĩa hơn với f < k. Quan hệ giữa các nhóm biến có liên hệ qua lại lẫn nhau được xem xét dưới dạng một số các nhân tố cơ bản. Mỗi một biến quan sát sẽ được tính một tỷ số gọi là Hệ số tải nhân tố (factor loading). Hệ số này cho người nghiên cứu biết được mỗi biến đo lường sẽ “thuộc về” những nhân tố nào. Theo Hair và ctg (1998, 111, Multivariate Data Analysis),
Prentice – Hall International, hệ số này là chỉ tiêu để đảm bảo mức ý nghĩa thiết thực của EFA:
Factor loading > 0.3 được xem là đạt mức tối thiểu Factor loading > 0.4 được xem là quan trọng
Factor loading > 0.5 được xem là có ý nghĩa thực tiễn
Trong phân tích nhân tố, thứ nhất, yêu cầu cần thiết là hệ số KMO (Kaiser-Meyer –Olkin (KMO) phải có giá trị lớn (0,5<KMO<1) thể hiện phân tích nhân tố là thích hợp, còn nếu hệ số KMO <0,5 thì phân tích nhân tố có khả năng không thích hợp với các dữ liệu.
Thứ hai, theo Trọng và Ngọc (205, 262), kiểm định Barlett (Barlett’s test) xem xét giả thiết H0 độ tương quan giữa các biến quan sát bằng 0 trong tổng thể. Nếu kiểm định này có ý nghĩa thống kê (Sig. < 0,05) thì các biến quan sát có mối tương quan với nhau trong tổng thể.
Thứ ba, hệ số tải nhân tố của từng biến quan sát phải có giá trị lớn hơn 0,5, điểm dừng khi Eigenvalue (đại diện cho phần biến thiên được giải thích bởi mỗi nhân tố) lớn hơn 1 (mặc định của chương trình SPSS).
Thứ tư, tổng phương sai dùng để giải thích bởi từng nhân tố lớn hơn 50% mới thỏa yêu cầu của phân tích nhân tố (Gerbing & Anderson, 1988). Tổng phương sai này thể hiện phần trăm biến thiên của các biến quan sát. Nghĩa là xem biến thiên là 100% thì giá trị này cho biết phân tích nhân tố giải thích được bao nhiêu %.
Khi tiến hành phân tích nhân tố, tác giả đã sử dụng phương pháp trích (Extraction method) là Principal Components với phép xoay Varimax và phương pháp tính nhân tố là phương pháp Regression.
2.3.3.4. Phân tích tương quan hệ số Pearson
Để mô tả độ tương quan giữa hai biến hay lượng hóa mức độ chặt chẽ của mối liên hệ tuyến tính giữa hai biến định lượng, chúng ta cần phải ước tính hệ số tương quan (coefficient of correlation). Có thể sử dụng nhiều công
thức tính hệ số tương quan khác nhau cho những tình huống khác nhau. Hệ số tương quan được biết đến nhiều nhất là hệ số tương quan Pearson. Trong phân tích tương quan Pearson, không có sự phân biệt giữa các biến độc lập và biến phụ thuộc mà tất cả đều được xem xét như nhau. Hệ số tương quan Pearson được tính bằng cách chia hiệp phương sai (covariance) của hai biến với tích độ lệch chuẩn (standard deviation) của chúng.
r= Cov(x,y)
var(x). var(y) = Cov(x,y)
sx ´sy =>r= (xi -x)(yi -y) i=1 n å (xi -x)2 (yi -y)2 i=1 n å i=1 n å
Nếu giá trị r là dương, hai biến x, y cùng biến thiên theo một hướng; nếu r âm, x và y liên hệ đảo ngược, tức khi x tăng thì y giảm và ngược lại. Nếu r= 1 hay r= -1, mối liên hệ của y và x được hoàng toàn xác định, có nghĩa là cho bất cứ giá trị nào của x, chúng ta có thể xác định giá trị của y. Các giá trị trong khoảng (-1,1) cho biết mức độ phụ thuộc tuyến tính giữa các biến. Hệ số tương quan càng gần với -1 và 1 thì tương quan giữa các biến càng mạnh. Nếu r=0, hai biến x và y hoàn toàn độc lập, tức không có liên hệ với nhau. Tuy nhiên, phát biểu ngược lại không đúng vì hệ số tương quan chỉ phát hiện tương quan tuyến tính giữa hai biến.
Bảng 2.2: Ý nghĩa của hệ số tƣơng quan
Hệ số tƣơng quan Ý nghĩa
±0.01 đến ±0.1 Mối tương quan quá thấp, không đáng kể
±0.2 đến ±0.3 Mối tương quan thấp
±0.4 đến ±0.5 Mối tương quan trung bình
±0.6 đến ±0.7 Mối tương quan cao
Nếu giữa 2 biến có sự tương quan chặt thì phải lưu ý vấn đề đa cộng tuyến khi phân tích hồi quy. Đa cộng tuyến là trạng thái trong đó các biến độc lập có tương quan chặt chẽ với nhau. Vấn đề của hiện tượng cộng tuyến là chúng cung cấp cho mô hình những thông tin rất giống nhau, và rất khó tách rời ảnh hưởng của từng biến một đến biến phụ thuộc. Hiệu ứng khác của sự tương quan khá chặt giữa các biến độc lập là nó làm tăng độ lệch chuẩn của các hệ số hồi quy và làm giảm trị thống kê t của kiểm định ý nghĩa của chúng nên các hệ số có khuynh hướng kém ý nghĩa hơn khi không có đa cộng tuyến trong khi hệ số xác định R square vẫn khá cao. Trong quá trình phân tích hồi quy bội, đa cộng tuyến được SPSS chuẩn đoán bằng lựa chọn Collinearity Diagnostic.
2.3.3.5. Phân tích hồi quy và kiểm định sự phù hợp của mô hình
Phân tích hồi quy là một phân tích thống kê để xác định xem các biến độc lập quy định các biến phụ thuộc như thế nào hay xác định mối quan hệ nhân quả giữa biến phụ thuộc và biến độc lập. Mô hình phân tích hồi quy sẽ mô tả hình thức của mối liên hệ, qua đó giúp ta dự đoán được mức độ của biến phụ thuộc khi biết trước giá trị của biến độc lập. Có rất nhiều phương pháp phân tích hồi quy, nhưng trong bài này ta sẽ chọn phương pháp ENTER. (là phương pháp các biến vào mô hình).