Phương pháp phân tích dữ liệu

Một phần của tài liệu Lê Công Hoàng Sơn-TCNH27A (Trang 54 - 57)

3.2.1. Thống kê mô tả

Thống kê mô tả (Descriptive Statistics) là các phương pháp sử dụng để tóm tắt hoặc mô tả một tập hợp dữ liệu, một mẫu nghiên cứu dưới dạng số hay biểu đồ trực quan. Các công cụ số dùng để mô tả thường dùng nhất là trung bình cộng và độ lệch chuẩn. Các công cụ trực quan thường dùng nhất là các biểu đồ.

Phương pháp thống kê mô tả được tác giả sử dụng để mô tả các đặc điểm cơ bản của dữ liệu nhằm cung cấp một cái nhìn tổng thể về mẫu nghiên cứu. Thơng qua

thống kê mơ tả, có thể thấy các giá trị trung bình, giá trị lớn nhất, giá trị nhỏ nhất, độ lệch chuẩn, skewness và kurtosis của các biến nghiên cứu. Thống kê mô tả giúp mô tả và hiểu được các tính chất của một bộ dữ liệu cụ thể bằng các tóm tắt về mẫu và các thông số của dữ liệu bao gồm các biến số được sử dụng.

3.2.2. Kiểm định tương quan Pearson

Kiểm định tương quan Pearson là phương pháp phổ biến nhất để sử dụng cho các biến số. Tương quan Pearson r có giá trị dao động từ -1 đến 1 (lưu ý, hệ số r chỉ có ý nghĩa khi sig nhỏ hơn 0.05). Trong đó:

 Nếu r càng tiến về 1, -1: tương quan tuyến tính càng mạnh, càng chặt chẽ. Tiến về 1 là tương quan dương, tiến về -1 là tương quan âm.

 Nếu r càng tiến về 0: tương quan tuyến tính càng yếu.

 Nếu r = 1: tương quan tuyến tính tuyệt đối.

 Nếu r = 0: khơng có mối tương quan tuyến tính. Trong trường hợp này sẽ có hai khả năng xảy ra, giữa hai biến sẽ khơng có mối quan hệ nào hoặc giữa hai biến tồn tại một mối tương quan phi tuyến.

Dựa vào chỉ số tương Pearson, có thể kết luận mối quan hệ giữa hai biến số, tuy nhiên để khẳng định giữa chúng có tương quan mang ý nghĩa thống kê hay khơng thì cần phải đặt giả thuyết và tiến hành kiểm định, theo Andy Field (2009). Giải thuyết được đặt ra là H0 với r = 0, giả định rằng giữa chúng không tồn tại mối quan hệ tuyến tính. Sau đó chúng ta tiến hành kiểm định giá trị r. Kết quả sẽ cho ra hai trường hợp sau đây:

 Nếu Sig < 0.05: Chúng ta bác bỏ giả thuyết H0, kết luận rằng tồn tại mối quan hệ tuyến tính giữa hai biến số. Lúc này, giá trị r không mang giá trị 0.

 Nếu Sig > 0.05: Chúng ta chấp nhận giả thuyết H0, kết luận rằng không tồn tại một mối quan hệ tuyến tính giữa hai biến số. Lúc này, giá trị r = 0.

3.2.3. Kiểm định đa cộng tuyến

Đa cộng tuyến là sự xuất hiện của các mối tương quan cao giữa hai hoặc nhiều biến độc lập trong một mơ hình hồi quy bội. Đa cộng tuyến có thể dẫn đến kết quả

sai lệch khi nhà nghiên cứu hoặc nhà phân tích cố gắng xác định mức độ sử dụng hiệu quả nhất của mỗi biến độc lập để dự đoán hoặc xác định mức độ ảnh hưởng của các độc lập đến biến phụ thuộc trong mơ hình nghiên cứu.

Do đó trong bài luận văn này, tác giả tiến hành kiểm định liệu rằng giữa các biến độc lập với nhau, có hay khơng tồn tại hiện tượng đa cộng tuyến thơng qua hệ số phóng đại phương sai (Variance Inflation Factor - VIF). Hệ số phóng đại phương sai là một thước đo về mức độ nghiêm trọng của đa cộng tuyến trong phân tích hồi quy. Trong phân tích hồi quy theo phương pháp bình phương nhỏ nhất (OLS) thông thường, đa cộng tuyến tồn tại khi hai hoặc nhiều biến độc lập chứng minh mối quan hệ tuyến tính giữa chúng.

Nhìn chung, VIF trên 4 hoặc dung sai dưới 0,25 cho thấy có thể tồn tại đa cộng tuyến và cần phải điều tra thêm. Khi VIF cao hơn 10 hoặc dung sai thấp hơn 0,1, có đa cộng tuyến đáng kể cần được hiệu chỉnh.

3.2.4. Phân tích hồi quy

Bài luận văn này sử dụng phương pháp phân tích hồi quy để đo lường mức độ ảnh hưởng và tác động của biến độc lập đến các biến phụ thuộc. Phương pháp này nhằm cung cấp những bằng chứng xác thực để trả lời các câu hỏi nghiên cứu.

Bài luận văn này sử dụng mô hình phân tích hồi quy dữ liệu bảng (Panel regression) với mơ hình hồi quy bằng phương pháp bình phương nhỏ nhất (Ordinary Least Square-OLS). Hồi quy bình phương nhỏ nhất (OLS) là một kỹ thuật phổ biến để ước tính hệ số của phương trình hồi quy tuyến tính mơ tả mối quan hệ giữa một hoặc nhiều biến định lượng độc lập và một biến phụ thuộc (hồi quy tuyến tính đơn giản hoặc nhiều tuyến tính). Bình phương tối thiểu là nghĩa của sai số bình phương tối thiểu (SSE).

Sau đó, để nâng cao độ tin cậy của kết quả hồi quy, các kiểm định phương sai thay đổi (heteroskedasticity test) sẽ được tiến hành để phát hiện hiện tượng đó trong mơ hình Phương sai thay đổi liên quan đến các tình huống trong đó phương sai của các phần dư là không bằng nhau trong một phạm vi giá trị đo được. Khi chạy phân tích hồi quy, phương sai thay đổi dẫn đến sự phân tán không bằng nhau của các phần

dư. Điều này vi phạm các giả định của Gauss Markov về mơ hình hồi quy tuyến tính là phương sai thay đổi của các sai số phải giống nhau.

Nếu các vấn đề tồn tại, mơ hình hồi quy sẽ được chạy lại với các lỗi chuẩn mạnh (“Robust” standard errors) để loại bỏ ảnh hưởng của việc thay đổi phương sai.

Một phần của tài liệu Lê Công Hoàng Sơn-TCNH27A (Trang 54 - 57)

Tải bản đầy đủ (PDF)

(110 trang)