Phương pháp xử lý dữ liệu

CHƯƠNG 2 DỮ LIỆU VÀ PHƯƠNG PHÁP NGHIÊN CỨU

2.3. Phương pháp xử lý dữ liệu

Dữ liệu nghiên cứu và kết quả nghiên cứu được trình bày ở chương 3 được tác giả xử lý theo trình tự các bước như sau:

Bước 1: Tìm hiểu về các biến và các dữ liệu đã thu thập được bằng mô hình thống kê mô tả

Thống kê mô tả giúp mô tả và hiểu được các tính chất của một bộ dữ liệu cụ thể bằng cách đưa ra các tóm tắt ngắn về mẫu và các thông số của dữ liệu. Đo lường xu hướng tập trung của các giá trị như giá trị trung bình, trung vị, yếu vị và đo lường các biến động gồm độ lệch chuẩn, phương sai và giá trị lớn nhất, giá trị nhỏ nhất độ nhọn và lệch.

Bước 2: Kiểm tra đa cộng tuyến bằng hai phương pháp ma trận tương quan và hệ số phóng đại phương sai VIF

Để kiểm định mô hình có xảy ra tình trạng đa cộng tuyến hay không thì có thể dùng hai phương pháp đó là ma trận tương quan và kiểm định hệ số phóng đại phương sai VIF. Nhưng trong hai phương pháp này thì ma trận tương quan ít được sử dụng hơn, cách phổ biến nhất để kiểm tra đa cộng tuyến là sử dụng kiểm định VIF.

Ma trận tương quan:

Ma trận tương quan được dùng khi muốn biết được mức ảnh hưởng của những mối liên hệ giữa các biến mang tính chất định lượng trong nghiên cứu, dựa vào đó tác giả có thể biết được mối liên hệ tuyến tính của những biến độc lập và phụ thuộc. Và xét trên khoảng tin cây cho trước sẽ có một giá trị tương quan của mô hình giữa các biến đại diện.

Khoảng giá trị của hệ số tương quan chạy trong đoạn giá trị -1 đến 1 là biểu hiện hai biến này có mối quan hệ tuyệt đối và về 0 chứng tỏ hay biến không có mối quan hệ gì với nhau. Dấu của hệ số tương quan nói lên tính liên hệ thuận nghịch giữa các biến, có nghĩa là giữa hai đối tượng nghiên cứu thì đống biến thì hai dối tượng sẽ cũng tăng, còn nghịch biến là một biến càng tăng thì biến còn lại sẽ còn giảm. Mô hình ma trận tương quan phản ánh tính chất tuyến tính của mô hình hồi quy. Nếu hệ số tương quan lớn hơn 0,8 thì chứng minh được mô hình có đa cộng tuyến.

29 Kiểm định VIF:

Trong mô hình hồi quy, nếu các biến độc lập có quan hệ chặt với nhau, các biến độc lập có mối quan hệ tuyến tính, nghĩa là các biến độc lập có tương quan chặt, mạnh với nhau thì sẽ có hiện tượng đa cộng tuyến, đó là hiện tượng các biến độc lập trong mô hình phụ thuộc lẫn nhau và thể hiện được dưới dạng hàm số. Để chứng minh cho mô hình không có bị đa cộng tuyến, tác giả thực hiện việc kiểm tra dựa vào hệ số VIF (variance inflation factor) với các giải thuyết như sau:

Nếu hệ số phóng đại phương sai VIF mà lớn hơn 10 thì mô hình chắc chắn có đa cộng tuyến.

Nếu hệ số phóng đại phương sai VIF lớn hơn 2 và nhỏ hơn 10 thì mô hình bắt đầu có dấu hiệu đa cộng tuyến.

Cuối cùng, nếu hệ số phóng đại phương sai VIF nhỏ hơn 2 thì có thể chứng minh được mô hình không có đa cộng tuyến.

Bước 3: Sử dụng Kiểm định Hausman Test và F- Test để tìm ra mô hình lựa chọn nghiên cứu phù hợp nhất cho đề tài của của bài nghiên cứu.

Trong đó ba mô hình được lựa chọn bao gồm:

Thứ nhất, Mô hình bình phương tối thiểu dạng gộp (Pooled Ordinary least squares – Pooled OLS) là mô hình kém hiệu quả vì nó không kiểm soát được từng những đặc điểm riêng của các đối tượng được lựa chọn nghiên cứu.

Thứ hai, mô hình tác động cố định ((Fixed Effects Model - FEM): là mô hình được tạo ra dựa theo mô hình Pooled OLS và thay đổi những khuyết điểm có mô hình Pooled OLS bằng cách kiểm soát được những sự khác nhau của các biến, đối tượng được lựa chọn nghiên cứu trong bài nghiên cứu. Quan trọng hơn hết là mô hình này có sự tương quan giữa biến độc lập và thành phần ngẫu nhiên.

Thứ ba, Mô hình tác động ngẫu nhiên (Random Effects Model - REM):

cũng giống như FEM thì REM cũng được tạo ra dựa theo mô hình Pooled OLS và có những nét tương đồng như mô hình FEM đó là kiểm soát sự khác nhau của các biến, đối tượng nghiên cứu. Nhưng khác với FEM thì mô hình REM đối tượng nghiên cứu không có mối quan hệ tương quan với nhau giữa biến độc lập và thành phần ngẫu nhiên.

Thông qua sử dụng kiểm định Hausman Test và F-Test để tìm ra mô hình lựa chọn nghiên cứu phù hợp nhất cho đề tài của của bài nghiên cứu thì tác giả có những giả thuyết để lựa chọn mô hình nghiên cứu phù hợp như sau:

Kiểm định F- test với hai giả thuyết:

H0: Lựa chọn mô hình Pooled OLS H1: Lựa chọn mô hình FEM

Nếu giá trị kiểm định Prob < α (5%). Bác bỏ H0 và lựa chọn H1, mô hình FEM phù hợp với mô hình nghiên cứu.

Nếu giá trị kiểm định Prob > α (5%). Chấp nhận H0 có nghĩa là không có các đặc điểm riêng khác nhau nên mô hình Pooled OLS phù hợp.

Kiểm định Hausman Test với hai giả thuyết:

H0: Lựa chọn mô hình REM và không có sự tương quan giữa biến độc lập và các thành phần ngẫu nhiên

H1: Lựa chọn mô hình FEM và có sự tương quan giữa các biến độc lập và các thành phần ngẫu nhiên

Nếu giá trị kiểm định Prob < α (5%) . Bác bỏ H0 và lựa chọn H1. Nếu giá trị kiểm định Prob > α (5%). Chấp nhận H0.

Bước 4: Kiểm định phương sai thay đổi và tự tương quan.

Kiểm định phương sai thay đổi:

Kiểm định này giúp phát hiện được liệu mô hình nghiên cứu có bị phương sai thay đổi hay không.

Với kiểm định này sẽ có hai giả thuyết được đưa ra:

H0: Mô hình có phương sai không đổi.

H1: Mô hình có phương sai thay đổi.

Nếu giá trị kiểm định Prob < α (5%). Bác bỏ H0, chấp nhận H1, do đó mô hình có phương sai thay đổi.

Nếu giá trị kiểm định Prob > α (5%). Chấp nhận H0, mô hình không có phương sai thay đổi.

Kiểm định tự tương quan:

Kiểm định tự tương giúp phát hiện được liệu mô hình nghiên cứu có bị tự tương quan hay không.

Với kiểm định tự tương quan cũng sẽ có hai giả thuyết:

H0: Mô hình không có tự tương quan.

H1: Mô hình có tự tương quan.

Nếu giá trị kiểm định Prob < α (5%). Bác bỏ H0, chấp nhận H1, do đó mô hình có tự tương quan.

Nếu giá trị kiểm định Prob > α (5%). Chấp nhận H0, mô hình không có tự tương quan.

Bước 5: Sử dụng phương pháp ước lượng ngẫu nhiên FGLS để chữa lỗi phương sai thay đổi và tự tương quan.

Mô hình FGLS được sử dụng trong bài nghiên cứu bởi mô hình FGLS có thể kiểm soát được phương sai thay đổi và tự tương quan. Theo đó mô hình FGLS sẽ ước lượng ngẫu nhiên theo mô hình theo phương pháp OLS, với cách làm này ngay cả khi mô hình OLS có tồn tại cả phương sai thay đổi và tự tương quan. Mô hình FGLS được dùng để chữa lỗi sai các sai số được rút ra từ mô hình sẽ được dùng để ước tính ma trận phương sai, hiệp phương sai của sai số. Cuối cùng, sử dụng ma trận này để chuyển đổi các biến ban đầu và ước tính giá trị các tham số cần tìm trong trong mô hình. Ở phương pháp này ta sẽ kiểm tra các yếu tố của vốn luân chuyển tác động như thế nào với lợi nhuận của doanh nghiệp qua ba cấp độ ý nghĩa thống kê tương ứng với mức ý nghĩa thống kê lần lượt là 1%, 5%, 10%.

KẾT LUẬN CHƯƠNG 2

Chương này tác giả trình bày về nguồn dữ liệu phục vụ cho bài khóa luận lấy từ báo cáo tài chính của 20 DN ngành dầu khí niêm yết trên TTCK Việt Nam trong khoảng thời gian 11 năm từ năm 2011 – 2021. Ngoài ra, chương này tác giả đưa ra các giả thuyết nghiên cứu và dấu kỳ vọng tác động của các yếu tố độc lập đến HQTC của các DN ngành dầu khí niêm yết trên TTCK Việt Nam. Các bước xử lý dữ liệu của nghiên cứu thông qua phần mềm định lượng stata khi thực hiện nghiên cứu ở chương 3 của khóa luận.

33 CHƯƠNG 3

Mô tả các biến nghiên cứu

Kết quả hồi quy mô hình