Phân tích tương quan và đa cộng tuyến

Một phần của tài liệu (luận văn thạc sĩ) nghiên cứu các nhân tố ảnh hưởng đến cấu trúc tài chính của các doanh nghiệp thuộc nhóm ngành sản xuất thực phẩm và đồ uống niêm yết trên sàn chứng khoán việt nam (Trang 63 - 64)

7. Tổng quan tài liệu nghiên cứu

2.4.2. Phân tích tương quan và đa cộng tuyến

Hệ số tương quan (r) là một chỉ số thống kê đo lường mối liên hệ tương quan giữa hai biến số X, Y.

Cho hai biến số x và y từ n mẫu, hệ số tương quan Pearson được ước tính bằng công thức sau đây:

r

Trong đó: x, y là giá trị của biến x, y

, : giá trị trung bình mẫu của biến x, y

Hệ số tương quan (r) có giá trị từ -1 đến 1. Hệ số tương quan (r) bằng 0 (hay gần 0) có nghĩa là hai biến số không có liên hệ gì với nhau. Ngược lại, nếu hệ số tương quan bằng -1 hay 1 có nghĩa là hai biến số có một mối liên hệ tuyệt đối. Nếu giá trị của hệ số tương quan là âm (r < 0) có nghĩa là khi x tăng cao thì y giảm (và ngược lại, khi x giảm thì y tăng). Nếu giá trị hệ số tương quan là dương (r > 0) có nghĩa là khi x tăng cao thì y cũng tăng, và khi x giảm thì y cũng giảm theo.

> 0.8 : x và y tương quan mạnh, tồn tại đa cộng tuyến. = 0.4 đến 0.8 : x và y tương quan trung bình.

< 0.4 : x và y tương quan yếu. [46]

Dựa vào hệ số tương quan Pearson r, ta có thể thấy được mối quan hệ giữa các biến, nếu hệ số tương quan r giữa các biến độc lập là cao, thì có khả năng xảy ra hiện tượng đa cộng tuyến. Đa cộng tuyến có nghĩa là sự tồn tại

56

mối quan hệ tuyến tính “hoàn hảo” hoặc chính xác giữa một số hoặc tất cả các biến độc lập trong một mô hình hồi quy.

Các giải pháp khắc phục đa cộng tuyến:

Loi b biến: Vì tính đa cộng tuyến là do những mối quan hệ chặt chẽ giữa các biến độc lập, cách chắc chắn nhất để loại bỏ hoặc giảm bớt các tác

động của tính đa cộng tuyến là bỏ một hoặc nhiều biến độc lập ra khỏi mô

hình.

Tăng kích thước mu: Giải pháp này thích hợp cho hiện tượng đa cộng

tuyến do cỡ mẫu nhỏ, vì tăng cỡ mẫu sẽ làm cải thiện độ chính xác của một ước lượng và do đó, giảm thiểu được những yếu tố phản tác dụng của tính đa cộng tuyến. Đôi khi chỉ cần tăng thêm một số quan sát là khắc phục được hiện tượng đa cộng tuyến. Tuy nhiên, việc tăng dữ liệu đôi khi đồng nghĩa với việc tăng chi phí, nhất là đối với dữ liệu sơ cấp.

Thay đổi dng mô hình.

S dng thông tin tiên nghim.

B qua đa cng tuyến: Nếu > 2 hoặc R2 của mô hình cao hơn R2 của

mô hình hồi quy phụ thì bỏ qua đa cộng tuyến. Nếu nhà nghiên cứu ít quan tâm đến việc diễn dịch từng hệ số riêng lẻ nhưng lại chú trọng hơn vào việc dự báo, thì tính đa cộng tuyến có thể không phải là một vấn đề nghiêm trọng. Ngay cả khi có tương quan cao giữa các biến độc lập, nếu như các hệ số hồi quy là có ý nghĩa, có những dấu và giá trị có ý nghĩa, thì không cần quan tâm vào vấn đề đa cộng tuyến. Bởi, nếu một hệ số hồi quy có ý nghĩa ngay cả trong trường hợp có sự hiện diện của đa cộng tuyến thì đó mới là một kết quả mạnh.

Một phần của tài liệu (luận văn thạc sĩ) nghiên cứu các nhân tố ảnh hưởng đến cấu trúc tài chính của các doanh nghiệp thuộc nhóm ngành sản xuất thực phẩm và đồ uống niêm yết trên sàn chứng khoán việt nam (Trang 63 - 64)

Tải bản đầy đủ (PDF)

(129 trang)