XỬ LÝ DỮ LIỆU

Một phần của tài liệu (luận văn thạc sĩ) nghiên cứu các nhân tố ảnh hưởng đến nhu cầu vốn lưu động của các doanh nghiệp sản xuất hàng tiêu dùng được niêm yết trên thị trường chứng khoán việt nam (Trang 54 - 57)

CHƢƠNG 2 THIẾT KẾ NGHIÊN CỨU

2.5. XỬ LÝ DỮ LIỆU

Để xây dựng hoàn chỉnh một mơ hình có nghĩa thì phải tiến hành đầy đủ các thủ tục sau:

2.5.1. P ân tí tƣơng qu n

Phân tích tƣơng quan để đo lƣờng mức độ liên kết tuyến tính giữa các biến với nhau, giữa các biến độc lập với nhau và giữa biến độc lập và biến phụ thuộc trong mơ hình. Bƣớc này tạo ra cái nhìn tổng quan về những mối quan hệ cần nghiên cứu: độ lớn, chiều, nghĩa thống kê, từ đó có thể xây dựng mơ hình hồi quy và có các bƣớc phân tích chuẩn xác hơn.

Hệ số tƣơng quan (r) là một chỉ số thống kê đo lƣờng mối liên hệ tƣơng quan giữa hai biến số X và Y.

Cho hai biến số x và y từ n mẫu, hệ số tƣơng quan Pearson đƣợc ƣớc lƣợng tính bằng cơng thức sau đây:

Trong đó: x, y là giá trị của biến x, y là giá trị trung bình mẫu của biến x, y

Hệ số tƣơng quan (r) có giá trị từ -1 đến 1. Hệ số tƣơng quan (r) bằng 0 (hay gần 0) có nghĩa là hai biến số khơng có liên hệ gì với nhau. Ngƣợc lại, nếu hệ số tƣơng quan bằng -1 hay 1 có nghĩa là hai biến số đó có một mối quan hệ tuyệt đối. Nếu giá trị tƣơng quan là âm (r < 0) có nghĩa là khi x tăng cao thì y lại giảm (và ngƣợc lại khi x giảm và y tăng). Nếu giá trị tƣơng quan là dƣơng (r >0) thì có nghĩa là x và y có mối quan hệ tỉ lệ thuận. Khi r = 0 thì báo hiệu khơng có sự ảnh hƣởng giữa các biến, đặc biệt nếu rxy = 0 thì các biến độc lập x khơng thể đƣa vào mơ hình để giải thích cho y.

>0,8: x và y tƣơng quan mạnh, tồn tại đa cộng tuyến. từ 0,4 đến 0,8: x và y tƣơng quan trung bình.

<0,4: x và y tƣơng quan yếu.

Dựa vào hệ số tƣơng quan r, ta có thể thấy đƣợc mối quan hệ giữa các biến, nếu các hệ số tƣơng quan giữa các biến độc lập là cao, thì có khả năng xảy ra hiện tƣợng đa cộng tuyến.

2.5.2. P ân tí độ p ù ợp ủ mô n

Một công việc quan trọng của bất kỳ thủ tục thống kê xây dựng mơ hình từ dữ liệu nào cũng đều là chứng minh sự phù hợp của mơ hình. Hầu nhƣ khơng có đƣờng thẳng nào có thể phù hợp hồn tồn với tập dữ liệu, vẫn ln có sự sai lệch giữa các giá trị dự báo đƣợc cho bởi đƣờng thẳng và các giá trị thực tế (thể hiện qua phần dƣ).

Để biết mơ hình hồi quy tuyến tính đã xây dựng trên dữ liệu mẫu phù hợp đến mức nào với dữ liệu thì chúng ta cần dùng một thƣớc đo cụ thể để đo độ phù hợp của nó.

Một thƣớc đo sự phù hợp của mơ hình tuyến tính thƣờng dùng là hệ số xác định R2

tƣởng toàn bộ biến thiên quan sát đƣợc của biến phụ thuộc đƣợc chia thành 2 phần: phần biến thiên do hồi quy và phần biến thiên không do hồi quy hay còn gọi là phần dƣ.

2.5.3. Lự ọn b ến o mô n

Để lựa chọn biến cho mơ hình ta dựa vào kết quả của bảng Coefficientsf sau khi chạy SPSS, ta xét giá trị sig của các biến. Những biến nào có giá trị sig nhỏ hơn 0,05 thì có nghĩa giải thích trong mơ hình.

2.5.4. K ểm tr g ả địn l ên ệ tuyến tín

Để kiểm tra giả định liên hệ tuyến tính ta thực hiện phƣơng pháp vẽ biểu đồ phân tán giữa các phần dƣ và giá trị dự đốn mà mơ hình hồi quy tuyến tính cho ra.

Nếu giả định liên hệ tuyến tính và phƣơng sai bằng nhau đƣợc thỏa mãn thì ta sẽ khơng nhận thấy có liên hệ gì giữa các giá trị dự đốn và phần dƣ, chúng sẽ phân tán rất ngẫu nhiên.

Quan sát hình vẽ Scatterplot, ta xem xét phần dƣ phân tán nhƣ thế nào, nếu phần dƣ phân tán ngẫu nhiên xung quanh đƣờng đi qua tung độ 0 chứ khơng tạo thành một hình dạng nào. Nhƣ vậy, ta có thể kết luận rằng giả định tuyến tính đƣợc thỏa mãn, ngƣợc lại nếu phần dƣ phân tán theo hình dạng bậc 2 Parabol, cong bậc ba Cubic, … thì giả định liên hệ tuyến tính bị vi phạm.

2.5.5. K ểm tr g ả địn p ƣơng s ủ s số ông đổ

Để chắc chắn phƣơng sai của sai số không đổi, ta tiến hành thủ tục kiểm định giả thuyết chuẩn tắc. Tùy theo cỡ mẫu mà ta dùng kiểm định White, kiểm định Glesjer hay Spearman.

2.5.6. K ểm tr g ả địn p ân p ố uẩn ủ p ần ƣ

Một trong những cách khảo sát phân phối chuẩn của phần dƣ là xây dựng biểu đồ tần số của các phần dƣ. Thật không hợp l khi chúng ta kỳ vọng rằng các phần dƣ quan sát có phân phối hồn tồn chuẩn vì ln ln có

những chênh lệch do lấy mẫu. Ngay cả khi các sai số có phân phối chuẩn trong tổng thể đi nữa thì phần dƣ trong mẫu quan sát cũng chỉ xấp xỉ chuẩn mà thôi.

Sau khi xây dựng biểu đồ Histogram ta xem giá trị trung bình mean độ lệch chuẩn Std.Dev để rút ra kết luận.

2.5.7. K ểm tr g ả địn ông xảy r ện tƣợng tự tƣơng qu n

Tự tƣơng quan là sự tƣơng quan giữa các thành phần của của chuỗi các quan sát đƣợc sắp xếp theo thứ tự thời gian hoặc không gian.

Đại lƣợng thống kê Durbin-Watson có thể dùng để kiểm định tƣơng quan của các sai số kề nhau. Dựa vào kết quả của Model Summaryf

ta có hệ số Durbin-Watson, sau đó tra giá trị d với k số biến độc lập và N quan sát để có dL , dU tƣơng ứng.

2.5.8. K ểm tr g ả địn ông xảy r ện tƣợng đ ộng tuyến

Cộng tuyến là trạng thái trong đó các biến độc lập có tƣơng quan chặt chẽ với nhau. Vấn đề của hiện tƣợng cộng tuyến là chúng cung cấp cho mơ hình những thơng tin rất giống nhau và khó tách rời ảnh hƣởng của từng biến một đến biến phụ thuộc.

Một trong những cơng cụ chẩn đốn giúp ta phát hiện sự tồn tại của cộng tuyến trong dữ liệu và đánh giá mức độ cộng tuyến làm thối hóa các tham số đƣợc ƣớc lƣợng là hệ số phóng đại phƣơng sai (Variance inflation factor – VIF). Quy tắc là VIF vƣợt quá 10, đó là dấu hiệu của đa cộng tuyến.

Một phần của tài liệu (luận văn thạc sĩ) nghiên cứu các nhân tố ảnh hưởng đến nhu cầu vốn lưu động của các doanh nghiệp sản xuất hàng tiêu dùng được niêm yết trên thị trường chứng khoán việt nam (Trang 54 - 57)

Tải bản đầy đủ (PDF)

(114 trang)