Phương pháp xử lý dữ liệu

Một phần của tài liệu (luận văn thạc sĩ) nghiên cứu các nhân tố ảnh hưởng đến việc nắm giữ tiền mặt của các doanh nghiệp thuộc nhóm ngành dược phẩm niêm yết trên thị trường chứng khoán việt nam (Trang 54 - 57)

7. Tổng quan tài liệu nghiên cứu

2.2.2.Phương pháp xử lý dữ liệu

a. Cấu trúc dữ liệu

Dữ liệu sử dụng trong mô hình được thiết kế theo kiểu dữ liệu bảng (panel data), cấu trúc dữ liệu bảng được kết hợp từ 02 thành phần: thành phần dữ liệu chéo (cross – section) và thành phần dữ liệu theo chuỗi thời gian (time series). Việc sử dụng dữ liệu bảng có nhiều ưu điểm hơn so với dữ liệu thời gian và dữ liệu chéo: Thứ nhất, dữ liệu bảng là sự kết hợp giữa dữ liệu thời gian và dữ liệu chéo nên giúp tăng thêm số quan sát, phần nào khắc phục hiện tượng đa cộng tuyến giữa các biến, bậc tự do cao hơn nên hiệu quả hơn và mô tả dạng hàm dữ liệu bảng đơn giản. Thứ hai, dữ liệu bảng cũng có thể phát hiện và đo lường tốt hơn các tác động mà khó có thể quan sát khi sử dụng dữ liệu thời gian hay dữ liệu chéo. Thứ ba, dữ liệu bảng có thể kiểm soát tốt hơn tính không đồng nhất giữa các đơn vị trong mẫu nghiên cứu.

b. Kiểm định sự vi phạm các giả thiết hồi quy

Phân tích dữ liệu kiểm tra sự thỏa mãn những giả thuyết của mô hình bao gồm việc kiểm tra tính dừng của các biến, kiểm tra các hiện tượng đa cộng tuyến, tự tương quan và phương sai sai số thay đổi.

Có thể nói, các kiểm định T và F cổ điển đều dựa trên giả định các dữ liệu có tính dừng. Một quá trình ngẫu nhiên được cho là có tính dừng yếu nếu trung bình, phương sai và các tự đồng phương sai của nó là hằng số theo thời gian. Có nhiều phương pháp kiểm tra tính dừng: kiểm định Dickey–Fuller (DF), kiểm định Phillip – Person (PP) và kiểm định Dickey và Fuller mở rộng (ADF), kiểm tra bằng giản đồ tự tương quan…Nghiên cứu đề xuất sử dụng kiểm định Dickey và Fuller mở rộng (ADF) để kiểm định tính dừng của biến.

cặp giữa các biến được thực hiện bằng cách thiết lập ma trận hệ số tương quan và xem xét hệ số tương quan cặp giữa các biến giải thích, tìm ra những cặp biến có hệ số tương quan cao. Để giảm thiểu hiện tượng đa cộng tuyến trong dữ liệu, các cặp biến có hệ số tương quan lớn hơn hoặc bằng 0.7 cần được xem xét loại bỏ ra khỏi mô hình.

Về việc sử dụng các phương pháp hồi quy khác nhau trong mô hình dữ liệu bảng, mô hình FEM (đề cập trong phần phương pháp nghiên cứu) tự bản thân nó chỉ quan tâm đến những khác biệt mang tính cá nhân đóng góp vào mô hình nên sẽ không có hiện tượng tự tương quan trong mô hình. Tuy nhiên, để đảm bảo trình tự và kiểm tra phát hiện các khuyết tật của mô hình trước khi phân tích quyết định lựa chọn hồi quy theo các phương pháp khác nhau, kiểm định tự tương quan cũng được tiến hành. Vấn đề về sự tương quan của phần dư trong mô hình hồi quy OLS tuy không làm thiên chệch kết quả ước lượng của hệ số nhưng sẽ làm kết quả ước lượng không hiệu quả, nhất là các sai số chuẩn ước lượng của hệ số không còn là bé nhất. Các phương pháp kiểm tra hiện tượng tự tương quan thường được sử dụng là kiểm định Durbin - Watson, kiểm định Breusch - Godfrey, kiểm định LM... Trong nghiên cứu, tác giả sử dụng kiểm định LM để kiểm tra sự tồn tại của hiện tượng tự tương quan.

Giả định của mô hình hồi quy tuyến tính cổ điển là phương sai của sai số hồi quy không đổi qua các quan sát. Tuy nhiên, trong thực tế sai số hồi quy có thể tăng lên hoặc giảm đi khi giá trị biến giải thích tăng lên. Dữ liệu bảng hay dữ liệu chéo thường gặp vấn đề phương sai không đồng nhất hơn so với số liệu chuỗi thời gian. Nguyên nhân phương sai của sai số tăng do các đơn vị được quan sát theo thời gian trong dữ liệu bảng thường là các cá thể khác nhau của một tổng thể, mang những đặc điểm có thể rất khác nhau dẫn đến dữ liệu rất khác biệt (rất lớn hoặc rất nhỏ so với các quan sát khác). Thứ hai, hoặc khi không xác đúng dạng mô hình, nếu một biến quan

trọng bị bỏ sót thì phương sai của sai số lớn và thay đổi. Tình trạng này giảm hẳn khi đưa biến bị bỏ sót vào mô hình. Để phát hiện vấn đề phương sai thay đổi, có thể sử dụng phương pháp đồ thị (vẽ đồ thị phân phối của phần dư theo biến phụ thuộc và các biến giải thích) và các phương pháp kiểm định. Các phương pháp kiểm định phổ biến là kiểm định White, kiểm định Breusch – Pagan – Godfrey, kiểm định Park. Nếu kết quả kiểm định cho thấy tồn tại hiện tượng phương sai sai số thay đổi, tác giả đề xuất một số phương án khắc phục. Với trường hợp thứ nhất, việc rà soát lại dữ liệu và phát hiện các giá trị dị biệt và loại bỏ ra khỏi mẫu là việc cần thiết. Trường hợp thứ hai, việc bỏ sót biến hoàn toàn có thể xảy ra mặc dù mô hình nghiên cứu đã được công bố trong nhiều nghiên cứu thực nghiệm các thị trường khác nhau. Nguyên nhân có thể xuất phát từ đặc thù của thị trường Việt Nam, sự khác biệt trong giai đoạn nghiên cứu và các yếu tố khách quan khác…Việc tìm hiểu và thu thập thêm biến cần được xem xét nghiêm túc trong các nghiên cứu sau. Về mặt kỹ thuật, hiện tượng phương sai sai số thay đổi có thể khắc phục bằng cách sử dụng các sai số chuẩn mạnh (robust standard errors), ước lượng bình phương tối thiểu có trọng số (weighted least square – WLS)…

Để chứng minh sự phù hợp của phương trình hồi quy trong việc giải thích bản chất, mối liên hệ giữa các hiện tượng, tác giả sử dụng hệ số xác định R2. Theo lý thuyết, tính chất của hệ số xác định là 0 ≤ R2 ≤ 1. R2 thường được xem như một chỉ báo cho mức độ phù hợp của mô hình. Khi R2 gần bằng 1, mô hình phù hợp; khi giá trị này nhỏ gần về 0 thì mô hình không phù hợp với bộ số liệu. Đối với các hiện tượng kinh tế - xã hội, R2 thường không cao như các hiện tượng trong kỹ thuật, nằm trong khoảng từ 30% đến 40%. Do đó, trong nghiên cứu này tác giả đề xuất mức chấp nhận các mô hình hồi quy phù hợp là lớn hơn hoặc bằng 0.3.

Một phần của tài liệu (luận văn thạc sĩ) nghiên cứu các nhân tố ảnh hưởng đến việc nắm giữ tiền mặt của các doanh nghiệp thuộc nhóm ngành dược phẩm niêm yết trên thị trường chứng khoán việt nam (Trang 54 - 57)