Mơ hình hồi quy tuyến tính có dạng như sau: GDP = β0+ β1*LR + β2*LE+ β3*GRL + β4*GRC
Biến phụ thuộc: GDP: Tăng trƣởng kinh tế Biến độc lập:
LR: Số người lớn biết chữ LE: tuổi thọ trung bình GRL: Tăng trưởng lao động GRC: Tăng trưởng tỉ lệ vốn
β0 : Hệ số tự do - Nó chính bằng giá trị trung bình của biến phụ thuộc GDP khi biến độc lập nhận giá trị bằng 0.
β1; β2; β3; β4 : Các tham số chưa biết của mơ hình.
Số ngƣời lớn biết chữ LR GDP Tuổi thọ trung bình LE Tăng trƣởng lao động GRL Tăng trƣởng vốn GRC
2.4 Phƣơng pháp phân tích dữ liệu 2.4.1 Thống kê mơ tả dữ liệu
Trung bình mẫu (mean) trong thống kê là một đại lượng mô tả thống kê, được tính ra bằng cách lấy tổng giá trị của toàn bộ các quan sát trong tập chia cho số lượng các quan sát trong tập.
Số trung vị (median) là một số tách giữa nửa lớn hơn và nửa bé hơn của một mẫu, một quần thể, hay một phân bố xác suất. Nó là giá trị giữa trong một phân bố, mà số số nằm trên hay dưới con số đó là bằng nhau. Điều đó có nghĩa rằng 1/2 quần thể sẽ có các giá trị nhỏ hơn hay bằng số trung vị, và một nửa quần thể sẽ có giá trị bằng hoặc lớn hơn số trung vị.
Độ lệch chuẩn, hay độ lệch tiêu chuẩn, là một đại lượng thống kê mô tả dùng để đo mức độ phân tán của một tập dữ liệu đã được lập thành bảng tần số. Có thể tính ra độ lệch chuẩn bằng cách lấy căn bậc hai của phương sai. Nếu gọi X là giá trị của cơng cụ tài chính, m = E(X) là trung bình động của X, S là phương sai, d là độ lệch chuẩn thì độ lệch chuẩn sẽ được tính tốn như sau: S = E[(X – m)2] d = Căn bậc hai của S.
Để thực hiện kiểm định mơ hình cần bảo đảm các biến dữ liệu thỏa mãn một số điều kiện để có thể đưa vào mơ hình. Quy trình để kiểm tra số liệu được thực hiện theo sơ đồ sau:
2.4.2 Kiểm tra ma trận tƣơng quan
Đánh giá mối quan hệ giữa các biến với nhau (từng cặp biến). Khi các hệ số khác khơng có nghĩa là các biến có sự tương quan với nhau. Hệ số tương quan dương nói lên 2 biến có quan hệ cùng chiều và ngược lại hệ số tương quan âm nói lên 2 biến có quan hệ ngược chiều.
2.4.3 Kiểm tra tính dừng của dữ liệu và chọn độ trễ tối ƣu:
Kiểm tra tính dừng:
Theo Gujarati (2003) một chuỗi thời gian là dừng khi giá trị trung bình, phương sai, hiệp phương sai (tại các độ trễ khác nhau) giữ nguyên không đổi cho
dù chuỗi được xác định vào thời điểm nào đi nữa. Chuỗi dừng có xu hướng trở về giá trị trung bình và những dao động quanh giá trị trung bình sẽ là như nhau. Nói cách khác, một chuỗi thời gian khơng dừng sẽ có giá trị trung bình thay đổi theo thời gian, hoặc giá trị phương sai thay đổi theo thời gian hoặc cả hai.
Có nhiều phương pháp kiểm tra tính dừng của chuỗi thời gian: Kiểm định Dickey–Fuller (DF), kiểm định Phillip–Person (PP) và kiểm định Dickey và Fuller mở rộng (ADF), kiểm tra bằng giản đồ tự tương quan… Trong Eviews thường dùng kiểm định đơn vị (Unit Root Test) để kiểm định tính dừng của một chuỗi dữ liệu thời gian dựa trên kiểm định ADF mở rộng (Nguyễn Văn Duy và cộng sự, 2014).
Giả thuyết kiểm định:
H0: β = 0 (Yt là chuỗi dữ liệu không dừng) H1: β < 0 (Yt là chuỗi dữ liệu dừng)
Khi P-value < 5% hoặc 10% kết luận chuỗi dừng, nếu chưa dừng thì lấy sai phân tới khi dừng.
Xác định độ trễ tối ưu của các biến trong mơ hình:
Việc xác định độ trễ tối ưu dựa trên các chỉ số lựa chọn. Độ trễ tối ưu là tại độ trễ đó các biến được mơ hình hố qua biến trễ và các biến khác cùng một độ trễ có kết quả tốt nhất.
Quy trình để thực hiện kiểm tra dữ liệu đầu vào được biểu hiện qua sơ đồ sau: