Khi các nghiên cứu sử dụng dữ liệu dưới dạng chuỗi dữ liệu thời gian (Time series), việc đầu tiên cần nên làm là kiểm tra xem những biến mà nghiên cứu sử dụng trong mô hình nghiên cứu là dừng (Stationary) hay không dừng (non- staionary). Một chuỗi dữ liệu thời gian được xem là dừng nếu như trung bình và phương sai của phương trình không thay đổi theo thời gian và giá trị của đồng phương sai giữa hai đoạn chỉ phụ thuộc vào khoảng cách hay độ trễ về thời gian giữa hai thời đoạn này chứ không phụ thuộc vào thời điểm thực tế mà đồng phương sai được tính (Ramanathan, 2002). Cụ thể:
Dữ liệu dao động xung quanh một giá trị trung bình cố định trong dài hạn
t
E Y const
Dữ liệu có giá trị phương sai xác định không thay đổi theo thời gian:
2
t
Var Y const
Dữ liệu có một giản đồ tự tương quan với các hệ số tự tương quan sẽ giảm dần khi độ trễ tăng lên. Hay nói cách khác, Cov(Yt,Yt+k) là một hằng số cho tất cả các thời điểm t và k khác không. Giá trị của hiệp phương sai giữa hai giai đoạn chỉ phụ thuộc vào khoảng cách giữa hai giai đoạn:
t, t k k ( t )( t k )
Cov Y Y E Y Y
Tính dừng của chuỗi dữ liệu thời gian là một khái niệm vô cùng quan trọng, vì thực tế hầu hết tất cả những mô hình thống kê đều được thực hiện dưới giả định là chuỗi dữ liệu thời gian phải dừng. (Gujarati, 2003) cho rằng nếu như một chuỗi thời gian không dừng thì chúng ta chỉ có thể nghiên cứu hành vi của nó trong một
khoảng thời gian đang được xem xét nhất định, hay nói cách khác, ta không thể khái quát hóa cho cả giai đoạn, cũng như không thể tiến hành dự báo. Hơn nữa, kết quả xuất phát từ những phân tích kinh tế khi sử dụng chuỗi dữ liệu không dừng theo phương pháp phân tích cổ điển sẽ dẫn đến hiện tượng "hồi quy giả mạo" (spurious regression) (Granger and Newbold, 1977). Vì vậy, bước đầu tiên là kiểm tra tính dừng cho chuỗi dữ liệu thời gian.
Để kiểm tra tính dừng và xác định bậc dừng của chuỗi dữ liệu thời gian, luận văn sử dụng kiểm định nghiệm đơn vị của Dickey Fuller.