Tự tương quan có thể hiểu là quan hệ tương quan giữa các thành phần của chuỗi quan sát được sắp xếp theo thứ tự thời gian (như trong dữ liệu chuỗi thời gian) hoặc không gian (như trong dữ liệu chéo). Kiểm định tự tương quan là
phương pháp kiểm định nhằm kiểm tra mối quan hệ tuyến tính giữa các quan sát (trong luận văn này là lợi nhuận của chỉ số thị trường theo ngày). Mục đích của việc phân tích tự tương quan là để xác định thử xem khả năng sự biến động của chuỗi quan sát có tuân theo chu kỳ mà chúng ta có thể dự đoán được quy luật của nó không hay nói cách khác là để xác định chuỗi quan sát có tính ngẫu nhiên hay không? Kiểm định tương quan là phương pháp thứ hai thường được sử dụng trong nghiên cứu kiểm định thị trường hiệu quả mức độ yếu cả trong và ngoài nước như nghiên cứu của Dickinson và Muragu (1994), Abeysekera (2001), Trương Đông Lộc (2006), Thiều Bích Ngọc (2007)…
Đối với nghiên cứu này, hệ số tự tương quan thể hiện mối quan hệ tuyến tính giữa các quan sát. Nếu hệ số tự tương quan khác không, điều đó có ý nghĩa chuỗi quan sát không có tính ngẫu nhiên, hay giữa các quan sát trong chuỗi có mối quan hệ phụ thuộc nhau, có sự tương quan nhau và ngược lại. Nếu hệ số tương quan dương, quan sát sau sẽ biến đổi cùng chiều so với quan sát trước trong chuỗi và ngược lại. Nếu kết quả là có sự tương quan nhau giữa các quan sát, chúng ta cần xác định chu kỳ của nó là như thế nào, sau bao lâu sẽ tăng hoặc sau bao lâu sẽ giảm, đó chính là độ trễ. Giả sử các quan sát trong chuỗi số liệu có hệ số tương quan dương và độ trễ là 1, nghĩa là quan sát sau tại thời điểm t+1 sẽ biến đổi cùng chiều với quan sát tại thời điểm t. Nếu hệ số tương quan âm với độ trễ là 2, nghĩa là cứ cách một quan sát, quan sát sau tại thời điểm t+2 sẽ biến đổi ngược chiều với quan sát tại thời điểm t. Hệ số tương quan được xác định bởi công thức:
= ∑ ( ̅)( ̅)
∑ ( ̅) (3.5)
Trong đó: k: độ trễ
: hệ số tương quan về lợi nhuận của chỉ số thị trường theo ngày với độ trễ k
N: tổng số quan sát
rt+k: lợi nhuận của chỉ số VN-index/HNX-index tại thời điểm t+k
̅: lợi nhuận trung bình của chỉ số VN-index/HNX-index
Hệ số kiểm tra về hiện tượng tự tương quan đối với lợi nhuận của chỉ số thị trường với độ trễ được xác định là k. Để lợi nhuận của chỉ số thị trường tại các thời điểm không có sự tự tương quan và dãy số được xem là ngẫu nhiên thì hệ số này phải là 0. Giả thiết kiểm định trong trường hợp này:
H : = 0 H : ≠ 0
Nhưng đây chỉ là hệ số tương quan trong chuỗi lợi nhuận chỉ số thị trường ở từng độ trễ xác định. Cần xác định lợi nhuận chỉ số thị trường ở nhiều độ trễ khác nhau có mối tương quan gì không? Nếu chúng có mối tương quan nhau thì chắc chắn tính ngẫu nhiên của các quan sát trong chuỗi thời gian cũng bị phá vỡ mặc dù với từng độ trễ xác định, đa số chúng lại không có sự tương quan. Vì vậy, cần kiểm định tự tương quan của chuỗi giữa nhiều độ trễ khác nhau. Giả thuyết đặt ra:
H : = = = ⋯ = = 0
H : ≠ 0
Để kiểm định giả thuyết trên, chúng ta có thể kiểm định từng , tuy nhiên người ta thường hay dùng kiểm định hai phía với giá trị kiểm định Q được định nghĩa bởi Ljung-Box như sau:
QLB = N (N + 2) ∑ (3.6)
Trong đó: QLB: Giá trị kiểm định Q
: hệ số tương quan về lợi nhuận của cổ phiếu ở độ trễ j
N: tổng quan sát
Với giả thuyết H0 là tất cả hệ số tự tương quan bằng 0 và H1 là khi có giá trị khác không, giá trị kiểm định Q sẽ tuân theo phân phối có bậc tự do k (độ trễ của quan sát). Với mức ý nghĩa và bậc tự do k, tra bảng ta có được giá trị .
- Nếu > : bác bỏ giả thuyết H0 và chấp nhận giả thuyết H1: chuỗi quan sát có xảy ra hiện tượng tự tương quan.
- Nếu < : chấp nhận giả thuyết H0 và bác bỏ giả thuyết H1: chuỗi quan sát không xảy ra hiện tượng tự tương quan hay chuỗi quan sát là ngẫu nhiên.
Chuỗi số liệu được xem là có tính ngẫu nhiên khi mỗi hệ số tương quan ( ) đều phải bằng 0, như vậy chỉ cần một hệ số tương quan khác 0 thì chuỗi số liệu được xem như có mối tương quan lẫn nhau giữa các quan sát của chuỗi.
Tóm lại, cả hai phương pháp kiểm định chuỗi và kiểm định tự tương quan đều nhằm kiểm tra tính ngẫu nhiên trong chuỗi lợi nhuận của chỉ số thị trường, từ đó có cơ sở để chấp nhận hay bác bỏ giả thuyết thị trường hiệu quả mức độ yếu trên thị trường chứng khoán Việt Nam. Vì thị trường chứng khoán chỉ hiệu quả khi lợi nhuận của chỉ số thị trường phải là một dãy số ngẫu nhiên, không phụ thuộc vào lợi nhuận của chỉ số thị trường trong quá khứ hay tương lai hay giữa các ngày khác nhau trong tuần.