Kiểm định tự tương quan là phương pháp kiểm định rất phổ biến và được sử
dụng như cơng cụ đầu tiên để kiểm định biến ngẫu nhiên độc lập hay phụ thuộc. Phương pháp này dùng để đo lường hệ số tương quan giữa các giá trị của một biến tại thời điểm t với giá trị của nĩ trong giai đoạn trước đĩ. Vì vậy trong bài nghiên cứu này, tác giả sẽ sử dụng phương pháp kiểm định tự tương quan đểđo lường mối quan hệ giữa tỷ suất sinh lợi của các chỉ số thị trường và các cổ phiếu ở thời điểm hiện tại với giá trị của nĩ ở thời điểm trước đĩ.
Phương pháp kiểm định tự tương quan được sử dụng trong hầu hết các nghiên cứu thực nghiệm về tính hiệu quả thơng tin của thị trường chứng khốn và được tính như sau: 1 2 1 ( )( ) ( ) N k t t k t k N t t r r r r r r ρ − + = = − − = − ∑ ∑ Trong đĩ:
- ρk : hệ số tương quan của tỷ suất sinh lợi với độ trễ là k - N: tổng số biến quan sát - rt: tỷ suất sinh lợi thời điểm t - rt+k: tỷ suất sinh lợi thời điểm t+k - r: lợi nhuận trung bình - k: độ trễ
Một dãy sốđược xem là cĩ hiện tượng tự tương quan khi sự biến động của dãy số quan sát đĩ tuân theo chu kỳ nhất định với xu hướng mà chúng ta cĩ thể đốn
được quy luật của chúng. Khi đĩ ta nĩi dãy số khơng cĩ tính ngẫu nhiên.
Nếu kết quả sau khi kiểm định cho thấy hệ số tương quan của các biến quan sát là khác 0 tức là các biến cĩ sự tương quan với nhau và khơng ngẫu nhiên. Chẳng hạn, nếu chúng ta nghiên cứu về tính tự tương quan của tỷ suất sinh lợi của các chỉ
số và cổ phiếu, nếu hệ số tương quan dương nghĩa là giá cổ phiếu ở thời điểm sau sẽ
cĩ sự biến đổi cùng chiều với giá cổ phiếu trong hiện tại. Nếu nĩ đang tăng trong hiện tại thì tất nhiên giá cổ phiếu cũng sẽ tiếp tục tăng so với giá của nĩ trong thời
điểm trước đĩ. Ngược lại, sự tương quan sẽ là ngược chiều khi hệ số tương quan mang dấu âm, tức là giá cổ phiếu sẽ giảm sau đĩ nếu như nĩ đang tăng giá. Mọi hệ
số tương quan khác 0 đều cĩ ý nghĩa rằng dãy số quan sát là khơng cĩ tính ngẫu nhiên. Tuy nhiên, nếu kết quả cĩ sự tương quan giữa các quan sát, chúng ta cần xác
định chu kỳ của nĩ là như thế nào, bao lâu tăng hoặc khi nào bắt đầu giảm giá. Vấn
đề này liên quan đến thuật ngữ mới gọi là độ trễ.
Trong phân tích chuỗi thời gian, chúng ta cĩ thể gặp hiện tượng biến phụ
thuộc ở thời kỳ t phụ thuộc vào các biến khác ở thời kỳ (t-1). Chẳng hạn khi nghiên cứu mối quan hệ giá cổ phiếu và thơng tin, chúng ta thấy rằng giá cổ phiếu ở một thời điểm hiện tại khơng chỉ phụ thuộc vào các thơng tin liên quan tới nĩ mà cịn phụ thuộc vào giá cả của chính cổ phiếu đĩ trong thời kỳ trước đĩ.
Ví dụ, cĩ một cổ phiếu với mức giá được xác định trong thời điểm hiện tại là t. Giả sử với những thơng tin mới cơng bố trên thị trường sẽ làm giá cổ phiếu tăng lên. Như vậy, các quan sát trong dãy số liệu sẽ cĩ hệ số tương quan dương và độ trễ
trong trường hợp này là 1. Nghĩa là giá cổ phiếu trong thời kỳ t+1 cũng tăng lên. Nếu kết quả cho ra một hệ số tương quan âm với kết quả là 2, điều này nĩi lên rằng cứ cách 2 quan sát giá cổ phiếu sẽ giảm nếu như giá của nĩ đang tăng trong thời
điểm hiện tại.
Giả thiết kiểm định trong trường hợp này là: H0: ρk = 0
H1: ρk ≠ 0
Phần trình bày ở trên chỉ là hệ số tương quan trong chuỗi tỷ suất sinh lợi ở
từng độ trễ xác định. Ngồi ra, chúng ta cần xác định xem tỷ suất sinh lợi ở nhiều
độ trễ khác nhau cĩ mối tương quan gì hay khơng. Nếu chúng cĩ mối tương quan với nhau thì sẽ bác bỏ giả thiết về tính ngẫu nhiên của các quan sát trong từng độ trễ
xác định. Vì vậy, bên cạnh việc kiểm tra về tính tự tương quan của dãy số với từng
độ trễ xác định, chúng ta cũng sẽ tiến hành việc kiểm định tự tương quan của dãy số
trong trường hợp giữa nhiều độ trễ khác nhau. Giả thiết kiểm định lúc này sẽ là:
H0: ρ1 = ρ2 = ρ3 = … = ρk = 0 H1: ρk≠ 0
Để kiểm định cho giả thiết trên, chúng ta cĩ thể kiểm định với từng ρk riêng lẽ, tuy nhiên người ta hay dùng giá trị thống kê Q được định nghĩa bởi Ljung-Box như
sau: 2 1 ( 2) k j LB j Q N N N j ρ = = + − ∑ Trong đĩ:
- QLB: giá trị kiểm định Q
- ρj: hệ số tương quan về tỷ suất sinh lợi ởđộ trễ j
- N: tổng số quan sát
- k: độ trễ
Nếu chuỗi số liệu đạt được tính ngẫu nhiên của nĩ thì mỗi hệ số tương quan (ρj) đều phải bằng 0. Vì vậy, chỉ cần một hệ số tương quan khác 0 thì chuỗi số liệu
được xem như cĩ mối tương quan với nhau giữa các quan sát của chuỗi, khi đĩ giả
thiết H0 sẽ bị bác bỏ. Giá trị kiểm định Q tuân theo gần như là một phân phối χ2 cĩ bậc tự do k (độ trễ của quan sát). Với mức ý nghĩa α và bậc tự do k, ta cĩ được giá trị χ02 cho từ tra bảng. Nếu χ2 > χ02 ta sẽ bác bỏ giả thiết H0 và chấp nhận giả thiết H1: dãy số quan sát cĩ xảy ra hiện tượng tự tương quan. Ngược lại, ta sẽ kết luận khơng cĩ hiện tượng tự tương quan trong dãy số thời gian hay dãy quan sát là ngẫu nhiên.