Chào các bạn, Trong bài viết hôm nay, mình sẽ giới thiệu tiếp về một hiện tượng/lỗi nữa cũng rất hay xảy ra trong hồi quy tuyến tính – đó là hiện tượng tự tương quan. Hiện tượng này thường xảy ra trong dữ liệu thời gian (time series) hoặc dữ liệu bảng (panel data). Chúng ta sẽ đi từ định nghĩa, hậu quả, cách nhận biết và cách khắc phục hiện tượng này nhé.
9/15/21, 2:39 PM Hiện tượng tự tương quan (autocorrelation) – How to STATA How to STATA A set of guides and tutorials for beginners on using Stata effectively Hiện tượng tự tương quan (autocorrelation) Posted on June 22, 2020June 23, 2020 by Chung Mai Chào bạn, Trong viết hơm nay, giới thiệu tiếp tượng/lỗi hay xảy hồi quy tuyến tính – tượng tự tương quan Hiện tượng thường xảy liệu thời gian (time series) liệu bảng (panel data) Chúng ta từ định nghĩa, hậu quả, cách nhận biết cách khắc phục tượng Định nghĩa: Đây tượng mà sai số thời điểm t có mối quan hệ với sai số thời điểm t-1 thời điểm khác khứ Ta ký hiệu sai số mơ hình hồi quy u Đối với liệu theo thời gian, tượng thường gọi với tên tiếng Anh “autocorrelation” Tự tương quan bậc (sai số kỳ t có tương quan với sai số kỳ t – 1) dạng công thức sau: autocorrelation1 Đối với liệu bảng, tượng thường gọi với tên tiếng Anh “serial correlation” tự tương quan bậc diễn tả dạng công thức sau: autocorrelation Lưu ý: Đây mối quan hệ sai số khoảng thời gian khác nhau, với ID quan sát Nếu có tượng TTQ hệ số tương quan ρ khác 0, ngược lại ρ = n tâm Hậu quả: https://stataguide.wordpress.com/2020/06/22/hien-tuong-tu-tuong-quan-autocorrelation/ 1/9 9/15/21, 2:39 PM Hiện tượng tự tương quan (autocorrelation) – How to STATA Nếu mơ hình có tượng TTQ ước lượng phương pháp OLS không bị thiên lệch (unbiased) quán (consistent) Tuy nhiên, ước lượng khơng cịn ước lượng hiệu Lưu ý, có nhiều ước lượng cho true beta, ước lượng hiệu ước lượng có sai số với true beta nhỏ Bên cạnh đó, tượng tự tương quan khiến cho giá trị t-value lớn (hoặc P-value nhỏ hơn) so với giá trị mà nên có làm cho hệ số hồi quy có xu hướng có ý nghĩa thống kê Vơ tình, kết luận yếu tố mơ hình có ảnh hưởng đến biến phụ thuộc mơ hình, thực điều bị gây tượng TTQ mà Nếu tượng xảy đồng thời với tượng phương sai sai số thay đổi ước lượng trở nên thiếu tin cậy chí mẫu nghiên cứu bạn lớn Các nhận biết: Chúng ta nhận biết tượng cách plot (minh hoạ liệu biểu đồ) liệu sử dụng kiểm định Mình dùng liệu AIR2 STATA để minh hoạ viết Bộ liệu gồm biến – Biến air thể số hành khách quốc tế, biến time thể cho thời gian (tháng) từ năm 1949 đến năm 1960, biến t thể cho cột mốc thời gian Bộ liệu có 144 quan sát nên t nhận giá trị từ đến 144 Trong liệu có liệu biến phụ thuộc mà ko có liệu biến độc lập khác biến thời gian Tuy nhiên, hoàn toàn kiểm tra tượng TTQ trường hợp này, biến phụ thuộc có tượng TTQ sai số mơ hình với biến phụ thuộc (khả cao) có tượng TTQ Để sử dụng liệu gõ lệnh sau: use http://www.stata-press.com/data/r13/air2 (http://www.stata-press.com/data/r13/air2) Cách 1: Plot liệu Như hai công thức trình bày trên, sai số thời điểm t có mối quan hệ tuyến tính với sai số thời điểm t-1 nghĩa có tượng tự tương quan Chúng ta lấy sai số từ mơ hình sau thực vẽ đồ thị để thể mối quan hệ sai số kỳ t sai số kỳ t-1 Chúng ta thực bước STATA sau: tsset t // Lệnh báo STATA biết liệu theo chuỗi thời gian reg air t // Thực hồi quy biến phụ thuộc biến thời gian predict r, resid // Sai số (phần dư) mơ hình lưu biến r twoway (scatter r l.r) (lfit r l.r) // theo lệnh này, thể hiện tượng TTQ sai số đồ thị scatter (các điểm liệu sai số thể dấu chấm khắp đồ thi) đường hồi quy tuyến tính (lfit – viết tắt linear fit) Đồ thị có dạng sau: https://stataguide.wordpress.com/2020/06/22/hien-tuong-tu-tuong-quan-autocorrelation/ 2/9 9/15/21, 2:39 PM Hiện tượng tự tương quan (autocorrelation) – How to STATA autocorrelation2 Trên đồ thị này, trục X thể cho sai số thời điểm t-1 trục Y thể cho sai số thời điểm t Ta cách rõ ràng sai số thời kỳ có mối quan hệ tuyến tính với Chúng ta dùng lệnh CORR để tìm hệ số tương quan sai số cách dùng lệnh: corr r l.r // Kết 0.7306 Như vậy, tự tin mà khẳng định mơ hình có tượng TTQ Ta kiểm tra tượng TTQ bậc khác Ví dụ TTQ bậc ta plot sai số kỳ t sai số kỳ t-2 với câu lệnh sau: twoway (scatter r l2.r) (lfit r l2.r) Cách 2: Dùng kiểm định Ta dùng kiểm định để kiểm tra xem tượng tự tượng quan có tồn khơng Các kiểm định dùng cho time-series data panel data có khác chút nha Đối với time-series data: Ta dùng Durbin-Watson (DW) Breusch-Godfrey (BG) Kiểm định DW có ý nghĩa (1) mơ hình hồi quy có hệ số chặn, (2) sai số có tượng tự tương quan bậc – TTQ xuất bậc khác kiểm định DW không phát đâu, (3) sai số tuân theo phân phối chuẩn (Mình nói vấn đề viết khác nhé), cuối (4) biến độc lập mơ hình khơng phải biến lag Y Kiểm định DW cho hệ số thống kê d-statistic Hệ số tính cơng thức sau: Hệ số d có giá trị nằm khoảng (0, 4) Có số trường hợp xảy với d sau: Nếu d ≈ 0: Có TTQ dương https://stataguide.wordpress.com/2020/06/22/hien-tuong-tu-tuong-quan-autocorrelation/ 3/9 9/15/21, 2:39 PM Hiện tượng tự tương quan (autocorrelation) – How to STATA Nếu d ≈ 4: Có TTQ âm Nếu d ≈ 2: Khơng có tượng TTQ Câu lệnh STATA cho DW là: estat dwatson Chúng ta phải chạy lệnh hồi quy trước sau chạy lệnh Tuy nhiên, kiểm định DW có nhiều ràng buộc hạn chế không? Để tránh bớt hạn chế này, dùng kiểm định BG để thay Kiểm định BG thực mơ hình có bao gồm biến lag biến phụ thuộc Thông thường, việc dùng biến lag biến phụ thuộc giúp kiểm soát tượng TTQ, tượng TTQ bậc cao việc dùng biến lag bậc khơng giúp ích nhiều đâu Thêm nữa, kiểm định BG giúp kiểm tra tượng TTQ bậc cao Giả thuyết kiểm định tượng TTQ bậc Giả thuyết viết sau: H0: ρ1 = ρ2 = ρ3 = … = ρn = Để kết luận mơ hình khơng có tượng TTQ, kỳ vọng không bác bỏ giả thuyết này, nghĩa giá trị P-value lớn tốt – cần phải lớn 0.1 Kiểm định thực STATA lệnh sau: estat bgodfrey, lags(#) Chúng ta kê khai giá trị lag mà muốn kiểm định Ví dụ lags(3) có nghĩa mơ hình kiểm tra TTQ bậc 1, bậc bậc Nếu khơng kê khai mơ hình kiểm định TTQ bậc Đây kết kiểm định DW BG cho mơ hình Ta thấy kiểm định khẳng định mơ hình có tượng TTQ TTQ dương Đối với panel data: Ta dùng kiểm định Wooldridge Kiểm định đặt giả thuyết tương tự kiểm định BG – mơ hình khơng có tượng tự tương quan Vì vậy, kỳ vọng thấy giá trị P-value lớn 0.1 Đây lệnh có sẵn STATA, nên cần cài đặt trước sử dụng ssc install xtserial https://stataguide.wordpress.com/2020/06/22/hien-tuong-tu-tuong-quan-autocorrelation/ 4/9 9/15/21, 2:39 PM Hiện tượng tự tương quan (autocorrelation) – How to STATA xtserial y x1 x2 x3 Cách khắc phục: Chúng ta biến đổi mơ hình để loại bỏ tượng TTQ, sử dụng phương pháp Newey-West để chỉnh sửa sai số ước lượng đưa biến trễ (lag) biến phụ thuộc vào mơ hình Mình làm rõ trường hợp Cách 1: Biến đổi theo sai phân bậc (first-difference transformation) Ta đưa tất liệu dạng sai phân bậc – nghĩa lấy hiệu số quan sát kỳ t quan sát kỳ t-1 cho biến mơ hình Theo cách này, ta giả định hệ số tương quan ρ = Thay ước lượng mơ bình thường (gọi level form), ta ước lượng mơ hình với liệu biến đổi sau: Lúc này, sai số mơ hình biến đổi nên tượng TTQ bị loại bỏ. Khi ước lượng mơ hình sai phân bậc này, cần lưu ý mô hình khơng có hệ số chặn Lệnh STATA ta dùng sau: reg d.Y d.X1 d.X2 dX3, noconstant Bạn không cần phải tao biến lag, lấy hiệu số để tính sai phân bậc biến nha Chỉ cần dùng d phía trước biến STATA tự động tạo liệu sai phân bậc cho bạn nè Cách 2: Biến đổi theo hệ số tương quan ước lượng (generalized transformation) Theo cách này, ta biến đổi liệu theo ước lượng hệ số tương quan ρ Trước tiên, ta chạy hồi quy với liệu ban đầu lấy sai số Sau đó, ta chạy mơ hình hồi quy sai số kỳ t sai số kỳ t-1 để lấy ước lượng ρ Và cuối ta dùng hệ số ρ để biến đổi liệu Ví dụ, biến Y_new = Yt – ρ*Yt-1 Mơ hình hồi quy trở thành Y_new = X1_new X2_new… Trong STATA, ta thực bước sau: regress Y X1 X2 X3 predict r, resid // sai số lưu biến r reg r l.r, nocons // ρ hệ số hồi quy đứng trước biến lag r Giả sử ρ = 0.7 gen Y_new = Y – 0.7*l.Y // ký hiệu l.Y nghĩa lag bậc biến Y gen X1_new = X1 – 0.7*l.X1 gen X2_new = X2 – 0.7*l.X2 reg Y_new X1_new X2_new https://stataguide.wordpress.com/2020/06/22/hien-tuong-tu-tuong-quan-autocorrelation/ 5/9 9/15/21, 2:39 PM Hiện tượng tự tương quan (autocorrelation) – How to STATA Ngồi ra, ta sử dụng thống kê d-statistic có từ kiểm định Durbin-Watson để tính hệ số ρ này: ρ ≈ – d/2 Cả cách mà giới thiệu sử dụng liệu có tượng tự tương quan bậc Nếu liệu có tượng TTQ bậc cao hơn, cần phải biến đổi liệu theo hệ số tương quan bậc cao Lúc này, sai số kỳ t khơng có mối quan hệ với sai số kỳ t-1 mà cịn có mối quan hệ với sai số kỳ t-2 kỳ trước Ví dụ: Ta cần phải ước lượng ρ1 ρ2 dùng đểu biến đổi liệu Trong trường hợp có tượng TTQ bậc cao, ta sử dụng mơ hình ARIMA để ước lượng Cách 3: Sử dụng phương pháp Newey-West để chỉnh sửa sai số ước lượng Theo cách này, hệ số hồi quy beta tính bình thường, sai số điều chỉnh theo hai tượng phương sai sai số thay đổi tự tương quan Tuy nhiên, cách nên sử dụng mẫu liệu lớn Trong STATA, ta thực phương pháp cách dùng hai lệnh sau: reg Y X1 X2 X3, vce(robust) newey Y X1 X2 X3, lag(#) Nếu dùng câu lệnh newey, phải kê khai bậc cho biến lag – giá trị nhỏ thể dự đốn liệu có tượng TTQ bậc Cách 4: Đưa biến trễ (lag) biến phụ thuộc vào mơ hình Một nguyên nhân tượng TTQ biến phụ thuộc có tượng TTQ – quan sát biến Y kỳ t có mối quan hệ với quan sát biến Y kỳ t-1 Vậy nên, ta đưa biến trễ biến Y vào mơ hình để kiểm soát tượng reg Y l.Y X1 X2 X3 // Nếu muốn đưa biến lag bậc Y vào mô hình reg Y l(1/2).Y X1 X2 X3 // Nếu muốn đưa lag bậc bậc biến Y vào mơ hình Sau sửa lỗi nhớ dùng kiểm định DW, BG Wooldrige mà trình bày để kiểm tra lại Lưu ý, kiểm định khơng có hiệu sửa lỗi cách thứ kiểm định DW không thực sửa lỗi theo cách thứ Tóm lại, liệu bạn liệu có yếu tố thời gian, bạn cần phải lưu ý đến tượng TTQ Khi tượng xảy ra, sai số ước lượng mơ hình hầu hết bị “thồi phồng” lên, làm cho giá trị tvalue lớn P-value nhỏ Theo đó, bạn có xu hướng kết luận hệ số hồi quy có ý nghĩa thống kê, thực kết bị gây tượng TTQ mà Thêm lưu ý nhỏ muốn đề cập trước kết thúc viết – liên quan đến cách sửa lỗi thứ Nếu sau đưa biến trễ Y vào mơ hình dùng kiểm định BG để kiểm tra lại mà tượng TTQ tồn tại, hệ số hồi quy lúc bị thiên lệch (biased) không quán (inconsistent) Như https://stataguide.wordpress.com/2020/06/22/hien-tuong-tu-tuong-quan-autocorrelation/ 6/9 9/15/21, 2:39 PM Hiện tượng tự tương quan (autocorrelation) – How to STATA vậy, tượng TTQ bị gây nguyên nhân khác sai dạng hàm Lúc này, ta cần phải sử dụng phương pháp khác phương pháp biến công cụ (instrument variable) để xử lý vấn đề phương pháp OLS khơng cịn hiệu Vậy nên, cách kiểm tra sửa lỗi tượng TTQ có tác dụng giả định mơ hình nghiên cứu hợp lý (correctly specified model) thỏa mãn Đây vấn đề mơ hình hồi quy khó xử lý Mình giới thiệu với bạn vấn đề viết lần sau Hy vọng chia sẻ giúp bạn xử lý tượng tự tương quan trình nghiên cứu Hãy comment viết cho để thảo luận thêm vấn đề Nguồn tham khảo: Gujarati (2012), Econometrics by example, chapter Click to access Panel101.pdf (http://www.princeton.edu/~otorres/Panel101.pdf) Posted in Kinh tế lượng bản, STATA for estimationsTagged autocorrelation, Breusch-Godfrey, Durbin-Watson, tự tương quan, Wooldridge thoughts on “Hiện tượng tự tương quan (autocorrelation)” hntien says: March 19, 2021 at 8:02 am Chào Ad:Mình dùng Stata 14 kiểm định tự tương quan, theo hướng dẫn làm kết quả: ssc install xtserial ssc install: “xtserial” not found at SSC, type -findit xtserial(To find all packages at SSC that start with x, type -ssc describe x-) r(601); Theo hươ1ng dẫn tiếp findit xtserial https://stataguide.wordpress.com/2020/06/22/hien-tuong-tu-tuong-quan-autocorrelation/ 7/9 9/15/21, 2:39 PM Hiện tượng tự tương quan (autocorrelation) – How to STATA sau install package Tuy nhiên dùng lại lệnh khơng xtserial mmHg1 mmHg2 Pulse Exercise D1 D2 D3 command xtserial is unrecognized r(199); (Trước kiểm định đa cộng tuyến phương sai sai số OK rồi) Xin lỗi hỏi nhiều (vì tự học) Reply Chung Mai says: March 19, 2021 at 12:21 pm Bạn nên vô tính help/search stata gõ xtserial để đường link dẫn tới package mà sử dụng để cài đặt Cài đặt từ đường link dễ thành công Reply phungdayne says: March 31, 2021 at 3:47 am Chào ad, có vài thắc mắc mong ad giải đáp giúp với Mình dùng Stata 13, sau kiểm định đưa mơ hình phù hợp FEM tiến hành kiểm định khuyết tật mơ hình Mơ hình FEM vừa bị phương sai sai số thay đổi tự tương quan PSSS thay đổi khắc phục robust, tự tương quan khắc phục ạ? Mình mong giải đáp thắc mắc Cảm ơn ad nhiều Reply Chung Mai says: June 2, 2021 at 2:33 pm Xin lỗi bạn bị nhỡ comment bạn Khi bạn dùng FEM liệu bạn dùng panel hen Nếu nghĩ phương pháp hồi quy FEM giúp bạn xử lý tượng TTQ Để chắn bạn cài đặt dùng kiểm định wooldridge mà có nói để kiểm tra Tuy nhiên, nhớ ko dùng robust mơ hình thực kiểm định nha Reply Moonie says: June 2, 2021 at 11:46 am Cho hỏi, sau sử dụng cách (đưa biến trễ vào mơ hình), mơ hình hồi quy cuối Y= l.Y + X1 + X2 +x3… ko ạ? Reply Chung Mai says: June 2, 2021 at 2:21 pm Đúng bạn Tuy nhiên cách hiệu nguyên nhân gây tượng TTQ quan sát biến phụ thuộc kỳ t có mối quan hệ với quan sát nhiều kỳ trước Vậy nên, sau dùng cách này, bạn cần phải test lại để xem tượng TTQ tồn ko? Nếu cịn bạn cần phải tìm xem ngun nhân thực nha Reply nguyễn thảo says: August 26, 2021 at 12:23 pm Ad ơi,em có câu hỏi khơng biết ad giải giúp em khơng Hiện em chạy mơ hình theo paper nước ngồi mơ hình em sử dụng GEE, sử dụng liệu bảng Và theo em biết liệu phải chạy đơn vị thời gian Tuy nhiên biến https://stataguide.wordpress.com/2020/06/22/hien-tuong-tu-tuong-quan-autocorrelation/ 8/9 9/15/21, 2:39 PM Hiện tượng tự tương quan (autocorrelation) – How to STATA độc lập mơ hình em sử dụng đo theo q, cịn biến phụ thuộc đo theo tuần nên em khơng biết cách xếp liệu cho Ad giúp em khắc phục tình trạng không ạ? EM cảm ơn ad nhiều ạ! Reply Chung Mai says: August 29, 2021 at 3:25 pm Hi em, trường hợp em thay đổi frequency biến phụ thuộc từ tuần thành quý, thay đổi frequency biến độc lập từ quý thành tuần Tuỳ theo chất biến mà em chọn cách biến đổi cho phù hợp Thơng thường giá trị giá trị trung bình tổng giá trị cũ Reply Website Powered by WordPress.com https://stataguide.wordpress.com/2020/06/22/hien-tuong-tu-tuong-quan-autocorrelation/ 9/9 ... lượng bản, STATA for estimationsTagged autocorrelation, Breusch-Godfrey, Durbin-Watson, tự tương quan, Wooldridge thoughts on ? ?Hiện tượng tự tương quan (autocorrelation) ” hntien says: March 19,... https://stataguide.wordpress.com/2020/06/22/hien-tuong-tu-tuong -quan- autocorrelation/ 3/9 9/15/21, 2:39 PM Hiện tượng tự tương quan (autocorrelation) – How to STATA Nếu d ≈ 4: Có TTQ âm Nếu d ≈ 2: Khơng có tượng TTQ Câu lệnh STATA... https://stataguide.wordpress.com/2020/06/22/hien-tuong-tu-tuong -quan- autocorrelation/ 4/9 9/15/21, 2:39 PM Hiện tượng tự tương quan (autocorrelation) – How to STATA xtserial y x1 x2 x3 Cách khắc phục: Chúng ta biến đổi mơ hình để loại bỏ tượng TTQ,