Chƣơng 4 Phƣơng pháp, dữ liệu và ết quả nghiê nc ứu định lƣợ nc ng
4.5. Phƣơng pháp hồi quy
4.5.1. Đặc điểm của mơ hình
Việc xác định đặc điểm của mơ hình nghiên cứu sẽ hổ trợ cho việc lựa chọn phƣơng pháp hồi quy thích hợp. Tác giả tổng quát các đặc điểm của mơ hình nhƣ sau :
Một là, mơ hình sử dụng dữ liệu có dạng bảng1. Cụ thể hơn, bộ dữ liệu ở đây đƣợc gọi là bộ dữ liệu bảng ngắn, số đơn vị chéo lớn hơn số năm quan sát2.
Hai là, mơ hình sử dụng là mơ hình động. Tính động ở đây đƣợc hiểu là tính động của biến phụ thuộc, thể hiện bằng sự hiện diện của biến trễ ( ), đây là biến nội sinh3. Hơn nữa, các biến đặc thù củ a ngành ngân hàng (SPECI) cũng đƣợc cho là các biến nội sinh (theo Louzis et al., 2012). Do đó, trong mơ hình nghiên cứu, tất cả các biến nội sinh này sẽ tƣơng quan với sai số ngẫu nhiên của mơ hình; nếu khơng xử lý vấn đề này thì việc hồi qui sẽ cho ra kết quả ƣớc lƣợng bị chệch.
Ba là, ngồi các nhân tố đƣợc xét đến, vẫn cịn có các nhân tố cố định khơng quan sát đƣợc4 có thể tƣơng quan với các biến giải thích.
Đối với vấn đề thứ ba, vì tác động của các nhân tố cố định đƣợc coi nhƣ là không đổi qua thời gian nên việc chuyển mơ hình hồi quy thành sai phân bậc nhất sẽ loại bỏ các tác động này; vấn đề thứ ba đã đƣợc giải quyết khi thực hiện chuyển từ mơ hình ( ) sang mơ hình ( ) (đã trình bày ở Mục 4.4 Mô hình nghiên cứu). 4.5.2. Phƣơng pháp General Method of Moments (GMM)
Để ƣớc lƣợng mơ hình có dạng dữ liệu bảng giống nhƣ mơ hình của đề tài này, với cách truyền thống, các phƣơng pháp hay dùng đến là: ƣớc lƣợng bình phƣơng
1 Dữ liệu dạng bảng là sự kết hợp giữa các quan sát của các đơn vị chéo theo chuỗi thời gian. Tham khảo một số ƣu điểm của dữ liệu bảng ở Gujarati (2014, p. 279).
2 Trong mẫu dữ liệu, tác giả thu thập đƣợc 18 đơn vị chéo (n) trong 9 năm (t), do n>t nên tác giả kết luận đây là dự liệu bảng ngắn (Gujarati, 2014).
3 Với biến nội sinh, quan hệ nhân quả giữa biến độc lập và biến phụ thuộc có thể xảy ra theo cả hai chiều: từ biến nội sinh đến biến phụ thuộc và ngƣợc lại.
4 Các nhân tố cố định này có thể đƣợc chứa trong phần dƣ của phƣơng trình, nó là biến của mơ hình (1).
nhỏ nhất (Pooled OLS), ảnh hƣởng cố định (fixed effect-FE) hoặc ảnh hƣởng ngẫu nhiên (random effect-RE)1.
Tuy nhiên, có thể nói “Pooled OLS”, “Fixed Effect”, “Random Effect” là các phƣơng pháp cơ bản áp dụng cho mơ hình tĩnh, chƣa xử lý hết đƣợc các vấn đề của mơ hình động, nhƣ: hiện tƣợng nội sinh tiềm ẩn2. Khi có sự xuất hiện của biến trễ của biến phụ thuộc, các phƣơng pháp ƣớc lƣợng này sẽ trở nên có xu hƣớng và khơng còn phù hợp (theo Getzmann, Lang, & Spremann, 2010).
Một phƣơng pháp giải quyết vấn đề nội sinh trong mơ hình động là: tìm kiếm biến cơng cụ cho các biến nội sinh3. Trên thực tế, việc tìm kiếm một biến cơng cụ bên ngồi mơ hình là rất khó. Hơn nữa, mơ hình đang nghiên cứu có tổng cộng sáu biến nghi ngờ bị nội sinh; do vậy, hầu nhƣ khơng thể giải quyết vấn đề bằng cách tìm kiếm thêm biến ngoại sinh bên ngoài.
Phát triển phƣơng pháp “General Method of Moments” (GMM)4, Hansen (1982) đã dùng biến trễ của biến nội sinh và biến ngoại sinh bên trong mơ hình làm cơng cụ, nhằm loại bỏ các tác động của biến nội sinh. Do vậy, tác giả sẽ vận dụng phƣơng pháp ƣớc lƣợng này để giải quyết vấn đề cho mơ hình của mình.
Cụ thể hơn, trong họ các phƣơng pháp hồi quy GMM, tác giả sử dụng Difference GMM (DGMM) hai bƣớc của Arellano and Bond (1991), đƣợc đề xuất lần đầu bởi Holtz-Eakin, Newey, and Rosen (1988). Theo quan điểm của tác giả:
1 Đối với “Pooled OLS”, phƣơng pháp này xem xét các đơn vị chéo là đồng nhất (cụ thể ở đây là các ngân hàng thƣơng mại Việt Nam). Điều này khơng đúng với thực tế, vì mỗi ngân hàng sẽ có những đặc điểm riêng biệt, hồn tồn khác biệt, mà chúng có thể ảnh hƣởng đến nợ xấu. Vì vậy, “Pooled OLS” có thể dẫn đến các ƣớc lƣợng bị sai lệch khi khơng kiểm sốt đƣợc các tác động riêng biệt này. Phƣơng pháp FE hoặc RE có thể kiểm sốt đƣợc vấn đề nêu trên.
2 Tham khảo phƣơng pháp nghiên cứu của Minh and Dũng (2015).
3 Tức là, đối với một biến nội sinh, cần phải tìm ít nhất một biến tƣơng quan với nó nhƣng khơng có tƣơng quan với sai số của mơ hình.
4 General Method of Moments (GMM) là tên chung của một họ phƣơng pháp hồi quy để xác định các thông số của mô hình thống kê hoặc mô hình kinh tế lƣ ợng. GMM đƣợc phát triển bởi Lars Peter Hansen
năm 1982 từ việc tổng quát hóa phƣơng pháp hồi quy theo moments. GMM đƣợc sử dụng nhiều cho dự liệu bảng, đặc biệt khi T nhỏ hơn N nhiều lần, hoặc dữ liệu không đồng nhất.
ƣớc lƣợng của Arellano – Bond đƣợc thiết kế dành cho dữ liệu bảng có T nhỏ và N lớn, vì vậy nó phù hợp với đặc điểm của bộ dữ liệu1.
Tóm lại, tác giả sử dụng phƣơng pháp DGMM để ƣớc lƣợng mơ hình có dạng sai phân bậc nhất. Bằng cách biến đổi phƣơng trình hồi qui sang sai phân bậc nhất, tác động cố định đặc thù sẽ bị loại trừ. Phƣơng pháp DGMM sử dụng các độ trễ thích hợp của các biến nội sinh và các biến ngoại sinh bên trong mơ hình để tạo nên các biến cơng cụ, giải quyết vấn đề nội sinh tiềm ẩn.
4.5.3. Các kiểm định sử dụng trong GMM
Mơ hình DGMM chỉ đƣợc xem là phù hợp khi thỏa mãn hai điều kiện :
− Không tồn tại hiện tƣợng tự tƣơng quan bậc 2 trong mơ hình sai phân bậc nhất.
− Tồn tại các giới hạn về nội sinh (Overidentifying Restrictions), nhằm xác định tính phù hợp của các biến cơng cụ.
Tác giả chọn hai kiểm định: Arellano-Bond (AR) để kiểm định về hiện tƣợng tự tƣơng quan; Sargan để kiểm định về giới hạn về nội sinh. Cụ thể nhƣ sau:
Kiểm định AR(2)- kiểm định về sự tự tƣơng quan
Kiểm định Arellano-Bond về tự tƣơng quan có giả thuyết H0 là: mơ hình khơng có sự tự tƣơng quan. Kiểm định phƣơng trình AR(1) trong sai phân bậc nhất thƣờng bác bỏ giả thuyết H0. Điều này là phù hợp bởi vì giả định của tác giả cũng cho là biến trễ có tƣơng quan với sai số ( ). Do đó, kiểm định AR(1) đƣợc bỏ qua; và, kiểm định AR(2) đƣợc coi là quan trọng hơn bởi vì nó kiểm tra sự tự tƣơng quan bậc hai (kiểm định tƣơng quan giữa và ).
Kiểm định Sargan- kiểm định giới hạn về nội sinh
Kiểm định Sargan xác định tính phù hợp của các biến cơng cụ trong mơ hình GMM. Đây là kiểm định giới hạn về nội sinh (over-identifying restrictions) của mơ hình.
Kiểm định Sargan với giả thuyết H0 là: biến công cụ là ngoại sinh, nghĩa là các
biến cơng cụ khơng có tƣơng quan với sai số của mơ hình. Vì thế, giá trị p-value của thống kê Sargan càng lớn càng tốt.
Để kiểm định Sargan khơng bị yếu thì số lƣợng các biến công cụ đƣợc lựa chọn về nguyên tắc phải nhỏ hơn hoặc bằng số lƣợng đơn vị chéo.
4.6. Dữ liệu nghiên cứu
Nguồn dữ liệu của đề tài đƣợc tác giả thu thập từ nhiều nguồn khác nhau, các nguồn này có thể coi là đáng tin cậy, cụ thể nhƣ sau:
Nguồn thu thập các biến kinh tế vĩ mô
Dữ liệu các biến số kinh tế vĩ mô lấy từ hai nguồn dữ liệu đƣợc công bố trên website của Ngân hàng Thế giới và Quỹ Tiền tệ Quốc tế. Khi so sánh hai nguồn dữ liệu này, tác giả nhận thấy số liệu của hai nguồn trong nhiều trƣờng hợp là khác nhau. Do vậy, để thuận tiện và số liệu thu thập đƣợc đồng nhất, với mỗi biến quan sát, tác giả chọn lựa nguồn dữ liệu nào có đầy đủ số liệu từ năm 2006 đến 2014 (mà không đối chiều với nguồn khác). Cụ thể :
− Từ ngân hàng dữ liệu của WB, tác giả thu thập số liệu của các biến “lãi su
ấ t cho vay” và “tăng trƣở ng GDP”.
− Từ ngân hàng dữ liệu của IMF, tác giả thu thập số liệu của biến “n ợ công” và “t ỷ l ệ th ấ t nghi ệ p”.
Tác giả xin lƣu ý: các biến đƣợc thu thập đều có dạng tỷ lệ phần trăm, các định nghĩa và cách tính của các biến mà tác giả sử dụng cũng đƣợc lấy từ nguồn của hai tổ chức này (tác giả đề cập ở Mục 4.3 Mô tả các biến đại diện).
Nguồn thu thập các biến đặc thù của ngân hàng và biến nợ xấu
Tác giả đã thu thập dữ liệu của các biến đặc thù của ngân hàng và biến nợ xấu từ nguồn dữ liệu: BCTC đƣợc kiểm toán và BCTN của các ngân hàng thƣơng mại Việt Nam.
Theo danh sách các ngân hàng thƣơng mại (NHTM) đƣợc Ngân hàng Nhà Nƣớc Việt Nam công bố vào 30/6/2015, toàn hệ thống Ngân hàng Việt Nam (khơng tính Ngân hàng nƣớc ngoài và liên doanh) có 37 NHTM bao gồm 03 NHTM nhà nƣớc
và 34 NHTM cổ phần, tác giả đã liệt kê ở Phụ lục 4 Danh sách ngân hàng thƣơng mại
Việt Nam (Đến 30/6/2015).
Đối với biến nợ xấu, dữ liệu đƣợc thu thập trong phần thuyết minh BCTC; cụ thể là phần “phân loại nợ theo nhóm nợ” của mục “cho vay khách hàng”, tác giả lấy số liệu của 3 nhóm nợ cuối (nợ nhóm 3, nhóm 4 và nhóm 5). Trong q trình thu thập số liệu, tác giả nhận thấy một số ngân hàng không công bố BCTC ở một số năm. Hơn nữa, các BCTC đƣợc báo cáo theo nhiều cách khác nhau, một số BCTC không phân loại khoản mục “cho vay khách hàng” theo 5 nhóm nợ (trong phần thuyết minh), vì vậy khơng thể lọc ra đƣợc số liệu “nợ xấu”.
Vì khả năng có hạn của mình, tác giả chỉ có thể thu thập đƣợc số liệu nợ xấu của 18 Ngân hàng Thƣơng mại trong giai đoạn 2006-2014 (danh sách đƣợc đính kèm trong Ph ụ l ụ c 5). Đối với các ngân hàng không thể thu thập toàn bộ dữ liệu từ BCTC trong suốt 9 năm, tác giả lựa chọn những ngân hàng chỉ thiếu tối đa là 2 năm (riêng Ngân hàng Thƣơng mại Cổ phần Bản Việt là 3 năm, 2006, 2009, 2014); sau đó tác giả điền vào những năm thiếu bằng số liệu đƣợc lấy ở BCTN tƣơng ứng (có đối chiếu với BCTC của những năm liền kề để kiểm tra mức độ trung thực của số liệu).
4.7. Kết quả nghiên cứu
4.7.1. Phần mềm Kinh tế Lƣợng và thống kê Stata
Tác giả sử dụng phần mềm Stata để giải bài tốn kinh tế lƣợng của mình. Khi đã thu thập đƣợc dữ liệu, tác giả tiến hành mã hóa các biến và nhập vào file “.dta”, thực hiện gõ các câu lệnh để hồi quy theo phƣơng pháp DGMM.
Bảng 4.2 Mã hóa các biến
Tên biến Biến gốc Sai phân
Mã ngân hàng i
Năm t
Tỷ lệ nợ xấu NPL DNPL
Tăng trƣởng GDP GDPG DGDPG
Lãi suất cho vay LIR DLIR
Nợ cơng DEBT DDEBT
Tỷ lệ thu nhập ngồi lãi NII Lợi nhuận trên vốn chủ sở hữu ROE Quy mô của ngân hàng SIZE Khả năng thanh toán SOLR Thiếu hiệu quả trong hoạt động INEF
Lệnh:
(Nguồn: Tổng hợp từ file “.dta”)
Mơ hình cơ bản: “xtabond2 dnpl l.dnpl l(1/2).dgdpg l(1/2).dun l(1/2).ddebt l(1/2).dlir, gmm(l.dnpl, collapse) iv(l(1/2).dgdpg l(1/2).dun l(1/2).ddebt l(1/2).dlir) small twostep nolevel”.
Mơ hình 2: “xtabond2 dnpl l.dnpl l(1/2).dgdpg l(1/2).dun l(1/2).ddebt l(1/2).dlir
l(1/4).roe, gmm(l.dnpl l(1/4).roe, collapse) iv(l(1/2).dgdpg l(1/2).dun l(1/2).ddebt l(1/2).dlir) small twostep nolevel”.
Mơ hình 3: “xtabond2 dnpl l.dnpl l(1/2).dgdpg l(1/2).dun l(1/2).ddebt l(1/2).dlir
l(1/4).solr, gmm(l.dnpl l(1/4).solr, collapse) iv(l(1/2).dgdpg l(1/2).dun l(1/2).ddebt l(1/2).dlir) small twostep nolevel”.
Mơ hình 4: “xtabond2 dnpl l.dnpl l(1/2).dgdpg l(1/2).dun l(1/2).dlir l(1/2).ddebt
l(1/4).inef, gmm(l.dnpl l(1/4).inef, collapse) iv(l(1/2).dgdpg l(1/2).dun l(1/2).ddebt l(1/2).dlir) small twostep nolevel”.
Mơ hình 5: “xtabond2 dnpl l.dnpl l(1/2).dgdpg l(1/2).dun l(1/2).dlir l(1/2).ddebt
l(1/4).size, gmm(l.dnpl l(1/4).size, collapse) iv(l(1/2).dgdpg l(1/2).dun l(1/2).ddebt l(1/2).dlir) small twostep nolevel”.
Mơ hình 6: “xtabond2 dnpl l.dnpl l(1/2).dgdpg l(1/2).dun l(1/2).ddebt l(1/2).dlir
l(1/4).nii, gmm(l.dnpl l(1/4).nii, collapse) iv(l(1/2).dgdpg l(1/2).dun l(1/2).ddebt l(1/2).dlir) small twostep nolevel”.
Trong đó:
− Các biến trình bày trong iv (...) là biến ngoại sinh.
− Tùy chọn “nolevel”: Nếu khơng gõ “nolevel” thì phần mềm Stata sẽ mặc định mơ hình sử dụng System GMM. Việc gõ thêm tùy chọn nolevel để giúp phần mềm nhận ra đƣợc phƣơng pháp đang sử dụng là Difference GMM. − Tùy chọn “small”: Thể hiện bảng dữ liệu là nhỏ.
− Twostep: Thể hiện đây là GMM 2 bƣớc.
4.7.2. Kết quả nghiên cứu định lƣợng
Bảng 4.3 Thống kê mô tả biến đại diện
Biến Số quan sát trung bình (%) Độ lệch chuẩn Số nhỏ nhất (%) Số lớn nhất (%) NPL 162 2,12064 1,415178 0,0835092 9,624874 GDPG 162 6,053744 0,6535892 5,2474 7,1295 UN 162 3,939222 0,9297038 2,45 4,82 DEBT 162 46,677 6,128941 38,407 58,734 LIR 162 12,3121 2,59601 8,665 16,9538 NII 162 21,92677 17,32876 -58,49189 80,05021 ROE 162 12,90981 7,651001 0,07 44,49 SIZE 162 5,555556 6,276168 0,1241747 26,44717 SOLR 162 11,79744 7,576167 3,70475 46,25961 INEF 162 115,7455 150,0643 19,32089 1277,016
(Nguồn: Tính tốn từ mẫu dữ liệu thu thập
được) Đề tài có một mơ hình cơ bản và 5 mơ hình mở rộng. Do đó, phần mềm
Stata cho ra 6 bảng kết quả. Vì cấu trúc của các bảng kết quả là tƣơng tự nhau, nên tác giả gộp lại thành 1 bảng kết quả chung để tiện cho việc theo dõi (6 bảng kết quả đƣợc xuất từ Stata sẽ đƣợc trình bày trong Phụ lục 6).
Bảng 4.4 Hệ số hồi quy của các biến
Mơ hình cơ bản Mơ hình 2 Mơ hình 3 -0.1086487*** 0,0824645 -0,0435432 (0.0248825) (0,0891551) (0,0409576) 0.3705847|*** 0,1958487* 0,2162999 (0.0956352) (0,1117474) (0,1617767)
1.035954*** (0.2798746) 0,4075451*** (0,0999204) 0,1969171* (0,1060735) -0.2244209 -0,0241826 0,1680416 (0.1492632) (0,1580682) (0,1587096) 0.1552746 0,4212573** 0,4271194** (0.1800685) (0,1888128) (0,1503256) 0.1916309** (0.0709445) ROEit-1 0,0186865 SOLRit-1 0,0862782 (0,0284989) (0,0628629) ROEit-2 -0,0591902* SOLRit-2 -0,0656356** (0,0305773) (0,0250876) ROEit-3 -0,0047537 SOLRit-3 -0,0109373 (0,0245127) (0,0310146) ROEit-4 0,0188264 SOLRit-4 -0,0108923 (0,0175794) (0,0120017)
Mơ hình 4 Mơ hình 5 Mơ hình 6
-0,1665241*** -0,0436712 -0,1076387** (0,0507654) (0,0461755) (0,0400296) 0,1150209 0,2689004* 0,2500113 (0,0830364) (0,1434253) (0,177941) 0,455357*** 0,4168283*** 0,3406283* (0,1396288) (0,0805397) (0,1637673) -0,4294301*** 0,3006185*** 0,0873248 (0,141767) (0,0733594) (0,1561622) -0,3852622** 0,4534134*** 0,3852871** (0,1187724) (0,104936) (0,1520143)
INEFit-1 -0,0085476*** SIZEit-1 0,3721408** NIIit-1 0,0206134
(0,0014855) (0,1465831) (0,0141167)
INEFit-2 0,0014965* SIZEit-2 0,0544572 NIIit-2 -0,0207112*
(0,0007167) (0,0858483) (0,0099736)
INEFit-3 -0,0020299** SIZEit-3 -0,1964958 NIIit-3 0,0100323***
(0,0008749) (0,1186451) (0,0034624)
INEFit-4 -0,0035228*** SIZEit-4 0,0387393 NIIit-4 0,0201295***
(0,0009291) (0,1018346) (0,0053829)
(Nguồn: Kết quả xuất từ phần mềm Stata)
Ghi chú: ***, **, * theo thứ tự tƣơng ứng với mức ý nghĩa 1%, 5%, 10%. Biến Lir bị loại ra khỏi tất cả các mơ hình vì vấn đề cộng tuyến.
Bảng 4.5 Hệ số dài hạn của các biến
GDPG
UN
DEBT
Mô hình cơ
bản Mơ hình 2 Mơ hình 3 Mơ hình 4 Mơ hình 5 Mô hình 6
1,2686965 0,657624 0,395975 0,4889551 0,657035 0,533242 (0,2561500) (0,22985) (0,152944) (0,112423) (0,155843) (0,194611) -0,0623699 0,432762 0,570327 -0,6983930 0,72248 0,426684 (0,2617443) (0,354107) (0,233584) (0,216975) (0,124827) (0,22958) 0,1728509 (0,0643182)
ROE SOLR INEF SIZE NII
-0,02881 -0,00114 -0,0108046 0,257592 0,027142 (0,032976) (0,047873) (0,001651) (0,06318) (0,01563)
(Nguồn: Tính tốn từ excel, sử dụng số liệu đầu vào là kết quả của Bảng 4.4).
Bảng 4.6 Kết quả kiểm định AR(2), Sargan và các kết quả khác
Mơ hình cơ bản Mơ hình 2 Mơ hình 3 Mơ hình 4 Mơ hình 5 Mơ hình 6 Loại bỏ biến vì vấn đề cộng tuyến
Dlirt-1 Ddebtt-2 Ddebtt-2 Ddebtt-2 Ddebtt-2 Ddebtt-2
Dlirt-2 Dlirt-1 Dlirt-1 Dlirt-1 Dlirt-1 Dlirt-1
Dlirt-2 Dlirt-2 Dlirt-2 Dlirt-2 Dlirt-2
Số đơn vị chéo 18 18 18 18 18 18 Số biến công cụ 11 17 17 17 17 17 Kiểm định Arellano-Bond AR(1) z -1,78 -1,83 -1,82 -1,43 -1,71 -1,45 Pr > z 0,074 0,067 0,068 0,152 0,087 0,146 AR(2) z -1,36 -1,41 -1,41 -1,48 -1,93 -0,52 Pr > z 0,175 0,158 0,157 0,138 0,053 0,601 Kiểm định Sargan chi2 chi2(5) = 7,1 chi2(8) = 5,86 chi2(8) = 16,96 chi2(8) = 11,41 chi2(8) = 5,67 chi2(8) = 6,62 Pr > chi2 0,213 0,663 0,031 0,180 0,684 0,578 Kiểm định Hansen chi2 chi2(5) = 6,37 chi2(8) = 4,37 chi2(8) = 5,47 chi2(8) = 5,36 chi2(8) = 9,7 chi2(8) = 4,09 Pr > chi2 0,272 0,823 0,706 0,718 0,286 0,849
(Nguồn: Trích từ các bảng kết quả của Stata).
Bảng 4.4 trình bày bảng kết quả xuất ra đƣợc từ phần mềm Stata sau khi tác giả đã nhập dữ liệu và thực hiện thao tác gõ các câu lệnh hồi quy theo phƣơng pháp DGMM. Ở bảng này, tất cả các hệ số hồi quy của các biến đƣợc liệt kê (trừ một số biến bị phần mềm Stata tự động loại trừ sau khi tính tốn1) kèm theo độ lệch chuẩn và mức ý nghĩa của chúng. Việc phân tích ý nghĩa của các hệ số này, thông qua dấu
và mức ý nghĩa của chúng, đƣợc trình bày ở mục 5.1.1. Qua đó, tác giả có thể kết luận việc chấp nhận hay bác bỏ giả thuyết đƣợc nêu ra trong nghiên cứu của mình.