3.4.1 Ƣu điểm của sử dụng dữ liệu bảng
Nghiên cứu này sử dụng phƣơng pháp nghiên cứu định lƣợng. Dữ liệu đƣợc trình bày theo dạng bảng cân bằng (balance panel data).
Dữ liệu bảng (panel data) là dữ liệu kết hợp dữ liệu theo không gian (cross – section, tức là giá trị của các biến đƣợc thu thập cho một đơn vị mẫu tại cùng một th i điểm) và dữ liệu theo chuỗi th i gian (time series, tức là giá trị của các biến đƣợc quan sát theo th i gian). Dữ liệu bảng khác với dữ liệu chéo gộp chung bởi vì dữ liệu chéo gộp chung gộp những quan sát trong nhiều năm nhƣng chỉ là các quan sát dữ liệu thuần túy và bỏ qua yếu tố th i gian. Việc kết hợp hai loại dữ liệu có nhiều thuận lợi trong phân tích các mối quan hệ kinh tế, đặc biệt khi muốn quan sát, phân tích sự biến động củ các đối tƣợng nghiên cứu sau các biến cố hay theo th i gi n, cũng nhƣ ph n tích sự khác biệt giữ các nh m đối tƣợng nghiên cứu. Có hai loại dữ liệu bảng: dữ liệu bảng cân bằng (balaned panels) và dữ liệu bảng không cân bằng (unbalaned panels). Dữ liệu bảng cân bằng hi các đơn vị chéo có cùng số quan sát theo th i gian, dữ liệu bảng không cân bằng hi các đơn vị chéo không có cùng số quan sát theo th i gian. Trong luận văn này, tác giả sử dụng dữ liệu bảng cân bằng theo chuỗi th i gi n (năm). Việc nghiên cứu các mô hình với dữ liệu bảng có những ƣu điểm theo Baltagi (2008):
Nh kết hợp dữ liệu chuỗi th i gian của các ngân hàng khác nhau, dữ liệu bảng sẽ chứa nhiều thông tin hữu ích hơn, tính biến thiên nhiều hơn, giảm hiện tƣợng đ cộng tuyến giữa các biến, tăng số quan sát - từ đ tăng số bậc tự do, và có thể đem lại ƣớc lƣợng vững, hiệu quả và không chệch.
Dữ liệu bảng c liên qu n đến nhiều ng n hàng theo th i gian, mỗi ng n hàng dựa trên dữ liệu bảng có thể tính đến sự hông đồng nhất này, cho phép kiểm soát
sự khác biệt hông qu n sát đƣợc giữa các thực thể, ví dụ nhƣ hả năng quản lý, triết inh do nh, văn hoá, hoáng sản... giữa các doanh nghiệp.
Nhƣ vậy, nh những lợi thế trên, việc sử dụng dữ liệu bảng trong các mô hình nghiên cứu của luận văn đƣợc kỳ vọng có thể đem lại hiệu quả c o hơn so với phân tích dữ liệu chéo hay dữ liệu chuỗi th i gian.
3.4.2 Kiểm soát các khuyết tật vi phạm các giả thuyết của mô hình
Theo giả thiết cổ điển định lƣợng, các hiện tƣợng đ cộng tuyến, phƣơng s i th y đổi, tự tƣơng qu n và nội sinh c thể ảnh hƣởng đến độ tin cậy củ ƣớc lƣợng. Do đ cần thiết phải iểm soát các yếu tố này nhằm đảm bảo ết quả thực nghiệm tin cậy.
iể soát ph ng sai của sai số hông đổi
Phƣơng s i th y đổi nghĩ là phƣơng s i của các phần dƣ là hông phải hằng số, nghĩ là chúng hác nh u ở các qu n sát hác nh u. Điều này sẽ dẫn đến vấn đề nếu các phƣơng s i hông bằng nh u thì độ tin cậy tƣơng đối của mỗi quan sát (dữ liệu) sẽ không bằng nh u. Phƣơng s i càng lớn thì mức độ quan trọng gán cho quan sát càng nhỏ. Vấn đề sẽ r ràng hơn hi giá trị củ phƣơng s i c mối quan hệ với một hoặc một số biến giải thích. Điều này vi phạm giả định rằng các phân phối của phần dƣ phải hông c tƣơng quan với bất kì biến giải thích nào.
Hiện tƣợng phƣơng s i th y đổi sẽ dẫn đến một số hậu quả nhƣ: các ƣớc lƣợng OLS vẫn là không chệch nhƣng hông c n hiệu quả nữ , ƣớc lƣợng củ các phƣơng sai sẽ bị chệch, nhƣ vậy sẽ làm mất hiệu lực của kiểm định hệ số hồi quy.
Trong quá trình hồi quy, tác giả sử dụng phƣơng pháp Greene (2000) trên dữ liệu bảng để kiểm tr xem mô hình đ vi phạm giả thiết hồi quy - hiện tƣợng phƣơng s i th y đổi.
iể soát hông c sự t ng quan giữa các phần d
Tự tƣơng qu n là sự tƣơng qu n giữa các thành phần của chuỗi các quan sát đƣợc sắp xếp theo thứ tự th i gian trong các số liệu chuỗi th i gian, hoặc sắp xếp theo thứ tự hông gi n, đối với các số liệu theo không gian.
Để kiểm tr xem mô hình đ vi phạm giả thiết hồi quy - hiện tƣợng tự tƣơng quan. Trong quá trình hồi quy, tác giả sẽ dùng phƣơng pháp đồ thị và kiểm định d (Durbin-W tson) để phát hiện tƣợng tự tƣơng qu n trong mô hình hồi quy OLS (pooled regression). Ở khía cạnh kiểm tr phƣơng s i th y đổi dữ liệu bảng, tác giả sử dụng kiểm định đƣợc đề xuất bởi Wooldrige (2002) và Drukker (2003).
Hiện tƣợng tự tƣơng qu n sẽ dẫn đến một số hậu quả nhƣ: uớc lƣợng OLS vẫn là ƣớc lƣợng tuyến tính không chệch, nhƣng hông là ƣớc lƣợng hiệu quả nữa; phƣơng s i các ƣớc lƣợng OLS là bị chệch, đôi hi quá thấp so với phƣơng s i thực và sai số tiêu chuẩn, dẫn đến ph ng đại t số t; các kiểm định t và F hông đáng tin cậy; công thức thông thƣ ng để tính phƣơng s i của sai số là ƣớc lƣợng chệch của phƣơng s i thực và trong một số trƣ ng hợp dƣ ng nhƣ ƣớc lƣợng thấp củ phƣơng sai thực; có thể hệ số xác định hông đáng tin cậy và dƣ ng nhƣ là nhận giá trị ƣớc lƣợng c o; các phƣơng s i và số tiêu chuẩn của dự đoán hông c hiệu quả.
iể soát hông ảy ra hiện t ợng đa c ng tuyến
Đ cộng tuyến nghĩ là h i h y nhiều biến giải thích trong biểu thức hồi quy có mối quan hệ tuyến tính với nhau. Nếu các biến có mối quan hệ tuyến tính thì các hệ số ƣớc lƣợng và thống kê T sẽ không còn hợp lý.
Trong quá trình hồi quy, kết quả hồi quy có hệ số xác định R2 c o nhƣng t số t thấp, tƣơng qu n cặp giữa các biến giải thích c o, xét tƣơng qu n riêng, hồi quy phụ thấy có tồn tại hiện tƣợng tƣơng qu n giữa các biến độc lập thì mô hình đ vi phạm giả thiết hồi quy - hiện tƣợng đ cộng tuyến.
Hiện tƣợng đ cộng tuyến sẽ dẫn đến một số hậu quả nhƣ: phƣơng s i và hiệp phƣơng s i củ các ƣớc lƣợng OLS lớn, khoảng tin cậy rộng lớn, t số t mất ý nghĩ , hệ số xác định c o nhƣng t số t mất nghĩ , các ƣớc lƣợng OLS và sai số chuẩn trở nên rất nhạy với những th y đổi trong số liệu, dấu củ các ƣớc lƣợng của các hệ số hồi quy có thể sai lệch, thêm vào hay bớt đi các biến cộng tuyến với các biến khác thì hệ số của các biến còn lại có thể th y đổi rất lớn và th y đổi cả dấu của chúng.
Đ cộng tuyến giữa các biến luôn tồn tại và khuyết tật chỉ xảy ra nếu mức độ đ cộng tuyến đủ lớn để gây ra sự thiên chệch các kết quả ƣớc lƣợng.
Theo Gujarati (2004), một số cách kiểm tra vấn đề đ cộng tuyến nhƣ s u: - Hệ số tƣơng qu n giữa các cặp biến độc lập cao. Nếu giá trị tuyệt đối của hệ số tƣơng qu n giữa 2 biến lớn hơn 0.8 cho thấy có tồn tại hiện tƣợng đ cộng tuyến giữa 2 biến này.
- Sử dụng hệ số khuếch đại phƣơng s i (VIF), nếu VIF của một biến lớn hơn 10 thì tồn tại hiện tƣợng đ cộng tuyến giữa biến đ với các biến giải thích còn lại. Trong luận án này, tác giả sẽ thực hiện tính toán hệ số tƣơng qu n giữa các cặp biến độc lập và sử dụng hệ số khuếch đại phƣơng s i (VIF).
Trong luận án tác giả sử dụng hệ số tƣơng qu n giữa các cặp biến độc lập kết hợp với sử dụng hệ số khuếch đại phƣơng s i (VIF). Tuy nhiên, cũng theo B lt gi (2008), việc sử dụng dữ liệu bảng cũng đ hạn chế đƣợc hiện tƣợng đ cộng tuyến này nhƣng nếu có hiện tƣợng đ cộng tuyến xảy ra thì tác giả sẽ khắc phục bằng cách bỏ các biến c đ cộng tuyến hoặc tăng thêm số quan sát bằng cách thu thập thêm số liệu.
iể soát hiện t ợng n i sinh
Hiện tƣợng nội sinh xảy ra khi giả thiết về sự hông tƣơng qu n giữa biến độc lập và sai số bị vi phạm. Biến độc lập trong mô hình vừa đ ng v i tr là biến ngoại sinh (do tác động đến Y) vừa là biến nội sinh (do bị sai số tác động). Trong mô hình bài nghiên cứu, các nghiên cứu về lợi nhuận ng n hàng thƣ ng sử dụng th nh hoản làm yếu tố ảnh hƣởng. Tồn tại tác động qu lại giữ yếu tố độc lập và phụ thuộc cho thấy mối qu n hệ nội sinh trong mô hình.
Với việc lự chọn biến công cụ trong hắc phục nội sinh ở phƣơng pháp GMM. Tác giả iểm tr độ tin cậy củ việc sử dụng biến công cụ bằng phƣơng pháp H nsen, S rg n để kiểm tra sự phù hợp của việc thay thế biến nội sinh bởi biến công cụ.
3.4.3 Phƣơng pháp hồi quy GMM
3.4.3.1 Lý do lựa chọn GMM
Tác giả sử dụng phƣơng pháp hồi quy trong trả l i c u hỏi các yếu tố ảnh hƣởng đến th nh hoản NHTM. Thông thƣ ng ƣớc lƣợng theo phƣơng pháp OLS (Pooled Regress Model) sẽ không chệch, vững và hiệu quả khi không tồn tại các vi phạm về phƣơng s i th y đổi, tự tƣơng qu n và biến nội sinh. Phƣơng pháp ƣớc lƣợng bình phƣơng bé nhất (OLS) là phƣơng pháp đƣợc dùng rất phổ biến trong lĩnh vực kinh tế lƣợng. Ƣu điểm củ phƣơng pháp này hông quá phức tạp nhƣng hiệu quả. Với một số giả thiết b n đầu, phƣơng pháp này sẽ dễ dàng xác định các giá trị ƣớc lƣợng hiệu quả, không chệch và vững.
Tuy nhiên, khi nghiên cứu về dữ liệu c vi phạm một hoặc một số giả định của OLS. Khi đ , các ƣớc lƣợng thu đƣợc sẽ bị bóp méo, mất tính vững và sẽ là sai lầm nếu sử dụng chúng để phân tích. Một trong những dạng vi phạm giả định phổ biến là hiện tƣợng nội sinh, một trƣ ng hợp khi hệ số ƣớc lƣợng (hoặc biến) tƣơng qu n với phần dƣ.
Với những vi phạm trên làm cho kết quả ƣớc lƣợng theo phƣơng pháp OLS hông c n đáng tin cậy và hiệu quả nhất.
Mẫu nghiên cứu tác giả tồn tại hiện tƣợng phƣơng s i th y đổi, tự tƣơng qu n và nghi ng tồn tại hiện tƣợng nội sinh khi biến phụ thuộc trong mô hình có khả năng tác động tới các biến độc lập. Theo Arellano Bond (1991), mô hình GMM khắc phục đƣợc các giả thuyết định lƣợng bao gồm cả phƣơng s i th y đổi, tự tƣơng quan và hiện tƣợng nội sinh, cho ƣớc lƣợng tin cậy.
3.4.3.2 Thủ tục ớc l ợng GMM và kiể định c bản
Phần trên đ cố gắng trình bày một cách đơn giản, có thể hiểu đƣợc vai trò của biến công cụ trong hồi quy IV. Tuy nhiên, cách thực hiện tính toán củ các phƣơng pháp hồi quy IV là rất phức tạp, GMM là phƣơng pháp hiệu quả, ƣu việt hơn cả nên cũng há phức tạp. GMM đƣợc Lars Peter Hansen trình bày lần đầu tiên vào năm
1982 trong bài viết “LargeSample Properties of Generalized Methods of Moments Estimators”Econometrica, Vol. 50, page 1029-1054.
Nhƣ đ đề cập ở phần trên, để ƣớc lƣợng đƣợc hệ số β, chúng ta cần một bộ L vector các biến công cụ (trong ƣớc lƣợng GMM c n đƣợc gọi là các điều kiện moment) và số lƣợng biến công cụ phải hông ít hơn số biến giải thích trong mô hình (L ≥ K).
Điều kiện để một biến đƣợc chọn là biến công cụ là n hông đƣợc tƣơng qu n với phần dƣ, điều này c nghĩ là:
( ( ))
tƣởng chủ đạo củ phƣơng pháp GMM là th y thế giá trị các biến công cụ bằng giá trị trung bình của mẫu:
( ( )) ∑ ( ) ( )
và đi tìm Vector β th m n phƣơng trình trên.
Khi số lƣợng điều kiện moment lớn hơn số biến trong mô hình (L>K) thì phƣơng trình không thể xác định một nghiệm chính xác duy nhất (có nhiều nghiệm có thể thỏ m n phƣơng trình). Khi đ mô hình đƣợc gọi là overidentified. Trong trƣ ng hợp đ , chúng t phải thực hiện tính toán lại nhằm xác định giá trị β làm cho điều kiện moment ( ( )) “gần” bằng 0 nhất có thể, khái niệm “gần” đƣợc hiểu là khoảng cách với giá trị 0 là nhỏ nhất, khoảng cách đ đƣợc xác định nhƣ sau:
( ̂ ) ( ) ( )
Ma trận ngẫu nhiên, cân xứng và không âm ̂( ích thƣớc L x L) đƣợc gọi là
ma trận trọng số vì nó thể hiện mức đ ng g p củ các điều kiện moment khác nhau vào khoảng cách J. Phƣơng pháp ƣớc lƣợng GMM sẽ xác định giá trị ƣớc lƣợng β để khoảng cách J là nhỏ nhất.
Kiểm định quan trọng nhất củ phƣơng pháp ƣớc lƣợng GMM là kiểm định Overidentifying Restrictions (Overidentifying Restrictions Test) hay còn gọi là
kiểm định Sargent (Sargent Test) hoặc kiểm định J (J – Test). Đ y là iểm định cần thiết trong trƣ ng hợp số biến công cụ nhiều hơn số biến trong mô hình. tƣởng của kiểm định là xem xét biến công cụ c tƣơng qu n với phần dƣ của mô hình không. Nếu câu trả l i là hông, hi đ biến công cụ là nội sinh, thì biến công cụ đƣợc chọn là phù hợp và mô hình sử dụng biến đ để ƣớc lƣợng cũng phù hợp. Kiểm định Sargent sử dụng thống kê J (J – statistic) nhằm kiểm định giả thiết H0 - biến công cụ là nội sinh, mô hình phù hợp. Thống kê J tuân theo phân phối Chi Bình phƣơng và đƣợc trình bày trên bảng kết quả ƣớc lƣợng của phần mềm thống kê cùng với giá trị P – v lue tƣơng ứng của nó.
3.4.3.3 Tính chất của ph ng pháp ớc l ợng GMM
Khi số lƣợng mẫu phù hợp giá trị β ƣớc lƣợng đƣợc sẽ vững, hi đ giá trị ƣớc lƣợng đƣợc sẽ càng gần với giá trị thực củ n . Ƣớc lƣợng GMM sẽ cho ra các giá trị ƣớc lƣợng tuân theo phân phối chuẩn, đ y là thuộc tính rất quan trọng vì đ là cơ sở để chúng ta xây dựng giá trị dự đoán ở các độ tin cậy (confidence bands) và thực hiện các kiểm định hác. Phƣơng pháp GMM cũng cho r ết quả là các giá trị ƣớc lƣợng hiệu quả, nghĩ là giá trị phƣơng s i trong mô hình ƣớc lƣợng là nhỏ nhất.
CHƢƠNG 4. KẾT QUẢ NGHIÊN CỨU THỰC NGHIỆM
hư ng này tác giả tr nh bày kết quả ph n tích mối quan hệ các yếu tố đến thanh khoản N TM tại Việt Nam. Trong chư ng 3 tác giả đã tr nh bày về mô h nh nghiên cứu, các phư ng pháp và dữ liệu sẽ sử dụng để mô h nh các biến. hư ng 3 cũng đưa ra một số tính chất lí thuyết đặc trưng trong mô h nh, đồng thời chỉ ra phư ng pháp cũng như cách đo lường các biến trong mô h nh nghiên cứu. Phần tiếp theo tác giả tr nh bày kết quả ph n tích định lượng trên dữ liệu bảng. Mẫu nghiên cứu của luận văn bao gồm 25 Ng n hàng với mẫu nghiên cứu 223 quan sát trong khoảng thời gian từ năm 2008–2016 tạo thành bảng c n bằng.
4.1 PHÂN TÍCH THÔNG KÊ MÔ TẢ GIỮA CÁC BIẾN TRONG MÔ HÌNH
Bảng 4.1: Thống kê mô tả giữa các biến trong mô hình
Variable Obs Mean Std. Dev. Min Max
LQD 223 0.225 0.105 0.052 0.611 SIZE 224 7.802 0.537 6.384 9.003 CA 224 0.112 0.063 0.038 0.462 ROA 224 0.891 0.811 -5.512 5.951 LLD 224 0.013 0.006 0.001 0.038 IRM 225 2.634 0.462 1.942 3.240 GDP 225 5.918 0.480 5.247 6.679 INF 225 9.067 6.893 0.879 23.116
Nguồn: Kết quả tổng hợp từ Phần mềm Stata 13(Phụ lục 1)
Phần thống ê mô tả chung cho các biến trong mô hình theo bảng 4.1, Các biến thu thập đƣợc c d o động ổn định, phần lớn các giá trị độ lệch chuẩn củ mẫu nghiên cứu đều nhỏ hơn so với giá trị trung bình. Cỡ mẫu nghiên cứu gồm 223 qu n sát cho mỗi biến, là số qu n sát đƣợc chấp nhận để thực hiện hồi quy và các iểm
định trong thống ê. Nhƣ vậy số lƣợng qu n sát và các giá trị đồng đều đảm bảo độ