Ưu điểm Nhược điểm
- Dữ liệu bảng cung cấp nhiều thông tin hơn, biến thiên hơn, nâng cao được số quan sát và phần nào khắc phục được hiện tượng đa cộng tuyến, bậc tự do cao hơn và hiệu quả hơn.
- Bằng cách nghiên cứu các dữ liệu chéo một cách lặp đi lặp lại, dữ liệu bảng thực hiện tốt hơn các nghiên cứu về những thay đổi xảy ra liên tục.
- Cho phép kiểm soát sự khác biệt không quan sát được giữa các thực thể (entities).
- Cho phép kiểm soát các biến không quan sát được nhưng thay đổi theo thời gian. - Cho phép nghiên cứu các mô hình phức tạp.
- Đây là loại dữ liệu có thể làm phức tạp trong phân tích bởi vì không thể giả định quan sát khác nhau là độc lập. - Loại dữ liệu này thường bị thiếu quan sát dẫn đến việc cần điều chỉnh trong các tiêu chuẩn phân tích.
- Vấn đề tồn tại trong dữ liệu chéo (ví dụ như phương sai thay đổi) và dữ liệu thời gian (ví dụ như tự tương quan) cần phải được xem xét.
Sử dụng Panel data có hai ưu điểm lớn nhất là: dữ liệu bảng cho các kết quả ước lượng của các tham số trong mô hình đáng tin cậy hơn và dữ liệu bảng cho phép chúng ta xác định và đo lường tác động mà những tác động này không thể được xác định và đo lường khi sử dụng dữ liệu chéo (cross-section) hoặc dữ liệu thời gian (time series).
Mẫu nghiên cứu được sàng lọc và xử lý như sau:
Đầu tiên, do mẫu nghiên cứu trong bài là các NHTM và các NHTM cổ phần nên các ngân hàng Nhà nước, ngân hàng nước ngoài và ngân hàng chính sách được loại ra khỏi mẫu.
Thứ hai, thực hiện loại bỏ các ngân hàng không có thông tin, thiếu và mất dữ liệu. Sau đó, loại bỏ các quan sát có số liệu lớn đột biến nhằm đảm bảo độ tin cậy và khách quan đối với kết quả nghiên cứu.
Thống kê mô tả được sử dụng để mô tả những đặc tính cơ bản của dữ liệu thu thập được từ nghiên cứu thực nghiệm qua các cách thức khác nhau, từ đó cung cấp những tóm tắt (dưới dạng các giá trị thống kê đơn nhất) về mẫu và các thước đo thông qua phân tích đồ họa đơn giản và các phương pháp cơ bản của mô tả dữ liệu giúp đưa ra các quyết định đúng đắn.
Số liệu trong thống kê mô tả hoặc các thông số đo lường và biến đổi chủ yếu là giá trị trung bình, trung vị, giá trị lớn nhất, giá trị nhỏ nhất và độ lệch chuẩn của các biến và cung cấp góc nhìn tổng quan về đặc tính dữ liệu. Độ lệch chuẩn rất quan trọng trong thống kê mô tả, nếu độ lệch thấp thì sự sai lệch dữ liệu thực so với giá trị trung bình là rất nhỏ.
3.1.3. Phân tích tương quan
Phân tích tương quan là phép phân tích được sử dụng làm thước đo độ lớn của các mối liên hệ giữa các biến định lượng trong một đề tài nghiên cứu, từ đó có thể xác định mối quan hệ tuyến tính giữa các biến độc lập và phụ thuộc trong nghiên cứu đó.
Đối với phân tích tương quan, hệ số tương quan được sử dụng để lượng hóa mức độ chặt chẽ của mối liên hệ tuyến tính giữa hai biến định lượng. Các biến có thể là hai cột của một bộ dữ liệu quan sát đã cho, thường được gọi là mẫu hoặc hai
phần của một biến ngẫu nhiên đa biến số có phân phối đã biết trước. Ma trận tương
quan xác định mối quan hệ tương quan tuyến tính giữa các biến lẫn nhau. Từ ma trận tương quan có thể xem xét vấn đề đa cộng tuyến giữa các biến đó và chọn ra những biến có mối quan hệ kinh tế với nhau được đưa vào để chạy mô hình hồi quy đa biến. Đa cộng tuyến (Multicollinearity) là hiện tượng có sự tương quan phụ thuộc lẫn nhau giữa các biến độc lập. Điều này sẽ dẫn đến việc tạo các thông số dư thừa hay các hệ số không ổn định khi thêm biến vào mô hình hồi quy (Farrar, 1967). Phân tích tương quan phản ánh tính chất tuyến tính của mô hình hồi quy nhằm kiểm định sự phù hợp trong môi trường nghiên cứu.
3.1.4. Phân tích hồi quy
biến sẽ là biến độc lập (ảnh hưởng đến biến mục tiêu), và biến còn lại sẽ là biến mục tiêu (bị ảnh hưởng bởi biến độc lập), mô hình hóa, định lượng hóa mối quan hệ này để qua đó có thể xác định giá trị của biến mục tiêu nếu các biến độc lập thay đổi như thế nào. Sau khi phân tích tương quan giữa các biến trong mô hình nghiên cứu và thực hiện xem xét hiện tượng đa cộng tuyến sẽ chỉ cho thấy mối quan hệ của từng cặp biến độc lập với nhau. Trong khi đó, mục đích nghiên cứu của đề tài là xác định rõ ràng mức độ ảnh hưởng của từng yếu tố đến RRTD của các NHTM tại Việt Nam. Do đó, đề tài sử dụng lần lượt các phương pháp hồi quy dữ liệu theo mô hình Pooled OLS và phương pháp hồi quy mẫu dữ liệu theo hai phương pháp ước lượng FEM và REM để phân tích, kiểm định, so sánh sự phù hợp và chọn ra mô hình tốt nhất trong ba mô hình. Trong đó, phương pháp Pooled OLS chỉ áp dụng với điều kiện các biến độc lập trong mô hình đều là biến ngoại sinh. Phương pháp ước lượng FEM chỉ quan tâm đến khác biệt mang tính cá nhân đóng góp vào mô hình nên không có hiện tượng tự tương quan trong mô hình. Nếu mô hình có hiện tượng tự tương quan thì ước lượng FEM sẽ không đạt hiệu quả cao. Còn phương pháp ước lượng REM quan tâm cả về các khác biệt của riêng các đối tượng phân tích thông qua thời gian đóng góp vào mô hình do đó tự tương quan là vấn đề tiềm tàng trong mô hình này cần xử lý và có thể giải quyết bằng cách chuyển mô hình nghiên cứu sang dạng sai phân bậc 1.
Để đảm bảo sự phù hợp của mô hình, nghiên cứu đã thực hiện một số kiểm định Breusch-Pagan Lagrangian là phương pháp cho phép lựa chọn chọn giữa mô hình tác động ngẫu nhiên REM và mô hình Pooled OLS với giả thuyết H0 - mô hình Pooled OLS là phù hợp, kiểm định Hausman (1978) cho phép lựa chọn giữa mô hình tác động cố định FEM và mô hình REM với giả thuyết H0 - mô hình REM là hiệu quả hơn, kiểm định Wald được dùng để kiểm định hiện tượng phương sai thay đổi trong mô hình với giả thuyết H0 là mô hình không có hiện tượng phương sai thay đổi và tương tự đối với kiểm định Wooldridge dùng để phát hiện tự tương quan.
Sau khi lựa chọn được mô hình phù hợp với đề tài nghiên cứu, tác giả sẽ tiếp tục tiến hành kiểm định các khuyết tật có thể xuất hiện trong mô hình này bằng phương pháp kiểm định Modified Ward và kiểm định Woodridge. Dựa vào kết quả kiểm định,
nếu nghiên cứu nhận thấy tồn tại vấn đề tự tương quan và phương sai thay đổi trong mô hình nghiên cứu thì sẽ khắc phục các khuyết tật trên bằng phương pháp ước lượng bình Phương tối thiểu tổng quát khả thi-FGLS (Feasible Generalized least square) được sử dụng (Greene, 2012) để hồi quy các phương trình nghiên cứu tồn tại vấn đề tự tương quan và phương sai thay đổi.
Do mô hình có sử dụng biến trễ của biến phụ thuộc (LNPL) làm biến độc lập nên hiện tượng nội sinh sẽ ảnh hưởng tới kết quả hồi quy. Theo nghiên cứu của nhóm tác giả Cristina Martinez-Sola và cộng sự (2013) cho rằng phương trình hồi quy không thể hồi quy bằng phương pháp OLS thông thường vì giả thiết các biến nội sinh bị vi phạm, vì thế tác giả sử dụng phương pháp hồi quy moment tổng thể (GMM) để khắc phục hiện tượng trên. GMM được Lars Peter Hansen trình bày lần đầu tiên vào năm 1982 trong bài viết “Large Sample Propertiesof Generalized Methods of Moments Estimators” được đăng trong Econometrica, Vol. 50, page 1029-1054. Một cách tổng quan, GMM là phương pháp tổng quát của rất nhiều phương pháp ước lượng phổ biến như OLS để cho ra các hệ số ước lượng vững, không chệch, phân phối chuẩn và hiệu quả.
3.1.5. Kiểm định sự phù hợp của mô hình
Sau khi chạy mô hình hồi quy GMM hai bước, kiểm định quan trọng nhất của phương pháp ước lượng GMM là kiểm định Overidentifying Restrictions (Overidentifying Restrictions Test) hay còn gọi là kiểm định Hansen test nhằm kiểm định biến công cụ được chọn là phù hợp và mô hình sử dụng biến đó để ước lượng cũng phù hợp. Ngoài ra, tác giả còn sử dụng kiểm định Arellano – Bond để kiểm tra tính bền vững của ước lượng GMM, AR(2) được kiểm định trên chuỗi sai phân của sai số để phát hiện hiện tượng tự tương quan của sai số ở bậc 1 (AR1). Do đó, chuỗi sai phân khảo sát mặc nhiên có tương quan bậc 1 để phát hiện hiện tượng tự tương quan bậc nhất của phần dư mô hình.
3.2. LỰA CHỌN MÔ HÌNH NGHIÊN CỨU
Dựa trên cơ sở các lý thuyết và công trình nghiên cứu từ mô hình trong đề tài nghiên cứu của tác giả Hasna Chaibi và Zied Ftiti năm 2015. Tác giả chọn ra 8 biến,
trong đó có 1 biến phụ thuộc là tỷ lệ nợ xấu và 8 biến còn lại là biến giải thích (biến độc lập). Các biến độc lập gồm 2 nhóm yếu tố, nhóm yếu tố kinh tế vĩ mô và nhóm yếu tố bên trong ngân hàng. Từ các tiền đề cơ bản trên, tác giả tiến hành áp dụng mô hình nghiên cứu tại Việt Nam nhằm xem xét các nhân tố tác động đến RRTD của các NTHM tại Việt Nam trong giai đoạn 2009-2019.
Do tình hình thực tế tại Việt Nam và để thuận tiện trong việc thu thập dữ liệu, các biến độc lập trong bài nghiên cứu này không hoàn toàn giống với mô hình trong bài nghiên cứu của Hasna Chaibi và Zied Ftiti (2015), có điều chỉnh thêm vào hoặc bớt đi một số biến để xác định các yếu tố ảnh hưởng đến RRTD của NHTM. Dữ liệu mẫu trong bài nghiên cứu liên tục trong thời gian 11 năm cho hầu hết các quan sát, tác giả có thể ước tính mô hình các yếu tố tác động đến RRTD của các NTHM tại Việt Năm từ dữ liệu bảng chi tiết sau đây:
NPLit = α + γNPLi,t-1 +
∑� �� ��
�� + εi,t (1)
Trong đó:
Biến phụ thuộc: NPLit: RRTD được đại diện bởi biến nợ xấu. Hệ số chặn: α
NPLi,t-1 là tỷ lệ nợ xấu của ngân hàng i vào năm t-1.
γ là tác động của biến trễ tỷ lệ nợ xấu đến tỷ lệ nợ xấu năm t.
Xkit là vector các biến độc lập, bao gồm cả biến vĩ mô và biến nội tại trong ngân hàng. Biến nội tại trong ngân hàng: LLR, LEV, SIZE, ROE; biến vĩ mô: INF, GDP, UEP.
Βk là tác động của vector biến độc lập đến tỷ lệ nợ xấu. εi,t là phần dư của mô hình.
=
�