Dữ liệu và mẫu quan sát

Một phần của tài liệu Luận văn thạc sĩ UEH các yếu tố ảnh hưởng đến tăng trưởng cho vay của các ngân hàng thương mại cổ phần việt nam (Trang 56 - 61)

CHƯƠNG 1 :GIỚI THIỆU ĐỀ TÀI

4.3. Dữ liệu và mẫu quan sát

4.3.1. Thu thập và xử lý dữ liệu

Dựa vào mơ hình được trình bày ở phần 4.2, tác giả tiến hành thu thập dữ liệu phục vụ cho việc ước tính kết quả nghiên cứu cho phần thống kê mô ta dữ liệu. Bài nghiên cứu được thực hiện trên dữ liệu của 25 ngân hàng thương mại cổ phần Việt Nam với giai đoạn nghiên cứu là từ năm 2006 đến năm 2015. Dữ liệu thống kê trong bài được thu thập và tổng hợp để tính tốn biến phụ thuộc và các biến độc lập thuộc mơ hình thực nghiệm được lấy từ báo cáo tài chính hợp nhất của các ngân hàng vào thời điểm 31/12 hàng năm. Dữ liệu trong bài nghiên cứu là dữ liệu bảng (panel data).

Trong quá trình thu thập dữ liệu, các ngân hàng liên doanh, ngân hàng hoặc chi nhánh ngân hàng nước ngoài sẽ được loại bỏ khỏi bảng dữ liệu do sự khác biệt trong môi trường quản lý và thể chế hoạt động. Mặc dù, Ngân hàng Nông nghiệp và phát triển nơng thơn Việt Nam (Agribank) là ngân hàng có 100% vốn nhà nước, sẽ rất tốt nếu đưa số liệu vào nghiên cứu, tuy nhiên Agribank mới chỉ cơng bố Báo cáo tài chính hợp nhất tới Quý I/2014, nên khơng đủ dữ liệu nghiên cứu do đó loại bỏ khỏi bảng dữ liệu nghiên cứu. Một lưu ý nữa là trong năm 2015, trong dữ liệu bảng nghiên cứu có 2 ngân hàng bị sát nhập là: Ngân hàng TMCP Phát triển Nhà đồng bằng sông Cửu Long (MHB) sát nhập vào Ngân hàng TMCP Đầu tư và Phát triển Việt Nam(BIDV) và Ngân hàng TMCP Phát triển Mekong (MDB) sát nhập với Ngân hàng TMCP Hàng Hải Việt Nam (Maritime Bank), do đó số liệu năm 2015 của MHB và MDB có giá trị 0, số liệu bị loại khỏi bảng dữ liệu. Bài viết được thực hiện khi các ngân hàng Việt Nam vừa mới kết thúc năm tài chính 2015, khơng nhiều ngân hàng công bố báo cáo tài chính hợp nhất đã kiểm tốn, do đó tác giả chỉ thu thập được số liệu báo cáo tài chính hợp nhất kiểm tốn được cơng bố của 25 NHTMCP. Vì vậy, mẫu của bài nghiên cứu là 25 ngân hàng tương đương 248 quan sát trong giai đoạn 2006-2015. Chi tiết các ngân hàng trong mẫu được trình bày trong Phụ lục 9.

4.3.2. Sự phù hợp của kích thước mẫu

Mẫu của bài nghiên cứu 25 ngân hàng, giai đoạn 10 năm 2006-2015, 248 quan sát với dữ liệu bảng. Theo Baltagi chưa là macro panel data, tuy nhiên mẫu với 248 quan sát là một cỡ mẫu lớn đối với hàm hồi quy trong thống kê. Do đó kết quả nghiên cứu từ mơ hình hồi quy có thể chấp nhận được về độ tin cậy. Dựa vào mơ hình của Cull và Peria (2013) được trình bày phần 4.2 cùng với bộ dữ liệu được thu thập cho phù hợp với đặc điểm các biến của mơ hình, tác giả tiến hành thực hiện kiểm định mơ hình bằng phần mềm Stata12 ở các phần tiếp theo trong chương 4.

4.4. Phương pháp nghiên cứu

Bài nghiên cứu sử dụng phương pháp định lượng trên dữ liệu bảng, tiến hành thu nhập dữ liệu từ báo cáo tài chính thường niên của mẫu gồm 25 ngân hàng trong giai đoạn từ 2006 đến 2015 (tổng cộng 248 quan sát). Bài nghiên cứu lần lượt kiểm định các khuyếm khuyết ảnh hưởng đến độ tin cậy của mơ hình như: kiểm định đa cộng tuyến, kiểm định phương sai thay đổi, kiểm định hiện tượng tự tương quan, hiện tượng nội sinh lý thuyết.

4.4.1. Kiểm định các trường hợp khuyếm khuyết của mơ hình do vi phạm các giả định

4.4.1.1. Giả định phương sai của sai số không đổi

Phương sai thay đổi nghĩa là phương sai của các phần dư là không phải hằng số, nghĩa là chúng khác nhau ở các quan sát khác nhau. Điều này sẽ dẫn đến vấn đề nếu các phương sai khơng bằng nhau thì độ tin cậy tương đối của mỗi quan sát (dữ liệu) sẽ không bằng nhau. Phương sai càng lớn thì mức độ quan trọng gán cho quan sát càng nhỏ. Vấn đề sẽ rõ ràng hơn khi giá trị của phương sai có mối quan hệ với một hoặc một số biến giải thích. Điều này vi phạm giả định rằng các phân phối của phần dư phải khơng có tương quan với bất kì biến giải thích nào.

Hiện tượng phương sai thay đổi sẽ dẫn đến một số hậu quả như: các ước lượng OLS vẫn là khơng chệch nhưng khơng cịn hiệu quả nữa, ước lượng của các phương sai sẽ bị chệch, như vậy sẽ làm mất hiệu lực của kiểm định hệ số hồi quy.

4.4.1.2. Giả định khơng có sự tương quan giữa các phần dư

Tự tương quan là sự tương quan giữa các thành phần của chuỗi các quan sát được sắp xếp theo thứ tự thời gian trong các số liệu chuỗi thời gian, hoặc sắp xếp theo thứ tự không gian, đối với các số liệu theo không gian.

Hiện tượng tự tương quan sẽ dẫn đến một số hậu quả như: uớc lượng OLS vẫn là ước lượng tuyến tính khơng chệch, nhưng khơng là ước lượng hiệu quả nữa; phương sai các ước lượng OLS là bị chệch, đôi khi quá thấp so với phương sai thực và sai số tiêu chuẩn, dẫn đến phóng đại tỷ số t; các kiểm định t và F không đáng tin cậy; công thức thông thường để tính phương sai của sai số là ước lượng chệch của phương sai thực và trong một số trường hợp dường như ước lượng thấp của phương sai thực; có thể hệ số xác định khơng đáng tin cậy và dường như là nhận giá trị ước lượng cao; các phương sai và số tiêu chuẩn của dự đốn khơng có hiệu quả.

Để kiểm tra xem mơ hình đã vi phạm giả thiết hồi quy - hiện tượng tự tương quan. Trong quá trình hồi quy, tác giả sẽ dùng phương pháp đồ thị và kiểm định d (Durbin-Watson) để phát hiện tượng tự tương quan trong mơ hình hồi quy OLS (pooled regression).

4.4.1.3. Giả định khơng có mối tương quan giữa các biến độc lập (khơng xảy ra hiện tượng đa cộng tuyến)

Đa cộng tuyến nghĩa là hai hay nhiều biến giải thích trong biểu thức hồi quy có mối quan hệ tuyến tính với nhau. Nếu các biến có mối quan hệ tuyến tính thì các hệ số ước lượng và thống kê T sẽ khơng cịn hợp lý.

Trong quá trình hồi quy, kết quả hồi quy có hệ số xác định R2 cao nhưng tỷ số t thấp, tương quan cặp giữa các biến giải thích cao, xét tương quan riêng, hồi quy phụ

thấy có tồn tại hiện tượng tương quan giữa các biến độc lập thì mơ hình đã vi phạm giả thiết hồi quy - hiện tượng đa cộng tuyến.

Hiện tượng đa cộng tuyến sẽ dẫn đến một số hậu quả như: phương sai và hiệp phương sai của các ước lượng OLS lớn, khoảng tin cậy rộng lớn, tỷ số t mất ý nghĩa, hệ số xác định cao nhưng tỷ số t mất ý nghĩa, các ước lượng OLS và sai số chuẩn trở nên rất nhạy với những thay đổi trong số liệu, dấu của các ước lượng của các hệ số hồi quy có thể sai lệch, thêm vào hay bớt đi các biến cộng tuyến với các biến khác thì hệ số của các biến cịn lại có thể thay đổi rất lớn và thay đổi cả dấu của chúng. Đa cộng tuyến giữa các biến luôn tồn tại và khuyết tật chỉ xảy ra nếu mức độ đa cộng tuyến đủ lớn để gây ra sự thiên chệch các kết quả ước lượng. Theo Gujarati (2004), một số cách kiểm tra vấn đề đa cộng tuyến như sau:

 Nhiều trường hợp mơ hình có R2 lớn hơn 0.8 nhưng | t | thấp.

 Hệ số tương quan giữa các cặp biến độc lập cao. Nếu giá trị tuyệt đối của hệ số tương quan giữa 2 biến lớn hơn 0.8 cho thấy có tồn tại hiện tượng đa cộng tuyến giữa 2 biến này.

 Sử dụng hệ số khuếch đại phương sai (VIF), nếu VIF của một biến lớn hơn 10 thì tồn tại hiện tượng đa cộng tuyến giữa biến đó với các biến giải thích cịn lại. Trong luận văn này, tác giả sẽ thực hiện tính tốn hệ số tương quan giữa các cặp biến độc lập và sử dụng hệ số khuếch đại phương sai (VIF). Trong luận văn tác giả sử dụng hệ số tương quan giữa các cặp biến độc lập kết hợp với sử dụng hệ số khuếch đại phương sai (VIF). Tuy nhiên, cũng theo Baltagi (2008), việc sử dụng dữ liệu bảng cũng đã hạn chế được hiện tượng đa cộng tuyến này nhưng nếu có hiện tượng đa cộng tuyến xảy ra thì tác giả sẽ khắc phục bằng cách bỏ các biến có đa cộng tuyến hoặc tăng thêm số quan sát bằng cách thu thập thêm số liệu.

4.4.1.4. Hiện tượng nội sinh

Hiện tượng nội sinh xảy ra khi giả thiết về sự không tương quan giữa biến độc lập và sai số bị vi phạm. Biến độc lập trong mơ hình vừa đóng vai trị là biến ngoại sinh (do tác động đến Y) vừa là biến nội sinh (do bị sai số tác động).

Để phát hiện vi phạm giả thiết hồi quy - hiện tượng nội sinh, tác giả sẽ sử dùng kiểm định phương pháp Hansen, Sargan để kiểm tra sự phù hợp của việc thay thế biến nội sinh bởi biến công cụ.

4.4.2. Phương pháp hồi quy GMM

4.4.2.1. Tính chất của phương pháp ước lượng GMM.

Khi số lượng mẫu phù hợp giá trị β ước lượng được sẽ vững, khi đó giá trị ước lượng được sẽ càng gần với giá trị thực của nó. Ước lượng GMM sẽ cho ra các giá trị ước lượng tuân theo phân phối chuẩn, đây là thuộc tính rất quan trọng vì đó là cơ sở để chúng ta xây dựng giá trị dự đoán ở các độ tin cậy (confidence bands) và thực hiện các kiểm định khác. Phương pháp GMM cũng cho ra kết quả là các giá trị ước lượng hiệu quả, nghĩa là giá trị phương sai trong mơ hình ước lượng là nhỏ nhất.

4.4.2.2. Ưu điểm của GMM

Thông thường ước lượng theo phương pháp OLS (Pooled Regress Model) sẽ không chệch, vững và hiệu quả khi không tồn tại các vi phạm về phương sai thay đổi, tự tương quan và biến nội sinh. Phương pháp ước lượng bình phương bé nhất (OLS) là phương pháp được dùng rất phổ biến trong lĩnh vực kinh tế lượng. Ưu điểm của phương pháp này không quá phức tạp nhưng hiệu quả. Với một số giả thiết ban đầu, phương pháp này sẽ dễ dàng xác định các giá trị ước lượng hiệu quả, không chệch và vững. Tuy nhiên, khi nghiên cứu về chuỗi dữ liệu thời gian, có nhiều chuỗi vi phạm một hoặc một số giả định của OLS. Khi đó, các ước lượng thu được sẽ bị bóp méo, mất tính vững và sẽ là sai lầm nếu sử dụng chúng để phân tích. Một trong những dạng vi phạm giả định phổ biến là hiện tượng nội sinh, một trường hợp khi hệ số ước lượng (hoặc biến) tương quan với phần dư.

Với những vi phạm trên làm cho kết quả ước lượng theo phương pháp OLS khơng cịn đáng tin cậy và hiệu quả nhất. Để khắc phục phương pháp ước lượng bình phương bé nhất, phương pháp GMM hệ thống do Arellano and Bover (1995) và Blundell and Bond (1998) được sử dụng vì cỡ mẫu đủ lớn. Việc sử dụng mơ hình GMM sẽ cho phép khắc phục cả vi phạm tự tương quan, phương sai thay đổi và biến nội sinh nên kết quả ước lượng lúc này sẽ không chệch, vững và hiệu quả nhất. Thêm vào đó, phương pháp Arellano - Bond cũng được thiết kế để khắc phục hiệu ứng tác động cố định hàm chứa trong sai số của mơ hình được phản ánh vào trong phần sai số, sẽ giảm dần theo thời gian (Roodman, 2006).

Một phần của tài liệu Luận văn thạc sĩ UEH các yếu tố ảnh hưởng đến tăng trưởng cho vay của các ngân hàng thương mại cổ phần việt nam (Trang 56 - 61)

Tải bản đầy đủ (PDF)

(110 trang)