5. Mức độ phù hợp về mặt hình thức của khóa luận:
3.3. Phương pháp nghiên cứu
Để đạt được mục tiêu nghiên cứu được đề ra, tác giả sử dụng phương pháp nghiên cứu là hồi quy dữ liệu bảng (panel data). Chi tiết quy trình thực hiện được mô tả ở sơ đồ như
Sơ đồ 3.1. Quy trình thực hiện ước lượng hồi quy
Nguồn: Tổng hợp của tác giả
Để thực hiện quy trình như trên, tác giả sử dụng phần mềm hỗ trợ là Stata 14.0 để thực hiện ước lượng mô hình và kiểm định mô hình. Chi tiết từng bước được mô tả như sau:
Bước 1: Thống kê mô tả dữ liệu
Thống kê mô tả được sử dụng nhằm mô tả những đặc tính cơ bản của dữ liệu thu thập được từ nghiên cứu qua các cách thức khác nhau. Qua thống kê mô tả này trình bày được giá trị trung bình của các biến thông qua tiêu chí giá trị trung bình, giá trị nhỏ nhất và giá trị lớn nhất, giá trị trung vị và sai số chuẩn giữa các giá trị. Thông qua các tiêu chí được thống kê đó, ta có thể hiểu được các hiện tượng và đưa quyết định đúng đắn về chuỗi dữ liệu nghiên cứu.
Bước 2: Ước lượng hồi quy mô hình Pooled OLS, FEM và REM
Hồi quy dữ liệu bảng sử dụng ba phương pháp chính, đó là phương pháp Pooled OLS, phương pháp tác động cố định (FEM) và phương pháp tác động ngẫu nhiên (REM).
Phương pháp Pooled OLS thực chất là việc sử dụng dữ liệu bảng để phân tích
bằng hình thức sử dụng tất cả dữ liệu theo cách xếp chồng và không phân biệt từng đơn vị chéo riêng. Đây là phương pháp thông thường và đơn giản nhất, tương tự như việc phân tích OLS bình thường, không kể đến kích thước không gian và thời gian của dữ liệu. Mô hình Pooled OLS được cụ thể như sau:
Tít =κι+ βιχut+ β2x2it + . ■ +βkxkit+ +uit
Trong đó yit là biến phụ thuộc của quan sát i trong thời kỳ t, Xkit là biến độc lập của quan sát k trong thời kỳ k.
Mô hình này có một số nhược điểm, đó là nhận diện sai thể hiện ở Durbin - Watson (DW) và ràng buộc quá chặt về các đơn vị chéo, điều này khó xảy ra so với thực tế. Vì thế, để khắc phục các nhược điểm trên, mô hình FEM và REM được sử dụng.
Để thể hiện tác động đặc trưng của mỗi đơn vị chéo đến biến phụ thuộc nhằm cho tung độ gốc thay đổi đối với mỗi đơn vị nhưng hệ số độ dốc không thay đổi. Phương pháp đó được gọi là phương pháp hồi quy theo mô hình tác động cố định (FEM), nghĩa là tung độ gốc có thể khác nhau giữa các đơn vị chéo nhưng không thay đổi theo thời gian.
Với giả định mỗi đơn vị đều có những đặc điểm riêng biệt có thể ảnh hưởng đến các biến giải thích, FEM phân tích mối tương quan này giữa phần dư của mỗi đơn vị với các biến giải thích qua đó kiểm soát và tách ảnh hưởng của các đặc điểm riêng biệt (không đổi theo thời gian) ra khỏi các biến giải thích để chúng ta có thể ước lượng những
ảnh hưởng thực (net effects) của biến giải thích lên biến phụ thuộc. Mô hình FEM có dạng như sau:
ya = ci + βχit + +uit
Trong đó yit là biến phụ thuộc của quan sát i trong thời gian t, Xit là biến độc lập của quan sát i trong thời gian t, Ci là hệ số chặn cho từng đơn vị nghiên cứu, β là hệ số góc đối với nhân tố x và Uit là phần dư.
Điểm khác biệt giữa mô hình ảnh hưởng ngẫu nhiên và mô hình ảnh hưởng cố định được thể hiện ở sự biến động giữa các đơn vị. Nếu sự biến động giữa các đơn vị có tương quan đến biến độc lập - biến giải thích trong mô hình ảnh hưởng cố định thì trong mô hình ảnh hưởng ngẫu nhiên sự biến động giữa các đơn vị được giả sử là ngẫu nhiên và không tương quan đến các biến giải thích.
Chính vì vậy, nếu sự khác biệt giữa các đơn vị có ảnh hưởng đến biến phụ thuộc thì REM sẽ thích hợp hơn so với FEM. Trong đó, phần dư của mỗi thực thể (không tương quan với biến giải thích) được xem là một biến giải thích mới.
Ý tưởng của mô hình REM cũng bắt đầu từ mô hình như sau:
ya = ci + βχit+ +uit
Thay vì trong mô hình trên, Ci là cố định thì trong REM có giả định rằng nó là một biến ngẫu nhiên với trung bình là C1 và giá trị hệ số chặn được mô tả như sau
Ci = C + εi (í = 1, ...,n)
Trong đó εi là sai số ngẫu nhiên có trung bình bằng 0 và phương sai là σ2. Thay vào mô
hình tác giả được:
yit = C + βχit + εit + Uit hay yit = C + βχit + Wit và Wit = εit + Uit
Trong đó εit là sai số thành phần của các đối tượng khác nhau (đặc điểm khác nhau của từng doanh nghiệp) và Uit là sai số thành phần kết hợp khác của cả đặc điểm riêng theo từng đối tượng và theo thời gian.
So với phương pháp FEM, phương pháp REM có thể khắc phục toàn bộ nhược điểm của phương pháp FEM nhưng REM coi mỗi đặc điểm riêng của các đơn vị εi không tương
quan với các biến độc lập. Do đó nếu xảy ra hiện tượng này thì REM ước lượng không còn chính xác.
Bước 3: Kiểm định lựa chọn mô hình phù hợp
Để kiểm định mô hình Pooled OLS, FEM hay REM là mô hình phù hợp trong nghiên cứu, tác giả quyết định sử dụng kiểm định F-Test cho việc lựa chọn Pooled OLS và REM và kiểm định Hausman để lựa chọn mô hình FEM và REM. Giả thuyết kiểm định F-Test như sau:
HO: σ<2≠ 0, mô hình hồi quy tuyến tính cổ điển (Pooled OLS) là phù hợp HI: σi2 = 0, mô hình tác động ngẫu nhiên (REM) là phù hợp
Đối với kiểm định Hausman để lựa chọn mô hình FEM và REM thì giả thuyết kiểm định là như sau:
HO: Không có sự tương quan giữa sai số và biến giải thích, mô hình REM là phù hợp HI: Có sự tương quan giữa sai số và biến giải thích, mô hình FEM là phù hợp
Để xác định giả thuyết HO hay HI là giả thuyết được lựa chọn, tác giả căn cứ vào hệ số Prob của kiểm định với mức ý nghĩa thống kê 1%, 5% và 10%. Nếu hệ số nhỏ hơn mức ý nghĩa thông kê thì giả thuyết H1 được lựa chọn và ngược lại.
Bước 4: Kiểm định các hệ số hồi quy phù hợp với mô hình
Đầu tiên tác giả sẽ thực hiện kiểm định thừa biến để loại bỏ những biến không cần thiết ra khỏi mô hình. Các biến được sử dụng là các biến không có ý nghĩa thống kê từ kết quả ước lượng của các mô hình Pooled OLS, FEM và REM. Để thực hiện, tác giả sử dụng kiểm định Wald để kiểm tra sự cần thiết của các biến không có ý nghĩa thống kê đối với mô hình.
Sau khi loại bỏ biến thừa (nếu có), tác giả sẽ chạy lại mô hình phù hợp được lưa chọn với biến độc lập còn lại, rồi tiến hành kiểm định các hệ số hồi quy. Tác giả quyết định sử dụng kiểm định t (t-test) để kiểm tra sự phù hợp của các hệ số hồi quy. Theo kinh nghiệm, một hệ số hồi quy được xem là phù hợp khi có mức ý nghĩa thống kê là 1% hoặc 5% hoặc 10%, tương ứng với độ tin cậy là 99%, 95% và 90%.
Kiểm định hiện tượng đa cộng tuyến: Tác giả sẽ tiến hành kiểm định đa cộng tuyến bằng hai cách. Cách một là thông qua phân tích hệ số tương quan nhằm kiểm định đa cộng tuyến của từng cặp biến độc lập. Hệ số tương quan (Pearson) được tính bằng cách chia hiệp phương sai của biến với tích độ lệch chuẩn của chúng. Nếu hệ số tương quan giữa các biến độc lập lớn hơn 0.8 (còn được gọi là hệ số tương quan cao), ta có hiện tượng đa cộng tuyến cao. Cách hai là kiểm định đa cộng tuyến giữa một biến độc lập so với các biến độc lập còn lại thông qua sử dụng thừa phóng đại phương sai VIF. Nếu hiện tượng đa cộng tuyến xảy ra, tác giả sẽ khắc phục bằng cách bỏ đi biến độc lập có đa cộng tuyến, đây là cách làm đơn giản nhất vì sau khi bỏ biến độc lập có đa cộng tuyến, các hệ số hồi quy của các biến còn lại từ chỗ khác 0 và không có ý nghĩa thống kê có thể trở thành khác 0 có ý nghĩa thống kê.
Kiểm định hiện tượng tự tương quan: Tác giả sẽ tiến hành kiểm định dưạ trên quy tắc kiểm định Durbin - Watson theo kinh nghiệm. Nếu có hiện tượng tự tương quan xảy ra, tác giả quyết định chọn biến pháp khắc phục là ước lượng ρ dựa trên thống kê Durbin - Watson.
Kiểm định hiện tượng phương sai thay đổi: Tác giả sẽ tiến hành kiểm định Breusch - Pagan cho mô hình Pooled OLS hoặc FEM. Nếu mô hình có phương sai thay đổi sẽ được khắc phục mô hình nghiên cứu bằng cách ước lượng lại mô hình được chọn bằng phương pháp GLS. Nếu trong trường hợp mô hình Random effect được chọn thì đề tài chỉ tiến hành kiểm định đa cộng tuyến và tự tương quan do mô hình Random Effect chưa có cách thức kiểm định phương sai thay đổi.
Bước 6: Ước lượng FGLS để khắc phục khuyết tật mô hình nếu có
Sau khi kiểm định khuyết tật mô hình ở bước 5, tác giả sẽ chạy mô hình FGLS để khắc phục toàn bộ khuyết tật mô hình như hiện tượng phương sai sai số thay đổi, tự tương quan đa cộng tuyến. Ước lượng GLS khả thi (hay còn gọi là ước lượng tác động ngẫu nhiên) là phương pháp ước lượng trong trường hợp cỡ mẫu lớn và T (thời gian) cố định, khi N → ∞. Phương pháp ước lượng này bao gồm 2 bước chính
Thứ nhất, tác giả cần chuyển dữ liệu ban đầu về dạng dữ liệu trung bình thời gian có trọng số (weighted time-demeaned data). Quá trình này được thực hiện như sau:
Tên biến Số quan sát Trung bình Độ lệchchuẩn Giá trị nhỏnhất Giá trị lớnnhất LIQ N14 0.194498 0.0997395 0.0450184 0.610376 ya = Yit - wYi Xitl = Xit1 - wXiι xit2 = Xit2 - WXị.2 Vit = μit - wμi Trong đó:
Yi là giá trị trung bình của Y cho quan sát i trong thời gian T năm
Xi là giá trị trung bình của X cho đối tượng i trong thờigian Tnăm
μl là giá trị trung bình của m cho đối tượng i trong thờigian Tnăm
Yit, xit, μit là giá trị thực tế
• yit' Xít’ Vít là các độ lệch so với giá trị trọng số theo thời gian (weighted time means)
W là trọng số được xác định bằng cách
W=I- —1—
^ε2 + Tσ2
Thứ hai, thực hiện hồi quy của yit lên (1-w), Xit1 và Xit2 sử dụng ước lượng OLS. Cụ thể ước lượng OLS cho biểu thức như sau:
yit = a0(1 - W) + βιXitI + β2Xit2 + εit
Nếu w = 0 thì mô hình tác động ngẫu nhiên sẽ trở thành mô hình hồi quy cổ điển Nếu w = 1 thì mô hình tác động ngẫu nhiên sẽ trở thành mô hình tác động cố định
KẾT LUẬN CHƯƠNG 3 •
Trong chương này, tác giả đã giới thiệu về mô hình nghiên cứu, giải thích ý nghĩa của các biến trong mô hình và kì vọng dấu về các biến. Ở phần giới thiệu mô hình, tác giả đã thiết kế mô hình cho đề tài dựa trên cơ sở lí thuyết đã trình bày ở chương 2. Đồng thời, tác giả cũng xác định các biến độc lập cùng biến phụ thuộc và làm rõ mô hình thông qua việc trình bày công thức, ý nghĩa và bảng kì vọng dấu của các biến trên. Từ đó làm cơ sở cho việc thực hiện mô hình và kết luận đề tài cho chương sau.
CHƯƠNG 4. KẾT QUẢ NGHIÊN CỨU
Ở chương 4, tác giả sẽ đi vào cụ thể kết quả ước lượng mô hình nghiên cứu dựa trên số liệu thu thập được bao gồm thống kê mô tả và chạy mô hình hồi quy. Dựa trên kết quả này, tác giả sẽ phân tích và đối chiếu với các nghiên cứu thực nghiệm trước đây. Từ đó, đưa ra các khuyến nghị phù hợp với tình hình thực tế cho các NHTM Việt Nam.