Chương 3: PHƯƠNG PHÁP NGHIÊN CỨU 25
3.3 Phương pháp nghiên cứu
Phương pháp nghiên cứu chủ yếu sử dụng trong nghiên cứu này là phương pháp định lượng.
3.3.1 Xử lý dữ liệu nghiên cứu
Dữ liệu nghiên cứu được sử dụng là dữ liệu thứ cấp. Nghiên cứu sử dụng phần mềm excel để tính toán và tạo ra các biến số cần thiết cho mô hình. Xây dựng dữ liệu bảng thông qua việc kết hợp các chuỗi dữ liệu có quy mô về thời gian từ năm 2006 đến năm 2016 lẫn không gian gồm hai mươi ba ngân hàng thương mại cổ phần tại Việt Nam. Cấu trúc dữ liệu bảng được kết hợp giữa dữ liệu chéo (cross – section) và thành phần dữ liệu chuỗi thời gian (time series). Thực hiện kết hợp hai loại dữ liệu này có nhiều ưu điểm trong phân tích bao gồm khắc phục được tính không đồng nhất của đối tượng nghiên cứu, dữ liệu bảng kết hợp chuỗi thời gian của các quan sát giúp cho số liệu thu thập chứa nhiều thông tin, ít hiện tượng đa cộng tuyến.
Tiếp theo nghiên cứu sử dụng phần mềm Stata 13 để tạo lập ma trận tương quan và ước lượng hồi quy.
3.3.2 Quy trình nghiên cứu
Bằng phương pháp xử lý dữ liệu đã trình bày trên đây nghiên cứu được thực hiện theo trình tự sau:
Thống kê mô tả dữ liệu: Thống kê mô tả một số giá trị tiêu biểu của các biến định lượng như giá trị lớn nhất, giá trị nhỏ nhất, giá trị trung bình, độ lệch chuẩn để sử dụng mô tả và phân tích dữ liệu tổng quát từ đó làm cơ sở phân tích kết quả mô hình.
Phân tích ma trận hệ số tương quan: Phân tích tương quan giữa các biến trong mô hình được thực hiện bằng cách tìm ra những cặp biến có hệ số tương quan cao qua việc thiết lập ma trận hệ số tương quan giữa các biến để phát hiện khả năng tồn tại hiện tượng đa cộng tuyến. Nếu có hiện tượng đa cộng tuyến nghiêm trọng thì dấu của các hệ số hồi quy sẽ sai.
Phương pháp ước lượng: Phương pháp hồi quy thông dụng với dữ liệu bảng là mô hình hồi quy Pool (Pooled OLS Regression Model), mô hình tác động cố định (Fixed Effects Regression Model – FEM) và mô hình tác động ngẫu nhiên (Random Effects Regression Model – REM).
Mô hình hồi quy Pool được biểu diễn như sau:
LLP = β0 + β1EBTP + β2LLP + β3NPL + β4SIGN + β5SIZE + β6MCAP + β7POST + β8EBTP*MCAP + β9MCAP*SIGN + β10MCAP*EBTP*SIGN + β11SIGN*EBTP+ ɛ
Trong mô hình này yếu tố thời gian và đặc tính của các biến thu thập không được xem xét đến. Tuy nhiên trên thực tế có rất nhiều đặc điểm giữa các ngân hàng khác nhau thay đổi theo thời gian. Do đó mô hình hồi quy Pool ít được tin cậy trong nghiên cứu dữ liệu bảng. Để khắc phục nhược điểm của mô hình Pool bài nghiên cứu sử dụng mô hình FEM và REM.
Mô hình các ảnh hưởng cố định (Fixed Effects Regression Model – FEM):
Với giả định mỗi đơn vị đều có những đặc điểm riêng biệt có thể ảnh hưởng đến các biến giải thích, mô hình FEM cho rằng tất cả các biến nghiên cứu đều không thay đổi theo thời gian. Mô hình các ảnh hưởng cố định thể hiện qua phương trình bên dưới giả định rằng các hệ số độ dốc của các biến độc lập không thay đổi theo thời gian. Kiểm soát và loại trừ ảnh hưởng của các đặc điểm riêng biệt (không đổi theo thời gian) ra khỏi các biến giải thích để ước lượng những ảnh hưởng thực của biến giải thích lên biến phụ thuộc. Mô hình này được biểu diễn như sau:
LLPi,t = β0 + β1EBTPi,t + β2LLPi,t-1 + β3NPLi,t + β4SIGNi,t + β5SIZEi,t + β6MCAPi,t + β7POSTj + β8EBTP*MCAPi,t + β9MCAP*SIGNi,t + β10MCAP*EBTP*SIGNi,t + β11SIGN*EBTPi,t + ɛi,t
Trong đó I đại diện cho ngân hàng, i=1, 2, 3…23; t đại diện cho thời gian.
Mô hình ảnh hưởng ngẫu nhiên (Rvàom Effects Regression Model – REM):
Điểm khác biệt giữa mô hình REM và mô hình FEM được thể hiện ở sự biến động giữa các đơn vị. Lập luận nền tảng cho mô hình này là khi xác định qui cách mô
hình không thể bao gồm những biến giải thích phù hợp mà không thay đổi theo thời gian và có những biến thay đổi theo thời gian nhưng có cùng giá trị đối với tất cả các đơn vị theo không gian. Nếu sự biến động giữa các đơn vị theo thời gian có tương quan đến biến độc lập thì một biến giả đại diện tiêu biểu cho biến giải thích trong mô hình ảnh hưởng ngẫu nhiên. Chính vì vậy, nếu sự khác biệt giữa các đơn vị có ảnh hưởng đến biến phụ thuộc thì mô hình ảnh hưởng ngẫu nhiên sẽ thích hợp hơn so với FEM. Trong đó, phần dư của mỗi thực thể (không tương quan với biến giải thích) được xem là một biến giải thích mới. Ý tưởng cơ bản của mô hình REM cũng bắt đầu từ mô hình:
LLPi,t = β0 + β1EBTPi,t + β2LLPi,t-1 + β3NPLi,t + β4SIGNi,t + β5SIZEi,t + β6MCAPi,t + β7POSTj + β8EBTP*MCAPi,t + β9MCAP*SIGNi,t + β10MCAP*EBTP*SIGNi,t + β11SIGN*EBTPi,t + ɛi,t
Trong đó tung độ góc ở mô hình được biểu diễn:
β1i = β1+ εi, với i=1, 2….N và ε là sai số ngẫu nhiên wit = μit + εi với i =1,2,…23, t đại diện cho thời gian
Kiểm định sự phù hợp của mô hình: mô hình FEM hay REM không có sự khác biệt lớn. Để chọn lựa giữa FEM và REM xem mô hình nào là phù hợp hơn, bài nghiên cứu sử dụng kiểm định Hausman được xây dựng vào năm 1978. Giả thiết không làm nền tảng cho kiểm định Hausman là các ước lượng FEM và REM không khác nhau đáng kể. Kiểm định Hausman xem xét có tồn tại tự tương quan giữa εi và các biến độc lập hay không. Giả thiết
Ho: εi và biến độc lập không tương quan H1: εi và biến độc lập có tương quan
Khi giá trị P_value <0.05 bác bỏ Ho, khi đó εi và biến độc lập tương quan với nhau sử dụng mô hình ảnh hưởng cố định (FEM) ngược lại sử dụng mô hình tác động ngẫu nhiên (REM).
Sau khi ước lượng được mô hình hồi quy, bài nghiên cứu tiến hành đánh giá độ phù hợp của mô hình hồi quy. Tiếp theo thực hiện một số kiểm định cơ bản nhầm xem xét có tồn tại các khuyết tật trong mô hình hay không.