6. Kết cấu của luận văn
3.1.3 Phương pháp xử lý số liệu
Sau khi thu thập xong số liệu cần thiết cho mơ hình, nghiên cứu tiến hành hiệu chỉnh và mã hóa các dữ liệu (tạo mã trong giai đoạn đầu tiên và điều chỉnh mã nếu có
phát hiện các sai sót, các ơ trống thiếu thơng tin, sai thơng tin, và tiến hành hoàn thiện ma trận dữ liệu (data matrix).
Ban đầu, nghiên cứu đã thu thập dữ liệu của 36 ngân hàng thương mại Việt Nam
trong khoảng thời gian từ năm 2006 đến năm 2012. Nhưng do có những nguyên nhân
khách quan như: một số ngân hàng thương mại mới được thành lập nên có số liệu khơng đầy đủ và trùng khớp với dòng thời gian 7 năm của mẫu nghiên cứu; đồng thời, một số ngân hàng thương mại chưa cập nhật thông tin kịp thời dẫn đến việc không hội tụ đầy đủ dữ liệu cần thiết cho mơ hình. Thêm vào đó, một vài ngân hàng dù cơng bố và
cập nhật số liệu tài chính trải dài qua các năm, nhưng lại phát sinh vấn đề là đơn vị tiền tệ được tính trong báo cáo tài chính lại khơng trùng khớp với đơn vị tiền tệ được lựa chọn trong mơ hình nghiên cứu (mơ hình lựa chọn Đồng Việt Nam (VND) làm đơn vị
tính). Hơn nữa, theo các quy định của pháp luật Việt Nam, một vài thương hiệu ngân hàng đã phải hủy niêm yết cổ phiếu, sáp nhập vào ngân hàng khác và biến mất khỏi thị
trường ngân hàng vào năm 2012. Do vậy, nghiên cứu đã loại dần ra các ngân hàng không phù hợp, và thống kê cuối cùng còn lại 32 ngân hàng thương mại Việt Nam
(danh sách các ngân hàng này được đính kèm trong phụ lục 30).
Như vậy, dữ liệu sau cùng được đưa vào sử dụng trong mơ hình và tiến hành
phân tích, kiểm định bằng phương pháp nghiên cứu hồi quy bé nhất OLS (Ordinary
Least Squares). Để đơn giản hóa mơ hình, nghiên cứu ban đầu đã bỏ qua yếu tố thời
gian và ngân hàng, tiến hành xây dựng và phân tích dữ liệu chuỗi thời gian và chéo gộp chung (Pooled Cross-sectional Analysis). Sau đó, để tăng tính hiệu quả khi hồi quy, nghiên cứu bổ sung phân tích theo phương pháp hiệu ứng cố định các biến thời gian và biến ngân hàng trong mơ hình ước lượng để tìm kiếm sự khác biệt (nếu có).