Xử lý dữ liệu

Một phần của tài liệu (LUẬN văn THẠC sĩ) vận dụng mô hình logistic và neural network trong xếp hạng tín dụng doanh nghiệp tại ngân hàng TMCP công thương việt nam (Trang 46 - 51)

CHƢƠNG 1 : GIỚI THIỆU TỔNG QUAN NGHIÊN CỨU

4.1 Dữ liệu nghiên cứu

4.1.2 Xử lý dữ liệu

Luận văn lựa chọn 10 biến số tài chính dựa trên mơ hình nghiên cứu của Soureshjani và Kimiagari (2012). Nhìn chung những chỉ tiêu này có sự tương đồng so với bộ chỉ tiêu tính tốn được sử dụng trong quy trình chấm điểm XHTD khách hàng doanh nghiệp tại Ngân hàng TMCP Công Thương Việt Nam, đồng thời đây cũng là các biến được sử dụng phổ biến trong các nghiên cứu trước đây (Ahmadi và cộng sự, 2012; Smaranda, 2014; Angelini và cộng sự, 2008). Luận văn sử dụng các số liệu thu thập được để tính giá trị của các biến nghiên cứu. Cơng thức tính các biến được tóm tắt trong Bảng 4.1.

Bảng 4.1: Tóm tắt các biến độc lập trong mơ hình hồi quy Logistic

hiệu Tên biến Cơng thức tính Ý nghĩa

X1 Tỷ số thanh toán hiện thời

Tài sản ngắn hạn/ Nợ ngắn hạn

Đo lường khả năng thanh toán trong ngắn hạn của doanh nghiệp.

X2 Tỷ số thanh toán nhanh (Tài sản ngắn hạn – Hàng tồn kho)/ Nợ ngắn hạn

Đo lường khả năng huy động tài sản lưu động để thanh toán ngay các khoản nợ ngắn hạn của doanh nghiệp.

X3 Tỷ số nợ trên tổng tài sản

Nợ phải trả/Tổng tài sản

Thể hiện cơ cấu sử dụng đòn cân nợ và quy mơ tài chính của doanh nghiệp X4 Tỷ số nợ trên vốn chủ sở hữu Nợ phải trả/Vốn chủ sở hữu bình qn

Thể hiện cấu trúc tài chính của doanh nghiệp

X5 Vòng quay tổng tài sản

Doanh thu thuần /Tổng tài sản

Đánh giá hiệu quả sử dụng tài sản của doanh nghiệp X6 Vòng quay khoản phải thu Doanh thu thuần/Khoản phải thu bình quân

Thể hiện tốc độ biến đổi các khoản phải thu thành tiền mặt, là một thước đo để đánh giá hiệu quả hoạt động của doanh nghiệp

X7 Vòng quay

hàng tồn kho

Giá vốn/ Hàng tồn kho bình quân

Thể hiện hiệu quả trong quản trị ngân quỹ. Chỉ tiêu phản ánh hiệu quả của doanh nghiệp trong việc quản lý và bán hàng trong kho.

X8 Tỷ suất sinh lợi trên tài sản

Lợi nhuận sau thuế/ Tổng tài sản

Đánh giá hiệu quả trong khai thác và sử dụng tài sản

X9

Tỷ suất sinh lợi trên vốn chủ sở hữu

Lợi nhuận sau thuế/ Vốn chủ sở hữu bình quân

Đánh giá tính hiệu quả trong việc sử dụng vốn chủ sở hữu

X10

Tỷ suất sinh lợi trên doanh thu

Lợi nhuận sau thuế/ Doanh thu thuần

Đánh giá khả năng sinh lời của doanh nghiệp. Chỉ tiêu này phản ánh một đồng doanh thu mà doanh nghiệp thực hiện trong kỳ sẽ thu được bao nhiêu đồng lợi nhuận.

(Nguồn: Tác giả tự tổng hợp)

4.2 Phƣơng pháp nghiên cứu

Trong mơ hình dự báo tín dụng khách hàng, có thể xảy ra hai lỗi sau: dự báo một khách hàng xấu là khách hàng tốt (sai lầm loại 1) và ngược lại dự báo một khách hàng tốt là khách hàng xấu (sai lầm loại 2). Để đạt được mục tiêu dự báo khả năng trả được nợ của khách hàng nhằm xác định hạng rủi ro tương ứng, nghiên cứu

xây dựng và vận dụng đồng thời mơ hình Logistic và Neural Network để có thể tối thiểu hóa xác suất mắc hai sai lầm trên.

Dựa trên nghiên cứu của Soureshjani và Kimiagari (2012) về việc vận dụng mơ hình Logistic và Neural Network để tính tốn ngưỡng xác suất trong chấm điểm tín dụng khách hàng doanh nghiệp tại một NHTM, luận văn tiến hành xây dựng mơ hình hồi quy Logistic để xác định được các biến tài chính cần thiết có ảnh hưởng đến khả năng trả nợ, đồng thời sử dụng các biến số này để tính tốn xác suất vỡ nợ và xác định vùng an tồn tín dụng của một khách hàng vay, kiểm định mức độ phù hợp thơng qua mơ hình Neural Network. Mục tiêu của mơ hình là xác định ngưỡng xác suất tốt nhất hỗ trợ q trình xếp hạng, phê duyệt tín dụng khách hàng.

Xây dựng mơ hình Logistic

Mơ hình Logistic (Maddala, 1983) là mơ hình hồi quy mà trong đó biến phụ thuộc là biến giả. Mơ hình này được ứng dụng rộng rãi trong phân tích kinh tế nói chung và rủi ro tín dụng nói riêng. Cụ thể hơn, mơ hình giúp các TCTD xác định khả năng khách hàng có rủi ro tín dụng (biến phụ thuộc) trên cơ sở sử dụng các nhân tố tác động (biến độc lập).

Mơ hình Logistics có dạng tổng qt như sau:

{

[ ]

| | |

|

Xi là biến độc lập, thể hiện các nhân tố ảnh hưởng đến khách hàng, ví dụ như giới tính, thu thập, tình trạng nhà,… đối với khách hàng cá nhân, hoặc ROE, ROA, vốn chủ sở hữu,… đối với khách hàng doanh nghiệp. Biến phụ thuộc Y là biến nhị phân, nhận giá trị 0 – khơng có nợ xấu hoặc 1 – có nợ xấu, giá trị ước lượng của Y thu được khi hồi quy Y theo các biến độc lập.

Do là phi tuyến đối với X và các tham số , vì vậy khơng thể áp dụng trực tiếp phương pháp bình phương nhỏ nhất (OLS) để ước lượng, người ta dùng ước lượng hợp lý tối đa (maximum likelihood-ML) để ước lượng β. Hàm mục tiêu của phương pháp OLS là tối thiểu tổng bình phương phần dư cịn hàm mục tiêu của phương

pháp ML là tối đa xác suất quan sát được mẫu với thuộc tính cho trước. Do Y có phân bố nhị thức, chỉ nhận một trong hai giá trị 0 và 1, nên hàm hợp lý với mẫu kích thước n có dạng sau:

L = ∏

Trong mơ hình Logistic chúng ta khơng nghiên cứu ảnh hưởng trực tiếp của biến độc lập Xi đối với Y mà xem xét ảnh hưởng của Xi đến xác suất để Y nhận giá trị bằng 1 hay kỳ vọng của Y.

p =

(với exp là là hàm e mũ)

Bài nghiên cứu đưa ra phương trình hồi quy logit có dạng: Y = β0 + β1X1 + β2X2 + .. + β10X10 + ui (1)

Hay có thể viết lại (1) dưới dạng tổng quát như sau: Y = β0 + ∑

+ ui (2)

Kiểm định Wald Test các biến với mức ý nghĩa 5% để loại bỏ các biến khơng cần thiết hoặc có mức độ ảnh hưởng khơng đáng kể. Q trình kiểm định này được thực hiện bằng phần mềm Stata.

Biến phụ thuộc Y trong mơ hình là biến định tính dạng nhị phân (chỉ nhận 2 giá trị 0 và 1) nên mục tiêu của mơ hình là ước lượng xác suất để xảy ra Y=1 hoặc Y=0. Các biến độc lập Xi sẽ ảnh hưởng đến xác suất để Y nhận giá trị bằng 0 hoặc 1, xác xuất nhận được theo mơ hình logistic như sau:

p = ∑ ∑

Xây dựng mơ hình Neural Network

Mạng Neural Network (hay được gọi mạng thần kinh nhân tạo - Artificial Neural Network) là mô hình xử lý thơng tin được mơ phỏng dựa trên hoạt động của hệ thống thần kinh của sinh vật, giống như bộ não để xử lý thông tin, thực hiện một số nhiệm vụ nhận thức và tính tốn nhất định (Angelini và cộng sự, 2008). Những năm gần đây mơ hình Neural Network đã được nghiên cứu ứng dụng trong các ngành: điện, điện tử, kỹ thuật chế tạo, y học, quân sự và đặc biệt là trong dự báo

kinh tế. Mục đích của mơ hình là so sánh dữ liệu quá khứ với dữ liệu ước lượng trong quá khứ của mơ hình để từ đó thấy được xu hướng trong tương lai. Sau khi ước lượng từ những dữ liệu trong q khứ mơ hình sẽ cho ra kết quả tương lai dự kiến.

Theo Nguyễn Khắc Hiếu và Nguyễn Thị Vân Anh (2014), trong mạng thần kinh truyền thẳng, các neuron nhân tạo được sắp xếp thành 3 lớp: lớp vào, các lớp ẩn và lớp ra. Tại lớp ẩn, tín hiệu của lớp vào sẽ được xử lý bằng một hàm kích hoạt, thường là hàm Sigmoid f(x)= 1/(1+e-x) hoặc hàm Tan-hyperbolic f(x) = (ex

- e-x)/(ex + e-x) sau đó tín hiệu sẽ được truyền qua lớp ra thông qua bộ trọng số wjk.

Từ kết quả hồi quy mơ hình Logistic ta xác định được các biến số tài chính Xi có ảnh hưởng đến khả năng trả được nợ của khách hàng, đây chính là biến đầu vào của mơ hình Neural Network.

Xi

Hình 4.1: Mơ hình Neural Network dự báo xác suất khơng thanh tốn nợ

Quá trình huấn luyện mạng được thực hiện bằng phần mềm SPSS, tham khảo tài liệu IBM SPSS Neural Networks 21. Qua q trình hồi quy, mơ hình xác định được số lớp ẩn và trọng số của các biến đầu vào. Tiến hành kiểm định mức độ phù hợp của mơ hình bằng các cơng cụ ROC, đồng thời xác định vai trị của từng chỉ tiêu tài chính trong dự báo xác suất vỡ nợ của một khách hàng vay.

Mục tiêu của mơ hình nghiên cứu là tính tốn xác suất khơng trả được nợ của từng khách hàng đồng thời xác định được ngưỡng xác suất an toàn để hỗ trợ việc ra quyết định đồng ý hoặc từ chối cấp tín dụng. Tại giá trị ngưỡng xác suất, khả năng mắc sai lầm loại 1 và loại 2 là nhỏ nhất, nghĩa là tổng giá trị Specifity và Sensitivity đạt giá trị tối đa (Soureshjani và Kimiagari, 2012). Từ kết quả hồi quy của mơ hình, luận văn tiến hành tính tốn giá trị Specifity (phần trăm dự báo khách hàng trả nợ đúng hạn) và Sensitivity (phần trăm dự báo khách hàng có nợ quá hạn) tại các mức xác suất vỡ nợ khác nhau.

Bảng 4.2: Tính tốn giá trị Specifity và Sensitivity

Giá trị Y thực tế Giá trị dự báo Y Phần trăm dự báo đúng

Y=0 Y=1

Y=0 a b Specifity = a/(a+b)

Y=1 c d Sensitivity = d/(c+d)

Một phần của tài liệu (LUẬN văn THẠC sĩ) vận dụng mô hình logistic và neural network trong xếp hạng tín dụng doanh nghiệp tại ngân hàng TMCP công thương việt nam (Trang 46 - 51)

Tải bản đầy đủ (PDF)

(95 trang)