2.5.1 Ƣu điểm
Liên tục trong nhiều năm qua, cây quyết định được bình chọn là giải thuật được sử dụng nhiều nhất và thành công nhất trong việc giải quyết các vấn đề về phân loại và hồi quy, làm việc với cả dữ liệu số và được ứng dụng trong nhiều lĩnh vực.
Hình 2. 5 Tỷ lệ thuật toán được người dùng bình chọn.
Cây quyết định có khả năng sinh ra các quy tắc có thể chuyển đổi được sang dạng if..then..else hoặc các câu lệnh SQL. Đây là ưu điểm nổi bật của kĩ thuật này. Sự giải thích cho bất cứ một sự phân lớp hay dự đoán nào đều tương đối minh bạch
Khả năng xử lý với cả thuộc tính liên tục và thuộc tính phân loại: trên cây quyết định mỗi nhãnh tương ứng với từng phân tập dữ liệu theo giá trị của thuộc tính được chọn để phát triển tại nút đó. Các thuộc tính liên tục cũng dễ dàng phân chia bằng việc chọn ra một số gọi là ngưỡng trong tập các giá trị đã sắp xếp của thuộc tính đó.
Thể hiện rõ ràng những thuộc tính tốt nhất: các thuật toán xây dựng cây quyết định đưa ra thuộc tính mà phân chia tốt nhất tập dữ liệu huấn luyện bắt đầu từ nút gốc của cây, từ đó có thể thấy những thuộc tính nào là quan trọng nhất cho việc dự đoán hay phân lớp.
Sinh viên thực hiện: Nguyễn Thu Hương - Lớp HTTTA – K11 Trang 21 / 61
2.5.2 Nhƣợc điểm
Mặc dù có những sức mạnh nổi bật trên, cây quyết định vẫn không tránh khỏi có những điểm yếu. Đó là cây quyết định không thích hợp lắm cho những bài toán với mục tiêu là dự đoán giá trị của thuộc tính liên tục như thu nhập, huyết áp hay lãi suất ngân hàng, … Cây quyết định cũng khó giải quyết với những dữ liệu thời gian liên tục nếu không bỏ ra nhiều công sức cho việc biểu diễn dữ liệu theo các mẫu liên tục.
Như vậy, từ những ưu điểm và nhược điểm trên cho thấy cây quyết định phù hợp với việc xếp hạng tín dụng nội bộ ngân hàng như sau:
Tốc độ tạo ra tri thức tương đối nhanh so với các phương pháp phân loại khác.
Có thể hoán chuyển được thành những luật phân lớp đơn giản và dễ hiểu.
Tri thức được rút ra trong kỹ thuật này thường được mô tả dưới dạng tường minh, đơn giản, trực quan, dễ hiểu đối với người sử dụng.
Có nhiều kĩ thuật khác có thể hiệu quả hoặc chính xác hơn rất nhiều, nhưng mà chi phí bỏ ra lớn hơn cái lợi nhuận thu về từ tri thức có được.
2.6 Ví dụ minh họa xây dựng cây quyết định
David là quản lý của một câu lạc bộ đánh golf nổi tiếng. Anh ta đang có rắc rối chuyện các thành viên đến hay không đến. Có ngày ai cũng muốn chơi golf nhưng số nhân viên câu lạc bộ lại không đủ phục vụ. Có hôm, không hiểu vì lý do gì mà chẳng ai đến chơi, và câu lạc bộ lại thừa nhân viên. Mục tiêu của David là tối ưu hóa số nhân viên phục vụ mỗi ngày bằng cách dựa theo thông tin dự báo thời tiết để đoán xem khi nào người ta sẽ đến chơi golf. Để thực hiện điều đó, anh cần hiểu được tại sao khách hàng quyết định chơi và tìm hiểu xem có cách giải thích nào cho việc đó hay không. Vậy là trong hai tuần, anh ta thu thập thông tin về: Trời (outlook) (nắng (sunny), nhiều mây (clouded) hoặc mưa (raining). Nhiệt độ (temperature) bằng độ F, độ ẩm (humidity), gió mạnh (windy) hay không. Và tất nhiên là số người đến chơi golf vào hôm đó. David thu được một bộ dữ liệu gồm 14 dòng và 5 cột.
Sinh viên thực hiện: Nguyễn Thu Hương - Lớp HTTTA – K11 Trang 22 / 61
Thực hiện các bước để xây dựng nên cây quyết định cho bài toán trên:
Cơ sở dữ liệu trên có 5 thuộc tính: OUTLOOK (thuộc tính rời rạc), TEMPERATURE (thuộc tính liên tục), HUMIDITY (thuộc tính liên tục), WINDY (thuộc tính rời rạc), PLAY (lớp)
PLAY(5 Play, 9 Don’t Play).
OUTLOOK: 5 sunny (3 Don’t Play, 2 Play), 4 overcast (4 Play), 5 rain (2 Don’t Play, 3 Play), TEMPERATURE, HUMIDITY, WINDY.
E(PLAY) = E(5 Play,9 Don’t Play) = - (5/14 log2 5/14 + 9/14 log29/14) = 0.94.
E(OUTLOOK) = 5/14 E(Sunny) + 4/14E(Overcast) + 5/14E(rain) = 5/14 (3/5 log23/5 + 2/5 log22/5) + 4/14 (4/4 log24/4 + 0) + 5/14 (2/5 log22/5 + 3/5 log23/5) = 0.69.
E(TEMPERATURE) Với ngưỡng σ là 70.5.
E(TEMPERATURE) = 4/14 E( < 70.5) + 10/14 E(≥70.5) = 4/14 (1/3 log2 1/3 + 2/3 log22/3) + 10/14 (4/10 log2 4/10 + 6/10 log26/10) = 0.92.
E(HUMIDITY) Với ngưỡng σ là 77.5
E(HUMIDITY) = 9/14E (≥77.5) + 5/14E(<77.5) = 0.89.
E(WINDY) = 8/14E(False) + 6/14 E(True) = 0.89. Suy ra, ta có G(PLAY, OUTLOOK) là Max.
Sinh viên thực hiện: Nguyễn Thu Hương - Lớp HTTTA – K11 Trang 23 / 61
Khi đó, ta sẽ được một phần của cây quyết định như sau :
OUTLOOK
Yes
Overcast Sunny Rain
Hình 2. 6 Xây dựng cây quyết định cho bài toán Play Golf
E(TEMPERATURE) = 1/5E(<70.5) + 4/5E(≥70.5) = 0.736.
E(HUMIDITY) = 2/5E(<77.5) + 3/5E(≥77.5) = 0.
E(WINDY) = 2/5E(True) + 3/5E(False) = 0.952.
G(OUTLOOK, HUMIDITY) là Max. Ta được cây như sau :
OUTLOOK
Yes
Overcast Sunny Rain
HUMIDITY
< 77.5 >= 77.5
Yes No
Hình 2. 7 dựng cây quyết định cho bài toán Play Golf
E(TEMPERATURE) = 3/5E(<70.5) + 2/5E(≥70.5) = 0.952.
E(HUMIDITY) = 4/5E( ≥77.5) + 1/5E(<77.5) = 0.648.
E(WINDY) = 3/5E(False) + 2/5E(True) = 0.
G(OUTLOOK, WINDY) là Max.
Sinh viên thực hiện: Nguyễn Thu Hương - Lớp HTTTA – K11 Trang 24 / 61
OUTLOOK
Yes
Overcast Sunny Rain
HUMIDITY < 77.5 >= 77.5 Yes No WINDY No Yes False True
Hình 2. 8 Xây dựng cây quyết định cho bài toán Play Golf
Nhận xét
Cây quyết định trên phân loại theo các giá trị của biến Outlook, ta có ba nhóm khác nhau: Nhóm người chơi golf khi trời nắng, nhóm chơi khi trời nhiều mây và nhóm chơi khi trời mưa.
Kết luận thứ nhất: nếu trời nhiều mây, người ta luôn luôn chơi golf và có một số người ham mê đến mức chơi golf cả khi trời mưa.
Tiếp theo, ta lại chia nhóm trời nắng thành hai nhóm con. Ta thấy rằng khách hàng không muốn chơi golf nếu độ ẩm lên quá 77.5%.
Cuối cùng, ta chia nhóm trời mưa thành hai và thấy rằng khách hàng sẽ không chơi golf nếu trời nhiều gió.
Và đây là lời giải ngắn gọn cho bài toán mô tả bởi cây quyết định, David cho phần lớn nhân viên nghỉ vào những ngày trời nắng và ẩm, hoặc những ngày mưa gió vì hầu như sẽ chẳng có ai chơi golf trong những ngày đó. Vào những hôm khác, khi nhiều người sẽ đến chơi golf, anh ta có thể thuê thêm nhân viên thời vụ để phụ giúpcông việc.
Sinh viên thực hiện: Nguyễn Thu Hương - Lớp HTTTA – K11 Trang 25 / 61
CHƢƠNG 3
XẾP HẠNG TÍN DỤNG NỘI BỘ NGÂN HÀNG
Chương này trình bày những lý thuyết chung về xếp hạng tín dụng, các phương pháp xếp hạng tín dụng phổ biến. Đồng thời, cũng giới thiệu về Ngân hàng thương mại cổ phần Quân Đội và quy trình xếp hạng tín dụng tại ngân hàng này.
3.1 Tổng quan về xếp hạng tín dụng 3.1.1 Khái niệm về xếp hạng tín dụng 3.1.1 Khái niệm về xếp hạng tín dụng
Hệ thống xếp hạng tín dụng nội bộ được thực hiện theo quyết định số 493/2005/QĐ-NHNN ngày 24/04/2005 của thống đốc NHNN Việt Nam về Phân loại nợ, trích lập và sử dụng dự phòng để xử lý rủi ro tín dụng trong hoạt động của ngân hàng, tổ chức tín dụng và quyết định 18/2007/QĐ-NHNN ngày 25/04/2007 về việc sửa đổi, bổ sung một số điều của quyết định về phân loại nợ, trích lập dự phòng để xử lý rủi ro tín dụng. Hệ thống này là một cấu phần quan trọng trong hệ thống quản lý rủi ro tín dụng của ngân hàng, giúp đo lường và định dạng rủi ro tín dụng trong quá trình xét duyệt cho vay và quản lý khoản vay.
Xếp hạng tín dụng hay xếp hạng tín nhiệm là những ý kiến đánh giá về rủi ro tín dụng, và chất lượng tín dụng, thể hiện khả năng và thiện chí trả nợ (gốc, lãi hoặc cả hai) của đối tượng đi vay để đáp ứng các nghĩa vụ tài chính một cách đầy đủ và đúng hạn thông qua hệ thống xếp hạng theo kí hiệu [7].
3.1.2 Đối tƣợng của xếp hạng tín dụng
Đối tượng áp dụng là khách hàng doanh nghiệp, khách hàng cá nhân, các định chế tài chính hoạt động theo các bộ luật liên quan của nhà nước.
3.1.3 Tầm quan trọng của xếp hạng tín dụng
Hệ thống xếp hạng tín dụng nhằm cung cấp những dự đoán khả năng xảy ra rủi ro tín dụng. Khái niệm rủi ro được xét đến ở đây là một sự không chắc chắn hay một tình trạng bất ổn có thể ước đoán được xác suất xảy ra [8].
Khái niệm tín dụng được hiểu là quan hệ chuyển giao quyền sử dụng vốn lẫn nhau giữa người cho vay và người đi vay trên nguyên tắc có hoàn trả. Quan hệ tín dụng dựa trên nền tảng sự tin tưởng lẫn nhau giữa các chủ thể [8].
Khi rủi ro tín dụng ảnh hưởng đến hoạt động kinh doanh của ngân hàng thương mại sẽ gây tâm tý hoang mang lo sợ cho người gửi tiền và có thể những người gửi tiền sẽ ồ ạt rút tiền làm cho toàn bộ hệ thống ngân hàng gặp khó khăn. Sự hoảng loạn này ảnh hưởng rất lớn tới toàn bộ nền kinh tế, làm cho sức mua giảm sút, giá cả tăng, xã hội mất ổn định. Rủi ro tín dụng của NHTM trong nước cũng có ảnh hưởng đến nền kinh tế các nước liên quan do sự hội nhập đã gắn chặt mối liên hệ tiền tệ và đầu tư giữa các nước.
Ngân hàng thương mại gặp rủi ro tín dụng sẽ khó thu được vốn tín dụng đã cấp và lãi cho vay, nhưng ngân hàng phải trả vốn và lãi cho khoản tiền vốn huy động khi
Sinh viên thực hiện: Nguyễn Thu Hương - Lớp HTTTA – K11 Trang 26 / 61
lòng tin của người gửi tiền và ảnh hưởng lớn đến uy tín của ngân hàng.
Hệ thống xếp hạng tín dụng giúp NHTM quản trị rủi ro tín dụng bằng phương pháp tiên tiến, giúp kiểm soát độ tín nhiệm của khách hàng, thiết lập mức lãi suất cho vay phù hợp với dự báo khả năng thất bại của từng nhóm khách hàng. NHTM có thể đánh giá hiệu quả danh mục cho vay thông qua giám sát sự thay đổi sư nợ và phân loại nợ trong từng nhóm khách hàng đã được xếp hạng, qua đó điều chỉnh danh mục theo hướng ưu tiên nguồn lực vào những nhóm khách hàng an toàn.
3.1.4 Các nhân tố ảnh hƣởng đến công tác xếp hạng tín dụng a) Yêu cầu về nguồn thông tin
Việc duy trì thông tin tín dụng trong hệ thống ngân hàng cho vay là vô cùng quan trọng do thông tin tín dụng tạo lập cơ sở dữ liệu tập trung về khách hàng để phục vụ cho quá trình cấp tín dụng, phân tích và quản lý tín dụng, quản trị rủi ro tín dụng. Hệ thống thông tin tín dụng giúp tìm kiếm và phát hiện sớm các khoản tín dụng đồng thời tiên liệu trước khả năng một khoản tín dụng có thể chuyển sang nợ xấu.
Chất lượng thông tin được thể hiện qua 4 yếu tố sau:
Đầy đủ, kịp thời: Theo định kì hoặc khi có phát sinh mọi thông tin tín dụng về khách hàng phải được thu thập, ghi chép, và xử lý kịp thời để phản ánh chính xác mức độ rủi ro và năng lực của khách hàng trong việc thực hiện các nghĩa vụ với ngân hàng cho vay.
Trung thực, khách quan: thông tin tín dụng phải được thu thập từ các nguồn cung cấp có cơ sở pháp lý hoặc cơ sở thực tiễn để đảm bảo tính trung thực, khách quan. Thông tin có được từ các nguồn không hợp lệ chỉ được sử dụng để tham khảo.
Nhất quán: thông tin tín dụng phải được tập hợp theo dõi liên tục theo thời gian ít nhất cho tới khi khách hàng chấm dứt quan hệ với ngân hàng cho vay.
Bảo mật: thông tin tín dụng phải được lưu trữ quản lý theo chế độ bảo mật như tài sản riêng có của ngân hàng cho vay, sử dụng an toàn, bí mật, không gây ảnh hưởng đến nguồn cung cấp thông tin và không cung cấp cho bên thứ 3.
b) Đội ngũ chuyên gia có kinh nghiệm và năng lực chuyên môn
Xếp hạng tín dụng là một mô hình mới được áp dụng tại Việt Nam, các tiêu chí và quy trình đánh giá được đưa ra phụ thuộc rất lớn vào các chuyên gia có kinh nghiệm, khả năng phân tích và hiểu biết sâu sắc trong lĩnh vực tín dụng.
c) Trình độ hiện đại hóa công nghệ ngân hàng
Hệ thống công nghệ của ngân hàng phải đủ hiện đại có thể kết hợp phần mềm xếp hạng tín dụng và tạo thành một quy trình cho vay và kiểm soát tín dụng thống
Sinh viên thực hiện: Nguyễn Thu Hương - Lớp HTTTA – K11 Trang 27 / 61
nhất. Áp dụng công nghệ thông tin vào hệ thống xếp hạng tín dụng làm tăng chất lượng lưu trữ, cập nhật và đảm bảo tính bảo mật của thông tin. Công nghệ ngân hàng còn giúp cho hệ thống xếp hạng tín dụng thực hiện nhanh và chính xác hơn. Đây là vấn đề không thể thiếu khi ngân hàng muốn xây dựng được một hệ thống xếp hạng tín dụng hoàn chỉnh chuẩn xác hướng tới tiêu chuẩn quốc tế.
3.1.5 Phƣơng pháp xếp hạng tín dụng doanh nghiệp điển hình
Có hai phương pháp xếp hạng tín dụng doanh nghiệp điển hình trên thế giới là mô hình toán học [16] và phương pháp chuyên gia [16].
3.1.5.1 Phƣơng pháp mô hình toán học
Với việc tính toán các chỉ số Z, chỉ số Zeta phương pháp mô hình toán học dự đoán được nguy cơ phá sản cũng như mức độ rủi ro của doanh nghiệp
a. Chỉ số Z
Chỉ số Z được xây dựng bởi Edward I. Altman (1968), Đại Học New York, dựa vào việc nghiên cứu khá công phu trên số lượng lớn các công ty khác nhau tại Mỹ. Chỉ số Z là công cụ được cả hai giới học thuật và thực hành, công nhận và sử dụng rộng rãi nhất trên thế giới.
Chỉ số Z bao gồm 5 tỷ số X1, X2, X3, X4, X5: - X1= Vốn luân chuyển / Tổng tài sản. - X2= Lợi nhuận giữ lại / Tổng tài sản. - X3= EBIT / Tổng tài sản.
- X4= Giá thị trường của vốn cổ phần / Giá sổ sách của nợ. - X5= Doanh thu / Tổng tài sản
Z = 1.2X1 + 1.4X2 + 3.3X3 + 0.64X4 + 0.999X5
- Nếu Z > 2.99: Doanh nghiệp nằm trong vùng an toàn, chưa có nguy cơ phá sản.
- Nếu 1.8< Z < 2.99: Doanh nghiệp nằm trong vùng cảnh báo, có thể có nguy cơ phá sản.
- Nếu Z < 1.8: Doanh nghiệp nằm trong vùng nguy hiểm, nguy cơ phá sản cao.
b. Chỉ số Zeta
Zeta là một chỉ số được Altman cải tiến từ chỉ số Z, Zeta làm việc tốt với dữ liệu tài chính của các công ty sản xuất và cả bán lẻ với độ chính xác hơn 90% trước khi phá sản 1 năm và chính xác trên 70% từ năm thứ 5 trở đi trước khi phá sản.
Vì tính độc quyền của mô hình nên Altman không công bố một cách đầy đủ các trọng số của mô hình mà chỉ cung cấp 7 biến số mô hình sử dụng:
- X1 = EBIT / Tổng tài sản. - X2 = Mức ổn định thu nhập. - X3 = EBIT / Lãi vay.
Sinh viên thực hiện: Nguyễn Thu Hương - Lớp HTTTA – K11 Trang 28 / 61
- X5 = Tài sản lưu động / Tổng tài sản. - X6 = Vốn cổ phần thường / Tổng vốn. - X7 = Quy mô ( Tổng tài sản )
3.1.5.2 Phƣơng pháp chuyên gia
Hiện nay có một số phương pháp chuyên gia đang được áp dụng phổ biến là:
a. Phƣơng pháp xếp hạng tín nhiệm doanh nghiệp của Fitch
Fitch xếp hạng doanh nghiệp dựa trên phân tích định tính và phân tích định lượng.
Phân tích định tính gồm có phân tích rủi ro ngành, môi trường kinh doanh, vị thế
của doanh nghiệp trong ngành, năng lực của ban quản trị, phân tích kế toán:
- Rủi ro ngành: Fitch xếp hạng tín nhiệm các doanh nghiệp trong bối cảnh chung của ngành mà nó hoạt động. Những ngành tăng trưởng thấp, cạnh tranh ở mức cao, đòi hỏi vốn lớn, có tính chu kỳ hay không ổn định thì rủi ro vốn có sẽ lớn hơn các ngành ổn