CHƯƠNG 1: GIỚI THIỆU BÀI TOÁN CHẤM ĐIỂM TÍN DỤNG ĐỐI TƯỢNG KHÁCH HÀNG CÁ NHÂN
1.4 Tổng quan các nghiên cứu về bài toán chấm điểm tín dụng khách hàng cá nhân
1.4.5 Mô hình mạng nơ-ron nhân tạo
Mạng nơ-ron nhân tạo là một mô hình xử lý thông tin được mô phỏng dựa
trên hoạt động của hệ thống thần kinh của sinh vật, bao gồm số lượng lớn các nơ- ron được gắn kết để xử lý thông tin.
Mạng nơ-ron nhân tạo hoạt động giống như bộ não của con người, được học bởi kinh nghiệm (thông qua việc huấn luyện), có khả năng lưu giữ các tri thức và sử dụng các tri thức đó trong việc dự đoán các dữ liệu chưa biết. Một mạng nơ-ron là một nhóm các nút nối với nhau, mô phỏng mạng nơ-ron thần kinh của não người.
Mạng nơ-ron nhân tạo được thể hiện thông qua ba thành phần cơ bản: mô hình
của nơ-ron, cấu trúc và sự liên kết giữa các nơ-ron. Trong nhiều trường hợp, mạng nơ-ron nhân tạo là một hệ thống thích ứng, tự thay đổi cấu trúc của mình dựa trên các thông tin bên ngoài hay bên trong chạy qua mạng trong quá trình học.
Hình 1-6 Kiến trúc chung của mạng rơ-ron [14]
31
Kiến trúc chung của một mạng nơ-ron nhân tạo gồm 3 thành phần: Lớp đầu vào, Lớp ẩn và Lớp đầu ra. Trong đó, lớp ẩn gồm các nơ-ron, nhận dữ liệu đầu vào từ các nơ-ron ở lớp trước đó và chuyển đổi các giá trị đầu vào này cho các lớp xử lý tiếp theo. Một mạng nơ-ron nhân tạo có thể có nhiều lớp ẩn.
Hình 1-7 Mô hình mạng nơ-ron [14]
Thông tin đầu vào: Mỗi giá trị trong mảng đầu vào tương ứng với 1 đặc trưng
của dữ liệu.
Trong mô hình chấm điểm tín dụng của ngân hàng đánh giá khả năng trả nợ của khách hàng khi đi vay, mảng các thông tin đầu vào bao gồm giá trị các thuộc tính của khách hàng như thu nhập, nghề nghiệp, tuổi, số người phụ thuộc, v.v.
Kết quả đầu ra: Kết quả của một mạng nơ-ron nhân tạo là một giải pháp cho
một vấn đề. Ví dụ như với bài toán chấm điểm rủi tín dụng ở trên, kết quả đầu ra có thể là “Vỡ nợ” hoặc “Không vỡ nợ”; hoặc một giá trị xác suất đặc trưng cho khả năng vỡ nợ (không hoàn trả khoản vay) của khách hàng.
32
Trọng số liên kết: Đây là thành phần rất quan trọng của một mạng nơ-ron
nhân tạo, nó thể hiện mức độ quan trọng, độ mạnh của dữ liệu đầu vào đối với quá trình xử lý thông tin chuyển đổi dữ liệu từ lớp này sang lớp khác. Quá trình học của mạng thực ra là quá trình điều chỉnh các trọng số liên kết của các dữ liệu đầu vào qua các lớp để có được kết quả mong muốn.
Hàm tổng: Tính tổng trọng số của tất cả các thông tin được đưa vào mỗi nơ-
ron.
𝑆 = ∑ 𝑤𝑖𝑥𝑖
𝑘
𝑖=1
(1.6)
Hàm kích hoạt: Hàm kích hoạt của một nơ-ron đại diện khả năng kích hoạt
của nơ-ron đó, còn gọi là kích hoạt bên trong. Các nơ-ron này có thể sinh ra một giá trị đầu ra hoặc không trong mạng nơ-ron nhân tạo; nói cách khác, một nơ-ron có thể truyền tín hiệu đến lớp tiếp theo trong mạng hoặc không. Mối quan hệ giữa hàm tổng và kết quả đầu ra của mỗi nơ-ron được thể hiện bằng hàm kích hoạt. Giá trị đầu ra của mỗi nơ-ron có thể biểu diễn theo công thức toán học sau:
𝑦 = 𝑓 (∑ 𝑤𝑖𝑥𝑖
𝑘
𝑖=1
− 𝜃) (1.7)
Tùy vào từng bài toán, hàm chuyển đổi có thể là các hàm dưới đây:
▪ Hàm ngưỡng (Hardlim):
33
𝜑(𝑥) = {1∀𝑥 ≥ 0
0∀𝑥 < 0
Hình 1-8 Đồ thị hàm ngưỡng
▪ Hàm ReLU (Rectified Linear Unit):
𝜑(𝑥) = {0∀𝑥 < 0
𝑥∀𝑥 ≥ 0
Hình 1-9 Đồ thị hàm ReLU
▪ Hàm sigmoid:
𝜑(𝑥) = 1
1 + 𝑒−𝑥
Hình 1-10 Đồ thị hàm sigmoid
34
▪ Hàm tanh
𝜑(𝑥) = 1 − 𝑒−2𝑥
1 + 𝑒−2𝑥
Hình 1-11 Đồ thị hàm tanh
Mạng nơ-ron nhân tạo là một thuật toán phân lớp mạnh được lấy cảm hứng từ khả năng xử lí và tiếp nhận thông tin của bộ não con người. Với khả năng xác định những mối quan hệ phi tuyến phức tạp giữa thông tin đầu vào và kết quả đầu ra, mạng nơ-ron nhân tạo được ứng dụng vào nhiều lĩnh vực khác nhau [14].