Quy trình phân lớp xây dựng mơ hình

Một phần của tài liệu (LUẬN văn THẠC sĩ) khai thác và phân tích dữ liệu nhằm quản lý rủi ro trong giao dịch tín dụng (Trang 29 - 31)

CHƢƠNG 2 : BÀI TỐN PHÂN LỚP DỰ BÁO RỦI RO TÍN DỤNG

2.3. Quy trình phân lớp xây dựng mơ hình

Để cĩ thể xây dựng được mơ hình như yêu cầu bài tốn ở mục 2.3 ta phải thực hiện thứ tự theo các bước như sau [14]:

a. Xây dựng mơ hình từ tập huấn luyện – Training data

Hình 2.4.1: Quy trình huấn luyện - training

Quá trình phân lớp thực hiện nhiệm vụ xây dựng mơ hình các cơng cụ phân lớp giúp cho việc gán nhãn phân loại cho các dữ liệu.

Example:

Nhãn “An tồn” hoặc “Rủi ro” cho các yêu cầu vay vốn; “Cĩ” hoặc “Khơng” cho các thơng tin thị trường….

 Các Nhãn dùng phân loại được biểu diễn bằng các giá trị rời rạc trong đĩ việc sắp xếp trùng là khơng cĩ ý nghĩa.

Phân lớp dữ liệu gồm hai quá trình.

 Cơng cụ phân lớp sẽ được xây dựng để xem xét nguồn data. Đây là quá trình học, qua đĩ một thuật tốn phân lớp được xây dựng bằng cách phân tích từ tập dữ liệu huấn luyện được xây dựng sẵn bao gồm nhiều bộ dữ liệu.

 Một bộ dữ liệu X biểu diễn bằng một vector n chiều, X = (x1, x2, …, xn), đây là các giá trị cụ thể của một tập n thuộc tính của nguồn dữ liệu {A1, A2, …, An}. Mỗi bộ được giả sử rằng nĩ thuộc về một lớp được định nghĩa trước với các nhãn xác định.

Classification algorithm

IF age=young THEN loan_decicion=risky IF income=high THEN loan_decicion=safe

IF age=middle AND income=low THEN loan_decicion=risky

Chạy thuật tốn

Xây dựng rules

b. Đánh giá mơ hình bằng tập kiểm kiểm thử - Data test

Hình 2.4.2: Quy trình test dữ liệu c. Áp dụng mơ hình để dự đốn dữ liệu mới c. Áp dụng mơ hình để dự đốn dữ liệu mới

Hình 2.4.3: Quy trình áp dụng mơ hình

Một phần của tài liệu (LUẬN văn THẠC sĩ) khai thác và phân tích dữ liệu nhằm quản lý rủi ro trong giao dịch tín dụng (Trang 29 - 31)

Tải bản đầy đủ (PDF)

(68 trang)