Quy trình phân lớp

Một phần của tài liệu (LUẬN văn THẠC sĩ) khai thác và phân tích dữ liệu nhằm quản lý rủi ro trong giao dịch tín dụng (Trang 37 - 39)

2.5.2.2. Phân lớp Naive Bayes là gì?

Naive Bayes là một kỹ thuật phân loại thống kê dựa trên Định lý Bayes. Đây là một trong những thuật tốn học được giám sát đơn giản nhất. Phân lớp Naive Bayes là thuật tốn nhanh, chính xác và đáng tin cậy. Các bộ phân lớp Naive Bayes cĩ độ chính xác và tốc độ cao trên các bộ dữ liệu lớn.

Phân lớp Naive Bayes giả định rằng hiệu ứng của một tính năng cụ thể trong một lớp là độc lập với các tính năng khác. Ví dụ, một người xin vay cĩ mong muốn hay khơng tùy thuộc vào thu nhập của anh ấy/cơ ấy, lịch sử giao dịch và khoản vay trước đĩ, tuổi và địa điểm. Ngay cả khi các tính năng này phụ thuộc lẫn nhau, các tính năng này vẫn được xem xét độc lập. Giả định này đơn giản hĩa tính tốn, và đĩ là lý do tại sao nĩ được coi là ngây thơ. Giả định này được gọi là độc lập cĩ điều kiện phân cấp.

( ) ( ) ( ) ( )

 P (h): xác suất của giả thuyết h là đúng (bất kể dữ liệu). Điều này được gọi là xác suất trước của h.

 P (D): xác suất của dữ liệu (bất kể giả thuyết). Điều này được gọi là xác suất trước.

 P (h | D): xác suất của giả thuyết h đưa ra dữ liệu D. Điều này được gọi là xác suất sau.

 P (D | h): xác suất của dữ liệu d cho rằng giả thuyết h là đúng. Điều này được gọi là xác suất sau.

2.5.2.3. Hoạt động của phân lớp Naive Bayes

Chúng ta hãy hiểu hoạt động của Naive Bayes qua một ví dụ. Cho một ví dụ về điều kiện thời tiết và chơi thể thao. Bạn cần tính xác suất chơi thể thao. Bây giờ, bạn cần phân loại xem người chơi sẽ chơi hay khơng, dựa trên điều kiện thời tiết.

Phân lớp Naive Bayes tính tốn xác suất của một sự kiện theo các bước sau:

 Bước 1: Tính xác suất trước cho các nhãn lớp đã cho

 Bước 2: Tìm xác suất khả năng với từng thuộc tính cho mỗi lớp

 Bước 3: Đặt các giá trị này vào Cơng thức Bayes và tính xác suất sau.

 Bước 4: Xem lớp nào cĩ xác suất cao hơn, với đầu vào thuộc về lớp xác suất cao hơn.

CHƢƠNG 3: THỰC NGHIỆM TRÊN DỮ LIỆU VIETINBANK 3.1. Khảo sát hoạt động tín dụng của hệ thống Vietinbank 3.1. Khảo sát hoạt động tín dụng của hệ thống Vietinbank

Tổng quan hoạt động tín dụng của Vietinbank

3.1.1.

Tổng dư nợ của VietinBank cĩ sự tăng trưởng mạnh mẽ giai đoạn 2012 – 2017, năm 2012 giá trị này mới ở mức 333,356 tỷ đồng, đến năm 2017 giá trị này đã đạt mức 790,688 tỷ đồng, tăng gấp 2,3 lần năm 2012. Cụ thể, tình hình tăng trưởng dư nợ của VietinBank như sau [5]:

Một phần của tài liệu (LUẬN văn THẠC sĩ) khai thác và phân tích dữ liệu nhằm quản lý rủi ro trong giao dịch tín dụng (Trang 37 - 39)

Tải bản đầy đủ (PDF)

(68 trang)