Ma trận nhầm lẫn của thuậttoán C4.5

Một phần của tài liệu Dự đoán khả năng gửi tiền của khách hàng cá nhân qua telemarketing tại NH với thuật toán phân lớp naive bayes và c4 5 072 (Trang 79 - 82)

- Có 1154 bản ghi thuộc lớp KHONG mà bộ phân lớp phân đúng giá trị KHONG

- Có 47 bản ghi thuộclớp CO mà bộ phân lớp phân đúng giá trị CÓ

- Có 94 bản ghi thuôclớp CO mà bộ phân lớp phân sai thành giá trị thuộclớp KHONG

- Có 61 bản ghi thuôclớp KHONG mà bộ phân lớp phân sai thành giá trịthuộc lớp CO

- Độ đo chính xác Accuracy: 88.57% (Tỷ lệ các mẫu được phân lớp đúngtrên toàn bộ tập mẫu)

- Độ hồi tưởng Class recall của lớp KHONG là 94.98% (Tỷ lệ các mẫu phân lớp KHONG đúng trên toàn bộ các mẫu thực sự thuộc phân lớp KHONG), độ hồi tưởng recall của lớp CO là 33.33% (Tỷ lệ các mẫu phân lớp CO đúng trên toàn bộ các mẫu thực sự thuộc phân lớp CO)

- Độ hiệu dụng Precision của lớp KHONG là 92.47% (Tỷ lệ các mẫu phân lớp KHONG đúng trên toàn bộ các mẫu dự đoán phân lớp KHONG), độ hiệu dụng Precision của lớp CO là 43.52% (Tỷ lệ các mẫu phân lớp CO đúng trên toàn bộ các mẫu dự đoán phân lớp CO)

Các luật của cây quyết định

T HO NHAN D THAN KHONG {KHONG=6,

T HO NHAN K HON: CO {KHONG=3, CO=3}

T

T HON NHAN = LY DI:CO {KHONG=1, CO=2}

H V = DAI HOC

Khóa luận tốt nghiệp

Cây quyết định

Hình 21. Cây quyết định của thuật toán C4.5 trên RapidMiner

Một số luật đáng chú ý được rút ra từ kết quả thuật toán như sau:

- Nếu “Thời gian liên lạc cuộc gọi cuối ít” “Kết quả chiến dịch trước không rõ hoặc thất bại” thì “KH không gửi tiền”

- Nếu “Thời gian liên lạc cuộc gọi cuối ít” “Kết quả chiến dịch trước thành công”

“Học vấn THPT” và “Số dư cao” thì “KH gửi tiền”

- Nếu “Thời gian liên lạc cuộc gọi cuối ít” “Kết quả chiến dịch trước thành công”

“Học vấn THPT” và “Số dư trung bình” thì “KH gửi tiền”

- Nếu “Thời gian liên lạc cuộc gọi cuối ít” “Kết quả chiến dịch trước thành công”

“Học vấn THPT” và “Số dư trung thấp” “Tình trạng hôn nhân = Kết hôn” thì “KH không gửi tiền”

- Nếu “Thời gian liên lạc cuộc gọi cuối ít” “Kết quả chiến dịch trước thành công”

“Học vấn Đại học” “Tình trạng hôn nhân độc thân” thì “KH gửi tiền”

- Nếu “Thời gian liên lạc cuộc gọi cuối ít” “Kết quả chiến dịch trước thành công”

“Học vấn Đại học” “Tình trạng hôn nhân kết hôn” “Số dư thấp hoặc trung bình” thì

“KH không gửi tiền”

- Nếu “Thời gian liên lạc cuộc gọi cuối ít” “Kết quả chiến dịch trước thành công”

“Học vấn Đại học” “Tình trạng hôn nhân kết hôn” “Số dư cao” “Số lần liên lạc trung bình” thì “KH gửi tiền”

- Nếu “Thời gian liên lạc cuộc gọi cuối nhiều” thì “KH gửi tiền”

- Nếu “Thời gian liên lạc cuộc gọi cuối ít” “Kết quả chiến dịch trước khác” “Số dư trung bình” thì “KH gửi tiền”

Nguyễn Thị Hương - 19A4040076 Page | 59

Tree

TG LLC = IT

| KQCD TRUOC = KHAC

| | SO DU = CAO

| | SO DU = THAP

| | | NHA = CO: KHONG {KHONG=13, CO=0}

| | | NHA = KHONG

| | | | SLLH = IT

| | | | | HOC VAN = DAI HOC: KHONG {KHONG=3, CO=1}

| | | | | HOC VAN = THPT: CO {KHONG=1, CO=2}

| | | | SLLH = TB: KHONG {KHONG=2, CO=0}

| | SO DU = TRUNG BINH: CO {KHONG=0, CO=7}

| KQCD TRUOC = KHONG RO: KHONG {KHONG=771, CO=83}

| T H NHAN = THAN: CO {KHONG=2, CO=5}

| T H NHAN = HON

| | S DU = CAO

| | | SL = KHONG {KHONG=1, CO=1}

| | | SL

LH = TB: CO {KHONG=0, CO=3}

| | S DU = THAP CO {KHONG=0, CO=7}

| | S DU = TRUN BINH: CO {KHONG=0, CO=3}

| T H NHAN = LY DI: KHONG {KHONG=1, CO=1}

H V = KHON RO: {KHONG=0, CO=5}

H

O VA THCS: KHONG {KHONG=3, CO=0}

H V THPT

| S D = CO {KHONG=0, CO=10}

| S D =

| | T HON NHAN DOC THAN: CO {KHONG=0, CO=2}

| | T

T HON NHAN = KET HON: KHONG {KHONG=2, CO=0}

| | T HON NHAN LY DI: CO {KHONG=0, CO=2}

| S

TG LLC = TRUNG BINH: KHONG {KHONG=218, CO=205}

3.4.2. Thuật toán Naive Bayes

Chạy thuật toán Naive Bayes với bộ dữ liệu truyền vào, chúng ta thu được ma trận nhầm lẫn (Confusion Matrix) như sau

Một phần của tài liệu Dự đoán khả năng gửi tiền của khách hàng cá nhân qua telemarketing tại NH với thuật toán phân lớp naive bayes và c4 5 072 (Trang 79 - 82)

Tải bản đầy đủ (DOCX)

(92 trang)
w