IV.1. Giới thiệu dataset bank marketing

Một phần của tài liệu Tìm hiểu khả năng phân lớp dữ liệu với WEKA (Trang 53)

Chương IV. Cài Đặt Và Thử Nghiệm

IV.1. Giới thiệu dataset bank marketing

2. Nguồn

Tác giả: Paulo Cortez (Univ. Minho) and Sérgio Moro (ISCTE-IUL) @ 2012 3. Thông tin liên quan:

Dữ liệu này liên quan đến chiến dịch marketing của một ngân hàng ở Bồ Đào Nha. Chiến dịch marketing được thực hiện trên cơ sở những cuộc gọi điện thoại.

Thường, hơn một liên lạc đến một khách hàng được chấp nhận

Mục đích của việc phân lớp là dự đoán một khách hàng có đồng ý gửi tiền hay không (biến y)

5. Number of Instances: 45211 for bank-full..arrf 6. Number of Attributes: 16 + output attribute. 7. Thông tin các thuộc tính:

Biến nhập vào: # dữ liệu khách hàng: 1 - age (numeric)

2 - job : kiểu nghề nghiệp (categorical:

"admin.","unknown","unemployed","management","housemaid","entrepreneur"," student", "blue-collar","self-employed","retired","technician","services")

3 - marital : tình trạng hôn nhân (categorical: "married","divorced","single"; note: "divorced" means divorced or widowed)

4 - education (categorical: "unknown","secondary","primary","tertiary") 5 - default: có thẻ tính dụng hay chưa?(binary: "yes","no")

6 - balance: thu nhập trung bình hàng năm bằng euros (numeric) 7 - housing: có vay thế chấp nhà không? (binary: "yes","no") 8 - loan: bản thân có vay không? (binary: "yes","no")

9 - contact: Kiểu liên hệ giao tiếp (categorical: "unknown","telephone","cellular")

10 - day: ngày liên hệ cuối cùng trong tháng (numeric)

11 - month: tháng liên hệ cuối cùng trong năm (categorical: "jan", "feb", "mar", ..., "nov", "dec")

12 - duration: thời gian liên hệ cuối cùng bằng giây (numeric) # Những thuộc tính khác:

13 – campaign: số lượng liên hệ được thực hiện trong suốt chiến dịch cho khách hàng này (numeric, includes last contact)

14 - pdays: number of days that passed by after the client was last contacted from a previous campaign (numeric, -1 means client was not previously contacted) 15 - previous: number of contacts performed before this campaign and for this client (numeric)

16 - poutcome: sự thành công của chiến dịch trước (categorical: "unknown","other","failure","success")

Biến xuất ra (mục đích cần đạt được):

17 - y – khách hàng có đồng ý gửi tiền hay không? (binary: "yes","no")

IV.2. Cách sử dụng Weka để phân lớp

Một phần của tài liệu Tìm hiểu khả năng phân lớp dữ liệu với WEKA (Trang 53)