PHÂN TÍCH VÀ DỰ BÁO BỘ DỮ LIỆU BANKING MARKETING

29 400 10
PHÂN TÍCH VÀ DỰ BÁO BỘ DỮ LIỆU BANKING MARKETING

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

CHƯƠNG I: MỞ ĐẦU 1 1.1. Chọn bộ dữ liệu: 1 1.2. Mô tả bộ dữ liệu: 1 1.2.1. Biến đầu vào (Input Variables): 1 1.2.2. Biến đầu ra (Output Variable): 6 1.3. Mục tiêu phân tích: 6 CHƯƠNG II: NỘI DUNG 6 2.1. Tiền xử lý bộ dữ liệu: 6 2.1.1. “Role” của các thuộc tính: 6 2.1.2. “Missing Value” trong bộ dữ liệu: 8 2.2. Khai thác bộ dữ liệu: 10 2.2.1. Phân cụm dữ liệu: 10 2.2.2. Trích xuất dữ liệu: 15 2.2.3. Phân lớp dữ liệu: 17 2.2.4. Dự báo: 21 TÀI LIỆU THAM KHẢO 22 CHƯƠNG I: MỞ ĐẦU 1.1. Chọn bộ dữ liệu: Dữ liệu “ Banking Marketing “ này liên quan đến các chiến dịch tiếp thị trực tiếp của một tổ chức ngân hàng tại Bồ Đào Nha. Các chiến dịch tiếp thị này sẽ được tính toán dựa trên các cuộc gọi điện thoại đã thực hiện. Thông thường, với một khách hàng thì sẽ có rất nhiều liên hệ, để truy cập và tìm hiểu xem họ có đăng ký (‘yes’) hay không đăng ký (‘no’) sản phẩm của ngân hàng hay không – sản phẩm ở đây chính là việc đăng ký chính sách tiền gửi có kỳ hạn. 1.2. Mô tả bộ dữ liệu: 1.2.1. Biến đầu vào (Input Variables): 1.2.1.1. Thuộc tính dữ liệu khách hàng (Bank Client Data): a) Độ tuổi (Age): - Được định dạng “Numeric”. - Thuộc tính này nhằm xác định độ tuổi của các đối tượng được thực hiện khảo sát. b) Nghề nghiệp (Job): - Được định dạng “Categorical”. - Thuộc tính này nhằm xác định nghề nghiệp của các đối tượng được thực hiện khảo sát. Trong đó, các loại nghề nghiệp bao gồm: • Quản trị viên (Admin) • Công nhân phổ thông (Blue-collar) • Chủ doanh nghiệp (Entrepreneur) • Người giúp việc nhà (Housemaid) • Nhà quản lý (Management) • Tự do (Self-employed) • Dịch vụ (Services) • Học sinh (Student) • Kỹ thuật viên (Technician) • Đã nghỉ hưu (Retired) • Thất nghiệp (Unemployed) • Chưa xác định (Unknown)

Ngày đăng: 22/11/2021, 19:00

Hình ảnh liên quan

Hình 2.1.1.a: Type và Role của các thuộc tính - PHÂN TÍCH VÀ DỰ BÁO BỘ DỮ LIỆU BANKING MARKETING

Hình 2.1.1.a.

Type và Role của các thuộc tính Xem tại trang 10 của tài liệu.
• Hình 2.1.2.a: Chuỗi thực hiện tiền xử lý dữ liệu trên Orange - PHÂN TÍCH VÀ DỰ BÁO BỘ DỮ LIỆU BANKING MARKETING

Hình 2.1.2.a.

Chuỗi thực hiện tiền xử lý dữ liệu trên Orange Xem tại trang 11 của tài liệu.
• Hình 2.1.1.c: Kết quả xử lý “Role” của các biến thuộc tính - PHÂN TÍCH VÀ DỰ BÁO BỘ DỮ LIỆU BANKING MARKETING

Hình 2.1.1.c.

Kết quả xử lý “Role” của các biến thuộc tính Xem tại trang 11 của tài liệu.
Hình 2.1.2.b: Qúa trình thực hiện Preprocess - PHÂN TÍCH VÀ DỰ BÁO BỘ DỮ LIỆU BANKING MARKETING

Hình 2.1.2.b.

Qúa trình thực hiện Preprocess Xem tại trang 12 của tài liệu.
Hình 2.1.2.c: Kết quả tiền xử lý dữ liệu - PHÂN TÍCH VÀ DỰ BÁO BỘ DỮ LIỆU BANKING MARKETING

Hình 2.1.2.c.

Kết quả tiền xử lý dữ liệu Xem tại trang 13 của tài liệu.
• Hình 2.2.1.a: Chuỗi thực hiện quá trình phân cụm trên Orange - PHÂN TÍCH VÀ DỰ BÁO BỘ DỮ LIỆU BANKING MARKETING

Hình 2.2.1.a.

Chuỗi thực hiện quá trình phân cụm trên Orange Xem tại trang 14 của tài liệu.
• Hình 2.2.1.b: Kết quả phân cụm phân cấp trên Orange - PHÂN TÍCH VÀ DỰ BÁO BỘ DỮ LIỆU BANKING MARKETING

Hình 2.2.1.b.

Kết quả phân cụm phân cấp trên Orange Xem tại trang 15 của tài liệu.
Hình 2.2.1.c,d,e: Bảng Silhouette Plot cho 2 phân cụm phân cấp - PHÂN TÍCH VÀ DỰ BÁO BỘ DỮ LIỆU BANKING MARKETING

Hình 2.2.1.c.

d,e: Bảng Silhouette Plot cho 2 phân cụm phân cấp Xem tại trang 17 của tài liệu.
Hình 2.2.1.f: Phân tích k-Means cho bộ dữ liệu - PHÂN TÍCH VÀ DỰ BÁO BỘ DỮ LIỆU BANKING MARKETING

Hình 2.2.1.f.

Phân tích k-Means cho bộ dữ liệu Xem tại trang 18 của tài liệu.
Hình 2.2.1.g,h,i: Bảng Silhouette Plot cho 2 phân cụm phân hoạch - PHÂN TÍCH VÀ DỰ BÁO BỘ DỮ LIỆU BANKING MARKETING

Hình 2.2.1.g.

h,i: Bảng Silhouette Plot cho 2 phân cụm phân hoạch Xem tại trang 20 của tài liệu.
• Hình 2.2.2.a: Trích xuất dữ liệu đã phân cụm - PHÂN TÍCH VÀ DỰ BÁO BỘ DỮ LIỆU BANKING MARKETING

Hình 2.2.2.a.

Trích xuất dữ liệu đã phân cụm Xem tại trang 22 của tài liệu.
Hình 2.2.2.b: Bảng dữ liệu excel khi đã phân cụm - PHÂN TÍCH VÀ DỰ BÁO BỘ DỮ LIỆU BANKING MARKETING

Hình 2.2.2.b.

Bảng dữ liệu excel khi đã phân cụm Xem tại trang 22 của tài liệu.
• Hình 2.2.3.a: Chuỗi quá trình thực hiện phân lớp trên Orange - PHÂN TÍCH VÀ DỰ BÁO BỘ DỮ LIỆU BANKING MARKETING

Hình 2.2.3.a.

Chuỗi quá trình thực hiện phân lớp trên Orange Xem tại trang 23 của tài liệu.
• Hình 2.2.3.b: Bảng đánh giá Text and Score - PHÂN TÍCH VÀ DỰ BÁO BỘ DỮ LIỆU BANKING MARKETING

Hình 2.2.3.b.

Bảng đánh giá Text and Score Xem tại trang 24 của tài liệu.
Hình 2.2.3.c,d,e: Ma trận nhầm lẫn của 3 phương pháp Logistic Regression, SVM và Tree - PHÂN TÍCH VÀ DỰ BÁO BỘ DỮ LIỆU BANKING MARKETING

Hình 2.2.3.c.

d,e: Ma trận nhầm lẫn của 3 phương pháp Logistic Regression, SVM và Tree Xem tại trang 26 của tài liệu.
• Hình 2.2.4.a: Kết quả dự báo dữ liệu - PHÂN TÍCH VÀ DỰ BÁO BỘ DỮ LIỆU BANKING MARKETING

Hình 2.2.4.a.

Kết quả dự báo dữ liệu Xem tại trang 28 của tài liệu.

Từ khóa liên quan

Mục lục

  • CHƯƠNG I: MỞ ĐẦU

    • 1.1. Chọn bộ dữ liệu:

    • 1.2. Mô tả bộ dữ liệu:

      • 1.2.1. Biến đầu vào (Input Variables):

      • 1.2.2. Biến đầu ra (Output Variable):

      • 1.3. Mục tiêu phân tích:

      • CHƯƠNG II: NỘI DUNG

        • 2.1. Tiền xử lý bộ dữ liệu:

          • 2.1.1. “Role” của các thuộc tính:

          • 2.1.2. “Missing Value” trong bộ dữ liệu:

          • 2.2. Khai thác bộ dữ liệu:

            • 2.2.1. Phân cụm dữ liệu:

            • 2.2.2. Trích xuất dữ liệu:

            • 2.2.3. Phân lớp dữ liệu:

            • 2.2.4. Dự báo:

            • TÀI LIỆU THAM KHẢO

Tài liệu cùng người dùng

Tài liệu liên quan