Chương 2 đã trình bày các kiến thức cơ bản về các phương pháp khai phá dữ liệu nhằm tiếp cận để giải quyết các bài tốn phân tích dữ liệu viễn thơng. Tiếp thu các nghiên cứu đã cĩ, luận văn đưa ra cách tiếp cận dựa trên phân lớp dữ liệu để giải quyết bài tốn dự đốn khách hàng tiềm năng cho các gĩi cước trong mạng di động. Kỹ thuật được đề xuất dựa trên việc kết hợp nhiều phương pháp học máy (ensemble models) cũng như việc trích xuất các đặc trưng nổi trội cho các hành vi tiêu dùng viễn thơng nhằm làm tăng độ chính xác của mơ hình dự đốn. Đây là một kỹ thuật cho phép kết quả mơ hình cĩ thể tận dụng được các ưu điểm của các mơ hình phân lớp thành phần để cho ra hiệu quả tốt hơn so với các bộ phân lớp thành phần. Tương tư như trong các nghiên cứu của Almana và các cơng sự [4] cũng như luận án của Li [17] các bộ phân lớp thành phần cũng sử dụng các kỹ thuật kinh điển như phân loại sử dụng cây quyết định, SVM và kNN. Mơ hình phân loại được thực hiện theo mơ hình truyền thống gồm bước huấn luyện mơ hình và kiểm thử mơ hình.
21 Mơ hình đề xuất bao gồm hai pha chính:
- Pha huấn luyện mơ hình: thực hiện việc huấn luyện mơ hình dự đốn nhĩm khách hàng tiềm năng bằng các kỹ thuật học máy là SVM, cây quyết định và kNN (k người láng giềng gần nhất).
- Pha kiểm thử mơ hình: pha này thực hiện việc kiểm chứng hiệu quả của mơ hình, dữ liệu kiểm thử được đưa qua các mơ hình dự đốn, kết quả dự đốn của 3 thuật tốn SVM, cây quyết định và kNN sẽ được kết hợp bằng kỹ thuật bình chọn (voting) cho ra kết quả dự đốn cuối cùng.