Để có thể triển khai ứng dụng phân tích Big Data, ngay trước khi triển khai, MobiFone đã phải quy hoạch và chuẩn hóa toàn bộ hệ thống cấu trúc dữ liệu khách hàng đang chưa được tập trung, quản lý trên nhiều hệ thống tài nguyên khác nhau.
Nguồn dữ liệu phục vụ cho phân tích có nguồn từ: - Hệ thống thông tin thuê bao trả trước;
- Hệ thống tính cước và quản lý khách hàng; - Hệ thống mạng lõi;
- Bản ghi chi tiết cuộc gọi khách hàng; - Dữ liê ̣u vi ̣ trí tra ̣m phu ̣c vu ̣;
- Dữ liê ̣u liên quan đến xác đi ̣nh khu vực và vùng kinh tế.
Các hệ thống cơ sở dữ liệu cung cấp toàn bộ dữ liệu của khách hàng sử dụng dịch vụ viễn thông của MobiFone về lịch sử cuộc gọi, thói quen sử dụng, vị trí sử dụng, hành vi tiêu dùng. Dựa trên hệ thống cơ sở dữ liệu, MobiFone thực hiện sắp xếp dữ liệu thu thập được dựa trên hệ thống các trường dữ liệu cơ bản như sau:
STT Kiểu dữ liệu Mô tả Đơn vị tính
1 Chuỗi Số điện thoại
2 Chuỗi Loại giao dịch
3 Thời gian Thời gian thực hiện giao dịch
4 Số Thời gian gọi/nhận cuộc gọi Giây
5 Chuỗi Mã trạm phục vụ
6 Chuỗi Loại giao dịch theo dịch vụ
7 Số Tiền trừ cước tài khoản Đồng
8 Chuỗi Hệ điều hành của thiết bị sử dụng 9 Chuỗi Dòng sản phẩm thiết bị sử dụng 10 Chuỗi Loại version thiết bị sử dụng
STT Kiểu dữ liệu Mô tả Đơn vị tính
12 Thời gian Ngày kích hoạt
13 Chuỗi Tên chủ thuê bao
14 Thời gian Ngày sinh chủ thuê bao
15 Chuỗi Dịch vụ Data sử dụng
16 Chuỗi Dịch vụ Giá trị gia tăng sử dụng
17 Số Số tiền sử dụng dịch vụ thoại Đồng
18 Số Số tiền sử dụng dịch vụ tin nhắn Đồng
19 Số Số tiền sử dụng dịch vụ Data Đồng
20 Số Số tiền sử dụng dịch vụ Giá trị gia tăng Đồng
21 Số Số tiền sử dụng dịch vụ khác Đồng
22 Số Số tiền nạp thẻ Đồng
23 Chuỗi Chương trình khuyến mại khách hàng tham gia
24 Chuỗi Mã trạm
Các dữ liệu này được cập nhật định kỳ hàng ngày trên các hệ thống dữ liệu của MobiFone và lưu trữ trên hệ thống máy chủ tập trung để phục vụ khai thác và sử dụng khi cần thiết.