CHƯƠNG 2 : KHAI PHÁ DỮ LIỆU TRONG VIỄN THÔNG
2.2. Dữ liệu trong viễn thông
Ngành viễn thông là một trong những ngành quan trọng và có tốc độ phát triển nhanh chóng, sử dụng các cơng nghệ và ứng dụng CNTT tiên tiến, ngồi ra viễn thơng cịn có số lượng khách hàng sử dụng lớn, cung cấp nhiều dịch vụ đa dạng khác nhau (di động, cố định, truyền hình), do đó dữ liệu mà các hệ thống trong viễn thông sản sinh ra sẽ rất đa dạng. Bao gồm các dữ liệu như thông tin cá nhân người dùng, dữ liệu về cuộc gọi, các dịch vụ sản phẩm khách hàng đang dùng, mức tiêu dùng, chi tiêu hàng tháng, dữ liệu truy cập mạng. Tất cả các dữ liệu này như là một tài sản vơ giá, có thể khai thác giúp doanh nghiệp đưa ra các quyết định trong kinh doanh, cũng như chăm sóc khách hàng tốt hơn. Chi tiết một số loại dữ liệu điển hình sau:
36
viễn thông là chúng ta luôn nghĩ ngay tới sim, số điện thoại, đặc biệt là các doanh nghiệp lớn thì luôn lưu trữ một lượng lớn thông tin về thuê bao, có thể lên tới hàng chục triệu bản ghi. Các trường thông tin như sau:
- Số thuê bao
- Trạng thái của thuê bao: Hoạt động/Hủy - Gói cước đang sử dụng
- Gói khuyến mại đang sử dụng - Ngày kích hoạt
- Loại thuê bao
- Thông tin hạ tầng kết nối - Địa bàn đăng ký
- Loại máy đang sử dụng.
Dữ liệu khách hàng (customer data): Bên cạnh thông tin liên quan đến th
bao, thì thơng tin về khách hàng cũng được các doanh nghiệp viễn thông lưu trữ đầy đủ thông tin. Các thông tin về khách hàng bao gồm:
- Tên/tuổi khách hàng. - Địa chỉ sinh sống - Số giấy tờ
- Thông tin hợp đồng và lịch sử thanh toán.
Chi tiết cước cuộc gọi (call detail record): Doanh nghiệp có thể hiểu khách
hàng hơn khi khai thác dữ liệu chi tiết cước gọi. Tất cả các cuộc gọi, tin nhắn hay dữ liệu sử dụng data đều được ghi lại, một số dữ liệu được sử dụng trong khai phá dữ liệu:
- Thời gian trung bình của các cuộc gọi. - Thời điểm cuộc gọi (ngày/đêm)
- Số lượng cuộc gọi vào các ngày trong tuần. - Khu vực phát sinh cuộc gọi.
- Số lượng cuộc gọi được tạo ra trong một ngày. - Số gọi đi, số gọi đến.
Dữ liệu mạng (network data): Mạng viễn thông gồm nhiều hệ thống giao tiếp
với nhau, có cấu hình phức tạp. Mỗi hệ thống lại sinh ra các thông báo và trạng thái, dữ liệu này được lưu trữ và xử lý dẫn đến có một lượng lớn về dữ liệu mạng. Dữ liệu
37
này được sử dụng để hỗ trợ quản lý, giám sát hệ thống tránh các sự cố. Các nhân sự giám sát hệ thống không thể xử lý thủ công mọi thông báo do số lượng các hệ thống sinh ra quá lớn. Do vậy các thông báo này cần phải được xử lý tự động dựa trên phân tích và các nhân sự giám sát chỉ xử lý khi vấn đề không thể tự động giải quyết.
Dữ liệu truy cập người dùng (User access data): Các thuê bao hiện nay chủ
yếu sử dụng hạ tầng mạng 3G/4G/5G để kết nối tới các mạng xã hội như Facebook, Youtube, Tiktok. Vì thế việc lưu trữ log truy cập đến các URL của thuê bao sẽ là một điểm quan trọng trong việc phân tích hành vi, nhu cầu mong muốn của khách hàng.