1. Trang chủ
  2. » Luận Văn - Báo Cáo

Nghiên cứu kỹ thuật khai phá dữ liệu và ứng dụng xây dựng hệ thống đánh giá khách hàng tiềm năng trong tập khách hàng hiện hữu

70 0 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Nghiên cứu kỹ thuật khai phá dữ liệu và ứng dụng xây dựng hệ thống đánh giá khách hàng tiềm năng trong tập khách hàng hiện hữu
Tác giả Nguyễn Như Tồn
Người hướng dẫn TS. Lê Nguyên Bảo, PGS. TS. Nguyễn Gia Như
Trường học Trường Đại học Duy Tân
Chuyên ngành Khoa học máy tính
Thể loại Luận văn Thạc sĩ Khoa học Máy tính
Năm xuất bản 2022
Thành phố Đà Nẵng
Định dạng
Số trang 70
Dung lượng 906,42 KB

Nội dung

Mục tiêu và nhiệm vụ nghiên cứu Mục tiêu của đề tài là đi sâu vào nghiên cứu các kỹ thuật khai phá dữliệu, áp dụng các kỹ thuật đó để khai phá dữ liệu hành vi sử dụng của cáckhách hàng h

Trang 1

NGUYỄN NHƯ TOÀN

NGHIÊN CỨU KỸ THUẬT KHAI PHÁ DỮ LIỆU

VÀ ỨNG DỤNG XÂY DỰNG HỆ THỐNG ĐÁNH GIÁ KHÁCH HÀNG

TIỀM NĂNG TRONG TẬP KHÁCH HÀNG HIỆN HỮU

LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH

ĐÀ NẴNG – 2022

Trang 2

NGUYỄN NHƯ TOÀN

NGHIÊN CỨU KỸ THUẬT KHAI PHÁ DỮ LIỆU

VÀ ỨNG DỤNG XÂY DỰNG HỆ THỐNG ĐÁNH GIÁ KHÁCH HÀNG

TIỀM NĂNG TRONG TẬP KHÁCH HÀNG HIỆN HỮU

Chuyên ngành: Khoa học máy tính

Mã số: 8480101

LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH

Người hướng dẫn khoa học: TS Lê Nguyên Bảo PGS TS Nguyễn Gia Như

ĐÀ NẴNG – 2022

Trang 3

LỜI CẢM ƠN

Tôi xin gửi lời cảm ơn sâu sắc tới TS Lê Nguyên Bảo, Hiệu trưởng Đạihọc Duy Tân, PGS.TS Nguyễn Gia Như, Hiệu trưởng Trường Đại học KhoaHọc Máy Tính - Đại học Duy Tân, những người thầy đã dành nhiều thời giantận tình chỉ bảo, hướng dẫn, giúp đỡ tôi trong suốt quá trình tìm hiểu, nghiêncứu Hai thầy là người định hướng và đưa ra nhiều góp ý quý báu trong quátrình tôi thực hiện luận văn

Tôi xin chân thành cảm ơn các thầy, cô ở Trường Khoa Học Máy Tính Đại học Duy Tân đã cung cấp cho tôi những kiến thức và tạo cho tôi nhữngđiều kiện thuận lợi trong suốt quá trình tôi học tập tại trường

-Tôi cũng bày tỏ lòng biết ơn về sự giúp đỡ của lãnh đạo cơ quan, đồngnghiệp đã cung cấp dữ liệu, tài liệu và cho tôi những lời khuyên quý báu Tôixin cảm ơn gia đình, người thân, bạn bè và các thành viên trong nhóm nghiêncứu luôn động viên và tạo mọi điều kiện tốt nhất cho tôi

Tôi xin chân thành cảm ơn!

Đà Nẵng, ngày tháng năm 2022

Học viên

Nguyễn Như Toàn

Trang 4

LỜI CAM ĐOAN

Tôi xin cam đoan đây là đề tài nghiên cứu của riêng tôi, thực hiện dướisự hướng dẫn của TS Lê Nguyên Bảo và PGS.TS Nguyễn Gia Như, Đại họcDuy Tân

Các kết quả nêu trong luận văn là trung thực và chưa được ai công bốtrong bất cứ công trình nào khác

Đà Nẵng, ngày tháng năm 2022

Học viên

Nguyễn Như Toàn

Trang 5

MỤC LỤC

LỜI CẢM ƠN i

LỜI CAM ĐOAN ii

MỤC LỤC iii

DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT v

DANH MỤC CÁC BẢNG BIỂU vi

DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ vii

MỞ ĐẦU 1

Chương I TỔNG QUAN VỀ KHAI PHÁ DỮ LIỆU 4

1.1 Khai phá dữ liệu 4

1.1.1 Khái niệm khai phá dữ liệu 4

1.1.2 Những nhĩm bài tốn của khai phá dữ liệu 6

1.1.3 Các bước xây dựng một giải pháp về KPDL 8

1.1.4 Kiến trúc của một hệ thống khai phá dữ liệu 8

1.2 Ứng dụng khai phá dữ liệu trong viễn thơng 9

1.3 Kết luận chương 1 11

Chương 2 MỘT SỐ KỸ THUẬT KHAI PHÁ DỮ LIỆU TRONG PHÂN LỚP, DỰ BÁO 12

2.1 Cây quyết định 12

2.1.1 Thuật tốn ID3 14

2.1.2 Thuật tốn C4.5 15

2.2 Phân lớp Nạve Bayes 17

2.3 Mạng nơ ron nhân tạo 18

2.4 Luật kết hợp 20

2.5 Kết luận chương 2 23

Chương 3: GIẢI PHÁP PHÁT HIỆN KHÁCH HÀNG TIỀM NĂNG TRONG TẬP KHÁCH HÀNG HIỆN HỮU 24

3.1 Giới thiệu về VNPT Quảng Trị 24

Trang 6

3.2 Giới thiệu khái niệm khách hàng, thuê bao, dịch vụ 25

3.3 Phát biểu bài toán 27

3.4 Giải pháp đề xuất 28

3.4.1 Hiện trạng 28

3.4.2 Giải pháp đề xuất dùng kỹ thuật khai phá dữ liệu 29

3.4.3 Giới thiệu về công cụ Weka 33

3.5 Thực nghiệm và xây dựng tập luật dự đoán 34

3.5.1 Tập hợp dữ liệu đầu vào 34

3.5.2 Trích chọn thuộc tính 38

3.5.3 Khai phá dữ liệu 42

3.6 Xây dựng ứng dụng Tìm kiếm khách hàng tiềm năng 45

3.6.1 Mục tiêu thực hiện 45

3.6.2 Xây dựng chương trình 45

3.6.3 Đánh giá kết quả 55

3.7 Kết luận chương 3 55

KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 57 TÀI LIỆU THAM KHẢO

Trang 7

DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT

KPDL Khai phá dữ liệu

CSDL Cơ sở dữ liệu

OLAP Online analytical processing

VNPT Vietnam Posts and Telecommunications Group

Trang 8

DANH MỤC CÁC BẢNG BIỂU

Bảng 3.1 - Số liệu khách hàng từ chối dịch vụ

Bảng 3.2 - Số lượng bản ghi dữ liệu sau khi làm sạch

Bảng 3.3 - Cấu trúc dữ liệu khách hàng

Bảng 3.4 - Các trường dữ liệu sau khi trích chọn

Bảng 3.5 - Số lượng bản ghi tập dữ liệu

Bảng 3.6 - Cấu trúc dữ liệu bảng khách hàng

Bảng 3.7 - Cấu trúc dữ liệu bảng thuê bao

Trang 9

DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ

Hình 1.1 - Quá trình khai phá dữ liệu

Hình 1.2 - Kiến trúc một hệ thống khai phá dữ liệu

Hình 2.1 - Biểu diễn cây quyết định cơ bản

Hình 2.2 - Cây quyết định cho việc chơi thể thao

Hình 2.3 - Mô hình mạng nơ ron nhiều lớp

Hình 2.4 - Tiến trình học

Hình 3.1 - Mô hình khai thác dữ liệu thô sơ

Hình 3.2 - Mô hình khai phá dữ liệu cải tiến

Hình 3.3 - Giao diện công cụ Weka

Hình 3.4 - Giao diện chức năng Tra cứu thông tin khách hàng

Hình 3.5 - Giao diện chức năng Thông tin chi tiết khách hàng

Hình 3.6 - Giao diện chức năng Xuất danh sách khách hàng tiềm năng

Trang 10

MỞ ĐẦU

1 Lý do chọn đề tài

Đối với doanh nghiệp, có thể nói khách hàng là yếu tố sống - còn, doanhnghiệp muốn tồn tại và phát triển bền vững cần phải có khách hàng, cần duytrì, phát triển khách hàng VNPT Quảng Trị cũng không nằm ngoài quy luật

đó, là doanh nghiệp cung cấp các sản phẩm dịch vụ về viễn thông, công nghệthông tin, VNPT Quảng Trị luôn phải tìm mọi cách để phát triển các kháchhàng mới, đồng thời, phải tận dụng tối đa các khách hàng hiện hữu để bánthêm nhiều sản phẩm, dịch vụ cho khách hàng

Với kho dữ liệu khách hàng rất lớn của VNPT Quảng Trị, yêu cầu đặt ra

là cần phải khai thác có hiệu quả tập dữ liệu khách hàng này để phục vụ tối đacho công tác bán hàng của VNPT Quảng Trị

Xuất phát từ yêu cầu đặt ra đối với đơn vị mình, tôi đã thực hiện đề tài

luận văn “Nghiên cứu kỹ thuật khai phá dữ liệu và ứng dụng xây dựng hệ

thống đánh giá khách hàng tiềm năng trong tập khách hàng hiện hữu”

2 Mục tiêu và nhiệm vụ nghiên cứu

Mục tiêu của đề tài là đi sâu vào nghiên cứu các kỹ thuật khai phá dữliệu, áp dụng các kỹ thuật đó để khai phá dữ liệu hành vi sử dụng của cáckhách hàng hiện hữu từ đó dự báo các khách hàng tiềm năng có thể sử dụngthêm nhiều dịch vụ của doanh nghiệp

3 Đối tượng và phạm vi đề tài

Đối tượng nghiên cứu của đề tài là: Các nội dung tổng quan về khai phá

dữ liệu, các kỹ thuật khai phá dữ liệu, đặc trưng của bài toán tìm kiếm cáckhách hàng tiềm năng trong tập khách hàng hiện hữu của VNPT Quảng Trị

Do số lượng các dịch vụ của VNPT Quảng Trị hiện đang cung cấp là rấtnhiều, mỗi dịch vụ lại có các đặc điểm, yêu cầu khác nhau, dẫn đến quy mô

Trang 11

và phạm vi cần thực hiện là rất lớn; vì vậy, cần thu hẹp phạm vi nghiên cứuđối với một dịch vụ cụ thể.

Trong đề tài này, phạm vi nghiên cứu là tìm kiếm các khách hàng tiềmnăng có nhu cầu sử dụng dịch vụ Gói Data trong tập khách hàng hiện hữuđang sử dụng các dịch vụ truyền thống của VNPT Quảng Trị

4 Phương pháp nghiên cứu

Để thực hiện luận văn này, tôi đã sử dụng 03 phương pháp nghiên cứukhoa học để tiếp cận và làm rõ những vấn đề của đề tài đặt ra, cụ thể đó là:

- Phương pháp phân tích và tổng hợp lý thuyết: Nghiên cứu các tài liệu

khác nhau về khái niệm và các kỹ thuật khai phá dữ liệu; phân tích để tìmhiểu đối với mỗi vấn đề và tổng hợp để có cái nhìn tổng quan, đầy đủ về cácvấn đề cần tìm hiểu

- Phương pháp so sánh: Khảo sát, trình bày thực trạng về phương pháp

khai thác dữ liệu hiện tại của VNPT Quảng Trị; đưa ra đánh giá, so sánh vớiphương pháp đề xuất sau khi áp dụng các kỹ thuật khai phá dữ liệu

- Phương pháp thực nghiệm khoa học: Thực hiện thu thập, xử lý dữ

liệu khách hàng; sử dụng công cụ WEKA với thuật toán cây quyết định đểxây dựng tập luật dự đoán khách hàng tiềm năng Trên cơ sở đó, xây dựng hệthống phần mềm Tìm kiếm khách hàng tiềm năng

5 Tổng quan vấn đề nghiên cứu

Nội dung của đề tài mang ý nghĩa khoa học khi cung cấp một cách nhìntổng quan về khai phá dữ liệu và nghiên cứu các kỹ thuật khai phá dữ liệu;đưa ra quy trình áp dụng các kỹ thuật khai phá dữ liệu và phát hiện tri thứcđối với dữ liệu khách hàng tại VNPT Quảng Trị

Đề tài luận văn cũng mang ý nghĩa thực tiễn khi thực nghiệm cácphương pháp trên với tập dữ liệu thực tế, mô tả các kết quả đạt được, từ đó

Trang 12

xây dựng các quy trình, giải pháp, cơng cụ gĩp phần vào nâng cao chất lượng,hiệu quả trong hoạt động sản xuất kinh doanh của đơn vị

6 Cấu trúc luận văn

Luận văn được trình bày với bố cục gồm cĩ phần mở đầu, kết luận và 03chương, cụ thể như sau:

Chương 1: Tổng quan về khai phá dữ liệu

Chương này trình bày tổng quan về khai phá dữ liệu, nghiên cứu các cơ

sở lý thuyết KPDL

Chương 2: Một số kỹ thuật khai phá dữ liệu trong phân lớp, dự báo

Chương này trình bày một số khái niệm cơ bản và các kiến thức cĩ liênquan về các thuật tốn thường được áp dụng trong KPDL ở dạng phân lớp, dựbáo đĩ là: cây quyết định, mạng nơron nhân tạo, phân lớp Nạve Bayes và luậtkết hợp

Chương 3: Giải pháp phát hiện khách hàng tiềm năng trong tập khách hàng hiện hữu

Chương này trình bày các phương pháp để phát hiện các khách hànghiện hữu là khách hàng tiềm năng của các dịch vụ khác bao gồm các kỹ thuậtdựa vào đặc trưng khách hàng, phương pháp ứng dụng kỹ thuật khai phá dữliệu

Áp dụng vào thực tế tại VNPT Quảng Trị, xây dựng giải pháp ứng dụngtìm kiếm khách hàng tiềm năng

Trang 13

Chương I TỔNG QUAN VỀ KHAI PHÁ DỮ LIỆU

1.1 Khai phá dữ liệu

1.1.1 Khái niệm khai phá dữ liệu

KPDL là quá trình khảo sát và phân tích một khối lượng lớn các dữ liệuđược lưu trữ trong các cơ sở dữ liệu, kho dữ liệu…để từ đó trích xuất ra cácthông tin quan trọng, có giá trị tiềm ẩn bên trong Do nhu cầu nghiệp vụ cần

có cách nhìn thông tin trên quy mô toàn đơn vị

Các dữ liệu này được thu từ nhiều nguồn, đa số là từ các phần mềmnghiệp vụ như: phần mềm tài chính, kế toán, các hệ thống quản lý tài nguyêndoanh nghiệp, các hệ thống quản lý khách hàng hay từ tác công cụ lưu trữthông tin trên web…

Đây là những khối dữ liệu khổng lồ nhưng những thông tin mà nó thểhiện ra thì lộn xộn và “nghèo” đối với người dùng Kích thước của khối dữ

Hình 1.1 - Quá trình khai phá dữ liệu

Đánh giá mẫu

Tri thức

Các mẫu Khai phá dữ liệu

Dữ liệu đã được chuyển đổi Chuyển đổi

Dữ liệu đã được tiền xử lý Tiền xử lý

Dữ liệu được chọn

Lựa chọn Dữ liệu

Dữ liệu

Trang 14

liệu khổng lồ đó cũng tăng với tốc độ rất nhanh chiếm nhiều dung lượng lưutrữ

KPDL sẽ giúp trích xuất ra các mẫu điển hình có giá trị và biến chúngthành những tri thức hữu ích Quá trình này gồm một số bước được thể hiệntrong hình sau [12]

Ý nghĩa cụ thể của các bước như sau:

- Lựa chọn: Tập hợp dữ liệu từ các kho dữ liệu liên quan đến bài toán

quan tâm Dữ liệu sau đó được lựa chọn hoặc phân chia theo một số tiêuchuẩn nào đó

- Tiền xử lý: Giai đoạn này là giai đoạn hay bị sao lãng, nhưng thực tế

nó là một bước rất quan trọng trong quá trình khai phá dữ liệu Một số lỗithường mắc phải trong khi tập hợp dữ liệu là tính không đủ chặt chẽ, logíc Vìvậy, dữ liệu thường chứa các giá trị vô nghĩa và không có khả năng kết nối dữliệu Giai đoạn này sẽ tiến hành xử lý những dạng dữ liệu không chặt chẽ nóitrên Những dữ liệu dạng này được xem như thông tin dư thừa, không có giátrị Bởi vậy, đây là một quá trình rất quan trọng vì dữ liệu này nếu khôngđược “làm sạch - tiền xử lý - chuẩn bị trước” thì sẽ gây nên những kết quả sailệch nghiêm trọng

- Chuyển đổi: Tiếp theo là giai đoạn chuyển đổi dữ liệu, dữ liệu đưa ra

có thể sử dụng và điều khiển được bởi việc tổ chức lại nó Dữ liệu đã đượcchuyển đổi phù hợp với mục đích khai thác

- Khai phá dữ liệu: Đây là bước mang tính tư duy trong khai phá dữ

liệu Ở giai đoạn này nhiều thuật toán khác nhau đã được sử dụng để trích racác mẫu từ dữ liệu Thuật toán thường dùng là nguyên tắc phân loại, nguyêntắc kết hợp hoặc các mô hình dữ liệu tuần tự, …

- Đánh giá mẫu: Đây là giai đoạn cuối trong quá trình khai phá dữ liệu.

Ở giai đoạn này, các mẫu dữ liệu được chiết xuất ra bởi phần mềm khai phá

Trang 15

dữ liệu Khơng phải bất cứ mẫu dữ liệu nào cũng đều hữu ích, đơi khi nĩ cịnbị sai lệch Vì vậy, cần phải ưu tiên những tiêu chuẩn đánh giá để chiết xuất

ra các tri thức

1.1.2 Những nhĩm bài tốn của khai phá dữ liệu

KPDL cĩ thể được dùng để giải quyết hàng trăm bài tốn với những mụcđích và nhiệm vụ khác nhau Dựa trên bản chất tự nhiên của các bài tốn đĩ,người ta cĩ thể nhĩm các bài tốn đĩ thành những nhĩm sau:

- Bài tốn phân loại:

Bài tốn phân loại là một trong những bài tốn phổ biến nhất của KPDL,

ví dụ như: phân tích xem loại khách hàng nào cĩ khả năng cao nhất sẽ chuyểnsang dùng sản phẩm dịch vụ của đối thủ cạnh tranh của cơng ty, quản lý rủi rohay lựa chọn ảnh quảng cáo nào sẽ xuất hiện đối với mỗi loại khách hàng…Phân loại là tổ chức dữ liệu trong các lớp cho trước, cịn được gọi là học

cĩ quan sát Phân loại sử dụng các nhãn lớp cho trước để sắp xếp các đốitượng Trong đĩ, cĩ một tập huấn luyện gồm các đối tượng đã được kết hợpvới các nhãn đã biết Những thuật tốn học cĩ quan sát sẽ được áp dụng chotập các đối tượng cần phân loại để từ đĩ mơ hình phân loại chúng

Một số thuật tốn dùng trong bài tốn phân loại như: cây quyết định,mạng nơ ron, mạng Nạve Bayes

- Bài tốn phân cụm:

Bài tốn phân cụm hay cịn gọi là phân đoạn Điểm khác với bài tốnphân loại là ở đây các nhãn lớp chưa biết và khơng cĩ huấn luyện Các đốitượng được phân loại dựa trên các thuộc tính tương đồng giữa chúng Bài tốnphân lớp hay cịn gọi là học khơng cĩ giám sát

- Bài tốn phân tích luật kết hợp:

Trang 16

Bài toán này đôi khi còn gọi là bài toán phân tích giỏ hàng bởi vì nóđược sử dụng rộng rãi trong phân tích các giao dịch dữ liệu, các bài toán lựachọn hàng hóa đi kèm…

Phân tích luật kết hợp khám phá ra các luật kết hợp thể hiện mối liên hệgiữa các thuộc tính dữ liệu thường xuất hiện cùng nhau trong các tập dữ liệu

- Bài toán hồi quy:

Bài toán hồi quy cũng tương tự như bài toán phân loại Điểm khác biệt làhồi quy dự đoán cho các dữ liệu liên tục

- Bài toán dự đoán:

Dự đoán là một mảng quan trọng của KPDL Dự đoán có hai loại chính:một loại là dự đoán về một số giá trị dữ liệu chưa biết hay có xu hướng sắpxảy ra, còn loại kia là dự đoán để phân lớp dựa trên một tập huấn luyện và giátrị thuộc tính của đối tượng

- Bài toán phân tích chuỗi:

Phân tích chuỗi được sử dụng để tìm ra các mẫu trong một loạt các giátrị hay trạng thái rời rạc Ví dụ như việc chọn mua hàng của khách hàng cóthể mô hình là một chuỗi dữ liệu Hành động chọn mặt hàng A, sau đó chọnmặt hàng B, C… là một chuỗi các trạng thái rời rạc Trong khi đó thời gian lại

là chuỗi số liên tục

Phân tích chuỗi và phân tích luật kết hợp giống nhau ở chỗ đều phân tíchtập hợp các đối tượng hay trạng thái Điểm khác nhau là mô hình chuỗi phântích sự chuyển của các trạng thái, trong khi mô hình luật kết hợp thì coi mỗimột mặt hàng trong giỏ hàng là như nhau và độc lập Với mô hình chuỗi, việcchọn mặt hàng A trước mặt hàng B hay chọn mặt hàng B trước A sau là khácnhau Còn ở mô hình kết hợp thì cả hai trường hợp là như nhau

- Bài toán phân tích độ lệch:

Trang 17

Bài toán này còn được gọi là phát hiện điểm biên Điểm biên là nhữngđối tượng dữ liệu mà không tuân theo các đặc tính, hành vi chung Bài toánphát hiện điểm biên ứng dụng rất nhiều trong các ứng dụng Ứng dụng quantrọng nhất của bài toán phát hiện điểm biên là bài toán kiểm tra xác nhận thẻtín dụng…[1]

1.1.3 Các bước xây dựng một giải pháp về KPDL

Có rất nhiều tác giả đưa ra các bước của một hệ thống KPDL, mọi sựphân chia chỉ mang tính chất tương đối và tư tưởng chủ đạo của nó là nhưsau:

- Bước 1: Xác định mục tiêu bài toán

- Bước 2: Thu thập dữ liệu

- Bước 3: Làm sạch dữ liệu và chuyển đổi dữ liệu

- Bước 4: Xây dựng mô hình

- Bước 5: Đánh giá mô hình hay đánh giá mẫu

- Bước 6: Báo cáo

- Bước 7: Dự đoán

- Bước 8: Tích hợp vào ứng dụng

- Bước 9: Quản lý mô hình

1.1.4 Kiến trúc của một hệ thống khai phá dữ liệu

- Máy chủ cơ sở dữ liệu hay máy chủ kho dữ liệu: Máy chủ này có tráchnhiệm lấy dữ liệu thích hợp dựa trên những yêu cầu khai phá của người dùng

- Cơ sở tri thức: Đây là miền tri thức được dùng để tìm kiếm hay đánhgiá độ quan trọng của các hình mẫu kết quả

- Máy khai phá dữ liệu: Một hệ thống khai phá dữ liệu cần phải có mộttập các modun chức năng để thực hiện công việc, chẳng hạn như đặc trưnghóa, kết hợp, phân lớp, phân cụm, phân tích sự tiến hoá…

Trang 18

- Modun đánh giá mẫu: Bộ phận này tương tác với các modun khai phá

dữ liệu để tập trung vào việc duyệt tìm các mẫu đáng được quan tâm Cũng cóthể modun đánh giá mâu được tích hợp vào modun khai phá tuỳ theo sự càiđặt của phương pháp khai phá được dùng

- Giao diện đồ họa cho người dùng: Thông qua giao diện này, ngườidùng tương tác với hệ thống bằng cách đặc tả một yêu cầu khai phá hay mộtnhiệm vụ, cung cấp thông tin trợ giúp cho việc tìm kiếm và thực hiện khai pháthăm dò trên các kết quả khai phá trung gian [13]

1.2 Ứng dụng khai phá dữ liệu trong viễn thông

Là một ngành công nghiệp với khối lượng dữ liệu cần xử lý rất lớn,ngành công nghiệp viễn thông đã nhanh chóng phát triển từ cung cấp dịch vụđiện thoại cố định để cung cấp nhiều dịch vụ thông tin liên lạc toàn diện khác.Chúng bao gồm di động, điện thoại thông minh, truy cập Internet, email, tinnhắn văn bản, hình ảnh, máy tính và truyền dữ liệu web và các dữ liệu giaothông Sự hội nhập của viễn thông, mạng máy tính, Internet và nhiều phươngtiện truyền thông khác đã được tiến hành, thay đổi bộ mặt của viễn thông vàđiện toán Điều này đã tạo ra một nhu cầu lớn về khai thác dữ liệu để giúp

Giao diện đồ họa cho người dùng

Đánh giá mẫu Máy khai phá dữ liệu

Kho dữ liệu CSDL

CSDL

Cơ sở tri thức

Máy chủ CSDL hay kho dữ liệu

Hình 1.2 - Kiến trúc một hệ thống khai phá dữ liệu

Trang 19

hiểu số liệu kinh doanh, xác định mô hình viễn thông, xác định các hoạt độnggian lận, sử dụng tốt hơn các nguồn lực và cải thiện chất lượng dịch vụ Bàitoán khai thác dữ liệu trong viễn thông có điểm tương đồng với những ngườitrong ngành công nghiệp bán lẻ Bài toán thường gặp bao gồm xây dựng kho

dữ liệu quy mô lớn, thực hiện biểu diễn đa chiều trực quan, OLAP và phântích chuyên sâu về các xu hướng, mẫu của khách hàng và các mẫu tuần tự.Các bài toán này góp phần cải thiện kinh doanh, giảm chi phí, duy trì kháchhàng, phân tích gian lận và tìm hiểu về đối thủ cạnh tranh Có rất nhiều bàitoán khai thác dữ liệu cùng với các công cụ khai thác dữ liệu cho viễn thông

đã được biết đến và sẽ đóng vai trò ngày càng quan trọng trong kinh doanhngày nay Một số bài toán cụ thể như sau:

- Phân tích đa chiều số liệu bán hàng, khách hàng, sản phẩm, theo thờigian, khu vực:

Ngành viễn thông nói riêng và dịch vụ bán lẻ nói chung cần nhìn cáinhìn đa chiều về doanh thu bán hàng, lợi nhuận, sản phẩm nên việc phântích dữ liệu đa chiều rất cần thiết giúp cho những người quản lý nắm bắt đượctình hình kinh doanh và thị trường cùng các thông tin hữu ích khác

- Phân tích hiệu quả của các chương trình khuyến mại:

Hiện các chương trình khuyến mại và sản phẩm của ngành viễn thôngliên tục được thay đổi, để đánh giá hiệu quả các chương trình khuyến mại làbài toán rất quan trọng của các mạng viễn thông

- Duy trì khách hàng - Phân tích về lòng trung thành của khách hàng: Chúng ta có thể sử dụng thông tin khách hàng trung thành để đăng kýtrình tự mua hàng của khách hàng cụ thể lòng trung thành của khách hàng và

xu hướng mua hàng có thể được phân tích một cách hệ thống Hàng hóa muatại giai đoạn khác nhau của cùng một khách hàng có thể được nhóm lại thànhchuỗi Tuần tự khai thác mô hình sau đó có thể được sử dụng để điều tra

Trang 20

những thay đổi trong tiêu dùng của khách hàng hoặc lòng trung thành và đềnghị điều chỉnh về giá cả và sự đa dạng của hàng hóa để giúp giữ chân kháchhàng và thu hút những người mới.

Ngoài ra KPDL còn giúp phân tích dự báo khách hàng rời mạng từ đó đềnghị điều chỉnh về giá cả và sự đa dạng của hàng hóa để giúp giữ chân kháchhàng

- Xây dựng hệ thống gợi ý:

Ở ngành viễn thông và bán lẻ nói chung thì việc tư vấn cho khách hàngrất quan trọng nhằm tăng doanh thu Vấn đề ở đây là phát hiện nhu cầu củakhách hàng để có thể tư vấn và gợi ý cho khách hàng đúng nhu cầu, thời gian

và địa điểm Các ứng dụng của việc KPDL ở đây bao gồm việc phân tíchhành vi khách hàng, phân lớp, …

- Phòng chống gian lận và xác định hành vi sử dụng bất thường:

Trong ngành viễn thông thì việc rất quan trọng là phát hiện gian lận vàhành vi sử dụng bất thường nhằm giảm thiểu thất thoát doanh thu Bài toánphát hiện dấu hiệu bất thường và phòng chống gian lận để phát hiện các hành

vi gian lận của khách hàng và các bất thường của hành vi sử dụng Ứng dụngKPDL là sử dụng các công cụ phân lớp, phân tích hành vi

1.3 Kết luận chương 1

Chương này trình bày tổng quan về khái niệm khai phá dữ liệu, các bàitoán cũng như kiến trúc của một hệ thống KPDL và ứng dụng đối với ngànhviễn thông

Trang 21

Chương 2 MỘT SỐ KỸ THUẬT KHAI PHÁ DỮ LIỆU TRONG

PHÂN LỚP, DỰ BÁO

2.1 Cây quyết định

Cây quyết định là một cấu trúc biểu diễn dưới dạng cây Trong đó, mỗinút trong biểu diễn một thuộc tính, mỗi nhánh biểu diễn giá trị có thể có củathuộc tính, mỗi lá biểu diễn các lớp quyết định và đỉnh trên cùng của cây gọi

Nút lá Nút lá

Gốc

Hình 2.1 - Biểu diễn cây quyết định cơ bản

Trang 22

Ví dụ 2.1: Một người có chơi thể thao hay không?

Cây quyết định là một cây phân cấp có cấu trúc được dùng để phân lớpcác đối tượng dựa vào dãy các luật Các thuộc tính của đối tượng (ngoại trừthuộc tính phân lớp) có thể thuộc các kiểu dữ liệu khác nhau (Binary,Nominal, ordinal, quantitative values) trong khi đó thuộc tính phân lớp phải

có kiểu dữ liệu là Binary hoặc Ordinal

Tóm lại, cho dữ liệu về các đối tượng gồm các thuộc tính cùng với lớpcủa nó, cây quyết định sẽ sinh ra các luật để dự đoán lớp của các đối tượngchưa biết

So với các phương pháp KPDL khác, cây quyết định là một trong nhữnghình thức mô tả dữ liệu tương đối đơn giản, trực quan, dễ hiểu đối với ngườidùng nhưng lại hiệu quả nên được sử dụng nhiều Trong những năm qua,nhiều mô hình phân lớp dữ liệu đã được các nhà khoa học trong nhiều lĩnhvực khác nhau đề xuất như mạng notron, mô hình thống kê tuyến tính /bậc 2,cây quyết định, mô hình di truyền Trong số những mô hình đó, cây quyếtđịnh được đánh giá là một công cụ mạnh, phổ biến

yếu mạnh

bình thường cao

có không

Trang 23

2.1.1 Thuật toán ID3

Thuật toán ID3 (Interative Dichotomizer 3) được đề ra bởi Quinlan vànhững dạng biểu diễn của nó được sử dụng rộng rãi trong thuật toán cây quyếtđịnh

Đây cũng được gọi là thuật toán tham lam (greedy algorithm) vì thuậttoán ID3 tìm kiếm những mô hình "tham lam" mà trong đó các thuộc tính đạtđược tối đa lượng thông tin cho việc xác định nhãn lớp của các mẫu trong tậphuấn luyện Kết quả là ta thu được một Cây quyết định mà gán nhãn đúng chomỗi mẫu trong tập huấn luyện

Thuật toán xây dựng cây ID3 sử dụng Entropy làm cơ sở đo độ đồngnhất của tập dữ liệu Trên cơ sở Entropy, thuật toán tính độ tăng thông tin nhưmức tăng độ đồng nhất, từ đây xác định thuộc tính tốt nhất tại mỗi nút

Đầu vào: Một tập các mẫu Mỗi mẫu bao gồm các thuộc tính rời rạc, mô

tả một tình huống, hay một đối tượng nào đó, và một giá trị phân loại của nó

Trang 24

H(S) đạt giá trị cực đại là log2(m) khi các nhãn c1, c2, …, cm có xác suấtnhư nhau và giá trị nhỏ nhất của H(S) là 0 khi tất cả các đối tượng có chungmột nhãn.

 Độ tăng thông tin (Information Gain, ký hiệu IG) là chỉ số đánh giá độtốt của thuộc tính trong việc phân chia tập dữ liệu thành những tập con đồngnhất IG được tính trên độ tăng thông tin theo công thức sau:

IG(S , A)=H(S) − ∑

v∈ values( A)

|S v|

|S|H (S v) (2.3)Trong đó:

- S là tập dữ liệu ở nút hiện tại

- A là thuộc tính được sử dụng để đánh giá độ tốt phân chia

- Values(A) là tập các giá trị của A

- Sv là tập mẫu con của S có các giá trị thuộc tính A bằng v

- |S| và |Sv| là số phần tử của các tập |S|, |Sv| tương ứng

Thuật toán ID3 sử dụng độ tăng thông tin để lựa chọn thuộc tính tốt nhấttại mỗi nút, thuộc tính được lựa chọn là thuộc tính mang lại độ tăng thông tinlớn nhất

2.1.2 Thuật toán C4.5

C4.5 là thuật toán dùng để xây dựng cây quyết định được đề xuất bởiQuinlan năm 1993, là mở rộng của ID3 Đặc điểm của C4.5:

- Cho phép dữ liệu đầu vào ở các thuộc tính là liên tục

- Cho phép thao tác với các thuộc tính có dữ liệu không xác định (do bịmất mát dữ liệu)

- Đưa ra phương pháp cắt tỉa cây và giản lược các luật để phù hợp vớinhững bộ dữ liệu lớn

Trang 25

- C4.5 sử dụng cơ chế lưu trữ dữ liệu thường trú trong bộ nhớ, chính đặcđiểm này làm C4.5 thích hợp với những cơ sở dữ liệu nhỏ, và cơ chế sắp xếplại dữ liệu tại mỗi nút trong quá trình phát triển cây quyết định.

- C4.5 còn chứa kỹ thuật cho phép biểu diễn lại cây quyết định dưới dạngmột danh sách sắp thứ tự các luật if-then (một dạng quy tắc phân lớp dễ hiểu)

Kỹ thuật này cho phép làm giảm bớt kích thước tập luật và đơn giản hóa cácluật mà độ chính xác so với nhanh tương ứng cây quyết định là tương đương.C4.5 có cơ chế sinh cây quyết định hiệu quả và chặt chẽ bằng việc sửdụng độ đo lựa chọn thuộc tính tốt nhất là Information Gain Các cơ chế xử lývới giá trị lỗi, thiếu và tránh quá phù hợp của dữ liệu của C4.5 cùng với cơchế cắt tỉa cây đã tạo nên sức mạnh của C4.5 Thêm vào đó, mô hình phân lớpC4.5 còn có phần chuyển đổi từ cây quyết định sang luật dạng if-then, làmtăng độ chính xác và tính dễ hiểu của kết quả phân lớp Đây là tiện ích rất có

ý nghĩa đối với người sử dụng

Độ đo GainRatio được sử dụng trong thuật toán C4.5 là cải tiến của

thuật toán ID3 và được xây dựng bởi Quinlan là thước đo cải tiến của chỉ sốInformation Gain

• Độ đo này giải quyết vấn đề thuộc tính có nhiều giá trị: Trong tập mẫuhuấn luyện bài toán chơi thể thao ở trên, nếu sử dụng thêm thuộc tính ngày thìthuộc tính này có 14 giá trị khác nhau và thuộc tính này có IG cao nhất, và khi

đó Ngày được chọn làm gốc với 14 nhánh và không phân loại được các ngàytiếp theo Do đó cần tránh thuộc tính có nhiều giá trị Thành phần thông tinchia (Split Information-SI) được bổ sung để phạt các thuộc tính có nhiều giátrị:

Trang 26

• Tiêu chuẩn đánh giá thuộc tính GainRatio được xác định bằng cáchchia độ tăng thơng tin cho thơng tin chia (khi SI(S,A)=0 thì cần cĩ phương án

xử lý riêng)

GR(S, A)=GI (S , A) SI (S, A) (2.5)

2.2 Phân lớp Nạve Bayes

Định lý Bayes cho phép tính xác suất xảy ra của một sự kiện ngẫu nhiên

A khi biết sự kiện liên quan B đã xảy ra Xác suất này được ký hiệu là P(A|B),

và đọc là "xác suất của A nếu cĩ B" Đại lượng này được gọi xác suất cĩ điềukiện vì nĩ được rút ra từ giá trị được cho của B hoặc phụ thuộc vào giá trị đĩ.Theo định lí Bayes, xác suất xảy ra A khi biết B sẽ phụ thuộc vào 3 yếutố:

- Xác suất xảy ra A của riêng nĩ, khơng quan tâm đến B, kí hiệu là P(A)

và đọc là xác suất của A Đây được gọi là xác suất biên duyên hay xác suấttiên nghiệm (prior), nĩ là "tiên nghiệm" theo nghĩa rằng nĩ khơng quan tâmđến bất kỳ thơng tin nào về B

- Xác suất xảy ra B của riêng nĩ, khơng quan tâm đến A, kí hiệu là P(B)

và đọc là "xác suất của B" Đại lượng này cịn gọi là hằng số chuẩn hĩa, vì nĩluơn giống nhau, khơng phụ thuộc vào sự kiện A đang muốn biết

- Xác suất xảy ra B khi biết A xảy ra, kí hiệu là P(B|A) và đọc là "xácsuất của B nếu cĩ A" Đại lượng này gọi là khả năng (likelihood) xảy ra B khibiết A đã xảy ra Chú ý khơng nhầm lẫn giữa khả năng xảy ra A khi biết B vàxác suất xảy ra A khi biết B

Khi biết ba đại lượng trên, xác suất của A khi biết B cho bởi cơng thức:

P(A|B)= P(B|A)P(A)

P(B) = likelihood∗prior normallisingconstant (2.6)

Từ đĩ dẫn tới:

Trang 27

P(A|B)P(B)=P(A ∩ B)=P(A)P(B∨ A) (2.7)Khi có n giả thuyết thì:

- Thiết kế hệ thống phân lớp thường dễ dàng hơn so với các phươngpháp khác

- Các thuộc tính trong tập mẫu học phải độc lập với điều kiện

- Độ chính xác thuật toán phân lớp phụ thuộc nhiều vào tập dữ liệu họcban đầu

2.3 Mạng nơ ron nhân tạo

Nơ ron nhân tạo là sự mô phỏng đơn giản của nơ ron sinh học Mỗi nơron nhân tạo thực hiện hai chức năng: chức năng tổng hợp đầu vào và chứcnăng tạo đầu ra Mỗi nơ ron có một giá trị ngưỡng, chức năng đầu vào chính

là tổng có trọng số các tín hiệu vào kết hợp với ngưỡng để tạo ra tín hiều đầuvào Chức năng tạo đầu ra được thực hiện bằng hàm truyền đạt Hàm này sẽnhận tín hiệu đầu vào và tạo tín hiệu đầu ra của nơ ron

Mạng nơ ron là một hệ thống gồm nhiều phần tử xử lý hoạt động songsong Chức năng của nó được xác định bởi cấu trúc mạng, độ lớn của các liênkết và quá trình xử lý tại mỗi nút hoặc đơn vị tính toán

Mạng nơ ron sử dụng mạng đa tầng bao gồm ba lớp tế bào thần kinh.Các lớp này là một lớp đầu vào, một lớp ẩn và một lớp đầu ra Trong mộtmạng nơ ron, mỗi nơ ron nhận được một hoặc nhiều đầu vào và sản xuất mộthoặc nhiều kết quả đầu ra Mỗi đầu ra là một hàm phi tuyến đơn giản của tổngcác đầu vào cho các nơ ron

Trang 28

Hình 2.3 - Mô hình mạng nơ ron nhiều lớp

Có ba loại nơ ron trong một mạng nơ ron được tạo ra với thuật toánmạng nơ ron:

Nơ ron đầu vào: Nơ ron đầu vào cung cấp các giá trị thuộc tính đầu vàocho các mô hình khai thác dữ liệu Đối với thuộc tính đầu vào rời rạc, một nơron đầu vào thường đại diện cho một trạng thái đơn nhất từ các thuộc tính đầuvào Một thuộc tính đầu vào liên tục tạo ra hai nơ ron đầu vào: một nơ ron chomột trạng thái bị thiếu, một nơ ron cho giá trị của chính thuộc tính liên tục đó

Nơ ron đầu vào cung cấp đầu vào cho một hoặc nhiều nơ ron ẩn

Nơ ron ẩn: nơ ron ẩn nhận đầu vào từ các nơ ron đầu vào và cung cấpđầu ra cho các nơ ron đầu ra

Nơ ron đầu ra: Nơ ron đầu ra đại diện cho các giá trị của thuộc tính dựđoán của mô hình KPDL Đối với các thuộc tính đầu ra là rời rạc, một nơ ronđầu ra đại diện duy nhất cho một trạng thái dự đoán của thuộc tính dự đoán,bao gồm cả giá trị thiếu Nếu các thuộc tính dự đoán liên tục tạo ra hai nơ ronđầu ra: một nơ ron cho một trạng thái bị thiếu, một nơ ron cho chính các giátrị của thuộc tính liên tục đó

Mỗi đầu vào có một giá trị được gán cho nó có trọng số là w, mô tả sựliên quan giữa đầu vào đến các nơ ron ẩn hoặc các nơ ron đầu ra

Output 3 Output 2 Output 1

Hidden layer Input

Output

Trang 29

Mạng nơ ron xây dựng lại cấu trúc bộ não có khả năng nhận biết dữ liệuthông qua tiến trình học, với các thông số tự do của mạng có thể thay đổi liêntục bởi những thay đổi của môi trường và mạng nơ ron ghi nhớ giá trị đó.

Do đó trong thực tế người ta phải thiết lập tiêu chuẩn dựa trên một giá trị sai

số nào đó của hai giá trị này, hay dựa trên một số lần lặp xác định

2.4 Luật kết hợp

Khai phá luật kết hợp: Là tìm các mẫu phổ biến, sự kết hợp, sự tươngquan, hay các cấu trúc nhân quả giữa các tập đối tượng trong các cơ sở dữ liệugiao tác, cơ sở dữ liệu quan hệ và những kho thông tin khác [4]

Các ứng dụng: Luật kết hợp có ứng dụng trong nhiều lĩnh vực khác nhaucủa đời sống như: khoa học, hoạt động kinh doanh, tiếp thị, thương mại, phântích thị trường chứng khoán, tài chính và đầu tư,

Trang 30

Ví dụ về luật kết hợp:

Bia => Mực (0,7%; 70%)

Luật này có nghĩa: Nếu mua bia thì mua mực trong 70% trường hợp Bia

và mực được mua chung trong 0.7% tổng giao dịch

Thu nhập= 60.000.000_max => Tài khoản tiết kiệm= yes (20%; 100%)Luật này có nghĩa: Nếu thu nhập lớn hơn hoặc bằng 60 triệu một năm thìkhách hàng có tài khoản tiết kiệm với độ tin cậy là 100%

Từ các luật kết hợp được trích rút từ chính các cơ sở dữ liệu giao dịch,

cơ sở dữ liệu khách hàng mà các siêu thị, các ngân hàng sẽ có chiến lược kinhdoanh (sắp xếp các mặt hàng, số lượng các mặt hàng, ), chiến lược tiếp thị,quảng cáo, … để từ đó thúc đẩy hoạt động kinh doanh của mình.[7]

Một số định nghĩa, khái niệm cơ bản:

Cho I = {i1, i2, i3,…,in} là tập bao gồm n mục (Item – còn gọi là thuộctính - attribute) X ⊆I được gọi là tập mục (itemset)

T = {t1, t2, …, tm} là tập gồm m giao tác (Transaction – còn gọi là bản ghi

- record)

R là một quan hệ nhị phân trên I và T (hay R ⊆IxT) Nếu giao tác t cóchứa mục i thì ta viết (i ,t )∈ R (hoặc iRt) Ta sẽ ký hiệu D = (T,I,R) là dữ liệu

để khai thác Về mặt hình thức, D chính là một quan hệ dạng bảng Về ýnghĩa, một cơ sở dữ liệu là một tập các giao tác (hay giao dịch), mỗi giao dịch

t chứa một tập mục X ⊆I

Độ hỗ trợ của tập mục X

Cho dữ liệu D = (T, I, R); X ⊆I Gọi T(X) là tập giao tác chứa X

Độ hỗ trợ (support) của tập mục X, ký hiệu support(X) là tỷ số của sốlượng giao tác trong cơ sở dữ liệu D chứa X trên tổng số các giao tác trong cơ

sơ dữ liệu D Hay

Support(X) = Card (T(X)) / Card (T) = (2.9)

Trang 31

¿T (X )∨¿T∨¿¿¿¿

Tập phổ biến

Cho D = (T, I, R); minsup ¿

Tập mục X ⊆I được gọi là một tập phổ biến theo ngưỡng minsup (gọi tắt

là tập phổ biến) nếu support(X) >= minsup

Ký hiệu FX(T, I, R, minsup) là tập hợp các tập phổ biến theo ngưỡngminsup:

FX(T, I, R, minsup) = { X ⊆I | support(X) ≥ minsup}

Độ hỗ trợ của luật kết hợp X => Y, ký hiệu support(X => Y) là tỷ số của

số các giao tác trong D có chứa X ∪Y trên số tất cả giao tác trong D

Hay

Support(X => Y) = card (T(X ∪ Y))/card(T) =

Trong đó T(X) là tập giao tác chứa tập mục X

Độ tin cậy của luật kết hợp X => Y

Độ tin cậy (confidence) của luật X => Y, ký hiệu: confidence(X => Y) là

tỷ số các giao tác trong D có chứa X ∪Y trên số các giao tác chứa X

Hay

Confidence(X => Y) = card(T( X ∪Y ))/card(T(X)) = (2.11)

Trang 32

Luật kết hợp tin cậy: Một luật được xem là tin cậy nếu độ tin cậy

confidence của nĩ lớn hơn hoặc bằng một ngưỡng minconf¿ nào đĩ dongười dùng xác định Ngưỡng minconf phản ánh mức độ xuất hiện của Y khicho trước X

Luật kết hợp cần tìm là luật kết hợp thỏa minsup và minconf cho trước.Chúng ta chỉ quan tâm đến các luật cĩ độ hỗ trợ lớn hơn độ hỗ trợ tối thiểu và

độ tin cậy lớn hơn độ tin cậy tối thiểu

Hầu hết các thuật tốn khai phá luật kết hợp thường chia thành hai pha:

- Pha 1: Tìm tất cả các tập mục phổ biến từ cơ sở dữ liệu D tức là tìm tất

cả các tập mục X thỏa mãn support(X) >= minsup

- Pha 2: Sinh các luật tin cậy từ các tập phổ biến đã tìm thấy ở pha 1.Cho minconf; X, Y là các tập mục phổ biến tìm thấy trong pha 1 luật kếthợp được sinh từ X, Y cĩ dạng: X => Y và confidence(X=>Y) >= minconf

2.5 Kết luận chương 2

Chương 2 trình bày một số khái niệm cơ bản và các kiến thức cĩ liênquan về các kỹ thuật thường được áp dụng trong KPDL ở dạng phân lớp, dựbáo đĩ là: cây quyết định, mạng nơron nhân tạo, phân lớp Nạve Bayes và luậtkết hợp

Trang 33

Chương 3: GIẢI PHÁP PHÁT HIỆN KHÁCH HÀNG TIỀM NĂNG

TRONG TẬP KHÁCH HÀNG HIỆN HỮU

3.1 Giới thiệu về VNPT Quảng Trị

VNPT Quảng Trị - đơn vị thành viên của Tập đoàn Bưu Chính ViễnThông Việt Nam – VNPT, được thành lập và đi vào hoạt động từ 01/01/2008.Chức năng, nhiệm vụ chính là: tổ chức, xây dựng, quản lý, vận hành, khaithác, bảo dưỡng, sửa chữa, kinh doanh dịch vụ Viễn thông - Công nghệ thôngtin trên toàn tỉnh Quảng Trị; tổ chức phục vụ thông tin đột xuất theo yêu cầucủa cấp ủy Đảng, chính quyền địa phương và cấp trên, đồng thời đảm bảothông tin liên lạc phục vụ nhiệm vụ quốc phòng, an ninh, phòng chống bãolụt, giảm nhẹ thiên tai

Là đơn vị kinh doanh trong lĩnh vực viễn thông, công nghệ thông tinhàng đầu trên địa bàn, VNPT Quảng Trị cung cấp đến khách hàng các sảnphẩm dịch vụ về viễn thông như: dịch vụ di động VinaPhone, dịch vụ băngrộng FiberVNN, truyền hình trả tiền MyTV, điện thoại cố định… Sở hữu hạtầng mạng lưới viễn thông hiện đại, rộng khắp, VNPT Quảng Trị đáp ứngđược những yêu cầu cao nhất về an toàn thông tin cũng như nhu cầu dịch vụ

đa dạng của khách hàng

Với chiến lược phát triển trong kỷ nguyên mới, phù hợp với xu thế toàncầu hóa và sự phát triển không ngừng của cuộc cách mạng công nghiệp 4.0,Tập đoàn Bưu Chính Viễn Thông Việt Nam – VNPT nói chung, VNPTQuảng Trị nói riêng đã và đang từng bước chuyển đổi từ nhà cung cấp dịch vụviễn thông truyền thống sang nhà cung cấp dịch vụ số (DSP), trở thành mộtdoanh nghiệp năng động, chú trọng phát triển những sản phẩm, dịch vụ, giảipháp ICT sáng tạo, đột phá để tiếp tục kiến tạo nên những giá trị đích thựccho cuộc sống

Trang 34

Tại Quảng Trị, VNPT đã và đang được biết đến là một doanh nghiệphàng đầu trong các lĩnh vực tư vấn giải pháp thi công dự án CNTT, cung cấpsản phẩm, giải pháp tích hợp, dịch vụ CNTT và phát triển phần mềm…

Với khả năng cung cấp các dịch vụ đa ngành và chuyên ngành, VNPTQuảng Trị thực sự đáp ứng được những yêu cầu cung cấp giải pháp tổng thể,

từ tư vấn thiết kế, cung cấp sản phẩm dịch vụ đến cung cấp các ứng dụng vàđào tạo Những giải pháp này được phát triển dựa trên những tri thức đã đượctích lũy nhiều năm của các chuyên gia đầu ngành trong từng lĩnh vực, kết hợpvới những công nghệ tiên tiến nhất của các đối tác công nghệ, cùng khả năngchuyên nghiệp của đội ngũ nhân lực VNPT Quảng Trị, đem lại những giá trị

Khách hàng hiện hữu: là những khách hàng đã từng hoặc đang sử dụng

một hoặc nhiều sản phẩm, dịch vụ của VNPT Quảng Trị cung cấp Ví dụ nhưkhách hàng sử dụng dịch vụ di động Vinaphone, khách hàng sử dụng dịch vụinternet cáp quang FiberVNN… Đây là những khách hàng VNPT Quảng Trị

đã có được dữ liệu về thông tin cơ bản của khách hàng như tên khách hàng,địa chỉ, thông tin liên lạc… cũng như dữ liệu về nhu cầu, thói quen, chi phíkhách hàng bỏ ra để sử dụng dịch vụ

Khách hàng tiềm năng: là những khách hàng chưa sử dụng sản phẩm,

dịch vụ của VNPT Quảng Trị cung cấp nhưng có khả năng và nhu cầu sử

Trang 35

dụng các dịch vụ đó Đây có thể là những khách hàng đang không sử dụngdịch vụ hoặc đang sử dụng dịch vụ của một nhà cung cấp khác Mở rộng ra,khách hàng tiềm năng vẫn có thể là khách hàng hiện hữu, nhưng tiềm năngđối với các sản phẩm, dịch vụ mà khách hàng đó hiện chưa sử dụng

Ví dụ như: Khách hàng A đang sử dụng một số điện thoại di độngVinaPhone, như vậy khách hàng A là khách hàng hiện hữu, đồng thời, kháchhàng A vẫn là khách hàng tiềm năng đối với các dịch vụ khác như dịch vụinternet cáp quang FiberVNN, dịch vụ truyền hình trả tiền MyTV của VNPTQuảng Trị

- Dịch vụ: là các sản phẩm, dịch vụ của VNPT Quảng Trị cung cấp đến

khách hàng, có thể chia thành các nhóm như sau:

+ Di động VinaPhone: Dịch vụ thoại truyền thống (gọi điện, nhắn tin),dịch vụ data (truy cập internet trên điện thoại di động) …

+ Băng rộng: Dịch vụ internet cáp đồng MegaVNN, dịch vụ internetcáp quang FiberVNN, dịch vụ truyền số liệu MetroNet, dịch vụ kênh thuêriêng MegaWan…

+ Truyền hình trả tiền MyTV: Dịch vụ xem truyền hình trên tivi, dịch

vụ xem truyền hình trên điện thoại thông minh…

+ Điện thoại cố định: Dịch vụ điện thoại cố định trên đường cáp đồng,dịch vụ điện thoại cố định trên đường cáp quang…

- Thuê bao: mỗi một dịch vụ của một khách hàng ký hợp đồng sử dụng

với VNPT Quảng Trị được gọi là thuê bao, một khách hàng có thể có mộthoặc nhiều thuê bao

Ví dụ: Khách hàng A đang sử dụng một số điện thoại di động VinaPhone

và một đường truyền internet FiberVNN của VNPT Quảng Trị, như vậykhách hàng A có 02 thuê bao

Ngày đăng: 07/03/2024, 20:55

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w