Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 26 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
26
Dung lượng
301,98 KB
Nội dung
Header Page of 126 BỘ GIÁO DỤC VÀ ĐÀO TẠO ĐẠI HỌC ĐÀ NẴNG NGUYỄN VĂN SANG ỨNG DỤNG KHAI THÁC DỮ LIỆU ĐỂ DỰ ĐOÁN SỰ TĂNG TRƯỞNG SỐ THUÊ BAO DI ĐỘNG CHUYÊN NGÀNH: KHOA HỌC MÁY TÍNH MÃ SỐ: 60.48.01 TÓM TẮT LUẬN VĂN THẠC SĨ KỸ THUẬT Đà Nẵng - Năm 2011 Footer Page of 126 Header Page of 126 Công trình ñược hoàn thành ĐẠI HỌC ĐÀ NẴNG Người hướng dẫn khoa học: PGS.TS VÕ TRUNG HÙNG Phản biện 1: PGS.TS PHAN HUY KHÁNH Phản biện 2: GS.TS NGUYỄN THANH THỦY Luận văn ñược bảo vệ trước Hội ñồng chấm Luận văn tốt nghiệp Thạc sĩ Kỹ thuật họp Đại học Đà Nẵng vào ngày 11 tháng 09 năm 2011 Có thể tìm hiểu luận văn : - Trung tâm Thông tin - Học liệu, Đại học Đà Nẵng - Trung tâm Học liệu, Đại học Đà Nẵng Footer Page of 126 Header Page of 126 - 1- MỞ ĐẦU Lý chọn ñề tài Ngày nay, viễn thông lĩnh vực phát triển nhanh chóng Các công ty viễn thông không ngừng nâng cao, cải tiến chất lượng dịch vụ mình, nhằm ñáp ứng nhu cầu khách hàng Các công ty ñể tồn phát triển cạnh tranh với nhau, khách hàng có nhiều hội ñể lựa chọn, ñó vấn ñề tìm hiểu khách hàng sử dụng dịch vụ viễn thông quan trọng Trong trình dịch vụ ñược thử nghiệm, hình khuyến ña dạng phong phú làm cho thị trường viễn thông sôi ñộng ngày tăng trưởng nhanh Tuy nhiên mặt trái làm cho nhà cung cấp dịch vụ nhiều phiền phức quản lí thuê bao ảo, tăng trưởng ảo Các công ty viễn thông dựa vào CSDL chi tiết gọi (Call Detail Record) ñể phân tích số liệu hành vi sử dụng khách hàng Hàng ngày hàng triệu gọi ñược ghi nhận tổng ñài với mục ñích ñể tính cước cho khách hàng quản lý mạng, cách mà khách hàng sử dụng mạng, sản phẩm dịch vụ viễn thông Ngoài công ty viễn thông lưu thông tin khác phiếu ñăng kí dịch vụ, thông báo lỗi mạng Các ghi chi tiết gọi cho biết dịch vụ ñược sử dụng mà cho biết dịch vụ ñó ñược sử dụng Một nhà cung cấp dịch vụ thành công có quan hệ tốt với khách hàng, giữ ñược khách hàng cũ có thêm khách hàng Thông tin chứa ñựng ghi gọi tài sản vô quý giá, khách hàng cần gì, mà khách hàng cần dịch vụ, khách Footer Page of 126 Header Page of 126 - 2- hài lòng, khách hàng ñem lại lợi nhuận, khách hàng rời bỏ Do ñó thách thức lớn trình tìm hiểu hành vi sử dụng khách hàng ñể ñiều chỉnh dịch vụ ñánh giá tăng trưởng ảo thực Người sử dụng không tiếp xúc trực tiếp với nhà cung cấp dịch vụ ñiện thoại Khách hàng tiếp xúc với nhà cung cấp dịch vụ qua phận chăm sóc khách hàng Do ñó nguồn liệu chủ yếu ñể nghiên cứu khách hàng thông qua tin gọi Mục ñích nghiên cứu Ứng dụng khai phá liệu ñể tìm xu hướng khách hàng thuê bao, họ rời bỏ mạng viễn thông hay không Dự ñoán tăng trưởng năm số thuê bao di ñộng ñể có sách ñiều tiết, ñầu tư mạng viễn thông chăm sóc khách hàng thích hợp Phương pháp nghiên cứu Phương pháp nghiên cứu tài liệu: Qua nguồn tài liệu ñược xuất bản, báo ñăng tạp chí khoa học, tài liệu liên quan ñến viễn thông Phương pháp ñiều tra: ñiều tra, thu thập công ty viễn thông Phương pháp thực nghiệm: Thực việc cài ñặt, thử nghiệm sở liệu, chỉnh sửa ñể cho kết mong ñợi Ý nghĩa khoa học thực tiễn Footer Page of 126 Header Page of 126 - 3- Kết ñưa ñánh giá tình hình thị trường dịch vụ viễn thông Đánh giá ñược xu hướng người sử dụng, ước lượng ñược phần trăm thuê bao thực, thuê bao ảo Ước lượng ñược số thuê bao gia tăng hàng năm Kết nghiên cứu làm tài liệu cho nhà cung cấp dịch vụ viễn thông Bố cục luận văn Luận văn ñược chia thành chương Chương 1: Nghiên cứu tổng quan khai phá liệu Tìm hiểu khái quát chung khai phá liệu, bước khai phá liệu, công cụ cụ thể tiếp cận ñược ñưa ñể giải toán Chương 2: Dự ñoán tăng trưởng số thuê bao Đưa toán tăng trưởng, phân tích thiết kế hệ thống ñưa phương pháp giải toán Chương 3: Xây dựng ứng dụng Từ kết ñã nghiên cứu, cài ñặt thuật toán xây dựng chương trình ứng dụng có tính thực tiễn Đưa kết luận, rút mặt ưu ñiểm hạn chế Footer Page of 126 Header Page of 126 - 4- CHƯƠNG NGHIÊN CỨU TỔNG QUAN KHAI PHÁ DỮ LIỆU 1.1 KHAI PHÁ DỮ LIỆU Định nghĩa Khai phá liệu trình tìm kiếm mẫu mới, thông tin tiềm ẩn mang tính dự ñoán dựa vào khối liệu lớn ñã lưu trước ñó Những công cụ KPDL dự ñoán xu hướng tương lai, tri thức mà KPDL mang lại giúp cho tổ chức ñịn kịp thời Sự phân tích cách tự ñộng mang tính dự báo KPDL có ưu hẳn so với phân tích thông thường dựa kiện mang khứ hệ hỗ trợ ñịnh(Decision Support Systems) trước ñây Với nội dung ñược trình bày trên, hiểu cách sơ lược rằng: KPDL ñược ñịnh nghĩa trình tìm kiếm thong tin có ích tiềm ẩn mang tính dự ñoán khối liệu lớn Vai trò khai phá liệu Cuộc cách mạng khoa học kỹ thuật số cho phép số hóa thông tin trở nên dễ dàng chi phí lưu trữ từ ñó trở nên thấp hơn, số lượng khổng lồ liệu ñược tập trung lưu trữ CSDL thiết bị ñiện tử như: ñĩa cứng, băng từ, ñĩa quang, CD ROM, thẻ nhớ khiến tốc ñộ tăng liệu lớn Từ ñó dẫn ñến kỹ thuật thống kê công cụ quản trị liệu dựa khối liệu khổng lồ ñó, không phù hợp phân tích tích ñầy ñủ Footer Page of 126 Header Page of 126 - 5- Dữ liệu sau xử lý trực tuyến phục vụ cho mục ñích ñó ñược lưu lại ngày lớn Trong khối lượng liệu nhiều thông tin có ích mang tính thống kê, có tính quy luật ñang tiềm ẩn mà chưa biết, ñồi hỏi cần phải khai phá có ñược Do ñó cần phải có công cụ tự ñộng rút trích thông tin, luật có ích Một hướng tiếp cận nới có khả giúp cho tổ chức khai thác thông tin ý nghĩa từ tập liệu lớn ñó KPDL Với ưu ñiểm trên, KPDL ñã chứng tỏ ñược tính hữu dụng môi trường ngày Vì mà KPDL ñược ứng dụng rộng rãi lĩnh vực thương mại, tài chính, y học, giáo dục, viễn thông, ngân hàng 1.2 CÁC BƯỚC KHAI PHÁ DỮ LIỆU KPDL ñược chia thành bước sau: Biến ñổi liệu Các tri thức Tiền xử lí liệu KPDL Đánh giá biểu diễn tri thức Dữ liệu ñã Trích chọn liệu Dữ liệu ñã ñược trích chọn Dữ liệu ban ñầu Footer Page of 126 Hình 1.1: Các bước khai phá liệu Header Page of 126 - 6- Trích chọn liệu (Data selection): bước chọn tập liệu cần ñược khai phá từ tập liệu lớn (Databases, Data Warehouse) Tiền xứ lý liệu (Data Preprocessing): bước làm liệu (xử lý liệu không ñầy ñủ, liệu nhiễu, liệu không quán ), rút gọn liệu(sử dụng phương pháp thu gọn liệu, histograms, lấy mẫu ), rời rạc hóa liệu (dựa vào histograms, entropy, phân khoảng ) sau bước này, liệu quán ñầy ñủ, ñược rút gọn ñược rời rạc hóa Biến ñổi liệu (Data Transformation): bước chuẩn hóa làm mịn liệu ñể ñưa liệu dạng thuận lợi nhằm phục vụ cho kỹ thuật khai phá bước KPDL (Data Mining): ñây bước quan trọng tiêu tốn nhiều thời gian KPDL Áp dụng kỹ thuật (phần lớn kỹ thuật Machine Learning) ñể khai phá trích chọn mẫu (pattern) thông tin dựa vào mối liên hệ ñặc biệt liệu Đánh giá biểu diễn tri thức (Knowledge Representtation & Evaluation): Dùng kỹ thuật hiển thị liệu ñể trình bày mẫu thông tin mối liên hệ ñặc biệt liệu ñã ñược khai phá, biểu diễn theo dạng gần gũi với người sử dụng ñồ thịm cây, bảng biểu, luật ñồng thời bước ñánh giá tri thức khai phá ñược theo tiêu chí ñịnh Trong giai ñoạn KPDL, cần tương tác người dùng ñể ñiều chỉnh rút tri thức cần thiết Footer Page of 126 Header Page of 126 - 7- 1.3 CÁC DẠNG DỮ LIỆU ĐƯỢC KHAI PHÁ KPDL ñã chứng tỏ ñược tính hữu dụng thực tế mà ñược ứng dụng rộng rãi lĩnh vực thương mại, tài chính, y học, giáo dục, viễn thông, ngân hàng với CSDL ñã có ñể ñưa luật KPDL có khả chấp nhận số dạng CSDL sau: CSDL giao tác (Transactonal Databases): dạng liệu tác nghiệp có ghi giao tác Dạng CSDL phổ biến ngân hàng CSDL quan hệ (Relational Databases): dạng liệu tác nghiệp ñược tổ chức theo mô hình liệu quan hệ CSDL ña chiều (Mutidimention Structures, Data Warehouses): kho liệu ñược tập hợp chọn lọc từ nhiều nguồn liệu khác Dạng liệu chủ yếu phục vụ cho trình phân tích cung khai phá tri thức hỗ trợ trình ñịnh CSDL quan hệ-hướng ñối tượng (Object Relational Databases): dạng liệu lai hai mô hình quan hệ ñối tượng 1.4 HƯỚNG TIẾP CẬN VÀ KỸ THUẬT KHAI PHÁ DỮ LIỆU KPDL lĩnh vực rộng với nhiều hướng nghiên cứu, tiếp cận khác Một số hướng tiếp cận KPDL ñược phân chia theo chức theo lớp toán khác 1.4.1 Cây ñịnh luật Cây ñịnh phương pháp mô tả tri thức dạng ñơn giản nhằm phân ñối tượng liệu thành số lớp ñịnh Các nút ñược gán nhãn tên thuộc tính, cạnh ñược gán giá trị thuộc tính, miêu tả lớp khác Các ñối tượng ñược phân Footer Page of 126 Header Page 10 of 126 - 8- lớp theo ñường ñi cây, qua cạnh tương ứng với giá trị thuộc tính ñối tượng lá.[1] Hình 1.2: Mô tả ñịnh Cây ñịnh miêu tả ñiều kiện chơi thể thao với thuộc tính ñặt quang cảnh, gió, ñộ ẩm Có hai giá trị “Có” “Không” Cây ñịnh luật có ưu ñiểm hình thức miêu tả ñơn giản, mô hình suy diễn dễ ñối với người sử dụng Tuy nhiên, giới hạn miêu tả luật biểu diễn ñược số dạng chức năng, giới hạn ñộ xác mô hình, Cho ñến ñã có nhiều giải thuật suy diễn sử dụng luật ñịnh ñược áp dụng máy học thống kê 1.4.2 Phân lớp Bayes Lý thuyết Bayes cung cấp tiếp cận theo xác xuất ñể suy diễn Nó dựa giả thuyết số lượng khuynh hướng bị chi phối phân Footer Page 10 of 126 Header Page 12 of 126 - 10- Trong phân tích hoạt ñộng kinh doanh nhiều lĩnh vực khác, hồi quy công cụ phân tích ñầy sức mạnh thay thế, phương pháp thống kê toán dùng ñể ước lượng, dự báo kiện xảy tương lai dựa vào quy luật khứ 1.4.3.1 Phương pháp hồi quy ñơn Còn gọi hồi quy ñơn biến, dùng xét mối quan hệ tuyến tính biến kết biến giải thích biến nguyên nhân (nếu chúng có mối quan hệ nhân quả) Trong phương trình hồi quy tuyến tính, biến gọi là: biến phụ thuộc; biến tác nhân gây biến ñổi, gọi biến ñộc lập 1.4.3.2 Phương pháp hồi quy bội Còn gọi phương pháp hồi quy ña biến, dùng phân tích mối quan hệ nhiều biến số ñộc lập (tức biến giải thích hay biến nguyên nhân) ảnh hưởng ñến biến phụ thuộc (tức biến phân tích hay biến kết quả) Footer Page 12 of 126 Header Page 13 of 126 - 11- CHƯƠNG DỰ ĐOÁN TĂNG TRƯỞNG SỐ THUÊ BAO 2.1 GIỚI THIỆU BÀI TOÁN 2.1.1 Bài toán Trong lĩnh vực viễn thông số lượng khách hàng sử dụng dịch vụ thuê bao lớn Đặc biệt thời gian gần ñây với phát triển nhanh ngành kèm theo sách quản lý thông thoáng ñã tạo ñiều kiện cho người dùng thỏa mãn nhu cầu sử dụng Bên cạnh ñó hình thức khuyến mang tính cạnh tranh lành mạnh ñược triển khai nhằm thu hút khách hàng Từ ñó nảy sinh mặt trái thuê bao ảo, số người dùng nhiều thuê bao mục ñích tận dụng sách khuyến Để nhìn nhận vấn ñề cách khách quan dùng công cụ khai phá liệu ñể phân tích khách hàng ñâu tiềm tàng gắn bó, ñâu thuê bao ảo rời bỏ, từ ñó ñiều chỉnh sách hợp lý cuối dự ñoán tăng trưởng hàng năm số lượng thuê bao 2.1.2 Các tập CSDL quản lí thuê bao liên quan ñến toán 2.1.2.1 Giới thiệu chi tiết gọi 2.1.2.2 CSDL tính cước (Billing’) 2.1.2.3.Cơ sở liệu khách hàng (Customer) 2.1.3 Một số thuộc tính Chi tiết gọi 2.2 PHÂN TÍCH THIẾT KẾ HỆ THỐNG 2.2.1 Cách giải yêu cầu toán Footer Page 13 of 126 Header Page 14 of 126 - 12- 2.2.2 Phương pháp triển khai 2.2.3 Nội dung triển khai 2.2.4 Xây dựng tập CSDL huấn luyện 2.2.5 Công nghệ sử dụng 2.2.6 Các công việc tiến hành với liệu 2.2.7 Phân tích thiết kế hệ thống 2.2.7.1 Kiến trúc hệ thống Dữ liệu huấn luyện Chi tiết gọi Tính cước Tiền xử lý liệu Thuật toán phân lớp Kết phân lớp Mô hình phân lớp Khách hàng Hồi quy dự ñoán tăng trưởng Dữ liệu chưa phân lớp Hình 2.1: Mô hình hệ thống 2.2.7.2 Các bảng liệu 2.2.7.3 lược ñồ quan hệ ñối tượng Footer Page 14 of 126 Header Page 15 of 126 - 13- Hình 2.2: Mô hình quan hệ CSDL 2.3 PHÂN LỚP DỰ ĐOÁN XU HƯỚNG KHÁCH HÀNG 2.3.1 Xây dưng tập liệu huấn luyện (Training Data) Dựa sở liệu ñã có Chi tiết gọi, tính cước, thông tin khách hàng chọn thuộc tính chứa nhiều thông tin có khả mang lại cho việc dự ñoán ñể tạo sở liệu tổng hợp Cơ sở liệu ñược tạo từ thông tin quan trọng dễ dàng phân tích cho việc dự ñoán, ñược gọi tập DL ñầu vào hay gọi tập DL huấn luyện (Training data) Footer Page 15 of 126 Header Page 16 of 126 - 14- Bảng 2.1: Tập CSDL huấn luyện Số thuê bao Sử dụng DV Thời gian gọi Tin nhắn Tài khoản Rời bỏ Nguyễn Văn An 0905245678 Nhiều Vừa Nhiều Cao Không Lê Thanh Bình 0935234532 Ít Ngắn Ít Thấp Có Lê Trung Kiên 01223563456 Trung Dài Trung bình Trung Không Tên khách hàng bình bình Thái Xuân Lan 0903541789 Ít Ngắn Ít Cao Có Đỗ Kim Lan 0904237865 Nhiều Dài Nhiều Thấp Không Trần Thúy Hằng 0932456654 Nhiều Vừa Trung bình Trung Không bình NguyễnVăn Nam 01215673565 Trước Ngắn Ít Cao Có Lê Hải Nam 0905234561 Trước Dài Nhiều Trung Không bình 2.3.2 Giới thiệu phân lớp 2.3.2.1 Xây dựng mô hình 2.3.2.2 Sử dụng mô hình 2.3.3 Một số phương pháp phân lớp Footer Page 16 of 126 Header Page 17 of 126 - 15- 2.3.3.1 Xây dựng ñịnh Xây dựng ñịnh vấn ñề then chốt quan trọng việc khai phá liệu kỹ thuật Các thuật toán xây dựng ñịnh ñã ñược nhà khoa học phát triển, công bố giới thiệu Một số thuật toán tiêu biểu sau:[4] Xây dựng Thuật toán tổng quát xây dựng ñịnh Trong khai phá liệu ñịnh xây dựng vấn ñề mấu chốt quan trọng Các thuật toán xây dựng ñịnh ñã ñược nhà khoa học phát triển, công bố cải tiến theo thời gian Tuy nhiên, mặt tổng quát ñịnh ñược xây dựng theo thuật toán sau: Dữ liệu vào: Tập liệu D, tập danh sách thuộc tính, tập nhãn lớp Dữ liệu ra: Mô hình ñịnh Thuật toán: Tạocây (Tập liệu E, tập danh sách thuộc tính F, tập nhãn lớp) Nếu ñiều_kiện_dừng (E,F) = ñúng nútlá = CreateNode () nútlá.nhãnlớp=Phânlớp (E) return nútlá Ngược lại Nútgốc = CreateNode () Nútgốc.ñiềukiệnkiểmtra = tìm_ñiểm_chia_tốt_nhất (E, F) Đặt V = {v| v thoả ñiều kiện phần phân chia xuất phát từ Nútgốc} Lặp qua tập phân chia v ∈ V 10 Đặt Ev = {e | Nútgốc.ñiềukiệnkiểmtra(e) = v e ∈ E} Đặt F = F \ {các giá trị ñiều kiện ñể phân chia v} 11 Nútcon = Tạocây (Ev, F, tập nhãn lớp) Footer Page 17 of 126 Header Page 18 of 126 - 16- 12 Dừng lặp 13 End if 14 Trả nútgốc Hàm Gọi hàm Tạocây (Tập liệu E, tập danh sách thuộc tính E, tập nhãn lớp) 2.3.3.2 Phân lớp Bayes 2.3.4 Dự ñoán tăng trưởng 2.3.4.1 Phương pháp hồi qui tuyến tính Phân tích hồi qui tuyến tính mô hình dự báo thiết lập mối quan hệ biến phụ thuộc với hai hay nhiều biến ñộc lập Trong phần này, xét ñến biến ñộc lập Nếu số liệu chuỗi theo thời gian biến ñộc lập giai ñoạn thời gian biến phụ thuộc thông thường doanh số bán hay tiêu khác mà ta muốn dự báo Mô hình có công thức:Y = ax + b[6] a = n∑ xy − ∑ x∑ y n ∑ x − ( ∑ x) b = ∑ x ∑ y − ∑ x∑ xy n ∑ x − (∑ x ) Trong ñó : y - Biến phụ thuộc cần dự báo x - Biến ñộc lập a - Độ dốc ñường xu hướng b - Tung ñộ gốc n - Số lượng quan sát 2.3.4.2 Mô hình dự báo theo phương trình hồi quy Footer Page 18 of 126 Header Page 19 of 126 - 17- CHƯƠNG XÂY DỰNG ỨNG DỤNG 3.1 GIỚI THIỆU Phần mềm ñược xây dựng với cho phép tương tác với liệu thực khai phá liệu Để tương tác với liệu phần mềm thực chức cập nhật, khởi tạo, xem liệu gốc Trong trình khai phá liệu thực nhiệm vụ toán ñó dự ñoán khách hàng rời bỏ dự ñoán tăng trưởng số thuê bao năm Trong toán ñưa ñó phân lớp khách hàng dựa hai xu hướng ñó gắn bó rời bỏ, từ ñó xác ñịnh ñược mối tương quan giá trị “thực” “ảo” phục vụ riêng cho lớp khách hàng có nhu cầu, sở thích, ñưa sách giá ưu ñãi chương trình khuyến ñối với lớp ñối tượng riêng Chẳng hạn, ñối với người dùng ñiện thoại di ñộng trả trước, có người gọi ñi nhiều có người sử dụng ñể nhận gọi sách ñối với hai ñối tượng nào? Người gọi nhiều có nhu cầu giá cước thấp, ta ñưa chương trình giảm giá cước từ phút gọi thứ trở ñi Nhưng ñối với người dùng nghe chương trình ý nghĩa với họ mà chương trình tăng ngày sử dụng có ý nghĩa Sau ta có ñược dự ñoán ñược giá trị thực thuê bao ta dùng phương pháp phân tích hồi quy ñể dự ñoán tăng trưởng năm Các số giá trị ñược ñưa giúp nhà cung cấp dịch vụ ñánh giá khách quan mặt ñịnh lượng số thuê bao Các số liệu ñược ñưa truy xuất dạng biểu ñồ dạng bảng Những số ñược ñưa minh họa, phản ánh Footer Page 19 of 126 Header Page 20 of 126 - 18- thực tế tăng trưởng số thuê bao di ñộng Phần mềm thực hai chức dự ñoán có ý nghía thực nhà cung cấp dịch vụ viễn thông, cách ñể ñi tìm chế hiệu sau năm hoạt ñộng ñể có phương pháp sách ñiều chỉnh phù hợp 3.2 QUÁ TRÌNH PHÁT TRIỂN Đề tài dựa ý tưởng dựa vào khai phá liệu ñể phân tích chăm sóc khách hàng viễn thông Trong ñó dựa vào thông tin, tính chất khách hàng lưu sở liệu quản lý ñể tổng hợp thành sở liệu Phân lớp khách hàng ñầu vào cho nhiều toán khác mà ñây ví dụ ñối với kho liệu cước ñiện thoại công ty VMS Mobifone Đây việc áp dụng thử nghiệm việc phân lớp sử dụng ñịnh khuôn khổ luận văn Bài toán ñặt phân tích ñặc trưng ngành viễn thông công cụ khai phá liệu ñể phân tích xu hướng, dự ñoán người có khả rời bỏ dự ñoán tăng trưởng số thuê năm Trong trình thực ñề tài tham khảo tìm hiểu công ty VMS Mobifone, vào giá trị gọi chi tiết bảng tính tiền quản lí khách hàng ñể ñưa tập liệu huấn luyện Áp dụng thuật toán phân lớp ñịnh Bayes ñể ñưa phân tích xu hướng khách hàng Sử dụng phân tích hồi quy ñể dự ñoán tăng trưởng số thuê bao năm Trong khuôn khổ ñề tài 3.3 XÂY DỰNG DEMO 3.3.1 Giao diện Footer Page 20 of 126 Header Page 21 of 126 - 19- Hình 3.1: Bảng nhập liệu kết giá trị dự ñoán Menu phần mềm dự ñoán tăng trưởng phía bên trái thực tương tác với CSDL bao gồm cập nhật, khởi tạo, xem liệu gốc Bên phải thao tác với dự ñoán Dự ñoán xu hướng dự ñoán ñưa danh sách người rời bỏ không rời bỏ Dự ñoán tăng trưởng dự ñoán số thuê bao tăng hàng năm bao nhiêu, tính theo phần trăm ñược xem dạng bảng biểu ñồ 3.3.2 Menu cập nhật liệu 3.3.3 Xem liệu gốc Footer Page 21 of 126 Header Page 22 of 126 - 20- 3.3.4 Cơ sở liệu huấn luyện Hình 3.4: Bảng sở liệu huấn luyện Là tập sở liệu dựa vào thuộc tính mà thuê bao rời bỏ hay không 3.3.5 Cơ sở liệu Test Hình 3.5: Bảng sở liệu Test Là tập sở liệu có ñược sau tiến hành kiểm tra tập sở liệu thuê bao dùng phương pháp ñịnh CSDL cho phép dự ñoán người có khả rời bỏ hay không Menu xem liệu gốc cho phép xem tập sở liệu huấn luyện một Footer Page 22 of 126 Header Page 23 of 126 - 21- Dự ñoán tăng trưởng số thuê bao theo phương pháp hồi quy Hình 3.7: Dự ñoán tăng trưởng số thuê bao năm Hình 3.8: Biểu ñồ tăng trưởng Footer Page 23 of 126 Header Page 24 of 126 - 22- 3.4 ĐÁNH GIÁ Phần mềm hạn chế ñã ñưa số kết ñịnh, cho phép truy cập liệu, xem liệu gốc, ñưa khả dự ñoán cho khách hàng tăng trưởng năm Để có có giá trị sử dụng cao cần có ñầu tư thời gian nhiều Footer Page 24 of 126 Header Page 25 of 126 - 23- KẾT LUẬN Đề tài Ứng dụng Khai phá liệu ñể dự ñoán tăng trưởng số thuê bao di ñộng ñã ñáp ứng ñược yêu cầu ñặt Đề tài ñã xây dựng ñược phần mềm có chức khai phá liệu ñáp ứng ñầu toán phục vụ công tác tham mưu, quản lý việc quy hoạch phát triển số thuê bao di ñộng Các kết ñạt ñược ñề tài: • Nắm vững kiến thức công nghệ: Quy trình khai phá liệu, DotNet, SQL 2005 • Nâng cao tính làm việc theo nhóm, khả tìm kiếm tài liệu, thông tin, kỹ thuật sở liệu, trích lọc, biến ñổi, thu gọn liệu • Đã tiến hành thu thập, tổng hợp thông tin, quản lý khách hàng sử dụng thuê bao di ñộng, nghiệp vụ xử lý cước • Đã thực tốt giải thuật ñịnh ñể phân lớp khách hàng: ñưa dự ñoán - Khách hàng tiềm - Khách hàng rời bỏ - Tính ñược số phần trăm thuê bao ảo - Ước lượng, ñiều chỉnh nhu cầu sử dụng áp dụng ñầu tư công nghệ ñáp ứng ñược công nghệ cho mạng di ñộng hoạt ñộng tốt • Cho phép người dùng khai thác tra dự ñoán tăng trưởng hàng năm ñưa dạng hai hình thức Footer Page 25 of 126 Header Page 26 of 126 - 24- - Dạng biểu ñồ - Dạng bảng • Đánh giá xu hướng biến ñổi sản lượng sản phẩm, dịch vụ: mục tiêu chức từ thông tin tình hình sản xuất, kinh doanh sản phẩm, dịch vụ • Cho phép người quản trị cập nhật thông tin cách nhanh chóng, ñơn giản ñáp ứng nhu cầu quản lý khai thác thông tin Những hạn chế ñề tài: - Đề tài ñã cố gắng thu thập, tổng hợp, phân tích liệu ñưa dự ñoán khác Tuy nhiên, số liệu thu thập dựa mẫu chưa phản ánh tình hình khách quan, thực tế lại sở liệu lớn - Các giải thuật chưa phải giải pháp tối ưu ñể lựa chọn mẫu thông tin cần thiết - Các số liệu thu thập phân tích chưa ñồng Hướng phát triển: Do ñề tài triển khai xây dựng sở liệu ghi nên tương tác sở liệu lớn nên việc cập nhật liệu khó khăn Cần xây dựng quản lý sở liệu tối ưu ñể thực chức dự ñoán xác khách quan Footer Page 26 of 126 ... tổng quan khai phá liệu Tìm hiểu khái quát chung khai phá liệu, bước khai phá liệu, công cụ cụ thể tiếp cận ñược ñưa ñể giải toán Chương 2: Dự ñoán tăng trưởng số thuê bao Đưa toán tăng trưởng, ... nhật, khởi tạo, xem liệu gốc Bên phải thao tác với dự ñoán Dự ñoán xu hướng dự ñoán ñưa danh sách người rời bỏ không rời bỏ Dự ñoán tăng trưởng dự ñoán số thuê bao tăng hàng năm bao nhiêu, tính theo... phép xem tập sở liệu huấn luyện một Footer Page 22 of 126 Header Page 23 of 126 - 21- Dự ñoán tăng trưởng số thuê bao theo phương pháp hồi quy Hình 3.7: Dự ñoán tăng trưởng số thuê bao năm Hình