Biểu diễn phân bố dữ liệu thực nghiệm của hai hệ thống

Một phần của tài liệu Ứng dụng công nghệ mới vào việc phân tích và lưu trữ dữ liệu (Trang 48 - 50)

Từ biểu đồ theo Hình 4.7 ta thấy với dữ liệu đầu vào nhỏ thì thời gian thực nghiệm của hai hệ thống không khác nhau nhiều. Khi dữ liệu càng tăng lên thì số liệu cành chênh lệch. Ta thấy khi dung lượng lên đến 95G thì thời gian chạy trên hệ thống thứ hai chỉ mất khoảng 100 phút, nhưng với hệ thống thứ nhất mất tới 300 phút. Điều này chứng tỏ rằng với công nghệ trên hệ thống thứ hai đảm bảo hoạt động với dữ liệu lớn, khi dữ liệu tăng lên 8 lần thì thời gian chạy chỉ tăng lên khoảng 5 lần. Trong khi đó với hệ thống cũ thì dữ liệu tăng lên 8 lần thì thời gian chạy thực nghiệm tăng lên khoảng 9 lần.

Kết luận, khuyến nghị

Kết luận

Trong đề tài, từ kết quả phân tích so sánh giữa giải pháp cũ và giải pháp mới ta thấy kết quả của giải pháp mới tốt hơn. Thời gian thực hiện import số liệu vào hệ thống nhanh hơn hẳn so với giải pháp cũ. Ngoài ra, dữ liệu cước của khách hàng ngày càng lớn, mỗi năm có thể tăng 20-30%, vì vậy nếu vẫn áp dụng công nghệ cũ và giải pháp cũ sẽ không đáp ứng được nhu cầu thực tế. Với công nghệ mới và giải pháp mới sẽ hoàn toàn có thể đáp ứng được các yêu cầu này, công nghệ được ra đời để chuyên dùng cho các cơ sở dữ liệu lớn, xử lý dữ liệu lớn trong thời gian thực.

Nếu áp dụng giải pháp này vào thực tế, với thử nghiệm trên ta thấy thời gian import có thể giảm tới 3-4 lần. Thời gian import nhanh sẽ đáp ứng được KPI của Bộ thông tin và truyền thông (thời gian có thể tra cứu được cuộc gọi kể từ khi kết thúc cuộc gọi là 45 phút) khi dữ liệu ngày càng lớn và với giải pháp cũ có nguy cơ không đáp ứng được. Công nghệ mới sử dụng một phần bộ nhớ để lưu trữ dữ liệu nên việc truy xuất dữ liệu cũng sẽ nhanh hơn, việc này phục vụ công các chốt sổ cuối tháng sẽ nhanh hơn, đảm bảo cung cấp chi tiết cước cho khách hàng đúng theo cam kết vào mùng hai hàng tháng.

Khuyến nghị

Đây là giải pháp so về mặt kỹ thuật tốt hơn nhiều so với giải pháp cũ, nhanh hơn 3-4 lần. Nhưng về mặt chi phí lại không hoàn toàn tốt hơn, một số phần mềm vẫn cần mua bản quyền (Mulesoft). Tùy thuộc vào mô hình triển khai mà chi phí đầu tư có thể khác nhau. Ngoài ra để chạy được với mô hình mới cần phải chuyển đổi dữ liệu từ hệ thống cũ sang hệ thống mới, việc này cũng không đơn giản khi hệ thống cũ đã có khoảng 15-20T dữ liệu. Để chuyển được cần đầu tư hạ tầng mới và hạ tầng tạm để chuyển đổi dữ liệu. Như vậy, việc áp dụng giải pháp mới hay không sẽ phụ thuộc vào người quản lý.

Để hệ thống đảm bảo về mặt KPI và chuyển dịch sang Big Data đáp ứng với nhu cầu dữ liệu ngày càng lớn của nghiệp vụ viễn thông thì việc áp dụng giải pháp mới là hoàn toàn nên thực hiện. Giải pháp cũ không thể đáp ứng được nhu cầu tăng trưởng dữ liệu trong vòng 4-5 năm tới. Áp dụng công nghệ Big Data là điều tất yếu phải làm.

Tài liệu tham khảo

[1] D. C. Montgomery, Design and analysis of experiments, 9th edition, Wiley & Sons, 2017..

[2] David J. Lilja, Measuring computer performance: A practitioner guide’s, Cambridge University Press, 2004.

[3] R. Jain, The Art of Computer Systems Performance Analysis: Techniques for Experimental Design, Measurement, Simulation, and Modeling, Wiley- Interscience, New York, NY, April 1991.

[4] Data Analysis and Graphics Using R – An Example Approach - Cambridge University Press, 2003, John Maindonald.

[5] Introductory Statistics With R - Springer, 2004 - Peter Dalgaard. [6] Linear Models with R - Chapman & Hall/CRC, 2004 - Julian Faraway. [7] R Graphics (Computer Science and Data Analysis) - Chapman & Hall/CRC,

2005 - Paul Murrell.

[8] Modern Applied Statistics with S-Plus - Springer, 4th Edition,2003. [9] Báo cáo Quý về KPI chất lượng dịch vụ của mạng viễn thông,2019. [10] Báo cáo tổng kết về chất lượng dịch vụ mạng viễn thông,2018. [11] Quy trình tính cước cho thuê bao di động và cố định,2016.

Một phần của tài liệu Ứng dụng công nghệ mới vào việc phân tích và lưu trữ dữ liệu (Trang 48 - 50)