Dữ liệu từ các thiết bị cơng nghệ ngày một phát triển, việc dự báo khả năng hỏng của các thiết đã là một trong các vấn đề đƣợc quan tâm để cĩ phƣơng án thay thế hay sao lƣu dữ liệu quan trọng tránh mất mát dữ liệu, tiết kiệm chi phí đầu tƣ mua sắm, cũng nhƣ đảm bảo về mặt dữ liệu thơng tin, …v.v. Hầu hết các cấu trúc dữ liệu của thiệt bị đều đƣợc biểu diễn dƣới dạng điều kiện cĩ xác suất. Vì vậy, việc nghiên cứu các thuật tốn về dự báo khả năng hỏng của các thiết bị đã và đang đƣợc nghiên cứu, nhằm tối ƣu hĩa các thuật tốn đƣa ra các dự báo chính xác nhất.
77
Hƣớng nghiên cứu tiếp theo của luận văn vẫn sẽ tiếp tục triển khai thuật tốn Nạve Bayes trên mơi trƣờng Spark với dữ liệu của các thiệt bị khác nhƣ (router, switch, Tivi, …v.v). Bên cạnh đĩ nghiên cứu tìm hiểu thêm các thuật tốn khác trên mơi trƣờng Spark để cĩ thể so sánh, đánh giá, và khẳng định tính hiệu quả của chúng trong việc dự báo khả năng hỏng của các thiết bị từ dữ liệu thiết bị lớn.
78
DANH MỤC TÀI LIỆU THAM KHẢO
[1] Nguyễn Thị Thùy Dƣơng, (2015). Nghiên cứu Lý thuyết Naive Bayes và Ứng dụng trong phân loại Văn bản tiếng việt, Luận văn thạc sĩ, Đại học
Cơng Nghệ Thơng Tin và Truyền Thơng.
[2] Trần Thị Oanh, (2006). Thuật tốn SELF-TRAINING Và CO-TRAINING Ứng dụng trong phân lớp văn bản, Khĩa luận tốt nghiệp, Đại học quốc gia
Hà Nội.
[3] Cagatay Catal, Ugur Sevim, Banu Diri, (2011), Practical development of an Eclipse-based software fault prediction tool using Naive Bayes algorithm, Expert Systems with Applications 38 (2011), pp. 2347–2353.
[4] Dan Jurafsky, James H. Martin, (2011), Text Classification and Naive Bayes, Stanford university All rights Reserved.
[5] Jason Brownlee, (2016), Master Machine Learning Algorithms: Discover
How they Work and Implement them from scratch.
[6] Jeffrey Dean and Sanjay Ghemawat, (2004), Mapreduce: Simplified Data Processing on Large Clusters, OSDI 2004.
[7] John King and Roger Magoulas, (2016), 2015 Data Science Salary Survey
Tools, Trends, What Pays (and What Doesn’t) for Data Professionals.
[8] Joseph F. Murray, Gordon F. Hughes and Kenneth Kreutz-Delgado, (2005), Machine Learning Methods for Predicting Failures in Hard Drives: A Multiple-Instance Application, Journal of Machine Learning
Research 6 (2005), pp. 783–816.
[9] Greg Hamerly and Charles Elkan, Bayesian approaches to failure prediction for disk drives, InEighteenth International Conference on
79
[10] Gordon F. Hughes, Joseph F. Murray, Kenneth Kreutz-Delgado, and Charles Elkan. Improved disk-drive failure warnings. IEEE Transactions
on Reliability, 51(3):350–357, September 2002.
[11] Mahmoud Parsian, (2015), Data Algorithms, pp. 327-362 - Tài liệu điện tử:
[12] TIEP HUU VU, 104 Electrical Engineering East Pennsylvania State University University Park, PA 16802, USA, “Học máy cơ bản (https://machinelearningcoban.com/)
[13] BACKBLAZE Company, 500 Ben Franklin Ct San Mateo, CA 94401, USA, “Hard Drive SMART Stats