CHƯƠNG 4: KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN

Trong bài viết này, tơi dã trình bày về khái niệm của mã xấu. Mã xấu không phải là lỗi phần mềm, mã xấu chỉ là những dấu hiệu hay nguy cơ dẫn đến lỗi phần mềm. Đó là lí do và tầm quan trọng của việc phát hiện mã xấu trong các mã nguồn. Nó giúp các nhà phát triển phần mềm ngăn ngừa được các lỗi có thể xảy ra trong tương lai. Bên cạnh đó, kết quả này cũng khẳng định rằng việc phát hiện mã xấu bằng các thuật toán học máy là khả thi và đầy hứa hẹn. Tôi đã công bố bài báo về các thực nghiệm trong việc dự đoán mã xấu sử dụng học máy. Bài báo được đăng trên Hội thảo khoa học quốc gia – CITA 2021. Tên của bài báo là “Experimentations of Machine Learning for Predicting Code Smells” với ID 27.

Trong tương lai tôi sẽ hướng đến việc mở rộng bộ dữ liệu. Như đã đề cập, 13 loại mã xấu được xây dựng không phải là tất cả, hiện nay cịn rất nhiều loại mã xấu khác. Vì vậy việc mở rộng bộ dữ liệu với quy mô lớn hơn là một mục tiêu rất quan trọng và cần thiết. Mặc khác, với độ rộng lớn của bộ dữ liệu, việc sử dụng các thuật toán học máy để phát hiện mã xấu theo phương pháp gán nhãn nhị phân (binary-labels) như hiện tại gây tốn thời gian. Vì lí do này, việc xây dựng và sử dụng các thuật toán học máy theo phương pháp gán

đa nhãn (multi-labels) là mục tiêu nghiên cứu tiếp theo. Nếu thành công, chúng sẽ giúp tiết kiệm thời gian thực thi hơn trong việc phát hiện nhiều mã xấu cùng lúc. Sau khi thực hiện các nghiên cứu này, việc đóng gói chúng thành một cơng cụ sẽ là mục tiêu nghiên cứu tiếp theo của tơi. Hi vọng rằng, các nhà phát triển, lập trình viên có thể sử dụng cơng cụ này để phát hiện các mã xấu và ngăn ngừa các lỗi một cách sớm và hiệu quả nhất.