V. Kết quả dự kiến
2.2.2 Phân loại tế bào máu sử dụng thuật tốn SVM
Nhiều cơng trình nghiên cứu trên thế giới đã cơng bố về phương pháp sử dụng thuật tốn SVM để phân loại tế bào máu và đã đạt được nhiều kết quả khả quan. Tác giả trình bày tĩm tắt một số bài báo sử dụng thuật tốn SVM để phân loại tế bào máu như sau:
Trong bài báo “Comparative study of shape, intensity and texture features and support vector machine for white blood cell classification” [21] các tác giả đã sử dụng thuật tốn SVM để phân loại ảnh tế bào bạch cầu thành 5 lớp. Các tác giả đã thực hiện việc phân đoạn nhân tế bào bạch cầu và nội suy đường bao của tế bào, sau đĩ sử dụng các đặc trưng phân loại bao gồm các tính chất về hình dạng, tính chất thống kê và tính chất về cấu trúc tế bào để làm chỉ số đầu vào cho quá trình phân loại. Việc giảm số chiều vector của những tính chất này được thực hiện và xử lý với thuật tốn kernel-PCA và Dual-Tree Complex Wavelet Transform (DTCWT). Độ chính xác khi sử dụng thuật tốn phân loại SVM kết hợp với DT- CWT đạt 84%.
Các tác giả trong bài báo “Microscopic Blood Smear: A Resource-Aware Healthcare Service in Smart Cities” [25] đã áp dụng thuật tốn SVM để phân loại tế bào bạch cầu thành 5 lớp. Tác giả đã sử dụng thuật tốn K-means để phân đoạn tế bào bạch cầu trong khơng gian màu HIS. Những đặc trưng phân loại được sử dụng bao gồm tính chất về hình thái học, tính chất thống kê và tính chất về cấu tạo tế bào. Những tính chất này được tác giả trích xuất trong miền tần số, để làm được điều này tác giả đã áp dụng biến đổi Wavelet cho mỗi hình ảnh bạch cầu. Sau đĩ các tính chất này được giảm số chiều bởi áp dụng thuật tốn PCA. Thuật tốn phân loại Multi-class SVM được ứng dụng để phân loại các tế bào bạch cầu, tỉ lệ chính xác đạt 94,3 %.
Thuật tốn SVM đã được sử dụng trong bài báo “Leukocyte subtypes classification by means of image processing” [27] để phân loại các tế bào bạch cầu thành 2 lớp là bạch cầu lympho và bạch cầu trung tính. Thuật tốn K-means để phân đoạn các tế bào bạch cầu trong khơng gian màu L*a*b, sau đĩ các tác giả đã tính tốn đặc trưng phân loại dựa trên Pseudo-Zernike -moment, sử dụng thuật tốn PCA để giảm số chiều của các đặc trưng phân loại. Phương pháp này sử dụng thuật tốn SVM để phân loại các tế bào với tỉ lệ chính xác đạt 97%.
26 Trong tài liệu tham khảo “Classification of White Blood Cells Using LMoments Invariant Features of Nuclei Shape” [19], các tác giả đã áp dụng thuật tốn SVM để phân loại nhân tế bào thành 10 lớp tế bào bạch cầu với 3 nhĩm chính gồm bạch cầu hạt, bạch cầu lympho, bạch cầu mono. Thuật tốn Geometric Active Contours (GAC) được sử dụng để phân đoạn nhân tế bào bạch cầu, sau đĩ các tác giả sử dụng các đặc trưng phân loại là các moment bất biến L-scale, Lskewness, L-mean and L-kurtosis của hình ảnh. Các tác giả đã sử dụng thuật tốn LDA để lựa chọn những đặc trưng tốt nhất để đưa vào quá trình phân loại sử dụng thuật tốn SVM. Kết quả phân lớp tế bào bạch cầu đạt tỉ lệ trung bình 97,23%. Các cơng trình nghiên cứu đã được cơng bố sử dụng thuật tốn SVM được nêu trên thường trải qua các bước bao gồm: phân đoạn tế bào máu, trích xuất đặc trưng, sử dụng thuật tốn SVM để phân lớp các loại tế bào bạch cầu. Các kết quả của phương pháp sử dụng thuật tốn SVM để phân loại tế bào máu đạt độ chính xác khá cao từ 84% trở lên.
Với việc áp dụng thuật tốn phân loại SVM mà đầu vào của thuật tốn này là các đặc trưng được trích xuất từ kết quả của quá trình phân đoạn tế bào máu. Do vậy việc lựa chọn những đặc trưng phân loại cần phù hợp để vừa cĩ thể đạt được kết quả cao và tránh mơ hình bị quá khớp hay cịn gọi là bị overfitting (mơ hình dự đốn quá khớp với tập huấn luyện, dẫn đến dự đốn khơng hiệu quả đối với tập kiểm tra), vì vậy tác giả đã đề xuất phương pháp phân loại tế bào máu sử dụng thuật tốn SVM đa tầng để cài thiện vấn đề trên.