Mục tiêu nghiên cứu, đối tượng và phạm vi đề tài
Nghiên cứu này tập trung vào việc phân loại tế bạch cầu nhằm hỗ trợ chẩn đoán các bệnh liên quan đến rối loạn máu Bài viết phân tích ưu nhược điểm của các phương pháp hiện có và đề xuất một phương pháp mới để phân loại tế bạch cầu Tác giả đã thực hiện mô phỏng thử nghiệm với bộ cơ sở dữ liệu tế bào máu từ cả trong nước và quốc tế, với hy vọng phát triển một công cụ phần mềm phân loại tế bạch cầu có khả năng ứng dụng thực tiễn.
Đề tài nghiên cứu tập trung vào các loại tế bào bạch cầu, bao gồm bạch cầu trung tính (Neutrophil), bạch cầu ưa baze (Basophil), bạch cầu lympho (Lymphocyte), bạch cầu ưa acid (Eosinophil) và bạch cầu mono (Monocyte).
Đề tài nghiên cứu được thực hiện thông qua khảo sát thực tế tại một số bệnh viện, bao gồm Bệnh viện Huyết học Truyền máu Trung Ương và Bệnh viện Đại học Y Hà Nội Ngoài ra, tác giả còn tham khảo các nghiên cứu, công bố và cơ sở dữ liệu tế bào máu trên toàn cầu để làm phong phú thêm nội dung nghiên cứu.
Ý nghĩa của đề tài
Đề tài nghiên cứu các bệnh lý liên quan đến tế bào bạch cầu và phương pháp chẩn đoán bệnh lý máu, nhấn mạnh tầm quan trọng của việc phân loại và kiểm tra tế bào bạch cầu Hiện nay, các bệnh viện chủ yếu sử dụng kỹ thuật phân loại thủ công qua kính hiển vi, dẫn đến việc khó phát hiện một số tế bào bạch cầu và chẩn đoán các bệnh lý Để cải thiện tình hình, đề tài đã áp dụng kỹ thuật khoa học máy tính, cụ thể là các mô hình học sâu, nhằm phân tích và phân loại hình ảnh tế bào bạch cầu Nghiên cứu đã chỉ ra rằng các mô hình mạng ANN và SVM đa tầng có thể xây dựng hệ thống tự động phân loại tế bạch cầu với độ chính xác cao và thời gian xử lý nhanh, chứng minh hiệu quả của học sâu trong phân tích hình ảnh tế bào máu và ứng dụng trong y học.
Việc phát triển phần mềm tự động phân loại tế bào bạch cầu nâng cao hiệu quả chẩn đoán mẫu máu dưới kính hiển vi, giúp tiết kiệm thời gian phân tích và giảm thiểu khó khăn khi kiểm tra số lượng lớn mẫu máu bằng phương pháp thủ công.
Nội dung nghiên cứu
Với đề tài này, tác giả nghiên cứu các nội dung sau:
- Nghiên cứu các thành phần máu về bệnh lý liên quan đến bạch cầu
- Nghiên cứu các phương pháp phân loại tế bào bạch cầu
- Nghiên cứu phương pháp phân loại tế bào bạch cầu sử dụng thuật toán vector học máy đa tầng
- Nghiên cứu xây dựng công cụ phần mềm phân loại tế bào bạch cầu.
Kết quả dự kiến
Bộ công cụ phần mềm giúp phân loại và đếm số lượng tế bào bạch cầu từ hình ảnh thu được qua kính hiển vi điện tử, kết nối với máy tính qua camera.
MỘT SỐ PHƯƠNG PHÁP PHÂN LOẠI TẾ BÀO BẠCH CẦU 21
Giới thiệu chương
Trong quá trình phát triển phân loại tế bào bạch cầu tự động, nhiều nghiên cứu đã đề xuất các phương pháp phân loại tế bào máu dựa trên nhiều thuật toán, bao gồm các bước như phân đoạn tế bào, phân đoạn nhân tế bào, trích xuất đặc trưng và phân loại tế bào Với sự tiến bộ của công nghệ máy tính, mạng neural đã thúc đẩy ứng dụng nhanh chóng của mô hình học sâu (deep learning) trong việc phát hiện và phân loại đối tượng với độ chính xác cao, như R-CNN, ANN, SVM kết hợp CNN, và thuật toán SVM đa tầng Các phương pháp này có ưu điểm là đạt được độ chính xác tốt mà không cần cơ sở dữ liệu lớn và thời gian huấn luyện ngắn Tuy nhiên, quá trình phân đoạn và trích xuất đặc trưng vẫn gặp khó khăn do sự đa dạng về màu sắc, kích thước của các loại tế bào bình thường và bất thường, cũng như phương pháp nhuộm.
Để phân loại tế bào bạch cầu, bước đầu tiên là thu thập hình ảnh của chúng từ các mẫu phết máu ngoại vi trên lam kính hiển vi Hình ảnh này được ghi lại bằng máy ảnh kỹ thuật số sau khi đặt các phiến kính dưới kính hiển vi quang học với các mức chiếu sáng và độ phóng đại từ 10x đến 1000x Việc sử dụng máy ảnh kỹ thuật số chất lượng cao giúp trình bày, nâng cao và quan sát tế bào máu một cách hiệu quả Một số máy ảnh kỹ thuật số có thể hoạt động độc lập với kính hiển vi, tạo thuận lợi cho quá trình phân tích.
Hình 2.1 Các bước phân loại tế bào bạch cầu
Bước đầu tiên trong việc phân tích bạch cầu (WBCs) là thu nhận hình ảnh từ các mẫu phết máu ngoại vi trên lam kính hiển vi Kỹ thuật nhuộm bạch cầu được áp dụng nhằm tăng cường độ tương phản bằng cách thay đổi màu sắc của một số bộ phận trong cấu trúc tế bào, giúp quan sát rõ hơn các chi tiết tế bào Quá trình nhuộm này tạo ra độ tương phản cần thiết để phân đoạn, đếm và phân loại các tế bào một cách chính xác.
Bước tiền xử lý hình ảnh là quá trình cải thiện dữ liệu hình ảnh nhằm loại bỏ biến dạng không mong muốn, tiếng ồn và nâng cao các tính năng quan trọng để phục vụ cho phân đoạn và phân loại Quá trình này cũng bao gồm các phép biến đổi hình học như xoay, chia tỷ lệ và dịch để tối ưu hóa chất lượng hình ảnh.
Quá trình phân đoạn trong việc phát hiện bạch cầu (WBC) và các thành phần của chúng, bao gồm nhân và tế bào chất, đồng thời phân biệt với hồng cầu (RBC), nền và huyết tương trong hình ảnh phết máu ngoại vi, được thực hiện thông qua các kỹ thuật xử lý hình ảnh và tín hiệu Những kỹ thuật này dựa vào hình dạng, màu sắc, các cạnh và hình học để thực hiện phân đoạn chính xác.
Bước 4 trong phân loại bạch cầu (WBC) là biểu diễn trích xuất đặc trưng, đóng vai trò quan trọng trong quá trình này Các đặc trưng được trích xuất bao gồm các yếu tố hình học như diện tích, bán kính, chu vi, diện tích lồi, độ dài trục chính, độ nhỏ gọn và hướng Ngoài ra, còn có các đặc trưng kết cấu như động lượng, độ tương phản, entropy và độ lệch, cùng với các đặc trưng màu sắc như phân bố màu và biểu đồ màu.
Bước 5 trong quá trình phân loại các loại bạch cầu (WBCs) rất quan trọng cho việc đánh giá và chẩn đoán nhiều bệnh Nhiều kỹ thuật máy học hiện đại như rừng ngẫu nhiên, máy hỗ trợ vectơ (SVM), Deep Learning (DL), mạng thần kinh nhân tạo (ANN), và các mô hình cây phân lớp đã được áp dụng để phân loại WBCs Trong số đó, phân loại bằng SVM được ưa chuộng nhất nhờ vào khả năng thực hiện phân loại nhanh chóng.
Bước 6: Quá trình đánh giá đóng vai trò quan trọng trong phân loại Việc này được thực hiện bằng cách sử dụng các thước đo số như độ chính xác hoặc biểu diễn đồ họa hiệu suất, chẳng hạn như đường cong đặc tính hoạt động của máy thu (ROC) Độ chính xác là thước đo hiệu suất phổ biến nhất, thể hiện tỷ lệ giữa số lớp dự đoán chính xác và lớp thực tế.
Máy học và nhận dạng mẫu đóng vai trò quan trọng trong hình ảnh y tế kỹ thuật số, đặc biệt trong chẩn đoán hỗ trợ bằng máy tính và phân tích hình ảnh Việc nhận diện mẫu hình ảnh y tế yêu cầu "học tập từ các mẫu", cho phép phân loại các đối tượng như tế bào bạch cầu thành các lớp WBC cụ thể dựa trên các đặc điểm đầu vào như hình dạng, cường độ và kết cấu từ hình ảnh.
WBC đã được phân đoạn bằng nhiều phương pháp khác nhau, trong đó bao gồm Mạng nơron nhân tạo không tham số (ANN), Hỗ trợ vectơ máy học kết hợp với thuật toán Random Forest, biến đổi Wavelet Phức hợp Cây kép (DT-CWT), và Máy vectơ hỗ trợ (SVM) Những phương pháp này giúp cải thiện độ chính xác trong việc phân loại tế bào WBC.
Phương pháp hỗ trợ véc tơ học máy (SVM)
SVM, khác với các phương pháp phân loại truyền thống, giúp giảm thiểu lỗi đào tạo bằng cách tối đa hóa lề giữa siêu phân tách mặt phẳng của dữ liệu, nhằm giảm thiểu giới hạn trên của lỗi tổng quát hóa Nguyên tắc này liên quan đến việc giảm thiểu rủi ro cơ cấu SVM trở nên phổ biến nhờ vào khả năng phân tích biểu thức dữ liệu, tính linh hoạt trong việc chọn hàm tương tự, khả năng xử lý các tập dữ liệu lớn và không gian tính năng rộng lớn, cũng như khả năng xác định các điểm khác biệt Các ứng dụng của SVM đã được chứng minh trong nhiều nghiên cứu Bộ phân loại lợi nhuận tối đa là công cụ tối ưu hóa đơn giản nhất được sử dụng với SVM.
2.2.1 Tóm lược về thuật toán SVM
SVM (Support Vector Machine) là một thuật toán giám sát chủ yếu được sử dụng cho phân loại, mặc dù nó cũng có thể áp dụng cho hồi quy Trong quá trình thực hiện, dữ liệu được biểu diễn dưới dạng các điểm trong không gian n chiều, với n là số lượng tính năng Mục tiêu của thuật toán là tìm kiếm một hyper-plane, hay còn gọi là "đường bay", để phân chia các lớp dữ liệu thành hai phần riêng biệt Hyper-plane này đóng vai trò quan trọng trong việc xác định ranh giới giữa các lớp khác nhau.
Hình 2.2 Ví dụ siêu phẳng với lề cực đại trong R2
Máy học vectơ hỗ trợ (SVM) là một giải thuật máy học dựa trên lý thuyết học thống kê do Vapnik và Chervonenkis phát triển SVM chủ yếu được sử dụng để giải quyết bài toán phân loại hai lớp, trong đó có n điểm trong không gian d chiều, mỗi điểm thuộc một lớp được ký hiệu là +1 hoặc -1 Mục tiêu của SVM là tìm một siêu phẳng (hyperplane) phân hoạch tối ưu, giúp chia các điểm thành hai phần sao cho các điểm cùng lớp nằm về một phía của siêu phẳng.
Reference source not found cho một minh họa phân lớp với SVM trong mặt phẳng
Trong bài viết này, chúng ta xem xét một tập dữ liệu mẫu có thể tách rời tuyến tính, bao gồm các cặp (𝑥𝑖, 𝑦𝑖) với 𝑥𝑖 thuộc R^d và 𝑦𝑖 thuộc {±1} Mục tiêu là tìm siêu phẳng tối ưu H: y = w.x + b = 0, có khả năng phân tách dữ liệu thành hai lớp với khoảng cách lớn nhất, đồng thời xác định hai siêu phẳng H1 và H2 song song với H Điều kiện cần thiết là không có phần tử nào của tập mẫu nằm giữa H1 và H2, dẫn đến các điều kiện w.x + b >= +1 cho y = +1 và w.x + b >= -1 cho y = -1.
Kết hợp hai điều kiện trên ta có y(w.x + b) >= 1
Khoảng cách của siêu phẳng H1 và H2 đến H là ||w|| Ta cần tìm siêu phẳng
H với lề lớn nhất, tức là giải bài toán tối ưu tìm min ||w|| với ràng buộc y(w.x + b)
Người ta có thể chuyển bài toán sang bài toán tương đương nhưng dễ giải hơn là min 1
2𝑤 2 với ràng buộc y(w.x + b) >= 1 Lời giải cho bài toán tối ưu này là cực tiểu hóa hàm Lagrange:
Trong đó α là các hệ số Lagrange, α≥0 Sau đó người ta chuyển thành bài toán đối ngẫu là cực đại hóa hàm W(α): max 𝑎 𝑊(𝑎)= max 𝑎 (min 𝑤,𝑏 𝐿(𝑤, 𝑏, 𝑎)) (2.3)
Để tìm ra các giá trị tối ưu cho w, b và α, ta cần giải bài toán Sau đó, việc phân loại một mẫu mới trở nên đơn giản, chỉ cần kiểm tra hàm dấu sign(wx + b).
Giải pháp tìm siêu phẳng tối ưu có thể áp dụng cho dữ liệu không tách rời tuyến tính bằng cách ánh xạ dữ liệu vào không gian có số chiều lớn hơn thông qua hàm nhân K (kernel).
Phương pháp SVM là một kỹ thuật phân loại hiệu quả, cho phép đạt được độ chính xác cao mà không cần một cơ sở dữ liệu đầu vào lớn Nhiều nghiên cứu trong những năm gần đây đã áp dụng thuật toán SVM trong phân loại và đã ghi nhận những kết quả khả quan.
Trong chương trước, chúng ta đã thảo luận về hình ảnh thu được qua kính hiển vi Hiện nay, việc phân loại và kiểm tra tế bào đã trở thành quy trình phổ biến tại hầu hết các bệnh viện.
Phương pháp thủ công trong việc phân tích 25 mẫu máu sử dụng kính hiển vi không kết nối với máy tính qua camera, dẫn đến việc cơ sở dữ liệu hình ảnh tế bào máu trên internet còn hạn chế Điều này tạo ra thách thức trong việc thực nghiệm và phân loại tế bào máu trong nhiều bài báo Do đó, việc áp dụng thuật toán SVM là giải pháp hợp lý để phân loại các tế bào máu từ hình ảnh thu được.
2.2.2 Phân loại tế bào máu sử dụng thuật toán SVM
Nhiều nghiên cứu toàn cầu đã chứng minh hiệu quả của thuật toán SVM trong việc phân loại tế bào máu, mang lại nhiều kết quả khả quan Bài viết này tóm tắt một số nghiên cứu tiêu biểu sử dụng thuật toán SVM cho mục đích phân loại tế bào máu.
Trong bài báo “Nghiên cứu so sánh các đặc trưng hình dạng, cường độ và kết cấu cùng với máy vector hỗ trợ (SVM) để phân loại tế bào bạch cầu”, các tác giả đã áp dụng thuật toán SVM để phân loại hình ảnh tế bào bạch cầu thành 5 lớp Họ đã thực hiện phân đoạn nhân tế bào và nội suy đường bao của tế bào, sau đó sử dụng các đặc trưng phân loại như hình dạng, tính chất thống kê và cấu trúc tế bào làm đầu vào cho quá trình phân loại Để giảm số chiều vector của các đặc trưng này, họ đã áp dụng thuật toán kernel-PCA và Biến đổi sóng phức Dual-Tree (DTCWT) Kết quả cho thấy độ chính xác khi sử dụng SVM kết hợp với DTCWT đạt 84%.
Trong bài báo “Microscopic Blood Smear: A Resource-Aware Healthcare Service in Smart Cities”, các tác giả đã sử dụng thuật toán SVM để phân loại tế bào bạch cầu thành 5 lớp khác nhau Họ áp dụng thuật toán K-means để phân đoạn tế bào bạch cầu trong không gian màu HIS, với các đặc trưng phân loại bao gồm hình thái học, thống kê và cấu trúc tế bào Để trích xuất các đặc trưng này trong miền tần số, tác giả đã sử dụng biến đổi Wavelet cho từng hình ảnh bạch cầu, sau đó giảm số chiều bằng thuật toán PCA Cuối cùng, thuật toán phân loại Multi-class SVM được áp dụng, đạt tỉ lệ chính xác lên tới 94,3%.
Trong bài báo “Leukocyte subtypes classification by means of image processing”, thuật toán SVM được áp dụng để phân loại tế bạch cầu thành hai loại: bạch cầu lympho và bạch cầu trung tính Các tế bào bạch cầu được phân đoạn trong không gian màu L*a*b bằng thuật toán K-means Sau đó, các tác giả tính toán đặc trưng phân loại dựa trên Pseudo-Zernike-moment và sử dụng thuật toán PCA để giảm số chiều của các đặc trưng này Phương pháp này cho kết quả phân loại với độ chính xác lên đến 97%.
Trong nghiên cứu "Phân loại tế bào bạch cầu sử dụng các đặc trưng hình dạng nhân tế bào bất biến L-moments," các tác giả đã áp dụng thuật toán SVM để phân loại 10 loại tế bào bạch cầu, chia thành 3 nhóm chính: bạch cầu hạt, bạch cầu lympho, và bạch cầu mono Thuật toán Geometric Active Contours (GAC) được sử dụng để phân đoạn nhân tế bào, sau đó các đặc trưng như L-scale, L-skewness, L-mean và L-kurtosis được trích xuất Các tác giả cũng đã áp dụng thuật toán LDA để chọn lọc các đặc trưng tốt nhất cho quá trình phân loại bằng SVM, với kết quả đạt tỷ lệ chính xác trung bình 97,23% Các nghiên cứu sử dụng SVM thường trải qua các bước phân đoạn tế bào máu, trích xuất đặc trưng và phân loại, cho thấy độ chính xác cao từ 84% trở lên.
Bài viết đề cập đến việc áp dụng thuật toán phân loại SVM với đầu vào là các đặc trưng được trích xuất từ quá trình phân đoạn tế bào máu Việc lựa chọn đặc trưng phân loại phù hợp là rất quan trọng để đạt được kết quả cao và tránh hiện tượng overfitting, nơi mô hình dự đoán quá khớp với tập huấn luyện, dẫn đến hiệu suất kém trên tập kiểm tra Do đó, tác giả đã đề xuất phương pháp phân loại tế bào máu sử dụng thuật toán SVM đa tầng nhằm cải thiện vấn đề này.
Phương pháp hỗ trợ véc tơ học máy kết hợp với mô hình cây phân lớp 26
2.3.1 Cách tiếp cận và tách bạch cầu Đề xuất phương pháp tiếp cận bao gồm ba bước chung:
1 Thu nhận hình ảnh và phân biệt WBCs từ RBCs
2 Trích xuất các đặc điểm hình dạng, cường độ và kết cấu
3 Phân loại vào năm loại Tế bào Bạch cầu bằng Máy hỗ trợ Véc tơ Đầu vào cho nghiên cứu là hình ảnh màu kỹ thuật số của phết máu ngoại vi mỏng Thuật toán khử nhiễu và khử nhiễu được trang bị được áp dụng cho những hình ảnh máu này bằng cách sử dụng wavelet hai biến co ngót và lọc bảo toàn cạnh Kuwahara được thực hiện để bù cho Bivariate làm mờ tác dụng phụ [22] Những hình ảnh này sau đó được tăng cường bởi sự kết hợp của Otsu và Niblack thuật toán binarization Tiếp theo, các tế bào máu trắng được xác định vị trí và phân đoạn theo thủ tục như sau: a Trích xuất các hình ảnh phụ chứa các vùng Bạch cầu khép kín riêng lẻ Thuật toán gần như xác định vị trí của nhân WBCs và tăng cường ranh giới của WBC
Sử dụng phương pháp lặp lại từng bước dựa trên ước tính kích thước hồng cầu và vật thể hình tròn, kết hợp với giá trị bão hòa và loại bỏ nhiễu, nhằm tách bạch cầu và hồng cầu thành hai cá thể ảnh phụ, giúp phân tách bạch cầu khỏi hồng cầu một cách hiệu quả.
2.3.2 Các tính năng dựa trên mô hình cây phân lớp (Wavelet phức hợp cây kép)
Khi máy ảnh quét qua các lam máu ngoại vi, các hạt có thể được phát hiện với độ phóng đại, góc độ, màu sắc và chất lượng khác nhau Để phát triển một chiến lược hiệu quả trong việc lưu trữ các tính năng, cần thiết phải có các bộ mô tả cục bộ cho các vùng hình ảnh mạnh mẽ và bất biến Trong số các vectơ đặc trưng, biến đổi wavelet cây kép là một phương pháp nâng cao cho phép tính toán sự biến đổi phức tạp của tín hiệu, sử dụng hai phân rã Wavelet Transform rời rạc để trình bày các đặc tính bất biến của cấu trúc hình ảnh máu kỹ thuật số.
Phân tích biến đổi Wavelet là công cụ mạnh mẽ giúp nắm bắt cấu trúc và chi tiết hình ảnh cục bộ, tuy nhiên, nó vẫn tồn tại một số nhược điểm như dao động, phương sai dịch chuyển, aliasing và thiếu định hướng Để khắc phục những vấn đề này, các phương pháp như biến đổi Wavelet kép, mật độ kép và phức tạp Wavelet Transforms đã được giới thiệu Biến đổi Wavelet hai cây, một phiên bản nâng cao của DWT, mang lại các thuộc tính phụ gia, dịch chuyển bất biến và tính chọn lọc định hướng theo hai chiều Hiện nay, hai phiên bản phổ biến là Kingsbury DT-DWT và Selesnick DT-DWT, được phát triển với các ngân hàng bộ lọc DWT song song để cải thiện hiệu suất phân tích.
Cây Wavelet rời rạc mật độ kép (DT-DWT (S)) và cây kép rời rạc Wavelet Tree (DT-DWT (K)) có nhiều điểm tương đồng Biến đổi wavelet đơn tích hợp cả thông số kỹ thuật của DWT mật độ kép và DWT phức hợp cây kép, điều này thúc đẩy nghiên cứu và phát triển cả hai phương pháp.
Biến đổi Wavelet thông thường cho phép thu được cả hệ số lớn và nhỏ, trong khi Biến đổi Wavelet phức tạp chỉ cung cấp các hệ số có liên quan chặt chẽ đến độ gần của chúng với biên giới.
Hình 2.4 Phương sai dịch chuyển: Hệ số cho cả DWT thông thường và Phức hợp WT
Phép biến đổi Selesnick DT-DWT (S) kết hợp các đặc điểm của biến đổi wavelet rời rạc mật độ kép và biến đổi wavelet rời rạc cây kép mẫu đơn Nó dựa trên hai hàm chia tỷ lệ {𝜙 ℎ (t), 𝜙 𝑔 (t)} cùng với bốn wavelet rõ ràng (𝜓 ℎ,𝑐 (t).
Biến đổi wavelet rời rạc mật độ kép được thực hiện thông qua ngân hàng bộ lọc phân tích 3 kênh (ℎ 0 , ℎ 1 , ℎ 2), áp dụng lần lượt cho các hàng và cột của hình ảnh Kết quả là chín dải phụ 2-D được tính toán trong mỗi cây (h, g), bao gồm một bộ lọc chia tỷ lệ thông thấp 2-D (ϕ(t)) và tám bộ lọc wavelet 2-D (ψ(t)) Các hàm này được hiểu ngầm với 𝑁 𝐺 là hàm lượng tử hóa vảy xám.
Hình 2.5 trình bày Q-shift DT-CWT, thể hiện phần thực và phần ảo của hệ số phức từ hai cây (α, β) Các dấu ngoặc trong hình minh họa cho việc chậm trễ gần đúng của mỗi bộ lọc, với q = 1/4 thời kỳ mẫu.
Phép biến đổi wavelet rời rạc mật độ kép (DT-DWT) có hai thuộc tính nổi bật: độ phức tạp tính toán thấp và khả năng bất biến dịch chuyển gần đúng, giúp nó hiệu quả trong việc nhận diện các đặc trưng kết cấu trong phân loại ảnh Một đánh giá ngắn gọn về DT-DWT và các tính chất toán học liên quan đã được trình bày trong tài liệu [23] Các ứng dụng phổ biến của DT-DWT tương tự như những ứng dụng của Cây Wavelet Rời rạc phức hợp, bao gồm mô hình hóa tín hiệu, tăng cường và phân đoạn hình ảnh, nén và mã hóa dữ liệu, đánh dấu nước, cũng như làm giảm độ nhiễu trong hình ảnh.
DT-CWT kết hợp hai Biến đổi Wavelet kỹ thuật số, sử dụng wavelets chẵn và lẻ để tạo ra các hệ số phức tạp Mỗi cây (α, β) chứa các bộ lọc thực, tạo ra phần thực và ảo tương ứng của mỗi wavelet phức tạp Để thực hiện cây (α, β), cần các bộ lọc thông thấp với độ trễ nhóm chênh lệch một nửa thời kỳ mẫu, trong đó bộ lọc Q-shift đạt được độ trễ nhóm cần thiết Điều này giúp giảm năng lượng răng cưa và cải thiện tính bất biến dịch chuyển Phân tích DT-CWT được áp dụng trong không gian 1-D, dọc theo các hàng và cột, cùng với sáu wavelet phức hợp 2-D có định hướng được tạo ra từ các kết hợp khác nhau của các đầu ra.
Kết quả của DT-CWT bao gồm một tập hợp các hệ số phức tạp, cung cấp một biểu diễn phong phú về cấu trúc cục bộ tại mỗi pixel cho sáu định hướng khác nhau, bao gồm cả ± 𝜋.
Đối với việc sử dụng thông tin trong các vectơ đặc trưng cho SVM, các giá trị phức tạp (thực và ảo) được chuyển đổi sang dạng cực (độ lớn, pha) để cải thiện hiệu suất của bộ phân loại Chúng tôi áp dụng DT-CWT cho hình ảnh ô được phân đoạn ở 6 tỷ lệ, với 14 lần nhấn vào các mẫu hình ảnh, dẫn đến tổng cộng 3204 tính năng từ các thang đo khác nhau.
12) độ lớn ×2, các thành phần pha) cho mỗi mẫu 28 × 28 (hình ảnh được phóng đại thấp)
Tế bào Bạch cầu được phân loại thành năm loại phụ dựa trên phức hợp cây kép hệ số wavelet, sử dụng máy hỗ trợ vector phân loại mạnh mẽ cho phân loại phi tuyến tính trong không gian chiều cao Nghiên cứu này phân tích hiệu suất và hiệu quả của các chiến lược lựa chọn tính năng trên tập dữ liệu nhỏ (28 mẫu cho mỗi lớp) và chất lượng thấp (kích thước hình ảnh 28×28) Ba bộ đào tạo và kiểm tra được giới thiệu, bao gồm vectơ đặc trưng chỉ sử dụng giá trị xám cường độ, các tính năng kết hợp từ giá trị xám cường độ và cường độ, hình dạng, đặc điểm kết cấu, cùng với hệ số DT-CWT (K) riêng biệt.
Trong thử nghiệm đầu tiên, chúng tôi sử dụng một tập dữ liệu giá trị màu xám cường độ với 5×28 mẫu, tạo thành vectơ D1 có kích thước 109760 chiều (5×28×784) Ở thử nghiệm thứ hai, chúng tôi cung cấp một tập hợp dữ liệu đào tạo và thử nghiệm để kiểm tra các yếu tố đầu vào, bao gồm cường độ xám và các đặc điểm liên quan.
Phương pháp hỗ trợ véc tơ học máy kết hợp với thuật toán Ramdom forest
Đến nay, nhiều bộ phân loại đã được phát triển để nhận dạng mẫu, bao gồm Bộ phân loại Bayes, công cụ dự đoán PONDR, cơ sở dữ liệu MobiDB, SVM, bản đồ tuyến tính cục bộ, mạng nơron, máy học cực trị và Random Forest Một số trong số này đã được áp dụng thành công trong phân loại tế bào bạch cầu (WBCs) Trong số các thuật toán, Random Forest, với cấu trúc cây, thường mang lại hiệu quả phân loại tốt hơn so với các bộ phân loại đơn lẻ.
Trong bài báo “Automatic detection and classification of leukocytes using convolutional neural networks”, các tác giả nghiên cứu một hệ thống tự động nhằm phát hiện và phân loại hiệu quả các bạch cầu (WBCs) từ hình ảnh máu ngoại vi Họ đề xuất sử dụng một thuật toán đơn giản để tự động phát hiện WBCs từ nền và trích xuất các đặc trưng ở cấp độ cao thông qua mạng nơ-ron tích chập (CNN) Cuối cùng, họ áp dụng bộ phân loại rừng ngẫu nhiên (random forest) để nâng cao độ chính xác trong việc phân loại các bạch cầu Các bước nghiên cứu được phát triển một cách có hệ thống nhằm tối ưu hóa quy trình này.
Bước 1: Trong quá trình phát hiện bạch cầu (WBCs) từ hình ảnh kính hiển vi, phương pháp này khác biệt so với các phương pháp truyền thống khi không chuyển đổi hình ảnh màu sang không gian màu khác Thay vào đó, nó áp dụng mối quan hệ đơn giản giữa các thành phần R và B dựa trên đặc điểm riêng của WBCs để phân tách chúng khỏi các tế bào khác Thuật toán được đề xuất kết hợp các thùy của hạt nhân, sử dụng các đặc điểm riêng biệt của chúng để tự động phát hiện WBCs một cách chính xác và kịp thời trong các thí nghiệm.
Trong bước trích xuất tính năng, chúng tôi sử dụng CNN để tự động trích xuất các đặc điểm hiệu quả của bạch cầu (WBCs), thay vì dựa vào kinh nghiệm thiết kế tính năng của các chuyên gia như trong một số phương pháp truyền thống.
Trong bước chọn bộ phân loại, thay vì sử dụng một bộ phân loại duy nhất như trong chiến lược truyền thống, chúng ta áp dụng khu rừng ngẫu nhiên với nhiều bộ phân loại có cấu trúc cây để nâng cao độ chính xác cho các tính năng được trích xuất bởi CNN Học sâu tập trung vào việc tìm kiếm các tính năng cấp cao hơn, giúp tăng cường tính bất biến đối với sự thay đổi nội bộ lớp Một ví dụ điển hình về ứng dụng thành công của học sâu trong phân loại hình ảnh là việc sử dụng mạng nơron tích chập (CNN) để phân loại các loại tế bào bạch cầu như bạch cầu ưa acid, bạch cầu ưa baze, bạch cầu trung tính, bạch cầu đơn nhân và tế bào lympho Hệ thống thị giác của con người có khả năng nhanh chóng trích xuất thông tin từ cảnh lộn xộn và phân tích mục tiêu một cách chính xác, trong khi CNN cố gắng mô phỏng nguyên tắc này thông qua cấu trúc mạng lưới và quy tắc học đặc biệt, cho phép nó trích xuất các tính năng cấp cao từ hình ảnh.
Hình 2 7 Năm loại tế bào bạch cầu: eosinophils, basophils, neutrophils, monocytes và lymphocytes 2.4.1 Phương pháp
Hệ thống nhận dạng bạch cầu (WBC) tự động mới được đề xuất nhằm phát hiện WBCs từ hình ảnh kính hiển vi thông qua mối quan hệ giữa màu sắc và các phép toán hình thái học Đối với mỗi WBC, đặc điểm chi tiết được trích xuất bằng phương pháp mẫu nhị phân cục bộ bất biến xoay chiều đồng thời xuất hiện (PRICoLBP) và áp dụng SVM để phân biệt bạch cầu ái toan và basophil với các loại bạch cầu khác Đối với ba loại WBC còn lại, CNN được sử dụng để tự động trích xuất các tính năng ở mức độ cao Cuối cùng, thuật toán Random Forest được áp dụng để phân loại các loại bạch cầu: bạch cầu trung tính, bạch cầu đơn nhân và tế bào bạch huyết.
Sơ đồ của phương pháp đề xuất của chúng tôi được thể hiện trong Hình 2.8
Hình 2.8 Sơ đồ của phương pháp đề xuất 2.4.2 Phát hiện WBCs
Hình ảnh máu ngoại vi I0 chứa nhiều bạch cầu và hồng cầu, do đó, bước đầu tiên trong phương pháp đề xuất của chúng tôi là phát hiện bạch cầu từ hình ảnh I0 Sau khi nhuộm tế bào máu bằng các phương pháp như nhuộm Wright, nhân bạch cầu sẽ có màu đậm, giúp phân biệt dễ dàng với các tế bào khác Các phương pháp cổ điển thường chuyển đổi hình ảnh kính hiển vi từ không gian RGB sang các không gian màu khác như HSI và HSV để chọn các thành phần quan trọng với giá trị ngưỡng thích hợp Trong phương pháp của chúng tôi, chúng tôi tận dụng tính chất đặc biệt của hình ảnh tế bào máu để phát hiện bạch cầu bằng cách sử dụng giá trị chênh lệch giữa màu R và B để tạo ra hình ảnh R - B I1, sau đó áp dụng mã nhị phân với giá trị ngưỡng để làm rõ các hạt nhân, như thể hiện trong Hình 2.10.
Hình 2.9 Một hình ảnh WBC được cắt xén minh họa thuật toán hợp nhất các khu vực thùy
Hình ảnh I2 trong Hình 2.9 cho thấy sự hiện diện của một số vật thể nhỏ không phải hạt nhân của tế bào bạch cầu (WBCs) và một số hạt nhân chưa hoàn chỉnh Để cải thiện chất lượng hình ảnh I2, chúng tôi sẽ áp dụng các phép toán hình thái học nhằm loại bỏ những vật thể nhỏ này và hoàn thiện các hạt nhân.
Phép toán xói mòn và giãn nở trên ảnh I2 giúp loại bỏ các vật thể nhỏ và không đáng kể Sự giảm phân của B trên X có thể được mô tả một cách chi tiết.
Trong phương pháp đề xuất, công thức X ⊖ B = {z ∈ 𝑍 2 | (B)z ⊂ X} (2.5) được sử dụng, trong đó e B là sự phản ánh của B Đầu tiên, thao tác xói mòn được thực hiện một lần để loại bỏ các đối tượng không đáng kể, sau đó tiến hành hoạt động giãn nở hai lần nhằm phát triển nhân của WBCs Hình ảnh rõ ràng 𝐼 3 được thu nhận từ hình 𝐼 2 thông qua quy trình này.
𝐼 3 = (𝐼 2 ⊖ B ⊕ B ⊕ B) ∩ 𝐼 2 (2.6) trong đó B là một số phần tử cấu trúc được chọn
Với thông tin từ hạt nhân trong hình ảnh 𝐼 3, chúng ta tiến hành xác định vị trí và cắt các tế bào bạch cầu (WBC) Đặt (𝑥 𝑖 , 𝑦 𝑖) là tọa độ trung tâm của hình chữ nhật giới hạn nhỏ nhất 𝐴 𝑖 chứa WBC thứ i, với i = 1, 2, , N Trong một số trường hợp, hình chữ nhật được chọn có thể khác nhau.
Trong nghiên cứu này, chúng tôi nhận thấy rằng 36 có thể không bao phủ toàn bộ ô mà chỉ là một thùy của hạt nhân, như minh họa trong Hình 2.9 với ba hình chữ nhật tương ứng cho một WBC Để xác định một hình chữ nhật bao trùm toàn bộ WBC, chúng tôi tính toán khoảng cách Euclidean giữa các tâm của hai hình chữ nhật Nếu khoảng cách này nhỏ hơn đường kính của hạt nhân và số pixel ở hai vùng nhỏ hơn giá trị lớn nhất, chúng tôi coi hai thùy này thuộc cùng một hạt nhân và cập nhật hình chữ nhật cùng tọa độ tâm theo công thức đã đề xuất.
Đường kính của hạt nhân và giá trị lớn nhất có liên quan đến độ phóng đại của hình ảnh Trong ví dụ của hình ảnh được lấy mẫu, một hạt nhân chứa khoảng 3000 pixel cho thấy sự quan trọng của kích thước hạt nhân trong việc cải thiện chất lượng hình ảnh.
Sơ đồ phương pháp phát hiện bạch cầu (WBCs) từ hình ảnh ngoại vi bao gồm các bước chuyển đổi hình ảnh màu thành hình ảnh R-B, sau đó tạo hình ảnh nhị phân bằng cách sử dụng mã hóa nhị phân với giá trị ngưỡng Tiếp theo, các vật thể nhỏ được loại bỏ và các hạt nhân được hoàn thành thông qua các phép toán hình thái học Cuối cùng, vị trí các WBC được xác định bằng thuật toán hợp nhất các thùy của một nhân và từng WBC được cắt ra khỏi hình ảnh ngoại vi.
Hình 2.11 Kiến trúc cụ thể của CNN được áp dụng trong phương pháp đề xuất
Thuật toán tự động phát hiện tất cả các loại bạch cầu (WBCs) từ hình ảnh ngoại vi và xác định loại bạch cầu như bạch cầu trung tính, bạch cầu ưa acid, bạch cầu ưa baze, bạch cầu đơn nhân hay tế bào lympho Các phương pháp truyền thống phân loại bạch cầu thường dựa vào việc trích xuất các đặc điểm của nhân hoặc tế bào chất, bao gồm đặc điểm hình học, kết cấu và màu sắc Kết quả phân loại phụ thuộc nhiều vào sự khác biệt của các tính năng được thiết kế, do đó, việc thiết kế một tính năng hiệu quả là rất quan trọng trong quá trình phân loại WBC.
Phân loại tế bào bạch cầu sử dụng mạng noron nhân tạo (ANN)
Việc phân loại hình ảnh hồng cầu và bạch cầu được thực hiện bởi Mạng thần kinh nhân tạo (ANN), trong đó hình ảnh chứa nhiều hồng cầu và ít bạch cầu Phương pháp phân đoạn giữa tiền cảnh và hậu cảnh giúp xác định vùng quan tâm, là bạch cầu, dễ dàng nhờ vào kích thước và hình dạng lớn hơn của chúng so với hồng cầu Hai yếu tố chính để xác định bạch cầu là kích thước và hình dạng Sau khi phát hiện và phân đoạn, các đặc điểm khác nhau của bạch cầu được chiết xuất và phân loại bằng ANN, cho phép đếm bạch cầu phân biệt và không phân biệt Các bước thực hiện bao gồm việc thu nhận ảnh.
4 Phân loại sử dụng ANN & Counting
Các phiến đồ máu nhuộm Giemsa bất thường thường được thu thập từ phòng thí nghiệm y tế Nhiều hình ảnh trên mỗi trang chiếu được chụp bằng kính hiển vi Coslab với mô-đun chụp ảnh, sử dụng độ phân giải 1280x1024 và phóng đại 40x của vật kính để đảm bảo độ phân giải tốt hơn Độ phân giải cao là cần thiết để phân biệt và phát hiện các loại bạch cầu.
Phân đoạn hình ảnh được chia thành hai phần: Phân đoạn tế bào, phân đoạn hạt nhân a) Phân đoạn tế bào
- RGB sang thang độ xám
- Cân bằng biểu đồ thích ứng
Hình 2.13 Trình phân đoạn tế bào b) Phân đoạn hạt nhân
- Không gian màu RGB sang HSV
- Thu được đoạn G của ảnh RGB
- Thu được đoạn S của ảnh HSV
Hình 2.14 Quá trình phân đoạn hạt nhân
2.5.2 Trích xuất tính năng & Nhận dạng tế bào
Sau quá trình phân đoạn hình thái, các tính năng như vùng ô, vùng hạt nhân, tỷ lệ nhân/diện tích tế bào, chu vi, độ lệch tâm, trục chính, trục nhỏ và tỷ số của chúng, cùng với số lượng tiểu thùy trong hạt nhân được trích xuất Những tính năng này cho phép xác định năm loại bạch cầu một cách thủ công Bên cạnh đó, các thông số dựa trên kết cấu như độ tương phản, tương quan, năng lượng và tính đồng nhất cũng được trích xuất để hỗ trợ phân loại bạch cầu Bảng dưới đây cung cấp giá trị trích xuất cho 15 mẫu bạch cầu, bao gồm bạch cầu ái toan, lympho và bạch cầu trung tính.
Bảng 0.2 Chiết xuất đặc trưng
Contrast Corelation Ennergy Homogeneity Leukocyte
2.5.3 Phân loại tế bào bạch cầu sử dụng ANN & Đếm số lượng
Hệ thống thần kinh sinh học trong khoa học thần kinh là sự kết nối của các tế bào thần kinh, tạo thành một mạng lưới lớn với các nơron tương tác qua các khớp thần kinh Khi tổng hợp tín hiệu đầu vào vượt qua một ngưỡng nhất định, nơron sẽ phát ra tiềm năng hành động (AP) và truyền tín hiệu điện dọc theo sợi trục Mạng nơron nhân tạo (ANN) là mô hình lấy cảm hứng từ mạng lưới thần kinh sinh học, được sử dụng để ước tính hàm phụ thuộc vào nhiều yếu tố đầu vào.
Mạng nơron lấy cảm hứng từ sinh học bao gồm một hệ thống lớn các tế bào thần kinh liên kết, cho phép trao đổi tín hiệu và học hỏi từ kinh nghiệm Trong nghiên cứu này, bạch cầu được phân loại thành ba loại: Eosinophil, Bạch cầu trung tính và Lymphocyte, dựa trên các đặc điểm hình thái như diện tích tế bào và cấu trúc tính năng Để thực hiện phân loại, công cụ nhận dạng mẫu (nprtool) đã được sử dụng để thiết kế một mạng nơron, nhận đầu vào từ 7 giá trị tính năng và cho ra ba loại phân loại Trong quá trình đào tạo, các mẫu được cung cấp cho mạng nơron để điều chỉnh và tối ưu hóa khả năng phân loại.
Xác thực: Các mẫu này được sử dụng để tạm dừng đào tạo khi tổng quát hóa ngừng cải thiện
Kiểm tra: Các mẫu này được sử dụng để đo lường tham số hiệu suất của mạng khi đào tạo và xác nhận được thực hiện
Hình 2.15 Đặc điểm kỹ thuật của ANN 2.5.4 Đặc tả của mạng thần kinh
Tổng số mẫu lấy mẫu: 90
Mô hình mạng: Nguồn cấp dữ liệu hai lớp phía trước
Tế bào thần kinh ẩn: Sigmoid
Nơron đầu ra: Softmax Đào tạo: Scaled Conjugate Gradient
Không có tế bào thần kinh ẩn: 10 Đầu vào: 7 vectơ đầu vào
Hệ thống đã được thiết kế và đánh giá dựa trên bộ ảnh thu được từ kính hiển vi kỹ thuật số với máy ảnh kỹ thuật số ở độ phóng đại 40x Hình ảnh có độ phân giải 1280 x 1024, tạo thành một tập dữ liệu hình ảnh phong phú.
Bài viết trình bày 70 hình ảnh hiển vi của vết bẩn bào mòn với 90 mẫu bạch cầu, bao gồm Lymphocyte, Bạch cầu trung tính và Bạch cầu ái toan Ba loại bạch cầu này chiếm khoảng 97% tổng số bạch cầu, nằm trong vùng quan tâm Quá trình phân loại được thực hiện bằng công cụ nhận dạng mẫu mạng thần kinh trong MATLAB, đạt độ chính xác tổng thể 98,9% Độ chính xác cụ thể cho từng loại bạch cầu là: Eosinophil 100%, Lympho 96,7% và Bạch cầu trung tính 100%.
Kết luận chương
Trong chương 2, tác giả trình bày các phương pháp phân loại tế bào bạch cầu như SVM, cây phân lớp kết hợp SVM, thuật toán Random Forest và mạng nơron ANN Việc đếm số lượng bạch cầu rất quan trọng cho bác sĩ trong chẩn đoán và điều trị, nhưng phương pháp thủ công thường tốn thời gian và dễ mắc lỗi Do đó, hệ thống tự động phân đoạn và phân loại bạch cầu được đánh giá cao Độ chính xác của các thuật toán phân loại WBC phụ thuộc vào quy trình phân đoạn và trích xuất tính năng, cũng như các yếu tố như vị trí, kích thước và giai đoạn trưởng thành của tế bào Học sâu nổi bật hơn các phương pháp học máy truyền thống trong việc nhận dạng và phân loại, cung cấp kết quả phân loại cao và đơn giản hóa quá trình huấn luyện mô hình mà không cần phân đoạn Phương pháp này cũng cho phép tái sử dụng các mô hình đã huấn luyện, giảm thời gian cài đặt cho các bài toán mới.