Tùy thuộc vào các mục đích khác nhau, bằng cách thay đổi độ tương phản của những thành phần tương ứng, những kênh MRI phổ biến sau đây thường được sử dụng trong chẩn đoán: kênh T1 là kên
TỔNG QUAN
Giới thiệu
Trong xã hội hiện nay, bệnh khối u ở não người mặc dù không phải là căn bệnh quá phổ biến, tuy nhiên nó là một trong những bệnh ung thư nguy hiểm nhất, có tỉ lệ tử vong cao [20] Khối u là hiện tượng tăng tế bào không kiểm soát được Một phần ba trong số các khối u não là khối u ác tính [21] Khối u não có thể được phân loại theo nguồn gốc hoặc độ di căn Nó có thể nảy sinh từ não hoặc di căn từ các bộ phận khác của cơ thể Tổ chức WHO đã phân loại khối u não thành bốn cấp từ I tới IV tương ứng với sự tăng dần của mức độ di căn Khối u cấp I và cấp II có thể được coi như là các khối u bán ác tính, trong khi khối u cấp III và cấp IV là các khối u ác tính mà gần như chắc chắn dẫn đến cái chết của người bệnh [22]
Kỹ thuật tiêu chuẩn cho việc chẩn đoán khối u não là ảnh chụp cộng hưởng từ (MRI)
MRI là một kỹ thuật được ứng dụng rộng rãi trong y học, cho phép tạo ra các ảnh có độ tương phản rõ ràng giữa các mô [23] MRI có thể tạo ra các kênh với độ tương phản khác nhau bằng cách thay đổi các tham số của mật độ proton và xung nhịp Vì tính chất tự nhiên và biểu hiện đa dạng của các khối u não, một kênh MRI là không đủ để phân đoạn khối u bao gồm các thành phần con của nó Do đó, các phương pháp hiện nay thường sử dụng nhiều kênh khác nhau cùng lúc để chẩn đoán khối u [24]
Hình 1: Các kênh khác nhau của ảnh MRI não người
LÊ NGỌC DƯƠNG THANH 2 Tùy thuộc vào các mục đích khác nhau, bằng cách thay đổi độ tương phản của những thành phần tương ứng, những kênh MRI phổ biến sau đây thường được sử dụng trong chẩn đoán: kênh T1 là kênh phổ biến nhất cho việc phân tích cấu trúc, giúp cho việc phân biệt dễ dàng các mô khỏe mạnh; kênh T1-gad giúp cho biên của khối u sẽ xuất hiện sáng hơn, từ đó phân biệt dễ dàng tế bào hoại tử và tế bào hoạt động; kênh T2 giúp cho vùng phù nề bao quanh khối u sẽ xuất hiện sáng hơn; kênh T2-FLAIR cho phép phân biệt vùng phù nề với dịch não tủy; kênh T2-TSE giúp làm giảm ảnh hưởng hiệu ứng dòng chảy, cho độ tương phản khối u tốt hơn; và kênh DTI cho phép đo lường khuếch tán của nước trong mô để tạo ra ảnh với các dây thần kinh rõ ràng [7]
Hình 2: Kết quả phân đoạn khối u
Do số lượng lớn của dữ liệu, việc chẩn đoán và phân đoạn khối u thủ công là việc khó có thể thực hiện trong khoảng thời gian thích hợp cho phép Hiện nay, rất nhiều phương pháp phân tích bán tự động hoặc tự động đã được nghiên cứu để hỗ trợ cho việc chẩn đoán [5] Trong đó, việc phân đoạn khối u là một trong những hướng nghiên cứu quan trọng và thách thức nhất [25]
Phân đoạn khối u bao gồm xác định khối u và cả các cấu trúc xung quanh nó Điều này không chỉ cho phép chẩn đoán bệnh mà còn giúp theo dõi sự phát triển của khối u, lên kế hoạch điều trị và phẫu thuật Việc theo dõi phản ứng của khối u sau khi điều trị sẽ ảnh hưởng lớn đến kết quả điều trị, do đó bắt buộc phải có sự miêu tả chính xác những thay đổi về kích thước và tính chất của khối u
Mục tiêu, giới hạn và đối tượng nghiên cứu
Mục tiêu chính cần đạt được của đề tài nghiên cứu cụ thể như sau:
- Phát triển một phương pháp để xác định và phân đoạn các khối u trong ảnh chụp MRI não người một cách tự động với độ chính xác cao
- Xây dựng công cụ giúp trực quan hóa việc phân đoạn khối u
- Cải tiến để đạt được hiệu quả cao về độ chính xác của kết quả phân đoạn
I.2.2 Giới hạn Đề tài nghiên cứu được giới hạn trong phạm vi các phương pháp phân đoạn khối u từ ảnh MRI não người Kết quả phân đoạn sẽ xác định khối u và các thành phần xung quanh nó Phương pháp được hiện thực trên nền tảng Python và trực quan trên nền tảng xử lý ảnh ITK Kết quả từ công cụ này sau đó có thể được sử dụng cho các bước chẩn đoán và điều trị tiếp theo
Dựa vào mục tiêu và giới hạn của nghiên cứu, chúng ta hướng tới các đối tượng nghiên cứu chính bao gồm:
- Các phương pháp phân đoạn khối u trên ảnh MRI não người, đặc biệt tập trung tới các phương pháp tự động hoàn toàn
- Cách hiện thực các phương pháp trên nền tảng Python Thư viện học máy scikit-learn hỗ trợ các phương pháp phân tích dữ liệu và học máy
- Cách xây dựng công cụ trực quan trên nền tảng xử lý ảnh ITK Hỗ trợ đọc dữ liệu, xử lý cũng như hiển thị trực quan kết quả phân tích
CÁC CÔNG TRÌNH LIÊN QUAN
Cơ sở lý thuyết
II.1.1 Ảnh chụp cộng hưởng từ (MRI)
MRI là kỹ thuật tạo hình cắt lớp sử dụng từ trường và sóng radio Nguyên tử hydrogen trong cơ thể dưới tác động từ trường và sóng radio, hấp thụ và phóng thích năng lượng sóng Các mô cơ thể khác nhau sẽ hấp thụ và phóng thích năng lượng khác nhau Quá trình phóng thích năng lượng được máy thu nhận, xử lý, chuyển đổi thành các tín hiệu hình ảnh
Hình 3: Máy chụp cộng hưởng từ Lợi ích của máy cộng hưởng từ:
- Bệnh nhân không bị ảnh hưởng bởi tia xạ
- Bệnh nhân không bị ảnh hưởng gì về mặt sinh học
- Thu được hình chụp đa mặt
- Hiển thị hình ảnh tốt hơn khi so với chụp cắt lớp CT
- Là kỹ thuật chụp hình ảnh không xâm lấn
Bất lợi của máy cộng hưởng từ:
- Không dùng được nếu bệnh nhân bị chứng sợ nơi chật hẹp hay đóng kín
- Thời gian chụp lâu, gặp khó khăn nếu bệnh nhân nặng hay không hợp tác
- Vỏ xương và tổn thương có canxi khảo sát không tốt bằng chụp cắt lớp
Cơ thể chúng ta có tỉ lệ chủ yếu nước Trong thành phần của phân tử nước có nguyên tử hydro Nếu ta dựa vào hoạt động từ tính của các nguyên tử hydro để ghi nhận sự phân bố nước khác nhau của các mô trong cơ thể thì chúng ta có thể ghi hình và phân biệt được các mô đó Mặt khác, trong cùng một cơ quan, các tổn thương bệnh lý đều dẫn đến sự thay đổi phân bố nước tại vị trí tổn thương, dẫn đến hoạt động từ tính tại đó sẽ thay đổi so với mô lành, nên ta cũng sẽ ghi hình được các thương tổn Ứng dụng nguyên lý này, MRI sử dụng một từ trường mạnh và một hệ thống phát các xung có tần số vô tuyến để điều khiển hoạt động điện từ của nhân nguyên tử nhằm bức xạ năng lượng dưới dạng các tín hiệu có tần số vô tuyến Bằng cách điều chỉnh các giá trị thông số của máy chụp, ta sẽ thu được các tương phản ảnh tương ứng với một số đặc tính mô riêng biệt:
- Kênh T1 là kênh phổ biến nhất cho việc phân tích cấu trúc của mô, rất có ý nghĩa trong chẩn đoán lâm sàng, đặc biệt khi phân biệt giữa mô lành và mô bệnh lý Mỡ có thời gian T1 ngắn nhất, nước tự do càng nhiều thời gian T1 càng dài Chất trắng có thời gian T1 ngắn hơn chất xám vì chất trắng chứa nhiều mỡ hơn Mô nào có T1 ngắn sẽ có tín hiệu mạnh (trắng) và mô nào có T1 dài sẽ có tín hiệu yếu (đen)
- Kênh T1-gad giúp cho biên của khối u sẽ xuất hiện sáng hơn, từ đó phân biệt dễ dàng tế bào hoại tử và tế bào hoạt động
- Kênh T2 giúp cho vùng phù nề bao quanh khối u sẽ xuất hiện sáng hơn Mô có T2 dài sẽ cho tín hiệu mạnh (trắng) và T2 ngắn sẽ cho tín hiệu yếu (đen)
- Kênh T2-FLAIR cho phép phân biệt vùng phù nề với dịch não tủy Chuỗi xung FLAIR có ý nghĩa phát hiện các tổn thương khác như chảy máu, viêm não, xơ hóa mảng (MS) Trên FLAIR, dịch não tủy bị xóa tín hiệu nên có màu đen, như vậy nếu có chảy máu màng não, tăng tín hiệu, sẽ dễ dàng nhận ra
- Kênh T2-TSE giúp làm giảm ảnh hưởng hiệu ứng dòng chảy [17], cho độ tương phản khối u tốt hơn
- Kênh DTI cho phép đo lường khuếch tán của nước trong mô để tạo ra ảnh với các dây thần kinh rõ ràng
II.1.2 Rừng ngẫu nhiên (Random Forests)
Cây quyết định là một phương pháp phổ biến trong học máy Thông thường, cây quyết định cho ra kết quả có thiên vị thấp và phương sai cao [15] Để giảm phương sai, phương pháp rừng ngẫu nhiên đã được giới thiệu Giá trị trung bình của các cây sẽ được sử dụng, vì vậy giảm được phương sai, trong khi thiên vị vẫn giữ ở mức thấp
Hình 4: Mối quan hệ thiên vị và phương sai
Rừng ngẫu nhiên (RF) [8], [10], [11] là một tập hợp của các cây quyết định được huấn luyện ngẫu nhiên RF được thiết lập từ một số các thành phần như số lượng cây, hàm chia ở mỗi nút, hàm dự đoán ở các nút lá…
Mỗi nút sẽ tương ứng một hàm chia nhị phân Dữ liệu đến nút này sẽ được chia qua nút con bên trái hoặc bên phải dựa vào hàm chia Hàm chia cũng sẽ lựa chọn đặc trưng tốt nhất từ một tập con ngẫu nhiên của tất cả các đặc trưng Suốt quá trình huấn luyện, hàm chia và các đặc trưng sẽ được tính toán và tối ưu Điểm quan trọng của RF là các cây con sẽ được xây dựng khác nhau Điều này dẫn đến sự không tương đồng giữa các cây, làm tăng khả năng dự đoán và giảm nhiễu
Lỗi tổng quát của rừng phụ thuộc vào độ chính xác của từng cây thành viên trong rừng và sự phụ thuộc lẫn nhau giữa các cây thành viên Giải thuật rừng ngẫu nhiên cho độ chính xác cao khi so sánh với các thuật toán học có giám sát hiện nay, chịu đựng nhiễu tốt Ở cuối quá trình huấn luyện, thông tin để dự đoán sẽ được học ở các nút lá Mỗi nút lá sẽ chứa một xác suất của tất cả các lớp tương ứng với tập dữ liệu đang chứa ở nút lá Trong quá trình kiểm tra, mỗi cây sẽ cho kết quả xác suất của từng lớp đối với dữ liệu kiểm tra Kết quả trung bình của tất cả các cây sẽ là kết quả dự đoán của RF
Hình 5: Quá trình kiểm tra ở từng cây quyết định
Trong hình 5, ví dụ một rừng gồm 3 cây quyết định Mỗi cây có cấu trúc khác nhau
Khi một đối tượng v cần phân loại đi vào nút gốc, nó sẽ lần lượt đi qua từng nút con dựa theo hàm chia tương ứng cho đến nút lá Khi đó, mỗi cây sẽ cho ra một kết quả khác nhau Và giá trị trung bình của 3 cây sẽ là kết quả phân lớp của đối tượng đó
Một lựa chọn quan trọng khác là điều kiện để dừng huấn luyện ở mỗi cây Điều kiện được sử dụng phổ biến là khi cây đạt đến độ cao giới hạn Một điều kiện khác có thể sử dụng là khi nút chứa ít hơn số lượng dữ liệu giới hạn
Các ưu điểm của rừng ngẫu nhiên:
- Đây là một trong những phương pháp học máy chính xác nhất hiện nay Với rất nhiều tập dữ liệu, nó cho ra kết quả phân loại có độ chính xác rất cao
- Có thể sử dụng hiệu quả với tập dữ liệu có kích thước lớn
- Có thể sử dụng với hàng ngàn đầu vào mà không cần phải xóa bớt
- Cung cấp thông tin về những đầu vào nào quan trọng trong quá trình phân loại
- Tạo ra các kết quả dự đoán không mang yếu tố thiên vị nhờ vào quá trình xây dựng tập hợp các cây quyết định
- Là phương pháp hiệu quả cho việc ước lượng các dữ liệu bị thiếu và duy trì độ chính xác ngay cả khi một lượng lớn dữ liệu bị thiếu
- Có khả năng cân bằng lỗi trong những tập dữ liệu phân bố không cân bằng
- Rừng quyết định được sinh ra có thể được lưu trữ cho việc sử dụng trên dữ liệu khác sau này
- Hỗ trợ xử lý song song
LÊ NGỌC DƯƠNG THANH 8 Bên cạnh đó, rừng quyết định cũng có vài nhược điểm:
- Trong vài trường hợp, rừng quyết định có thể bị quá phù hợp (overfit) đối với một số tập dữ liệu
- Với những dữ liệu có phân loại theo những mức độ khác nhau, rừng quyết định thường có xu hướng thiên vị những thuộc tính có mức độ cao Vì vậy, thông tin độ quan trọng của thuộc tính là không đáng tin cậy cho loại dữ liệu này.
Các công trình nghiên cứu liên quan
Trong những năm gần đây, rất nhiều phương pháp phân đoạn khối u trên ảnh MRI não đã được phát triển dựa vào những tiến bộ nhanh chóng của các kỹ thuật học máy
Hình 6: Các phương pháp phân đoạn khối u trên MRI não người
Trong nghiên cứu [12], tác giả sử dụng phương pháp gom cụm để phân đoạn khối u
Một cụm được định nghĩa là một nhóm các điểm có mối quan hệ gần nhau Phương pháp gom cụm là phương pháp học không giám sát Cụ thể trong nghiên cứu này, giải thuật gom cụm K-means sẽ được sử dụng kết hợp với bộ lọc hình thái để phát hiện khối u từ ảnh MRI não người
Hình 7: Phân đoạn bằng phương pháp gom cụm K-means Ảnh MRI của não được sử dụng như là dữ liệu đầu vào Bước tiền xử lý sẽ chuyển ảnh thành dạng mức xám Các phần nhiễu trong ảnh nếu có sẽ bị lọc bỏ bởi bộ lọc trung vị Ảnh sau khi tiền xử lý sẽ được sử dụng như đầu vào cho giải thuật K-means
Sau khi gom cụm kết thúc, có thể xảy ra những miền được gom cụm nhầm, phương pháp sẽ sử dụng thêm bộ lọc hình thái để cải thiện kết quả
Các bước của giải thuật K-means bao gồm:
- Cho x1,…,xn là n điểm trong ảnh đầu vào, và k là số lượng cụm được quy định bởi bài toán
- Chọn c1,…,ck trung tâm cụm ngẫu nhiên
- Tính khoảng cách giữa mỗi điểm trong tập dữ liệu lần lượt với mỗi trung tâm cụm đang có
- Gán mỗi điểm x tới trung tâm cụm gần nó nhất x є Cj nếu |x-cj| < |x-ci| i = 1, 2, …, k và i ≠ j
- Cập nhật trung tâm cụm bởi giá trị trung bình của tất cả các điểm thuộc cụm
𝑖=1 m: số lượng điểm trong cụm Cj
- Lặp lại ba bước phía trên cho đến khi trung tâm cụm không đổi
LÊ NGỌC DƯƠNG THANH 10 Bộ lọc hình thái sử dụng hai ảnh: ảnh đầu vào và phần tử cấu trúc Phần tử cấu trúc là một ảnh nhỏ được sử dụng để thăm dò ảnh đầu vào Phần tử cấu trúc sẽ được quét qua từng vùng của ảnh đầu vào và kiểm tra kết quả phù hợp hay không phù hợp Nếu kết quả phù hợp, vùng tương ứng trên ảnh đầu vào sẽ được nhận Nếu kết quả không phù hợp, vùng tương ứng trên ảnh đầu vào sẽ bị bỏ đi Hai hoạt động chính của bộ lọc hình thái là xói mòn và giãn nở Xói mòn sẽ làm mỏng đối tượng hình ảnh, còn giãn nở sẽ làm dầy đối tượng hình ảnh
Hình 8: Hoạt động xói mòn
Hình 9: Hoạt động giãn nở
II.2.2 Phương pháp Fuzzy c-means
Trong nghiên cứu [3], tác giả sử dụng bốn kênh MRI bao gồm T1, T2, FLAIR, và T1-gad Mỗi điểm được đại diện bởi véc tơ đặc trưng Những điểm có cường độ bằng không trong bất kỳ kênh nào sẽ bị bỏ qua Giá trị log của cường độ thường nằm trong khoảng từ 3 đến 8 x = [log(x (T1) ), log(x (T2) ), log(x (T1G) ), log(x (FLAIR) )] T
LÊ NGỌC DƯƠNG THANH 11 Fuzzy c-means (FCM): FCM thực hiện gom cụm bằng cách chia dữ liệu vào một số cụm với thông tin gom cụm mờ Trong ví dụ bên dưới, mỗi điểm với tọa độ X, Y sẽ có khả năng thuộc cụm C1 hoặc C2 với giá trị xác suất tương ứng Giá trị lớn nhất giữa các cụm sẽ quyết định một điểm thuộc cụm đó
Bảng 1: Ví dụ kết quả gom cụm FCM Giải thuật FCM sẽ hướng tới tối thiểu hàm mục tiêu sau:
Trong đó U là giá trị mờ của kết quả gom cụm, V là giá trị của trung tâm cụm Giá trị m sẽ ảnh hưởng đến độ mờ của việc gom cụm Các giá trị U và V sẽ được tính trong từng vòng lặp huấn luyện:
Giải thuật sẽ kết thúc khi lỗi nhỏ hơn giá trị cho trước hoặc độ cải thiện của lỗi nhỏ hơn ngưỡng cho trước
LÊ NGỌC DƯƠNG THANH 12 Trong nghiên cứu này, FCM được tiến hành trong hai bước Trong bước đầu tiên, FCM được tiến hành cho tất cả các điểm trong tập dữ liệu Số lượng cụm c thay đổi từ 6 tới 20 Sau bước FCM đầu tiên, các điểm được gom thành c cụm Mỗi cụm sẽ được đánh giá bởi hệ hỗ trợ quyết định để xác định nếu cụm đó có chứa khối u hay không
Trong bước FCM lần hai, các điểm thuộc cụm có chứa khối u sẽ được sử dụng như dữ liệu đầu vào Số lượng cụm vẫn được chọn trong khoảng từ 6 tới 20 Sau khi chạy FCM lần hai, các cụm mới sẽ được đánh giá lần nữa bởi hệ hỗ trợ quyết định, kết quả nếu có chứa khối u thì sẽ được kết luận là khối u
FCM bị ảnh hưởng lớn bởi các giá trị khởi tạo Một cách cơ bản, các cụm khởi tạo nên cách xa các cụm khác Việc chọn ngẫu nhiên các cụm khởi tạo sẽ tạo ra kết quả thay đổi giữa các lần chạy Để có một giải pháp ổn định, phương pháp cần một quy tắc khởi tạo Phương pháp tiến hành FCM trên mỗi chiều d để tạo ra ba cụm, được sử dụng như là ba điểm lưới trên chiều d Với bốn chiều, sẽ có 34 = 81 điểm lưới, được xem như các điểm khởi tạo cụm tiềm năng Trong các điểm này, phương pháp sẽ chọn những điểm có khoảng cách nhỏ nhất đến các véc tơ đầu vào
Hệ hỗ trợ quyết định:
Sau khi tiến hành FCM, phương pháp cần xác định nếu một cụm có khả năng chứa khối u hay không Hệ hỗ trợ quyết định này cần được tạo ra từ các thông tin biết trước được rút trích từ dữ liệu huấn luyện Một chuỗi các FCM được chạy trước đó tạo nên các cụm và việc xác định các cụm này có khối u hay không sẽ dựa vào kết quả cho trước Ở giai đoạn ra quyết định, giải thuật k láng giềng gần nhất được sử dụng để quyết định nếu một cụm có chứa khối u hay không
II.2.3 Phương pháp Support Vector Machine
Trong nghiên cứu [4], tác giả sử dụng phương pháp Support Vector Machine (SVM) để phân đoạn ảnh thành khối u và không phải khối u Phương pháp sẽ sử dụng đặc trưng wavelet Gabor Hàm này có thể đặc trưng cho cấu trúc không gian trong ảnh cũng như giữ lại thông tin quan hệ không gian
Hình 10: Phân đoạn bằng phương pháp SVM Support Vector Machine:
SVM sẽ chia không gian điểm thành hai phần, mỗi phần bao gồm các điểm tương đồng nhau, sao cho khoảng cách giữa hai phần là lớn nhất
Hình 11: Phân lớp bằng SVM
Khoảng cách giữa H và H1 là |w•x+b| / ||w|| = 1 / ||w|| Để tối đa khoảng cách, phương pháp cần tối thiểu ||w|| với điều kiện không có điểm nào nằm giữa H1 và H2 Bài toán này có thể được giải bằng phương pháp Lagrangian Tuy nhiên, trong nhiều trường hợp phương pháp không thể chia không gian điểm thành hai phần bởi đường thẳng khi mà các điểm được phân bố xen kẽ nhau Trong trường hợp này, phương pháp cần sử dụng hàm biến đổi để chuyển các điểm từ không gian cho trước vào không gian có số chiều cao hơn
LÊ NGỌC DƯƠNG THANH 14 Trong nghiên cứu này, phương pháp sẽ sử dụng hàm Gaussian:
SVM hướng tới tối thiểu lỗi ở biên hơn là tối thiểu lỗi trung bình của nguyên tập dữ liệu Điều này dẫn tới SVM đạt được kết quả tốt khi áp dụng cho các dữ liệu ngoài tập huấn luyện
PHƯƠNG PHÁP GIẢI QUYẾT BÀI TOÁN
Các vấn đề gặp phải
Theo nghiên cứu [1], tác giả đã sử dụng hai bước rừng ngẫu nhiên để phân đoạn khối u Phương pháp này cho kết quả khá tốt ở bước một, phân đoạn ảnh thành khối u hoặc không phải khối u Tuy nhiên, ở bước phân đoạn thứ hai, phân khối u thành các thành phần khác nhau, kết quả vẫn chưa được cao Ảnh đầu vào được trích đặc trưng bao gồm 80 loại khác nhau Tuy nhiên, các đặc trưng này không bao gồm thông tin về vị trí tương đối của các thành phần khối u với nhau Điều đó khiến cho kết quả phân đoạn ở bước thứ hai vẫn chưa được tốt.
Cải tiến
Một khối u não thường bao gồm cấu trúc phổ biến sau:
- Tiếp theo là phần khối u mở rộng
- Phần khối u không mở rộng ở xung quanh
- Phần phù nề ở ngoài cùng
Hình 20: Các thành phần của khối u Để có kết quả phân đoạn các thành phần của khối u tốt hơn, chúng ta cần đưa vào các đặc trưng liên quan đến tọa độ vị trí của các điểm ảnh Hai loại đặc trưng được đề xuất bao gồm:
- Tọa độ tương đối của các điểm so với khối u
- Đặc trưng liên quan đến ma trận đồng xuất hiện Đối với đặc trưng liên quan đến tọa độ tương đối, ba tọa độ x, y, z của mỗi điểm sẽ được tính toán so với điểm có mức sáng lớn nhất Chúng ta giả sử rằng nhân của khối u sẽ có mức sáng lớn nhất Ở bước rừng ngẫu nhiên thứ nhất, mức sáng lớn nhất sẽ xác định trên toàn bộ các điểm đầu vào Ở bước rừng ngẫu nhiên thứ hai, mức sáng lớn nhất sẽ xác định trên các điểm đầu vào được phân loại là thuộc khối u Đối với đặc trưng liên quan đến ma trận đồng xuất hiện [30], [31], [32], đề tài đề xuất sử dụng các đặc trưng này ở bước rừng quyết định thứ hai Ở bước này, chúng ta mới cần thông tin về vị trí các thành phần trong khối u Đồng thời, việc tính các đặc trưng này cho toàn bộ các điểm ở bước thứ nhất sẽ đòi hỏi nhiều thời gian xử lý
Hình 21: Các hướng trong ma trận đồng xuất hiện
Ma trận đồng xuất hiện được xây dựng cho mỗi điểm Với mỗi điểm, một vùng lân cận có kích thước 21x21x21 được sử dụng để tính toán ma trận Mỗi điểm trong không gian 3D tương ứng với 26 hướng xung quanh nó Tuy nhiên, chúng ta chỉ tính toán 13 hướng như trong hình trên vì 13 hướng còn lại sẽ được tính toán bởi các điểm lân cận tương ứng
Các mức sáng của điểm ảnh được đưa về 64 mức khác nhau Các mức này không được chia đều mà chia theo hàm ln(), để các mức sáng cao sẽ không bị đưa về cùng một mức
LÊ NGỌC DƯƠNG THANH 27 Sau khi ma trận đồng xuất hiện được tính toán cho mỗi điểm ảnh, mỗi ma trận sẽ được tính toán 4 loại đặc trưng đang được sử dụng phổ biến Như vậy, với mỗi điểm, ta có 13 ma trận tương ứng với 13 hướng, mỗi ma trận sẽ có 4 đặc trưng Tổng cộng mỗi điểm sẽ có 52 đặc trưng thêm vào
- Độ tương phản: đo lường độ tương phản giữa một điểm ảnh và lân cận của nó
Nếu ảnh là hằng số, độ tương phản sẽ bằng không Giá trị độ tương phản càng cao khi mức sáng là ngẫu nhiên, tức là mức sáng của một điểm và lân cận của nó là khác nhau rất lớn
- Năng lượng: đo lường độ thống nhất của ảnh Năng lượng có giá trị lớn nhất khi ảnh là hằng số
- Độ đồng chất: đo lường độ gần nhau về không gian của phân phối ma trận đồng xuất hiện Độ đồng chất có giá trị bằng không khi ma trận có phân phối chuẩn, ngược lại có giá trị bằng một khi là ma trận đường chéo
- Độ tương quan: đo lường độ tương quan của một điểm ảnh so với các điểm lân cận Độ tương quan có giá trị bằng 1 khi ảnh là tương quan dương hoàn hảo, và là -1 khi ảnh là tương quan âm hoàn hảo
Trong đú, i là hàng, j là cột, p(i,j) là giỏ trị của ụ [i,j], à là giỏ trị trung bỡnh, và σ là độ lệch chuẩn
Hiện thực
Phương pháp đề xuất được hiện thực bằng ngôn ngữ Python dựa trên thư viện học máy scikit-learn
Hình 22: Sơ đồ các bước phân đoạn Đầu tiên, các dữ liệu được chuẩn hóa sao cho giá trị trung bình bằng 0 và độ lệch chuẩn bằng 1 Ở bước huấn luyện rừng ngẫu nhiên đầu tiên, các điểm với phân lớp lớn hơn 0 (thuộc khối u) sẽ được chuyển thành cùng một giá trị là 1 Đối tượng RandomForestClassifier từ thư viện sklearn.ensemble được sử dụng để huấn luyện rừng ngẫu nhiên với các thông số sau:
- max_features = 0.5 Ở bước này, mỗi điểm ảnh sẽ được rút trích 18 đặc trưng khác nhau:
- Mức sáng sau khi qua bộ lọc Gaussian (sigma = 0.5) của 4 kênh
- Độ lệch chuẩn, tầm giá trị, độ hỗn độn, giá trị nhỏ nhất và lớn nhất trong các điểm lận cận 5x5x5
- Tọa độ x, y, z tương đối so với điểm có mức sáng cao nhất Ở bước huấn luyện rừng ngẫu nhiên thứ hai, các điểm với phân lớp lớn hơn 0 (thuộc khối u) sẽ được đưa vào huấn luyện Các điểm sẽ được phân lớp thành 4 loại tương ứng với các thành phần khác nhau của khối u Đối tượng RandomForestClassifier từ thư viện sklearn.ensemble được sử dụng để huấn luyện rừng ngẫu nhiên với các thông số sau:
- max_features = 0.5 Ở bước thứ hai, mỗi điểm ảnh sẽ bao gồm 18 đặc trưng ở trên cộng thêm với 52 đặc trưng từ ma trận đồng xuất hiện Như vậy, mỗi điểm sẽ bao gồm 70 đặc trưng:
- Mức sáng sau khi qua bộ lọc Gaussian (sigma = 0.5) của 4 kênh
- Độ lệch chuẩn, tầm giá trị, độ hỗn độn, giá trị nhỏ nhất và lớn nhất trong các điểm lận cận 5x5x5
- Tọa độ x, y, z tương đối so với điểm có mức sáng cao nhất trong số các điểm thuộc khối u
- 52 đặc trưng liên quan đến ma trận đồng xuất hiện Ở bước kiểm tra thứ nhất, tất cả các điểm ảnh sẽ được đưa vào rừng ngẫu nhiên thứ nhất Chương trình sử dụng hàm predict_proba() để lấy kết quả xác suất của điểm thuộc khối u Nếu giá trị xác suất lớn hơn hoặc bằng 0.6, điểm đó sẽ được phân loại là thuộc khối u
Sau bước kiểm tra thứ nhất, dữ liệu được đưa vào quá trình hậu xử lý Chương trình sử dụng thư viện skimage.morphology để xử lý bộ lọc hình thái Phần tử cấu trúc được sử dụng có hình cầu với kích thước 13x13x13 Sau đó, chương trình sẽ xác định và loại bỏ các phần tử kết nối có số lượng nhỏ hơn 3000 điểm
LÊ NGỌC DƯƠNG THANH 30 Tiếp theo, các điểm được phân loại thuộc khối u sẽ được tính toán các đặc trưng liên quan đến ma trận đồng xuất hiện Thư viện skimage.feature được sử dụng để tính toán ma trận và các đặc trưng liên quan:
- Hàm greycomatrix(): tính toán ma trận đồng xuất hiện
- Hàm greycoprops(): tính toán đặc trưng từ ma trận đồng xuất hiện
Sau đó, chương trình sử dụng hàm predict_proba() để lấy kết quả xác suất của điểm thuộc từng thành phần của khối u Lớp nào có xác suất cao nhất sẽ xác định điểm tương ứng thuộc lớp đó
Sau cùng, chương trình sẽ sử dụng thư viện pystruct.inference để tính toán bước hậu xử lý bao gồm Markov Random Fields và Graph-cut
Insight Segmentation and Registration Toolkit (ITK) là một hệ thống mã nguồn mở, hướng đối tượng cho phép xử lý, đăng ký và phân đoạn ảnh Mặc dù là một hệ thống lớn và phức tạp, ITK được thiết kế giúp dễ dàng sử dụng và hiện thực
Hình 23: Các thành phần ITK ITK bao gồm một vài hệ thống con:
- Essential System Concepts: chứa các nguyên lý, nhân tố cơ bản của hệ thống
- Numerics: thư viện xử lý số học
- Data Representation and Access: truy xuất và thể hiện dữ liệu
- Data Processing Pipeline: xử lý dữ liệu song song
- IO Framework: kết hợp với pipeline để truy xuất dữ liệu vào ra
- Spatial Objects: hỗ trợ đối tướng không gian
- Registration Framework: nền tảng đăng ký ảnh
- FEM Framework: nền tảng Finite Element Methods
- Level Set Framework: nền tảng tập mức
- Wrapping: hỗ trợ biên dịch Python, XML…
ITK-SNAP là phần mềm mã nguồn mở dựa trên nền tảng xử lý ảnh ITK Phần mềm cho phép hiện thị các ảnh MRI cũng như các công cụ đánh dấu phân đoạn thủ công
Hình 24: Giao diện ITK-SNAP
Sau khi các kênh MRI được mở lên, nhấn vào biểu tượng bộ não để mở chức năng phân đoạn khối u
Hình 25: Giao diện phân đoạn khối u
Dữ liệu có thể được lấy mẫu để giảm kích thước, nhằm giảm thời gian xử lý Tuy nhiên việc này sẽ làm giảm chất lượng phân đoạn
Hình 26: Giao diện xử lý
LÊ NGỌC DƯƠNG THANH 33 Sau khi nhập vào địa chỉ IP của máy chủ, nhấn vào nút “Segment”, chương trình sẽ giao tiếp với máy chủ để thực hiện quá trình phân đoạn Quá trình này bao gồm một số bước:
- Kết nối tới máy chủ
- Nạp dữ liệu cần phân đoạn
- Chờ máy chủ xử lý quá trình phân đoạn
- Tải kết quả phân đoạn về
- Hiển thị kết quả phân đoạn lên giao diện
Hình 27: Giao diện hiển thị kết quả
Kết quả phân đoạn này có thể được lưu trữ vào tập tin cho phép mở lại sau này
PHÂN TÍCH VÀ ĐÁNH GIÁ KẾT QUẢ
Thí nghiệm triển khai
Dữ liệu huấn luyện và kiểm tra được thu thập từ cuộc thi phân đoạn khối u não của hội nghị MICCAI [2] Dữ liệu này bao gồm các ảnh MRI não người mắc các bệnh về khối u với các thông tin phân đoạn khối u đầy đủ đã được thực hiện sẵn một cách thủ công bởi các chuyên gia y tế trong ngành Dữ liệu này sẽ được chia thành hai phần ngẫu nhiên: dữ liệu dùng để huấn luyện bao gồm 80 ảnh chụp MRI và dữ liệu dùng để kiểm tra bao gồm 80 ảnh chụp MRI còn lại Các dữ liệu kiểm tra sẽ không được sử dụng trong quá trình huấn luyện mô hình
Hình 28: Ảnh chụp MRI với dữ liệu phân đoạn biết trước
Giải thuật được thực thi thông qua dịch vụ điện đoán đám mây của Amazon Cấu hình của máy chủ gồm 4 nhân CPU, 32GB RAM và 30GB lưu trữ
Các thí nghiệm được thực hiện bao gồm:
- Phương pháp cải tiến đề xuất bao gồm tọa độ và ma trận đồng xuất hiện
- Phương pháp chỉ bao gồm tọa độ
- Phương pháp chỉ bao gồm ma trận đồng xuất hiện.
Đánh giá
Sau khi chạy các thí nghiệm khác nhau với tập dữ liệu kiểm tra, phương pháp sẽ cho ra các thông tin phân đoạn khối u cho từng mẫu dữ liệu tương ứng Kết quả phân đoạn này được so sánh với thông tin phân đoạn biết trước của tập dữ liệu kiểm tra Độ đo DICE [19] sẽ được sử dụng để so sánh độ sai lệch giữa hai thông tin phân đoạn
Hình 29: Độ đo DICE Độ đo DICE được tính toán bằng 2 lần diện tích giao nhau của A và B chia cho tổng diện tích của A và của B
- Khi hai vùng A và B không giao nhau, độ đo DICE bằng 0
- Khi hai vùng A và B trùng nhau, độ đo DICE bằng 1 Sau khi đo đạc từng phương pháp, chúng ta có kết quả như sau:
Cả khối u Nhân khối u Khối u mở rộng
Cải tiến bao gồm tọa độ 84.9% 67.1% 70.0%
Cải tiến bao gồm ma trận đồng xuất hiện 84.9% 70.0% 70.7%
Cải tiến bao gồm tọa độ và ma trận đồng xuất hiện 84.9% 70.2% 73.1%
Bảng 2: Kết quả so sánh các phương pháp
Hình 30: Đồ thị so sánh các phương pháp
Với các phương pháp cải tiến đã đề xuất, trong bước kiểm tra của rừng ngẫu nhiên đầu tiên, kết quả phân đoạn sẽ cho ra toàn bộ khối u Ta thấy kết quả phân đoạn toàn bộ khối u của cả ba phương pháp cải tiến đã tăng từ 82% lên 84.9% Điều này cho thấy tọa độ tương đối của các điểm cũng đóng góp vào độ chính xác khi phân đoạn toàn bộ khối u Ở bước phân đoạn của rừng ngẫu nhiên thứ hai, toàn bộ khối u sẽ được sử dụng như dữ liệu đầu vào Kết quả của bước này là các thành phần khác nhau của khối u sẽ được phân đoạn
- Đối với cải tiến chỉ sử dụng tọa độ, kết quả phân đoạn nhân khối u hầu như không thay đổi (67.1% so với 67%) Tuy nhiên, phần khối u mở rộng có kết quả tăng lên từ 68% thành 70.0% Điều này cho thấy tọa độ cũng giúp một phần trong việc phân đoạn phần khối u mở rộng
- Đối với cải tiến chỉ sử dụng ma trận đồng xuất hiện, kết quả phân đoạn có thay đổi rõ rệt Nhân khối u có kết quả tăng từ 67% thành 70.0% Phần khối u mở rộng có kết quả tăng lên từ 68% thành 70.7% Điều này cho thấy ma trận đồng xuất hiện góp phần vào việc phân đoạn từng thành phần của khối u
- Đối với cải tiến sử dụng cả tọa độ và ma trận đồng xuất hiện, ta nhận thấy kết quả độ chính xác tăng lên đáng kể Nhân khối u có kết quả tăng từ 67% thành 70.2% Phần khối u mở rộng có kết quả tăng lên từ 68% thành 73.1% Điều này cho thấy phương pháp này đã kết hợp được đóng góp của các đặc trưng từ tọa độ và ma trận đồng xuất hiện
Một nhược điểm của ma trận đồng xuất hiện là thời gian xử lý khá chậm
Cải tiến bao gồm tọa độ
Cải tiến bao gồm ma trận đồng xuất hiện
Cải tiến bao gồm tọa độ và ma trận đồng xuất hiện
Bảng 3: Thời gian thực thi của các phương pháp
Thời gian xử lý cho phương pháp ma trận đồng xuất hiện gấp gần 5 lần so với chỉ sử dụng tọa độ Vì điều này nên ma trận đồng xuất hiện không thể được sử dụng ở bước phân đoạn thứ nhất, với toàn bộ tập dữ liệu đầu vào