5. Ý nghĩa khoa học và thực tiễn của đề tài
1.2. Bài toán phát hiện bất thƣờng trên ản hy khoa
1.2.1. Phát biểu bài toán
Đối với các bác sĩ, việc phát hiện khối u, vùng bất thƣờng trong cơ thể là nhờ vào kiến thức học tập và rèn luyện nhiều năm, cùng kinh nghiệm đƣợc tích lũy, hoặc đƣợc phát hiện trong quá trình thao tác, làm việc. Trong thị giác máy tính, các vùng bất thƣờng sẽ đƣợc phát hiện và khoanh vùng. Bài toán đƣợc phát biểu cụ thể nhƣ sau:
Cho trƣớc một ảnh y khoa chuẩn DICOM (X-quang, ảnh cắt lớp CT,…). Mục tiêu bài toán là tìm và xác định vùng khoanh tƣơng ứng với các vùng bất thƣờng của phổi nếu có trong ảnh. Xác định và khoanh vùng đƣợc đối tƣợng bất thƣờng trong ảnh thể hiện sự bất thƣờng của cơ quan, khu vực bên trong cơ thể tại nơi khoanh vùng, từ đó hỗ trợ bác sĩ chẩn đoán bệnh dễ dàng và nhanh chóng hơn. Sơ đồ cơ bản của bài toán có thể đƣợc mô phỏng nhƣ hình 1.5:
Hình 1.5: Sơ đồ cơ bản của bài toán phát hiện bất thƣờng trên ảnh y khoa
1.2.2. Ý nghĩa thực tiễn
Hiện nay trên thế giới cũng nhƣ Việt Nam, chẩn đoán các bệnh về phổi luôn là một bài toán quan trọng và mang tính cấp thiết, đặc biệt trong bối cảnh
dịch bệnh COVID-19 diễn ra hiện nay, việc chẩn đoán sớm đƣợc bệnh sẽ giúp quá trình chữa và phân loại bệnh nhân đƣợc dễ dàng hơn. Chẩn đoán bằng hình ảnh là một phƣơng pháp chẩn đoán nhanh chóng và hiệu quả cao, đã đƣợc ứng dụng để hỗ trợ chẩn đoán bệnh trong ngành y tế, tuy nhiên, bác sĩ chẩn đoán hình ảnh cần kiến thức chuyên môn sâu cũng nhƣ kinh nghiệm làm việc lâu năm để có thể đƣa ra kết quả chẩn đoán chính xác. Thực trạng hiện nay có thể thấy đƣợc rằng số lƣợng bác sĩ chẩn đoán hình ảnh giỏi là không nhiều, chỉ tập trung tại các bệnh viện trung ƣơng và các thành phố lớn, nên việc chẩn đoán hình ảnh ở các trung tâm y tế và bệnh viện tuyến địa phƣơng gặp nhiều khó khăn.
Một trong số các giải pháp là việc ứng dụng một số chƣơng trình phần mềm hỗ trợ các bác sĩ có thể nhanh chóng hơn trong quá trình chẩn đoán hình ảnh. Bên cạnh đó, ứng dụng nói trên là một công cụ hỗ trợ các bác sĩ trẻ, chƣa có kinh nghiệm định hƣớng và đƣa ra các chẩn đoán cận lâm sàng.
Trong việc chuẩn đoán bệnh, các kỹ thuật phát hiện và khoanh vùng bất thƣờng trên ảnh y khoa nhằm hỗ trợ phát hiện ra những vùng đƣợc nghi vấn là khối u hay từ đó chẩn đoán sớm đƣợc bệnh trong cơ thể ngƣời từ ảnh chụp X- quang ngực là một hƣớng đi mang tính ứng dụng cao.
Dựa trên các kỹ thuật xử lý ảnh để phát hiện khối u bất thƣờng trong cơ thể ngƣời từ ảnh chụp X-quang nhằm hỗ trợ các bệnh viện, các cơ sở y tế tuyến địa phƣơng, không có đủ bác sĩ chẩn đoán hình ảnh vẫn có thể nhanh chóng đƣa ra các kết luận sau khi khám cận lâm sàng cho bệnh nhân.
1.2.3. Một số nghiên cứu liên quan
Nhƣ đã nói, bài toán phát hiện vùng bất thƣờng trên ảnh y khoa là một bài toán mang tính thực tiễn cao khi hỗ trợ các bác sĩ trong chẩn đoán bệnh, kết quả phát hiện càng chính xác, độ hiệu quả trong chẩn đoán và điều trị càng cao. Vì vậy, bài toán này nhận đƣợc sự quan tâm và đầu tƣ nghiên cứu
của nhiều tổ chức và nhà khoa học trên thế giới với mục đích phát triển, tìm cách cải thiện và nâng cao độ chính xác cũng nhƣ tốc độ phát hiện vùng bất thƣờng. Nhiều phƣơng pháp và kỹ thuật đã đƣợc tiếp cận và phát triển trong hệ thống ảnh y khoa, ví dụ nhƣ, ứng dụng các mô hình học máy, học sâu, các mô hình mờ, kết hợp nhiều kỹ thuật xử lý ảnh nhƣ phân ngƣỡng, phát hiện biên hay trích xuất đặc trƣng, … với nhau. Nhƣ đã nói, bài toán phát hiện vùng bất thƣờng trên ảnh y khoa là một bài toán mang tính thực tiễn cao khi hỗ trợ các bác sĩ trong chẩn đoán bệnh, kết quả phát hiện càng chính xác, độ hiệu quả trong chẩn đoán và điều trị càng cao. Vì vậy, bài toán này nhận đƣợc sự quan tâm và đầu tƣ nghiên cứu của nhiều tổ chức và nhà khoa học trên thế giới với mục đích phát triển, tìm cách cải thiện và nâng cao độ chính xác cũng nhƣ tốc độ phát hiện vùng bất thƣờng. Nhiều phƣơng pháp và kỹ thuật đã đƣợc tiếp cận và phát triển trong hệ thống ảnh y khoa, ví dụ nhƣ, ứng dụng các mô hình học máy, học sâu, các mô hình mờ, kết hợp nhiều kỹ thuật xử lý ảnh nhƣ phân ngƣỡng, phát hiện biên hay trích xuất đặc trƣng, … với nhau. Theo Kostis, W.J., Reeves, A.P., Yankelevitz, D.F. [11], có 4 loại vùng bất thƣờng. (i). Đƣợc tách biệt tốt: Trong trƣờng hợp này, các bất thƣờng không đƣợc kết nối với mạch máu nhƣng nằm ở lõi của mô phổi. (ii). Juxta - mạch máu: Trong trƣờng hợp này, các bất thƣờng nằm ở trung tâm của trƣờng phổi và đƣợc kết nối với các mạch phổi xung quanh. (iii). Đuôi màng phổi: Các loại nốt bất thƣờng này đƣợc nối với nhau bằng một cấu trúc mỏng và nằm gần bề mặt màng phổi. (iv). Juxta-màng phổi: Đây là một cấu trúc mỏng đƣợc kết nối bởi phần đáng kể của nốt. Trong [12], họ đã sử dụng kỹ thuật Wavelet Packet Frame (WPF) để thu nhận các biểu diễn tần số không gian và áp dụng phân cụm k-Means để phân đoạn các mô phổi tốt hơn. Điều này đã chứng minh kỹ thuật này là mạnh mẽ và có thể phân đoạn hiệu quả các vùng phổi từ nhiều hình ảnh từ các lần quét khác nhau. Raghuramanet và cộng sự [13] phân
đoạn phổi bằng thuật toán truy xuất hình ảnh tƣơng tác dựa trên khoảnh khắc Krawtchouk, đƣợc đào tạo dựa trên dữ liệu có sẵn trƣớc đó. Nghiên cứu này [14] đã triển khai kỹ thuật phân đoạn cắt bằng đồ thị, kết hợp hình dạng và các thông tin trƣớc đó khác về cấu trúc phổi lân cận, trên hình ảnh bệnh lý phổi bao gồm tràn dịch màng phổi. nhu cầu phân tích các bài kiểm tra trong thời gian ngắn cũng đang tăng lên. Do đó, các bác sĩ X-quang có thể hiểu sai gây ra sai sót khi phát hiện. Do đó, cần có các hệ thống CAD có thể phát hiện các nốt sần một cách hiệu quả trong thời gian ngắn [15]. Hai hệ thống CAD chính đƣợc các bác sĩ X-quang sử dụng để hỗ trợ họ, đó là: CADe – Những hệ thống này chỉ đƣợc sử dụng để phát hiện khối u. CADx – Các luận án đƣợc sử dụng để kiểm tra các đặc điểm của khối u. Nanusha [16] đề xuất một cách tiếp cận là định lƣợng đặc điểm bề mặt của nốt phổi dựa trên hình ảnh CT mặt cắt mỏng. Trong cách tiếp cận này mô tả sự phân đoạn của hình ảnh nốt ba chiều (3D) thu đƣợc bằng cách tiếp cận bề mặt có thể biến dạng 3D.
1.3. MỘT SỐ KỸ THUẬT XỬ LÝ ẢNH PHÁT HIỆN BẤT THƢỜNG TRÊN ẢNH Y KHOA TRÊN ẢNH Y KHOA
Dữ liệu ảnh y khoa, cũng nhƣ ảnh bình thƣờng, có thể là ảnh màu, ảnh xám hoặc ảnh trắng đen nhị phân. Trong đó, ảnh màu (RGB) chứa tổng cộng ba kênh với mỗi kênh sở hữu các giá trị cƣờng độ giao động từ 0 đến 255. Trong RGB, nếu RGB có giá trị bằng 0 tức ảnh màu đen, và ngƣợc lại là ảnh trắng nếu giá trị RGB bằng 255. Trong khi thị giác con ngƣời so với thị giác máy hạn chế hơn nhiều, máy tính có thể dễ dàng phân biệt đƣợc các điểm màu trong khi con ngƣời không thể. Trong ảnh màu RGB có thể tồn tại tới gần 16777216 điểm màu khác nhau, với ảnh xám là 256 điểm với 0 thể hiện ảnh màu đen và 256 đại diện cho ảnh trắng (hình 1.6).
Hình 1.6: Dải màu của ảnh xám
Với ảnh nhị phân, cấu trúc dải màu ảnh chỉ bao gồm hai giá trị lần lƣợt là 0 là màu đen và 1 đƣợc dùng cho màu trắng. Thông thƣờng, chúng ta biến đổi ảnh màu thành ảnh xám để trích xuất các đối tƣợng trong ảnh bằng cách điều chỉnh histogram của ảnh đầu vào [17].
Có nhiều kỹ thuật đã đƣợc ứng dụng để xử lý, làm việc với ảnh y khoa. Ở đây chúng tôi xin đề cập tới hai kỹ thuật thƣờng đƣợc sử dụng nhất vì tính hiệu quả của chúng là phân đoạn (Segmentation) và trích xuất đặc trƣng (Feature Extraction).
1.3.1. Tiếp cận dựa trên phân đoạn (Image Segmentation)
Quá trình chia nhỏ ảnh đầu vào phân ảnh thành hai phần gồm phần mong muốn, hay còn đƣợc gọi là ROI và phần không mong muốn. Đối với bài toán phát hiện bất thƣờng trong phổi, mục tiêu của chúng ta là xác định sự hiện diện của vùng bất thƣờng hay khối u ở trong hình ảnh đầu vào (hình 1.7).
Hình 1.7: Phân đoạn đối với ảnh chụp phổi
lại trong ảnh là phần không mong muốn [18]. Nhiệm vụ cực kỳ quan trọng của máy là tự động xác định đƣợc vùng bất thƣờng bởi các cấu trúc đặc của các biến thể của vùng bất thƣờng ở mô phổi nhƣ khối u hoặc mức độ ác tính của ung thƣ [19]. Để phân đoạn hình ảnh, có hai chiến thuật có thể đƣợc thực hiện nhƣ phân đoạn bằng phát hiện biên và phân đoạn dựa trên phân vùng.
1.3.1.1. Phân đoạn dựa trên phân vùng
Phân đoạn theo vùng có thể đƣợc chia thành các phƣơng pháp nhƣ: - Phân ngƣỡng (Thresholding).
- Lan vùng (Region growing).
- Phân cụm trong không gian đặc trƣng (Clustering in Feature Space).
a) Phân ngƣỡng
Giá trị đƣợc dùng để phân đoạn ROI đƣợc gọi là giá trị ngƣỡng (threshold value). Trong trƣờng hợp ung thƣ phổi, chúng tôi chuyển đổi hình ảnh đầu vào thành một ảnh xám và sau đó quyết định giá trị ngƣỡng dựa trên các đặc tính cơ bản của khối u. Ví dụ: chúng tôi nhận thấy khối u có các giá trị cƣờng độ từ 155-255 ở ảnh đầu vào, chúng tôi có thể tiến hành chuyển đổi về ảnh nhị phân với tất cả các giá trị nhỏ hơn 155 về 0 và tất cả các giá trị khác từ 155-255 đều bằng 1. Bằng cách này, tất cả các vùng không mong muốn trở thành màu đen, và các vùng mong muốn xác định là màu trắng [20].
b) Lan vùng
Trong phƣơng pháp lan vùng, chúng tôi nhóm các pixel hoặc các vùng con của ảnh đầu vào lại thành các vùng lớn hơn, với ý nghĩa phân tích giá trị pixel và từ đó kết hợp với các giá trị cƣờng độ khác nhau mà có cùng cấu trúc đặc tính nhƣ màu sắc, giá trị mức xám, các đặc điểm về hình dạng,… . Trong khi đó, đối với phƣơng pháp chia tách, chúng ta tiến hành lấy một ảnh lớn và chia nó ra thành các vùng nhỏ hơn dựa trên tính đồng nhất của các vùng đó [21].
c) Các kỹ thuật phân cụm
Trong phân đoạn dựa trên phân cụm, bƣớc đầu tiên là tìm ra tất cả số các đặc điểm nhƣ giá trị trung bình, trung vị, độ lệch chuẩn, số phần tƣ và các đặc điểm kết cấu nhƣ tính đồng nhất, entropy, tƣơng quan và wavelet hoặc các thông số hồi quy, sau đó nhóm vùng tùy thuộc vào khoảng cách tối thiểu trong khu vực. Phân cụm dựa trên vùng cho kết quả tốt hơn trong việc xử lý ảnh y khoa và cả trong việc phát hiện các vùng bất thƣờng, khối u trong ảnh ung thƣ phổi [22- 4]. Các kỹ thuật phân cụm đƣợc xem là phƣơng pháp phân loại không giám sát, trong đó thuật toán phân cụm k-means rất đƣợc quan tâm trong các kỹ thuật học máy mà đầu ra không có trong các vector đặc trƣng (hình 1.8)[25].
1.3.1.2. Phân doạn dựa trên phát hiện biên
Trong phân đoạn dựa trên biên, chúng tôi cố gắng tìm ra các biên của các đối tƣợng số đƣợc tìm thấy trong ảnh dựa trên căn bản là các thay đổi đột ngột trong giá trị của một pixel (hình 1.9). Nhiều đối tƣợng số có các biên đứt gãy và mập mờ, không rõ ràng. Để loại bỏ các yếu tố này khỏi ảnh, chúng ta thƣờng thực hiện các phép toán hình học và các bộ lọc tuyến tính để có đƣợc khoảng cách nhiều hơn và loại bỏ các khoảng cách không cần thiết ở gần đối tƣợng số [25, 26]. Bởi vì các khối u hay vùng bất thƣờng không hề có một quy chuẩn hay một dạng hình cụ thể nên đây là bài toán thách thức đối với CAD (Computer Aided Design – tạm dịch: Thiết kế nhờ hỗ trợ của máy tính).
Hình 1.9: Phân đoạn phổi dựa trên biên
a) Phân đoạn dựa trên hình học
Phân đoạn cơ sở hình thái là một quá trình kết hợp các phép toán hình học nhƣ mở rộng cực tiểu và gradient hình học với thuật toán watershed flooding (tách đối tƣợng khỏi nền ảnh) để phân đoạn ảnh thang độ xám của bất kỳ loại ảnh nào. Ví dụ: thang độ xám với dải đơn (hình ảnh 8-bit) và hình ảnh màu với ba dải (hình ảnh 24-bit). Trong phép toán hình học, các phép toán phổ biến là giãn nở (Dialtion) và xói mòn (Erosion). Phép toán xói mòn đƣợc thực hiện khi hai biên đƣợc hợp nhất với nhau trong khi phép toán xói
mòn đƣợc thực hiện khi có các biên bị hỏng đƣợc tìm thấy trong hình ảnh. Thao tác này cố gắng lấp đầy khoảng trống giữa hai biên bị hỏng [27-28].
b) Khớp mẫu
Trong phƣơng pháp khớp mẫu, chúng tôi lấy một mẫu và đối sánh nó với tất cả các ảnh con có thể có trong toàn bộ ảnh. Quá trình này đƣợc tiếp tục cho đến khi mẫu đƣợc khớp chính xác về giá trị cƣờng độ với bất kỳ phần nào của hình ảnh [29]. Có hai loại đối sánh mẫu là Đối sánh cục bộ và Đối sánh 3D mềm dẻo. Phƣơng pháp đối sánh cục bộ dựa trên GGVF (Generalized Gradient Vector Flaw). Một trong những tính năng của GGVF là mở rộng ảnh hƣởng của gradient đến các vị trí cách xa biên và vùng đồng nhất trong khi vẫn để lại các thuộc tính mong muốn của trƣờng vector trên bản đồ biên. Phƣơng pháp so khớp 3D mềm dẻo dựa trên một vector dịch chuyển làm mịn. Phƣơng pháp này nhằm tối thiểu hóa hàm năng lƣợng bằng cách cập nhật tuần tự vector dịch chuyển trên các điểm thẳng hàng từ một vector ban đầu. Vector ban đầu này đƣợc lấy từ vector dịch chuyển thu đƣợc từ so khớp cục bộ.
1.3.2. Tiếp cận dựa trên phân tích đặc trƣng (Feature Extraction)
Mỗi đối tƣợng đƣợc xác định tốt có một số tính năng hoặc thuộc tính giúp chúng ta xác định đối tƣợng đó một cách dễ dàng. Để tự động phân loại các đối tƣợng, chúng ta cần một số đặc trƣng. Tập hợp các đối tƣợng đặc trƣng này đƣợc gọi là vector đối tƣợng. Để xác định bất thƣờng trên phổi, chúng ta cần tìm các đặc trƣng nhƣ vậy từ hình ảnh chụp đầu vào. Trong xử lý ảnh có ba loại đặc trƣng, thứ nhất là đặc điểm cấu trúc, thứ hai là đặc điểm kết cấu thống kê và thứ ba là đặc điểm quang phổ. Đặc điểm cấu trúc còn đƣợc gọi là các đặc điểm nhị phân nhƣ diện tích, tâm, chu vi, định hƣớng, hình chiếu, tỷ lệ cỡ ảnh và số Euler,… . Các đặc điểm thống kê cũng chia thành hai lớp lần lƣợt là đặc điểm kết cấu thống kê bậc nhất và bậc hai. Các đặc điểm cấu trúc bậc nhất đƣợc trích xuất trực tiếp từ biểu đồ mức xám trong khi đối
với các đặc điểm cấu trúc bậc hai, trƣớc tiên, chúng tôi tìm một ma trận đồng xuất hiện và sau đó chúng tôi tìm entropy trung bình và đồng phƣơng sai. Trong các đặc điểm quang phổ, đặc điểm Gaber và wavelet là các đặc điểm rất phổ biến, thƣờng gặp khi làm việc với ảnh y khoa. Nhiều tác giả sử dụng các tập đặc điểm khác nhau để phát hiện ung thƣ phổi bằng các phƣơng pháp khác nhau với các bộ dữ liệu có sẵn khác nhau nhƣng vẫn chƣa có phƣơng pháp nào có thể tự động phân đoạn và phân loại các vùng ác tính và lành tính trong hình ảnh ung thƣ phổi. Tuy nhiên, có hai cách tiếp cận đƣợc sử dụng để trích xuất vector đặc trƣng, đầu tiên là phƣơng pháp Banalization liên quan đến các đặc điểm cấu trúc đƣợc tính toán từ các hình ảnh nhị phân và cách