Xử lý ảnh hỗ trợ chẩn đoán tự động tổn thương xuất huyết, tụ máu dựa vào ảnh CT não

MỤC LỤC

Giới thiệu – kiến thức tổng quan

  • Một số kiến thức cơ bản
    • Tiêu chuẩn đánh giá độ chính xác

      Giai đoạn tiền xử lý bao gồm các công việc như: đọc thông tin về bệnh nhân, thông tin về các lát cắt được chụp (độ dày, kích thước, vị trí…), lọc ra biên của sọ dùng làm mốc định vị cho các module sau, chuyển dữ liệu ảnh Hounsfield (xem phụ lục) thành ảnh độ xám…. Vấn đề quan trọng nhất để xây dựng bộ phân lớp là phải có dữ liệu học, mà hiện nay chưa có một bộ dữ liệu học nào được tạo ra cho mục đích này (hầu hết các nghiên cứu đều sử dụng dữ liệu tự tạo, với kích thước khá nhỏ hoặc dùng các bộ giả lập để tạo dữ liệu ảo).

      Hình  1-1: Hình định vị (topogram)
      Hình 1-1: Hình định vị (topogram)

      Cơ sở lý thuyết

      Phân đoạn ảnh

        Cơ sở của phương pháp phân đoạn dựa trên ngưỡng như sau: khi một ảnh độ xám bao gồm nhiều vùng phân biệt, histogram của nó thường sẽ có nhiều đỉnh phân biệt nhau, mỗi đỉnh ứng với một vùng và giữa 2 đỉnh liền kề nhau thường là một “thung lũng” sâu. Kĩ thuật phân đoạn dựa vào biên không cho được kết quả tốt như mong đợi, lý do là vì thao tác tìm biên thường liên quan đến các phép toán vi phân (như 2 toán tử Gradient và Laplace đã nói ở trên), vốn rất nhạy cảm đối với nhiễu.

        Hình  2-1: Ảnh độ xám với: (a) 1 ngưỡng phân đoạn và (b) 2 ngưỡng phân đoạn
        Hình 2-1: Ảnh độ xám với: (a) 1 ngưỡng phân đoạn và (b) 2 ngưỡng phân đoạn

        Làm mảnh biên

        Ông đã sử dụng mạng nơ ron 3 lớp, trong đó số nút ở lớp nhập được xác định theo số đặc trưng được rút ra cho mỗi pixel, số nút xuất ứng với số phân vùng của ảnh. Như vậy, cách tiếp cận này nhằm mục đích kết hợp các ưu điểm của tập mờ (suy luận dựa trên tính không chính xác/không hoàn chỉnh của tri thức) và ưu điểm của mạng nơ ron. Lưu ý rằng ta chỉ xóa điểm ảnh khi tất cả các điểm biên đã được duyệt qua, nhờ vậy dữ liệu không bị thay đổi trong quá trình xử lý.

        Điều kiện (b) không thỏa khi điểm đang xét nằm trên vùng biên có độ dày bằng 1, và do đó nếu xóa nó sẽ làm mất tính liên tục của đối tượng.

        Biểu diễn đường biên

          Tương tự, trong trường hợp p1 có 7 điểm lân cận, nếu ta xóa nó sẽ gây ra lỗ hổng trong vùng đang xét. Chain code tỏ ra rất hữu dụng khi dùng để xác định hướng của đường biên tại một điểm, hoặc dùng để tính chu vi của vùng (xem 2.5.1). Lí do là vì với cách biểu diễn này, thật khó có thể rút ra được các thông tin cần thiết cho quá trình xử lý, chẳng hạn như khoảng cách từ một điểm đến đường biên.

          Nguyên tắc tắc rất đơn giản: xem mỗi đối tượng là một tập hợp các dòng, và thay vì lưu tất cả các điểm trong mỗi dòng, ta chỉ cần lưu chỉ số của dòng đó, cùng với điểm bắt đầu và kết thúc tương ứng trong dòng.

          Hình  2-8: Vùng và biểu diễn dòng quét của nó
          Hình 2-8: Vùng và biểu diễn dòng quét của nó

          Các đặc trưng mô tả vùng (đường kính, chu vi, diện tích…)

            Khoảng cách xuyên tâm là khoảng cách Euclide giữa tâm khối lượng của vùng và tâm của hợp tất cả các vùng trong ảnh. Cách đơn giản nhất để ước lượng tâm vùng là dùng giá trị trung bình của tọa độ các điểm của vùng đó. Chiều dài trục chính và phụ là những đặc trưng rất quan trọng và có thể được ước lượng bằng cách sử dụng các giá trị riêng.

            Chiều dài của các trục bằng với căn bậc hai của các giá trị riêng của ma trận hiệp phương sai.

            Cây quyết định

            • Thuật toán ID3

              Hầu hết các thuật toán dựa vào qui nạp hiện có đều sử dụng phương pháp của Hunt dùng để xây dựng một cây quyết định từ một tập T các ca học với các lớp được kí hiệu là {C1,C2,……Cn}. - Trường hợp 2: T không chứa ca nào: Cây quyết định cho T là một lá, nhưng lớp được gắn với lá này phải được xác định từ các thuộc tính không thuộc T. Quá trình này được thực hiện một cách đệ qui cho đến khi một tập đối tượng tại một cây con đã cho trở nên thuần nhất, tức là nó chỉ chứa các đối tượng thuộc về cùng một lớp.

              Như vậy, có thể quyết định chọn Quang cảnh làm thuộc tính đầu tiên khai triển cây, Hình 2-12 là khai triển của cây quyết định theo thuộc tính Quang cảnh.

              Bảng 2-1: Dữ liệu minh họa cho cây quyết định
              Bảng 2-1: Dữ liệu minh họa cho cây quyết định

              Thông tin tương hỗ

              Từ các giá trị của Entropy Gain, ta thấy Độ ẩm là thuộc tính tốt nhất cho đỉnh nằm dưới nhánh Nắng của thuộc tính Quang cảnh. Tiếp tục quá trình trên cho tất cả các đỉnh và sẽ dừng khi không còn đỉnh nào có thể khai triển được nữa. Kết quả này nói lên rằng không tồn tại cách xử lý Y nào, dù là ngẫu nhiên hay chủ ý, có thể làm tăng thông tin Y chứa về X.

              Ở phần 3.4, ta sẽ bàn về cách sử dụng thông tin tương hỗ này vào bài toán phân vùng ảnh.

              Học dựa vào sự trình diễn

              Trong suốt quá trình học, thường thì không có bất kì một phản hồi nào từ phía người học sinh về mức độ kiến thức mà họ đã tiếp thu được, do đó cách học này có thể làm lãng phí nhiều tài nguyên, thời gian và công sức. Cách học dựa vào trình diễn là một bước phát triển cao hơn của mô hình tương tác trên: người học sinh yêu cầu giáo viên giải một ví dụ nào đó và bằng cách quan sát cách giải quyết của giáo viên, học sinh sẽ tổng quát thành kiến thức cho mình. Lợi thế của của cách học này là học sinh có thể định hướng trực tiếp được những phần chưa hiểu để giáo viên tập trung vào đó.

              Nhờ vậy, vai trò của người học sinh trong quá trình học là chủ động chứ không phải bị động.

              Xây dựng hệ thống

              Phân đoạn đơn giản

              Qua thử nghiệm, với ngưỡng cho tổn thương xuất huyết/tụ máu như trong bảng 1-1 thì tất cả những vùng bị tổn thương đều được phát hiện, không bỏ sót vùng nào. Một ví dụ về hiện tượng này là trường hợp những vùng nhu mô não (vốn có đậm độ chỉ khoảng 30-45) nhưng nếu nằm kế bên vùng xương (có đậm độ cao hơn rất nhiều, từ 250 trở lên) thì đậm độ của vùng nhu mô đó sẽ tăng lên. Đó chính là lí do mà những vùng như mô não nằm cạnh xương sọ sẽ bị nhận lầm là vùng tổn thương xuất huyết/tụ máu.

              Loại bỏ những vùng này chính là nhiệm vụ của module tiếp theo: phân lớp bằng K người láng giềng gần nhất với dữ liệu học thu được bằng phương pháp học dựa vào sự trình diễn.

              Học dựa vào sự trình diễn

              • Đặc trưng vùng
                • Phân lớp bằng thuật toán k-người láng giềng gần nhất

                  Nhớ rằng do hiệu ứng thể tích từng phần nên những vùng nhu mô não ở quá gần vùng xương sọ sẽ bị ảnh hưởng tăng đậm độ, do đó sẽ là hợp lý nếu ta tìm khoảng cách từ một vùng đến vùng sọ gần nhất của nó. Cũng xuất phát từ ảnh hưởng của hiệu ứng thể tích toàn phần nên đậm độ ở những lát cắt trên cùng sẽ tăng cao (do gần với vùng sọ đỉnh), và dĩ nhiên những vùng tụ máu/xuất huyết ở đây cũng sẽ có đậm độ cao hơn. Từ đó, ta nhận thấy rằng đậm độ trung bình của vùng nhu mô não sẽ đóng vai trò quan trọng, và phản ánh tương đối vị trí của lát cắt đó trong não ( lát cắt càng cao thì đậm độ trung bình càng lớn, tuy nhiên nó cũng sẽ bị ảnh hưởng bởi nhiều yếu tố khác, chẳng hạn như những tổn thương có biểu hiện là giảm đậm độ…) cũng như là đậm độ của vùng tụ máu/xuất huyết được phát hiện.

                  Mặt khác, nếu vùng đó nằm gần não, nhưng có diện tích lớn khá lớn thì nhiều khả năng đó là tổn thương tụ máu dưới/ngoài màng cứng nên cần được giữ lại, như vậy hệ số về tương ứng với diện tích cũng phải cao.

                  Dùng hệ luật để định vị vùng tổn thương

                    Cùng với cách chọn giá trị cho k thì việc xác định công thức tính khoảng cách giữa 2 vector đặc trưng (nói cách khác, là độ tương tự giữa 2 mẫu) cũng đóng vai trò quan trọng. Chẳng hạn, một vùng càng nằm gần sọ não thì càng có nhiều khả năng đã bị phát hiện lầm ở bước phân đoạn trước, như vậy hệ số cho đại lượng này trong công thức tính khoảng cần phải lớn hơn. Nếu một vùng tổn thương nằm trên nhiều vùng khác nhau của não thì vị trí được xác định sẽ là hợp của các vị trí đó lại với nhau, chẳng hạn “thái dương-trán” hay “thái dương-chẩm”.

                    Khi định vị, ta chỉ cần phân vùng ảnh theo cách đã làm khi học, xác định phân vùng chứa tổn thương, tính toán các đặc trưng và sử dụng hệ luật đã xây dựng để định vị.

                    Hình  3-2: Minh họa lát cắt đầu tiên vùng trên lều
                    Hình 3-2: Minh họa lát cắt đầu tiên vùng trên lều

                    Chương trình cài đặt – kết quả thử nghiệm

                    Chương trình cài đặt

                      • Sau đó, sử dụng công cụ đánh dấu vùng kèm theo để chọn những vùng bệnh thật (vùng sẽ được giữ lại). Sau khi đã có dữ liệu học, hệ thống chính đã có thể hoạt động. Rất tiếc do thời gian có hạn nên em đã không kịp cài đặt và thử nghiệm phần tạo hệ luật cho module định vị vùng tổn thương trong não.

                      Hình  4-2: Màn hình học dựa vào sự trình diễn
                      Hình 4-2: Màn hình học dựa vào sự trình diễn

                      Đánh giá kết quả

                        Ngược lại, “tỉ lệ phân lớp vùng bình thường đúng” rất cao (98%) nói lên rằng 98% các vùng được đánh nhãn bình thường là đúng; nói cách khác, chỉ có 2% số vùng bệnh bị đánh dấu không bệnh là sai. - Chỉ mới đề cập đến một góc nhỏ của việc chẩn đoán chấn thương sọ não bằng ảnh CT, cộng thêm việc yêu cầu dữ liệu đầu vào khá chặt, nên tính thực tế vẫn còn thấp. - Nghiên cứu thử nghiệm nhiều phương pháp và thuật toán khác, vì các thuật toán được chọn nói chung đều do chủ quan của người viết, không qua quá trình thử nghiệm so sánh độ hiệu quả cụ thể.

                        - Để nâng cao tính chính xác của hệ thống, ta có thể áp dụng thêm các kiến thức khác về chuyên môn, đặc biệt chú ý đến tính đối xứng của não.