5. Ý nghĩa khoa học và thực tiễn của đề tài
1.3.2. Tiếp cận dựa trên phân tích đặc trƣng (Feature Extraction)
Mỗi đối tƣợng đƣợc xác định tốt có một số tính năng hoặc thuộc tính giúp chúng ta xác định đối tƣợng đó một cách dễ dàng. Để tự động phân loại các đối tƣợng, chúng ta cần một số đặc trƣng. Tập hợp các đối tƣợng đặc trƣng này đƣợc gọi là vector đối tƣợng. Để xác định bất thƣờng trên phổi, chúng ta cần tìm các đặc trƣng nhƣ vậy từ hình ảnh chụp đầu vào. Trong xử lý ảnh có ba loại đặc trƣng, thứ nhất là đặc điểm cấu trúc, thứ hai là đặc điểm kết cấu thống kê và thứ ba là đặc điểm quang phổ. Đặc điểm cấu trúc còn đƣợc gọi là các đặc điểm nhị phân nhƣ diện tích, tâm, chu vi, định hƣớng, hình chiếu, tỷ lệ cỡ ảnh và số Euler,… . Các đặc điểm thống kê cũng chia thành hai lớp lần lƣợt là đặc điểm kết cấu thống kê bậc nhất và bậc hai. Các đặc điểm cấu trúc bậc nhất đƣợc trích xuất trực tiếp từ biểu đồ mức xám trong khi đối
với các đặc điểm cấu trúc bậc hai, trƣớc tiên, chúng tôi tìm một ma trận đồng xuất hiện và sau đó chúng tôi tìm entropy trung bình và đồng phƣơng sai. Trong các đặc điểm quang phổ, đặc điểm Gaber và wavelet là các đặc điểm rất phổ biến, thƣờng gặp khi làm việc với ảnh y khoa. Nhiều tác giả sử dụng các tập đặc điểm khác nhau để phát hiện ung thƣ phổi bằng các phƣơng pháp khác nhau với các bộ dữ liệu có sẵn khác nhau nhƣng vẫn chƣa có phƣơng pháp nào có thể tự động phân đoạn và phân loại các vùng ác tính và lành tính trong hình ảnh ung thƣ phổi. Tuy nhiên, có hai cách tiếp cận đƣợc sử dụng để trích xuất vector đặc trƣng, đầu tiên là phƣơng pháp Banalization liên quan đến các đặc điểm cấu trúc đƣợc tính toán từ các hình ảnh nhị phân và cách tiếp cận còn lại là cách tiếp cận masking trong đó tác giả thƣờng trích xuất cấu trúc thống kê và các đặc trƣng quang phổ.
1.3.2.1. Thuật toán Banalization
Thuật toán banalization còn đƣợc biết đến nhƣ thuật toán threshold. Mục tiêu của thuật toán này là tìm ra ngƣỡng threshold thích hợp [26]. Bằng việc sử dụng giá trị ngƣỡng này, ảnh mục tiêu đƣợc chia ra thành hai phần gồm phần ảnh mặt tiền và phần ảnh nền. Ảnh mặt tiền đƣợc thể hiện bằng màu trắng trong khi phần nền đƣợc thể hiện bằng màu đen. Hƣớng tiếp cận này đƣợc dựa trên số lƣợng các pixel màu đen mà có giá trị lớn hơn các pixel màu trắng, nếu không thì có nghĩa là ảnh không đƣợc bình thƣờng.
1.3.2.2. Phương pháp Masking
Masking, hay còn đƣợc gọi là bộ lọc. Bộ lọc đƣợc phân thành các dạng nhƣ:
- Low-Pass (duy trì các tần số thấp) - High-Pass (duy trì các tần số cao)
- Band-Pass (duy trì các tần số với một dải tần số nhất định)
Trong hƣớng tiếp cận masking, chúng ta thƣờng sử dụng các pixel láng giềng của các ảnh đầu vào với các vùng hiệu ứng và từ đó tính toán các đặc điểm cấu trúc và thống kê để từ xác định đƣợc vùng bất thƣờng của phổi.