Theo [4], một vấn đề quan trọng khi xây dựng những hệ thống dựa vào tri thức là giai đoạn thu thập tri thức. Đây là một thách thức lớn và là một đề tài thu hút nhiều quan tâm trong lĩnh vực máy học cũng như trí tuệ
nhân tạo. Thông thường, người kĩ sư tri thức cần có một chuyên gia trình bày những hiểu biết chuyên môn của mình và dựa vào đó để xây dựng cơ sở tri thức. Đây là quá trình khá buồn tẻ và thường có nhiều sai sót. Cách trình bày của chuyên gia có thể không hoàn toàn chính xác, không hoàn chỉnh và có thể không được hiểu đúng bởi người kĩ sư tri thức. Trong nhiều trường hợp, các chuyên gia có khuynh hướng thực hiện hành động hơn là giải thích về
chuyên môn của mình. Những vấn đề trên thúc đẩy chúng ta tìm kiếm một giải pháp khác cho bài toán xây dựng cơ sở tri thức: thay vì thu thập các tri thức dưới dạng trao đổi với chuyên gia, ta sẽ yêu cầu họ trình diễn các tri thức của mình thông qua các hành động mà hệ thống có thể quan sát và ghi nhận lại được. Cách tiếp cận này gọi là phương pháp học dựa vào trình diễn (learning by demonstration).
Nhiều dạng máy học có thể xem như là một hình thức tương tác giữa giáo viên và học sinh: người giáo viên đưa ra các ví dụ và máy tính (hoặc học sinh) tổng quát hóa những ví dụđó để tạo thành tri thức cho riêng mình. Sau đó, giáo viên sẽ kiểm tra khả năng của học sinh bằng cách đưa ra những
bài kiểm tra và xem xét kết quả thực hiện của học sinh. Trong suốt quá trình học, thường thì không có bất kì một phản hồi nào từ phía người học sinh về
mức độ kiến thức mà họ đã tiếp thu được, do đó cách học này có thể làm lãng phí nhiều tài nguyên, thời gian và công sức. Cách học dựa vào trình diễn là một bước phát triển cao hơn của mô hình tương tác trên: người học sinh yêu cầu giáo viên giải một ví dụ nào đó và bằng cách quan sát cách giải quyết của giáo viên, học sinh sẽ tổng quát thành kiến thức cho mình. Lợi thế
của của cách học này là học sinh có thể định hướng trực tiếp được những phần chưa hiểu để giáo viên tập trung vào đó. Nhờ vậy, vai trò của người học sinh trong quá trình học là chủđộng chứ không phải bị động.
Chương 3 : Xây dựng hệ thống
Phần đầu tiên của hệ thống là module dò tìm vùng tổn thương bằng phương pháp lọc ngưỡng. Nhiệm vụ của bộ lọc này là tìm ra những vùng có
độ đo Hounsfield nằm trong ngưỡng của tổn thương đang được dò tìm. Do
ảnh hưởng của hiệu ứng thể tích từng phần nên sẽ có khá nhiều vùng bị nhận lầm. Chính vì vậy, nhiệm vụ của module tiếp theo chính là để loại ra những vùng bị phát hiện nhầm đó. Ở đây ta sử dụng thuật toán k-người láng giềng gần nhất để tạo bộ phân lớp. Bộ phân lớp này được xây dựng dựa vào phương pháp học bằng sự trình diễn: kết quả của bộ lọc thứ nhất sẽ được hiển thị, và các chuyên gia (bác sĩ chẩn đoán hình ảnh), bằng tri thức và kinh nghiệm của mình, sẽ quyết định xem vùng nào sẽ bị loại bỏ và vùng nào sẽ được giữ lại. Đặc trưng của những vùng này, cùng với thông tin về hành
động tương ứng tách động lên nó (giữ hay xóa) sẽ được lưu lại tạo thành dữ
liệu học.
Sau khi loại bỏ các vùng bị nhận dạng nhầm, ta sẽ tiến hành đo các thông tin định tính về vùng đó, sau đó sử dụng hệ luật để định vị vùng tổn thương đó trong não. Do vấn đề thời gian nghiên cứu, hệ luật này chỉ mới
được xây dựng ở mức độ đơn giản, dựa vào các quan sát trên hình ảnh và tiêu bản não. Để xây dựng được hệ luật phức tạp hơn, một lần nữa phương pháp học bằng sự trình diễn sẽđược dùng đến.
3.1 Phân đoạn đơn giản
Dữ liệu sau khi tiền xử lý sẽ được cho qua bộ phân đoạn để xác định vùng chấn thương thứ nhất. Module này sử dụng phương pháp lọc ngưỡng để
phát hiện ra các vùng xuất huyết/tụ máu. Phương pháp này được chọn vì nó có những ưu điểm sau:
a. Nhưđã trình bày trong bảng 1-1, mỗi một cấu trúc trong não sẽ có độ
hấp thụđối với tia X khác nhau, tức là có đậm độ khác nhau. Như vậy, ngưỡng đậm độ của tổn thương xuất huyết/tụ máu là đã xác định được,
mà ta biết rằng xác định ngưỡng chính là bước quan trọng và khó khăn nhất trong cách tiếp cận này.
b. Cài đặt đơn giản, tốc độ cao, không cần dữ liệu học.
c. Qua thử nghiệm, với ngưỡng cho tổn thương xuất huyết/tụ máu như
trong bảng 1-1 thì tất cả những vùng bị tổn thương đều được phát hiện, không bỏ sót vùng nào.
Tuy vậy, bộ phân đoạn đơn giản này cũng có một khuyết điểm quan trọng: phân đoạn nhầm một số vùng khác. Nguyên nhân chính gây ra sai sót này là do hiện tượng gọi là hiệu ứng thể tích từng phần. Một ví dụ về hiện tượng này là trường hợp những vùng nhu mô não (vốn có đậm độ chỉ khoảng 30-45) nhưng nếu nằm kế bên vùng xương (có đậm độ cao hơn rất nhiều, từ
250 trở lên) thì đậm độ của vùng nhu mô đó sẽ tăng lên. Đó chính là lí do mà những vùng như mô não nằm cạnh xương sọ sẽ bị nhận lầm là vùng tổn thương xuất huyết/tụ máu. Loại bỏ những vùng này chính là nhiệm vụ của module tiếp theo: phân lớp bằng K người láng giềng gần nhất với dữ liệu học thu được bằng phương pháp học dựa vào sự trình diễn.
3.2 Học dựa vào sự trình diễn
Như đã nói, mọi phương pháp máy học đều bao gồm 2 giai đoạn: giai
đoạn học và giai đoạn hoạt động. Trong hệ thống của chúng ta, giai đoạn học sẽ được thực hiện trên một hộp thoại riêng, và những tri thức thu được từ
người sử dụng sẽ được lưu lại để sử dụng cho quá trình chẩn đoán thật sựở
màn hình chính.
3.2.1 Hệ thống học
Để thu nhận tri thức từ chuyên gia cho hệ thống học dựa vào sự trình diễn, ta cần xây dựng một giao diện tương tác trực tiếp với người sử dụng. Dữ liệu nhập cho hệ thống này là kết quả từ module phân đoạn đơn giản ở
trên, gồm dữ liệu về các lát cắt CT cùng những vùng tụ máu/xuất huyết đã
sử dụng những kiến thức chuyên môn của mình để quyết định hành động sẽ được thực hiện lên mỗi vùng (gồm một trong 2 hành động là xóa hoặc giữ
lại). Bên cạnh đó, chương trình sẽ tính toán các đặc trưng cần thiết của mỗi vùng. Tại mỗi vùng, kết hợp hành động với đặc trưng ta sẽ có một mẫu học. Những mẫu này sẽ được lưu lại và trở thành dữ liệu học cho một phương pháp phân lớp nào đó, ví dụ như mạng nơ ron, cây quyết định hoặc k-người láng giềng gần nhất…
Hình 3-1: Ảnh CT qua bộ lọc thứ nhất, trong đó màu đỏ biểu diễn cho vùng bệnh và màu xanh ứng với những vùng bị nhận nhầm
3.2.2 Đặc trưng vùng
Bên cạnh những đặc trưng đã nêu ra trong phần 2.5, sẽ có thêm một số đặc trưng khác được sử dụng:
3.2.2.1 Đậm độ lớn nhất, nhỏ nhất, trung bình của vùng
Ứng với mỗi vùng, ta sẽ tính các thông số vềđậm độ lớn nhất, nhỏ nhất và trung bình của nó. Do mỗi vùng được lưu theo dạng dòng quét nên việc duyệt qua tất cả các điểm ảnh và tính ra các giá trị này khá đơn giản.
3.2.2.2 Diện tích của vùng
Đặc trưng này đã được trình bày trong phần trong phần 2.5. Đặc trưng này cho ta biết độ lớn nhỏ của vùng.
3.2.2.3 Khoảng cách gần nhất
Nhớ rằng do hiệu ứng thể tích từng phần nên những vùng nhu mô não ở
quá gần vùng xương sọ sẽ bịảnh hưởng tăng đậm độ, do đó sẽ là hợp lý nếu ta tìm khoảng cách từ một vùng đến vùng sọ gần nhất của nó. Vấn đề cần quan tâm nhất là điểm nào trong vùng sẽ được chọn làm mốc để tính khoảng cách tới vùng xương. Ởđây ta chọn điểm trung tâm của vùng, với điểm trung tâm được xác định như là “điểm giữa của dòng quét giữa của vùng”. Ví dụ: vùng đó có 9 dòng quét và dòng quét thứ 5 có 7 điểm thì điểm thứ 4 của dòng quét 5 chính là điểm được chọn.
3.2.2.4 Đậm độ trung bình của vùng nội sọ (vùng nhu mô não)
Cũng xuất phát từ ảnh hưởng của hiệu ứng thể tích toàn phần nên đậm
độ ở những lát cắt trên cùng sẽ tăng cao (do gần với vùng sọ đỉnh), và dĩ
nhiên những vùng tụ máu/xuất huyết ở đây cũng sẽ có đậm độ cao hơn. Từ đó, ta nhận thấy rằng đậm độ trung bình của vùng nhu mô não sẽ đóng vai trò quan trọng, và phản ánh tương đối vị trí của lát cắt đó trong não ( lát cắt càng cao thì đậm độ trung bình càng lớn, tuy nhiên nó cũng sẽ bị ảnh hưởng bởi nhiều yếu tố khác, chẳng hạn như những tổn thương có biểu hiện là giảm
Qua quá trình thử nghiệm, vector đặc trưng của mỗi vùng gồm 3 đại lượng sau: diện tích vùng, trung bình đậm độ, và khoảng cách nhỏ nhất.