Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 27 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
27
Dung lượng
1,05 MB
Nội dung
BỘ GIÁO DỤC VÀ ĐÀO TẠO VIỆN HÀN LÂM KHOA HỌC VÀ CÔNG NGHỆ VIỆT NAM HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ …… ….***………… TRẦN MẠNH TUẤN NGHIÊN CỨU MỘT SỐ PHƢƠNG PHÁP PHÂN CỤM BÁN GIÁM SÁT MỜ TRONG PHÂN ĐOẠN ẢNH NHA KHOA Chuyên ngành: Cơ sở toán học cho tin học Mã số: 62 46 01 10 TÓM TÁT LUẬN ÁN TIẾN SĨ TOÁN HỌC HÀ NỘI – 2016 Công trình đƣợc hoàn thành tại: Học viện Khoa học Công nghệ Viện Hàn lâm Khoa học Công nghệ Việt Nam Ngƣời hƣớng dẫn khoa học 1: PGS.TS LÊ BÁ DŨNG Ngƣời hƣớng dẫn khoa học 2: TS VŨ NHƢ LÂN Phản biện 1: PGS.TS Trần Đình Khang Phản biện 2: PGS.TS Ngô Thành Long Phản biện 3: TS Phạm Thanh Hà Luận án bảo vệ trước Hội đồng chấm luận án tiến sĩ, họp Học viện Khoa học Công nghệ - Viện Hàn lâm Khoa học Công nghệ Việt Nam vào hồi ngày tháng năm Có thể tìm hiểu luận án tại: - Thư viện Học viện Khoa học Công nghệ - Thư viện Quốc gia Việt Nam MỞ ĐẦU Phân đoạn ảnh chia nhỏ ảnh thành vùng đông cấu tạo nên ảnh đối tượng [17], [52] Phân đoạn ảnh thường sử dụng để xác định: vị trí đối tượng (chẳng hạn loại trồng, khu vực đô thị, rừng hình ảnh vệ tinh, v.v.) đường biên, ranh giới (đường thẳng, đường cong, v.v.) ảnh Với ảnh nha khoa mục đích phân đoạn ảnh nha khoa bước xử lý quan trọng nha khoa thực hành nhằm hỗ trợ bác sĩ chẩn đoán cách hiệu bệnh quanh Ảnh X-quang nha khoa gồm phần [54]: i) Phần răng: phần có độ xám cao phần ta nhìn thấy rõ ảnh; ii) Phần cấu trúc răng: phần có độ xám trung bình gồm lợi răng, xương, phần khác (tủy, xi măng v.v.); iii) Phần nền: phần có giá trị độ xám nhỏ tảng cấu trúc Với cấu trúc ảnh X-quang nha khoa việc phân đoạn ảnh phức tạp phân đoạn ảnh thông thường [70] Bài toán phân đoạn ảnh nha khoa sử dụng để hỗ trợ việc chẩn đoán bệnh nha khoa dự đoán tuổi nha khoa [51] Đồng thời, phân đoạn ảnh nha khoa mang lại thông tin có giá trị cho nha sĩ trình phân tích thông tin từ hình ảnh [51] Liên quan đến độ xác phân đoạn ảnh nha khoa, cần có phương pháp học máy khác áp dụng [30], [35] Kết phân đoạn ảnh nha khoa cung cấp thêm thông tin cho nha sỹ trình chẩn đoán bệnh, giúp nha sỹ chẩn đoán bệnh xác hiệu Với toán phân đoạn ảnh nha khoa, nghiên cứu trước đưa kỹ thuật phân đoạn phân đoạn ảnh dựa phân ngưỡng [21], [27], phân đoạn ảnh dựa phân cụm [44], [70] Tuy nhiên phương pháp thường gặp vấn đề xác định tham số ngưỡng hay biên chung mẫu phương pháp phân cụm mờ cho xử lý tốt [59] Trong phân cụm rõ, liệu chia vào nhóm, điểm liệu thuộc vào xác cụm [10] Trong phân cụm mờ, điểm liệu thuộc vào nhiều cụm với độ thuộc tương ứng [10] Khi đó, tương ứng với điểm liệu ma trận độ thuộc, với giá trị phần tử ma trận mức độ điểm liệu thuộc vào cụm khác [10] Các phương pháp phân cụm mờ sử dụng nhiều toán nhận dạng mẫu, phát tri thức từ sở liệu, đánh giá rủi ro có ứng dụng nhiều phân đoạn ảnh Trong nghiên cứu gần việc sử dụng thông tin bổ trợ cung cấp người dùng gắn với đầu vào phân cụm mờ để hướng dẫn, giám sát điều khiển trình phân cụm Các thuật toán phân cụm mờ kết hợp với thông tin bổ trợ người dùng xác định trước hình thành lên nhóm thuật toán phân cụm bán giám sát mờ [23] Một số nghiên cứu gần cho thấy thuật toán phân cụm bán giám sát mờ hiệu nhiều lĩnh vực xử lý ảnh [16], [31], [49], nhận dạng mẫu, nhận dạng khuôn mặt [5], [33], đánh giá rủi ro [15], dự báo phá sản [36] Đặc biệt xử lý ảnh với ảnh màu ảnh y học Cũng có số kết đưa cho toán phân đoạn ảnh nha khoa sử dụng đặc trưng ảnh nha khoa cấu trúc ảnh, màu sắc, hình dáng trình phân đoạn gồm phương pháp lấy ngưỡng [21], [27], phương pháp phân cụm [70] Tuy nhiên nghiên cứu này, chưa có kết phân cụm bán giám sát mờ áp dụng cho ảnh X-quang nói chung ảnh X-quang nha khoa nói riêng, mà chủ yếu nghiên cứu trước sử dụng phân cụm mờ đồng thời sử dụng đặc trưng ảnh nha khoa chưa sử dụng thông tin không gian Nội dung nghiên cứu luận án tập trung vào việc đề xuất, cải tiến kỹ thuật phân đoạn ảnh thuật toán phân cụm bán giám sát mờ Trong trình phân đoạn ảnh nha khoa, kỹ thuật phân cụm mờ (FCM) [10], phân cụm bán giám sát mờ (eSFCM) [67] kỹ thuật tách ngưỡng Otsu [43] kỹ thuật làm tiền đề cho phương pháp đề xuất luận án Trong phương pháp trình bày luận án, thông tin bổ trợ xác định ma trận độ thuộc thuật toán phân cụm mờ FCM kết hợp với thông tin đặc trưng ảnh nha khoa Đây cách tiếp cận mà phương pháp trước chưa đề cập đến Đồng thời, luận án trình bày số cách xác định thông tin bổ trợ phù hợp ứng với đối tượng đầu vào khác Từ thực việc cài đặt đánh giá đề xuất máy tính Mục tiêu nghiên cứu: Nghiên cứu thuật toán phân cụm bán giám sát mờ vào phân đoạn ảnh Phát triển nghiên cứu đề xuất cải tiến phương pháp phân cụm bán giám sát mờ cho phân đoạn ảnh nha khoa Các thuật toán cải tiến đề xuất dựa thông tin không gian đặc trưng ảnh nha khoa nhằm mục đích nâng cao chất lượng phân cụm thuật toán phân cụm bán giám sát mờ áp dụng với toán phân đoạn ảnh nha khoa Với mục tiêu nghiên cứu luận án thu đƣợc số đóng góp nhƣ sau: Luận án nghiên cứu phát triển thuật toán phân cụm bán giám sát mờ phân đoạn ảnh nha khoa, cụ thể: - Đề xuất phương pháp phân đoạn ảnh nha khoa dựa phân cụm bán giám sát mờ lai ghép (Lai ghép phân cụm bán giám sát mờ với phân cụm mờ phương pháp tách ngưỡng Otsu) - Đề xuất phân cụm bán giám sát mờ có sử dụng đặc trưng không gian ảnh nha khoa vào toán phân đoạn ảnh; - Vận dụng phương pháp giải tối ưu đa mục tiêu để giải toán tối ưu đa mục tiêu phân cụm bán giám sát mờ, từ đưa mệnh đề, định lý tính chất nghiệm toán; - Xây dựng kho liệu hàm xác định thông tin bổ trợ cho phân cụm bán giám sát mờ, từ lựa chọn hàm thông tin bổ trợ phù hợp với ảnh đầu vào để chất lượng cụm tốt Cài đặt thực nghiệm thuật toán cải tiến dựa thu thập phân tích liệu ảnh mẫu bệnh nha khoa Ứng dụng phân đoạn ảnh hệ hỗ trợ chẩn đoán nha khoa Ngoài phần phần mở đầu kết luận, luận án cấu trúc thành ba chương: Chương trình bày tổng quan phân cụm bán giám sát mờ toán phân đoạn ảnh Đồng thời trình bày lý thuyết sở sử dụng trình học tập nghiên cứu Thông qua chương này, luận án đưa nhìn tổng quan toán nghiên cứu, khái niệm thuật toán sử dụng nghiên cứu luận án Các đóng góp luận án trình bày chương 2, chương Chương trình bày kết nghiên cứu phương pháp phân cụm bán giám sát mờ sử dụng cho phân đoạn ảnh nha khoa Trong chương trình bày phân cụm bán giám sát mờ lai ghép Đặc biệt luận án trình bày đề xuất phát triển phân cụm bán giám mờ có sử dụng thông tin đặc trưng không gian sử dụng phương pháp nhân tử Lagrange thỏa dụng mờ giải toán tối ưu đa mục tiêu Đồng thời, chương 2, luận án xây dựng cách xác định thông tin bổ trợ phù hợp ảnh đầu vào để có kết phù hợp Chương trình bày kết thực nghiệm thu cài đặt thuật toán phân cụm bán giám sát mờ đề xuất chương liệu ảnh X-quang nha khoa Trong có phân tích liệu sử dụng tiêu chí đánh giá thông qua độ đo, từ xác định kết sử dụng để đánh giá hiệu thuật toán đề xuất so sánh với thuật toán khác nghiên cứu gần cho toán tương tự Ứng dụng phân đoạn ảnh thiết kế hệ hỗ trợ chẩn đoán bệnh Cuối cùng, kết luận nêu đóng góp, hướng phát triển, vấn đề quan tâm công trình công bố luận án CHƢƠNG TỔNG QUAN VỀ PHÂN CỤM BÁN GIÁM SÁT MỜ TRONG PHÂN ĐOẠN ẢNH NHA KHOA Trong chương này, luận án nêu toán nghiên cứu thời gian vừa qua Qua có nhìn tổng quan toán nghiên cứu luận án, cụ thể toán phân đoạn ảnh nha khoa toán chẩn đoán bệnh nha khoa Luận án trình bày kết nghiên cứu liên quan đề xuất gần Đồng thời chương này, luận án trình bày lý thuyết tập mờ, phân cụm, phương pháp giải tối ưu hệ suy diễn mờ Các kiến thức tảng để giải toán phân đoạn ảnh chẩn đoán nha khoa mà luận án hướng tới 1.1 Bài toán phân đoạn ảnh nha khoa 1.1.1 Khái niệm Phân đoạn ảnh chia nhỏ ảnh thành vùng cấu thành nên đối tượng [17], [52] Phân đoạn ảnh thường sử dụng để xác định vị trí đối tượng (chẳng hạn loại trồng, khu vực đô thị, rừng hình ảnh vệ tinh, v.v.) đường biên/ranh giới (đường thẳng, đường cong, v.v.) ảnh Chính xác hơn, phân đoạn ảnh trình gán nhãn cho pixel ảnh mà pixel có nhãn có chung số đặc điểm định 1.1.2 Ảnh X-quang nha khoa Cơ quan bao gồm nha chu quanh răng, đơn vị hình thái chức Răng phận trực tiếp nhai nghiền thức ăn, nha chu phận giữ nâng đỡ đồng thời phận nhận cảm, tiếp nhận dẫn truyền lực nhai Răng gồm men, ngà (mô cứng) tủy (mô mềm) Nha chu gồm xương chân răng, men chân răng, dây chằng, xương ổ răng, nướu (lợi), xương Bộ thể thống thuộc hệ thống nhai tạo thành xếp có tổ chức quan [2] 1.1.3 Nhu cầu ứng dụng y học Phân đoạn ảnh giai đoạn trình xử lý ảnh đóng vai trò quan trọng [14, 20] trình Khi đó, phân đoạn ảnh nha khoa bước xử lý then chốt nha khoa nhằm hỗ trợ bác sĩ chẩn đoán cách hiệu bệnh viêm chân răng, bệnh nha chu, viêm túi [55, 56] Khi ứng dụng phân đoạn ảnh chẩn đoán bệnh nha khoa Một ứng dụng thú vị phân đoạn ảnh nha khoa từ hình ảnh X-quang giám định pháp y [23], [50], việc giám định pháp y thường sử dụng công nghệ khoa học để phân tích (trong có phân tích răng) việc xác định người, Do đó, trở nên quan trọng để đưa định xác định hình thái mặt người dựa đặc tính: kích thước răng, khoảng cách mẫu xoang, xương mặt v.v [50] Bên cạnh việc giám định pháp y, phân đoạn ảnh nha khoa có số ứng dụng khác: xác định số [35], ước lượng tuổi nha khoa [65], phân đoạn ảnh nha khoa phân tích mảng bám [24], v.v 1.2 Tổng quan nghiên cứu liên quan Phân đoạn ảnh giai đoạn trình xử lý ảnh đóng vai trò quan trọng [32, 49] Phân đoạn ảnh công việc khó khăn xử lý ảnh Trong đó, phân đoạn ảnh nha khoa bước xử lý then chốt nhằm hỗ trợ bác sĩ chẩn đoán cách hiệu bệnh viêm chân răng, bệnh nha chu, viêm túi [42], [43] Khi trình phân đoạn ảnh bước quan trọng cần thiết để phân tích ảnh X-quang nha khoa cho trình xử lý sau như: hỗ trợ chẩn đoán [50], xác định thành phần khác ảnh (răng, lợi, tủy v.v.) [51] (a) (b) Hình 1.1 Ảnh nha khoa (a) Ảnh X-quang nha khoa; (b) Lỗ trống bị thiếu Ảnh X-quang nha khoa gồm phần (hình 1.1 a) [54]: i) Phần răng: phần có độ xám cao phần ta nhìn thấy rõ ảnh; ii) Phần cấu trúc răng: phần có độ xám trung bình gồm lợi răng, xương, phần khác (tủy, xi măng v.v.); iii) Phần nền: phần có giá trị độ xám nhỏ tảng cấu trúc Với cấu trúc ảnh X-quang nha khoa việc phân đoạn ảnh phức tạp phân đoạn ảnh thông thường [71] Nói cách khác, kết nối phần khác hình ảnh nha khoa X-quang chất lượng thấp hình ảnh tạp chất, độ tương phản thấp, sai sót chức quét hình ảnh, v.v làm giảm hiệu suất phân đoạn Ví dụ, lỗ trống bị (hình 1.1 b) xử lý kỹ thuật xử lý ảnh dựa ngưỡng thông thường [26] Vì vậy, phương pháp khai phá liệu phân đoạn ảnh X-quang nha khoa nghiên cứu để đạt độ xác cao phân đoạn [40] Các phƣơng pháp phân đoạn ảnh Dựa điểm ảnh Lấy ngưỡng Dựa biên Phát biên Phân cụm Kỹ thuật Gradient Otsu Toàn cục K-Means Đường mức kích hoạt Fuzzy C Means Kích hoạt Dựa vùng Xây dựng vùng Phân tách/ Kết hợp Phương pháp đồ thị Tập mức Hình 1.2 Các phương pháp phân đoạn ảnh Hình 1.2 giới thiệu số phương pháp phân đoạn ảnh [45] dựa điểm ảnh, dựa biên dựa vùng Trong phân đoạn ảnh có nhiều kỹ thuật khác sử dụng kỹ thuật chia thành loại xu hướng là: i) Áp dụng kỹ thuật xử lý ảnh [13], [37] gồm: phương pháp ngưỡng, phương pháp dựa biên dựa vùng ; ii) Áp dụng phương pháp phân cụm [46] gồm: K-means [60], Fuzzy C-Means (FCM) [10] Các phương pháp có sử dụng kỹ thuật xử lý ảnh thường phải biến đổi để biểu diễn ảnh dạng nhị phân, thông qua ngưỡng sử dụng đường cong phức tạp để xác định biên Một phương pháp thường sử dụng phương pháp tách ngưỡng Otsu [43] Các phương pháp thường gặp vấn đề khó khăn xác định tham số ngưỡng hay biên chung mẫu [59] Trong phương pháp sử dụng kỹ thuật phân cụm để xác định cụm không cần trước thông tin ngưỡng đường cong Tuy nhiên phương pháp đặt thách thức việc lựa chọn tham số phát biên cụm [12], [38], [39], [53] Điều đặt động lực việc cải tiến phương pháp phân đoạn ảnh để đạt hiệu suất tốt Các nghiên cứu trước [6], [66] cho thấy có thêm thông tin bổ sung kết hợp với trình phân cụm chất lượng phân cụm tăng cường Việc nghiên cứu đề xuất phương pháp phân cụm bán giám sát mờ với thông tin bổ trợ ba loại [70]: ràng buộc Must-link Cannot-link, nhãn lớp phần liệu, độ thuộc xác định trước Ví dụ, biết điểm ảnh đại diện cho vùng tương ứng ta gãn nhãn cho điểm ảnh vào lớp răng, điểm ảnh khác ảnh X-quang nha khoa phân cụm với hỗ trợ điểm ảnh biết Thông tin điểm ảnh biết làm cho kết phân đoạn ảnh xác Trong thuật toán phân cụm bán giám sát mờ đề xuất luận án, thông tin bổ trợ sử dụng ma trận thành viên xác định trước Đối với loại thông tin này, thuật toán phân cụm bán giám sát mờ (SSFC) [66], thuật toán phân cụm bán giám sát mờ sử dụng Entropy (eSFCM) [67] có hiệu so với thuật toán phân cụm mờ FCM Trong thuật toán này, thông tin bổ trợ tích hợp vào hàm mục tiêu thuật toán phân cụm bán giám sát mờ FCM Một ảnh X-quang đầu vào số bệnh bệnh Nếu việc chẩn đoán thực vùng ảnh chi tiết kết chẩn đoán cho toàn ảnh xác Mục tiêu phân đoạn từ hình ảnh X-quang nha khoa tạo nhiều phân vùng khác từ ảnh đầu vào cho điểm ảnh phân vùng có tương đồng cao so với phân vùng khác Những ảnh X-quang nha khoa phân loại theo vùng khác cụ thể vùng vùng cấu trúc vùng có bệnh vùng bệnh [71] Những vùng sau so sánh với tiêu chuẩn bệnh phương pháp tìm kiếm nhanh để xác định hình ảnh nha khoa có hay không chứa bệnh nha khoa Vấn đề nghiên cứu rộng rãi công trình [10], [12], [19], [29], [30], [43], [45] Trong đó, phương pháp điển hình phổ biến phương pháp tách ngưỡng Otsu [43], phân cụm mờ FCM [10], phân cụm bán giám sát mờ theo quy tắc Entropy eSFCM [67] 1.3 Một số kiến thức sở 1.3.1 Tập mờ Tập mờ [1] coi phần mở rộng tập kinh điển Nếu X không gian (một tập nền) phần tử biểu thị x, tập mờ A X xác định cặp giá trị: A ( x, A x ) | x X ,0 A x (1.1) Trong A(x) gọi hàm liên thuộc x A viết tắt MF Nó không hàm hai giá trị tập kinh điển nữa, mà hàm với tập giá trị hay gọi ánh xạ Tức là, hàm liên thuộc ánh xạ phần tử X tới giá trị liên thuộc khoảng [0,1] 1.3.2 Phân cụm Phân cụm liệu [10] trình nhóm tập đối tượng tương tự tập liệu vào cụm cho đối tượng thuộc cụm tương đồng, đối tượng thuộc cụm khác tương đồng Trong phân cụm mờ, điểm liệu thuộc vào nhiều cụm tương ứng với điểm liệu ma trận độ thuộc, với giá trị phần tử mức độ điểm liệu thuộc vào cụm khác [10] Khi thuật toán phân cụm mờ kết hợp với thông tin bổ trợ hình thành lên nhóm thuật toán gọi phân cụm bán giám sát mờ [65] Các thuật toán phân cụm bán giám sát mờ xây dựng dựa thuật toán phân cụm mờ kết hợp với thông tin bổ trợ người dùng cung cấp Các thông tin bổ trợ nhằm mục đích hướng dẫn, giám sát điều khiển trình phân cụm Thông tin bổ trợ thường xây dựng dựa loại [70] là: i)Các ràng buộc Mustlink Cannot-link; ii) Các nhãn lớp phần liệu; iii) Độ thuộc xác định trước Trong luận án tập trung nghiên cứu phân cụm bán giám sát mờ với thông tin bổ trợ độ thuộc xác định trước Một số nghiên cứu phân đoạn ảnh sử dụng phân cụm bán giám sát thường dùng loại thông tin bổ trợ giá trị hàm độ thuộc bổ sung Với loại thông tin bổ trợ này, Zhang [70] áp dụng quy tắc entropy để giảm số chiều đề xuất tiếp cận với ý tưởng kết hợp thành phần theo quy tắc entropy vào hàm mục tiêu Bên cạnh đó, Yasunori [66] đề xuất thuật toán phân cụm mờ bán giám sát sở FCM bổ sung thêm hàm độ thuộc bổ trợ sử dụng trình phân cụm Bouchachia Pedryzc [12] sử dụng thông tin bổ trợ vào việc xác định thành phần u kj thông qua giá trị trung gian u kj 1.3.3 Phƣơng pháp giải toán tối ƣu đa mục tiêu Phương pháp nhân tử Lagrange Phương pháp thỏa dụng mờ 1.4 Kết luận Trong chương này, luận án nêu toán nghiên cứu thời gian vừa qua Qua có nhìn tổng quan toán nghiên cứu luận án, cụ thể toán phân đoạn ảnh nha kho Luận án trình bày nghiên cứu liên qua thời gian qua Đồng thời chương này, luận án trình bày lý thuyết về: tập mờ, phân cụm, phương pháp giải tối ưu Các kiến thức tảng để giải toán phân đoạn ảnh chẩn đoán nha khoa mà luận án hướng tới CHƢƠNG MỘT SỐ THUẬT TOÁN PHÂN CỤM BÁN GIÁM SÁT MỜ CHO PHÂN ĐOẠN ẢNH NHA KHOA Trong chương này, luận án trình bày phương pháp phân cụm bán giám sát mờ cụ thể thuật toán phân cụm bán giám sát mờ lai ghép trình bày mục 2.1, kết mục công bố [CT3] Thuật toán phân cụm bán giám sát mờ có đặc trưng không gian trình bày mục 2.2 Phương pháp giải tối ưu đa mục tiêu thỏa dụng mờ với toán phân cụm bán giám sát mờ có đặc trưng không gian trình bày mục 2.3, kết mục công bố [CT5] Phương pháp xác định thông tin bổ trợ phù hợp cho thuật toán phân cụm bán giám sát mờ có đặc trưng không gian trình bày mục 2.4, kết mục công bố [CT2] Cuối số đánh giá đưa phần tổng kết chương 2.5 2.1 Thuật toán phân cụm bán giám sát mờ lai ghép 2.1.1 Lƣợc đồ tổng quan lai ghép Lược đồ tổng quan thể Hình 2.1 Từ ảnh X-quang có chứa vùng nền, sử dụng thủ tục để kiểm tra điều trước phân đoạn ảnh Phương pháp Otsu áp dụng để loại bỏ khu vực từ hình ảnh Sau tiến hành phân cụm mờ (FCM) Các kết trình phân cụm tâm cụm ma trận độ thuộc Khi kết nhận gần với kết toán, đồng thời sử dụng kết thông tin bổ trợ cho thuật toán phân cụm bán giám sát mờ bước Thuật toán phân cụm bán giám sát mờ (eSFCM) sử dụng để cải thiện kết trình phân cụm giai đoạn xử lý phân đoạn ảnh 2.1.2 Phƣơng pháp tách ngƣỡng Otsu Phương pháp tách ngưỡng Otsu giới thiệu [43] (Otsu, 1975) sử dụng [46] Rad, Rahim & Norouzi (2014) Bắt đầu Ảnh đầu vào TS tham số Kiểm tra xem ảnh đầu vào có vùng hay không? Sai Đúng Dùng phương pháp tách ngưỡng Otsu để loại bỏ vùng ảnh Dùng thuật toán FCM để loại bỏ vùng cấu trúc từ kết bước trước Dùng thuật toán eSFCM để làm rõ cải tiến kết với ma trận độ thuộc xác định trước từ FCM Đánh giá hiệu thuật toán tiêu chuẩn khác Các kết phân đoạn ảnh Kết thúc Hình 2.1 Lược đồ tổng quan phương pháp lai ghép 2.1.3 Thuật toán phân cụm bán giám mờ lai ghép Bảng 2.1 Thuật toán phân cụm bán giám sát mờ lai ghép Input Ảnh đầu vào, số cụm C, ma trận độ thuộc bổ trợ U ; ngưỡng dừng ; số lần lặp lớn maxStep> Ảnh phân đoạn Output Lai ghép: 1: Sử dụng phương pháp xử lý ảnh lấy ngưỡng Otsu 2: Phân cụm mờ (FCM) xác định ma trận độ thuộc UFCM 3: Xây dựng thông tin bổ trợ U từ ma trận độ thuộc UFCM bỏ giá trị hàm thuộc nhỏ điểm 4: Phân cụm bán giám sát mờ (eSFCM) với anh đầu vào thông bổ trợ U 5: Ảnh phân đoạn 2.1.4 Phân tích đánh giá thuật toán phân cụm bán giám sát mờ lai ghép Thuật toán đề xuất mục kết hợp phương pháp tách ngưỡng Otsu, thuật toán phân cụm mờ FCM phân cụm bán giám sát mờ (eSFCM) Thuật toán Otsu dùng để tách phần với phần ảnh nha khoa Những thông tin bổ trợ dùng eSFCM xác định kết ma trận độ thuộc phân cụm FCM Thuật toán eSFCM sử dụng để phân cụm phân đoạn ảnh cuối Tuy nhiên thuật toán có số nhược điểm: chưa sử dụng đặc trưng ảnh nha khoa phân cụm chưa sử dụng thành phần không gian hàm mục tiêu để tăng độ xác 2.2 Thuật toán phân cụm bán giám sát mờ có đặc trƣng không gian 2.2.1 Lƣợc đồ tổng quát Hình 2.2 xác định chế mô hình đề xuất Đầu vào ảnh X-quang nha khoa với vài tham số người dùng xác định Thuật toán xác định thông tin bổ trợ ảnh đồng thời tiến hành phương pháp phân cụm FCM sử dụng để phân đoạn ảnh X-quang nha khoa đầu vào thành số cụm Ma trận độ thuộc nhận từ FCM với thông tin đặc trưng không gian sử dụng cho việc tính toán thông tin bổ trợ cho thuật toán phân cụm bán giám sát mờ Sử dụng thông tin này, việc xây dựng giải toán phân đoạn ảnh nha khoa thuật toán phân cụm bán giám sát mờ (SSFC-SC) thiết lập Sau thuật toán SSFC-SC lặp lại để sử dụng xác định tâm cụm ma trận độ thuộc, xác định ảnh phân đoạn Cuối cùng, số hiệu áp dụng để đánh giá chất lượng kết đạt Ảnh đầu vào tham số Trích chọn đặc trưng nha khoa Cơ sở liệu đặc trưng Áp dụng FCM để xác định ma trận độ thuộc xác định trước Xác định thông tin bổ trợ Tri thức chuyên gia Xây dựng mô hình phân cụm bán giám sát mờ thuật toán SSFC-SC Ảnh phân đoạn Đánh giá kết tiêu chuẩn khác Hình 2.2 Lược đồ hoạt động thuật toán 2.2.2 Xây dựng đặc trƣng ảnh nha khoa Luận án giới thiệu đặc trưng ảnh nha khoa bao gồm: 2.2.2.1 Entropy, giá trị Edge cường độ(EEI) Những đặc trưng sử dụng để mô tả cấu trúc ảnh X-quang phân thành ba vùng tách biệt: vùng nền, vùng cấu trúc vùng [27] 2.2.2.2 Local Patterns Binary (LBP) Đặc trưng trường hợp đặc biệt Texture Spectrum [8] Model, sử dụng để xác định khác biệt phân vùng ảnh X-quang Đó bất biến chuyển đổi cường độ ánh sáng bảo đảm trật tự mật độ điểm ảnh khu vực định 2.2.2.3 Red-Green-Blue (RGB) RGB đo màu ảnh X-quang, chia thành ba ma trận theo giá trị Red-GreenBlue Đối với hình ảnh 256 màu sắc, ma trận giống hai đo hình ảnh màu xám [70] 2.2.2.4 Đặc trưng Gradient (GRA) Đặc trưng sử dụng để phân biệt khác nhỏ phận men, cementum, xi măng, ống tủy, v v [18] 2.2.2.5 Đặc trưng mức Patch (Patch) Đặc trưng sử dụng để tính toàn vector gradient với điểm ảnh mức patch, biểu thị δ(z) [20] 2.2.3 Xác định thông tin bổ trợ Cách xác định thông tin bổ trợ cho thuật toán SSFC-SC: - Bước 1: Từ ma trận độ thuộc tối ưu FCM, xác định giá trị độ thuộc tối thiểu cho điểm liệu thiết lập u1 Với thành phần hàm mục tiêu viết tường minh công thức (2.13), (2.14), (2.15) Áp dụng định lý Weierstrass, tồn nghiệm tối ưu toán thể bổ đề đây: Bổ đề 2.1 Bài toán tối ưu đa mục tiêu (2.4)-(2.5) có hàm mục tiêu liên tục tập compact khác rỗng Do toán có phương án tối tu toàn cục liên tục bị chặn Trên sở bổ đề 2.1 phương pháp thỏa dụng mờ tương tác, việc tìm nghiệm tối ưu toán thực sau: Xác định nghiệm tối ƣu toán: Bước khởi tạo: Giải toán phương pháp nhân tử Lagrange, nghiệm tương ứng nhận u1 , u , u : Ký hiệu: (2.16) z i minzhi , h 1,2,3, z i maxzhi , h 1,2,3, i = 1, 2, (2.17) S u1 , u , u , t =1, a t z p i i Bước lặp: t = Bước 1: Hàm thỏa dụng mờ cho toán xây dựng theo công thức sau: J z J z J z 1 ( J1 ) 1 ; 2 ( J ) 2 ; 3 ( J ) 3 (2.18) z2 z2 z3 z3 z1 z1 Trên sở hàm này, ta có hàm thỏa dụng tổ hợp sau: Y b11 ( J1 ) b2 2 ( J ) b33 ( J ) , (2.19) Trong đó: b1 b2 b3 b1, b2 , b3 (2.20) Bổ sung ràng buộc đây: J i ( x) ai( r ) , i 1, 2, (2.21) bz b1 b2 b3 b z bz J1 J2 J3 1 2 3 z1 z z1 z1 z2 z2 z3 z3 z z z3 z3 Lấy đạo hàm Y (2.22) theo ukj b3 J b1 J b2 J Y k , k 1, N , j 1, C u kj z z u kj z z u kj z z u kj Y (2.22) (2.23) ( Với ( b1, b2 , b3 ) thỏa mãn (2.20), nghiệm tối ưu toán u t u kjt ) C N Bước 2: - Nếu min mini ( J i ), i 1, ,3 , với ngưỡng người dùng chọn u (t ) không phương án chấp nhận Ngược lại, ta kiểm tra xem u (t ) S p bổ sung u (t ) vào Sp - Nếu cần mở rộng tập S p ta tăng t (t=t+1) kiểm tra điều kiện sau: Nếu t > L1 sau L2 lần lặp liên tiếp (L1, L2 giá trị tùy ý) mà tập S p không kết nạp thêm nghiệm đặt ait z i , i 1, 2, lấy số h từ tập {1, 2, 3} để gán aht z h , z h lặp lại bước - Nếu không cần mở rộng tập S p chuyển sang bước Bước 3: - Kết thúc thuật toán Công thức nghiệm toán bổ đề sau: Bổ đề 2.2 Với tham số b1, b2 , b3 cho, nghiệm u (r ) toán cực tiểu hóa hàm mục tiêu Y (2.65) xác định thỏa mãn đẳng thức: 11 b3 J b1 J b2 J Y k 0, j 1, C , k 1, N , u kj z z u kj z z u kj z z u kj ( ukjt ) (2.24) b3t t d kj ukj k z3 z , j 1, C , k 1, N t t b1 b3 b2t z z z z d kj z z kj 1 (2.25) 2 b1t b t ( ( u kjt ) u kjt ) u kj X k z z z3 z k 1 N t1 t 2 b1 b3 ( ( z z u kjt ) z z u kjt ) u kj k 1 1 3 (2.26) V (t ) j N b3t d kj u jk C z3 z 1 b t b t b t j 1 d kj kj z2 z Với t z1 z z3 z , k 1, N k C b t b t b r j 1 d kj kj z z z2 z 1 z3 z (2.27) 2.3.2 Các tính chất hệ từ phân tích nghiệm thuật toán Các tính chất, bổ đề, mệnh đề, định lý sau chứng minh Từ công thức tâm cụm V jt (2.26), dễ dàng suy tính chất mệnh đề sau: Tính chất 2.1 Trong trường hợp b2 1, b1 b3 , tâm cụm không xác định Tính chất 2.2 Nghiệm u (r ) tìm liên tục bị chặn b1, b2 , b3 Mệnh đề 2.1 Với giá trị tham số b1, b2 , b3 , từ công thức nghiệm (2.25) ta có: b t t b3t b t b3t b2t d kj u kj d kj kj k d kj u kj , j 1, C , k 1, N z3 z z2 z 2 z3 z z1 z z z (2.28) Khi so sánh nghiệm tìm theo phương pháp thỏa dụng mờ với nghiệm tìm theo phương pháp nhân tử Lagrange, xét toán tối ưu (2.4) - (2.5) ta nhận thấy nghiệm nhận từ phương pháp Lagrange nghiệm tối ưu cục Mệnh đề 2.2 Nghiệm tối ưu toán cho xác định theo công thức sau: u N Vj k 1 N m kj u k 1 u kj u kj x k m kj u kj u kj , u kj u kj X k V j C K l 2 j 1 X k V j R kj wik l i 1 k 2u kj X k V j 2*2 X k Vj 1 2 Rkj C j 1 2 X k V j 2 l wik l i 1 l R kj wik l i 1 (2.29) (2.30) Để đánh giá nghiệm theo phương pháp thỏa dụng mờ (FS) phương pháp Lagrange (LA), ta dụng số IFV [64] với giá trị IFV cao nghiệm tốt Cụ thể, công thức tính số IFV sau: (2.31) C N 2 N SDmax , IFV ukj log2 C log2 ukj C j 1 N k 1 N k 1 D 12 (2.32) C 1 N d kj k j C j 1 N k 1 Ký hiệu IFV(LA) giá trị số IFV nghiệm tối ưu dùng phương pháp Lagrange tương ứng cho nghiệm theo phương pháp thỏa dụng mờ IFV(FS) 2 k k d kj u kj d kj u kj N SD C 1 N log C IFV LA (2.33) log 2d max , C j 1 N k 1 2d kj kj N k 1 kj kj D SDmax max Vk V j , D IFVFS 2 w3d kjukj k w3d kjukj k SDmax C 1 N N 2 log2 C log2 w1 w3 d kj w2 kj D C j 1 N k 1 w1 w3 d kj w2 kj N k 1 (2.34) Bổ đề 2.3 Trong phương pháp Lagrange, tham số k xác định theo công thức (2.30) Do đó, để so sánh nghiệm Lagrange với nghiệm thỏa dụng mờ, tham số b1, b2 , b3 chọn thỏa mãn: d kju kj k 2d kj kj d kju kj k N log C log N k 1 2d kj kj (2.35) b3 b3 d kju kj k d kju kj k z3 z z3 z N log C log , N k 1 b1 b1 b3 b3 b2 b2 z z z z d kj z z kj z z z z d kj z z kj 2 2 1 3 1 3 l kj Rkj wik , j 1, C , k 1, N (2.36) l i 1 Định lý 2.1 Với giá trị tham số b1 , b2 , b3 cho trước thỏa mãn điều kiện bổ đề 2.3 ta có: LA FS (2.37) IFV - IFV Tính chất 2.3 Các nghiệm tối ưu nhận theo phương pháp thỏa dụng mờ tốt nghiệm tối ưu nhận dược theo phương pháp Lagrange Giá trị mà số IFV nhận nghiệm nhận theo phương pháp thỏa dụng mờ bước lặp thứ t cận cận đây: Định lý 2.2 Cận giá trị số IFV nghiệm tối ưu u u (t ) theo phương pháp thỏa dụng mờ đánh giá công thức: IFV FS SDmax log C C D Để đánh giá cận trên, ta định nghĩa giới hạn L sau: b3 d kju kj k N z3 z L lim log u kj 0 b1 b3 b2 k 1 z z z z d kj z z kj Bổ đề 2.4 Với giá trị tham số b1 , b2 , b3 , ta có: 13 (2.38) (2.39) b3 b3 d kju kj k d kju kj k N N z3 z z3 z lim log L (2.40) log2 b ukj 0 b1 b3 b3 b2 b2 k 1 k 1 z z z z d kj z z kj z z z z d kj z z kj 2 2 1 3 1 3 Định lý 2.3 Cận số IFV nghiệm tối ưu nhận theo phương pháp thỏa dụng mờ đánh giá theo công thức: IFV FS SDmax L log2 C C N D (2.41) Hệ 2.1: Từ bất đẳng thức Cauchy–Schwarz dùng phép biến đổi trên, dấu xảy khi: b3 d kj u kj k z3 z b1 b3 b2 d kj kj z z z3 z z2 z constant L log C N Với ràng buộc (2.40), ta viết lại sau: b3 d kju kj k z3 z (2.42) L b1 b3 b2 log C z z z z d kj z z kj N Kết hệ 2.1 cụ thể số trường hợp đặc biệt sau: - Giả sử b2 số khác 1, ta biểu diễn b1 b3 dạng: b1 b2 b3 ,0 b1, b2 , b3 1, b2 1, b2 = constant Với ký hiệu: (2.43) kj d kj L ukj L H kj log C d kj , Ekj , P log C N z3 z z1 z1 z3 z N z1 z1 z2 z C B b Akj b3 1 Ekj b2 Fkj , C B b E b F j 1 kj kj kj k Akj d kj u kj z3 z , j 1 kj 1 Bkj z z z z d kj , (2.44) Fkj d kj z1 z (2.45) M kj H kj PAkj , Trong trường hợp này, ta biểu diễn b3 qua b2 sau: b3 G kj PE kj b2 Fkj Fkj P (2.46) PE kj b2 M kj Fkj P Giá trị tham số: b3 [0, 0.2] b1 [0.1, 0.4], b2 [0.3, 0.7] Thứ 4, khác nghiệm nhận từ lần lặp liên tiếp trình thực thuật toán đánh giá sử dụng ký hiệu: 1 b3r b1r 1 b1r b3r 1 , b3r b2r 1 b2r b3r 1 , r r 1 (2.47) k k Định lý sau thể chênh lệch nghiệm lần lặp liên tiếp 14 Định lý 2.4 [CT5] Khi tham số lần lặp thứ r thứ r + xác định tương ứng b1r , b2r , b3r b1r1 , b2r1 , b3r1 Bổ đề 2.4, khác biệt nghiệm tối ưu tìm lần lặp liên tiếp đánh giá công thức: dkj ukj1 dkjukj kj r 1 r ukj ukj (2.48) z1 z1 z3 z 2 z2 z z3 z Hệ 2.2: Điều kiện dừng thuật toán dùng phương pháp thỏa dụng mờ u kjr 1 u kjr (2.49) 2.3.3 Phân tích đánh giá thuật toán SSFC-FS - Hiệu phương pháp xác nhận lý thuyết trình bày mục 2.3.3 cụ thể chất lượng phân cụm thuật toán sử dụng phương pháp thỏa dụng mờ tốt so với sử dụng Lagrange - Thuật toán trang bị với phân tích lý thuyết chặt chẽ Nhiều định lý mệnh đề trình bày - Chất lượng phân cụm phương pháp (SSFC-FS) tốt so với thuật toán sử dụng Lagrange (SSFC-SC) i) Các giới hạn số IFV nghiệm tối ưu thể phương trình (2.38, 2.41) ii) Điều kiện dừng tổng quát phương pháp SSFC-FS đưa Tuy nhiên số nhược điểm phương pháp là: thời gian thực thuật toán dài việc sử dụng cách xác định thông tin bổ trợ nhiều không phù hợp với ảnh khác 2.4 Xác định thông tin bổ trợ phù hợp cho thuật toán SSFC-FS 2.4.1 Lƣợc đồ tổng quát Hình 2.3 minh họa chế phương pháp SSFC-FSAI Dữ liệu đầu vào phương pháp ảnh X-quang nha khoa Ảnh phân cụm theo thuật toán FCM sau trích chọn thông tin đặc trưng Từ kết đạt được, ma trận độ thuộc xác định trước phù hợp thông số tính tự động cho ảnh nha khoa định Hàm lựa chọn thông tin bổ trợ sau sử dụng để tính toán kết đầu cuối mô hình phân cụm bán giám sát mờ (sẽ trình bày mục 2.4.2 đây) Các hình ảnh phân đoạn đánh giá theo tiêu chí khác 2.4.2 Xây dựng tập hàm thông tin bổ trợ Trong phần này, số hàm thông tin bổ trợ [1] giới thiệu bao gồm: + Hàm Gaussian + Hàm Bell + Hàm Sigmoid + Hàm sin Hyperbolic + Hàm Gudermannian + Hàm Fresnel + Hàm sóng tam giác Và vài hàm đề xuất + Hàm hỗn hợp: Hàm SSFC-FS u1 u u , , 0,1 , j 1, C , k 1, N u kj (2.50) u1 u u , l u2 w i 1 i l max wi i 1 Trong u1 xác định độ thuộc xác định sử dụng phân cụm mờ (FCM) + Hàm không gian: 15 (2.51) u kj max i 1,C u ki u , 0,1 , j 1, C , k 1, N u kj u kj max i 1,C u ki 0 Với u2 định nghĩa từ giá trị đặc trưng điểm ảnh + Hàm phân cụm mờ: u kj max i 1,C u ki u kj , 0,1 , j 1, C , k 1, N u kj u kj max i 1,C u ki 0 ukj nhận cách sử dụng phương pháp FCM Phân đoạn ảnh phương pháp FCM Xây dựng thông tin bổ trợ (2.53) Ảnh đầu vào tham số Xây dựng liệu CSDLvề thông tin bổ trợ (2.52) Trích chọn đặc trưng Xác định thông tin bổ trợ Chọn thông tin bổ trợ thích hợp Phân cụm bán giám sát mờ sử dụng thông tin đặc trưng không gian (SSFC-SC) Ảnh phân đoạn Tri thức chuyên gia Đánh giá kết dựa vào số Hình 2.3 Sơ đồ khối phương pháp SSFC-FSAI 2.4.3 Xác định hàm thông tin bổ trợ phù hợp cho liệu ảnh nha khoa Bước 1: Dùng phương pháp FCM để phân đoạn ảnh đầu vào nhận U, V Bước 2: Tính toán hàm số đánh giá IFV Bước 3: Tính toán giá trị ma trận độ thuộc ứng với giá trị IFV lớn Bước 4: Chọn ma trận độ thuộc giá trị tham số hàm bổ trợ 2.4.4 Phân tích đánh giá thuật toán SSFC-FSAI Thuật toán đề xuất có ưu điểm sau: Thứ nhất, SSFC-FSAI tốt so với SSFC-FS chất lượng cụm Trong đó, ảnh nha khoa xử lý với hàm bổ trợ khác cho phù hợp với ảnh đầu vào tăng độ xác tổng thể Thứ hai, SSFC-FSAI tự động xác định giá trị tham số cho chất lượng cao thuật toán phân cụm Thứ ba, thành phần mới kết hợp với giai đoạn cũ cách thống nhất, hỗ trợ cách hiệu chẩn đoán y tế 2.5 Kết luận Chương trình bày thuật toán phân cụm bán giám sát mờ phân đoạn ảnh nha khoa Cụ thể thuật toán: phân cụm mờ bán giám sát lai ghép; phân cụm mờ bán giám sát mờ có sử dụng thông tin đặc trưng không gian ảnh nha khoa (SSFC-SC); sử dụng phương pháp giải tối ưu thỏa dụng mờ cho phân cụm bán giám sát mờ có sử dụng thông tin đặc trưng không gian ảnh nha khoa (SSFC-FS); cuối cách xác định thông tin bổ trợ thích hợp cho phương pháp SSFC-FS (SSFC-FSAI) 16 CHƢƠNG ĐÁNH GIÁ THỰC NGHIỆM Chương luận án trình bày kết thực nghiệm thu cài đặt thuật toán phân cụm bán giám sát mờ đề xuất chương liệu ảnh X-quang nha khoa Trong có phân tích liệu sử dụng tiêu chí đánh giá thông qua độ đo, từ xác định kết sử dụng để đánh giá hiệu thuật toán đề xuất so sánh với thuật toán khác nghiên cứu gần cho toán tương tự 3.1 Mô tả liệu ảnh X-quang nha khoa 3.1.1 Đặc tả liệu Bộ liệu bao gồm 66 ảnh X-quang nha khoa chụp từ máy chụp X-quang VATECH Bệnh viện Đại học Y Hà Nội, Việt Nam khoảng 2014 – 2015 bệnh nhân thuộc độ tuổi từ 16 đến 38 chia thành nhóm bệnh Thống kê thông tin bệnh nhân Bảng 3.1 đây: Bảng 3.1 Thông tin nhóm bệnh nhân Giới tính Tuổi Số bệnh Nhóm bệnh nhân nhân Nam Nữ 16-22 23-30 31-38 Nhóm gãy chân 12 6 Nhóm mọc ngầm 15 6 Nhóm sâu 12 5 Nhóm thiếu 12 6 Nhóm tiêu xương 15 7 Tổng 66 33 33 15 22 29 3.1.2 Xác định đặc trƣng ảnh nha khoa Bằng việc trích chọn đặc trưng bản, ta có liệu đặc trưng 66 ảnh Bảng 3.2 trình bày thống kê đặc trưng tất ảnh thuộc sở liệu ảnh nha khoa Bảng 3.2 Thống kê ảnh toàn liệu ảnh X-quang Giá trị lớn Giá trị nhỏ Đặc trƣng Kỳ vọng Độ lệch Trung vị nhất 44.02 3.25 51.12 31.58 43.97 EEI-M 153.31 2.29 157.07 147.25 153.84 LBP-M 117.48 9.19 139.03 82.94 117.83 RGB-M 0.42 0.0192 0.45 0.33 0.42 Gradient-M 0.026 0.004 0.033 0.19 0.26 Patch-M 3.2 Độ đo tiêu chí đánh giá kết Mục đích: Các độ đo sử dụng để đánh giá độ xác thuật toán phân đoạn ảnh Từ tìm giá trị thích hợp cho tham số cho phân đoạn ảnh nha khoa Tác giả luận án sử dụng độ đo phân cụm [69] sau: PBM, IFV, DB, SSWC, TRA, BH, BR, VRC 3.3 Các kết so sánh phân đoạn ảnh Dựa liệu ảnh X-quang nha khoa, thuật toán đề xuất chương (thuật toán eSSFCM-OTSU [CT3], SSFC-SC, SSFC-FS [CT5], SSFC-FSAI [CT2]) với thuật toán có từ trước (FCM [10], OTSU[48], eSFCM[75]) cài đặt thực nghiệm với thuật toán xử lý ảnh thuật toán phân cụm mờ có liên quan 3.3.1 Kết tập sở liệu ảnh nha khoa Dựa kết tính toán giá trị độ đo ảnh, kỳ vọng phương sai giá trị tương ứng với độ đo thuật toán tính toán Bên cạnh đó, để so sánh cách định lượng giá trị độ đo thuật toán tính toán, giá trị trung bình tốt dòng (ứng với độ đo) ghi từ tính toán số lần mà thuật toán tốt tốt thuật toán lại dòng tương ứng với độ đo Kết thống kê trình bày Bảng 3.3 17 Số lần tốt PBM DB IFV SSWC Bảng 3.3 So sánh hiệu thuật toán liệu thực (Giá trị in đậm độ đo tốt nhất) SSFCFCM OTSU eSFCM eSFCM-Otsu SSFC-FS SC SSFCFSAI 1.58 1.01 62.01 2.01 1.31 1.58 1.32 1.33 1.00 1.26 21.89 1.28 1.08 1.00 1.04 1.16 1.38 1.29 Inf 1.93 1.80 2.78 1.67 2.79 1.80 1.08 4.34 1.96 1.33 1.53 1.32 1.27 6.14 1.00 1.00 2.20 1.51 2.01 1.47 1.45 1.06 1.23 41.29 1.18 1.08 1.39 1.00 1.15 1.11 1.27 36.76 1.00 1.00 1.10 1.09 1.00 VRC BH BR TRA Kết phân cụm liệu ảnh X-quang nha khoa minh họa hình 3.1 (a) Ảnh gốc (b) Tách ngưỡng OTSU (c) Phân đoạn FCM (d) Phân đoạn eSFCM (h) Phân đoạn SSFC(f) Phân đoạn SSFC- (g) Phân đoạn SSFCFS FSAI SC Hình 3.1 Ảnh phân đoạn 3.3.2 Kết với tham số thay đổi Xác định tham số thích hợp nhất: Mục trình bày phương pháp xác đinh giá trị tham số (số cụm giá trị ) thích hợp với ảnh đầu vào theo nghĩa thuật toán SSFC-SC đạt hiệu cao Trong phần trước, số cụm cố định C = giá trị = 0.9 Để biết rõ thay đổi thuật toán SSFC-SC theo tham số này, kết thực nghiệm liệu ảnh nha khoa với giá trị thay đổi Các kết số giá trị lớn, nghĩa thông tin bổ trợ sử dụng nhiều, hiệu thuật toán SSFC-SC cao Để xác nhận điều này, thuật toán SSFC-SC cài đặt thực nghiệm liệu với trường hợp trước thay số cụm C =5 với thay đổi Kết thực nghiệm cho kết luận trường hợp C = Tương tự vậy, cố định = 0.9, số thực nghiệm với phương pháp giá trị C, m thay đổi (C = 3, 5, m = 2, 4, 6) ghi lại thấy rằng, thuật toán SSFC-SC, giá trị nhỏ tham số (m, C) cho hiệu cao thuật toán có kết tốt thuật toán khác trường hợp giá trị tham số chưa tốt Từ chứng minh mục 2.2.4, biết rằng, toán tối ưu (2.4-2.5) lồi có nghiệm tối ưu m = Độ xác phương pháp phân cụm với số cụm thay đổi, số cụm chọn phù hợp C = Do gợi ý việc chọn tham số phù hợp với thực nghiệm trình bày Để có nhìn trực (e) Phân đoạn eSFCMOTSU 18 quan hiệu thuật toán, hình 3.2 biểu diễn giá trị độ đo biểu đồ so sánh thuật toán số cụm thay đổi Hình 3.2 Độ xác phương pháp với số cụm thay đổi, 0.9 m=2 Thực nghiệm ra, giới hạn IFV số nghiệm tối ưu nêu mục 2.3 hoàn toàn xác thông qua sáu trường hợp: Case 1: IFV= 88.78 > 12 SDmax log2 C 2 = 4.89 C D Case 2: IFV = 96.65> 12 SDmax log2 C 2 = 5.43 C D Case 3: IFV = 110.62 > 12 SDmax log2 C 2 = 6.15 C D Case 4: IFV = 102.63 > 12 SDmax log2 C 2 = 5.72 C Case 5: IFV = 123.53 > 12 C D SDmax D log2 C = 6.88 Case 6: IFV = 134.76> 12 SDmax log2 C 2 = 7.56 C D Trong bảng 3.4, kết so sánh giá trị trung bình IFV tính toán sở lý thuyết thực nghiệm Bảng 3.4 Giá trị trung bình IFV lý thuyết IFV thực nghiệm C=3 Case Case Case Case Case Case IFV(LT) 87.89 96.72 109.71 103.69 123.04 133.83 88.78 96.65 110.62 102.63 123.53 134.76 IFV(TN) C=5 Case Case Case Case Case Case IFV(LT) 88.60 98.35 123.02 102.89 111.92 119.89 89.73 99.38 123.63 103.76 113.78 120.83 IFV(TN) C=7 Case Case Case Case Case Case IFV(LT) 55.36 58.82 89.02 76.78 66.67 84.03 56.67 59.89 89.76 78.32 67.89 84.78 IFV(TN) 3.4 Ứng dụng phân đoạn ảnh hỗ trợ chẩn đoán bệnh nha khoa 3.4.1 Mô hình hóa toán Mô hình hệ thống chẩn đoán nha khoa (DDS: Dental Diagnosis System) thể hình 3.3 Một ảnh đầu vào từ tập liệu kiểm tra đưa vào hệ thống DDS sau 19 phân tích phương pháp trích chọn đặc trưng nha khoa để có biểu diễn đặc trưng Sau đó, sử dụng thuật toán SSFC-FS phân loại ảnh đầu vào dựa đặc trưng không gian ảnh nha khoa để phân thành phân vùng, từ đưa vùng có bệnh Trong phân vùng này, giữ lại phân vùng có khả mắc bệnh để tiến hành chẩn đoán Phân cụm dựa đồ thị cải tiến (phương pháp APC+) sử dụng để xem phân vùng xét gần với mẫu bệnh Quá trình thực lặp lặp lại cho phân vùng nghi khác Một thủ tục định xác định bệnh thức từ bảng đề xuất vài bước cuối hệ thống DDS Đầu hệ thống dự đoán bệnh có khả xảy ảnh nha khoa ban đầu 3.4.2 Chọn phân vùng có khả mắc bệnh Các bước thực hiện: + Bước 1: Xác định điểm ảnh phân vùng sau phân đoạn ảnh + Bước 2: Tính trọng số độ tương đồng điểm ảnh vùng theo công thức sau: (3.1) w average max , k 1, C * u k ik j 1,C ij Trong u(k)ij giống điểm i với điểm ảnh j vùng ảnh k + Bước 3: Chuẩn hóa trọng số tương đồng: Wk wk , k 1, C * max wk (3.2) k 1,C1 + Bước 4: Sắp xếp trọng số tương đồng chuẩn hóa + Bước 5: Chọn phân có trọng số tương đồng thấp λ 3.4.3 Chẩn đoán phân vùng Việc chẩn đoán phân vùng thể qua giai đoạn sau: 3.4.3.1 Biểu diễn đồ thị Khi chọn C1 vùng có khả mắc bệnh để thực chẩn đoán, vùng chẩn đoán kết hợp với sở liệu ảnh nha khoa mẫu để tạo thành biểu đồ Khi đồ thị sử dụng với mục đích biểu diễn mối quan hệ mô hình bệnh tật vùng chẩn đoán cách trực quan Mỗi nút đồ thị biểu diễn vùng chẩn đoán ảnh mẫu sở liệu mẫu bệnh Các cạnh thể mối quan hệ vùng chẩn đoán với ảnh mẫu sở liệu mẫu bệnh mẫu bệnh với dựa đặc trưng ảnh nha khoa 3.4.3.2 Lượng tử hóa đồ thị Mục đích mục giảm bớt số nút đồ thị để đẩy nhanh thời gian xử lý Lượng tử hóa đồ thị phương pháp hiệu thường dùng để đưa nút đại diện cho nhóm nút gần giống đảm không mát thông tin [25] Các bước thực lượng tử hóa đồ thị sau: + Bước 1: Chọn k vectơ ngẫu nhiên từ liệu ban đầu + Bước 2: Tính toán khoảng cách Euclide bình phương tất k vector chọn với phân vùng chẩn đoán tương ứng + Bước 3: Khởi tạo vectơ X vào phân đoạn thứ i với giới hạn phương khoảng cách j Euclide từ X để vector thứ i ngắn j + Bước 4: Tính toán trung tâm phân vùng + Bước 5: Xác định trung bình phân vùng lỗi (MSE) k phân vùng thu + Bước 6: Tính toán MSE 20 Bắt đầu ảnh X- quang nha khoa, tham số Trích chọn đặc trưng nha khoa Phân đoạn ảnh sử dụng phương pháp SSFCFS tạo C* phân vùng Tạo C1 (C1 C1 Đúng Tổng hợp bệnh ảnh xác định từ phân vùng Bảng tổng hợp bệnh phân vùng Chẩn đoán bệnh Kết thúc Hình 3.3 Hệ thống chẩn đoán bệnh nha khoa (DDS) 3.4.3.3 Phân cụm dựa đồ thị Phân cụm dựa đồ thị với APC+ Trong phần này, cải tiến thuật toán phân cụm dựa đồ thị APC (gọi APC+) trình bày Thuật toán APC+ tích hợp hàm lực điểm liệu mẫu nhằm tìm bệnh tương đồng phân đoạn ảnh xét Thuật toán cải tiến APC+ tích hợp hàm lực điểm liệu mẫu Cụ thể, hàm lực xác định bởi: d d ik xd ik Fik d d ik xd ik d d ik if if , (3.3) d d ik Trong d ik khoảng cách Euclid điểm i mẫu k; d giá trị trung bình khoảng cách từ điểm i tới tất mẫu Khi r(i, k) tính bởi: r (i, k ) : s(i, k ) max a(i, k ' ) s(i, k ' ) s(i, k ) * a(i, k ) * Fik (3.4) k ' k Thuật ngữ “self-availability” định nghĩa trường hợp đặc biệt: a(k , k ) : max 0, r (i' , k ) (3.5) i ' ,k Một số gọi hệ số giảm xóc sử dụng để giảm dao động truyền thông điệp: rt 1 (i, k ) : .rt (i, k ) (1 ).rt 1 (i, k ) (3.6) 21 at 1 (i, k ) : .at (i, k ) (1 ).at 1 (i, k ) (3.7) Thuật toán APC+ mô tả chi tiết Bảng 3.6 Bảng 3.6 Các bước thuật toán APC+ Input Một tập hợp độ tương tự theo cặp s (i, k )i ,k 1, 2, , N ˆ ˆ ˆ Một gán nhãn: c (c1 , , c N ) Thuật toán Khởi tạo, i, k : a(i, k)=0, t=0 Repeat Cập nhật “responsibility” theo công thức (3.6) với r(i, k) (3.4) Cập nhật “ availability” công thức (3.7) t=t+1 (t ) ( t 1) Until ai, k ai, k Output xác định 3.4.4 Xây dựng bảng tổng hợp vùng Khoảng cách trung bình từ vùng chấn đoán đến mẫu bệnh nhãn nhóm với phân vùng, xác định theo công thức (3.8) sau: d ij averagek' group j d ik ' , i 1, C1 , j 1, m (3.8) Sau đó, vectơ độ thuộc vùng chẩn đoán thứ i vào mẫu bệnh chuẩn xác định công thức (3.9): u ij d ij / max j d ij , i 1, C1 , j 1, m (3.9) Bảng tổng hợp bệnh phân vùng biểu diễn bảng 4.3 Bảng 3.7 Bảng tổng hợp bệnh vùng Mẫu bệnh Mẫu bệnh … u11 u12 Phân vùng Phân vùng … un1 u2n Phân vùng n Bảng 3.8 Các kết tổng hợp bệnh ảnh Mẫu bệnh Mẫu bệnh … y1 y2 Ảnh Mẫu bệnh m u1m unm Mẫu bệnh m ym n yj W * u i i 1 m n ij Wi * uij , j 1, m ; ymax max y1 , y2 , , ym (4.10) j 1 i 1 Cuối cùng, ta xác định bệnh nha khoa ảnh toán tử tìm cực đại 3.4.5 Phân tích đánh giá mô hình DDS Mô hình chẩn đoán đề xuất có vài ưu điểm: - DDS tạo cách tiếp cận kết hợp phương pháp phân đoạn ảnh định cho việc chẩn đoán bệnh nha khoa - DDS cải phương pháp phân cụm dựa đồ thị gọi APC+ cho giai đoạn phân lớp - DDS có hiệu cao với phương pháp đề xuất [64] dựa vào việc bao trùm tối thiểu theo thuật toán Prim (GCP) hay Kruskal (GCK) thuật toán phân cụm lan truyền tương đồng (APC) cách điều chỉnh hàm lực điểm đầu vào mẫu APC+; sử dụng thao tác phân đoạn phương pháp định - DDS đưa quan điểm tốt việc làm để kết hợp thuật toán phân cụm (trong phân đoạn) với hệ thống dựa tri thức (kết hợp thuật toán APC+ thủ tục định việc 22 phân lớp định) Điều có ý nghĩa lớn toán chẩn đoán nha khoa nói riêng lĩnh vực y tế - tin học liên ngành nói chung 3.4.6 Kết thực nghiệm Dựa liệu ảnh X-quang nha khoa, để đánh giá mô hình đề xuất với mô hình dựa thuật toán có từ trước (APC [CT4], FKNN [48]) Các độ đo tính toán trường hợp để có so sánh hiệu thuật toán Các kết trình bày phần đây: 3.4.6.1 Độ đo tiêu chí đánh giá kết Các độ đo phân lớp liệu sử dụng nhằm mục đích đánh giá hiệu thuật toán đề xuất Các độ đo MSE (Mean Squared Error), MAE (Mean Absolute Error) and Accuracy sử dụng thực nghiệm đề tài luận án 3.4.6.2 Kết chẩn đoán từ liệu ảnh Sau thực chẩn đoán bệnh phân vùng ảnh đầu vào liệu kiểm tra liệu huấn luyện với kết cụ thể đưa Đồng thời, hiệu thuật toán dựa độ đo thể qua bảng 3.9 đây: Bảng 3.9 Đánh giá hiệu tất phương pháp APC FIS FKNN DDS MSE 0.821 0.2493 0.2727 0.0714 MAE 0.701 0.1312 0.2273 0.0714 Accuracy (%) 89.10 91.30 79.55 92.86 Với số liệu bảng 3.9, rõ ràng phương pháp DDS đề xuất có hiệu tốt thuật toán khác APC, FIS, FKNN Trên đồ thị hình 3.4 với độ đo: với độ đo MSE (thể đường màu đỏ) độ đo MAE (thể đường màu xanh) điểm phương pháp DDS thấp nhất, thể phương pháp DDS tốt sau đến phương pháp FIS, FKNN, APC Còn độ đo Accuracy (thể đường màu vàng) thì điểm phương pháp DDS cao nhất, thể phương pháp DDS tốt sau đến phương pháp FIS, FKNN, APC Bằng kết thực nghiệm dựa độ đo MSE, MAE, Accuracy phương pháp DDS cho kết hộ trợ chẩn đoán bệnh nha khoa tốt với phương pháp APC, FIS, FKNN Kết chứng tỏ độ xác phương pháp đề xuất cao hơn, DDS đưa quan điểm tốt việc kết hợp ảnh phân đoạn đoạn với hệ thống dựa tri thức (kết hợp thuật toán APC+ thủ tục định việc phân lớp định) để đưa kết hỗ trợ chẩn đoán bệnh nha khoa Điều có ý nghĩa toán hỗ trợ chẩn đoán bệnh nha khoa nói riêng lĩnh vực y tế - tin học liên ngành nói chung Hình 3.4 Kết thực nghiệm đồ thị 3.5 Kết luận chƣơng Trong chương 3, luận án trình bày kết thực nghiệm thuật toán phân cụm bán giám mờ đề xuất với phương pháp phân cụm bán giám sát mờ có, phương pháp phân cụm Kết đánh giá thông qua độ đo, đồng thời thông qua kết 23 kiểm nghiệm lại lần tính đắn đề xuất xây dựng mô hình lý thuyết Trong mục 3.3, luận án đánh giá so sánh thuật toán phân cụm bán giám sát mờ đề xuất với thuật toán phân cụm mờ, đồng thời đánh cách xác định thông tin cho phù hợp với ảnh đầu vào Trong mục 3.4 luận án trình bày ứng dụng ảnh phân đoạn thiết kế hệ hỗ trợ chẩn đoán bệnh Đã đưa đề xuất mô hình hỗ trợ chẩn đoán bệnh từ ảnh phân đoạn Trong mục 3.4.6 luận án trình bày tiêu chí đánh giá đánh giá kết chẩn đoán bệnh nha khoa thông qua độ đo Accuracy, MSE, MAE KẾT LUẬN Trong luận án, đề cập đến nghiên cứu phương pháp phân cụm bán giám sát mờ phân đoạn ảnh X-quang nha khoa ứng dụng chẩn đoán bệnh nha khoa Trên sở nghiên cứu đó, luận án đạt số kết sau: Trong toán phân đoạn ảnh, luận án có kết đóng góp sau: i) Đề xuất phương pháp phân đoạn ảnh nha khoa dựa phân cụm bán giám sát mờ lai ghép eSFCM-OTSU (đã công bố [CT3]); ii) Đề xuất phân cụm bán giám sát mờ có sử dụng đặc trưng không gian ảnh nha khoa vào toán phân đoạn ảnh SSFC-SC; iii) Vận dụng phương pháp giải tối ưu đa mục tiêu thỏa dụng mờ để giải toán tối ưu đa mục tiêu phân cụm bán giám sát mờ SSFC-FS, từ đưa mệnh đề, định lý tính chất nghiệm toán [CT5]; iv) Cuối đưa phương pháp để xác định hàm thông tin bổ trợ phù hợp (SSFCFSAI) cho ảnh đầu vào phương pháp phân cụm bán giám sát mờ dựa đặc trưng không gian (SSFC-FS) (đã công bổ [CT2]); v) Cài đặt đánh thuật toán cải tiến với nghiên cứu trước đưa dự liệu thực tế, qua khẳng định đắn đề xuất trên; vi) Đề xuất ứng dụng phân đoạn ảnh nha khoa cho hỗ trợ chẩn đoán nha khoa Tuy nhiên kết thu luận án số hạn chế: kết phân đoạn thực nghiệm ảnh X-quang nha khoa thông thường, cần thử nghiệm với loại ảnh nha khoa 3D cho phù hợp với phát triển công nghệ Thời gian thực thuật toán lớn, cần cải tiến để phù hợp với thực tế Các kết chẩn đoán thu hỗ trợ bác sỹ chẩn đoán cận lâm sàng, cần kết hợp với kết chẩn đoán lâm sàng trình chẩn đoán Xây dựng thêm đặc trưng xuất phát từ bệnh để việc chẩn đoán xác Hướng phát triển thời gian tới: nghiên cứu cải tiến để thời gian xử lý phương pháp phù hợp Áp dụng phân cụm bán giám sát mờ phân đoạn ảnh với ảnh thông thường Tiếp tục nghiên cứu toán chẩn đoán bệnh nha khoa việc tiếp cận với thực tế gần nhất, áp dụng vào thực tế Kết hợp với triệu chứng lâm sàng trình chẩn đoán 24 DANH MỤC CÔNG TRÌNH ĐÃ CÔNG BỐ [CT1] Lê Bá Dũng Trần Mạnh Tuấn (2010), “Một số phương pháp phân cụm liệu”, tạp chí Khoa học công nghệ - Đại học Thái Nguyên, tập 69, số 07, trang 15-20 [CT2] Tran Manh Tuan, Le Hoang Son, Le Ba Dung (2015), “Dynamic semi-supervised fuzzy clustering for dental X-ray image segmentation: an analysis on the additional function”, Journal of Computer Science and Cybernetics, 31(4), 323-339 [CT3] Le Hoang Son, Tran Manh Tuan (2016), “A cooperative semi-supervised fuzzy clustering framework for dental X-ray image segmentation”, Expert Systems With Applications, 46, pp 380 – 393 (SCIE, IF = 2.240, Elsevier) [CT4] Tran Manh Tuan, Le Hoang Son (2016), “A novel framework using graph-based clustering for dental x-ray image search in medical diagnosis”, International Journal of Engineering and Technology, 8(6), pp.428-433 [CT5] Tran Manh Tuan, Tran Thi Ngan, Le Hoang Son (2016), “A Novel Semi-Supervised Fuzzy Clustering Method based on Interactive Fuzzy Satisficing for Dental X-Ray Image Segmentation”, Applied Intelligence, in press, DOI: 10.1007/s10489-016-0763-5 (SCI, IF=1.853, Springer) 25