1. Trang chủ
  2. » Luận Văn - Báo Cáo

0874 nghiên cứu một số phương pháp phân cụm bán giám sát mờ trong phân đoạn ảnh nha khoa luận văn tốt nghiệp

149 5 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Nghiên Cứu Một Số Phương Pháp Phân Cụm Bán Giám Sát Mờ Trong Phân Đoạn Ảnh Nha Khoa
Tác giả Trần Mạnh Tuấn
Người hướng dẫn PGS.TS. Lê Bá Dũng, TS. Vũ Như Lân
Trường học Viện Hàn Lâm Khoa Học Và Công Nghệ Việt Nam
Chuyên ngành Cơ sở toán học cho tin học
Thể loại luận án tiến sĩ
Năm xuất bản 2016
Thành phố Hà Nội
Định dạng
Số trang 149
Dung lượng 1,49 MB

Cấu trúc

  • CHƯƠNG 1.TỔNGQUANVỀPHÂN CỤMBÁN GIÁMSÁTMỜTRONGPHÂNĐOẠNẢNHNHAKHOA (18)
    • 1.1. Bàitoánphânđoạnảnhnhakhoa (18)
      • 1.1.1. Kháiniệm (18)
      • 1.1.2. ẢnhX-quangnhakhoa (19)
      • 1.1.3. Nhucầuvà ứng dụngtrong yhọc (21)
    • 1.2. Tổngquanvềcácnghiêncứuliênquan (21)
    • 1.3. Mộtsố kiếnthứccơsở (26)
      • 1.3.1 Tậpmờ (26)
      • 1.3.2. Phâncụm (29)
      • 1.3.3. Phươngphápgiảibàitoántối ưuđamụctiêu (39)
    • 1.4. Kếtluận (44)
  • CHƯƠNG 2. MỘT SỐ THUẬT TOÁN PHÂN CỤM BÁN GIÁM SÁT MỜCHOPHÂNĐOẠN ẢNHNHAKHOA (45)
    • 2.1. Thuậttoánphâncụmbángiámsátmờlai ghép (45)
      • 2.1.1. Lượcđồtổngquanlaighép (45)
      • 2.1.2. ThuậttoántáchngưỡngOtsu (47)
      • 2.1.3. Thuật toánphâncụm bángiámmờlaighép (50)
      • 2.1.4. Phântíchvà đánhgiá thuậttoánphâncụm bángiám sátmờlaighép 38 2.2. Thuậttoánphâncụmbángiámsátmờcóđặctrƣngkhônggian (51)
      • 2.2.1. Lượcđồtổngquát (52)
      • 2.2.2. Xâydựng đặctrưngảnhnha khoa (52)
      • 2.2.3. Xácđịnhthông tinbổ trợ (57)
      • 2.2.4. Thuật toánphâncụmbángiám sátmờSSFC-SC (59)
      • 2.2.5. Phântíchvà đánhgiá thuậttoánSSFC-SC (64)
    • 2.3. Thuật toán phân cụm bán giám sát mờ giải nghiệm bằng thỏadụngmờ (65)
      • 2.3.1. Thuật toánphâncụm bángiám sátmờ(SSFC-FS) (65)
      • 2.3.2. Cáctínhchấtvàhệ quảtừphântích nghiệmcủathuậttoán.57 2.3.3. Phântíchvà đánhgiá thuậttoánSSFC-FS (70)
    • 2.4. Xácđịnhthôngtinbổ trợphùhợpchothuậttoánSSFC-FS (87)
      • 2.4.1. Lượcđồtổngquát (88)
      • 2.4.2. Xâydựngtậpcáchàm thôngtinbổtrợ (88)
      • 2.4.3. Xácđịnhhàm thôngtinbổtrợphùhợp cho ảnhnhakhoa (91)
    • 2.5. Kếtluận (95)
    • 3.1. Mô tả dữliệuảnhX-quang nha khoa (96)
      • 3.1.1. Đặctả dữliệu (96)
      • 3.1.2. Xácđịnhcácđặctrưng của ảnhnha khoa (99)
    • 3.2. Độđovàtiêuchíđánhgiákếtquả (102)
    • 3.3. Cáckếtquảsosánhphânđoạnảnh (105)
      • 3.3.1. Kếtquả trên tập cơsởdữliệu ảnhnha khoa (105)
      • 3.3.2. Kếtquả với cáctham số thayđổi (108)
    • 3.4. Ứngdụng phânđoạnảnhtronghỗtrợchẩnđoánbệnhnhakhoa (115)
      • 3.4.1. Mô hìnhhóabàitoán (116)
      • 3.4.2. Chọnphân đoạncókhảnăngmắcbệnh (119)
      • 3.4.3. Chẩnđoán từngphân đoạn (120)
      • 3.4.4. Xâydựng bảng tổng hợp củacácđoạn (123)
      • 3.4.5. Phântích vàđánhgiámôhìnhDDS (124)
      • 3.4.6. Kếtquảthực nghiệm (125)
    • 3.5. Kết luận (129)
  • PHỤLỤC 1....................................................................................................125 (0)
  • PHỤLỤC 2....................................................................................................128 (0)

Nội dung

CỤMBÁN GIÁMSÁTMỜTRONGPHÂNĐOẠNẢNHNHAKHOA

Bàitoánphânđoạnảnhnhakhoa

Phân đoạn ảnh là chia nhỏ một ảnh thành các vùng đồng nhất tạo nên ảnhhoặc các đối tượng [17], [52] Phân đoạn ảnh thường được sử dụng để xác định vịtrí đối tượng (chẳng hạn như các loại cây trồng, khu vực đô thị, rừng của một hìnhảnh vệ tinh, v.v.) và các đường biên/ranh giới (đường thẳng, đường cong, v.v.)trong ảnh Chính xác hơn, phân đoạn ảnh là quá trình gán nhãn cho mọi pixel trongảnh mà những pixel có cùng nhãn thì có chung một số đặc điểm nhất định nào đó.Với phân đoạn ảnh nha khoa thì mục đích của phân đoạn ảnh nha khoa là bước xửlý quan trọng trong nha khoa thực hành nhằm hỗ trợ bác sĩ chẩn đoán một cáchhiệuquảcácbệnhquanhrăngnhƣviêmchânrăng,bệnhnhachu,viêmtúirăn g, v.v Hình 1.1 cho thấy kết quả của phân đoạn ảnh X-quang nha khoa chia ảnh X- quang thành các vùng, vùng màu xanh trong ảnh phân đoạn có thể mắc một bệnhnhakhoa nàođómà các bácsỹcầnđặcbiệtchúý.

Kếtquảcủaphânđoạnảnhlàmộttậpcácphânđoạnmànóbaotrùmtoànbộ ảnh Mỗi một điểm ảnh trong một phân đoạn là tương đồng nhau về một sốthuộctínhhoặctínhchấttínhtoán,vídụnhưmàusắc,cườngđộhoặccáchcấutạo, v.v Việc áp dụng với ảnh phân đoạn nha khoa người ta có thể xây dựng lên cácứng dụng nhƣ: hỗ trợ việc thu thập thông tin trong chẩn đoán bệnh nha khoa củabácsỹ,cácđườngmứcthuđượcsaukhiphânđoạnảnhcóthểđượcsửdụngđểtạodựng thành 3D với sự giúp đỡ của các thuật toán nội suy để từ đó các bác sĩ có thểnắn chỉnhlạirăngsaochophù hợpv.v.

Cơ quan của răng baog ồ m r ă n g v à n h a c h u q u a n h r ă n g l à đ ơ n v ị h ì n h t h á i vàchứcnăngcủabộrăng.Rănglàbộphậntrựctiếpnhainghiềnthứcăn,nhachul à bộ phận giữ và nâng đỡ răng đồng thời là bộ phận nhận cảm, tiếp nhận và dẫntruyền lực nhai Răng gồm men, ngà (mô cứng) và tủy (mô mềm) Nha chu gồmxươngchânrăng,menchânrăng,dâychằng,xươngổrăng,nướu(lợi),xương.Bộrăng là một thể thống nhất thuộc hệ thống nhai tạo thành bởi sự sắp xếp có tổ chứccủacác cơ quanrăng[2].

Mỗi răng có phần thân răng và chân răng Giữa thân răng và chân răng làđường cổ răng hay cổ răng giải phẫu là một đường cong Thân răng được bao bọcbởimen răng,chân răngđƣợcmen chân răngbaophủ.

Nướu răng viền xung quanh cổ răng tạo thành một bờ gọi là cổ răng sinh lý.Phần răng thấy đƣợc trong miệng là thân răng lâm sàng Cổ răng sinh lý thay đổitùy theo nơi bám và bờ của viền nướu, khi tuổi càng cao thì nơi bám này càng cókhuynh hướng di chuyển dần về phía chóp răng Nhiều trường hợp bệnh lý, nướurăngcóthểbịsưnghoặctrụt,làmthân răngbịngắnlạihoặcdàira[2].

Các thông tin về răng đƣợc hiển thị thông qua ảnh X-quang nha khoa Do đóảnh X-quang nha khoa là một trong các công cụ chính để trợ giúp các nha sĩ thuđƣợccácthôngtinnhakhoa.ẢnhX-quangnhakhoacóthểtrợgiúpviệcthuthập một số thông tin mà nha sĩ có thể không thấy đƣợc trong quá trình thăm khám trựctiếp Từ đó ảnh X-quang có thể trợ giúp cho việc xác định thông tin các bệnh nhakhoa nhƣ [2]: Lỗ sâu giữa các răng hoặc phát hiện sâu răng bên dưới lớp trámrăng,răng mọcngầm, viêmlợi,tiêu xươngquanh răng….

Córất nhiềuloạiảnhX-quangnha khoa khác nhau,t r o n g đ ó đ ƣ ợ c c h i a thành hai kiểu ảnh X-quang nha khoa chính: ảnh X-quang phạm vi trong miệng vàảnhX-quangphạmvicảngoàimiệng[9],[68]. Ảnh trong miệng: là loại ảnh X-quang nha khoa phổ biến Nó mô tả các răngmộtcáchchitiếtvàchophépnhasĩtìmsâurăng,kiểmtrasứckhỏecủacácrăngvà xương xung quanh răng, kiểm tra tình trạng phát triển của răng và theo dõi sứckhỏe chung của răng và xương hàm Ảnh X-quang thuộc kiểu trong miệng gồmảnh cắncánhvà ảnhquanhchóp. Ảnh ngoài miệng: cũng cho chúng ta thấy các răng nhƣng mục đích chính làcho thấy toàn bộ hàm răng và xương sọ Nó không cung cấp các đặc điểm chi tiếtvề từng răng nhƣ ảnh trong miệng và do đó, nó không đƣợc sử dụng để phát hiệnsâu răng hoặc một số vấn đề khác với từng chiếc răng Thay vào đó, nó đƣợc sửdụng để tìm các răng nêm vào nhau, theo dõi sự tăng trưởng và phát triển hàmtrong quan hệ với răng, để xác định các vấn đề tiềm ẩng i ữ a r ă n g v à h à m , h ộ i chứng rối loạn thái dương hàm hoặc các xương mặt khác Các ảnh X-quang thuộckiểu ngoài miệng gồm ảnh toàn cảnh, ảnh cắt lớp, phim sọ nghiêng, ảnh X-quangtuyến nướcbọt,ảnhcắt lớpđiệntoán.

MộtsốhìnhảnhX-quangnhakhoađƣợcthểhiệnởHình1.2. a) Ảnhcắncánh.b ) Ảnhquanhchóp c) Ảnhtoànhàm

Phân đoạn ảnh là giai đoạn đầu tiên trong quá trình xử lý ảnh và đóng vai tròrất quan trọng [32], [49] trong quá trình này Khi đó, phân đoạn ảnh nha khoa làbước xử lý then chốt trong nha khoa nhằm hỗ trợ bác sĩ chẩn đoán một cách hiệuquả các bệnh về răng nhƣ: viêm chân răng, răng mọc ngầm [55], [56] Khi đó ứngdụng đầu tiên củaphânđoạn ảnhlàhỗtrợviệcchẩnđoánbệnhnhakhoa.

Một trong những ứng dụng thú vị của phân đoạn ảnh nha khoa từ hình ảnhX-quanglàgiámđịnhphápy[23],[50],việcgiámđịnhphápythườngsửdụngcáccông nghệ khoa học để phân tích (trong đó có phân tích răng) trong việc xác địnhcon người, ví dụ: một vụ máy bay rơi sau khi rơi người ta phải giám định pháp yđể nhận dạng với từng người trong tất cả những người đã chết [50] Khi đó ngườita xác định thông qua các nhận dạng sinh trắc học, đặc điểm hình dạng nha khoacòn tồn tại của các nạn nhân (trongtrường hợp chết trong một thời gian dài [50]).Do đó, nó trở nên quan trọng để đưa ra quyết định xác định hình thái mặt của conngười dựa trên các đặc tính kích thước răng, khoảng cách giữa các răng và cácmẫu xoang, xương trên mặt v.v [50] Bên cạnh việc giám định pháp y, phân đoạnảnh nha khoa còn có một số ứng dụng khác: xác định số răng [35], ƣớc lƣợng tuổinha khoa [65], phân đoạn ảnh nha khoa có thể phân tích các mảng bám răng [24],v.v.

Tổngquanvềcácnghiêncứuliênquan

Phân đoạn ảnh là giai đoạn đầu tiên trong quá trình xử lý ảnh và đóng vai tròrất quan trọng [32], [49] Phân đoạn ảnh cũng là công việc khó khăn của xử lý ảnh.Trong đó, phân đoạn ảnh nha khoa là bước xử lý then chốt nhằm hỗ trợ bác sĩ chẩnđoán một cách hiệu quả các bệnh về răng nhƣ viêm chân răng, bệnh nha chu, viêmtúi răng [42], [43].Khi đó quá trình phân đoạn ảnh là một trong các bước quantrọngvàcầnthiếtđểphântíchảnhX- quangnhakhoachocácquátrìnhxửlýsau này nhƣ: hỗ trợ chẩn đoán bệnh [50], xác định các thành phần khác nhau trong ảnh(răng,lợi,tủyv.v.) [51].

(a) ẢnhX-quang nhakhoa; (b)Lỗtrống răngbịthiếu Ảnh X-quang nha khoa gồm 3 phần chính (hình 1.3 a) [54]: i) Phần răng:phần có độ xám cao và là phần ta nhìn thấy rõ nhất trên ảnh; ii) Phần cấu trúc răng:làphầncóđộxámtrungbìnhgồmlợirăng,xương,phầnkhác(tủy,ximăngv.v.); iii) Phần nền: là phần có giá trị độ xám nhỏ nhất là nền tảng của cấu trúc răng. Vớicấu trúc của ảnh X-quang nha khoa thì việc phân đoạn ảnh phức tạp hơn phân đoạnảnh thông thường [70] Nói cách khác, sự kết nối giữa các phần khác nhau của mộthình ảnh nha khoa X-quang và chất lượng thấp của hình ảnh do tạp chất, độ tươngphản thấp, sai sót về chức năng quét hình ảnh, v.v làm giảm hiệu suất phân đoạn.Ví dụ, các lỗ trống trong răng bị mất (hình 1.3 b) không thể đƣợc xử lý bằng kỹthuậtxửlýảnhdựatrênngưỡngthôngthường[26].Vìvậy,phươngphápkhaiphádữliệuph ânđoạnảnhX-quangnhakhoađãđƣợcnghiêncứuđểđạtđƣợcđộchínhxáccaocủa phânđoạn[40].

Các phương pháp phân đoạn ảnh

Dựa trên điểm ảnh Dựa trên biên Dựa trên vùng

Lấy ngƣỡng Phân cụm Phát hiện biên Xây dựng

Fuzzy C - Means Đường mức kích hoạt

Hình 1.4 giới thiệu một số phương pháp phân đoạn ảnh dựa trên điểm ảnh,dựa trên biên và dựa trên vùng Trong phân đoạn ảnh có rất nhiều kỹ thuật khácnhau đƣợc sử dụng và các kỹ thuật đó có thể đƣợc chia thành 2 loại xu hướng cơbản là: i) Áp dụng các kỹ thuật xử lý ảnh [13], [37] gồm: phương pháp ngưỡng,cácphươngphápdựabiênvàdựatrênvùng;ii)Ápdụngphươngphápphânc ụm

[46] gồm: K-means [60], Fuzzy C-Means (FCM) [10] Các phương pháp có sửdụngkỹthuậtxửlýảnhthườngphảibiếnđổiđểbiểudiễnảnhdướidạngnhịphân,thông qua ngưỡng hoặc sử dụng một đường cong phức tạp để xác định biên Mộtphương pháp thường được sử dụng là phương pháp tách ngưỡng Otsu [43].

Cácphươngphápnàythườnggặpvấnđềhếtsứckhókhănlàxácđịnhthamsốngưỡnghay biên chung của các mẫu răng [59] Trong khi các phương pháp sử dụng kỹthuật phân cụm để xác định các cụm thì không cần biết trước thông tin về ngưỡngvàcácđườngcong.Tuynhiêncácphươngphápnàyđặtramộttháchthứclàviệc lựa chọn các tham số và phát hiện biên giữa các cụm [12], [38], [39], [53]. Điềunày đặt ra các động lực của việc cải tiến các phương pháp phân đoạn ảnh để đạtđƣợchiệu suấttốthơn.

Các nghiên cứu trước đây [6], [66] cho thấy rằng nếu có thêm thông tin bổsung kết hợp với quá trình phân cụm thì chất lƣợng phân cụm đƣợc tăng cường.Việc nghiên cứu đề xuất các phương pháp phân cụm bán giám sát mờ với cácthông tin bổ trợ là một trong ba loại [69]: các ràng buộc Must-link và Cannot- link,các nhãn lớp của một phần dữ liệu, độ thuộc được xác định trước Ví dụ, nếuchúng ta biết rằng một điểm ảnh đại diện cho một vùng tương ứng là răng thì tagán nhãn cho điểm ảnh vào lớp răng, các điểm ảnh khác trong ảnh X-quang nhakhoa đƣợc phân cụm cùng với sự hỗ trợ của các điểm ảnh đã biết Thông tin vềđiểm ảnh đã biết làm cho kết quả phân đoạn ảnh chính xác hơn Trong các thuậttoán phân cụm bán giám sát mờ đƣợc đề xuất trong luận án, thông tin bổ trợ đượcsửdụnglàmatrậnđộthuộcđượcxácđịnhtrước(cáchxácđịnhđượcthựchiệnchitiết cho từng phương pháp trình bày trong chương 2) Đối với thông tin này, cácthuật toán phân cụm bán giám sát mờ (SSSFC) [66], thuật toán phân cụm bán giámsát mờ sử dụng Entropy (eSFCM) [67] có hiệu quả hơn so với thuật toán phân cụmmờFCM.

Một ảnh X-quang đầu vào có thể chỉ ra một số bệnh về răng chứ không phảimột bệnh duy nhất Nếu việc chẩn đoán đƣợc thực hiện trên từng vùng của ảnhcàng chi tiết thì kết quả chẩn đoán cho toàn bộ ảnh càng chính xác Mục tiêu củaphân đoạn từ một hình ảnh X-quang nha khoa là tạo ra nhiều phân đoạn khác nhautừ một ảnh đầu vào sao cho các điểm ảnh trong một phân đoạn có sự tương đồngcao hơn so với các phân đoạn khác Những ảnh X-quang nha khoa có thể đƣợcphân loại theo từng vùng khác nhau cụ thể là vùng nền và vùng cấu trúc răng hoặcvùng có bệnh và vùng không có bệnh [70] Những vùng này sau đó đƣợc so sánhvớicácmẫubệnhbằngmộtphươngpháptìmkiếmnhanhđểxácđịnhhình ảnh nha khoa có hay không chứa bệnh nha khoa nào Vấn đề này đã đƣợc nghiên cứurộng rãi trong các công trình [10], [12], [19], [29], [30], [43], [45] Trong đó, cácphương pháp điển hình và phổ biến là phương pháp tách ngưỡng Otsu [43], phâncụmmờFCM[10],phâncụmbángiámsátmờtheoquytắcEntropyeSFCM[67].

Khi ảnh đƣợc phân đoạn tạo thành các phân đoạn, thuật toán phân lớp đƣợcsử dụng để xác định bệnh có thể có của từng phân đoạn riêng lẻ và hệ hỗ trợ raquyết định đƣợc áp dụng để xác định các bệnh của toàn bộ ảnh đầu vào Quá trìnhphân lớp đôi khi còn đƣợc gọi là quá trình tìm kiếm ảnh X-quang nha khoa nhằmtrợ giúp cho quá trình khớp một ảnh hoặc một phân đoạn X-quang nha khoa vớimộtmẫubệnhcótrongcơ sởdữliệu. Ở trong nước, những năm gần đây cũng có một số nhóm nghiên cứu về cácphươngphápphânđoạnảnh.ChẳnghạnnhómtácgiảNgôThànhLongvàcộngsự

[39] đã nghiên cứu phương pháp phân cụm bán giám sát mờ loại 2 dùng với ảnhviễn thám Nhóm tác giả Lê Hoàng Sơn và cộng sự [57] cũng đã đề xuất phươngpháp phân cụm áp dụng cho bộ dữ liệu chuẩn từ UCI với các giai đoạn: phân cụmdữ liệu đầu vào thành các phân hoạch; áp dụng các kỹ thuật phân cụm thôngthường để xác định ma trận tương tự cho từng phân hoạch; tính toán trọng số chocác phân đoạn bằng các độ đo phân cụm và xác định ma trận độ thuộc cuối cùngcủa thuật toán phân đoạn đƣợc xác định dựa trên nguyên tắc cực tiểu hóa bìnhphươngsaisốtừphươngphápgiảmGradient.Phươngphápnàychưasửdụngcácthông tin bổ trợ có lợi trong quá trình phân cụm khi thực hiện Nhóm tác giả PhạmHuy Thông và Lê Hoàng Sơn [63] đề xuất thuật toán phân cụm mờ bức tranh nhưlà một phương pháp của trí tuệ tính toán Các thực nghiệm của phương pháp nàyđược áp dụng cho bộ dữ liệu số Iris và một vài bộ dữ liệu khác trên UCI Một cáchtiếp cận của thuật toán phân cụm trong một ứng dụng khác đƣợc tác giả Lê

HoàngSơntrìnhbàytrong[56],thuậttoánphâncụmmờđƣợcsửdụngtrongphânt ích địalýcủacụmdâncƣ.Cáccáchtiếpcậnnàychƣathựchiệntrênảnhnhakhoacũng nhƣchƣasửdụngcácthôngtinđặctrƣngcủaảnhtrongquátrìnhphâncụm.

Mộtsố kiếnthứccơsở

Tập mờ [1] đƣợc coi là mở rộng của tập kinh điển Nếu X là một không giannền (một tập nền) và những phần tử của nó đƣợc biểu thị bằng x, thì một tập mờ Atrong Xđƣợcxác định bởi một cặp cácgiátrị:

Trong đó A (x)đƣợc gọi là hàm liên thuộc củaxtrongAviết tắt là

MF(Membership Function) Nó không còn là hàm hai giá trị nhƣ đối với tập kinh điểnnữa, mà là một hàm với một tập các giá trị hay còn gọi là một ánh xạ Tức là, hàmliên thuộc ánh xạ mỗi một phần tử của X tới một giá trị liên thuộc trong khoảng[0,1].

Nhƣ vậy, một tập mờ phụ thuộc vào hai yếu tố là không gian nền và hàm liênthuộcphùhợp.

Các hàm liên thuộc đƣợc xây dựng từ những hàm cơ bản nhƣ: hàm bậc nhất,hình thang, hình tam giác, hàm phân bố Gaussian, đường cong sigma, đường congđathứcbậc haivàbậc ba.Hình1.5ởtrênmô tảmộtvàidạnghàmthuộccơbản.

Hình1.5.Mộtsốdạnghàmthuộccơ bản Đểbiểudiễnmộttậpmờ,tuỳthuộcvàokhônggiannềnvàhàmliênthuộclàrời rạchayliên tụcmàtacócáccáchbiểudiễnnhƣsau:

(1.3) Cácy êu c ầ u c ơ b ả n c ủ a hàm T(g ọ i làt o á n h ạn g c h u ẩ n h a y T- norm)đ ƣ ợ c phátbiểunhƣsau:

Tlàmột ánhxạbậchaiT()thoảmãn: Đườngbiên: T(0,0) =0;T(a, 1) =T(1,a) =a (1.4) Đơnđiệu: T(a,b)T(c,d)nếuac vàbd (1.5)

Những toán hạng kết hợp mờ này thường được coi như những toán hạngkhông tiêu chuẩn T(hoặc tiêu chuẩn S), chúng phải thoả mãn những yêu cầu cơbản sau:

Toán hạng không tiêu chuẩn T (hoặc tiêu chuẩn S) là một ánh xạ bậc hai S()thoảmãn: Đườngbiên: S(1,1)=1;S(a,0) =S(0,a)=a (1.14) Đơnđiệu: S(a,b )S(c,d)nếu ac và bd (1.15)

Trên cơ sở đó, người ta thường sử dụng một số phép toán giao thoả mãnchuẩn Snhƣsau:

Phép phủ định: Phủ định là một trong các phép toán logic cơ bản Để suy rộngchúng ta cần tới toán tử N gọi là toán tử phủ định mờ Toán tử này thoả mãn điềukiệnsau:

Hàm N: [0,1][0,1] không tăng đƣợc gọi là hàm phủ định nếu thoả mãn cácđiềukiệnsau: Điều kiện biên: N(0)=1 và

Phân cụm dữ liệu [10] là quá trình nhóm một tập các đối tượng tương tựnhau trong tập dữ liệu vào các cụm sao cho các đối tƣợng thuộc cùng một cụm làtương đồng, còn các đối tượng thuộc các cụm khác nhau sẽ ít tương đồng (Hình1.6).

Phânc ụ m dữl i ệ u l à mộ t k ỹ thuật t r o n g kh ai p h á d ữ liệun h ằ m tìmkiếm,pháthiệncáccụm,cácmẫudữliệutựnhiêntiềmẩnquantrọngtrongtậpdữliệu lớntừđócungcấpthôngtinhữuíchchoviệcraquyếtđịnh.Ngoàira,phâncụmdữ liệu còn có thể được sử dụng như một bước tiền xử lý cho các thuật toán khaiphá dữ liệu khác như là phân loại và mô tả đặc điểm, có tác dụng trong việc pháthiện ra các cụm Phân cụm dữ liệu đang là vấn đề mở và khó vì người ta cần phảigiải quyết nhiều vấn đề cơ bản về dữ liệu để nó phù hợp với nhiều dạng dữ liệukhácnhau.

Mục tiêu của phân cụm dữ liệu là xác định đƣợc các dữ liêu có bản chấttương đồng nhau thành một cụm (gán nhãn) trong tập dữ liệu chưa có nhãn. Vìvậy, phân cụm đòi hỏi người sử dụng phải cung cấp tiêu chuẩn phân cụm một cáchrõ ràng theo cách mà kết quả phân cụm sẽ đáp ứng đƣợc yêu cầu của bài toán đặtra.

Bài toán phân cụm xuất hiện dưới nhiều tên gọi khác nhau tùy theo yêu cầu,mục đích của việc sử dụng bài toán Ngày nay bài toán phân cụm rất phong phú vàđƣợcsửdụngtrongnhiềulĩnhvực.Đặcbiệttrongcáclĩnhvựcxửlýthôngtinnhƣchúng ta biết, thông tin trong thời đại bây giờ là rất lớn và ngày càng nhiều hơn.Vấn đề đặt ra là phải tìm ra giá trị tri thức từ kho thông tin đó, KPDL ra đời vàKPDL kết hợp với hệ mờ đang đƣợc phát triển để tăng giá trị tri thức rút ra từ bộdữliệu.Bàitoánphâncụmđangđượcpháttriểntheohướngđó.

Phân cụm dữ liệu đƣợc chia thành 2 nhóm cơ bản: Phân cụm rõ (phân cụmchính xác) và phân cụm mờ Trong phân cụm rõ, mỗi điểm dữ liệu chỉ thuộc vàomột cụm duy nhất nào đó Còn trong phân cụm mờ, một điểm dữ liệu có thể thuộcvào nhiều cụm khác nhau với các độ thuộc khác nhau Mục 1.3.2.2 giới thiệu cácthuật toán phâncụmmờvàthuậttoán phâncụmbángiámmờ.

ChomộttậpdữliệuX={x1,x2,….,xN},vớixi  R r ,gồmNdữliệurchiều.phântách tập dữliệuthànhCcụm:v1,v2,…,vCrời nhau thỏamãn điều kiện sau:

C:làsốcụmsẽphânthành,phảichotrướcm.vi:véct ơtâmcụm,dùngđề chỉcụmthứi.

Nhiều vấn đề đã dẫn đến bài toán phân cụm mờ và các ứng dụng đƣợc đề cậpđến nhiều trong bài toán phân cụm mờ bao gồm nhận dạng ảnh, xử lý thông tin,phân loại khách hàng trong ngân hàng Đã có rất nhiều nghiên cứu chuyên sâutrong 2 thập kỷ qua Điểm quan trọng là sự khác nhau của hai hướng tiếp cận theohướng mờ (một véc tơ thuộc đồng thời vào nhiều cụm) và theo hướng xác suất(mộtvéctơchỉđƣợcthuộcvàoduynhấtchỉmộtcụm).Ƣuđiểmcủaphâncụmmờsovớip hâncụmrõđƣợcthểhiệntrongthựctếkhimàkhôngthểchỉraranhgiớirõrànggiữacác cụm.Phâncụmrõbắtbuộccácđiểmchỉđƣợcphépthuộcvàoduynhất một cụm Còn phân cụm mờ cho phép các điểm dữ liệu linh hoạt hơn, mộtđiểm dữ liệu có thể thuộc vào nhiều cụm và ta đƣa ra khái niệm độ thuộc để chỉmức độ liên quan của điểm dữ liệu vào cụm mà nó thuộc Giá trị độ thuộc nằmtrong đoạn [0,1], trường hợp điểm dữ liệu không thuộc một cụm nào hay chỉ thuộcvào duynhấtmộtcụmlà rấthiếm.

Thuật toán phân cụm mờ đƣợc Bezdek [10] đề xuất dựa trên độ thuộcu kj của phầntửdữliệux k từcụmthứj.Hàmmụctiêuđƣợcxácđịnhnhƣsau:

 mlàtrọngsốmũđượcgọilàthamsốmờ,làmứcđộmờtươngứngvới matrậnphânhoạch(theo Bezdek[10]giátrịmđƣợc chọnlà1.5m3.0);

 Clàsố cụm, Nlàsốphầntửdữliệu,rlàsốchiều củadữliệu;

 u kj là độthuộccủa phầntử dữliệuxkvàocụmthứj,hìnhthànhmatrậnđộ thuộc Trong phân cụm mờ, tất cả các phân hoạch mờ cóCcụm dữ liệucủa tập dữ liệu cóNđối tƣợng trong không gianrchiều thì ma trận độthuộcđƣợcxácđịnhnhƣsau: 

SửdụngphươngphápLagrange,xácđịnhđượctâmcủacụmdựavào(1.25)vàđột huộcdựavào(1.26)từhàmmục tiêu(1.23)và ràngbuộc(1.24):

Bảng1.1.Thuậttoánphâncụmmờ Input Tậpdữliệu XgồmNphần tửtrongkhônggian rchiều;số cụmC;mờ hóam;ngƣỡngε;sốlầnlặplớnnhấtMaxStep>0.

Nhận xét về phân cụm mờ: Phân cụm mờ là một sự mở rộng của phân cụm dữliệu bằng cách thêm vào yếu tố quan hệ giữa các phần tử và các cụm dữ liệu thôngqua các trọng số trong ma trận U Bằng cách này, chúng ta có thể khám phá cáccụm dữ liệu phức tạp theo cách mềm dẻo từ một tập dữ liệu dã cho Thuật toánphân cụm mờ là một cách thức mở rộng cho các thuật toán phân cụm rõ nhằmkhám phá ra các cụm dữ liệu chồng lên nhau Tuy nhiên trong thuật toán phân cụmmờ chưa sử dụng các thông tin biết trước để làm tăng chất lượng của cụm, khi đóđãcó những cải tiếnvàđềxuất cácthuật toánphân cụmbán giámsát mờ. b) Phâncụmbán giámsát mờ

Cáct h u ậ t t o á n p h â n c ụ m báng i á m sátm ờ x â y dựngd ự a t r ê n c á c t h u ậ t t o á n phân cụm mờ kết hợp với các thông tin bổ trợ được người dùng cung cấp Cácthông tin bổ trợ nhằm mục đích hướng dẫn, giám sát và điều khiển quá trình phâncụm.

- Các ràng buộc Must-link và Cannot-link: Ràng buộc Must-link yêu cầu 2 phầntửphảithuộcvàocùng1cụm,ngƣợclạiràngbuộcCannot- linkchỉra2phầntửkhôngthuộc cùng1cụm(mà phải thuộc2 cụmkhácnhau).

- Các nhãn lớp của một phần dữ liệu: Một phần của dữ liệu đƣợc gán nhãn vàphần còn lại không đƣợc gán nhãn.

Mộtsố nghiêncứu về phân đoạnảnh sử dụngphânc ụ m b á n g i á m s á t thườngdùngloạithông tinbổtrợlàgiátrịhàmđộthuộcđượcxácđịnhtrước.Vớiloại thông tin bổ trợ này, Zhang [69] đã áp dụng quy tắc entropy để giảm số chiềuvà đề xuất một tiếp cận mới với ý tưởng là kết hợp một thành phần theo quy tắcentropy vào hàm mục tiêu Bên cạnh đó, Yasunori [66] đã đề xuất thuật toán phâncụm bán giám sát mờ trên cơ sở của FCM bổ sung thêm hàm độ thuộc bổ trợ sửdụngtrongquátrìnhphâncụm.BouchachiavàPedryzc[12]sửdụngthôngtinbổ trợvàoviệc xácđịnhcác thànhphần u kj thôngquagiátrịtrunggian u ik

Yasunori et al [66] đã đề xuất một thuật toán phân cụm bán giám sát mờ vớithông tin bổ trợ là hàm độ thuộc bổ sung trong hàm mục tiêu của FCM để cải thiệnhiệu quả trong quá trình phân cụm của thuật toán Khi đó hàm mục tiêu [66] đƣợcxácđịnhnhƣsau:

Vớiđiềukiệnràngbuộc(1.24),khiđóhàmđộthuộcbổtrợcủaphầntử x k cụmthứjlà u kj   0,1 đ ồngthờithỏamãn: với

Khi đódựavào điềukiện(1.24)vàhàmmụctiêu (1.27)chúngtacó: m

 u kj 1  u kj ,khi k argminx k  v i u kj  u kj j1

Bảng 1.2.Thuậttoánphân cụmbán giámsát mờchuẩn

Input TậpdữliệuXgồm Nphầntử,sốcụm C,matrận ngƣỡng,sốlầnlặptốiđamaxStep>0. độ thuộc bổ trợ U ,

4: Tính U (t) bởi u ( k1,N ; j1,C )theo công thức(1.29)với m 1 kj hoặc côngthức(1.30)với m 1.

Thuậttoánphâncụmbángiámsátmờ theo quy tắcentropy(eSFCM)

ThuậttoáneSFCMđƣợcYasunorivàcộngsự[66]đềxuấtnăm2009,đếnnă m2012Yin[67]cóđềxuấthiệuchỉnhhệsốEntropyvàkhiđóthuậttoánphân cụmbángiámsátmờdựatrênthuậttoáneSFCM,sửdụngđộthuộcbổtrợtăngh iệusuấtphâncụmvớiđiềukiện: u kj để

Vớiđiều kiện ràng buộc(1.24) và hàm mục tiêu(1.35) ta cócáccông thức xácđịnh ma trậnđộthuộc: e   x k  v j A  C ,

Bảng 1.3.Thuậttoánphâncụmbán giámsátmờtheoquytắcentropy Input Tậpd ữ l i ệ u X g ồ m N p h ầ n t ử , s ố c ụ m C , đ ộ t h u ộ c b ổ t r ợ U , ngƣỡng ,sốlầnlặptốiđamaxStep>0.

1: TínhmatrậnPtheocôngthức(1.33)vớimatrậnđộthuộc U đ ã cho vàcác tâmcụmV (0) banđầu;

BouchachiavàPedrycz[12]đãđềxuấtphươngphápphâncụmbángiámsát mờvớithôngtinbổtrợlàđộthuộcxác địnhbởi(1.38). u kj chotrước,khiđóhàm mụctiêu[12]được

   (ukj u kj ) j1k1 d kj    (u kj  1)min j1

Với H làsốlớp,mỗilớp h chứa C h cụmthỏamãn C h  C và  h h1 làtập các cụmthuộcvàolớp h t h ì cácgiátrị u kjđ ư ợ c chobởicôngthức(tlàsốbướclặp).

Bảng 1.4.Thuậttoánphân cụmbán giámsát mờ Input TậpdữliệuXgồmNphầntử,sốcụmC,độthuộcbổtrợ U ,ngƣỡng

3 Xácđịnhmatrận M  m hi  HC trongđó: m hi  1nếucụmthứithuộclớp hvàbằng0nếungƣợclại

8 Tínhtoán U( t)bởi u theo côngthức(1.41) kj

Kếtluận

Trong chương này, luận án đã nêu tổng quan về bài toán nghiên cứu trongluận án, cụ thể là phân cụm bán giám sát mờ trong phân đoạn ảnh nha khoa.Nôidung chương này trình bày những kiến thức cơ bản về lý thuyết tập mờ, phân cụm,phương pháp giải tối ưu Các kiến thức cơ bản này là nền tảng để giải quyết cácbài toán phân đoạn ảnh và chẩn đoán nha khoa qua phân cụm bán giám sát mờ sẽđượctrìnhbàyởcácchươngsau.

MỘT SỐ THUẬT TOÁN PHÂN CỤM BÁN GIÁM SÁT MỜCHOPHÂNĐOẠN ẢNHNHAKHOA

Thuậttoánphâncụmbángiámsátmờlai ghép

Nội dung trình bày trong phần này bao gồm: lƣợc đồ tổng quan về sự kếthợp giữa kỹ thuật xử lý ảnh với thuật toán phân cụm bán giám sát mờ ở mục 2.1.1.ChitiếtvềthuậttoántáchngƣỡngOtsuvàthuậttoánphâncụmbángiámsátm ờsử dụng trong sơ đồ tổng quan được mô tả chi tiết trong mục 2.1.2 và 2.1.3 tươngứng Cuối cùng, mục 2.1.4 nhận xét về thuật toán lai ghép giữa kỹ thuật xử lý ảnhvới thuật toán phân cụm bán giám sát mờ trong bài toán phân đoạn ảnh X-quangnhakhoa.

Trong hình 2.1, luận án minh họa mô hình kết hợp giữa Otsu - FCM - eSFCM bằng một sơ đồ tổng quan Đầu vào là một ảnh X-quang nha khoa và vớimột vài tham số do người dùng xác định như là số lượng cụm (C), số mờ hóa(m),ngƣỡngOtsu (T)vàngƣỡngdừng().

Dùng phương pháp phân cụm eSFCM để phân đoạnảnhvớithôngtin bổtrợxácđịnh từmatrậnđộthuộc

Bắt đầu Ảnh đầu vào và các tham số

Kiểm tra xem ảnh đầu vào có vùng nền Sai Đúng

Dùng phương pháp phân cụm FCM để xác định ma trận độ thuộc Dùng phương pháp tách ngưỡng Otsu để loại bỏ vùng nền trong ảnh

Kết quả ảnh phân đoạn

Kết thúc Đánh giá hiệu năng thuật toán bằng các tiêu chuẩn

Từ một ảnh X-quang có thể có hoặc không có chứa các vùng nền, khi đó sửdụng một thủ tục để kiểm tra điều này trước khi phân đoạn ảnh Thuật toánOtsuđƣợc áp dụng để loại bỏ các khu vực nền từ hình ảnh Vùng nền là phần có giá trịđộ xám nhỏ nhất và là nền tảng của cấu trúc răng Thuật toán này có ƣu điểm là xửlý nhanh và hiệu quả, đồng thời có thể phân biệt phần nền với các phần chính củaảnh Sau đó, tiến hành phân cụm mờ bằng thuật toán FCM Các kết quả của quátrìnhphâncụmlàcáctâmcụmvàmatrậnđộthuộc.Khiđókếtquảnhậnđƣợclà gần đúng với kết quả của bài toán, đồng thời sử dụng các kết quả đó là các thôngtin bổ trợ cho các thuật toán phân cụm bán giám sát mờt r o n g b ƣ ớ c t i ế p t h e o Thuật toán phân cụm bán giám sát mờ (eSFCM) đƣợc áp dụng để cải thiện các kếtquảcủaquá trìnhphâncụmtronggiaiđoạn xửlý phânđoạnảnh sauđó. Ýnghĩacủathuậttoánlaighép (Otsu-FCM-eSFCM):

 Khi sử dụng thuật toán Otsu [43] có thể xác định đƣợc các vùng độc lập dựatrên việc tách ngƣỡng từ một ảnh X-quang nha khoa Thuật toán này có ƣuđiểm là xử lý nhanh, hiệu quả và có thể xác định các vùng theo ngƣỡng vìvậyđượcsửdụngtrongcácbướctiềnxửlýcủađềxuất;

 Cho phép sử dụng các thuật toán phân cụm mờ để xác định thông tin bổ trợchophâncụmbángiámsátmờthôngquamatrậnđộthuộcnhậnđƣợc.

 Cho phép sử dụng các thuật toán eSFCM để nâng cao chất lƣợng cụm củaquátrình phâncụmtừđó nângcao chấtlƣợng ảnhphânđoạn.

Thuật toán tách ngƣỡng Otsu biến đổi một hình ảnh đầu vào thành một ảnhnhịphân.Nóđƣợcgiớithiệutrong[43](Otsu,1975)vàcũngđƣợcsửdụngtrong

[46] bởi Rad, Rahim & Norouzi (2014) Một ảnh đầu vào có thể đƣợc chia thành 3khu vực theo cường độ ảnh trong đó vùng có cường độ thấp nhất tương ứng vớinền hoặc vùng mô mềm; các khu vực có cường độ trung bình tương ứng vớixương;vàcáckhuvựccócườngđộcaonhấttươngứngvớirăng.Tuynhiên,trongtrường hợp các ảnh có cường độ của các răng nhiều thì hoàn toàn chia thành 2vùng là vùng nền và vùng ảnh (hay vùng chính), nên đƣợc sử dụng trongt h u ậ t toán Otsu.

Otsu là một thuật toán tách ngƣỡng nổi tiếng trong các kỹ thuật xử lý ảnhdựa trên điểm ảnh Kỹ thuật đơn giản nhất trong các thuật toán tách ngƣỡng làphân chia ảnh thành hai vùng dựa trên một ngưỡng toàn cục T Trong trường hợpnày,thuậttoánOtsuchọnmộtngƣỡngvớimụctiêunhằmgiảmthiểunhữngthay đổi của các lớp bên trong của các điểm ảnh màuđ e n v à t r ắ n g ( n h ã n m ỗ i đ i ể m trong ảnh thuộc vào vùng chính r0hoặc vùng nền r1) Mỗi điểm ảnh đƣợc gán nhãndựatrêngiátrịcấpxámcủa nó(f(x)).Nóicáchkhác: g(x) ro khi f(x)T

Kết quả của bước tách ngưỡng là một ảnh nhị phân để đơn giản hóa quátrình phân tích ảnh trong các bước tiếp theo Mô tả chi tiết thuật toán Otsu đƣợcthểhiệntrongbảng2.1.

Trong trường hợp tổng quát mà số lượng các cụm (C) là lớn hơn 2, nhiềungƣỡng có thể đƣợc sử dụng để xác định các cụm khác nhau Giả sử T1,

T2, , Tn(Tilà điểm cách đều trong đoạn [min, max] với mọi i = 1, 2, , n) là các ngƣỡng.Giá trị của mỗi điểm ảnh (f(x)) đƣợc tính là trung bình của các giá trị R,

Sau đó, uijtrong ma trận độ thuộc U bằng 1 nếu điểm ảnh j thuộc về cụm thứi vàbằng0nếungƣợc lại.

Ví dụ 2.1.Đối với một hình ảnh 9x9, tại mỗi điểm ảnh có một giá trị màu khácnhau giả sử các giá trị đó thể hiện nhƣ trong hình 2.2, sử dụng thuật toán Otsu vớiT (0) =3 , s a u 5 l ầ n l ặ p , c h ú n g t a c ó h a i c ụ m c ủ a ả n h đ ầ u v à o t ƣ ơ n g ứ n g v ớ i c á c g i á trị0hoặc1nhƣtronghình2.3.

Hình2.3.Ảnh nhịphân củaảnhđầu vàokhi áp dụngthuật toánOtsu

Thuậttoánbángiámsátmờlaighépđƣợcthựchiệndựatrênsựlaighépcủathuật toán Otsu, thuật toán phân cụm mờ (FCM) với thuật toán phân cụm bán giámsátmờ(eSFCM).Cácbướcthựchiệncủathuậttoánđượctrìnhbàytrongbảng2.2.

Input Ảnhđầuvào,sốcụmC,matrậnđộthuộcbổtrợ U ;ngƣỡngdừng; sốlần lặplớnnhấtmaxStep>0

2: Phân cụmmờ(FCM)xácđịnh ma trậnđộthuộcUFCM.

3: Xâydựngthôngtin bổ trợ U từmatrậnđộthuộcUFCMbỏđi cácgiá trịhàmthuộcnhỏnhất tại cácđiểm.

4: Phân cụmbángiámsát mờ (eSFCM)vớianhđầu vàovàthôngbổtrợ

Thuật toán phân cụm bán giám sát mờ lai ghép là một sự kết hợp giữa thuậttoán tách ngƣỡng Otsu, thuật toán phân cụm mờ FCM và phân cụm bán giám sátmờ (eSFCM) Thuật toán Otsu dùng để tách phần nền với phần chính của ảnh nhakhoa Những thông tin bổ trợ dùng trong eSFCM đƣợc xác định là kết quả của matrậnđ ộ t h u ộ c tr on g p h â n c ụ m F C M Th u ậ t t o á n e S F C M đ ƣ ợ c s ử d ụ n g đ ể p h â n cụmtrongphânđoạnảnhcuốicùng.

Các kết quả thực nghiệm ở chương 3 cho thấy chất lượng phân cụm khi ápdụng thuật toán phân cụm bán giám sát mờ lai ghép luôn tốt hơn các thuật toánkhôngđƣợclaighépvớinhau(thuậttoánFCM,eSFCM,OSTUđộclập).

Tuy nhiên thuật toán này có một số nhƣợc điểm là chƣa sử dụng các đặctrƣng của ảnh nha khoa, chƣa sử dụng thành phần không gian trong hàm mục tiêuđểtăngđộchínhxác.

Trong mục 2.1, luận án đã trình bày một thuật toán kết hợp giữa phân cụmmờ với phân cụm bán giám sát mờ và Otsu Để phát triển tiếp các kết quả đã có,thuật toán phân cụm bán giám sát mờ có sử dụng các thông tin đặc trƣng khônggian đƣợc đề xuất Nội dung trình bày bao gồm lƣợc đồ tổng quát của thuật toánphânc ụ m báng i á m sát m ờ c ó đ ặ c t r ƣ n g kh ôn g g i a n đ ƣ ợ c tr ìn h b à y tron gm ụ c

2.2.1 Xây dựng các đặc trƣng không gian của một ảnh X-quang nha khoa trongmột cơ sở dữ liệu đặc trƣng nha khoa đƣợc trình bày trong mục 2.2.2 Mục 2.2.3trìnhb à y q uá t r ì n h x á c đ ị n h t h ô n g t i n m ớ i b ổ t r ợ c h o q u á t r ì n h p h â n c ụ m bằngcách kết hợp các kết quả của FCM với các thông tin đặc trƣng không gian Môhình hóa bài toán phân đoạn nha khoa dưới dạng một bài toán phân cụm bán giámsát mờ có ràng buộc đặc trƣng không gian (SSFC-SC) và giải bài toán bằngphươngphápnhântửLagrangeđểnhậnđượccáctâmcụmtốiưuvàmatrậnđộ thuộc đƣợc đƣa ra trong mục 2.2.4 Cuối cùng, các ƣu điểm và nhƣợc điểm củaSSFC-SCđƣợctrìnhbàytrong mục2.2.5.

Hình 2.4 dưới đây xác định cơ chế chính của mô hình đề xuất Đầu vào làmột ảnh X-quang nha khoa và với một vài tham số do người dùng xác định như làsố lƣợng cụm (C), các số mờ hóa (m), ngƣỡng Otsu (T) và ngƣỡng dừng () Xácđịnh các thông tin bổ trợ của ảnh và đồng thời tiến hành thuật toán phân cụm FCMcũng đƣợc sử dụng để phân đoạn các ảnh X-quang nha khoa đầu vào thành cùngmộtsốcụm.MatrậnđộthuộcnhậnđƣợctừFCMcùngvớicácthôngtinđặctrƣngkhông gian đƣợc sử dụng cho việc tính toán các thông tin bổ trợ cho thuật toánphân cụm bán giám sát mờm ớ i S ử d ụ n g t h ô n g t i n n à y , v i ệ c x â y d ự n g v à g i ả i quyết bài toán phân đoạn ảnh nha khoa bằng các thuật toán phân cụm bán giám sátmờ mới (SSFC-SC) đƣợc thiết lập Sau đó thuật toán SSFC-SC lặp lại để xác địnhcác tâm cụm và ma trận độ thuộc, xác định ảnh phân đoạn Cuối cùng, các chỉ sốhiệunăngđƣợcápdụngđểđánhgiáchấtlƣợngcủacáckếtquảđạtđƣợc.

Trong mục này, luận án giới thiệu 5 đặc trƣng cơ bản của một ảnh nha khoa.Các đặc trƣng này đƣợc xây dựng xuất phát từ đặc tính của ảnh nha khoa (đƣợctrình bày ở mục 1.1.2 về ảnh nha khoa) Các đặc trưng này nhận được bằng cácháp dụng các phương pháp trích chọn đặc trƣng từ một ảnh X-quang nha khoa nhƣsau:

Cơ sở dữ liệu đặc trƣng

Xây dựng một mô hình phân cụm bán giám sát mờ và thuật toán SSFC-SC

Xác định thông tin bổ trợ

Thuật toán phân cụm bán giám sát mờ giải nghiệm bằng thỏadụngmờ

Trong mục trước, luận án đã trình bày thuật toán phân cụm bán giám sát mờmới là SSFC-SC với phương pháp Lagrange giải nghiệm tối ưu của hàm mục tiêu.Tuy nhiên, thuật toán này có một nhược điểm là tìm nghiệm của bài toán tối ƣu đamụctiêuchƣathựcsựchochấtlƣợngcụmtốtnhất.Đểkhắcphụcđiềunày,tácgiảluận án đề xuất sử dụng phương pháp thỏa dụng mờ để tìm nghiệm tối ưu chothuật toán phân cụm bán giám sát mờ SSFC-SC Đồng thời, việc kiểm tra tốc độhội tụ, giới hạn của độ đo và so sánh với nghiệm nhận đƣợc từ các thuật toán cóliênquankháccũngđƣợctrìnhbàytrongmụcnày.

Trên cơ sở bài toán đã được mô hình hóa dưới dạng một bài toán tối ưu đamục tiêu (2.39)-(2.40), một thuật toán mới có tên là thuật toán phân cụm bán giámsát mờ với ràng buộc không gian dùng phương pháp thỏa dụng mờ (SSFC-FS)đƣợc đề xuất Đóng góp mới của thuật toán này là xây dựng một cách giải mới chobài toán tối ưu đa mục tiêu (2.32)-(2.33) Cách giải này sẽ đưa ra hướng tiếp cậnmới choquátrìnhmô phỏngthuậttoán.

Với các thành phần hàm mục tiêu được viết tường minh trong các công thức(2.25),(2.30),(2.31). Áp dụng định lý Weierstrass, sự tồn tại nghiệm tối ƣu của bài toán trên đƣợc thểhiệntrong bổđềdướiđây:

Bổ đề 2.1 [4]Bài toán tối ƣu đa mục tiêu (2.32) - (2.33) có hàm mục tiêu liên tụctrên một tập compact khác rỗng Do đó bài toán có phương án tối ưu toàn cục liêntụcvàbịchặn.

Trên cơ sở bổ đề 2.1 và phương pháp thỏa dụng mờ, việc tìm nghiệm tối ưu củabàitoánđƣợcthựchiện nhƣsau:

Với d kj  x k  v j 2,k=1,…,N;j=1,…,C.Khiđó,hàmmụctiêuJđ ƣ ợ c viếtlại dướidạng: u l j k

J 2  k1j 1 u kj R kj  k1j 1 u kj l  i1 w ik (2.45) Đặt R 2  1  l w ,k= 1,…,N;j=1,…, C,tacó: kj kj ki i1

Cùngvớikýhiệud kj nhƣtrongbàitoán1,hàmmụctiêuJ 3 đƣợcviếtlạinhƣsau:

Từcácn g h i ệ m tốiƣ u c ủ a c á c bài toánc o n , talậpb ản g đ á n h g iá hàmmụct iê u(pay-off) [4](bảng 2.9):

Bảng2.9.Bảngđánhgiáhàmmụctiêu(pay-off)củaphươngphápthỏadụngmờ

Ký hiệu: z 1  min  z h1 , h1,2,3  , z 1  max  z h1 , h1,2,3 , (2.50) z 2  min  z h2 , h1,2,3  , z 2  max  z h2 , h1,2,3 , (2.51) z3min  zh3,h1,2,3  , z 3 max  zh3,h1,2,3 , (2.52)

Sauđótatìmphươngántốiưuchobàitoáncóhàmmụctiêu(2.55)vàcácràngbuộc(2.33), (2.56)cùngvới ràngbuộcbổsung dướiđây:

Vớimỗibộthamsố( b 1 ,b 2 , b 3) thỏamãnđiềukiện(2.56),tatìmđƣợcmộtnghiệm tốiưucủabàitoánnày,kýhiệulà u  t    u (t) 

-Nếu  min  min   i (J i ),i1, ,3    ,v ớ i l à m ộ t n g ƣ ỡ n g d o n g ƣ ờ i d ù n g c h ọ n t h ì u (t) khônglàphươngánchấpnhậnđược.Ngượclại,takiểmtraxemnếu u (t)  S thìbổsung u (t) vào S p

-Nếucầnmởrộngtập S pthì ta tăngt( tt 1)và kiểmtra điềukiệnsau:

Nếut>L 1 hoặclàsauL2lầnlặpliêntiếp(L1,L2làcácgiátrịtùyý)màtập S p khôngkếtnạpthêmnghiệmnàothìđặt a  t  z , i1, 2,3 vàlấy1chỉsốhbấtkỳ i i từtập{1,2,3}đểgán a  t    z ,z h rồilặplạibước1.

Trongmụctrên,thuậttoánthỏadụngmờđƣợcsửdụngđểtìmnghiệmtối ƣu u (t) củab à i t o á n đ ặ t r a M ụ c n à y c u n g c ấ p m ộ t v à i k ế t q u ả p h â n t í c h v ề m ặ t l ý thuyết của nghiệm tìm đƣợc nhƣ tốc độ hội tụ, giới hạn của các tham số khi xácđịnh nghiệm, so sánh nghiệm tìm đƣợc với nghiệm tìm đƣợc bằng các thuật toánkhác.

Mệnhđề2.1.Vớimọigiátrịcủabộthamsố b 1 ,b 2 ,b 3 ,từcôngthứcnghiệmtrong(2.61)ta có: b  t   1  b  t  b  t    b  t  

3 d kj u kj   1 3 d kj 2 kj  k 3 d kj u kj ,j1,C ,k1,N z 3  z 3 z 1  z 1 z 3  z 3  z 2  z 2  2 z 3  z 3 (2.63)

Khi so sánh nghiệm tìm được theo phương pháp thỏa dụng mờ với nghiệmtìmđượctheophươngphápnhântửLagrange,xétbàitoántốiưu(2.32) -(2.33)tacó thể nhận thấy rằng nghiệm nhận được từ phương pháp Lagrange là nghiệm tốiưucụcbộ,từđó cácmệnh đềsau đƣợcchứngminh:

Mệnh đề 2.2.Nghiệm tối ƣu của bài toán tối ƣu đa mục tiêu (2.32), (2.33)đã chođƣợcxácđịnhtheo công thức (2.64)-(2.66):

Chỉ số IFV [64] được dùng để đánh giá nghiệm theo phương pháp thỏa dụngmờ (FS) và phương pháp Lagrange (LA) Theo chỉ số này, nghiệm nào có giá trịIFVcaohơnsẽlànghiệmtốthơn.Cụthể,côngthứctínhchỉsốIFVnhƣsau:

Ký hiệu IFV (LA) là giá trị của chỉ số IFV của nghiệm tối ưu dùng phương phápLagrange và tương ứng cho nghiệm theo phương pháp thỏa dụng mờ là IFV (FS) Theo côngthức (2.67) ta có:

 N    u m    kj u kj u kj x k v  k  1 , j  N    u m  kj u kj u kj k  1

  1  k j kj 2   logC  1  log kjkj 2    SD max ,

(2.71) Đểxácđịnhsựsaikhácgiữa2giátrịIFVcủa2nghiệmtheo2phươngpháp,vớigiảthiếtởb ổđề2.3 nhƣsauđƣợcđƣara.

Bổđề 2.3.T r o n gp hƣ ơn g phápLa gr an ge , thamsố

 k đƣợcxácđịnhtheocông thức(2.74).Do đó,đểsosánhnghiệmLagrangevớinghiệm thỏadụngmờ,cá cthamsố b 1 ,b 2 , b 3  đƣợcchọnthỏamãn:

Vớimọi j 1,C,k1,N Địnhlý2.1.Vớicácgiátrịtrongbộthamsố b 1 ,b 2 ,b 3 c h o trướcthỏamãncácđiềukiệntr ongbổđề 2.3ta có:

Dođó:  LA   FS  1 1 SD maxC

Tính chất 2.3.Các nghiệm tối ƣu của bài toán (2.32)-(2.33) nhận đƣợc theophươngphápthỏadụngmờvớiđộđoIFVlàtốthơnnghiệmtốiưunhậnđượctheophương phápLagrangevớiđộđo IFV.

IFV  FS   0  IFV  LA  IFV  FS  Điều này có nghĩa là, với một số điều kiện nhất định nghiệm tối ƣu nhậnđược theo phương pháp thỏa dụng mờ là tốt hơn nghiệm tối ưu nhận được theophương pháp Lagrange.

Giá trị mà chỉ số IFV có thể nhận đối với nghiệm nhận đƣợc theo phươngpháp thỏa dụng mờ tại bước lặp thứ t được chỉ ra bằng các xác định cận dưới vàcậntrêncủaIFVnhưsau. Địnhlý2.2(GiớihạnchỉsốIFV)CậndướicủagiátrịchỉsốIFVđốivớinghiệm tốiưu u  u (t) t h e ophươngphápthỏadụngmờđượcđánhgiábởicôngthức:

2 kj kj kj kj kj kj kj

Vớicácthànhphầnnghiệmu kj đƣợctínhtheocôngthức: b 3 z z d kj u kj   k 2 b 3 zz d kj u kj   k 2 u (r)  3 3 1,j1,C,k1,Nlog 3 3  0 kj  b b  b 2  b b  b

 FS  1 SD max 1   2 C   N   z 3  z 3 3 d kj u kj

C  D C  2 Định lý 2.2 mới xét đến cận dưới của chỉ số IFV, cận trên của chỉ số này sẽ đượcxác định trong định lý 2.3 dưới đây Để đánh giá được cận trên, ta định nghĩa giớihạnLnhƣsau:

Bổđề2.4.Vớimọigiátrịcủabộthamsố b 1 ,b 2 , b 3  ,taluôncó: b 3 du   k  b 3 du   k 

DễdàngnhậnđƣợcbấtđẳngthứcdựavàotínhchấtcủahàmLogarit. Định lý 2.3.Cận trên của chỉ số IFV đối với nghiệm tối ƣu nhận đƣợc theophươngphápthỏadụngmờđượcđánhgiátheocôngthức:

-Giảsửrằngb 2 làmộthằngsốkhác1,tacóthểbiểudiễnb 1 vàb 3 dướidạng: b 1  1b 2  b 3 ,0b 1 ,b 2 , b 3  1,b 2  1,b2=hằngsố (2.80) Trongtrườnghợpnày,theo(2.80),tacóthểbiểudiễnb3quab2nhưsau: b 3 z z d kj u kj   k 2 1

 z d kj u kj  2  log2C  N  z  z  z  z  z  z d kj  z  z  kj

2 trongcôngthức(2.81)bằngcôngthức(2.82)vàcáckýhiệuđƣợcxác địnhnhƣtrong(2.83),tacó:

HbGb  j  1 B kj 3 b  G kj 2 b  F kj P d kj kj3 kj2 0

Bb  Gb  F kj3 Bb  Gb  F kj2 j  1 kj3 kj2 kj j  1 kj3 kj2 kj

 Bb  Gb F 1 P Bb  Gb  Fz z

 j  1 kj3 kj2 kj  j  1 kj3 kj2 kj1 1

 j  1 kj3 kj2 kj j  1 kj3 kj2 kj 

Bb  Gb  F 2 Bb  Gb  F kj j  1 kj3 kj2 kj j  1 kj3 kj2 kj

 BbGbF P0 j  1 kj3 kj2 kj

Bb kj3  Gb kj2  F kj kj kj kj j1

PGb kj2  M  FP kj kj

Với các giả thiết nhƣ trong công thức (2.83), giá trị củab 3 thuộc vào đoạn [0, 0.2].Tươngtựvớicáctrườnghợpkhácmàvaitròcủab 2 đượcthaylầnlượtbằngb 1 ,b 3 (xem như các hằng số) thì giá trị củab 1 đƣợc xác định trong đoạn [0.1, 0.4] và giátrị củab 2 đƣợc xác định trong đoạn [0.3, 0.7] Các chú ý này có vai trò trợ giúptrong việclựachọngiátrịthích hợpcho các thamsốcủa thuậttoán.

Sự khác nhau về nghiệm nhận đƣợc từ 2 lần lặp liên tiếp trong quá trình thực hiệnthuật toán đƣợcđánhgiásửdụng cáckýhiệu:

C Định lý sauđâythểhiệnsựchênhlệchvềnghiệmgiữa2lần lặpliên tiếp. Địnhlý2.4.Khicácthamsốcủalầnlặpthứrvàthứr+1đượcxácđịnhtương ứngl à

1 2 3 1 2 3 nghiệmtốiưutìmđượctrong2lầnlặpliêntiếpnàyđượcđánhgiábởicôngthức: kj kj kj kj

  d  2 u  du   u  kj r1   u  r  kj   kj kj1  kjk j k j 2  

2 kj kj kj kj kj kj

Kếth ợ p ( 2 8 7 ) và ( 2 8 9 ) , tan hậ n đ ƣ ợ c kết q u ả tr on g c ô n g t h ứ c ( 2 8 6 ) c ầ n t ìm

Từ nội dung đƣợc trình bày trong mục 2.3.1 và 2.3.2, thuật toán mới đề xuấtcó mộtsố ƣuđiểmsau:

-Thuật toán tìm được nghiệm cho bài toán tối ưu đa mục tiêu bằng phươngpháp thỏa dụng mờ Không giống như các phương pháp truyền thống sử dụngLagrange, thuật toánmớiđ ề x u ấ t c h i a n h ỏ b à i t o á n t h à n h c á c b à i t o á n c o n r i ê n g biệt với các hàm mục tiêu cụ thể cho từng bài toán và giải quyết các bài toán connày trước khi giải bài toán tổng hợp Hiệu quả của phương pháp là đánh giá đượcbằng lý thuyết (trình bày trong mục 2.3.2) chất lượng phân cụm của thuật toán sửdụngphươngphápthỏadụngmờtốthơnsovớisửdụng phươngphápLagrange.

- Thuật toán mới đã đƣợc trang bị với những phân tích lý thuyết chặt chẽ.Nhiều định lý và các mệnh đề đã đƣợc chứng minh Các kết quả lý thuyết giúpchúng ta hiểu rõ hơn về thuật toán mới và có cơ sở để đƣa thuật toán vào thựcnghiệm.

- Chất lƣợng phân cụm của thuật toán mới (SSFC-FS) là tốt hơn so với cácthuật toán sử dụng Lagrange (SSFC-SC) thông qua độ đo IFV (đã nêu và chứngminh ởđịnhlý2.1).

Xácđịnhthôngtinbổ trợphùhợpchothuậttoánSSFC-FS

Mục2.3đãtrìnhbàyphâncụmbángiámsátmờsửdụngthôngtinđặctrƣngkhông gian. Trong đó có một yếu tố rất quan trong của phân cụm bán giám sát mờlà việc xác định thông tin bổ trợ Do vậy để khắc phục các nhƣợc điểm của phần2.3,phầnnàyđưaraphươngphápxácđịnhthôngtinbổtrợphùhợpchothuậttoánSSFC-FS. Nội dung mục này bao gồm thuật toán SSFC-FSAI đƣợc trình bày trongmục 2.4.1; một tập các ma trận độ thuộc đƣợc xác định trước cho ảnh nha khoađƣợcđềxuấttrong2.4.2vàmục2.4.3môtảmộtthủtụcđểlựachọnmộtmatrận

CSDLvề các thông tin bổ trợ y dựng thông tin bổ trợ

Trích chọn đặc trƣng Phân đoạn ảnh bằng phương pháp FCM Ảnh đầu vào và các tham số Ảnh phân đoạn

Phân cụm bán giám sát mờ sử dụng thông tin đặc trƣng không gian

(SSFC-SC) Chọn thông tin bổ trợ thích hợp nhất

Xác định thông tin bổ trợ độ thuộc phù hợp nhất cho một ảnh đầu vào nhất định; cuối cùng, một số ƣu điểmcủathuật toán đƣợcđƣaratrong mục2.4.4.

Hình 2.7 minh họa cơ chế chính của thuật toán SSFC-FSAI Dữ liệu đầu vào củathuật toán này là một ảnh X-quang nha khoa Ảnh này đƣợc phân cụm theo thuậttoánFCMvàsauđóđƣợctríchchọncácthôngtinđặctrƣng.Từnhữngkếtquảđạtđƣợc, một ma trận độ thuộc được xác định trước phù hợp và các thông số của nóđược tính tự động cho từng ảnh nha khoa đầu vào Hàm lựa chọn thông tin bổ trợnày sau đó đƣợc sử dụng để tính toán các kết quả đầu ra cuối cùng của mô hìnhphân cụm bán giám sát mờ (sẽ đƣợc trình bày trong mục 2.4.2 dưới đây) Các ảnhphânđoạnđượcđánhgiátheonhữngtiêu chíkhácnhau.

Trongđóx j là dữliệucủa điểmảnhthứj,v i là tâmcủa cụmthứi u   Gau jk ,   0,1 , j1,C,k1,N jk C

 Gau ik  min Gau ik  i1 i1,C

Vớia,blà cácthamsố,x j :là dữliệucủa điểmảnhthứj,v i là tâmcủa cụmthứi. u   B kj ,   0,1 , j1,C,k1,N kj C

Vớithamsốa,dữliệucủa điểmảnhthứjlàx j ,là tâmcủa cụmthứilàv i u   S kj ,   0,1 , j1,C,k1,N kj C

Trongđóx j là dữliệucủa điểmảnhthứj,v i là tâmcủa cụmthứi

 Sin ki  mi n  Sin ki  i1 i1,C

Trongđóx j là dữliệucủa điểmảnhthứj,v i là tâmcủa cụmthứi u   GD kj ,   0,1 , j1,C,k1,N kj C

 GD ki  mi n  GD ki  i1 i1,C

Trongđóx j là dữliệucủa điểmảnhthứj,v i là tâmcủa cụmthứi u   F kj ,   0,1 , j1,C,k1,N kj C

Vớithamsốa,dữliệucủađiểmảnhthứjlàx j ,là tâmcủa cụmthứilàv i u   T kj ,   0,1 , j1,C,k1,N kj C

  u2 khi ukj max i1,C  uki  u kj   ,   0,1 , j 1,C,k

  ukj khi ukj max i1,C  uki  u kj   ,    0,1  , j 1,C,k

2.4.3 Xácđịnhhàm thôngtinbổtrợphùhợp cho ảnhnhakhoa Đểxácđịnhmatrậnđộthuộcphùhợpnhấtvớimỗiảnhnhakhoađãcho,cácbướccủathuật toánthựchiện nhƣsau:

- Bước 2:Tính toángiá trị của chỉ số IFV đƣợc xác định nhƣ trong công thức(2.67)-(2.69).

2.4.2 có giá trị IFV lớn nhất Ví dụ xét hàm Gauss trong côngthức(2.91)-(2.92),tính đạohàmbậcnhấtcủa IFVtheo :

  max    2u kj  kj   logC   logu kj  

Giảsửdùng côngthức(2.92)khi đó tacó

  2 C  N  2  u kj Bj log2 Bj log2 ln2 

  2  C   N u2   1   B  log   1    B log      1  kj   ln2  j 2 ln2  j 2   ln2  j1  k1     

 2 1 0,  2 2 0 (2.113) Điềun à y c ó n g h ĩ a l à , v ớ i g i á t r ị =  2 thìc h ỉ s ố I F V đ ạ t c ự c đ ạ i c ò n k h i =  1 , chỉsốIFVđạtgiátrịcực tiểu.Haygiátrị cần tìmlà:

- Bước 4:Chọn ma trận độ thuộc này và các giá trị tham số của nó nhƣ là mộthàmbổtrợ.

Ví dụ 2.5.Xét một ảnh cỡ 3x3 với 9 điểm ảnh, tại mỗi điểm ảnh có các giá trị màutương ứng, giả sử giá trị màu xác định như (Hình 2.8) tại mỗi dòng tương ứng với1 điểmảnhcócácvéc tơmàu tươngứng.

Hình2.8.Minh họacácgiátrị màu củaảnh

Vớiảnh3x3taxácđịnhđƣợcmatrậntrọngsốđƣợctríchchọnđặctrƣngcủatừngđiểmảnh,cácgi átrịnàyđƣợcxácđịnh(Hình 2.9).

Hình2.9.Giátrịđặctrƣngcủatừngđiểmảnh ÁpdụngthuậttoánFCMđểphânđoạnảnhnàytanhậnđƣợccáctâmcụmvàmatrậnđộ thuộcthểhiện(hình 2.10) trongcácbảngdướiđây:

Hình 2.10.Giá trị tâm cụm và độ thuộc sau phân cụm bằng thuật toán

Bảng 2.10.Cácgiátrị củaIFVđểchọnhàmbổ trợthích hợpnhất

Kếtluận

Chương 2 đã trình bày các thuật toán phân cụm bán giám sát mờ trong phânđoạn ảnh nha khoa Cụ thể là các thuật toán: phân cụm mờ bán giám sát lai ghép;phân cụm mờ bán giám sát mờ có sử dụng các thông tin đặc trƣng không gian củaảnh nha khoa (SSFC-SC); sử dụng phương pháp giải tối ưu bằng thỏa dụng mờcho phân cụm bán giám sát mờ có sử dụng các thông tin đặc trƣng không gian củaảnh nha khoa (SSFC-FS);cuối cùng là cách xác định thông tin bổ trợ thích hợpnhất chothuậttoánSSFC-FS(SSFC-FSAI).

Trong chương 2 của luận án, tác giả đã trình bày các thuật toán phân cụmbán giám sát mờ trong phân đoạn ảnh Để kiểm nghiệm các thuật toán trên, các kếtquả thực nghiệm sẽ được trình bày trong chương này Cụ thể như sau: dữ liệu chothực nghiệm là các ảnh nha khoa thu thập trong giai đoạn 2014-2015 tại bệnh việntrường Đại học Y Hà Nội được cài đặt trên các thuật toán phân cụm bán giám sátmờ lai ghép (eSFCM-Otsu), thuật toán phân cụm bán giám sát mờ dựa trên đặctrƣng không gian (SSFC-SC), thuật toán phân cụm bán giám sát mờ kết hợp vớiphương pháp thỏa dụng mờ (SSFC-FS), thuật toán phân cụm bán giám sát mờ cólựa chọn thông tin bổ trợ (SSFC-FSAI) và các kết quả đƣợc thể hiện dưới dạng sốvà bảng Các kết quả này đã chứng tỏ những đề xuất và cải tiến đƣợc trình bàytrong luận án có hiệu năng và độ chính xác cao hơn các thuật toán có liên quanđƣợcđềxuấtbởicáctácgiảkhác.Việcđánhgiáđƣợcthựchiệnquagiátrịcủacácđộđoph âncụm.

Mô tả dữliệuảnhX-quang nha khoa

Bộ dữ liệu bao gồm 66 ảnh X-quang nha khoa (các ảnh trình bày trong phụ lục1) đƣợc chụp từ máy chụp X-quang VATECH tại Bệnh viện Đại học Y Hà Nội,ViệtNamtrongkhoảng2014–

Giớitính của bệnhnhân Tuổi củabệnh nhân

Trong mỗi nhóm, các ảnh này có cả ảnh toàn cảnh và ảnh từng phần (gọi làảnh chóp) Trong hình 3.1, ảnh chóp là các ảnh 3.1a, 3.1b, 3.1c, 3.1d và ảnh toàncảnh là ảnhtrong3.1e.

Các ảnh X-quang có trong bộ dữ liệu đều là các ảnh chi tiết của răng. Dựavào đó, các nha sĩ có thể kiểm tra sâu răng, sức khỏe răng miệng nói chung và theodõiquátrìnhpháttriểncủarăngcũngnhưsứckhỏetổngthểcủanướuvàhàm.

Từ các ảnh X-quang nha khoa, 5 đặc trƣng cơ bản đƣợc trích chọn (sẽ đượctrình bàytrongmục3.1.2dướiđây). a.Ảnhgãychânrang b.Ảnhrăngmọcngầm c.Ảnh sâu rang d.Ảnh thiếurang e.Ảnhtiêuxươngquanhrang

Cácđ ặ c t r ƣ n g c ủ a t ừ n g đi ểm ảnhn h a khoađ ã đ ƣ ợ c t r ì n h bà ytrong m ụ c 2.2.2 Đặc trƣng của toàn bộ ảnh đƣợc xác định là trung bình cộng của đặc trƣngcácđiểmảnhthuộc ảnhđangxét.

Bằng việc trích chọn các đặc trƣng cơ bản, ta có bộ dữ liệu đặc trƣng của 66ảnh Bảng 3.2 và 3.3 trình bày các thống kê của từng đặc trƣng trong tất cả các ảnhthuộccơsở dữliệuảnhnha khoa.

LBP-M EEI-M RGB-M GRA-M Pat-M Nhóm bệnh

Bảng3.3.Thống kêcácảnh trongtoànbộdữliệuảnh X-quang. Đặctrƣng Kỳ vọng Độlệch Giátrịlớn nhất

Độđovàtiêuchíđánhgiákếtquả

Mục đích: Các độ đo đƣợc sử dụng để đánh giá độ chính xác của các thuật toánphân đoạn ảnh Từ đó tìm ra các giá trị thích hợp nhất cho các tham số cho phânđoạn các ảnh nha khoa Trong phần cài đặt thực nghiệm, luận án sử dụng các độ đophân cụmsau:

 Độ đo Davies-Bouldin(DB) [64]: có liên quan đến tiêu chuẩn tỷ số phươngsai, dựa trên tỷ số giữa khoảng cách bên trong nhóm và khoảng cách bênngoài nhóm Đặc biệt, chất lƣợng của phân cụm đƣợc xác định bởi côngthứcsau: k

Trongđó d l , d m làkhoảngcáchtrungbìnhcủacáccụmlvàmtươngứng, d l,m là khoảng cách giữacáccụmnày.Cụ thể: d 1

 ĐộđoPBM[64]:dựatrênkhoảngcáchcủacáccụmvàkhoảngcáchgiữac áccụmvới nhau.Độ đoPBMđƣợctínhtoántheocông thức:

RõrànglàtrongđộđoPBM,giátrịcàngcaothìhiệunăngcủathuậttoáncàng cao Do đó, phân hoạch tốt nhất nhận đƣợc khi PBM đạt giá trị cao nhất Điều nàyxảyrakhiDkđạtcựcđạicònEKđạtcực tiểu.

Giátrị củaIFVcàng lớn thì thuậttoán cànghiệu quả.

 Độ đo BH (Ball and Hall index) [64]: đƣợc dùng để đo tổng khoảng cáchbên trong nhóm Giá trị của BH càng lớn thì hiệu năng của thuật toán càngcao.Độđo BHđƣợctínhtheocôngthức

 Độ đo CH (Calinski-Harabasz index) [64]: đƣợc dùng để đánh giá chấtlượng của phân hoạch dữ liệu bằng tỷ số tương quan giữa các ma trận củacác nhóm và trong một nhóm Giá trị của VCR đƣợc tính theo công thứcsau:

(3.15) trace(W)  k trace(W); trace(W)  r   , l l x ip x lp l1 p1x i  C l

(3.17) r N 2 trace(B)trace(T)trace(W), trace(T)  p1i1  x ip  x p 

Giátrị củaCHcàng lớn càng tốt.

 ĐộđoBR (Banfeld-Raftery) [64]:làmộtđộđosử dụng ma trậnhiệpphươngsaicủamỗicụm.Độđonàyđượcxácđịnhtheocôngthức

Trongđó n kl à sốcác điểmdữliệutrongcụmk.Nếu n 1thìgiátrịcủaTr(WG {k} ) bằng0vàkhi đóthuậttoánkhông xácđịnh Giátrịcủa độđoB R càngnhỏthì thuậ t toán tươngứngcàngtốt. k Tr  WG k  

 ĐộđoDL(Difference-likeindex)[64]: làđộđođƣợcxácđịnhnhƣcông thức(3.21)dướiđây,trongđó trace(W) đượctínhnhưtrongphươngtrình (3.16).Giátrịcủađộđonàycànglớncàngtốt.

Cáckếtquảsosánhphânđoạnảnh

Dựa trên bộ dữ liệu về ảnh X-quang nha khoa, các thuật toán đƣợc đề xuấttrong các chương 2 (thuật toán eSFCM-OTSU, SSFC-SC, SSFC-FS, SSFC- FSAI)với các thuật toán có liên quan (FCM [10], OTSU [43], eSFCM [69]) đƣợc cài đặtthực nghiệm cùng với các thuật toán xử lý ảnh và các thuật toán phân cụm mờ cóliênquan.Cácđộđođượctínhtoántrongmỗitrườnghợpđểcósựsosánhvềhiệunăng của các thuật toán Các kết quả lần lượt sẽ được trình bày trong các mục3.3.1,3.3.2dướiđây.

Theo các kết quả trong phụ lục 2, thuật toán SSFC-FS có giá trị độ đo tốtnhất trong hầu hết các trường hợp (đạt giá trị tốt nhất tại 4 trong 8 tiêu chuẩn đánhgiá) trong toàn bộ cơ sở dữ liệu Trong 4 tiêu chuẩn kém hơn, của, các giá trị IFVcủaS S F C - F S v ẫ n l u ô n c a o h ơ n c ủ a t h u ậ t t o á n S S F C -

S C Đ i ề u n à y k h ẳ n g đ ị n h rằng chất lƣợng phân cụm của thuật toán SSFC-FS là tốt hơn của thuật toán SSFC- SCnhƣđãđƣợcchứngminhtrongmệnhđề2.1vàtínhchất2.3. Để có cái nhìn toàn cảnh trên bộ dữ liệu6 6 ả n h t h a y v ì x e m x é t t r ê n t ừ n g ảnh riêng lẻ, kỳ vọng và phương sai của các giá trị tương ứng với từng độ đo trênmỗithuậttoánđượctínhtoánvàđưavàobảng3.4dướiđây.

Bảng3.4.Cácgiátrịkỳvọngvàphươngsaicủacácthuậttoán(Giátrịin đậmchỉ ragiátrị tốtnhất của mỗiđộđo)

Thuật toán FCM OTSU eSFCM eSFCM-

Otsu SSFC-SC SSFC-FS SSFC-

Sốlần tốthơn FCM OTSU eSFCM eSFCM

DL 1.33 2.79 1.27 1.45 1.15 1.00 1.16 Để so sánh một cách định lƣợng các giá trị độ đo giữa các thuật toán đãđƣợc trình bày ở bảng 3.5, giá trị tốt nhất trên mỗi dòng đƣợc ghi là 1 từ đó tínhtoán sốlầnmà thuật toán tốt nhấttốt hơncác thuật toáncòn lạit r ê n c á c d ò n g tươngứngvớitừngđộđo.Kếtquảthốngkêđượctrìnhbàytrongbảng3.5.

(e)Phân cụmbằng eSFCM-OTSU (f)PhâncụmbằngSSFC-SC

Kết quả phân cụm trên bộ dữ liệu ảnh X-quang nha khoa đƣợc minh họanhƣtronghình3.2.

Phương pháp xác định giá trị các tham số (số cụm và giá trị ) thích hợp nhất với các ảnh đầu vào theo nghĩa thuật toán SSFC-SC đạt hiệu năng cao nhất.Trong mục 3.3.1, số cụm đƣợc cố định là C = 3 và giá trị = 0.9 Để biết rõ sự thay đổi của thuật toán SSFC-SC theo các tham số này, các kết quả thực nghiệmtrênbộdữliệuảnhnhakhoavớicácgiátrị thay đổiđƣợctrìnhbàyởBảng3.6.

Bảng3.6.Giátrịđộđokhithựchiện thuậttoánSSFC-SCvới C=3 vàgiátrị

Rõ ràng là khi giá trị của càng lớn, nghĩa là thông tin bổ trợ đƣợc sử dụng càng nhiều thì hiệu năng của thuật toán SSFC-SC cao hơn Do đó, một chú ý khilựa chọn giá trị là giá trị càng lớn càng tốt Giá trị tốt nhất là  = 0 9 Đ ể x á c nhận điều này, thuật toán SSFC-SC được cài đặt thực nghiệm trên cùng bộ dữ liệuvới trường hợp trước chỉ thay số cụm C =5 cùng với thay đổi Kết quả của thực nghiệmnàyđƣợc thểhiệntrong Bảng3.7.

Bảng3.7.Giátrịđộđokhithựchiện thuậttoán SSFC-SCvới C=5vàgiátrị

Có thể thấy rằng, đối với thuật toán SSFC-SC, các giá trị nhỏ của bộ tham số(m,C) cho hiệu năng cao hơn mặc dù thuật toán này vẫn có kết quả tốt hơn các thuậttoán khác trong những trường hợp giá trị của các tham số này là chưa tốt.Từchứng minh trong mục 2.2.4, chúng ta biết rằng, bài toán tối ƣu (2.39-2.40) là lồivàcónghiệmtốiưukhim=2.

(a)Kết quả sosánh độ đoPBM

(b) Kết quả so sánhđộđo SSWC

(e)Kếtquảso sánhđộđoCH (f)Kếtquảsosánh độđoBH (g)Kếtquảso sánhđộđoBR (h)Kếtquảso sánhđộđoDL

Hình3.3.ĐộchínhxáccủacácphươngphápphâncụmvớisốcụmthayđổiHình3.3mi nhhọasựsosánhđộchínhxáccủacácthuậttoántheosốcụm vàcácđộđo.Trongcáchình3.3,t h ể hiệngiátrịcủacácthamsốcònlạitương ứnglà  0.9 vàm=2.Việcmôtảtrựcquanbằnghình3.3cũngkhẳngđịnhcho việc chọn tham sốphù hợp, đồng thời cũng khẳng định lợi thế của thuật toán mớiđềxuất.

Các kết quả nhận được dựa trên việc thực nghiệm với các trường hợp khácnhau của bộ tham số (b1, b2, b3) với thuật toán SSFC-FS (mỗi trường hợp gọi là 1case).Việcthiếtlập cáccasecủabộ thamsố (b1,b2,b3)nhƣsau:

C=3 Case1 Case2 Case3 Case4 Case5 Case6

C=5 Case1 Case2 Case3 Case4 Case5 Case6

C=7 Case1 Case2 Case3 Case4 Case5 Case6

Bảng 3.9.Giá trị trung bình của thuật toán SSFC-FS với các bộ tham số(Giátrịinđậmchỉragiátrị tốtnhấtcủa mỗiđộđo)

Case1 Case2 Case3 Case4 Case5 Case6

Trong bảng 3.8 và bảng 3.9, kết quả chỉ ra thấy thuật toán SSFC-FS phù hợpvớicase3(b2>b1>b3):(b1=0.3,b2=0.6,b3=0.1).

Thựcn g h i ệ m c ũn g c h ỉ r a , c á c g i ớ i h ạ n d ƣ ớ i c ủ a I F V c h ỉ s ố c ủ a c á c g i ả i pháp tối ưu được nêu trong mục 2.3 là hoàn toàn chính xác thông qua sáu trườnghợp trong kiểm tra bảng 3.8 và bảng 3.9 Các kết quả đƣợc tính toán thực tế nhƣsau:

Case1:IFV.78> 1  SD max   logC  2

Case2:IFV.65> 1  SD max   logC  2 =5.43.

Case3:IFV0.62> 1  SD max   logC  2

Case4:IFV2.63> 1  SD max   logC  2

Case5:IFV3.53> 1  SD max   logC  2 =6.88.

Case6:IFV4.76> 1  SD max   logC  2

Trong bảng 3.10, chỉ ra kết quả so sánh tính toán trên cơ sở lý thuyết và thựcnghiệm về giá trị trung bình của độ đo IFV thực hiện thuật toán SSFC-SC Kết quảnàythể hiện việctínhtoánlýthuyết và thựcnghiệmgần xấpxỉnhau. Để so sánh thuật toán đƣợc đề xuất SSFC-SC với các thuật toán có liênquan, các kết quả được trình bày ở trên được thể hiện dưới dạng đồ thị như Hình3.3.

C=3 Case1 Case2 Case3 Case4 Case5 Case6

C=5 Case1 Case2 Case3 Case4 Case5 Case6

C=7 Case1 Case2 Case3 Case4 Case5 Case6

Ứngdụng phânđoạnảnhtronghỗtrợchẩnđoánbệnhnhakhoa

Chẩn đoán bệnh luôn đóng một vai trò quan trọng trong nha khoa. Trongchẩn đoán các bệnh nha khoa, thì ảnh X-quang chính là một tƣ liệu quan trọng, nógiúp nha sĩ dựa vào đó có thể kiểm tra, phân tích, và tìm ra những bệnh mà nếu chỉnhìn bằng mắt thường sẽ khó xác định Thực tế, kinh nghiệm và trình độ của cácbác sĩ là khác nhau cũng có thể dẫn đến các kết quả khác nhau và chƣa hoàn toànđảmbảochínhxác.

Khi không có các hệ hỗt r ợ c h ẩ n đ o á n t h ì c á c b á c s ĩ p h ả i x e m x é t t o à n b ộ ảnh và các thông tin từng phần rồi tìm kiếm xem vùng nào có khả năng mắc bệnh.Khi có các hệ hỗ trợ chẩn đoán thì các hệ hỗ trợ đã đƣa ra trợ giúp việc tìm kiếmxem vùng nào có khả năng mắc bệnh và bệnh nào có thể mắc sau đó bác sỹ chỉ cầntập trung vào vùng đó và kiểm tra lại xem chẩn đoán đó có đúng hay không để đƣaraquyếtđịnhcuốicùng.

Trong thực tế việc chẩn đoán chính xác bệnh thì nha sĩ cần các thông tin thuthập một loạt các thông tin khác nhau từ quá trình thăm khám, qua ảnh X-quang vàtừ các xét nghiệm Trong ứng dụng này luận án chỉ dừng lại việc hộ trợ chẩn đoánnhakhoasửdụngkhaitháccácthôngtin ảnhX-quanh nhakhoa.

Việc ứng dụng chẩn đoán bệnh nha khoa có thể sử dụng suy diễn mờ với tậpcơ sở dữ liệu ảnh Tuy nhiên phương pháp này vẫn còn một số nhược điểm như:một ảnh có thể mắc nhiều bệnh khác nhau (lai ghép giữa các bệnh mà trong cơ sởdữ liệu mẫu không có) khi đó chẩn đoán đƣợc một bệnh hoặc không phát hiện hếtcác bệnh, kết quả suy diễn đạt hiệu suất chƣa cao, chƣa đi sâu vào từng khu vực.Khi đó trong phần này có đề xuất một môn hình sử dụng ảnh phân đoạn để hỗ trợchẩn đoánbệnhnhakhoa.

Trong hệ thống chẩn đoán nha khoa (DDS: Dental Diagnosis System) thểhiện trong hình 3.4, khi đó cơ sở dữ liệu ảnh nha khoa mẫu đƣợc xây dựng là tậphuấn luyện tạo dựng thành kho dữ liệu để sử dụng cho việc chẩn đoán bệnh về sau.Một ảnh đầu vào từ tập dữ liệu kiểm tra được đưa vào hệ thống DDS và sau đóđược phân tích bằng phương pháp trích chọn đặc trƣng nha khoa để có đƣợc biểudiễn đặc trƣng (mục 2.2).Sau đó, sử dụng thuật toán SSFC-FS nhằm phân loại cácảnhđầuvàodựatrêncácđặctrƣngkhônggiancủaảnhnhakhoađểphânthành các phân đoạn, từ đó đƣa ra các vùng có thể có bệnh Từ những phân đoạn này,chúng tôi chỉ giữ lại những phân đoạn có khả năng mắc bệnh để tiến hành chẩnđoán Đối với một phân đoạn ảnh xác định cho trước sử dụng các ảnh trong cơ sởdữ liệu ảnh mẫu để chuẩn đoán xem vùng này có bị bệnh không, nếu bị bệnh thìbệnhđólàbệnhgì.Khiđóphânđoạnlàmộtđỉnhcủađồthịvàmỗiảnhtrongcơsở dữ liệu mẫu cùng là 1 đỉnh của đồ thị dựa mối quan hệ đặc trƣng giữa các ảnhhoặc vùng xây dựng nên các cạnh của đồ thị (trong trường hợp tất cả đều có quanhệvới cácđặctrưngkhácnhau sẽtạo lênmột đồthịđầyđủ).

Tổng hợp bệnh của ảnhxácđịnhtừcácphânđoạ n

Phân cụm sử dụng APC+

Biểu diễn bằng đồ thị Lƣợng tử hóa

Bảng tổng hợp bệnh của các phân đoạn i=i+1

Sai i > C1 Đúng Ảnh X- quang nha khoa, các tham số

Phân đoạn ảnh sử dụng phương pháp SSFC-FS tạo ra C* phân đoạn Trích chọn đặc trƣng nha khoa

Trích chọn đặc trƣng của phân đoạn thứ i

Cơ sở dữ liệu ảnh mẫu i=1 Tạo C1 (C1

Ngày đăng: 31/08/2023, 07:42

HÌNH ẢNH LIÊN QUAN

Bảng 1.2.Thuậttoánphân cụmbán giámsát mờchuẩn Input TậpdữliệuXgồm Nphầntử,sốcụm C,matrận - 0874 nghiên cứu một số phương pháp phân cụm bán giám sát mờ trong phân đoạn ảnh nha khoa luận văn tốt nghiệp
Bảng 1.2. Thuậttoánphân cụmbán giámsát mờchuẩn Input TậpdữliệuXgồm Nphầntử,sốcụm C,matrận (Trang 35)
Bảng 1.3.Thuậttoánphâncụmbán giámsátmờtheoquytắcentropy Input Tậpd ữ l i ệ u X g ồ m N p h ầ n t ử , s ố c ụ m C , đ ộ t h u ộ c b ổ t r ợ U , - 0874 nghiên cứu một số phương pháp phân cụm bán giám sát mờ trong phân đoạn ảnh nha khoa luận văn tốt nghiệp
Bảng 1.3. Thuậttoánphâncụmbán giámsátmờtheoquytắcentropy Input Tậpd ữ l i ệ u X g ồ m N p h ầ n t ử , s ố c ụ m C , đ ộ t h u ộ c b ổ t r ợ U , (Trang 37)
Bảng 1.4.Thuậttoánphân cụmbán giámsát mờ Input TậpdữliệuXgồmNphầntử,sốcụmC,độthuộcbổtrợ U ,ngƣỡng - 0874 nghiên cứu một số phương pháp phân cụm bán giám sát mờ trong phân đoạn ảnh nha khoa luận văn tốt nghiệp
Bảng 1.4. Thuậttoánphân cụmbán giámsát mờ Input TậpdữliệuXgồmNphầntử,sốcụmC,độthuộcbổtrợ U ,ngƣỡng (Trang 38)
Bảng 2.2.Thuậttoánphân cụmbángiámsát mờlaighép - 0874 nghiên cứu một số phương pháp phân cụm bán giám sát mờ trong phân đoạn ảnh nha khoa luận văn tốt nghiệp
Bảng 2.2. Thuậttoánphân cụmbángiámsát mờlaighép (Trang 50)
Bảng 2.3.Matrậnđộthuộccuối cùng củaFCM - 0874 nghiên cứu một số phương pháp phân cụm bán giám sát mờ trong phân đoạn ảnh nha khoa luận văn tốt nghiệp
Bảng 2.3. Matrậnđộthuộccuối cùng củaFCM (Trang 58)
Hình 2.7 minh họa cơ chế chính của thuật toán SSFC-FSAI. Dữ liệu đầu vào củathuật toán này là một ảnh X-quang nha khoa - 0874 nghiên cứu một số phương pháp phân cụm bán giám sát mờ trong phân đoạn ảnh nha khoa luận văn tốt nghiệp
Hình 2.7 minh họa cơ chế chính của thuật toán SSFC-FSAI. Dữ liệu đầu vào củathuật toán này là một ảnh X-quang nha khoa (Trang 88)
Bảng 2.10.Cácgiátrị củaIFVđểchọnhàmbổ trợthích hợpnhất - 0874 nghiên cứu một số phương pháp phân cụm bán giám sát mờ trong phân đoạn ảnh nha khoa luận văn tốt nghiệp
Bảng 2.10. Cácgiátrị củaIFVđểchọnhàmbổ trợthích hợpnhất (Trang 93)
Bảng 3.1.Thông tinvềcácnhómbệnhnhân - 0874 nghiên cứu một số phương pháp phân cụm bán giám sát mờ trong phân đoạn ảnh nha khoa luận văn tốt nghiệp
Bảng 3.1. Thông tinvềcácnhómbệnhnhân (Trang 97)
Bảng 3.8.Kếtquảthuậttoán SSFC-FSvớicácbộthamsố (b 1 ,b 2 ,b 3 ) - 0874 nghiên cứu một số phương pháp phân cụm bán giám sát mờ trong phân đoạn ảnh nha khoa luận văn tốt nghiệp
Bảng 3.8. Kếtquảthuậttoán SSFC-FSvớicácbộthamsố (b 1 ,b 2 ,b 3 ) (Trang 112)
Bảng 3.9.Giá trị trung bình của thuật toán SSFC-FS với các bộ tham - 0874 nghiên cứu một số phương pháp phân cụm bán giám sát mờ trong phân đoạn ảnh nha khoa luận văn tốt nghiệp
Bảng 3.9. Giá trị trung bình của thuật toán SSFC-FS với các bộ tham (Trang 113)
Bảng tổng hợp bệnh của các phân đoạn i=i+1Phân đoạn thứ i - 0874 nghiên cứu một số phương pháp phân cụm bán giám sát mờ trong phân đoạn ảnh nha khoa luận văn tốt nghiệp
Bảng t ổng hợp bệnh của các phân đoạn i=i+1Phân đoạn thứ i (Trang 117)

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w