Kết quả thực nghiệm

Một phần của tài liệu Xây dựng hệ thống tư vấn trong chuẩn đoán bệnh nha khoa từ kho dữ liệu ảnh (Trang 33 - 41)

CHƢƠNG 2 - THIẾT KẾ MÔ HÌNH HỆ TƢ VẤN CHO BÀI TOÁN

CHUẨN ĐOÁN BỆNH NHA KHOA

2.1. Mô tả bài toán

Nhƣ đã đề cập ở phần mở đầu, chuẩn đoán bệnh luôn đóng một vai trò quan trọng, và trong nha khoa cũng vậy. Trong chuẩn đoán các bệnh nha khoa, thì ảnh X- Quang chính là một tƣ liệu quan trọng, nó giúp nha sĩ dựa vào đó có thể kiểm tra, phân tích, và tìm ra những bệnh mà nếu chỉ nhìn bằng mắt thƣờng sẽ khó xác định. Thực tế, kinh nghiệm và trình độ của các bác sĩ là khác nhau cũng có thể dẫn đến các kết quả khác nhau và chƣa hoàn toàn đảm chính xác. Do vậy, việc phát triển các hệ thống hỗ trợ chuẩn đoán và điều trị dựa trên hình ảnh nha khoa là vô cùng cấp thiết.

Trong thời gian gần đây, với sự phát triển của khoa học, đã có những hƣớng nghiên cứu về xử lý hình ảnh nha khoa nhằm hỗ trợ bác sĩ, trong nghiên cứu này, tác giả đã đề xuất một hƣớng nghiên cứu mới, đó là xây dựng một hệ tƣ vấn cho

bài toán chuẩn đoán bệnh nha khoa dựa trên kho dữ liệu ảnh X-Quang.

Hình 2.1 – Quy trình hệ thống Ảnh đầu vào Ảnh đầu vào Đặc trƣng nha khoa Đặc trƣng nha khoa Dữ liệu training Dữ liệu training Dữ liệu testing Dữ liệu testing Diagnosis Results and Accuracy Diagnosis Results and Accuracy 1 1 2 2 3 3 4 4 6 6 Tập luật

Tập luật Hàm thuộcHàm thuộc

5 5 Mờ hóa Mờ hóa Giải mờ Giải mờ

- 34 -

Toàn bộ quy trình của hệ thống suy diễn mờ đƣợc thể hiện nhƣ hình 2.1. Theo luồng dữ liệu đƣợc mô tả, hệ thống sẽ gồm có 3 giai đoạn chính:

Giai đoạn 1: Tiền xử lý dữ liệu

Giai đoạn 1 gồm có 2 bƣớc: nhƣ trên hình 2.1 là bƣớc 1 và bƣớc 2

 Bƣớc 1: trích chọn đặc trƣng

a. Đầu vào: Ảnh nha khoa (mục 3.1)

b. Đầu ra: File text chứa dữ liệu đặc trƣng (mục 3.3)

c. Mô tả: ảnh nha khoa đƣợc trích chọn ra 5 đặc trƣng (mục 3.2) lƣu trữ dƣới dạng số và tập hợp dữ liệu số này đƣợc lƣu trữ dƣới dạng bản ghi và lƣu thành file text. Định dạng của bản ghi tƣơng ứng mới 1 ảnh đƣợc mô tả nhƣ sau:

Số thứ tự, <giá trị đặc trƣng 1>, … , <đặc trƣng n>, <nhãn>

 Bƣớc 2: chia bộ dữ liệu

a. Đầu vào: file text chứa dữ liệu đặc trƣng

b. Đầu ra: 2 file text với file thứ nhất là bộ training chứa 2/3 số bản ghi và bộ testing chứa 2/3 số bản ghi

c. Mô tả: bƣớc này thực hiện việc chia bộ dữ liệu thành 2 phần, một phần là bộ training sẽ đƣợc sử dụng để xây dựng cơ sở luật (mục 2.4) và bộ testing sẽ đƣợc sử dụng để thử nghiệm độ chính xác của mô hình suy diễn.

Giai đoạn 2: Xây dựng mô hình suy diễn

Giai đoạn 2 theo hình 2.1 sẽ là bƣớc 3 sử dụng FCM

 Bƣớc 3: Tạo luật

a. Đầu vào: Bộ dữ liệu training b. Đầu ra: Bộ luật (mục 2.4)

- 35 -

c. Mô tả: tại bƣớc này, thuật toán phân cụm mờ FCM đƣợc sử dụng để tạo ra mô hình luật phục vụ mục đích suy diễn về sau. Luật đƣợc tạo ra từ dữ liệu, sau khi bỏ đi số thứ tự sẽ có dạng nhƣ sau:

<đặc trƣng 1>, <2>, <3>, <4>, <5>, <nhãn> Và dƣợc chuyển đổi thành dạng

IF <điều kiện 1> AND <2> AND <3> AND <4> AND <5> THEN <result>

 Bƣớc 4: huấn luyện tham số cho hệ suy diễn (mục 2.5, hình 2.4) a. Đầu vào: Bộ dữ liệu training

b. Đầu ra: Tham số hàm thuộc và tham số khử mờ

c. Mô tả: Tham số của khối suy diễn Sugeno cần đƣợc tối ƣu gồm có tham số hàm thuộc và tham số khử mờ. Cho tập huấn luyện qua hệ thống suy diễn, kết quả suy diễn so sánh với kết quả thật, nếu chƣa đúng thì thay đổi tham số khử mờ và cho tập huấn luện qua hệ suy diễn để thử lại đến khi kết quả không thể tối ƣu hơn đƣợc nữa thì ta tiếp tục làm tƣơng tự với tham số của hàm thuộc. Sau cùng ta sẽ có hệ suy diễn với tham số tối ƣu.

Giai đoạn 3: Ứng dụng mô hình suy diễn cho bộ testing

Giai đoạn 3 theo hình 2.1 là bƣớc 5, sau đó bƣớc 6 là cho ra kết quả a. Đầu vào: Bộ dữ liệu testing

b. Đầu ra: Kết quả và độ đo tính hiệu quả của hệ thống suy diễn (mục 3.3)

c. Mô tả: Lần lƣợt từng bản ghi không có nhãn sẽ đƣợc 2.2. Trích chọn đặc trƣng của ảnh nha khoa

Ảnh X-Quang nha khoa là ảnh đƣợc chụp bởi tia X, hình ảnh thu đƣợc là ảnh đen trắng. Bằng việc nhìn vào các ảnh X-Quang, các bác sĩ có thể phân tích và nhận

- 36 -

biết đƣợc các bệnh nhƣ: sâu răng, gãy răng, các bệnh viêm nƣớu, v.v. Đó là với thị giác của ngƣời, còn trong vấn đề thị giác máy, ta phải sử dụng các kĩ thuật xử lý ảnh. Để phân tích ảnh nha khoa, ta sử dụng 5 loại đặc trƣng đƣợc trích chọn từ ảnh X-Quang. Dữ liệu sẽ đƣợc lƣu trữ dƣới dạng tệp tin để phục vụ cho quá trình suy diễn.

2.2.1. Entropy, edge-value và intensity

a) Entropy [7]: là độ đo mức độ ngẫu nhiên của thông tin lấy đƣợc trong một phạm vi nhất định và đƣợc tính bằng công thức (2.1)

với z là biến ngẫu nhiên, p(zi) là xác xuất của điểm ảnh thứ i với i = 1, 2, ..., L (L là số lƣợng điểm ảnh).

b) Edge-value và intensity [7]: là độ đo số lƣợng thay đổi trong giá trị điểm ảnh tại một vùng (2.2) (2.3) (2.4)

với f x,y là độ dài của véc tơ gradient, b(x,y) là ảnh nhị phân và e(x,y)

intensity của ảnh X-Quang. T1 là ngƣỡng. Những đặc trƣng này đƣợc chuẩn hóa bởi công thức:

- 37 -

(2.6)

2.2.2. Local Binary Patterns – LBP

Đặc trƣng này là bất biến đối với bất kì sự thay đổi về cƣờng độ sáng nào và đảm bảo thứ tự của mật độ điểm ảnh trong một vùng không gian cho trƣớc (hình 2.2). Giá trị LBP đƣợc xác định theo các bƣớc sau [1]:

1. Chọn một điểm ảnh bất kì, xét tất cả các điểm ảnh xung quanh, ta có cửa sổ 3x3.

2. So sánh giá trị các điểm ảnh xung quanh với điểm ảnh đƣợc chọn. Nếu giá trị điểm ảnh đó lớn hơn điểm ảnh đƣợc chọn thì đánh dấu 1, còn không thì đánh dấu là 0.

3. Đƣa toàn bộ giá trị nhị phân từ điểm ảnh trên cùng bên trái đến điểm ảnh cuối cùng theo chiều kim đồng hồ vào chuỗi 8 bit, sau đó quy đổi sang hệ thập phân. (2.7) (2.8)

Với gc là giá trị của điểm ảnh trung tâm (xc, yc) và gn là giá trị của điểm ảnh thứ n trong cửa sổ 3x3.

- 38 -

2.2.3. Red-Green-Blue (RGB)

Đặc trƣng này mô tả màu sắc của ảnh X-Quang dựa vào giá trị Đỏ, Xanh lá cây và Xanh da trời. Đối với ảnh 24 bit, đặc trƣng RGB đƣợc tính toán nhƣ sau

(2.9) Có một cách khác để tính đặc trƣng RGB, đó là tính từng ma trận hR[],hG[],hB[]. 2.2.4. Gradient

Đặc trƣng này đƣợc sử dụng nhằm phân biệt các thành phần khác nhau của răng nhƣ men răng, xƣơng răng, lợi, ống tủy [3]. Giá trị Gradient đƣợc tính nhƣ sau:

1. Áp dụng bộ lọc Gaussian vào ảnh X-Quang nhằm giảm nhiễu nền. 2. Bộ lọc Difference of Gaussian (DoG) đƣợc dùng để tính gradient của

ảnh theo 2 trục x và y. Mỗi điểm ảnh đƣợc mô tả bằng một véc tơ gradient.

3. Lấy lại dạng tiêu chuẩn của véc tơ gradient và lấy véc tơ 2 chiều cho mỗi điểm ảnh nhƣ sau.

(2.10) Với α là hƣớng của véc tơ gradient.

Ví dụ, độ và và hƣớng của một điểm ảnh đƣợc tính nhƣ sau.

(2.11) (2.12) (2.13) (2.14)

Với I(x, y) là véc tơ điểm ảnh, G(x, y, kζ) là hàm Gaussian của véc tơ điểm ảnh, * là toán tử nhân chập giữa x và y, θ1 là ngƣỡng.

- 39 -

2.2.5. Đặc trƣng mức Patch

Đặc trƣng này đƣợc sử dụng để tính toàn bộ véc tơ gradient với từng điểm ảnh ở mức patch, đƣợc biểu thị bởi δ(z) [10].

(2.15) (2.16)

Với m(z) là biên độ gradient tại điểm ảnh z,

là giá trị tiêu chuẩn của m(z) và εg là hằng số. δ(z) thƣờng đƣợc xác định bởi phƣơng pháp Hard Binning nhƣ sau.

(2.17)

2.3. Xây dựng cơ sở dữ liệu

Cơ sở dữ liệu đƣợc lƣu trữ dƣới dạng tệp tin dạng text đuôi txt. Với mỗi ảnh nha khoa, ta trích chọn ra 5 đặc trƣng đã đƣợc mô tả ở phần trƣớc bao gồm đặc trƣng EEI, LBP, RGB, Gradient và Patch. Đồng thời, với kinh nghiệm chuyên gia, các ảnh đã đƣợc xác định chính xác tên bệnh để lƣu trữ. Trong tệp tin, mỗi dòng là thông tin một bản ghi tƣơng ứng với một ảnh. Mỗi bản ghi sẽ gồm các giá trị đƣợc ngăn cách bởi dấu phẩy và có dạng nhƣ sau:

Số thứ tự, EEI, LBP, RGB, Gradient, Patch, Label

Ví dụ về một bản ghi: 1,42.719,156.4,113.04,0.41599,0.019287,1

Bản ghi trên thể hiện ảnh thứ nhất, có giá trị EEI là 42.719, LBP là 156.4, RGB là 113.04, Gradient là 0.41599, Patch là 0.019287, nhãn của bệnh là 1.

Số thứ tự: số thứ tự của bản ghi tƣơng ứng với số thứ tự của ảnh đƣợc trích

chọn đặc trƣng và đƣa vào số liệu. Trong ví dụ trên thì số thứ tự 1 sẽ tƣơng ứng với ảnh đầu tiên (ta tạm gọi là ảnh 1) đƣợc xử lý.

- 40 -

EEI: bao gồm 3 thông số Entropy, Edge-value và Intensity. Trong MATLAB đã hỗ trợ tính toán cho 3 thông số này. Sau khi tính toán các thông số trên, ta thu đƣợc 3 giá trị, và giá trị đặc trƣng của EEI chính là trung bình cộng của 3 thông số này. Trong ví dụ của ảnh 1 thì giá trị đƣợc tính ra là 42.719.

LBP: Áp dụng lý thuyết tính toán LBP đƣợc đề cập ở trên, ta tính giá trị LBP cho từng điểm ảnh và đƣợc một ma trận giá trị LBP của một ảnh. Ta tính giá trị trung bình của ma trận đó, kết quả cuối cùng là một giá trị duy nhất thu đƣợc, đó chính là giá trị của đặc trƣng LBP. Theo ví dụ thì kết quả đặc trƣng LBP của ảnh 1 là 156.4

RGB: Đặc trƣng RGB đƣợc tính với ảnh JPEG. Ảnh JPEG bao gồm 3 ma trận Red, Green, Blue, ta tính giá trị trung bình lần lƣợt 3 ma trận đó và thu đƣợc 3 giá trị trung bình của 3 ma trận. Để có đƣợc kết quả cuối cùng, ta tiếp tục tính trung bình cọng của 3 giá trị vừa tính đƣợc để lấy kết quả cuối cùng. Đó là giá trị đặc trƣng RGB, với ví dụ ảnh 1 thì giá trị là 113.04.

Gradient: Đặc trƣng Gradient đƣợc tính bằng việc sử dụng 3 ma trận Red-

Green-Blue. Truyền 3 tham số là 3 ma trận vào hàm gradient trong MATLAB, ta thu đƣợc một ma trận số. Kết quả cuối cùng vẫn đƣợc tính bằng giá trị trung bình của ma trận. Theo ví dụ tao có gái trị gradient là 0.41599.

Patch: Đặc trƣng Patch cũng đƣợc tính bằng cách sử dụng 3 ma trận Red-

Green-Blue của ảnh JPEG. Kết quả cuối cùng đƣợc tính bằng hàm patch trong MATLAB.

Label: Giá trị cuối cùng của 1 bản ghi trong cơ sở dữ liệu là Label. Giá trị

này thể hiện nhóm bệnh của bản ghi hay chính là của ảnh. Trong nghiên cứu này, tác giả hiện giới hạn thực nghiệm cho 5 loại bệnh cơ bản là: Gãy răng, Răng mọc ngầm, Sâu răng, Thiếu răng, và Tiêu xƣơng quanh răng. Mỗi bệnh sẽ đƣợc đánh số để lƣu vào dữ liệu phục vụ tính toán sau này. Các bệnh sẽ đƣợc đánh số nhƣ sau:

Một phần của tài liệu Xây dựng hệ thống tư vấn trong chuẩn đoán bệnh nha khoa từ kho dữ liệu ảnh (Trang 33 - 41)

Tải bản đầy đủ (PDF)

(90 trang)