Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 90 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
90
Dung lượng
2,75 MB
Nội dung
LỜI CAM ĐOAN Nội dung luận văn đƣợc lên ý tƣởng từ thực trạng chẩn đoán bệnh ung thƣ vú qua việc sử dụng ảnh X-quang vú Dƣới hƣớng dẫn bảo TS Nguyễn Thái Hà- Trƣờng Đại học bách khoa Hà Nội, nghiên cứu từ lý thuyết bệnh ung thƣ vú, sai sót trình chẩn đoán để từ xây dựng chƣơng trình hỗ trợ phát bệnh ung thƣ vú ảnh X-quang vú Tuy nhiên trình xử lý X-quang vú phải trải qua nhiều bƣớc, nên luận văn tập trung chủ yếu vào việc khoanh vùng nghi ngờ, khai thác đặc trƣng ảnh Xquang vú để phân loại vùng nghi ngờ có bệnh hay không Tôi xin cam đoan nội dung luận văn hoàn toàn trung thực, xác chƣa đƣợc công bố công trình khác Tác giả Nguyễn Hải Tuyên LỜI CẢM ƠN Để hoàn thành đƣợc luận văn này, tất nhiên công sức thân em bỏ mà có giúp đỡ nhiều thầy cô giáo, ngƣời thân bạn bè Đặc biệt em xin gửi lời cảm ơn sâu sắc đến TS Nguyễn Thái Hà, cô trực tiếp hƣớng dẫn em thực luận văn Chính bảo tận tình cô mặt chuyên môn, đến lời khuyên động viên kịp thời cô giúp đỡ em nhiều trình hoàn thành luận văn Em xin đƣợc gửi lời cảm ơn chân thành đến ThS Nguyễn Việt Dũng nhóm thành viên lớp chất lƣợng cao KTYS-K53 giúp đỡ hỗ trợ cho em mặt chuyên môn suốt trình làm luận văn Cuối cùng, xin gửi lời cám ơn chân thành đến gia đình, bạn bè ngƣời thân, ngƣời bên cạnh động viên suốt trình học tập hoàn thành luận văn MỤC LỤC DANH SÁCH CÁC HÌNH VẼ DANH SÁCH CÁC BẢNG BIỂU DANH SÁCH CÁC TỪ VIẾT TẮT CHƢƠNG 1: GIỚI THIỆU CHUNG 1.1 Mục đích luận văn 1.2 Cấu trúc luận văn CHƢƠNG 2: GIỚI THIỆU CHUNG VỀ X-QUANG VÚ 2.1 Ung thƣ vú cách chẩn đoán, điều trị 2.1.1 Giới thiệu bệnh ung thƣ vú: 2.1.2 Các cách chẩn đoán điều trị 10 2.2 Ảnh chụp X-Quang vú: 12 2.2.1 Thiết bị tạo ảnh X- quang vú 13 2.2.1.1 Nguyên lý hoạt động máy X- quang vú .14 2.2.1.2 Kỹ thuật chụp 15 2.3 Thực trạng việc chẩn đoán điều trị ung thƣ vú 16 2.4 Ý tƣởng mục tiêu thiết kế hệ thống chẩn đoán ung thƣ vú 22 2.4.1 Cấu trúc hệ thống hỗ trợ phát ung thƣ vú điển hình 22 2.4.2 Vai trò khối hệ thống 24 2.4.2.1 Khối tiền xử lý 24 2.4.2.2 Khối phát .26 2.4.2.3 Tính toán lựa chọn đặc trƣng 28 2.4.2.4 Nhận dạng 28 CHƢƠNG 3: PHÂN LOẠI VÙNG NGHI NGỜ UNG THƢ DỰA TRÊN CÁC ĐẶC TRƢNG 29 3.1 Đặc trƣng ảnh X-quang vú 29 3.1.1 Tính toán đặc trƣng: 29 3.1.1.1 Thống kê bậc .30 3.1.1.2 Các đặc trƣng ma trận đồng mức xám 31 3.1.1.3 Các đặc trƣng sai lệch xác suất ngƣợc theo khối 35 3.1.1.4 Các đặc trƣng biến thiên hệ số tƣơng quan cục theo khối .36 3.1.2 Lựa chọn đặc trƣng 38 3.1.2.1 Lựa chọn tiến 41 3.1.2.2 Lựa chọn lùi 43 3.2 Nhận dạng phân loại vùng nghi ngờ ung thƣ 44 3.2.1 Lý thuyết nhận dạng phân loại 44 3.2.2 Mạng nơ ron nhân tạo 46 3.2.2.1 Các phƣơng pháp học mạng nơron 49 3.2.2.2 Học có giám sát mạng nơron 50 3.2.2.3 Perceptron 51 3.2.2.4 Mạng nơron đa lớp 51 3.2.2.5 Phƣơng pháp phân tích thành phần 56 3.2.3 Máy vector hỗ trợ 58 3.2.3.1 SVM tuyến tính 61 3.2.3.2 SVM phi tuyến 63 CHƢƠNG 4: KẾT QUẢ ĐẠT ĐƢỢC 65 4.1 Cơ sở liệu ảnh x-quang vú 65 4.2 Khoanh vùng ảnh 67 4.3 Tính toán lựa chọn đặc trƣng 69 4.3.1 Các đặc trƣng sử dụng cho mạng nơron nhân tạo 69 4.3.2 Các đặc trƣng sử dụng cho máy hỗ trợ vector 72 4.4 Phần mềm lập trình giao diện chƣơng trình 81 CHƢƠNG 5: KẾT LUẬN VÀ HƢỚNG PHÁT TRIỂN 84 5.1 Kết luận 84 5.2 Hƣớng phát triển 84 DANH SÁCH CÁC HÌNH VẼ Hình 2.1 - Ảnh giải phẫu vú phụ nữ trƣởng thành Hình 2.2 - Thiết bị chụp ảnh X-quang vú 14 Hình 2.3 - Khi vú đƣợc nén lại, ảnh X–quang rõ ngƣợc lại .15 Hình 2.4 - Mối liên hệ giữa tỉ lệ TN,TP,FN,FP 19 Hình 2.5 - Đồ thị đƣờng cong ROC hệ số AUC 20 Hình 2.6 - Một số giá trị AUC 21 Hình 2.7 - (a)Ảnh X-quang vú với khối u lành tính, (b) Ảnh X-quang vú với khối u ác tính 23 Hình 2.8– Sơ đồ khối hệ thống phát ung thƣ vú .24 Hình 2.9 - Ảnh X-quang vú đƣợc tiền xử lý loại bỏ nhãn tách ngực vú 26 Hình 2.10 - Các vùng nghi ngờ khối vi canxi 27 Hình 3.1 - Quá trình nhận dạng vùng bất thƣờng bình thƣờng ảnh X-quang vú .29 Hình 3.2 - Tính toán đặc trƣng 30 Hình 3.3 - Quá trình biến đổi sử dụng GLCM 31 Hình 3.4– hƣớng liền kề GLCM 32 Hình 3.5- Ảnh gốc ảnh sau sử dụng BDIP .36 Hình 3.6 - Quá trình dịch sử dụng BVLC với cửa sổ 2x2 37 Hình 3.7 - Ảnh sau sử dụng BVLC .37 Hình 3.8 - Lựa chọn đặc trƣng 38 Hình 3.9 – Giải thuật phƣơng pháp lựa chọn đặc trƣng .41 Hình 3.10 - Mạng nơ ron tự nhiên 46 Hình 3.11 - Mô hình mạng nơ ron nhân tạo 47 Hình 3.12 - Mô hình mạng perceptron 51 Hình 3.13 - Mạng MLP tổng quát .52 Hình 3.14 - Giải thuật thuật toán lan truyền ngƣợc 53 Hình 3.15 - Thiết kế mạng nơ ron .54 Hình 3.16 - Xác định độ biến thiên tốt trục tọa độ 57 Hình 3.17 - Độ rộng biên lớn đƣợc tính toán SVMs tuyến tính .62 Hình 3.18 - Ánh xạ liệu từ miền D sang miền D’ 63 Hình 4.1 - Một phần sở liệu Mini-MIAS đƣợc đƣa vào Excel .66 Hình 4.2 – Phân bố vùng TP, FP dựa đặc trƣng BDIP BDIP2x2var 77 Hình 4.3 – Các đƣờng cong ROC tƣơng ứng với đặc trƣng BDIP đƣợc sử dụng tỉ lệ 40:60 để huấn luyện kiểm tra 78 Hình 4.4– Đồ thị ROC với đặc trƣng khối BVLC ixi tỉ lệ 40:60 .80 Hình 4.5– Sử dụng 10-fold để chia liệu huấn luyện 81 Hình 4.6 - Giao diện sử dụng mạng nơ ron nhân tạo cho việc nhận dạng 82 Hình 4.7 – Giao diện sử dụng SVM chia liệu thành lớp riêng biệt 83 DANH SÁCH CÁC BẢNG BIỂU Bảng 2.1 - Các trƣờng hợp có xét nghiệm bệnh 17 Bảng 3.1 – Các hàm mục tiêu lựa chọn đặc trƣng 40 Bảng 3.2- Các thông tin ảnh X-quang vú sở liệu Mini-MIAS .66 Bảng 4.1- Bảng trích liệu ROI với việc huấn luyện đặc trƣng f1 f2 GLCM .71 Bảng 4.2 – Giá trị AUC với phƣơng pháp tính toán đặc trƣng khác 73 Bảng 4.3 – Các giá trị AUC với đặc trƣng đƣợc tính toán từ khối BDIP ixi 78 Bảng 4.4- Giá trị AUC ACC với đặc trƣng khối BVLC ixi 79 DANH SÁCH CÁC TỪ VIẾT TẮT AUC The area under the ROC curve ACC accuracy CAD Computer-Aided Diagnosis ROI Region of Interest ROC Receiver Operating Characteristic FP False Positive TP True Position FPF False Positive Fraction TPF True Positive Fraction FNF False Negative Fraction TNF True Negative Fraction GLCM Gray Level Co-occurrence Matrix FOS First Order Statistic BDIP Block Difference of inverse probability BVLC Block Variance of Local Correlation Coefficients ANN Artificial Neural Network SVM Support Vector Machine FPR False Positive Reduction CHƢƠNG 1: GIỚI THIỆU CHUNG 1.1 Mục đích luận văn Ung thƣ vú loại ung thƣ thƣờng gặp gây tử vong hàng đầu phụ nữ nhiều nƣớc công nghiệp Theo quan nghiên cứu ung thƣ giới (IARC International Agency for Research on Cancer) vào năm 1998 ung thƣ vú đứng đầu, chiếm 21% tổng số loại ung thƣ phụ nữ toàn giới Cũng theo IARC, xuất độ chuẩn hóa theo tuổi ung thƣ vú phụ nữ 92,04 (trên 100 000 dân) châu Âu 67,48 (trên 100 000 dân) toàn giới vào năm 1998, cao loại ung thƣ nữ giới.[1] Ung thƣ vú trở nên phổ biến nƣớc phát triển Tại Việt Nam, năm 1998, nữ giới, ung thƣ vú loại ung thƣ có tần suất cao Hà Nội với xuất độ chuẩn hóa theo tuổi 20,3 (trên 100 000 dân) cao thứ hai Thành phố Hồ Chí Minh với xuất độ chuẩn hóa theo tuổi 16 (trên 100 000 dân) sau ung thƣ cổ tử cung mà xuất độ chuẩn hóa theo tuổi 28,6 (trên 100 000 dân).[2] Đây bệnh phức tạp mà nhiều năm qua có nhiều nghiên cứu nguyên nhân, bệnh sinh điều trị Một điều quan trọng cần phải nhận thấy việc phát sớm ung thƣ vú qua tầm soát phụ nữ bình thƣờng làm thay đổi rõ ràng bệnh sử tự nhiên bệnh nhƣ cải thiện đáng kể tiên lƣợng bệnh Cho đến nay, phƣơng pháp hiệu để phát ung thƣ vú phụ nữ chụp nhũ ảnh – phƣơng pháp sử dụng tia X để tạo ảnh vú Phƣơng pháp phát đƣợc khối u ác tính vú hai năm trƣớc thể cảm nhận đƣợc nó.[3] Ở nƣớc phát triển, trình chẩn đoán ảnh X quang vú đƣợc hỗ trợ nhiều từ hệ thống máy tính Tuy nhiên, Việt Nam, công việc chẩn đoán đƣợc thực thủ công, phụ thuộc chủ yếu vào kinh nghiệm trình độ bác sĩ Việc sử dụng thêm bác sĩ làm tăng độ xác chẩn đoán nhiên điều làm cho tăng chi phí khám với thực trạng Việt Nam thiếu bác sĩ có chuyên môn tốt việc tăng thêm bác sĩ để chẩn đoán cho bệnh nhân điều Do hệ thống máy tính hỗ trợ phát ( Computer Aided Detection-CAD) đƣợc nghiên cứu, đƣợc coi nhƣ “ bác sĩ thứ hai” nhằm nâng cao độ xác trình phát ung thƣ vú ảnh X-quang Mặc dù vậy, trình khoanh vùng nhận dạng vùng ung thƣ có nhiều trƣờng hợp bị chẩn đoán nhầm có bệnh, hay gọi tỉ lệ dƣơng tính giả Đã có nhiều phƣơng pháp đƣợc đƣa nhiên hiệu chƣa đƣợc cao Trong luận văn xin đƣợc đƣa phƣơng pháp giúp làm giảm tỉ lệ dƣơng tính giả việc phát vùng nghi ngờ ung thƣ Bằng việc sử dụng phƣơng pháp lựa chọn đặc trƣng nhƣ Block Diffrence of Inverse Probability (BDIP), Block Variantion of Local Correlation Coefficient (BVLC) để mô tả khối nghi ngờ Sau sử dụng nhận dạng máy vector hỗ trợ ( Support Vector Machine – SVM) để nhận dạng khu vực ung thƣ Đánh giá với khoảng 2700 khu vực nghi ngờ ung thƣ đƣợc lấy từ sở liệu chuẩn Mini – MIAS với 322 ảnh X-quang vú ( Hiệp hội phân tích ảnh X – quang vú – Một tổ chức Vƣơng Quốc Anh) tính toán đƣợc AUC ≥ 0,91 ( Diện tích dƣới đƣờng cong hoạt động thu nhận - The area under the ROC curve) Với giá trị AUC tính toán đƣợc ta thấy hai phƣơng pháp lựa chọn đặc trƣng BDIP BVLC cho hiệu tốt 1.2 Cấu trúc luận văn Chƣơng 2: Tổng quan ung thƣ vú: Chƣơng trình bày khái niệm tổng quan bệnh ung thƣ vú, cách chẩn đoán điều trị Giới thiệu tập trung phƣơng pháp chẩn đoán bệnh thông qua ảnh X-quang vú Thực trạng bệnh ung thƣ vú Việt Nam, từ đề xuất ý tƣởng mục tiêu thiết kế chƣơng trình hỗ trợ phát ung thƣ vú Tỉ lệ Các đặc Độ nhạy Độ đặc trƣng AUC (Sensitivity) (Specificity) FOS 0,6935 0,72 0,63 BDIP 0,9102 0,92 0,84 GLCM 0,7839 0,68 0,93 FOS 0,7932 0,78 0,62 BDIP 0,8156 0,55 0,91 GLCM 0,7278 0,67 0,78 trƣng cấu trúc 40:60 30:70 Bảng 4.2 – Giá trị AUC với phƣơng pháp tính toán đặc trƣng khác Dựa vào kết trên, ta thấy mức độ phân loại phụ thuộc tỷ lệ liệu đầu vào, phƣơng pháp huấn luyện việc lựa chọn hàm kernel Trong nghiên cứu này, sử dụng hàm kernel Gaussian thu đƣợc diện tích AUC 0,9102, độ xác ACC = 86,28% số lƣợng vector hỗ trợ vào khoảng 18,36% tổng số mẫu huấn luyện Hình 4.10- Các đƣờng cong ROC với tỉ lệ 40:60 73 Giá trị AUC = 0,9102 tốt, có hiệu cao loại bỏ trƣờng hợp dƣơng tính giả hệ thống hỗ trợ phát bệnh ung thƣ vú So với số kết trƣớc có kết tốt nhiều Và cho hiệu tốt nhiều so với kết AUC=0,87 mạng nơ ron nhân tạo Điều cho thấy việc sử dụng đặc trƣng BDIP SVM tốt việc giảm dƣơng tính giả ảnh X-quang vú cần tập trung cải thiện hiệu suất tốt Trong hình ta thấy hiệu phƣơng pháp vector máy hỗ trợ-SVM mạng nơ ron với phƣơng pháp tính toán đặc trƣng, hàm kernel để thực Hay nói cách khác, SVM cho ta độ xác hiệu mong muốn tốt mạng nơ ron Hình 4.11- Phân loại sử dụng đặc trƣng BDIP tƣơng ứng SVM mạng nơ ron Sử dụng khối BDIP BVLC có kích thƣớc ixi Việc sử dụng đặc trƣng trình phân tích yếu tố quan trọng để thu đƣợc kết tốt Trong nghiên cứu này, thử sử dụng đặc trƣng BDIP tƣơng ứng giá trị trung bình phƣơng sai với khối 2x2, 3x3 74 a BDIP ixi: Từ công thức: BDIP = M2 - ∑( ) ( ( ) )( ) BDIP1 = 22 - = 0,21 BDIP2 = 22 - = 0,19 Cứ tính toán lần lƣợt cho khối có kích thƣớc 2x2 nhƣ ta đƣợc ảnh Ví dụ ảnh có mức xám nhƣ trên: Hình 4.12- Ảnh sau sử dụng đặc trƣng BDIP Từ cách tính trên, dƣới phần giá trị đặc trƣng BDIP đƣợc tính toán từ khu vực ROI đƣợc khoanh vùng ROI BDIP 1 133.084 7354.75 BDIP BDIP 2x2var 2x2mean 58.736 25.59263 84406.5 1445.000 BVLC 2x2var 0.001436 3.47E-05 75 BVLC 2x2mean 0.083944 0.009186 BVLC var3x3 0.002691 0.000156 BVLC 3x3mean 0.113841 0.020603 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 633.707 712.119 6014.82 121.734 3968.10 50.8026 49.1826 1309.95 994.951 107.914 78.5483 360.623 8618.07 232.487 232.389 701.246 455.786 200.938 580.673 86.3716 910.791 58.4295 4522.80 6737.62 140.649 4190.18 1304.03 706.458 319.26 9421.32 147.767 5517.34 414.317 1918.45 367.572 342.720 4906.31 682.039 517.125 588.315 27007.6 20.2185 29758.8 10.1144 4.09630 3180.03 2749.65 21.8027 12.0999 107.449 200092 57.4646 70.8041 155.763 66.0130 45.0922 501.200 4.02245 2074.36 7.24317 23517.6 28196.0 19.6985 15950.2 5243.91 487.130 52.6079 277363 49.1644 41558.0 113.029 5936.53 77.6992 94.2704 68231.5 716.253 132.8244 112.9050 1151.310 24.55293 765.2972 10.22956 9.204489 250.7529 206.1791 20.86329 14.28705 64.79108 1717.792 32.45678 50.04093 135.4958 99.19574 39.91509 100.0106 17.53529 194.2580 12.78755 1029.863 1443.026 28.62379 836.5700 148.1683 92.30307 74.05249 1661.112 28.57200 1258.621 91.83104 398.8456 79.22146 67.20176 643.3111 130.9648 0.000418 0.000755 2.33E-05 0.001340 2.58E-05 0.001411 0.001056 0.000132 4.17E-05 0.000264 0.001554 9.09E-05 4.76E-05 0.111873 0.000343 0.000341 0.000744 0.002025 0.001119 0.003218 0.000633 0.000690 6.92E-05 0.006721 0.000632 0.001099 0.001719 0.001120 0.001443 0.000249 0.000784 0.000260 0.001248 0.000577 0.000501 0.000597 0.000779 0.000744 0.043241 0.041671 0.007616 0.059466 0.010137 0.091595 0.053203 0.019911 0.015757 0.047638 0.080849 0.042708 0.011384 0.338768 0.105714 0.086799 0.117801 0.131299 0.071509 0.183247 0.088494 0.104045 0.022159 0.103168 0.128280 0.043119 0.059224 0.046441 0.135558 0.010559 0.161510 0.031132 0.122893 0.068831 0.107677 0.089998 0.039931 0.092059 0.000404 0.002039 0.000109 0.003990 7.13E-05 0.003254 0.002329 0.000439 0.000186 0.002072 0.003834 0.000370 0.000155 0.047469 0.000628 0.001132 0.000905 0.005702 0.002692 0.001932 0.001797 0.003753 0.000234 0.000329 0.002061 0.001012 0.003216 0.002334 0.002249 8.62E-05 0.002021 0.000130 0.001398 0.002680 0.002884 0.002940 0.000433 0.001681 0.079486 0.075337 0.017550 0.122347 0.018610 0.108848 0.083855 0.038979 0.027112 0.086367 0.141221 0.059763 0.017906 0.253293 0.121264 0.102787 0.129832 0.145348 0.099579 0.218494 0.098949 0.153399 0.031698 0.065604 0.143274 0.063818 0.074766 0.049312 0.143869 0.011550 0.181780 0.036477 0.139122 0.104953 0.131393 0.111605 0.072509 0.132211 Bảng 4.2 – Giá trị đặc trƣng giá trị phân loại ROI đƣợc tính toán dựa sở liệu Mini-MIAS 76 300000 250000 200000 FP 150000 TP 100000 50000 0 2000 4000 6000 8000 10000 Hình 4.2 – Phân bố vùng TP, FP dựa đặc trƣng BDIP BDIP2x2var Giá trị 0,44 giá trị trung bình BDIP vùng nghi ngờ ta chọn làm ngƣỡng để chia khu vực thành miền Tiếp tục lặp lại trình chọn ngƣỡng miền Sau lần ta đƣợc miền có giá trị BDIP gần nhƣ Các giá trị kỳ vọng phƣơng sai đƣợc coi nhƣ đặc trƣng BDIP cho khu vực nghi ngờ Ta đƣa đƣợc đặc trƣng sử dụng cho vùng nghi ngờ: giá trị BIDP toàn ảnh, giá trị trung bình 2x2, giá trị trung bình 3x3, phƣơng sai 2x2, phƣơng sai 3x3 Tỉ lệ 40:60 Các đặc trƣng AUC BDIP 2x2 mean 0,7213 BDIP 2x2 var 0,9035 BDIP 3x3 mean 0,5668 BDIP 3x3 var 0,7662 77 BDIP 2x2 mean 0,6855 BDIP 2x2 var 0,8223 BDIP 3x3 mean 0,7204 BDIP 3x3 var 0,7933 30:70 Bảng 4.3 – Các giá trị AUC với đặc trƣng đƣợc tính toán từ khối BDIP ixi Từ kết bảng 4.3, ta thấy giá trị tốt thể diện tích dƣới đƣờng cong ROC AUC = 0,9035 tƣơng ứng với đặc trƣng giá trị phƣơng sai khối BDIP 2x2 Giá trị tốt, nhiên so với giá trị AUC=0,9102 tính đƣợc việc sử dụng đặc trƣng BDIP Do phƣơng pháp tính giá trị AUC đặc trƣng BDIP phƣơng pháp tiềm cho hiệu tốt cần đƣợc nghiên cứu Hình 4.3 – Các đƣờng cong ROC tƣơng ứng với đặc trƣng BDIP đƣợc sử dụng tỉ lệ 40:60 để huấn luyện kiểm tra 78 b BVLC ixi: Tƣơng tự nhƣ đặc trƣng BDIP, ta sử dụng giá trị trung bình ixi BVLC giá trị phƣơng sai ixi BVLC Thông qua nguyên tắc dịch công thức BVLC đƣợc trình bày mục 3.1.1.4, ta thấy rõ xem ví dụ sau: ρ( k, l) = ∑( ) ( ) ( ) BVLC = max[ρ( k, l)] – [ρ( k, l)] (k, l) O4 = {(0,1), (1, 0), (1, 1), (1, 1)} ρ( 0,1) = -0,09 ; ρ( 1,0) = -1,42; ρ( 1,1) = -0,83; ρ( 1,-1) = -10 => BVLC1 = -0,09-(-10) = 9,91 Ảnh Tỉ lệ 40:60 30:70 Kích thƣớc BVLC mean BVLC var khối AUC AUC 2x2 0.73903 0.8404 3x3 0.7288 0.8033 4x4 0,6527 0,7955 Toàn 0,7975 0,8915 2x2 0,7932 0,8023 3x3 0,8156 0,7655 4x4 0,6278 0,7927 Toàn 0,8083 0,8193 Bảng 4.3- Giá trị AUC với đặc trƣng khối BVLC ixi 79 Hình 4.4– Đồ thị ROC với đặc trƣng khối BVLC ixi tỉ lệ 40:60 Từ kết cho thấy việc sử dụng đặc trƣng BDIP BVLC dùng cho việc giảm tỉ lệ dƣơng tính giả hiệu Kết thực nghiệm cho thấy với đặc trƣng BDIP 2x2 var, ta thu đƣợc AUC = 0,9035 tốt so với đặc trƣng BVLC với giá trị tốt thu đƣợc AUC = 0,8915 Kết cho thấy BDIP 2x2 var sử dụng hiệu đặc trƣng mean (giá trị trung bình) Ở hình 4.15 thử nghiệm sử dụng kết hợp BVLC var BVLC mean khối 2x2, kết thu đƣợc AUC = 0,9325 Ngoài ra, ta cần phải quan tâm đến hàm kernel phƣơng pháp phân loại để thực tƣơng ứng với đặc trƣng đƣợc tính toán - Hàm Kernel: Áp dụng hàm RBF để tìm giá trị thích hợp C ξ cho hiệu suất phân loại cao - Phƣơng pháp phân loại: Áp dụng phƣơng pháp gập k lần (k-fold) để huấn luyện kiểm tra liệu Trong nghiên cứu này, sử dụng k=10 để chia liệu huấn luyện thành 10 tập với tỷ lệ tƣơng ứng Với trình huấn luyện i = 10, sử dụng tập để huấn luyện tất tập lại để kiểm tra Hoặc ta kết hợp 2, 3,…8 10 tập để sử dụng cho việc huấn luyện Tức 80 tất tập đƣợc sử dụng để huấn luyện kiểm tra Hình 4.14 thể toàn liệu đƣợc chia thành 10 phần Với tỉ lệ huấn luyện: kiểm tra khác đƣợc mô hình SVM khác Hình dƣới liệu đƣợc chia thành 10 phần, phần để huấn luyện phần để kiểm tra Mỗi trình nhƣ ta đƣợc giá trị AUC Sau làm 10 lần nhƣ vậy, tất phần đƣợc train huấn luyện, ta tính đƣợc giá trị ̅̅̅̅̅̅ Hình 4.5– Sử dụng 10-fold để chia liệu huấn luyện 4.4 Phần mềm lập trình giao diện chƣơng trình Chƣơng trình hỗ trợ phát ung thƣ vú đƣợc xây dựng phần mềm Matlab 7.10(R2010a) Đây môi trƣờng lập trình thực hành bậc cao dựa ngôn ngữ lập trình C đƣợc sử dụng để giải toán kỹ thuật Matlab tích hợp 81 đƣợc việc tính toán, thể kết quả, cho phép lập trình, giao diện làm việc dễ dàng cho ngƣời sử dụng Dữ liệu với thƣ viện đƣợc lập trình sẵn cho phép ngƣời sử dụng thực nhiều ứng dụng thực tế điều khiển, viễn thông, xử lý âm thanh, hình ảnh, video Sử dụng hàm có sẵn thƣ viện, phép tính toán học thông thƣờng Cho phép lập trình tạo ứng dụng Cho phép mô mô hình thực tế Phân tích, khảo sát hiển thị liệu Với phần mềm đồ họa cực mạnh Cho phép phát triển, giao tiếp với số phần mềm khác nhƣ C++, Fortran Trong trình thực nghiệm, sử dụng số tiện ích nhƣ LIBSVM neurol network training tool cho trình nhận dạng Hình 4.6 - Giao diện sử dụng mạng nơ ron nhân tạo cho việc nhận dạng 82 LIBSVM thƣ viện dùng cho vector máy hỗ trợ, đƣợc phát triển từ năm 2001 nhóm tác giả ngƣời Đài Loan Mục đích thƣ viện giúp cho ngƣời dùng dễ dàng ứng dụng SVM.[7] Hình 4.7 – Giao diện sử dụng SVM chia liệu thành lớp riêng biệt 83 CHƢƠNG 5: KẾT LUẬN VÀ HƢỚNG PHÁT TRIỂN 5.1 Kết luận Trong luận văn này, nghiên cứu, phân tích thực việc tính toán lựa chọn đặc trƣng, sử dụng hệ thống CAD để phân loại vùng bất thƣờng bệnh ung thƣ vú, giúp làm giảm tỉ lệ dƣơng tính giả trình chẩn đoán Thông qua việc nghiên cứu giải thuật cho việc trích chọn đặc trƣng, lựa chọn đƣợc loại đặc trƣng có hiệu cho mục đích luận văn, : đặc trƣng FOS, đặc trƣng GLCM, đặc trƣng BDIP đặc trƣng BVLC, với việc sử dụng phân loại nhƣ mạng nơ ron nhân tạo hay máy hỗ trợ vector – SVM Việc lựa chọn đặc trƣng cho việc huấn luyện nhận dạng, tỉ lệ liệu đầu vào, hàm kernel tham số C, γ, yếu tố ảnh hƣởng đến kết thu đƣợc Qua trình thử nghiệm phƣơng pháp, kết cho thấy đặc trƣng BDIP cho kết AUC = 0,9102 số lƣợng vector xấp xỉ khoảng 18,36% tổng số mẫu dùng cho việc huấn luyện Đối với nhiều tổn thƣơng ảnh X quang vú, thực nghiệm cho thấy BDIP BVLC cho hiệu tốt 5.2 Hƣớng phát triển Trong tƣơng lai, đƣa đƣợc đặc trƣng phƣơng pháp lựa chọn đặc trƣng khác để nâng cao hiệu suất việc phân loại vùng nghi ngờ giảm tỉ lệ dƣơng tính giả Sử dụng số phân loại khác để so sánh, đánh giá đƣợc tối ƣu Mặc dù hệ thống cho hiệu suất tốt, nhiên nhiều vấn đề cần giải quyết, nhƣ phát triển thêm: Cần đánh giá xác tỉ lệ lỗi trình thực hiện, qua đƣa phƣơng pháp khắc phục 84 Chiều không gian liệu cần đƣợc mở rộng để xử lý giảm ảnh hƣởng nhiễu tín hiệu đầu vào Xây dựng mô hình SVM xử lý đƣợc nhiều biến lúc Áp dụng thuật toán lựa chọn đặc trƣng để giảm thiểu số đặc trƣng đầu vào mà không làm ảnh hƣởng đến hiệu suất phân loại hệ thống Cuối cùng, tin với việc tiếp tục hoàn thiện nâng cao hiệu suất hệ thống, việc ứng dụng hệ thống vào thực tế nhằm giúp bác sĩ việc chẩn đoán bệnh ung thƣ vú đem lại hiệu tốt, giảm thiểu thực trạng xấu tồn việc chẩn đoán ung thƣ vú 85 TÀI LIỆU THAM KHẢO 1.http://www.ehealthmd.com 2.http://www.wikipedia.com 3.John Terry Sample (2003), Computer assisted screening of digital mamogram images, University of Southern Mississippi http://www.thietbiysinh.com.vn/news/mammography-chup-x-quang-tuyen-vu Bích Thủy, Hải Yến (1997), Cẩm nang Vú bệnh ung thư vú, NXB Y học Robert M.Haralick, K.Shanmugam, and It’sHak Dinstein (November 1973), Textural Features for Image Classification, IEEE Transactions On Systems, man and cybernetics, Vol.SMC-3,No.6 Young Deok Chun, Sang Yong Seo, Nam Chul Kim (2003), Image Retrieval Using BDIP and BVLC Moments, IEEE Transactions On Circuits And Systems For Video Technology, vol.13, No.9 http://www.doc.ic.ac.uk/~nd/surprise_96/journal/vol4/cs11/report.html http://www.support-vector-machines.org 10 http://peipa.essex.ac.uk/info/mias.html 11 Chih-Chung Chang, Chih-Jen Lin (2013), LIBSVM: A Library for Support Vector Machines, National Taiwan University, Taipei, Taiwan 12.Nikola K Kasabov Foundations of Neural Networks, Fuzzy Systems, and Knowledge Engineering Massachusetts Institute of Technology 13 R Gaughan (Sept / Oct 1998.), “New approaches to early detection of breast cancer makes small gains”, Biophotonics International, pp 48-53 86 14 Buseman S, Mouchawar J, Calonge N, Byers T (2003) Mammography screening matters for young women with breast carcinoma Cancer 97(2):352–8, 15 Birdwell R L, Ikeda D M, O’Shaughnessy K D, Sickles E A (2001) Mammographic characteristics of 115 missed cancers later detected with screening mammography and the potential utility of computer-aided detection Radiology 219:192–202 16 G D Tourassi, N H Eltonsy, J H Graham et al (2005) Feature and knowledge based analysis for reduction of false positives in the computerized detection of masses in screening mammography IEEE Conf Eng Med Biol Soc 6524–6527 17 Llad X, Oliver A, Freixenet J, Mart R, Mart J (2009) A textural approach for mass false positive reduction in mammography Computerized Medical Imaging and Graphics 33(6):415-422 18 N Karssemeijer (1992), “Stochastic model for automated detection of calcifications in digital mammograms”, Image and Vision Computing, vol 10, no 6, pp 369-375 19 M Gurcan, Y Yardimci, A Cetin, and R Ansari (1997), “Detection of microcalcifications in mammograms using higher order statistics”, IEEE Signal Processing Letters, vol 4, no 8, pp 213-216, 20 Tien Dzung Nguyen, Quy Tran Thanh, Thang Man Duc, Trang Nguyen Quynh, Thang Manh Hoang (2011) SVM classifier based face detection system using BDIP and BVLC moments Conference on Advanced Technologies for Communication (ATC2011): 264-267 87 ... (a )Ảnh X-quang vú với khối u lành tính, (b) Ảnh X-quang vú với khối u ác tính 23 Hình 2.8– Sơ đồ khối hệ thống phát ung thƣ vú .24 Hình 2.9 - Ảnh X-quang vú đƣợc tiền xử lý. .. Trên lý thuyết ta sử dụng hệ thống phát khu vực bình thƣờng để sử dụng phát khu vực bình thƣờng bất thƣờng ảnh X-quang vú Hệ thống hỗ trợ phát ung thƣ vú bao gồm phần: (1) Tiền xử lý ảnh Xquang vú, ... qua ảnh X-quang vú Thực trạng bệnh ung thƣ vú Việt Nam, từ đề xuất ý tƣởng mục tiêu thiết kế chƣơng trình hỗ trợ phát ung thƣ vú Chƣơng 3: Giới thiệu phƣơng pháp tính toán đặctrƣng ảnh X-quang vú