Bộ dữ liệu ung thư cổ tử cung

Một phần của tài liệu Ứng dụng hệ thống nhận dạng miễn dịch nhân tạo mờ trong chẩn đoán ung thư (FULL TEXT) (Trang 101 - 109)

5.2.1 Mục đích thử nghiệm

So sánh AIRS mờ và mạng ANFIS

Thử nghiệm trên các bộ đặc trưng khác nhau, để thấy được sự thích nghi của hệ thống.

5.2.2 Kết quả đạt được

Do tính chất mạng ANFIS là hệ suy luận dựa trên mạng thích nghi, nên sẽ có 3 hệ thống luật được trích ra từ cơ sở dữ liệu:

1. Luật chuyên gia, sử dụng thuộc tính y1, y4, y5, y3.

2. Luật chuyên gia nâng cao, sử dụng thuộc tính y1, y4, y5, y3.

3. Luật trích từ hệ thống theo thuật giải subtractive clustering, với 9 thuộc tính sau: y2, y4, y6, y9, y10, y11, y14, y16, y17.

Tất cả các luật này được thực hiện trên 2 bộ phân lớp: 2 phân lớp và 7 phân lớp.

Bộ luật Độ chính xác (%) - ANFIS Độ chính xác (%) - AIRS mờ

2 phân lớp 7 phân lớp 2 phân lớp 7 phân lớp

1 85.6 70.0 97.0 96.0 2 79.6 68.0 97.0 96.0 3 92.4 74.4 98.0 97.2 Bảng 5.3: So sánh ANFIS và AIRS mờ 5.3 Nhận xét 5.3.1 Ưu điểm

Độ chính xác phân lớp đạt kết quả tốt, có thể ứng dụng được trên nhiều dạng dữ liệu y khoa.

Cho kết quả tốt trên bộ dữ liệu nhiều phân lớp đầu ra.

Khi có một hay một số yếu tố mới, quá trình huấn luyện có thể thực hiện tiếp tục, không cần phải huấn luyện lại.

5.3.2 Khuyết điểm

Quá trình đột biến đặc trưng mang tính ngẫu nhiên nên ảnh hưởng khá nhiều kết quả của thuật toán.

Độ chính xác thuật toán phụ thuộc vào số lượng tài nguyên phân phối cũng như phụ thuộc vào dữ liệu bệnh.

5.4 Hướng phát triển

Tổng quát hóa thành hệ thống chẩn đoán y khoa chung, không giới hạn về mẫu bệnh cũng như độ phức tạp của thuộc tính.

Tích hợp thêm các thuật toán lựa chọn đặc trưng để thu hẹp không gian tìm kiếm, giúp độ chính xác của thuật toán tăng cao.

Tích hợp với các giai đoạn tiền xử lý trong y khoa, để có thể rút trích đặc trưng của bệnh mà không cần đến sự can thiệp của bác sĩ.

Chuyển những tri thức chuyên gia thành hệ thống luật mờ, giúp các giá trị đầu vào cho hệ thống mô tả chính xác hơn ý nghĩa của nó.

Tích hợp tính toán song song để cải thiện thời gian huấn luyện và nâng cao khả năng chính xác do tăng chất lượng đột biến.

Tài liệu tham khảo

[1] Andrew Watkins, (December 2001), “AIRS: A resource limited artificial immune classifer”, Master Thesis, Mississippi State University.

[2] Andrew Watkins, (March 2005), “Exploiting immunological metaphors in the development of serial, parallel, and distributed learning algorithm”,

Phd Dissertation, The University Of Kent.

[3] Andrew Watkins, Lois Boggess, (2002), “A new classifier based on resource limited artificial immune system”, IEEE.

[4] Andrew Watkins, Lois Boggess, (2002), “A resource limited artificial immune classifier”, IEEE.

[5] Andrew Watkins, Jon Timmis, (2001), “Artificial immune recognition system (AIRS): An Immune – Inspired Supervised Algorithm”, Kluwer Academic Publishers.

[6] Andrew Watkins, Jon Timmis, (September 2002), “Artificial immune recognition system (AIRS): Revisions and Refinements”,

1st International Conference on Artificial Immune Systems (ICARIS2002), University of Kent at Canterbury.

[7] Bennet, K. P, & Blue, J. A., (1997), “A support vector machine approach to decision trees”, Rensselaer Polytechnic Institute, Math Report, No. 97 – 100.

[8] Bac Le, Tu Vo, (2004) “Chẩn đoán ung thư cổ tử cung bằng phương pháp mạng nơron mờ trong giai đoạn tiền ung thư”, luận văn cử nhân, , Khoa Công Nghệ Thông Tin, Trường Đại học Khoa học Tự nhiên.

[9] F. Martin McNeil, Ellen Thro, (1994), “Fuzzy logic: A practical approach”, United Kingdom Edition, Academic Press Limited.

[10] J. Timmis, T. Knight, L. N. de Castro, E. Hart, (November 2004), “An overview of artificial immune systems”, Natural Computation Series, Springer.

[11] Goodman, D. E., Boggess, L., & Watkins, A., (2002), “Artificial immune system classification of multiple – class problems”, In The proceedings of the artificial neural networks inengineering ANIIE.

[12] Goodman, D. E., Boggess, L., & Watkins, A., (July 2003), “An investigation into the source of power for AIRS, an artificial immune classification system”, In Proceedings of the international joint conference on neural networks (IJCNN’03), Portland, Oregon.

[13] Hamaker, J., và Boggess, L., (2004), “Non – Euclidean distance measures in AIRS, an artificial immune classification system”, In The proceedings of the congress on evoluationary computation (CEC2004), Portland, Oregon, USA.

[14] Hamilton, H. J., Shan, N., và Cercone, N., (1996), “BRIAC: A rule induction algorithm based on approximate classification”, University of Regina. [15] http://archive.ics.uci.edu/ml/datasets/Breast+Cancer+Wisconsin+%28Ori ginal%29 [16] http://www.machsong.org/modules.php?name=News&file=article&sid=1 256 [17] http://www.ykhoanet.com/NCKH/nguyenvantuan/ungthuvu.htm [18] http://vi.wikipedia.org/wiki/Ung_th%C6%B0_v%C3%BA

[19] Kelmal Polat, Salih Gunes, (December 2006), “Automated identification of diseases related to lymph system from lymphography data using artificial immune recognition system with fuzzy resource allocation mechanism (fuzzy – AIRS)”, Biomedical Signal Processing and Control 1 (2006) 253 – 260, Elsevier.

[20] Kelmal Polat, Seral Sahan, Halife Kodaz và Salih Gunes, (2005), “A new classification method for breast cancer disgnosis: Feature selection artificial immune regconition system (FS – AIRS)”, Springer – Verlag Berlin Heidelberg 2005.

[21] Kelmal Polat, Seral Sahan, Halife Kodaz và Salih Gunes, (April 2008), “Breast cancer and liver disorders classification using artificial immune recognition system (AIRS) with performance evaluation by fuzzy resource allocation mechanism”, An international journal of Expert Systems with Applications, Volume 34, Issue 3.

[22] Lê Hoài Bắc, Nguyễn Thanh Nghị, (2003), “Bionet - Hệ chẩn đoán bệnh”,

Luận văn thạc sĩ, Đại học Quốc gia TP. HCM, Đại học Khoa học Tự nhiên, Khoa Công nghệ thông tin.

[23] Marwah, G., và Boggess, L., (2002), “Artificial immune system for classification: Some issues”, In Proceedings of the first international conference on artificial immune systems, University of Kent, Canterbury, England.

[24] Nauck, D., và Kruse, R., (1999), “Obtaining interpretable fuzzy classification rules from medical data”,Artificial Intelligence in Medicine. [25] Pena – Reyes, C. A., và Sipper, M., (1999), “A fuzzy – genetic approach

to breast cancer diagnosis”,Artificial Intelligence in Medicine.

[26] Quinland, J. R., (1996), “Improved use of continuous attributes in C4.5”,

Journal of Artificial Intelligence Research.

[27] S. Balachandran, S. Yu, N. Majumdar, F. Nino, (April 2007), “Artificial Immune Systems: A bibliography”, CS Technical Report, Computer Science Department, The University of Memphis, USA.

[28] Seral Sahan, Kemal Polat, Halife Kodaz, Salih Gunes, (May 2006), “A new hybrid method based on fuzzy – artificial immune system and k – nn algorithm for breast cancer diagnosis”, Computers in Biology and Medicine 37 (2007) 415 – 423, Elsevier.

[29] Setiono, R., (2000), “Generating concise and accurate classification rules for breast cancer diagnosis”,Artificial Intelligence in Medicine.

[30] Ster, B., & Dobnikar, A., (1996), “Neural networks in medical diagnosis: Comparison with other methods”, In The proceedings of the international conference on engineering applications of neural networks.

[31] Simon M. Garrett, (2005), “How do we evaluate Artificial Immune Systems”, Evolutionary Computation 13.

[32] Vitoantonio Bevilacqua, Cosimo G. de Musso, Filippo Menolascina, Giuseppe Mastronardi, Antonio Pedone, (2007), “Hydrib systems and Artificial Immune Systems: Performances and Applications to Biomedical Research”, Springer – Verlag Berlin Heidelberg 2007.

Phụ lục

Chức năng phần mềm

Chương trình chủ yếu thực hiện các chức năng sau:

Thể hiện bước huấn luyện và kiểm nghiệm của thuật toán AIRS mờ.

Xuất các thông số cho giai đoạn huấn luyện và kiểm nghiệm để đánh giá khả năng thực hiện của thuật toán.

Thực hiện nhập dữ liệu huấn luyện của bệnh Thực hiện chẩn đoán theo bệnh án

Các độ đo để đánh giá khả năng thực hiện

1. Độ chính xác phân lớp

Độ chính xác phân lớp được tính cho tập dữ liệu là:

T t T t assess T accurancy i T i i , 1 otherwise c t t classify if t assess , 0 . _ , 1

Trong đó, T là tập hợp các bộ dữ liệu được phân lớp (tập kiểm nghiệm)

t T, t.c là lớp của bộ dữ liệu t

2. Mức hợp lý ngưỡng k

Để kết quả kiểm nghiệm có giá trị hơn, mức hợp lý ngưỡng k được sử dụng trong các nghiên cứu. Trong phương pháp này, toàn bộ dữ liệu được chia ngẫu nhiên thành k tập con riêng biệt nhau và kích thước bằng nhau. Thuật toán phân lớp đã huấn luyện và kiểm nghiệm k lần. Trong mỗi trường hợp, một trong những lần được thực hiện khi dữ liệu kiểm nghiệm và những lần còn lại được thêm vào để hình thành dữ liệu huấn luyện. Do đó, k kết quả kiểm nghiệm khác nhau tồn tại cho mỗi cấu hình huấn luyện - kiểm nghiệm. Giá trị trung bình của tất cả những kết quả này cho độ chính xác kiểm nghiệm của thuật toán.

Thuật toán K láng giềng gần nhất

Thuật toán láng giềng gần nhất gồm 5 bước:

1. Tính khoảng cách Euclide Di từ z đến từng phần tử xi, với i = 1, …, n

2. Tạo ma trận n n i c D c D A ... ... 1

và sắp xếp các hàng trong A theo thứ tự tăng của cột 1. Sau khi sắp xếp, A trở thành: 2 , 1 , 2 , 1 1 , 1 1 ... ... n n a a a a A

trong đó a1,1 a2,1 … an,1 là các khoảng cách có thứ tự tăng, và ai,2 là phân lớp tương ứng của mỗi hàng.

3. cho bj = 0, j = 1, …, C, trong đó C là số nhóm được mô tả trong ci. 4. Lặp lại bước 4 với i = 1, …, k, tăng b(ai,2) với khoảng cách trọng hoá:

k i i i i a a a b a b , 1 , 2 , 2 , 1

5. Ấn định điểm dữ liệu z vào nhóm j sao cho

C l l b j b , 1,...,

Một phần của tài liệu Ứng dụng hệ thống nhận dạng miễn dịch nhân tạo mờ trong chẩn đoán ung thư (FULL TEXT) (Trang 101 - 109)

Tải bản đầy đủ (PDF)

(109 trang)