1. Trang chủ
  2. » Luận Văn - Báo Cáo

Hệ tư vấn mờ trực cảm và ứng dụng trong chẩn đoán bệnh

53 86 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 53
Dung lượng 1,85 MB

Nội dung

ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ NGUYỄN THỌ THÔNG HỆ TƯ VẤN MỜ TRỰC CẢM VÀ ỨNG DỤNG TRONG CHẨN ĐOÁN BỆNH LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ NGUYỄN THỌ THÔNG HỆ TƯ VẤN MỜ TRỰC CẢM VÀ ỨNG DỤNG TRONG CHẨN ĐỐN BỆNH Ngành: Cơng nghệ thơng tin Chun ngành: Hệ thống thông tin Mã số: 60480104 LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN NGƯỜI HƯỚNG DẪN KHOA HỌC: TS LÊ HỒNG SƠN PGS.TS NGUYỄN ĐÌNH HĨA Lời cảm ơn Trước tiên, em xin trân trọng gửi lời cảm ơn sâu sắc đến thầy giáo TS Lê Hoàng Sơn – ĐH Khoa học Tự nhiên thầy giáo PGS.TS Nguyễn Đình Hóa – Viện CNTT – ĐH Cơng nghệ trực tiếp hướng dẫn tận tình giúp đỡ em suốt thời gian thực luận văn Em xin trân trọng cảm ơn Thầy, Cô giáo khoa Công nghệ thông tin – Trường ĐH Công nghệ – ĐH Quốc gia Hà Nội tận tình dạy, cung cấp cho em kiến thức quý báu ln nhiệt tình giúp đỡ, tạo điều kiện thuận lợi suốt trình em học tập trường Đồng thời em xin chân thành cảm ơn người thân gia đình tồn thể bạn bè giúp đỡ, động viên em lúc gặp phải khó khăn học tập, cơng việc sống Luận văn thực tài trợ đề tài NAFOSTED, mã số: 102.05-2014.01 Lời cam đoan Những kiến thức trình bày luận văn tơi tìm hiểu, nghiên cứu trình bày lại theo cách hiểu Trong q trình làm luận văn, tơi có tham khảo tài liệu có liên quan ghi rõ nguồn tài liệu tham khảo Tôi xin cam đoan cơng trình nghiên cứu tơi không chép Hà Nội, ngày … tháng … năm 2016 Học viên Nguyễn Thọ Thông Mục lục Lời cảm ơn Lời cam đoan Mục lục Danh mục ký hiệu chữ viết tắt Danh mục bảng Danh mục hình vẽ, đồ thị .8 MỞ ĐẦU CHƯƠNG TỔNG QUAN VỀ TẬP MỜ TRỰC CẢM, HỆ TƯ VẤN VÀ BÀI TOÁN CHẨN ĐOÁN BỆNH 10 I.Bài toán chẩn đoán bệnh 10 II.Tổng quan tập mờ trực cảm 11 III.Hệ tư vấn 21 IV.Kết luận .25 CHƯƠNG HỆ TƯ VẤN MỜ TRỰC CẢM 26 I.Giới thiệu .26 II.Hệ tư vấn mờ trực cảm .26 CHƯƠNG KẾT QUẢ THỰC NGHIỆM VÀ SO SÁNH 37 I.Giới thiệu .37 II.Kết thực nghiệm so sánh 39 KẾT LUẬN .48 Nội dung luận văn trình bày số kết nghiên cứu đạt sau 48 Các kiến thức toán chẩn đoán bệnh, tập mờ trực cảm hệ tư vấn 48 Trình bày nghiên cứu nhóm đề xuất Đó hệ tư vấn mờ trực cảm cho toán chẩn đoán bệnh bao gồm định nghĩa hệ tư vấn mờ trực cảm, số phép tốn, tính chất thuật tốn lọc mờ trực cảm 48 Cài đặt thực nghiệm thuật tốn có thuật tốn đề xuất, đánh giá chất lượng thời gian chạy thuật toán 48 TÀI LIỆU THAM KHẢO 49 Danh mục ký hiệu chữ viết tắt Từ viết tắt Từ đầy đủ CF collaborative filtering FS Fuzzy Sets IFS Intuitionistic Fuzzy Set IFV Intuitionistic Fuzzy Value RS Recommender System Intuitionistic Fuzzy Recommender IFRS System Single-criterion Intuitionistic Fuzzy SC-IFRS Recommender System Multi-criteria Intuitionistic Fuzzy MC-IFRS Recommender System IFM Intuitionistic fuzzy matrix IFCM Intuitionistic fuzzy composition matrix IFSM Intuitionistic fuzzy similarity matrix IFSD Intuitionistic fuzzy similarity degree Intuitionistic fuzzy collaborative IFCF filtering Ý nghĩa Phương pháp lọc cộng tác Tập mờ Tập mờ trực cảm Giá trị mờ trực cảm Hệ tư vấn Hệ tư vấn mờ trực cảm Hệ tư vấn mờ trực cảm đơn tiêu chí Hệ tư vấn mờ trực cảm đa tiêu chí Ma trận mờ trực cảm Ma trận hợp thành mờ trực cảm Ma trận tương đồng mờ trực cảm Độ đo tương đồng mờ trực cảm Phương pháp lọc cộng tác mờ trực cảm Danh mục bảng Bảng Quan hệ bệnh nhân triệu chứng () 11 Bảng Quan hệ triệu chứng bệnh () .11 Bảng Quan hệ bệnh nhân bệnh () 11 Bảng Bệnh bệnh nhân 11 Bảng Quan hệ bệnh nhân bệnh () phương pháp De, Biswas Roy 17 Bảng Ma trận 17 Bảng Ma trận 18 Bảng Ma trận giảm thiểu 18 Bảng Quan hệ bệnh nhân bệnh sử dụng hàm Hamming 19 Bảng 10 Quan hệ bệnh nhân bệnh sử dụng hàm Euclidean 20 Bảng 11 Tập liệu huấn luyện với giá trị * cần dự báo 24 Bảng 12 Tập liệu huấn luyện thô với giá trị * cần dự báo 24 Bảng 13 Tập liệu đầy đủ xác định phương pháp Hassan Syed, giá trị in đậm thể bệnh bệnh nhân 24 Bảng 14 Tập liệu đầy đủ xác định phương pháp Davis cộng [9], giá trị in đậm thể bệnh mắc phải 24 Bảng 15 MC-IFRS cho chẩn đoán bệnh với giá trị * cần dự báo .30 Bảng 16 Miêu tả tập liệu thực nghiệm 37 Bảng 17 Tập liệu huấn luyện với giá trị * cần dự báo 39 Bảng 18 Tập liệu SC-IFRS trích xuất với giá trị * cần dự báo .39 Bảng 19 Bệnh khuyến nghị, bệnh với khả mắc cao in đậm 40 Bảng 20 Kết MAE thực nghiệm ngẫu nhiên liệu HEART 41 Bảng 21 Kết thời gian chạy thực nghiệm ngẫu nhiên liệu HEART 42 Bảng 22 Kết MAE thực nghiệm k-fold liệu HEART 42 Bảng 23 Kết thực nghiệm k-fold liệu HEART 42 Bảng 24 Kết MAE thực nghiệm ngẫu nhiên liệu RHC .44 Bảng 25 Kết thời gian chạy thực nghiệm ngẫu nhiên liệu RHC 44 Bảng 26 Kết MAE thực nghiệm k-fold liệu RHC .45 Bảng 27 Kết thời gian chạy thực nghiệm k-fold liệu RHC 45 Danh mục hình vẽ, đồ thị Hình Tập rõ biểu diễn tập rõ .12 Hình Ví dụ tập mờ 13 Hình Thuật tốn IFCF 36 Hình Phân bố chiều HEART 38 Hình Phân bố chiều RHC .38 Hình Kết MAE thực nghiệm ngẫu nhiên liệu HEART 43 Hình Kết MAE thực nghiệm k-fold liệu HEART 43 Hình Kết MAE thực nghiệm ngẫu nhiên liệu RHC 45 Hình Kết MAE thực nghiệm k-fold liệu RHC 46 MỞ ĐẦU Ngày này, công nghệ thông tin ứng dụng nhiều lĩnh vực thực tế y tế, giáo dục, nông nghiệp, lâm nghiệm, v.v Trong đó, ứng dụng cơng nghệ thơng tin y tế coi nhiệm vụ trọng điểm năm gần nhằm giảm bớt tình trạng tải bệnh viện Một ứng dụng điển hình cơng nghệ thơng tin y tế tư vấn khám, chữa bệnh từ xa dịch vụ cổng trực tuyến, v.v Mục tiêu luận văn tìm hiểu lý thuyết tập mờ trực cảm áp dụng hệ tư vấn toán chẩn đoán bệnh Các thuật toán liên quan cài đặt kiểm chứng đánh giá liệu chuẩn Luận văn gồm các phần sau: Chương Trình bày khái niệm chung toán chẩn đoán bệnh, tập trờ trực cảm hệ tư vấn Chương Hệ tư vấn mờ trực cảm cho toán chẩn đoán bệnh Chương Kết thực nghiệm so sánh CHƯƠNG TỔNG QUAN VỀ TẬP MỜ TRỰC CẢM, HỆ TƯ VẤN VÀ BÀI TỐN CHẨN ĐỐN BỆNH I Bài tốn chẩn đốn bệnh Giới thiệu Bài toán chẩn đoán bệnh tốn phổ biến y học Nó khâu quan trọng quy trình điều trị bệnh nhân Bernegger cộng [5] cho chẩn đoán khâu trung tâm y học lâm sàng việc chẩn đốn xác u cầu quan trọng định điều trị Chẩn đoán bệnh dự báo khả mắc bệnh cho bệnh nhân dựa vào thông tin triệu chứng mà bệnh nhân gặp phải Với mức độ quan trọng chẩn đoán điều trị bệnh nhân nên vấn đề nâng cao chất lượng chẩn đoán vấn đề quan tâm hàng đầu Bài toán chẩn đoán bệnh Định nghĩa [46]: Cho P = { P1 , , Pn } tập bệnh nhân, S = { S1 , , S m } tập triệu chứng, D = { D1 , , Dk } tập bệnh Mối quan hệ bệnh nhân triệu chứng PS PS thể tập RPS = { R ( Pi , S j ) | ∀i = 1, n; ∀j = 1, m} Ở R ( Pi , S j ) thể cấp độ bệnh nhân Pi có triệu chứng S j biểu diễn giá trị số hay giá trị mờ, mờ trực cảm Tương tự, quan hệ triệu chứng bệnh nhân thể tập { } RSD = R SD ( S i , D j ) | ∀i = 1, m; ∀j = 1, k Ở R SD ( S i , D j ) phản ánh khả triệu chứng Si dẫn đến bệnh D j Bài toán chẩn đoán bệnh nhằm xác định mối quan hệ PD bệnh nhân bệnh thể tập RPD = { R ( Pi , D j ) | ∀i = 1, n; ∀j = 1, k } Ở R PD ( Pi , D j ) nhận giá trị tương ứng với bệnh nhân Pi có bị bệnh D j hay khơng Bài tốn chẩn đốn bệnh thể ngắn gọn ánh xạ: { RPS , RSD } → RPD Ví dụ tốn chẩn đốn bệnh Ví dụ 1: Xem xét tập liệu Samuel Balamurugan [35] bao gồm bốn bệnh nhân P = {Ram, Mari, Sugu, Somu}, năm triệu chứng S = {Temperature, Headache, Stomach-pain, Cough, Chest-pain} năm bệnh D = {Viral-Fever, Malaria, Typhoid, Stomach, Heart} Quan hệ bệnh nhân – triệu chứng triệu chứng – bệnh cho Bảng 10 II Kết thực nghiệm so sánh Minh họa IFCF Trong phần minh họa hoạt động IFCF tập liệu chẩn đoán bệnh mờ trực cảm Samuel Balamurugan [35] miêu tả từ Bảng đến Tương tự Ví dụ 9, tập liệu huấn luyện cho Bảng 17 với giá trị * bảng cần dự báo U Ram Mari Sugu Somu Viral_Fever (0.4, 0.1) (0.3, 0.5) * * Malaria (0.7, 0.1) (0.2, 0.6) * * Typhoid (0.6, 0.1) (0.4, 0.4) * * Stomach (0.2, 0.4) (0.6, 0.1) * * Chest (0.2, 0.6) (0.1, 0.7) * * Bảng 17 Tập liệu huấn luyện với giá trị * cần dự báo Từ bảng 17 chúng tơi có trích xuất tập liệu SC-IFRS Bảng 18 Tương tự ô trống cần dự báo Patient Ram Symptoms Temperatur e( 0.8,0.1) ; Headache(0.6,0.1) Stomach_pain ( 0.2,0.8) ; Cough(0.6,0.1) Chest_pain ( 0.1,0.6 ) Diseases Viral_fever ( 0.4,0.1) ; Malaria(0.7,0.1) Typhoid ( 0.6,0.1) ; Stomach_problem(0.2,0.4) Chest_problem( 0.2,0.6 ) Mari Temperatur e( 0.0,0.8) ; Headache(0.4,0.4) Stomach_pain ( 0.6,0.1) ; Cough(0.1,0.7) Viral_fever ( 0.3,0.5) ; Malaria(0.2,0.6) Typhoid ( 0.4,0.4 ) ; Stomach_problem(0.6,0.1) Chest_pain ( 0.1,0.8) Sugu Somu Temperatur e( 0.8,0.1) ; Headache(0.8,0.1) Stomach_pain ( 0.0,0.6 ) ; Cough(0.2,0.7) Chest_pain ( 0.0,0.5) Temperatur e( 0.6,0.1) ; Headache(0.5,0.4) Stomach_pain ( 0.3,0.4 ) ; Cough(0.7,0.2) Chest_problem( 0.1,0.7 ) * * Chest_pain ( 0.3,0.4 ) Bảng 18 Tập liệu SC-IFRS trích xuất với giá trị * cần dự báo 39 Với tham số thuật toán IFCF cho α = , β = γ = / w1i = w2i = w3i = 0.2 Từ Bảng 18, chúng tơi tính tốn IFSD Sugu (Somu) Ram Mari, sử dụng định nghĩa 13 ta có IFSD( Sugu , Ram) = 0.87 , (110) IFSD( Sugu , Mari) = 0.57 , (111) IFSD( Somu, Ram) = 0.83 , (112) IFSD( Somu, Mari ) = 0.58 (113) Từ công thức (110-113), Chúng ta sử dụng định nghĩa 14 để tính tốn kết dự báo IFM Sogu Somu Disease( Sugu ) = Disease( Somu ) = Viral_fever ( 0.49,0.38) ; Malaria(0.52,0.22) Typhoid ( 0.36,0.52 ) ; Stomach_problem(0.40,0.34) Chest_problem( 0.10,0.68) Viral_fever ( 0.47,0.39 ) ; Malaria(0.52,0.22) Typhoid ( 0.36,0.51) ; Stomach_problem(0.39,0.47) (114) , (115) Chest_problem( 0.10,0.68) Dựa hàm khuyến nghị định nghĩa công thức (114-115), khuyến nghị bệnh bệnh nhân Bảng 19 U Sugu Somu Viral_Fever 0.5537 0.5358 Malaria 0.6552 0.6552 Typhoid 0.4032 0.4068 Stomach 0.504 0.4446 Chest 0.122 0.122 Bảng 19 Bệnh khuyến nghị, bệnh với khả mắc cao in đậm Từ Bảng 19, Chúng ta kết luận Sugu Somu mắc bệnh Malaria Nhận xét a) Kết IFCF thể Bảng 19 giống với kết De, Biswas Roy [10] Ví dụ 6, Samuel Balamurugan [35] Ví dụ Hassan Syed [14] Ví dụ b) IFCF có khả thực dự báo khuyến nghị với nhiều kiểu tập liệu Điều khẳng định tính linh hoạt hữu ích IFCF việc so sánh với phương pháp liên quan 40 c) Giới hạn phương pháp giải mờ nêu nghiên cứu liên quan De, Biswas Roy [10], Szmidt Kacprzyk [49], Samuel Balamurugan [35], Davis cộng [9] Hassan Syed [14] xử lý hàm khuyến nghị SC-IFRS (Định nghĩa 7) MCIFRS (Định nghĩa 8) d) IFCF sử dụng hai liệu, quan hệ bệnh nhân – triệu chứng bệnh nhân – bệnh cho dự báo, không dựa liệu bệnh nhân – bệnh phương pháp liên quan tới RS Davis cộng [9] Hassan Syed [14] Điều giúp tăng độ xác chẩn đốn từ việc thêm thơng tin cho tính tốn thuật tốn Đánh giá Trong phần này, thực thực nghiệm hai tập liệu chuẩn đoán bệnh HEART RHC Các kết thực nghiệm miêu tả từ Bảng 20 tới Bảng 23 Các kết MAE thực nghiệm ngẫu nhiên (tương ứng, k-fold) tập liệu HEART minh họa Hình (tương ứng, Hình 7) Tương tự, kết MAE thực nghiệm ngẫu nhiên (tương ứng, k-fold) tập liệu RHC minh họa Hình (tương ứng, Hình 9) Data sets 10 20 30 40 50 60 70 80 90 100 MAE IFCF DAVIS HASSAN DE SAMUEL SZMIDT 0.49641 0.492051 0.490383 0.488195 0.492451 0.490892 0.491429 0.493946 0.494265 0.493219 0.500286 0.495541 0.492238 0.49185 0.494166 0.494094 0.494952 0.497251 0.49741 0.495757 0.494036 0.488739 0.486775 0.483692 0.487049 0.486138 0.487727 0.490348 0.490197 0.488414 0.489147 0.496361 0.493604 0.47396 0.490438 0.476327 0.480793 0.491512 0.484721 0.483999 0.508045 0.504834 0.509998 0.526556 0.510221 0.523458 0.519985 0.507438 0.517029 0.516403 0.491955 0.495166 0.490002 0.473444 0.489779 0.476542 0.480015 0.492562 0.482971 0.483597 Bảng 20 Kết MAE thực nghiệm ngẫu nhiên liệu HEART Data sets 10 20 30 40 50 IFCF DAVIS 0.327558 0.796293 1.166132 1.221915 1.232003 0.646215 0.703126 0.739453 1.192436 1.234968 Computational time (sec) HASSAN DE 0.089682 0.152622 0.211139 0.255561 0.290003 0.011868 0.028907 0.032683 0.043212 0.043985 SAMUEL SZMIDT 0.009564 0.0347 0.036562 0.037371 0.043722 0.014055 0.023194 0.029526 0.046678 0.053152 41 60 70 80 90 100 1.260366 1.278752 1.469952 1.613406 2.210751 2.084581 2.360242 3.014339 3.081387 3.305678 0.304465 0.306179 0.323535 0.324501 0.328335 0.048735 0.058691 0.078036 0.081523 0.127595 0.052548 0.053144 0.060445 0.11539 0.11964 0.058788 0.072443 0.072655 0.082507 0.102687 Bảng 21 Kết thời gian chạy thực nghiệm ngẫu nhiên liệu HEART Fold 10 MAE IFCF 0.495733 0.494624 0.490572 0.488722 0.489378 0.492201 0.492132 0.488487 0.487778 DAVIS 0.498977 0.497455 0.49394 0.492826 0.493186 0.496148 0.496581 0.492575 0.491602 HASSAN 0.491243 0.489978 0.486429 0.485395 0.484268 0.488301 0.488893 0.485452 0.484024 DE 0.479124 0.474681 0.491674 0.474125 0.474017 0.468833 0.492033 0.486527 0.490158 SAMUEL 0.521357 0.525323 0.510025 0.525475 0.526214 0.527847 0.509502 0.515524 0.514568 SZMIDT 2.060489 0.474677 0.489975 0.474525 0.474768 0.472153 0.490498 0.484476 0.485432 Bảng 22 Kết MAE thực nghiệm k-fold liệu HEART Data sets 10 IFCF DAVIS 3.225795 3.158217 2.821404 2.70524 2.310253 2.166859 2.088267 2.060489 1.889909 4.059911 4.039289 3.383637 3.208319 2.952161 2.342186 2.186523 2.150605 0.492826 Computational time (sec) HASSAN DE 1.572734 1.431444 1.335837 1.137519 1.108358 1.101027 1.097188 0.956852 0.863702 0.213536 0.191975 0.09894 0.092019 0.088419 0.076773 0.057825 0.047176 0.045803 SAMUEL SZMIDT 0.21604 0.103076 0.100901 0.083503 0.04564 0.043674 0.034734 0.029806 0.019865 0.207523 0.144031 0.128371 0.086687 0.075412 0.07241 0.06922 0.0414 0.037433 Bảng 23 Kết thực nghiệm k-fold liệu HEART 42 Hình Kết MAE thực nghiệm ngẫu nhiên liệu HEART Hình Kết MAE thực nghiệm k-fold liệu HEART Data sets 50 100 150 MAE IFCF DAVIS HASSAN DE SAMUEL SZMIDT 0.442175 0.439844 0.438635 0.44247 0.440324 0.438546 0.441502 0.451435 0.450023 0.479901 0.482438 0.481689 0.52626 0.524069 0.524843 0.47374 0.475931 0.475157 43 200 250 300 350 400 450 500 550 600 650 700 750 800 850 900 950 1000 0.438282 0.436268 0.436115 0.437641 0.436992 0.440996 0.435963 0.436537 0.435991 0.435262 0.438705 0.437769 0.435194 0.434399 0.435067 0.436633 0.434831 0.438322 0.436218 0.436708 0.438068 0.436864 0.441618 0.436172 0.436788 0.436306 0.435451 0.439116 0.437992 0.435462 0.434582 0.435319 0.436888 0.434984 0.450814 0.444011 0.438171 0.453067 0.449501 0.450962 0.441205 0.453276 0.458081 0.438105 0.45581 0.463094 0.444957 0.451129 0.463573 0.448817 0.460705 0.476943 0.474844 0.480948 0.480032 0.47773 0.481943 0.475933 0.480885 0.478958 0.478893 0.481182 0.481186 0.476458 0.479923 0.476773 0.483203 0.478549 0.529039 0.531077 0.525275 0.526245 0.528056 0.523331 0.529638 0.525715 0.526851 0.527255 0.524615 0.524855 0.529806 0.526656 0.529274 0.523412 0.527785 0.470961 0.468923 0.474725 0.473755 0.471944 0.476669 0.470362 0.474285 0.473149 0.472745 0.475385 0.475145 0.470194 0.473344 0.470726 0.476588 0.472215 Bảng 24 Kết MAE thực nghiệm ngẫu nhiên liệu RHC Data sets 50 100 150 200 250 300 350 400 450 500 550 600 650 700 750 800 850 900 950 1000 IFCF DAVIS 40.06698 77.14874 113.0401 147.2283 180.2224 211.1297 242.7504 272.7885 319.4657 325.5207 344.3712 365.4371 385.1481 404.1568 421.5027 436.5416 453.7668 465.9425 478.8142 597.5560 33.57283 65.9519 87.0333 113.8669 135.3158 152.9428 168.4303 189.6871 219.4764 249.4249 262.0359 275.2695 291.7030 315.0818 333.7332 351.0495 385.3729 402.2348 421.2111 442.4772 Computational time (sec) HASSAN DE SAMUEL SZMIDT 12.06656 30.21522 51.16982 67.81981 83.36726 96.91099 113.4414 129.7520 142.0267 156.7367 169.7921 180.1441 191.0308 202.0023 204.5337 213.1942 217.8114 226.5664 262.3495 287.3276 0.010931 0.019594 0.028967 0.038453 0.047737 0.056865 0.066663 0.076921 0.087006 0.094882 0.112752 0.134178 0.143444 0.151820 0.166440 0.170800 0.187068 0.199256 0.208938 0.237930 0.014407 0.028265 0.041422 0.055456 0.068599 0.081633 0.095873 0.113722 0.123928 0.135023 0.154736 0.162411 0.188254 0.210567 0.214335 0.242015 0.252885 0.268898 0.273174 0.306299 0.010758 0.015019 0.021002 0.038148 0.049271 0.056363 0.061749 0.067974 0.081742 0.096007 0.108004 0.110438 0.128739 0.138693 0.153086 0.163775 0.169128 0.185551 0.205338 0.216944 Bảng 25 Kết thời gian chạy thực nghiệm ngẫu nhiên liệu RHC Fold MAE IFCF 0.440949 0.437283 0.434009 0.436070 0.435874 0.437098 DAVIS 0.441186 0.437374 0.434141 0.436107 0.436164 0.437535 HASSAN 0.469381 0.463187 0.458663 0.464382 0.436214 0.461758 DE 0.481136 0.480916 0.477842 0.479325 0.482992 0.479249 SAMUEL 0.524992 0.525445 0.528936 0.527072 0.523708 0.526433 SZMIDT 0.475008 0.474555 0.471064 0.472928 0.476292 0.473567 44 10 0.434386 0.437215 0.441839 0.434495 0.437222 0.442047 0.44394 0.435230 0.457397 0.481571 0.479689 0.477239 0.525246 0.52695 0.527824 0.474754 0.47305 0.472176 Bảng 26 Kết MAE thực nghiệm k-fold liệu RHC Data sets 10 IFCF DAVIS 736.6445 701.3804 692.8024 629.4906 566.3853 508.6334 456.6042 436.1555 409.1319 477.9642 476.6182 450.9788 424.9808 396.0038 370.6705 349.1144 329.7963 319.6725 Computational time (sec) HASSAN DE SAMUEL SZMIDT 262.6263 262.9038 251.8981 238.3611 226.2907 215.6599 206.5204 198.37997 194.55609 0.942148 0.712606 0.617685 0.615317 0.494319 0.346833 0.287202 0.277723 0.250653 1.651110 1.358187 1.215837 0.993458 0.780865 0.356283 0.321834 0.288569 0.275802 0.791994 0.503385 0.366384 0.291197 0.229366 0.113842 0.051412 0.037128 0.013360 Bảng 27 Kết thời gian chạy thực nghiệm k-fold liệu RHC Hình Kết MAE thực nghiệm ngẫu nhiên liệu RHC 45 Hình Kết MAE thực nghiệm k-fold liệu RHC Nhận xét a) Bảng 20 21 cho biết giá trị MAE IFCF gần với thuật tốn khác Nó tốt so với Davis cộng [9] Samuel Balamurugan [35] tập liệu Các giá trị MAE trung bình IFCF, Davis cộng [9], Hassan Syed [14], De, Biswas Roy [10], Samuel Balamurugan [35] Szmidt Kacprzyk [49] Bảng 20 tương ứng 0.4923241, 0.4953545, 0.4883115, 0.4860862, 0.5143967 0.4856033 Trong Bảng 21 tương ứng 0.491069667, 0.49481, 0.487109222, 0.481241333, 0.519537222 0.656332556 Hình minh họa cho điều Trên tập liệu thể IFCF thực không hiệu trường hợp tập liệu có kích thức nhỏ tập chung phạm vi nhỏ b) Bảng 22 23 thể kết khác MAE trương hợp tập liệu lớn RHC Trung bình giá trị MAE IFCF, Davis cộng [9], Hassan Syed [14], De, Biswas Roy [10], Samuel Balamurugan [35] Szmidt Kacprzyk [49] Bảng 22 tương ứng 0.43716495, 0.4374099, 0.4504119, 0.47942055, 0.52670285 0.47329715 Trong Bảng 23 tương ứng 0.437191444, 0.437363444, 0.454461333, 0.479995444, 0.526289556 0.473710444 Trong trường hợp MAE 46 IFCF nhỏ So sánh thuật toán thể Hình Thể cho thấy IFCF hiệu trường hợp tập liệu chẩn đốn bệnh lớn có phạm vi giá trị rộng c) Thời gian tính tốn nhược điểm IFCF Trong trường hợp tập liệu với kích thược nhỏ HEART, thời gian tính tốn IFCF nằm khoảng trung bình từ 1.2 đến 2.5 giây không lớn so với thuật toán khác Tuy nhiên, trường hợp tập liệu kích thước lớn RHC, khác biệt thời gian tính tốn thể rõ ràng Vì vậy, việc cân nhắc thời gian tính tốn xác chẩn đốn nên trọng cho việc đảm bảo hiệu xuất thuật toán 47 KẾT LUẬN Nội dung luận văn trình bày số kết nghiên cứu đạt sau • Các kiến thức toán chẩn đoán bệnh, tập mờ trực cảm hệ tư vấn • Trình bày nghiên cứu nhóm đề xuất Đó hệ tư vấn mờ trực cảm cho toán chẩn đoán bệnh bao gồm định nghĩa hệ tư vấn mờ trực cảm, số phép tốn, tính chất thuật tốn lọc mờ trực cảm • Cài đặt thực nghiệm thuật tốn có thuật tốn đề xuất, đánh giá chất lượng thời gian chạy thuật toán 48 TÀI LIỆU THAM KHẢO [1] Agarwal, M., Hanmandlu, M., Biswas, K K (2011) Generalized intuitionistic fuzzy soft set and its application in practical medical diagnosis problem Proceeding of IEEE International Conference on Fuzzy Systems (FUZZ 2011), 2972-2978 [2] Ahn, J Y., Han, K S., Oh, S Y., Lee, C D (2011) An application of intervalvalued intuitionistic fuzzy sets for medical diagnosis of headache International Journal of Innovative Computing, Information and Control, 7(5), 2755 – 2762 [3] Albeanu, G., Popentiu-Vladicescu, F.L (2010) Intuitionistic fuzzy methods in software reliability modelling Journal of Sustainable Energy, 1(1), 30 - 34 [4] Atanassov, K T (1986) Intuitionistic fuzzy sets Fuzzy sets and Systems, 20(1), 87-96 [5] Bernegger, G., Musalek, M., Rehmann-Sutter, C (2012) An alternative view on the task of prognosis Critical reviews in oncology/hematology, 84, S17-S24 [6] Cantor, Georg (1874), “Ueber eine Eigenschaft des Inbegriffes aller reellen algebraischen Zahlen”, Journal für die reine und angewandte Mathematik 77: 258–262 [7] Connors, A.F., et al (1996) The effectiveness of right heart catheterization in the initial care of critically III patients Jama, 276(11), 889-897 [8] Cuong, B C., Son, L H., Chau, H T M (2010) Some context fuzzy clustering methods for classification problems Proceedings of the 2010 ACM Symposium on Information and Communication Technology (pp 34-40) [9] Davis, D A., Chawla, N V., Blumm, N., Christakis, N., Barabási, A L (2008) Predicting individual disease risk based on medical history Proceedings of the 17th ACM conference on Information and knowledge management, 769-778 [10] De, S K., Biswas, R., Roy, A R (2001) An application of intuitionistic fuzzy sets in medical diagnosis Fuzzy Sets and Systems, 117(2), 209-213 [11] Duan, L., Street, W N., Xu, E (2011) Healthcare information systems: data mining methods in the creation of a clinical recommender system Enterprise Information Systems, 5(2), 169-181 [12] Feng, F., Li, C., Davvaz, B., Ali, M I (2010) Soft sets combined with fuzzy sets and rough sets: a tentative approach Soft Computing, 14(9), 899-911 49 [13] Feng, F., Liu, X., Leoreanu-Fotea, V., Jun, Y B (2011) Soft sets and soft rough sets Information Sciences, 181(6), 1125-1137 [14] Hassan, S., Syed, Z (2010) From netflix to heart attacks: collaborative filtering in medical datasets Proceedings of the 1st ACM International Health Informatics Symposium, 128-134 [15] Hosseini, R., Ellis, T., Mazinani, M., Dehmeshki, J (2011) A genetic fuzzy approach for rule extraction for rule-based classification with application to medical diagnosis Proceeding of European Conference on Machine Learning and Principles and Practice of Knowledge Discovery in Databases (ECML PKDD), 5-9 [16] Hung, W L., Yang, M S (2008) On similarity measures between intuitionistic fuzzy sets International Journal of Intelligent Systems, 23(3), 364-383 [17] Irfan Ali, M (2011) A note on soft sets, rough soft sets and fuzzy soft sets Applied Soft Computing, 11(4), 3329-3332 [18] Jafarian, E., Rezvani, M A (2013) A valuation-based method for ranking the intuitionistic fuzzy numbers Journal of Intelligent and Fuzzy Systems, 24(1), 133-144 [19] Kala, R., Janghel, R R., Tiwari, R., Shukla, A (2011) Diagnosis of breast cancer by modular evolutionary neural networks International Journal of Biomedical Engineering and Technology, 7(2), 194-211 [20] Khatibi, V., Montazer, G A (2009) Intuitionistic fuzzy set vs fuzzy set application in medical pattern recognition Artificial Intelligence in Medicine, 47(1), 43-52 [21] Kononenko, I (2001) Machine learning for medical diagnosis: history, state of the art and perspective Artificial Intelligence in medicine, 23(1), 89-109 [22] Littlestone, N., & Warmuth, M K (1994) The weighted majority algorithm.Information and computation, 108(2), 212-261 [23] Meenakshi, A R., Kaliraja, M (2011) An application of interval valued fuzzy matrices in medical diagnosis Int J Math Anal, 5(36), 1791-1802 [24] Meisamshabanpoor, Mahdavi, M (2012) Implementation of a Recommender System on Medical Recognition and Treatment International Journal of eEducation, e-Business, e-Management and e-Learning, 2(4), 315 – 318 50 [25] Meng, D., Zhang, X., Qin, K (2011) Soft rough fuzzy sets and soft fuzzy rough sets Computers & Mathematics with Applications, 62(12), 4635-4645 [26] Moein, S., Monadjemi, S A., Moallem, P (2009) A Novel Fuzzy-Neural Based Medical Diagnosis System International Journal of Biological and Medical Sciences, 4(3), 146 – 150 [27] Neog, T J., Sut, D K (2011) An Application of Fuzzy Soft Sets in Medical Diagnosis using Fuzzy Soft Complement International Journal of Computer Applications, 33, 30 – 33 [28] Own, C M (2009) Switching between type-2 fuzzy sets and intuitionistic fuzzy sets: an application in medical diagnosis Applied Intelligence, 31(3), 283-291 [29] Parthiban, L., Subramanian, R (2008) Intelligent heart disease prediction system using CANFIS and genetic algorithm International Journal of Biological, Biomedical and Medical Sciences, 3(3), 157 - 160 [30] Pawlak, Z (2002) Rough sets and intelligent data analysis Information sciences, 147(1), 1-12 [31] Ricci, F., Rokach, L., Shapira, B (2011) Introduction to recommender systems handbook (pp 1-35) Springer US [32] Rocchio, J J (1971) Relevance feedback in information retrieval [33] Rodriguez, R M., Martinez, L., Herrera, F (2012) Hesitant fuzzy linguistic term sets for decision making IEEE Transactions on Fuzzy Systems, 20(1), 109-119 [34] Salton, G (1989) Automatic text processing: The transformation, analysis, and retrieval of Reading: Addison-Wesley [35] Samuel, A E., Balamurugan, M (2012) Fuzzy max-min composition technique in medical diagnosis Applied Mathematical Sciences, 6(35), 1741-1746 [36] Sanchez, E (1976) Resolution of composition fuzzy relation equations Information Control, 30, 38-48 [37] Shinoj, T K., John, S J (2012) Intuitionistic Fuzzy Multi sets and its Application in Medical Diagnosis World Academy of Science, Engineering and Technology, 6, 1418-1421 [38] Son, L.H (2014a) Enhancing Clustering Quality of Geo-Demographic Analysis Using Context Fuzzy Clustering Type-2 and Particle Swarm Optimization Applied Soft Computing, 22, 566 – 584 51 [39] Son, L.H (2014b) HU-FCF: A Hybrid User-Based Fuzzy Collaborative Filtering Method in Recommender Systems Expert Systems With Applications, 41(15), 6861 – 6870 [40] Son, L.H (2014c) Optimizing Municipal Solid Waste Collection Using Chaotic Particle Swarm Optimization in GIS Based Environments: A Case Study at Danang City, Vietnam Expert Systems With Applications, 41 (18), 8062–8074 [41] Son, L.H (2015) DPFCM: A Novel Distributed Picture Fuzzy Clustering Method on Picture Fuzzy Sets Expert Systems With Applications, 42 (1), 51-66 [42] Son, L.H., Cuong, B.C., Lanzi, P.L., Thong, N.T (2012) A novel intuitionistic fuzzy clustering method for geo-demographic analysis Expert Systems with Applications, 39(10), 9848-9859 [43] Son, L.H., Cuong, B.C., Long, H.V (2013) Spatial interaction–modification model and applications to geo-demographic analysis Knowledge-Based Systems, 49, 152-170 [44] Son, L.H., Lanzi, P.L., Cuong, B.C., Hung, H.A (2012) Data Mining in GIS: A Novel Context-Based Fuzzy Geographically Weighted Clustering Algorithm International Journal of Machine Learning and Computing, 2(3), 235 – 238 [45] Son, L.H., Linh, N.D., Long, H.V (2014) A lossless DEM compression for fast retrieval method using fuzzy clustering and MANFIS neural network Engineering Applications of Artificial Intelligence, 29, 33–42 [46] Son, L H., & Thong, N T (2015) Intuitionistic fuzzy recommender systems: An effective tool for medical diagnosis Knowledge-Based Systems, 74, 133-150 [47] Szmidt, E., Kacprzyk, J (2001) Intuitionistic fuzzy sets in some medical applications Proceeding of Computational Intelligence Theory and Applications, 148-151 [48] Szmidt, E., Kacprzyk, J (2003) An intuitionistic fuzzy set based approach to intelligent data analysis: an application to medical diagnosis Proceeding of Recent advances in intelligent paradigms and applications, 57-70 [49] Szmidt, E., Kacprzyk, J (2004) A similarity measure for intuitionistic fuzzy sets and its application in supporting medical diagnostic reasoning Proceeding of Artificial Intelligence and Soft Computing (ICAISC 2004), 388-393 52 [50] Tan, K C., Yu, Q., Heng, C M., Lee, T H (2003) Evolutionary computing for knowledge discovery in medical diagnosis Artificial Intelligence in Medicine, 27(2), 129-154 [51] University of California (2007) UCI Repository of Machine Learning Databases URL: http://archive.ics.uci.edu/ml/ [52] Xiao, Z., Yang, X., Niu, Q., Dong, Y., Gong, K., Xia, S., Pang, Y (2012) A new evaluation method based on D–S generalized fuzzy soft sets and its application in medical diagnosis problem Applied Mathematical Modelling, 36(10), 4592-4604 [53] Yao, Y (2010) Three-way decisions with probabilistic rough sets Information Sciences, 180(3), 341-353 [54] Zadeh, L A (1965) Fuzzy sets Information and Control, 8, 338-353 [55] Zhang, X., Zhou, B., Li, P (2012) A general frame for intuitionistic fuzzy rough sets Information Sciences, 216, 34-49 53 ... Tập mờ Tập mờ trực cảm Giá trị mờ trực cảm Hệ tư vấn Hệ tư vấn mờ trực cảm Hệ tư vấn mờ trực cảm đơn tiêu chí Hệ tư vấn mờ trực cảm đa tiêu chí Ma trận mờ trực cảm Ma trận hợp thành mờ trực cảm. .. kiến thức toán chẩn đoán bệnh, tập mờ trực cảm hệ tư vấn 48 Trình bày nghiên cứu nhóm đề xuất Đó hệ tư vấn mờ trực cảm cho toán chẩn đoán bệnh bao gồm định nghĩa hệ tư vấn mờ trực cảm, số phép... liên quan sử dụng RS toán chẩn đoán bệnh 25 CHƯƠNG HỆ TƯ VẤN MỜ TRỰC CẢM I Giới thiệu Trong chương giới thiệu định nghĩa hệ tư vấn mờ trực cảm đơn tiêu chí (SC-IFRS) hệ tư vấn mờ trực cảm đa tiêu

Ngày đăng: 08/12/2019, 22:24

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w