1. Trang chủ
  2. » Luận Văn - Báo Cáo

(Luận văn) phương pháp xây dựng cây quyết định dựa trên tập phụ thuộc hàm xấp xỉ

97 0 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Nội dung

ĐẠI HỌC THÁI NGUYÊN TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG NGUYỄN ĐĂNG NGUYÊN lu an n va p ie gh tn to PHƯƠNG PHÁP XÂY DỰNG CÂY QUYẾT ĐỊNH DỰA TRÊN TẬP PHỤ THUỘC HÀM XẤP XỈ d oa nl w nf va an lu lm ul LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH z at nh oi z m co l gm @ an Lu THÁI NGUYÊN - 2017 n va http://www lrc.tnu.edu.vn/ ac th Số hóa Trung tâm Học liệu - ĐHTN si ĐẠI HỌC THÁI NGUYÊN TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG NGUYỄN ĐĂNG NGUYÊN lu an n va gh tn to PHƯƠNG PHÁP XÂY DỰNG CÂY QUYẾT ĐỊNH DỰA TRÊN TẬP PHỤ THUỘC HÀM XẤP XỈ p ie Chuyên ngành: Khoa học máy tính Mã số: 60 48 01 01 d oa nl w nf va an lu LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH z at nh oi lm ul Người hướng dẫn khoa học: TS LÊ VĂN PHÙNG z m co l gm @ va http://www lrc.tnu.edu.vn/ n Số hóa Trung tâm Học liệu - ĐHTN an Lu THÁI NGUYÊN - 2017 ac th si i LỜI CAM ĐOAN Tơi xin cam đoan luận văn thực hiện, hướng dẫn khoa học TS Lê Văn Phùng, số liệu kết nghiên cứu luận văn hoàn toàn trung thực chưa sử dụng để bảo vệ cơng trình khoa học nào, thơng tin, tài liệu trích dẫn luận văn rõ nguồn gốc Mọi giúp đỡ cho việc hoàn thành luận văn cảm ơn Nếu sai tơi hồn tồn chịu trách nhiệm Thái Nguyên, tháng 05 năm 2017 lu Học viên an n va to p ie gh tn Nguyễn Đăng Nguyên d oa nl w ll u nf va an lu oi m z at nh z m co l gm @ an Lu va Số hóa Trung tâm Học liệu - ĐHTN http://www lrc.tnu.edu.vn/ n ac th si ii LỜI CẢM ƠN Trước hết em xin trân trọng cảm ơn thầy giáo, cô giáo trường Đại học Công nghệ Thông tin Truyền thông giảng dạy em trình học tập chương trình sau đại học Dù rằng, trình học tập có nhiều khó khăn việc tiếp thu kiến thức sưu tầm tài liệu học tập, với nhiệt tình tâm huyết thầy với nỗ lực thân giúp em vượt qua trở ngại Em xin bày tỏ lòng biết ơn sâu sắc tới thầy giáo TS.Lê Văn Phùng lu người hướng dẫn khoa học, tận tình hướng dẫn em suốt trình an làm luận văn va n Xin chân thành cảm ơn bạn bè, đồng nghiệp, bạn học viên lớp tn to cao học CK14A, người thân gia đình động viên, chia sẻ, tạo Một lần em xin chân thành cảm ơn! p ie gh điều kiện giúp đỡ suốt trình học tập làm luận văn w oa nl Thái Nguyên, tháng 05 năm 2017 d Học viên u nf va an lu ll Nguyễn Đăng Nguyên oi m z at nh z m co l gm @ an Lu va Số hóa Trung tâm Học liệu - ĐHTN http://www lrc.tnu.edu.vn/ n ac th si iii MỤC LỤC LỜI CAM ĐOAN i LỜI CẢM ƠN ii MỤC LỤC iii DANH MỤC TỪ VIẾT TẮT VÀ KÍ HIỆU SỬ DỤNG vi DANH MỤC CÁC BẢNG vii DANH MỤC CÁC HÌNH viii THUẬT NGỮ TIẾNG ANH ix lu an MỞ ĐẦU n va Chương 1: TỔNG QUAN VỀ CÂY QUYẾT ĐỊNH VÀ PHỤ tn to THUỘC HÀM XẤP XỈ gh 1.1 Tổng quan khai phá liệu định p ie 1.1.1 Khái niệm khai phá liệu, trình phát triển ứng dụng w việc phát tri thức oa nl 1.1.2 Khái quát phương pháp khai phá liệu phổ biến d 1.2 Phụ thuộc hàm xấp xỉ lu va an 1.2.1 Khái niệm phụ thuộc hàm mơ hình CSDL quan hệ u nf 1.2.2 Khái niệm phụ thuộc hàm xấp xỉ đặc trưng chúng 13 ll 1.3 Kết luận chương 18 m oi Chương 2: MỘT SỐ THUẬT TOÁN XÁC ĐỊNH PHỤ THUỘC z at nh HÀM XẤP XỈ VÀ XÂY DỰNG CÂY QUYẾT ĐỊNH 17 z 2.1 Thuật toán TANE xác định phụ thuộc hàm xấp xỉ từ quan hệ 19 gm @ 2.1.1 Khái niệm lớp tương đương phân hoạch 19 l 2.1.2 Phân hoạch mịn 20 m co 2.1.3 Thuật toán TANE cải tiến 24 an Lu 2.1.4 Chiến lược tìm kiếm 24 2.2 Thuâ ̣t toán xác đinh ̣ phụ thuộc hàm xấ p xỉ dựa luật kết hợp 38 va Số hóa Trung tâm Học liệu - ĐHTN http://www lrc.tnu.edu.vn/ n ac th si iv 2.2.1 Luật kết hợp 38 2.2.2.Biểu diễn PTH xấp xỉ qua LKH 41 2.2.3 Đô ̣ hỗ trơ ̣ của PTH xấ p xỉ và tính không tầ m thường 45 2.2.4 Đinh ̣ nghiã PTH xấp xỉ mạnh [14] 47 2.2.5 Biể u diễn đô ̣ đo, đô ̣ hỗ trơ ̣, đô ̣ chính xác qua lý thuyế t PTH xấ p xỉ 48 2.2.6 Thuâ ̣t toán xác đinh ̣ PTH xấ p xỉ dựa LKH 52 2.3 Thuật toán xác định phụ thuộc hàm xấp xỉ dựa phủ tối thiểu lớp tương đương 54 2.3.1 Khái niệm Phủ tối thiểu mệnh đề liên quan 54 lu an 2.3.2 Thuật tốn tìm Phủ tối thiểu 56 n va 2.3.3 Thuật toán khai phá PTH xấp xỉ nhờ phủ tối thiểu lớp tương đương 57 tn to 2.3.4 Độ phức tạp thuật toán khai phá PTH xấp xỉ sử dụng phủ tối gh thiểu lớp tương đương 60 p ie 2.4 Thuật toán xây dựng định dựa phụ thuộc hàm xấp xỉ 61 w 2.4.1 Giải thuật chung xây dựng định 61 oa nl 2.4.2 Giải thuật xây dựng định dựa tập PTH xấp xỉ phân lớp 67 d 2.5 Kết luận chương 69 lu va an Chương 3: CHƯƠNG TRÌNH THỬ NGHIỆM XÂY DỰNG CÂY u nf QUYẾT ĐỊNH CHẨN ĐOÁN BỆNH TẠI BỆNH VIỆN ĐA KHOA ll TRUNG ƯƠNG THÁI NGUYÊN DỰA TRÊN VIỆC KHAI PHÁ m oi TẬP PTH XẤP XỈ 70 z at nh 3.1 Mô tả Bài toán chẩn đoán bệnh cúm bệnh viện đa khoa Trung z ương Thái Nguyên yêu cầu chương trình 70 gm @ 3.1.1 Giới thiệu bệnh Cúm 70 l 3.1.2 Quy trình chẩn đốn xác định bệnh cúm 71 m co 3.2 Tập liệu huấn luyện (input) 74 an Lu 3.3 Ứng dụng hai thuật toán 2.3 2.4 để xác định tập phụ thuộc hàm xấp xỉ xây dựng định chẩn đoán bệnh 75 va Số hóa Trung tâm Học liệu - ĐHTN http://www lrc.tnu.edu.vn/ n ac th si v 3.4 Thiết kế chương trình 76 3.5 Các giao diện chương trình 77 3.6 Đánh giá kết thử nghiệm 82 3.7 Kết luận chương 83 KẾT LUẬN CHUNG 84 Kết đạt luận văn 84 Hướng phát triển đề tài 84 TÀI LIỆU THAM KHẢO 85 lu an n va p ie gh tn to d oa nl w ll u nf va an lu oi m z at nh z m co l gm @ an Lu va Số hóa Trung tâm Học liệu - ĐHTN http://www lrc.tnu.edu.vn/ n ac th si vi DANH MỤC TỪ VIẾT TẮT VÀ KÍ HIỆU SỬ DỤNG Từ Ký hiệu Diễn giải R U  Quan ̣ tâ ̣p thuộc U U   A1 , , A m  Tâ ̣p m thuộc tính Lược đồ quan ̣ với U tâ ̣p thuộc tính, F là tâ ̣p S = phu ̣ thuộc hàm U lu an LĐQH Lươ ̣c đồ quan ̣ CSDL Cơ sở liệu PTH Phu ̣ thuô ̣c hàm KPDL Khai phá liệu n va p ie gh tn to d oa nl w ll u nf va an lu oi m z at nh z m co l gm @ an Lu va Số hóa Trung tâm Học liệu - ĐHTN http://www lrc.tnu.edu.vn/ n ac th si vii DANH MỤC CÁC BẢNG Bảng 1.1 Ví du ̣ về quan ̣ Bảng 1.2 Các thuật toán khám phá phụ thuộc hàm 12 Bảng 1.3: Bảng quan hệ ví dụ 17 Bảng 1.4: Bảng quan hệ ví dụ phụ thuộc hàm điều kiện 18 Bảng 2.1 Bảng quan hệ minh họa cho phân hoạch 20 Bảng 2.2 Bảng quan hệ ví dụ cho phân hoạch mịn 21 Bảng 2.3: Bảng quan hệ minh họa cho PTH xấp xỉ 22 lu an Bảng 2.4 Ví du ̣ về CSDL giao tác D 38 n va Bảng 2.5 Ví du ̣ về các tâ ̣p phổ biế n với đô ̣ hỗ trơ ̣ tương ứng, minsupp = tn to 50% 39 gh Bảng 2.6 Mô ̣t quan ̣ R 43 p ie Bảng 2.7.Tâ ̣p các giao tác TD của R 45 d oa nl w Bảng 2.8 Một số LKH TD tương ứng với PTH xấp xỉ R 45 ll u nf va an lu oi m z at nh z m co l gm @ an Lu va Số hóa Trung tâm Học liệu - ĐHTN http://www lrc.tnu.edu.vn/ n ac th si viii DANH MỤC CÁC HÌNH Hình 1.1 Quá trình phát tri thức Hình 1.2 Các loại phụ thuộc liệu Hình 1.3 Kỹ thuật phát phụ thuộc hàm 12 Hình 2.1 Dàn cho thuộc tính (A, B, C, D, E) 24 Hình 2.2 Một tập cắt tia chứa dàn cho {A,B,C,D} 26 Hình 2.3 Cây trước cắt tỉa 65 Hình 2.4 Cây sau cắt tỉa 67 lu an n va p ie gh tn to d oa nl w ll u nf va an lu oi m z at nh z m co l gm @ an Lu va Số hóa Trung tâm Học liệu - ĐHTN http://www lrc.tnu.edu.vn/ n ac th si 72  Đau đầu liên tục, đau nhiều vùng thái dương, vùng trán, dội lên kèm theo hoa mắt chóng mặt ù tai  Đau mỏi tồn thân đau bắp khớp, đau dọc sống lưng, đau ngang thắt lưng, xoa bóp khớp đỡ đau Dựa vào triệu chứng bệnh nêu Nếu hết giai đoạn khám lâm sàng này, bác sĩ nghi ngờ bệnh cúm đưa câu trả lời phủ định bệnh cúm, gợi ý khả bệnh nhân mắc bệnh khác Bệnh nhân khuyên nên quay lại bệnh nặng mà không rõ nguyên lu an Bước 2: Làm xét nghiệm n va Số lượng bạch cầu máu ngoại vi bình thường giảm, Lymphocyte tăng tn to Để chẩn đoán xác định mầm bệnh phải dựa vào xét nghiệm đặc hiệu gh Phản ứng Hirst: Là phản ứng huyết dựa nguyên lý kỹ thuật p ie ức chế ngưng kết hồng cầu (HI) Lấy máu lần cách 7-10 ngày lần đầu w lấy sớm tốt Kết dương tính hiệu giá kháng thể đạt 1/1280 oa nl hiệu giá kháng thể lần tăng gấp lần trở lên d Phản ứng kết hợp bổ thể lu va an Phản ứng miễn dịch huỳnh quang: Cho phép chẩn đốn sớm, kết u nf xác tỷ lệ (+) 60- 70% sau 3-4 ll Phân lập vi rút: Có giá trị chẩn đốn định Lấy dịch mũi họng, lấy oi m máu, cấy tổ chức phôi gà z at nh Các kỹ thuật xét nghiệm: Elisa, Mac- Elisa, PCR, RT- PCR, kính hiển z vi điện tử…được áp dụng để xác định chủng virut cúm đặc biệt có an Lu va Số hóa Trung tâm Học liệu - ĐHTN m co Bệnh nhân cúm thể thông thường l Nguyên tắc điều trị gm Bước 3: Điều trị @ typ xuất http://www lrc.tnu.edu.vn/ n ac th si 73 Cách ly nghỉ ngơi giường hết sốt đề phòng biến chứng Ăn lỏng đủ dinh dưỡng, uống đủ nước, tăng cường loại sinh tố Cho bệnh nhân thuốc an thần: Seduxen, rotunda… thuốc giảm ho long đờm, sirocodein, tecpincodein Kháng sinh dùng trường hợp bội nhiễm vi khuẩn Bệnh nhân cúm thể nặng (ác tính), nhiều virut cúm H5 N1 Bệnh nhân nghi ngờ phải cách ly Dùng thuốc kháng virut sớm tốt, từ ngày đầu bệnh lu an Hồi sức chống suy hô hấp n va Điều trị bội nhiễm, biến chứng suy đa phủ tạng tn to Điều trị nguyên nhân Tamiflu (Oseltamivir) p ie gh Thuốc kháng virut: Chỉ định cho trường hợp nặng w Trẻ em từ 1- 13 tuổi: dùng dung dịch uống tuỳ theo trọng lượng thể oa nl < 15kg : 30mg x lần/ ngày x ngày d 16- 23kg : 45mg x lần/ ngày x ngày lu va an 24- 40kg : 60mg x lần/ ngày x7 ngày u nf Người lớn trẻ em 13 tuổi: 75mg x lần/ ngày x ngày ll Cần theo dõi chức gan, thận để điều chỉnh cho phù hợp oi m Amatadine z at nh 1-9 tuổi : 50mg x 2lần/ ngày x ngày z > tuổi : 100mg x lần/ ngày x ngày m co > tuổi : 2- viên x lần/ ngày x ngày l 1- tuổi : viên x lần/ ngày x ngày gm @ Ribavirin viên 400mg Người lớn: 1- 6ml tiêm bắp thịt lần va Số hóa Trung tâm Học liệu - ĐHTN an Lu Gammaglobulin chống cúm lấy từ huyết người cho máu http://www lrc.tnu.edu.vn/ n ac th si 74 Trẻ em: 1- 3ml tiêm bắp thịt 1-2 lần Huyết khô chống cúm Nga dạng bột phun vào mũi 1- lần InTerferon: Để bảo vệ tế bào chưa bị virut phá huỷ Điều trị theo chế bệnh sinh Điều trị suy hô hấp cấp Thở ôxy 1- lít/phút để SPO2 > 90% Thở ơxy cao áp: Khi thở ơxy qua mũi khơng cải thiện tình trạng giảm ôxy máu bắt đầu cho thở với CPAP = cm H2O, sau điều chỉnh mức CPAP theo tình trạng bệnh nhân với mức thay đổi cm H2O để trì SPO2 lu an > 90% Mức CPAP tối đa đạt tới 10m H2O n va Thơng khí nhân tạo biện pháp khơng cải thiện tình tn to trạng hơ hấp ie gh Truyền dịch bù nước điện giải: Trung bình 1200 - 1500ml/ ngày cho p bệnh nhân người lớn, ý tránh phù phổi nl w Trợ tim mạch, chống sốc d oa Cocticoid: Có thể dùng thuốc an lu Methylprenisolon 0,5 - 1,0 mg/kg/ ngày x ngày, tiêm tĩnh mạch chậm u nf va Hydrocortisone 100mg x lần/ ngày x ngày Depersolon 30mg x lần/ ngày x ngày ll oi m Prednisolon 0,5 - 1,0 mg/kg/ ngày x ngày uống z at nh Kháng sinh: Liều cao phối hợp để phòng điều trị bội nhiễm vi khuẩn thuốc nhóm Cephalosporin, Quinolon… z gm @ Bảo đảm chế độ dinh dưỡng chăm sóc: Cho ăn sữa bột dinh dưỡng l qua ống thông dày Nuôi dưỡng đường tĩnh mạch không ăn m co Chống loét: cho bệnh nhân nằm đệm nước, xoa bóp thay đổi tư 3.2 Tập liệu huấn luyện (input) va Số hóa Trung tâm Học liệu - ĐHTN an Lu Chăm sóc hơ hấp: Giúp bệnh nhân ho, khạc vỗ rung vùng ngực, hút đờm http://www lrc.tnu.edu.vn/ n ac th si 75 CSDL bệnh nhân cúm cung cấp bác sĩ CKII Hoàng Thị Thư - Trưởng khoa Bệnh Nhiệt Đới - Bệnh viện Đa khoa Trung ương Thái Nguyên Xây dựng CSDL ban đầu gồm có 50 bệnh nhân Mỗi bệnh nhân gồm có 12 thuộc tính điều kiện thuộc tính định (Cúm ={Có, Khơng}) Triệu chứng Giá trị thể lu an n va Có/ khơng Dauco (Đau cơ) Có/ khơng Thannhiet (Thân nhiệt)-sốt cao(có)/ Bìnhthường(khơng) Onlanh (Ớn lạnh) Có/ khơng Chongmat (Chóng mặt) Có/ khơng Metmoi (Mệt mỏi) Có/ khơng tn to Daudau (Đau đầu) Ho (Ho) Có/ khơng gh Dauhong (Đau họng) p ie Có/ khơng Có/ khơng 10 Nghetmui (Nghẹt mũi) Có/ khơng oa nl w Chaynuocmui (Chảy nước mũi) 11 Non (Nơn) Có/ khơng d 12 Tieuchay (Tiêu chảy) Có/ khơng u nf va 13 Cum (Cúm) an lu Có/ khơng ll 3.3 Ứng dụng hai thuật toán 2.3 2.4 để xác định tập phụ thuộc hàm m oi xấp xỉ xây dựng định chẩn đoán bệnh z at nh Mục đích tốn chẩn đốn bệnh lâm sàng dựa vào triệu chứng bệnh nhân mắc phải mà đưa kết luận bệnh nhân có mắc bệnh z gm @ hay khơng bệnh nhân có triệu chứng kết luận bệnh l nhân mắc bệnh nên toán chẩn đốn bệnh lâm sàng ta chủ yếu m co sử dụng mối quan hệ định phụ thuộc hàm để xây dựng va Số hóa Trung tâm Học liệu - ĐHTN an Lu suy diễn để chẩn đốn q trình chẩn đốn bệnh http://www lrc.tnu.edu.vn/ n ac th si 76 Trong thực tế ta thường dựa vào triệu chứng để chẩn đoán bệnh bệnh nhân lại có triệu chứng khác việc xây dựng định từ tập phụ thuộc hàm không thật cần thiết hay mang nhiều ý nghĩa thực tế cơng tác chẩn đốn bệnh khơng tham gia vào q trình chẩn đoán bệnh Nếu dựa vào định xây dựng để sử dụng cơng tác chẩn đốn không đem lại hiệu mong muốn Bài toán chẩn đoán bệnh lâm sàng thiết kế xử lý theo chiều xây dựng phụ thuộc hàm xấp xỉ từ định Từ CSDL với 12 thuộc tính lu an điều kiện cho bệnh nhân, suy luật, chẳng hạn như: n va If tn to (Daudau = có) and (Dauco = có) and (Thannhiet = cao) and (Onlanh then p ie gh = có) and (Metmoi = có) and (Ho = có) and (Dauhong = có) Cum = có w oa nl Từ định ta dễ dàng xác định thuộc tính d cần thiết tham gia vào việc định bệnh nhân có mắc bệnh cúm hay lu va an không Dựa phủ tối thiểu ta rút tập phụ thuộc hàm tối tiểu thể 3.4 Thiết kế chương trình ll u nf tri thức chẩn đoán bệnh m oi - Bài toán thử nghiệm chẩn đoán lâm sàng phương pháp Phủ tối z at nh thiểu để xác định tập PTH tối thiểu gồm chức sau: z Chức năng: Giới thiệu chương trình liên kết mô đun gm @ Chức năng: Quản lý danh sách thuộc tính định l Chức năng: Xác định Phủ tối thiểu định m co Chức năng: Thực hành chẩn đoán bệnh nhân bị cúm an Lu va Số hóa Trung tâm Học liệu - ĐHTN http://www lrc.tnu.edu.vn/ n ac th si 77 lu 3.5 Các giao diện chương trình an n va  Giao diện hình p ie gh tn to d oa nl w ll u nf va an lu oi m z at nh Chương trình gồm menu “Dữ liệu”, “Huấn luyện”, “Chẩn đốn z bênh” menu khác “Chương trình” “Giới thiệu” @ m co l xây dựng định chẩn đoán bệnh cúm gm - Menu “Dữ liệu”: mở giao diện cho nhập xem liệu huấn luyện để - Menu “Huấn luyện” mở giao diện thực tìm tập phủ tối tiểu an Lu phụ thuộc hàm xấp xỉ thực xây dựng định va Số hóa Trung tâm Học liệu - ĐHTN http://www lrc.tnu.edu.vn/ n ac th si 78 - Menu “Chẩn đoán bệnh cúm” mở giao diện cho phép người dùng chẩn đoán khả mắc bệnh cúm bệnh nhân với triệu chứng thu - Menu “Chương trình”: chứa nút lệnh tắt chương trình - Menu “Giới thiệu”: mở form giới thiệu chương trình, tác giả lu an n va p ie gh tn to d oa nl w ll u nf va an lu oi m z at nh z m co l gm @ an Lu va Số hóa Trung tâm Học liệu - ĐHTN http://www lrc.tnu.edu.vn/ n ac th si 79  Giao diện nhập liệu huấn luyện lu an n va p ie gh tn to - Nút chọn liệu để chọn file excel chứa bảng liệu huấn luyện bệnh cúm Bảng liệu gồm 13 cột (12 thuộc tính triệu chứng cột “Cúm” oa nl w kết có mắc bệnh cúm hay khơng người bệnh) Chương trình cho d phép đọc liệu từ file excel 2003 2007 trở lên (*.xls *.xlsx) an lu - Khi chọn file liệu hợp lệ, liệu cập nhật vào hệ thống ll u nf va hiển thị giao diện oi m z at nh z m co l gm @ an Lu va Số hóa Trung tâm Học liệu - ĐHTN http://www lrc.tnu.edu.vn/ n ac th si 80  Giao diện huấn luyện lu an n va p ie gh tn to - Giao diện huấn luyện gồm vùng thể cho thuật tốn: tìm tập phủ tối tiểu phụ thuộc hàm xấp xỉ theo ngưỡng sai số xây dựng oa nl w định d - Tìm tập phủ tối tiểu phụ thuộc hàm xấp xỉ: người dùng nhập an lu ngưỡng sai số tính theo % (0< 

Ngày đăng: 24/07/2023, 09:27