1. Trang chủ
  2. » Luận Văn - Báo Cáo

Tiểu luận khai phá dữ liệu: Sử dụng weka để phân lớp trên dataset Acute Inflammationsnt

14 587 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 14
Dung lượng 629,68 KB

Nội dung

BTL KHAI PHÁ DỮ LIỆU Đềbài :Acute Inflammations Sinh viên thực hiện: PhạmTrungKiên Lớp : HTTT6 GVHD :Hồ Nhật Quang 1.Mô tả bài toán Đưa ra danh sáhc các bệnh nhân có các triệu chứng để chuẩn đoán xem bệnh nhân đó có mắc bệnh về đường tiết niệu không(viêm bàng quang hay viêm thận).Ví dụ: viêm bàng quang tiết niệu cấp tính đặc trưng bởi sẹ xuất hiện đột ngột của đau ở vùng bụng và đi tiểu dưới hình thức nước tiểu liên tục bị đảy ra, đi tiểu rát và đôi khi thiếu trong việc giữ nước tiểu.Nhiệt độ cơ thể tăng lên tuy nhiên thường ko ở trên 38C, nước tiểu bài tiết đục và đôi khi có máu -Giải quyết bài toán: sử dụng J48 trong Weka để đưa ra cây quyết định xem bệnh nhân có mắc bệnh viêm bàng quang hay viêm thận hay không 2.Xây dựng cơ sở dữ liệu -Dataset sửdụng: Acute Inflammations -Thông tin dataset

Phạm Trung Kiên – Khai phá dữ liệu 2011 BTL KHAI PHÁ DỮ LIỆU Đềbài :Acute Inflammations Sinh viên thực hiện: PhạmTrungKiên Lớp : HTTT6 GVHD :Hồ Nhật Quang 1.Mô tả bài toán Đưa ra danh sáhc các bệnh nhân có các triệu chứng để chuẩn đoán xem bệnh nhân đó có mắc bệnh về đường tiết niệu không(viêm bàng quang hay viêm thận).Ví dụ: viêm bàng quang tiết niệu cấp tính đặc trưng bởi sẹ xuất hiện đột ngột của đau ở vùng bụng và đi tiểu dưới hình thức nước tiểu liên tục bị đảy ra, đi tiểu rát và đôi khi thiếu trong việc giữ nước 1 Phạm Trung Kiên – Khai phá dữ liệu 2011 tiểu.Nhiệt độ cơ thể tăng lên tuy nhiên thường ko ở trên 38C, nước tiểu bài tiết đục và đôi khi có máu -Giải quyết bài toán: sử dụng J48 trong Weka để đưa ra cây quyết định xem bệnh nhân có mắc bệnh viêm bàng quang hay viêm thận hay không 2.Xây dựng cơ sở dữ liệu -Dataset sửdụng: Acute Inflammations -Thông tin dataset -Các thuộc tính: Temperature of patient { 35C-42C } Occurrence of nausea { yes, no } Lumbar pain { yes, no } 2 Phạm Trung Kiên – Khai phá dữ liệu 2011 Urine pushing (continuous need for urination) { yes, no } Micturition pains { yes, no } Burning of urethra, itch, swelling of urethra outlet { yes, no } Decision: Inflammation of urinary bladder { yes, no } Decision: Nephritis of renal pelvis origin { yes, no } -Training data 3.TIến hành trong Weka -Đưa dữ liệu vào Weka 3 Phạm Trung Kiên – Khai phá dữ liệu 2011 -Sử dụng toàn bộ dữ liệu để training 4 Phạm Trung Kiên – Khai phá dữ liệu 2011 -Nội dung kếtquả === Run information === Scheme: weka.classifiers.trees.J48 -C 0.25 -M 2 Relation: Acute Instances: 120 Attributes: 8 Temperature of patient Occurrence of nausea Lumbar pain 5 Phạm Trung Kiên – Khai phá dữ liệu 2011 Urine pushing Micturition pains Burning of urethra, itch, swelling of urethra outle Viêmbàngquang Viêmthận Test mode: evaluate on training data === Classifier model (full training set) === J48 pruned tree ------------------ Occurrence of nausea = no | Lumbar pain = yes | | Urine pushing = no: no (20.0) | | Urine pushing = yes: yes (21.0) | Lumbar pain = no: no (50.0) Occurrence of nausea = yes: yes (29.0) Number of Leaves : 4 6 Phạm Trung Kiên – Khai phá dữ liệu 2011 Size of the tree : 7 Time taken to build model: 0 seconds === Evaluation on training set === === Summary === Correctly Classified Instances 120 100 % Incorrectly Classified Instances 0 0 % Kappa statistic 1 Mean absolute error 0 Root mean squared error 0 Relative absolute error 0 % Root relative squared error 0 % Total Number of Instances 120 === Detailed Accuracy By Class === 7 Phạm Trung Kiên – Khai phá dữ liệu 2011 TP Rate FP Rate Precision Recall F-Measure ROC Area Class 1 0 1 1 1 1 no 1 0 1 1 1 1 yes Avg. 1 0 1 1 1 1 === Confusion Matrix === a b<-- classified as 70 0 | a = no 0 50 | b = yes -Cây quyết định 8 Phạm Trung Kiên – Khai phá dữ liệu 2011 -95% dữ liệu để xây dựng, 5% dữ liệu test 9 Phạm Trung Kiên – Khai phá dữ liệu 2011 -90% dữliệuđểxâydựng, 10% dữliệu test 10

Ngày đăng: 03/12/2013, 21:08

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w