0

tiểu luận khai phá dữ liệu sử dụng phần mềm weka phân lớp cho bộ dữ liệu golf dataset bằng cây quyết định c4 5

Tiểu luận khai phá dữ liệu: Sử dụng phần mềm Weka phân lớp cho bộ dữ liệu  golf dataset bằng cây quyết định C4.5

Tiểu luận khai phá dữ liệu: Sử dụng phần mềm Weka phân lớp cho bộ dữ liệu golf dataset bằng cây quyết định C4.5

Lập trình

... toán xây dựng định: Dữ liệu vào: Tập liệu D, tập danh sách thuộc tính, tập nhãn lớp Dữ liệu ra: Mô hình định Thuật toán: Tạocây(Tập liệu E, tập danh sách thuộc tính F, tập nhãn lớp) Nếu điều_kiện_dừng(E,F) ... kết phân loại phân lóp Detailed Accuracy By Class === TP Rate FP Rate Precision Recall F-Measure ROC Area Class 0. 25 0 0 .5 dont_play 0. 75 0.6 0. 75 0.667 0 .5 play Weighted Avg 0 .5 0. 75 0.4 0 .5 0.444 ... ta đến chơi golf Để thực điều đó, anh cần hiểu khách hàng định chơi tìm hiểu xem có cách giải thích cho việc hay không Người ta thu bảng số liệu sau: Chúng ta sử dụng thuật toán c4. 5 để giải do:...
  • 11
  • 1,087
  • 7
Tiểu luận Khai phá dữ liệu : sử dụng phần mềm WEKA cho bộ dữ liệu Tic Tac Toe

Tiểu luận Khai phá dữ liệu : sử dụng phần mềm WEKA cho bộ dữ liệu Tic Tac Toe

Lập trình

... xác định lớp (class) đối tượng cho thuộc lớp lớp cho trước (given categories) Khác với toán phân cụm (clustering), liệu dùng để xây dựng mô hình (Training Data) toán phân lớp phải xác định lớp ... hình phân lớp đối tượng Quy trình thực huấn luyện phân lớp với mẫu liệu Tic Tac Toe.arff Test set  Dữ liệu xây dựng mô hình  Dữ liệu để xây dựng mô hình: liệu gốc (original dataset) , liệu phải ... thuộc tính tập liệu có kiểu liệu rời rạc Bài toán phân lớp - Phân lớp theo tình trạng nước cờ, có trạng thái Positive (thuận lợi) Negative( bất lợi) Giải toán sử dụng phân lớp Xử lý liệu đầu vào:...
  • 11
  • 1,145
  • 3
Tiểu luận Khai phá dữ liệu: Sử dụng phần mềm weka khai phá bộ dữ liệu Gamers với thuật toán phân lớp

Tiểu luận Khai phá dữ liệu: Sử dụng phần mềm weka khai phá bộ dữ liệu Gamers với thuật toán phân lớp

Lập trình

... Area Class 0.6 25 0. 45 0.7 35 0.6 25 0.676 0 .58 7 Co 0 .55 0.3 75 0.423 0 .55 0.478 0 .58 7 Khong Weighted Avg 0.6 0.4 25 0.631 0.6 0.61 0 .58 7 === Confusion Matrix === a b < classified as 25 15 | a = Co 11 ... chơi , nhà phát hành game kết luận họ có chơi game hay không Thuật toán phân lớp lựa chọn áp dụng liệu II Thực nghiệm WEKA Tiền xử lý liệu: Trong qui trình khai phá liệu, công việc xử lý liệu trước ... of Instances 151 === Detailed Accuracy By Class === TP Rate FP Rate Precision Recall F-Measure ROC Area Class 0 .58 5 0.667 0 .59 1 0 .58 5 0 .58 8 0. 45 Co 0.333 0.4 15 0.328 0.333 0.33 0. 45 Khong Weighted...
  • 16
  • 1,586
  • 35
Tiểu luận Khai phá dữ liệu: Sử dụng phần mềm weka khai phá bộ dữ liệu Congressional Voting Records

Tiểu luận Khai phá dữ liệu: Sử dụng phần mềm weka khai phá bộ dữ liệu Congressional Voting Records

Lập trình

... thiệu tiền xử lý liệu (Data Preprocessing) - Trong qui trình khai phá liệu, công việc xử lý liệu trước đưa vào mô hình cần thiết, bước làm cho liệu có ban đầu qua thu thập liệu (gọi liệu gốc original ... Root relative squared error 0.0696 0. 153 3 14. 659 5 % 31.2338 % Coverage of cases (0. 95 level) 99 .53 92 % Mean rel region size (0. 95 level) 56 .2212 % 97.2 35 % 2.7 65 % Total Number of Instances 217 === ... lập false - ấn Apply ta liệu thuộc tính sex Làm tương tự cho thuộc tính Kết cuối ta thuộc tính sử dụng sau: - Ta lưu lại liệu thực thuật toán liệu IV- Thuật toán phân lớp 1- Thực thuật toán a-...
  • 19
  • 1,065
  • 5
Tiểu luận Khai phá dữ liệu: Sử dụng phần mềm weka khai phá bộ dữ liệu meta data

Tiểu luận Khai phá dữ liệu: Sử dụng phần mềm weka khai phá bộ dữ liệu meta data

Lập trình

... Meta Data -90% d liệu ểxâydựng, 10% d liệu test - 85% d liệu ểxâydựng, 15% liệu test 2011 Meta Data -70% d liệu ểxâydựng, 30% d liệu test 2011 Meta Data -50 % d liệu ểxâydựng, 50 % d liệu test 2011 ... absolute error 151 .54 01 Root mean squared error Relative absolute error Root relative squared error Total Number of Instances 764.994 100 % 100 % 52 8 -Cây định - 95% liệu để xây dựng, 5% liệu test 2011 ... {Ac2,Alloc80,BackProp,Bayes,BayesTree ,C4. 5, CART,Cal5,Cascade,Castle,Cn2,Default,Dipol92,D iscrim,ITrule,IndCART,KNN,Kohonen,LVQ,LogDisc,NewId,QuaDisc,RBF,Smart} Norm_error real -Training data 3.TIến hành Weka -Đưa liệu vào Weka...
  • 9
  • 1,397
  • 16
Tiểu luận Khai phá dữ liệu: Sử dụng phần mềm Weka phân lớp cho khả năng phê duyệt tín dụng cho các ứng dụng thẻ tín dụng

Tiểu luận Khai phá dữ liệu: Sử dụng phần mềm Weka phân lớp cho khả năng phê duyệt tín dụng cho các ứng dụng thẻ tín dụng

Lập trình

... Lần 7: lấy 95 % liệu test 52 5 96 621 chiếm chiếm 84 .54 11 % 15. 458 9 % Kết phân lớp sau: + Trường hợp phân lớp xác: + Trường hợp không xác: + Tổng số trường hợp: 55 7 98 655 chiếm chiếm 85. 0382 % 14.9618 ... chuẩn cho vấn đề khai phá liệu như: phân lớp, hồi quy, phân nhóm, phân cụm, luật kết hợp, thuộc tính kết hợp.Cụ thể đề tài em tìm hiểu toán phân lớp weka áp dụng toán phê duyệt tín dụng cho ứng dụng ... duyệt Đọc liệu đầu vào sau áp dụng toán phân lớp dựa vào thuộc tính để phân lớp khả phê duyệt tín dụng cho ứng dụng thẻ tín dụng Tạo định khả phê duyệt ứng dụng thẻ tín dụng để hỗ trợ cho việc...
  • 19
  • 2,007
  • 9
Tiểu luận Khai phá dữ liệu: Sử dụng phần mềm weka khai phá bộ dữ liệu STATLOG (Vehicle Silhouettes)

Tiểu luận Khai phá dữ liệu: Sử dụng phần mềm weka khai phá bộ dữ liệu STATLOG (Vehicle Silhouettes)

Lập trình

... Anh- Khai phá liệu - 85% d liệu ểxâydựng, 15% test 13 11/2011 Vũ Tuấn Anh- Khai phá liệu -80% d liệu ểxâydựng, 20% test 14 11/2011 Vũ Tuấn Anh- Khai phá liệu -60% d liệu ểxâydựng, 40% test 15 11/2011 ... Anh- Khai phá liệu a b c d < classified as 28 0 | a = van 19 0 | b = saab 0 26 | c = bus 16 | d = opel -Câyquyếtđịnh: - 95% d liệu ểxâydựng, 5% test 11 11/2011 Vũ Tuấn Anh- Khai phá liệu -90% d liệu ểxâydựng, ... Tuấn Anh- Khai phá liệu Cáclớp -Giải toán :Sử dụng J48 Weka dựa vào thuộc tính để đưa định xem bóng loại xe 2.Xây dựng sở liệu -Dataset sử dụng: STATLOG (Vehicle Silhouettes) -Thông tin dataset: ...
  • 16
  • 791
  • 3
Tiểu luận Khai phá dữ liệu: Sử dụng phần mềm weka khai phá bộ dữ liệu Abalone( bào ngư) với thuật toán phân lớp

Tiểu luận Khai phá dữ liệu: Sử dụng phần mềm weka khai phá bộ dữ liệu Abalone( bào ngư) với thuật toán phân lớp

Lập trình

... 0.1 657 84138 257 7434 Node 2.7 958 8080 755 17263 Node 2.893377 350 0 356 263 Node -5. 04346046 259 59 45 Node -11.0 952 59227784064 Sigmoid Node Inputs Weights Threshold 5. 76362817 351 0738 Attrib Length -6.00600871 453 6174 ... -8.96349777874 458 Sigmoid Node Inputs Weights Threshold -1 .59 91294080918697 Attrib Length -1.3 952 6 855 83391 653 Attrib Diameter 6.6299406 853 660106 Attrib Height 5. 52 850 9 358 996284 Attrib Whole 2 .52 603 657 0 756 588 ... 0.7 15 F 0.771 0.1 45 0.716 0.771 0.743 0.892 I Weighted Avg 0 .56 0.23 0 .55 5 0 .56 0 .55 1 0. 756 === Confusion Matrix === a b c < classified as 873 397 258 | a=M 7 25 430 152 | b=F 2 45 62 10 35 | c=I...
  • 15
  • 1,829
  • 7
Tiểu luận Khai phá dữ liệu: Sử dụng phần mềm weka khai phá bộ dữ liệu bank-data

Tiểu luận Khai phá dữ liệu: Sử dụng phần mềm weka khai phá bộ dữ liệu bank-data

Lập trình

... mô hình khai phá luật kết hợp không làm việc với kiểu liệu liên tục Quá trình goi rời rạc hóa liệu (Discretization) Nạp liệu (Loading the Data) Thông thường, định dạng chuẩn file liệu Weka la ... Spreadsheet cho phép tổ chức file liệu dạng file csv (comma-separated values) điều thuận lợi Weka cho phép đọc liệu từ file csv Nạp file liệu data-bank.csv: Chọn tab “Preprocess” > Open file Nếu không định ... "(34.333333 -50 .666667]" “ (50 .666667- inf)” Chúng ta thay đổi nhãn mà Weka tự động tạo nhãn dễ hiểu Chẳn hạn ta thay nhãn "(-inf-34.333333]" 0_34, nhãn "(34.33333 350 .666667]" 35_ 51 nhãn “ (50 .666667-...
  • 28
  • 4,852
  • 20
Tiểu luận KHAI PHÁ DỮ LIỆU: Sử dụng phần mềm Weka khai phá bộ dữ liệu Computer hardware với thuật toán phân lớp

Tiểu luận KHAI PHÁ DỮ LIỆU: Sử dụng phần mềm Weka khai phá bộ dữ liệu Computer hardware với thuật toán phân lớp

Lập trình

... navie bayes: 15 Vũ Trung Kiên – Lớp CNPM – Sử dụng weka để phân lớp cho dataset Computer Hardware - Với thuật toán J48: 16 Vũ Trung Kiên – Lớp CNPM – Sử dụng weka để phân lớp cho dataset Computer ... expression data Wiley) - Tính toán lỗi cho phân lớp Vũ Trung Kiên – Lớp CNPM – Sử dụng weka để phân lớp cho dataset Computer Hardware - Kết nhận phân lớp - Các phân lớp weka hỗ trợ bao gồm: Bayes: - NavieBayes ... Trung Kiên – Lớp CNPM – Sử dụng weka để phân lớp cho dataset Computer Hardware Với thuật toán Navie Bayes Với thuật toán J48 14 Vũ Trung Kiên – Lớp CNPM – Sử dụng weka để phân lớp cho dataset Computer...
  • 17
  • 1,859
  • 14
Tiểu luận khai phá dữ liệu: sử dụng phần mềm weka cho bộ dữ liệu Sick-euthyroid

Tiểu luận khai phá dữ liệu: sử dụng phần mềm weka cho bộ dữ liệu Sick-euthyroid

Lập trình

... > Choose > filters >unsupervised > attribute > Remove Ta thu kết Lưu lại liệu SE2.Ta sử dụng dataset để phân lớp Thuật toán phân lớp 1.Thực thuật toán Đối với dataset sử dụng thuật toán phân lớp: ... lần chạy thử , ta rút kết luận lần chạy thử với liệu: 66% liệu dùng để xây dựng cây, 34% để test có tỷ lệ phân lớp xác 98,2326% Nên ta sử dụng định lần thử để sử dụng cho mẫu thử sau Page 30 ... b = negative Với liệu chia theo tỷ lệ 75% , 25% Kết === Run information === Page 13 0.973 KHAI PHÁ DỮ LIỆU Scheme :weka. classifiers.trees.J48 -C 0. 25 -M Relation: sick-euthyroid -weka. filters.unsupervised.attribute.Remove-R1,2,3,8,10,14, 15, 19,21,22,25...
  • 30
  • 920
  • 9
Tiểu luận khai phá dữ liệu: sử dụng phần mềm weka cho bộ dữ liệu dataset El Nino

Tiểu luận khai phá dữ liệu: sử dụng phần mềm weka cho bộ dữ liệu dataset El Nino

Lập trình

... Training set : gồm 783 mẫu liệu  Testing set : gồm 178080 mẫu dự liệu 12 thuộc tính III Thuật toán phân cụm K Mean Phân cụm kỹ thuật quan trọng khai phá liệu, thuộc lớp phương pháp Unsupervised Learning ... MÔN HỌC Họ tên : Trần Hoàng Giang Lớp : HTTT6 DataSet : El Nino Link : http://archive.ics.uci.edu/ml/datasets/El+Nino Bài toán thực : Khai phá liệu Weka với toán phân cụm Thuật toán: Simple K-Mean ... Finance: Phân nhóm đối tượng sử dụng bảo hiểm dịch vụ tài chính, dự đoán xu hướng (trend) khách hàng, phát gian lận tài (identifying frauds); • WWW: Phân loại tài liệu (document classification); phân...
  • 18
  • 1,052
  • 1
Tiểu luận khai phá dữ liệu: Sử dụng weka để phân lớp trên Dataset SpamBase

Tiểu luận khai phá dữ liệu: Sử dụng weka để phân lớp trên Dataset SpamBase

Lập trình

... 55 .capital_run_length_average 56 .capital_run_length_longest 57 .capital_run_length_total 58 .class Thực hành phân lớp weka Sau cài đặt xong, mở weka, chọn explorer 2.1 Tiền xử lý liệu 2.1.1 Nạp liệu Thông thường, định ... P(A/Bi)) Phương pháp phân loại Naïve-Bayesian Phân loại Bayesian phương pháp phân loại sử dụng tri thức xác suất qua huấn luyện Phương pháp thích hợp với lớp toán đòi hỏi phải dự đoán xác lớp mẫu cần ... kết thống kê cho thấy có 3890 mẫu phân loại chiếm 84 ,54 68%, 711 mẫu phân loại sai chiếm 15. 453 2% Với J48, 3868 mẫu phân loại chiếm 84,0687% sai chiếm 15, 9313% Trong thời gian phân lớp Naive Bayers...
  • 17
  • 1,839
  • 13
Tiểu luận khai phá dữ liệu: Sử dụng weka để phân lớp trên dataset Flags

Tiểu luận khai phá dữ liệu: Sử dụng weka để phân lớp trên dataset Flags

Lập trình

... ROC Area Class 0.313 0.3 75 0 .54 5 0.8 65 green 0.333 0.3 0 .5 0.333 0.4 0 .56 7 red 0.333 0.063 0 .5 0.333 0.4 0.8 85 white 0 .5 0 .5 0.667 0.647 black 0 .5 0. 059 0 .5 0 .5 0 .5 0. 853 blue 0 0 ? gold 0 0 ? ... định J48 • Bước ta sử dụng tất liệu để training cho cây: - Nhấn vào tab Classify chọn thuật toán sử dụng cách nhấn vào nút Choose; thư mục thư mục Trees/J48:  - Để tiến hành trainning toàn liệu ... Class 0 .5 0 .5 0.667 green 0.667 0 .57 1 0.333 0.667 0.444 0.619 red 0.333 0.143 0 .5 0.333 0.4 0.786 white 0 0 ? black 0 .5 0 .5 0.667 0.844 blue 0 Weighted Avg 0 0 .5 0 0 0 0 0.214 0. 65 ? ? ? 0 .5 gold...
  • 30
  • 750
  • 4
Tiểu luận khai phá dữ liệu: Sử dụng weka để phân lớp trên dataset Post-Operative Patient

Tiểu luận khai phá dữ liệu: Sử dụng weka để phân lớp trên dataset Post-Operative Patient

Lập trình

... Minh Đức – Khai phá liệu -Lấy 75% liệu để xây dựng, 25% liệu để test 13 2011 Phạm Minh Đức – Khai phá liệu -Lấy60% liệu để xây dựng,40% liệu để test 14 2011 Phạm Minh Đức – Khai phá liệu 15 2011 ... -Training data Phạm Minh Đức – Khai phá liệu 3.Tiến hành Weka -Đưa liệu vàoWeka 2011 Phạm Minh Đức – Khai phá liệu -Sử dụng toàn liệu để training 2011 Phạm Minh Đức – Khai phá liệu -Nội dung kết quả: ... liệu để xây dựng ,5% liệu để test 10 2011 Phạm Minh Đức – Khai phá liệu -Lấy 90% liệu để xây dựng,10% liệu để test 11 2011 Phạm Minh Đức – Khai phá liệu -Lấy 80% liệu để xây dựng,20% liệu để test...
  • 15
  • 585
  • 0
Tiểu luận khai phá dữ liệu: Sử dụng weka để phân lớp trên dataset Acute Inflammationsnt

Tiểu luận khai phá dữ liệu: Sử dụng weka để phân lớp trên dataset Acute Inflammationsnt

Lập trình

... – Khai phá liệu - 95% liệu để xây dựng, 5% liệu test 2011 Phạm Trung Kiên – Khai phá liệu -90% d liệu ểxâydựng, 10% d liệu test 10 2011 Phạm Trung Kiên – Khai phá liệu - 85% d liệu ểxâydựng, 15% ... d liệu ểxâydựng, 15% d liệu test 11 2011 Phạm Trung Kiên – Khai phá liệu -70% d liệu ểxâydựng, 30% d liệu test 12 2011 Phạm Trung Kiên – Khai phá liệu -50 % d liệu ểxâydựng, 50 % d liệu test 13 2011 ... 3.TIến hành Weka -Đưa liệu vào Weka Phạm Trung Kiên – Khai phá liệu -Sử dụng toàn liệu để training 2011 Phạm Trung Kiên – Khai phá liệu -Nội dung kếtquả === Run information === Scheme: weka. classifiers.trees.J48...
  • 14
  • 584
  • 0
Tiểu luận khai phá dữ liệu: Sử dụng weka để phân lớp trên dataset Balloons

Tiểu luận khai phá dữ liệu: Sử dụng weka để phân lớp trên dataset Balloons

Lập trình

... biến ứng dụng khai phá sở liệu có kích thước nhỏ C4. 5 sử dụng chế lưu trữ liệu thường trú nhớ, đặc điểm làm C4. 5 thích hợp với sở liệu nhỏ, chế xếp lại liệu node trình phát triển định C4. 5 chứa ... tương ứng định tương đương Tư tưởng phát triển định C4. 5 phương pháp HUNT Chiến lược phát triển theo độ sâu (depth-first strategy) áp dụng cho C4. 5 Giả mã C4. 5 Đặc điểm thuật toán C4. 5 • C4. 5 dùng ... Pascal, C4 (Quinlan 1987) Năm 1993, J Ross Quinlan kế thừa kết phát triển thành C4. 5 với 9000 dòng lệnh C chứa đĩa mềm 4.2.1Thuật toán C4. 5 Với đặc điểm C4. 5 thuật toán phân lớp liệu dựa định hiệu...
  • 19
  • 1,243
  • 2
Tiểu luận khai phá dữ liệu: Sử dụng weka để phân lớp trên dataset weather.arff

Tiểu luận khai phá dữ liệu: Sử dụng weka để phân lớp trên dataset weather.arff

Lập trình

... Class 0 .55 6 0.6 0.6 25 0 .55 6 0 .58 8 0.633 yes 0.4 0.444 0.333 0.4 0.364 0.633 no Weighted Avg 0 .5 0 .54 4 0 .52 1 0 .5 0 .50 8 0.633 === Confusion Matrix === SVTH: Nguyễn Thị Hoa Trang 10 Khai phá liệu GVHD: ... hiệu liệu Qualititive value (ordinal, Binary, nominal).Sau chuẩn hóa liệu bảng liệu toàn kiểu Nominal, ta sử dụng thuật toán J48 để đạt hiệu phân lớp cao  Sử dụng thuật toán với phần mềm Weka ... với phần mềm WeKa SVTH: Nguyễn Thị Hoa Trang Khai phá liệu GVHD: Hồ Nhật Quang Dataset dùng file định dạng chuẩn weka Weather.arff Khởi động Weka > Chọn Explorer > Chọn Open file > Chọn Dataset...
  • 20
  • 3,831
  • 21
Tiểu luận khai phá dữ liệu: Sử dụng weka để phân lớp trên dataset Billionaires92

Tiểu luận khai phá dữ liệu: Sử dụng weka để phân lớp trên dataset Billionaires92

Lập trình

... thành C4. 5 với 9000 dòng lệnh C chứa đĩa mềm 4.2.1 Thuật toán C4. 5: C4. 5 thuật toán phân lớp liệu dựa định hiệu phổ biến ứng dụng khai phá sở liệu có kích thước nhỏ C4. 5 sử dụng chế lưu trữ liệu ... giá trị lỗi này: Dữ liệu Billionaires92: Dữ liệu lỗi nên tiến hành phân lớp 4.2 Phân lớp định j4.8: Weka xây dựng định chương trình C4. 5 C4. 5 kế thừa của thuật toán học máy định dựa tảng kết ... “quá vừa” liệu C4. 5 với chế cắt tỉa tạo nên sức mạnh C4. 5 Thêm vào đó, mô hình phân lớp C4. 5phần chuyển đổi từ định sang luật dạng if-then, làm tăng độ xác tính dễ hiểu kết phân lớp Đây tiện...
  • 20
  • 931
  • 0
Tiểu luận khai phá dữ liệu: Sử dụng phần mềm weka khai phá bộ dữ liệu  Pittsburgh Bridges dataset

Tiểu luận khai phá dữ liệu: Sử dụng phần mềm weka khai phá bộ dữ liệu Pittsburgh Bridges dataset

Lập trình

... năm: Lấy 50 % liệu để xây dựng cây, 50 % để test: Khai phá liệu 15  Lần thứ sáu: Lấy 30% liệu để xây dựng cây, 70% để test:  Lần thứ bảy: Lấy 91% liệu để xây dựng cây, 9% để test: Khai phá liệu 16 ... cửa số Preprocess WEKA sau: Bạn chỉnh sửa liệu cách click vào liệu xuất để bạn chỉnh sửa Khai phá liệu , lúc bảng Xây dựng định: - Bước ta sử dụng tất liệu để trainning cho cây: + Nhấn vào tab ... theo dấu chấm phẩy Khai phá liệu II XÂY DỰNG CƠ SỞ DỮ LIỆU Đề tài sử dụng dataset Pittsburgh Bridges cung cấp giá trị 13 thuộc tính phân loại cho 124 liệu Thông tin chung dataset Pittsburgh Bridges...
  • 18
  • 789
  • 3

Xem thêm