0
  1. Trang chủ >
  2. Công nghệ thông tin >
  3. Hệ thống thông tin >

Tiểu luận khai phá dữ liệu GOM CỤM DỮ LIỆU VÀ CÔNG CỤ WEKA

Tiểu luận khai phá dữ liệu GOM CỤM DỮ LIỆU VÀ CÔNG CỤ WEKA

Tiểu luận khai phá dữ liệu GOM CỤM DỮ LIỆU CÔNG CỤ WEKA

... 40 CHNG GOM CM D LIU V THUT TON WEKA 41 3.3 Cụng c khai phỏ d liu Weka 43 3.3.1 Gii thiu cụng c Weka 43 3.3.2 Cỏc phiờn bn Weka .44 3.3.3 Ca s chớnh Weka ... trỡnh c cụng b nhng nm gn õy Bi thu hoach ô S DNG PHNG PHP PHN LP, GOM CM TRONG KHAI PH D LIU V CễNG C KHAI PH D LIU WEKA ằ nhm nghiờn cu cỏc phng phỏp phõn lp v gom cm ỏp dng khai phỏ d liu v cụng ... cng ch thuc v cm, ch phự hp vi ng biờn gia cỏc cm rừ 3.3 Cụng c khai phỏ d liu Weka 3.3.1 Gii thiu cụng c Weka Weka l mụi trng th nghim khai phỏ d liu cỏc nh khoa hoc thuc trng hoc Waitako, NZ,...
  • 59
  • 247
  • 0
Tiêu luận khai phá dữ liệu : Sử dụng Weka với bài toán phân cụm  Dataset Optical Recognition of Handwritten Digits

Tiêu luận khai phá dữ liệu : Sử dụng Weka với bài toán phân cụm Dataset Optical Recognition of Handwritten Digits

... có liệu để sử dụng cho Weka, với 64 attribute ( đặt tên từ đến 64 ) Số lượng mẫu liệu :  Trainning : 3823 mẫu với 0: 376 1: 389 2: 380  3: 389 4: 387 5: 376 6: 377 7: 387 8: 380 9: 382 Test : ... Test : 1797 mẫu với 0: 1: 2: 3: 4: 5: 6: 7: 8: 9: II 178 182 177 183 181 182 181 179 174 180 Mô tả toán Phân cụm ? Phân cụm kỹ thuật quan trọng khai phá liệu, thuộc lớp phương pháp Unsupervised ... thuật toán, K-means thuật toán đơn giản, dễ sử dụng , hợp với liệu biết số cụm, cho kết xác , hiệu so với thuật toán Fathestfirst, thuật toán X-mean cho kết tương đương K-means lại khó sử dụng...
  • 14
  • 1,005
  • 4
Tiểu luận khai phá dữ liệu: SỬ DỤNG WEKA VỚI CSDL SEGMENT TEST ÁP DỤNG THUẬT TOÁN PHÂN CỤM REPTree

Tiểu luận khai phá dữ liệu: SỬ DỤNG WEKA VỚI CSDL SEGMENT TEST ÁP DỤNG THUẬT TOÁN PHÂN CỤM REPTree

... thực thuật toán phân lớp sở liệu III Kết thu sử dụng thuật toán REPTree Kết sử dụng thuật toán REPTree với thông số thiết đặt sau(chia liệu thành 10 phần) === Run information === Scheme :weka. classifiers.trees .REPTree ... Weka vào toán với sở liệu segment test sử dụng thuật toán REPTree Mô tả toán Phân đoạn ảnh thao tác mức thấp toàn trình xử lý ảnh Quá trình thực việc phân vùng ảnh thành vùng rời rạc đồng với hay ... Weka cách sử dụng phần mềm Weka Weka công cụ phần mềm viết Java, phục vụ lĩnh vực học máy khai phá liệu Các tính - Một tập công cụ tiền xử lý liệu, giải thuật học máy, khai phá liệu, phương pháp...
  • 25
  • 1,946
  • 8
Tiểu luận Khai phá dữ liệu : sử dụng phần mềm WEKA cho bộ dữ liệu Tic Tac Toe

Tiểu luận Khai phá dữ liệu : sử dụng phần mềm WEKA cho bộ dữ liệu Tic Tac Toe

... với mẫu liệu Tic Tac Toe. arff Test set  Dữ liệu xây dựng mô hình  Dữ liệu để xây dựng mô hình: liệu gốc (original dataset), liệu phải có thuộc tính phân lớp (categorical attribute) Dữ liệu gốc ... RandomForest Thực nghiệm Dữ liệu chia làm 10 Folds trình Train/Test Model thực lặp lại 10 lần Tại lần Train/Test Model, phần liệu dùng để Test phần lại dùng để Train Sử dụng công cụ KnowledgeFlow ... Chia nhỏ tập liệu theo phương pháp CV (Cross-Validation) trình huấn luyện kiểm lỗi mô hình phân lớp Đây kỹ thuật chủ yếu sử dụng xây dựng predictive Model Trong liệu gốc chia thành n phần (n-fold),...
  • 11
  • 1,145
  • 3
Tiểu luận Khai phá dữ liệu: Sử dụng phần mềm weka khai phá bộ dữ liệu Gamers với thuật toán phân lớp

Tiểu luận Khai phá dữ liệu: Sử dụng phần mềm weka khai phá bộ dữ liệu Gamers với thuật toán phân lớp

... chơi , nhà phát hành game kết luận họ có chơi game hay không Thuật toán phân lớp lựa chọn áp dụng liệu II Thực nghiệm WEKA Tiền xử lý liệu: Trong qui trình khai phá liệu, công việc xử lý liệu trước ... dạng *.arff để thực thuật toán phân lớp ( mục save phía bên phải weka ) 2 .Thuật toán phân lớp Thực thuật toán - Trong toán này, ta áp dụng thử thuật toán phân lớp, là: định (Decision tree) J48 ... chọn thuật toán để phân tích dataset quan trọng , dataset thích hợp với loại thuật toán khác Chẳng hạn thuật toán hồi qui phân loại (CART – Classification And Regression Tree) J48 cho kết tốt liệu...
  • 16
  • 1,590
  • 36
Tiểu luận Khai phá dữ liệu: Sử dụng phần mềm weka khai phá bộ dữ liệu Congressional Voting Records

Tiểu luận Khai phá dữ liệu: Sử dụng phần mềm weka khai phá bộ dữ liệu Congressional Voting Records

... cần sử dụng khai phá liệu cần 4/17 thuộc tính, ta sử dụng thuộc tính này: adoption-of-the-budget-resolution anti-satellite-test-ban aid-to-nicaraguan-contras immigration III1- Tiền xử lý liệu ... thiệu tiền xử lý liệu (Data Preprocessing) - Trong qui trình khai phá liệu, công việc xử lý liệu trước đưa vào mô hình cần thiết, bước làm cho liệu có ban đầu qua thu thập liệu (gọi liệu gốc original ... entropy, số phương pháp khác thường sử dụng lựa chọn thuộc tính Bayesian with K2 Prior, Bayesian Dirichlet Equivalent with Uniform Prior 2- Trích chọn đặc tính weka - Trong WEKA, phương pháp lựa chọn...
  • 19
  • 1,066
  • 5
Tiểu luận Khai phá dữ liệu: Sử dụng phần mềm weka khai phá bộ dữ liệu meta data

Tiểu luận Khai phá dữ liệu: Sử dụng phần mềm weka khai phá bộ dữ liệu meta data

... -95% liệu để xây dựng, 5% liệu test 2011 Meta Data -90% d liệu ểxâydựng, 10% d liệu test -85% d liệu ểxâydựng, 15% liệu test 2011 Meta Data -70% d liệu ểxâydựng, 30% d liệu test 2011 Meta Data ... iscrim,ITrule,IndCART,KNN,Kohonen,LVQ,LogDisc,NewId,QuaDisc,RBF,Smart} Norm_error real -Training data 3.TIến hành Weka -Đưa liệu vào Weka 2011 Meta Data -Sử dụng toàn liệu để training 2011 Meta Data -Nội dung kếtquả === Classifier model (full ... 2011 Meta Data -Dataset s dụng: Meta Data -Thông tin dataset -Các thuộc tính: DS_Name{Aust_Credit,BT,Belgian,CUT,Chromosone,Credit,DNA,Diabetes,Digits,Faults,German_Cr...
  • 9
  • 1,398
  • 16
Tiểu luận Khai phá dữ liệu: Sử dụng phần mềm Weka phân lớp cho khả năng phê duyệt tín dụng cho các ứng dụng thẻ tín dụng

Tiểu luận Khai phá dữ liệu: Sử dụng phần mềm Weka phân lớp cho khả năng phê duyệt tín dụng cho các ứng dụng thẻ tín dụng

... dụng toán phân lớp dựa vào thuộc tính để phân lớp khả phê duyệt tín dụng cho ứng dụng thẻ tín dụng Tạo định khả phê duyệt ứng dụng thẻ tín dụng để hỗ trợ cho việc quản lý tín dụng hiệu IV TIẾN ... toán phân lớp weka áp dụng toán phê duyệt tín dụng cho ứng dụng thẻ tín dụng II XÂY DỰNG CƠ SỞ DỮ LIỆU Trong đề tài này, tập tin chứa ứng dụng thẻ tín dụng Tất tên thuộc tính giá trị thay biểu ... thuộc tính) III PHÂN TÍCH BÀI TOÁN Mục đích: tạo định Weka xem khả phê duyệt tín dụng Phê duyệt Dữ liệu thuộc tính liên quan Weka decision tree Không phê duyệt Đọc liệu đầu vào sau áp dụng toán phân...
  • 19
  • 2,007
  • 9
Tiểu luận Khai phá dữ liệu: Sử dụng phần mềm weka khai phá bộ dữ liệu STATLOG (Vehicle Silhouettes)

Tiểu luận Khai phá dữ liệu: Sử dụng phần mềm weka khai phá bộ dữ liệu STATLOG (Vehicle Silhouettes)

... 11/2011 Vũ Tuấn Anh- Khai phá liệu -85% d liệu ểxâydựng, 15% test 13 11/2011 Vũ Tuấn Anh- Khai phá liệu -80% d liệu ểxâydựng, 20% test 14 11/2011 Vũ Tuấn Anh- Khai phá liệu -60% d liệu ểxâydựng, 40% ... Vũ Tuấn Anh- Khai phá liệu 3.Tiến hành Weka -Đưa liệu vào Weka -Sử dụng toàn liệu để Training: 11/2011 Vũ Tuấn Anh- Khai phá liệu *Nội dung kếtquả === Run information === Scheme: weka. classifiers.trees.J48 ... 11/2011 Vũ Tuấn Anh- Khai phá liệu Cáclớp -Giải toán :Sử dụng J48 Weka dựa vào thuộc tính để đưa định xem bóng loại xe 2.Xây dựng sở liệu -Dataset sử dụng: STATLOG (Vehicle Silhouettes) -Thông...
  • 16
  • 791
  • 3
Tiểu luận Khai phá dữ liệu: Sử dụng phần mềm weka khai phá bộ dữ liệu Abalone( bào ngư) với thuật toán phân lớp

Tiểu luận Khai phá dữ liệu: Sử dụng phần mềm weka khai phá bộ dữ liệu Abalone( bào ngư) với thuật toán phân lớp

... lượng vỏ bào ngư Rings integer III Thực nghiệm Weka Tiền xử lý dữ liệu - Trong qui trình khai phá liệu, công việc xử lý liệu trước đưa vào mô hình cần thiết, bước làm cho liệu có ban ... liệu có ban đầu qua thu thập liệu (gọi liệu gốc original data) áp dụng (thích hợp) với mô hình khai phá liệu (data mining model) cụ thể Các công việc cụ thể tiền xử lý liệu bao gồm công việc như: ... Discretization (rời rạc hóa liệu) : Nếu bạn có liệu liên tục vài mô hình áp dụng cho liệu rời rạc (như luật kết hợp chẳn hạn) bạn phải thực việc rời rạc hóa liệu _ Khởi động Weka explorer Open file,...
  • 15
  • 1,834
  • 7
Tiểu luận Khai phá dữ liệu: Sử dụng phần mềm weka khai phá bộ dữ liệu bank-data

Tiểu luận Khai phá dữ liệu: Sử dụng phần mềm weka khai phá bộ dữ liệu bank-data

... mô hình khai phá luật kết hợp không làm việc với kiểu liệu liên tục Quá trình goi rời rạc hóa liệu (Discretization) Nạp liệu (Loading the Data) Thông thường, định dạng chuẩn file liệu Weka la ... “income” ta lưu lại file liệu cuối có tên bank-data- final.arff” B ,Khai phá luật kết hợp(Association rule mining) Bây giờ, với file liệu qua trình lọc thuộc tính id rời rạc hóa liệu thuộc tính “children”, ... việc liệu nominal (như association rule mining) Sau kết thực thuật toán Apriori để phát luật kết hợp file liệu bank-data- final.arff” Click vào tab "Associate" để mở giao diện thuật toán khai phá...
  • 28
  • 4,853
  • 20
Tiểu luận KHAI PHÁ DỮ LIỆU: Sử dụng phần mềm Weka khai phá bộ dữ liệu Computer hardware với thuật toán phân lớp

Tiểu luận KHAI PHÁ DỮ LIỆU: Sử dụng phần mềm Weka khai phá bộ dữ liệu Computer hardware với thuật toán phân lớp

... - Với thuật toán navie bayes: 15 Vũ Trung Kiên – Lớp CNPM – Sử dụng weka để phân lớp cho dataset Computer Hardware - Với thuật toán J48: 16 Vũ Trung Kiên – Lớp CNPM – Sử dụng weka để phân lớp ... tương tự với thuật toán Naviebayes ta mô sau: Sau kết thực nghiệm: 13 Vũ Trung Kiên – Lớp CNPM – Sử dụng weka để phân lớp cho dataset Computer Hardware Với thuật toán Navie Bayes Với thuật toán J48 ... (kiểu integer) Vũ Trung Kiên – Lớp CNPM – Sử dụng weka để phân lớp cho dataset Computer Hardware Bài toán phân lớp Bài toán phân lớp dùng tập liệu cho huấn luyện phân lớp có khả đánh giá hiệu tương...
  • 17
  • 1,861
  • 14
Tiểu luận khai phá dữ liệu: sử dụng phần mềm weka cho bộ dữ liệu Sick-euthyroid

Tiểu luận khai phá dữ liệu: sử dụng phần mềm weka cho bộ dữ liệu Sick-euthyroid

... phân lớp: định J48 Với liệu chia thành 10 phần Page KHAI PHÁ DỮ LIỆU Kết quả: === Run information === Scheme :weka. classifiers.trees.J48 -C 0.25 -M Relation: sick-euthyroid -weka. filters.unsupervised.attribute.Remove-R1,2,3,8,10,14,15,19,21,22,25 ... b = negative Với liệu chia theo tỷ lệ 75%, 25% Kết === Run information === Page 13 0.973 KHAI PHÁ DỮ LIỆU Scheme :weka. classifiers.trees.J48 -C 0.25 -M Relation: sick-euthyroid -weka. filters.unsupervised.attribute.Remove-R1,2,3,8,10,14,15,19,21,22,25 ... negative Page 16 0.937 KHAI PHÁ DỮ LIỆU Với liệu chia theo tỷ lệ 80%, 20% Kết quả: === Run information === Scheme :weka. classifiers.trees.J48 -C 0.25 -M Relation: sick-euthyroid -weka. filters.unsupervised.attribute.Remove-R1,2,3,8,10,14,15,19,21,22,25...
  • 30
  • 920
  • 9
Tiểu luận khai phá dữ liệu: sử dụng phần mềm weka cho bộ dữ liệu dataset El Nino

Tiểu luận khai phá dữ liệu: sử dụng phần mềm weka cho bộ dữ liệu dataset El Nino

... Lớp : HTTT6 DataSet : El Nino Link : http://archive.ics.uci.edu/ml/datasets /El+ Nino Bài toán thực : Khai phá liệu Weka với toán phân cụm Thuật toán: Simple K-Mean I.Giới thiệu El- Nino ban đầu ... đây, lần El- Nino xuất gây thiệt hại lớn năm 18771878, 1888; đối El- Nino (La-Nina) 1973-1975 đặc biệt "El- Nino kỷ 1982-1983" gây tổng thiệt hại cho toàn giới 13 tỷ đô la II Mô tả Dataset El Nino Thuộc ... Training set : gồm 783 mẫu liệu  Testing set : gồm 178080 mẫu dự liệu 12 thuộc tính III Thuật toán phân cụm K Mean Phân cụm kỹ thuật quan trọng khai phá liệu, thuộc lớp phương pháp Unsupervised Learning...
  • 18
  • 1,052
  • 1
Tiểu luận khai phá dữ liệu: Sử dụng weka để phân lớp trên Dataset SpamBase

Tiểu luận khai phá dữ liệu: Sử dụng weka để phân lớp trên Dataset SpamBase

... P(A/Bi)) Phương pháp phân loại Naïve-Bayesian Phân loại Bayesian phương pháp phân loại sử dụng tri thức xác suất qua huấn luyện Phương pháp thích hợp với lớp toán đòi hỏi phải dự đoán xác lớp mẫu cần ... số thẻ tín dụng tin tức cá nhân họ Do gia tăng hàng năm thư rác, việc phân biệt xem email thư rác, email trở nên cần thiết để tránh phiền toái 1.2.Giới thiệu dataset SpamBase Dataset SpamBase chứa ... tổng số email kho non-spam 2.2.2 Phân lớp weka Trên giao diện weka, chọn classify/Choose/bayers/NaiveBayers Mục Cross-validation để mặc định 10 Chọn More option để thiết lập ouput Tại ta tích thêm...
  • 17
  • 1,839
  • 13

Xem thêm

Từ khóa: tiểu luận khai phá dữ liêutiểu luận khai phá dữ liệu sử dụng phần mềm weka khai phá bộ dữ liệu abalone bào ngư với thuật toán phân lớptiểu luận khai phá dữ liệu sử dụng phần mềm weka phân lớp cho bộ dữ liệu golf dataset bằng cây quyết định c4 5tiểu luận khai phá dữu liệukhái niệm và đặc điểm của nguyên vật liệu và công cụ dụng cụlược đồ công nghiệp khai thác nhiên liệu và công nghiệp điệnluận văn kế toán nguyên vật liệu và công cụ dụng cụkhóa luận tốt nghiệp kế toán nguyên vật liệu và công cụ dụng cụ tại công ty tnhh mtv xdi khái niệm đặc điểm và vai trò của nguyên liệu vật liệu và công cụ dụng cụ trong sản xuất kinh doanhkhái niệm đặc điểm của nguyên liệu vật liệu và công cụ dụng cụkế toán tổng hợp nguyên liệu vật liệu và công cụ dụng cụ theo phương pháp kê khai thường xuyêngiới thiệu các thành phần kiểu dữ liệu và công cụ chínhmột số vấn đề lý luận chung về công tác hạch toán nguyên vật liệu và công cụ dụng cụkế toán nguyên vật liệu và công cụ dụng cụhạch toán kế toán nguyên vật liệu và công cụ dụng cụchuyên đề điện xoay chiều theo dạngNghiên cứu sự hình thành lớp bảo vệ và khả năng chống ăn mòn của thép bền thời tiết trong điều kiện khí hậu nhiệt đới việt namMột số giải pháp nâng cao chất lượng streaming thích ứng video trên nền giao thức HTTPNghiên cứu vật liệu biến hóa (metamaterials) hấp thụ sóng điện tử ở vùng tần số THzNghiên cứu tổ chức chạy tàu hàng cố định theo thời gian trên đường sắt việt namBiện pháp quản lý hoạt động dạy hát xoan trong trường trung học cơ sở huyện lâm thao, phú thọGiáo án Sinh học 11 bài 13: Thực hành phát hiện diệp lục và carôtenôitĐỒ ÁN NGHIÊN CỨU CÔNG NGHỆ KẾT NỐI VÔ TUYẾN CỰ LY XA, CÔNG SUẤT THẤP LPWANPhát triển mạng lưới kinh doanh nước sạch tại công ty TNHH một thành viên kinh doanh nước sạch quảng ninhNghiên cứu, xây dựng phần mềm smartscan và ứng dụng trong bảo vệ mạng máy tính chuyên dùngNghiên cứu tổng hợp các oxit hỗn hợp kích thƣớc nanomet ce 0 75 zr0 25o2 , ce 0 5 zr0 5o2 và khảo sát hoạt tính quang xúc tác của chúngNghiên cứu khả năng đo năng lượng điện bằng hệ thu thập dữ liệu 16 kênh DEWE 5000Thiết kế và chế tạo mô hình biến tần (inverter) cho máy điều hòa không khíChuong 2 nhận dạng rui roKiểm sát việc giải quyết tố giác, tin báo về tội phạm và kiến nghị khởi tố theo pháp luật tố tụng hình sự Việt Nam từ thực tiễn tỉnh Bình Định (Luận văn thạc sĩ)chuong 1 tong quan quan tri rui roNguyên tắc phân hóa trách nhiệm hình sự đối với người dưới 18 tuổi phạm tội trong pháp luật hình sự Việt Nam (Luận văn thạc sĩ)Giáo án Sinh học 11 bài 14: Thực hành phát hiện hô hấp ở thực vậtHIỆU QUẢ CỦA MÔ HÌNH XỬ LÝ BÙN HOẠT TÍNH BẰNG KIỀMQUẢN LÝ VÀ TÁI CHẾ NHỰA Ở HOA KỲ