0

phần mềm khai phá dữ liệu weka

Tiểu luận Chuyên đề công nghệ phần mềm “Khai phá dữ liệu với Association Rule”

Tiểu luận Chuyên đề công nghệ phần mềm “Khai phá dữ liệu với Association Rule”

Hệ thống thông tin

... training set  Khai phá web: Khai phá web để phân tích tiện ích web Có năm thành phần để đặc tả tác vụ khai phá liệu:  Dữ liệu cụ thể khai phá (task-relevant data): phần liệu từ liệu nguồn quan ... (data mining tasks/functions) Từ liệu có, trình khai phá liệu tìm mối quan hệ liệu theo đặc điểm tùy theo cách khai phá gọi tác vụ khai phá liệu Một số tác vụ khai phá liệu như:  Kết hợp: tìm luật ... trúc liệ để khai phá  Là liệu luư trữ như: tập tin truyền thống, sở liệu quan hệ, sở liệu giao tác hay kho liệu, sở liệu hướng ứng dụng… Tri thức đạt từ trình khai phá liệu? Với lượng liệu đầu...
  • 20
  • 1,209
  • 5
Ứng dụng phần mềm khai phá dữ liệu rapidminer trong quản lý khách hàng vay vốn tại ngân hàng nông nghiệp và phát triển nông thôn chi nhánh huyện a lưới

Ứng dụng phần mềm khai phá dữ liệu rapidminer trong quản lý khách hàng vay vốn tại ngân hàng nông nghiệp và phát triển nông thôn chi nhánh huyện a lưới

Thạc sĩ - Cao học

... Phần mềm khai phá liệu RapidMiner 45 3.2.1 Giới thiệu chung 45 Đ ại 3.2.2 Luật kết hợp phần mềm khai phá liệu RapidMiner 49 3.2.2.1 Thêm phần mềm Weka Extension vào phần mềm ... Chương 1: Tổng quan khám phá tri thức khai phá liệu Chương bao gồm số lý thuyết khai phá liệu khái niệm, Đ ại kỹ thuật khai phá, ứng dụng khai phá liệu, … Chương 2: Khai phá liệu với luật kết hợp ... Quá trình khai phá liệu [3] Tr  Hình 1.2: Quá trình khai phá liệu (Nguồn: http://www.uet.vnu.edu.vn) Gom liệu Tập hợp liệu bước trình khai phá liệu Đây bước khai thác CSDL, kho liệu chí liệu từ...
  • 115
  • 573
  • 0
Tiểu luận Khai phá dữ liệu : sử dụng phần mềm WEKA cho bộ dữ liệu Tic Tac Toe

Tiểu luận Khai phá dữ liệu : sử dụng phần mềm WEKA cho bộ dữ liệu Tic Tac Toe

Lập trình

... với mẫu liệu Tic Tac Toe.arff Test set  Dữ liệu xây dựng mô hình  Dữ liệu để xây dựng mô hình: liệu gốc (original dataset), liệu phải có thuộc tính phân lớp (categorical attribute) Dữ liệu gốc ... RandomTree REPTree RandomForest Thực nghiệm Dữ liệu chia làm 10 Folds trình Train/Test Model thực lặp lại 10 lần Tại lần Train/Test Model, phần liệu dùng để Test phần lại dùng để Train Sử dụng công cụ ... Chia nhỏ tập liệu theo phương pháp CV (Cross-Validation) trình huấn luyện kiểm lỗi mô hình phân lớp Đây kỹ thuật chủ yếu sử dụng xây dựng predictive Model Trong liệu gốc chia thành n phần (n-fold),...
  • 11
  • 1,145
  • 3
Tiểu luận Khai phá dữ liệu: Sử dụng phần mềm weka khai phá bộ dữ liệu Gamers với thuật toán phân lớp

Tiểu luận Khai phá dữ liệu: Sử dụng phần mềm weka khai phá bộ dữ liệu Gamers với thuật toán phân lớp

Lập trình

... chơi , nhà phát hành game kết luận họ có chơi game hay không Thuật toán phân lớp lựa chọn áp dụng liệu II Thực nghiệm WEKA Tiền xử lý liệu: Trong qui trình khai phá liệu, công việc xử lý liệu trước ... bước làm cho liệu có ban đầu qua thu thập liệu (gọi liệu gốc original data) áp dụng (thích hợp) với mô hình khai phá liệu (data mining model) cụ thể Các công việc cụ thể tiền xử lý liệu bao gồm ... hóa liệu) : Nếu bạn có liệu liên tục vài mô hình áp dụng cho liệu rời rạc (như luật kết hợp ) bạn phải thực việc rời rạc hóa liệu Trong toán , bước tiền xử lý liệu cụ thể sau: - Khởi động WEKA...
  • 16
  • 1,590
  • 36
Tiểu luận Khai phá dữ liệu: Sử dụng phần mềm weka khai phá bộ dữ liệu Congressional Voting Records

Tiểu luận Khai phá dữ liệu: Sử dụng phần mềm weka khai phá bộ dữ liệu Congressional Voting Records

Lập trình

... thiệu tiền xử lý liệu (Data Preprocessing) - Trong qui trình khai phá liệu, công việc xử lý liệu trước đưa vào mô hình cần thiết, bước làm cho liệu có ban đầu qua thu thập liệu (gọi liệu gốc original ... Lọc mẫu (instances, patterns) liệu cho mô hình • Clean data: Làm liệu xóa bỏ liệu bất thường (Outlier) Transformation: Chuyển đổi liệu cho phù hợp với mô chuyển đổi liệu từ numeric qua nomial hay ... Discretization (rời rạc hóa liệu) : Nếu bạn có liệu liên tục vài mô hình áp dụng cho liệu rời rạc (như luật kết hợp chẳn hạn) bạn phải thực việc rời rạc hóa liệu 2- Tiền xử lí liệu với toán chọn - Trong...
  • 19
  • 1,066
  • 5
Tiểu luận Khai phá dữ liệu: Sử dụng phần mềm weka khai phá bộ dữ liệu meta data

Tiểu luận Khai phá dữ liệu: Sử dụng phần mềm weka khai phá bộ dữ liệu meta data

Lập trình

... -Cây định -95% liệu để xây dựng, 5% liệu test 2011 Meta Data -90% d liệu ểxâydựng, 10% d liệu test -85% d liệu ểxâydựng, 15% liệu test 2011 Meta Data -70% d liệu ểxâydựng, 30% d liệu test 2011 ... iscrim,ITrule,IndCART,KNN,Kohonen,LVQ,LogDisc,NewId,QuaDisc,RBF,Smart} Norm_error real -Training data 3.TIến hành Weka -Đưa liệu vào Weka 2011 Meta Data -Sử dụng toàn liệu để training 2011 Meta Data -Nội dung kếtquả === Classifier model ... 15% liệu test 2011 Meta Data -70% d liệu ểxâydựng, 30% d liệu test 2011 Meta Data -50% d liệu ểxâydựng, 50% d liệu test 2011 Meta Data ...
  • 9
  • 1,398
  • 16
Tiểu luận Khai phá dữ liệu: Sử dụng phần mềm Weka phân lớp cho khả năng phê duyệt tín dụng cho các ứng dụng thẻ tín dụng

Tiểu luận Khai phá dữ liệu: Sử dụng phần mềm Weka phân lớp cho khả năng phê duyệt tín dụng cho các ứng dụng thẻ tín dụng

Lập trình

... THỰC NGHIỆM TRÊN WEKA Tiền xử lý liệu Dữ liệu ban đầu ta lấy mạng lưu lại dạng “.text” để đọc Weka ta làm sau: Đầu tiên mở Microsoft Exel 2010 nhấn “Ctr+O” chọn đến file text liệu lưu Tiếp theo ... cho liệu Workbenh bao gồm phương thức chuẩn cho vấn đề khai phá liệu như: phân lớp,hồi quy, phân nhóm, phân cụm, luật kết hợp, thuộc tính kết hợp.Cụ thể đề tài em tìm hiểu toán phân lớp weka ... III PHÂN TÍCH BÀI TOÁN Mục đích: tạo định Weka xem khả phê duyệt tín dụng Phê duyệt Dữ liệu thuộc tính liên quan Weka decision tree Không phê duyệt Đọc liệu đầu vào sau áp dụng toán phân lớp dựa...
  • 19
  • 2,007
  • 9
Tiểu luận Khai phá dữ liệu: Sử dụng phần mềm weka khai phá bộ dữ liệu STATLOG (Vehicle Silhouettes)

Tiểu luận Khai phá dữ liệu: Sử dụng phần mềm weka khai phá bộ dữ liệu STATLOG (Vehicle Silhouettes)

Lập trình

... 11/2011 Vũ Tuấn Anh- Khai phá liệu -85% d liệu ểxâydựng, 15% test 13 11/2011 Vũ Tuấn Anh- Khai phá liệu -80% d liệu ểxâydựng, 20% test 14 11/2011 Vũ Tuấn Anh- Khai phá liệu -60% d liệu ểxâydựng, 40% ... Vũ Tuấn Anh- Khai phá liệu 3.Tiến hành Weka -Đưa liệu vào Weka -Sử dụng toàn liệu để Training: 11/2011 Vũ Tuấn Anh- Khai phá liệu *Nội dung kếtquả === Run information === Scheme: weka. classifiers.trees.J48 ... Anh- Khai phá liệu a b c d < classified as 28 0 | a = van 19 0 | b = saab 0 26 | c = bus 16 | d = opel -Câyquyếtđịnh: -95% d liệu ểxâydựng, 5% test 11 11/2011 Vũ Tuấn Anh- Khai phá liệu -90% d liệu ểxâydựng,...
  • 16
  • 791
  • 3
Tiểu luận Khai phá dữ liệu: Sử dụng phần mềm weka khai phá bộ dữ liệu Abalone( bào ngư) với thuật toán phân lớp

Tiểu luận Khai phá dữ liệu: Sử dụng phần mềm weka khai phá bộ dữ liệu Abalone( bào ngư) với thuật toán phân lớp

Lập trình

... Thực nghiệm Weka Tiền xử lý dữ liệu - Trong qui trình khai phá liệu, công việc xử lý liệu trước đưa vào mô hình cần thiết, bước làm cho liệu có ban đầu qua thu thập liệu (gọi liệu gốc original ... Lọc mẫu (instances, patterns) liệu cho mô hình o Clean data: Làm liệu xóa bỏ liệu bất thường (Outlier) Transformation: Chuyển đổi liệu cho phù hợp với mô chuyển đổi liệu từ numeric qua nomial hay ... Discretization (rời rạc hóa liệu) : Nếu bạn có liệu liên tục vài mô hình áp dụng cho liệu rời rạc (như luật kết hợp chẳn hạn) bạn phải thực việc rời rạc hóa liệu _ Khởi động Weka explorer Open file,...
  • 15
  • 1,834
  • 7
Tiểu luận Khai phá dữ liệu: Sử dụng phần mềm weka khai phá bộ dữ liệu bank-data

Tiểu luận Khai phá dữ liệu: Sử dụng phần mềm weka khai phá bộ dữ liệu bank-data

Lập trình

... mô hình khai phá luật kết hợp không làm việc với kiểu liệu liên tục Quá trình goi rời rạc hóa liệu (Discretization) Nạp liệu (Loading the Data) Thông thường, định dạng chuẩn file liệu Weka la ... “income” ta lưu lại file liệu cuối có tên “bank-data-final.arff” B ,Khai phá luật kết hợp(Association rule mining) Bây giờ, với file liệu qua trình lọc thuộc tính id rời rạc hóa liệu thuộc tính “children”, ... việc liệu nominal (như association rule mining) Sau kết thực thuật toán Apriori để phát luật kết hợp file liệu “bank-data-final.arff” Click vào tab "Associate" để mở giao diện thuật toán khai phá...
  • 28
  • 4,853
  • 20
Tiểu luận KHAI PHÁ DỮ LIỆU: Sử dụng phần mềm Weka khai phá bộ dữ liệu Computer hardware với thuật toán phân lớp

Tiểu luận KHAI PHÁ DỮ LIỆU: Sử dụng phần mềm Weka khai phá bộ dữ liệu Computer hardware với thuật toán phân lớp

Lập trình

... thiệu tiền xử lý liệu (Data Preprocessing) Trong qui trình khai phá liệu, công việc xử lý liệu trước đưa vào mô hình cần thiết, bước làm cho liệu có ban đầu qua thu thập liệu (gọi liệu gốc ordinal ... Sử dụng weka để phân lớp cho dataset Computer Hardware Quy trình thực huấn luyện phân lớp với mẫu liệu machine.arff Dữ liệu để xây dựng mô hình: + Dữ liệu gốc (original dataset) tập liệu file ... làm liệu Vũ Trung Kiên – Lớp CNPM – Sử dụng weka để phân lớp cho dataset Computer Hardware o Rời rạc hóa liệu: data set bao gồm phần lớn liệu kiểu liên tục nên ta cần tiến hành rời rạc hóa liệu...
  • 17
  • 1,861
  • 14
Tiểu luận khai phá dữ liệu: sử dụng phần mềm weka cho bộ dữ liệu Sick-euthyroid

Tiểu luận khai phá dữ liệu: sử dụng phần mềm weka cho bộ dữ liệu Sick-euthyroid

Lập trình

... GredySteepWise Thu kết Page KHAI PHÁ DỮ LIỆU === Run information === Evaluator: weka. attributeSelection.WrapperSubsetEval -B weka. classifiers.bayes.NaiveBayes -F -T 0.01 -R -Search :weka. attributeSelection.GreedyStepwise ... Lưu lại liệu SE2.Ta sử dụng dataset để phân lớp Thuật toán phân lớp 1.Thực thuật toán Đối với dataset sử dụng thuật toán phân lớp: định J48 Với liệu chia thành 10 phần Page KHAI PHÁ DỮ LIỆU Kết ... b = negative Với liệu chia theo tỷ lệ 75%, 25% Kết === Run information === Page 13 0.973 KHAI PHÁ DỮ LIỆU Scheme :weka. classifiers.trees.J48 -C 0.25 -M Relation: sick-euthyroid -weka. filters.unsupervised.attribute.Remove-R1,2,3,8,10,14,15,19,21,22,25...
  • 30
  • 920
  • 9
Tiểu luận khai phá dữ liệu: sử dụng phần mềm weka cho bộ dữ liệu dataset El Nino

Tiểu luận khai phá dữ liệu: sử dụng phần mềm weka cho bộ dữ liệu dataset El Nino

Lập trình

... Training set : gồm 783 mẫu liệu  Testing set : gồm 178080 mẫu dự liệu 12 thuộc tính III Thuật toán phân cụm K Mean Phân cụm kỹ thuật quan trọng khai phá liệu, thuộc lớp phương pháp Unsupervised Learning ... DataSet : El Nino Link : http://archive.ics.uci.edu/ml/datasets/El+Nino Bài toán thực : Khai phá liệu Weka với toán phân cụm Thuật toán: Simple K-Mean I.Giới thiệu El-Nino ban đầu tên dòng hải ... bảo hiểm dịch vụ tài chính, dự đoán xu hướng (trend) khách hàng, phát gian lận tài (identifying frauds); • WWW: Phân loại tài liệu (document classification); phân loại người dùng web (clustering...
  • 18
  • 1,052
  • 1
Tiểu luận khai phá dữ liệu: Sử dụng phần mềm weka khai phá bộ dữ liệu  Pittsburgh Bridges dataset

Tiểu luận khai phá dữ liệu: Sử dụng phần mềm weka khai phá bộ dữ liệu Pittsburgh Bridges dataset

Lập trình

... Lấy 50% liệu để xây dựng cây, 50% để test: Khai phá liệu 15  Lần thứ sáu: Lấy 30% liệu để xây dựng cây, 70% để test:  Lần thứ bảy: Lấy 91% liệu để xây dựng cây, 9% để test: Khai phá liệu 16 ... 0, 1, 2, III TIẾN HÀNH THỰC NGHIỆM TRÊN WEKA Tiền xử lý liệu Tiến hành khởi chạy weka. Trong giao diện đồ họa Weka, chọn Explorer Trong weka lưu trữ liệu định dạng ARFF File ARFF bao gồm danh ... trình sở liệu cho phép bạn chuyển liệu thành tập tin mà giá trị thuộc tính tách dấu phẩy Khai phá liệu định dạng file arff.Bạn cần đưa file vào trình soạn thảo văn từ vi xử lý; thêm tên tập liệu...
  • 18
  • 789
  • 3
Tiểu luận khai phá dữ liệu: Sử dụng phần mềm weka khai phá bộ dữ liệu Adult  với thuật toán phân lớp

Tiểu luận khai phá dữ liệu: Sử dụng phần mềm weka khai phá bộ dữ liệu Adult với thuật toán phân lớp

Lập trình

... marital-status… Phần III: Tiền xử lí liệu Giới thiệu tiền xử lý liệu (Data Preprocessing) - Trong qui trình khai phá liệu, công việc xử lý liệu trước đưa vào mô hình cần thiết, bước làm cho liệu có ban ... liệu có ban đầu qua thu thập liệu (gọi liệu gốc original data) áp dụng (thích hợp) với mô hình khai phá liệu (data mining model) cụ thể Các công việc cụ thể tiền xử lý liệu bao gồm công việc như: ... liệu) : Nếu bạn có liệu liên tục vài mô hình áp dụng cho liệu rời rạc (như luật kết hợp chẳn hạn) bạn phải thực việc rời rạc hóa liệu Tiền xử lí liệu với toán chọn Trong toán này, tiền xử lý liệu...
  • 18
  • 3,323
  • 14
Tiểu luận khai phá dữ liệu: Sử dụng phần mềm Weka phân lớp cho dataset AutoUniv

Tiểu luận khai phá dữ liệu: Sử dụng phần mềm Weka phân lớp cho dataset AutoUniv

Lập trình

... cửa số Preprocess WEKA sau: Khai phá liệu Bạn chỉnh sửa liệu cách click vào liệu xuất để bạn chỉnh sửa Khai phá liệu , lúc bảng Xây dựng định: - Bước ta sử dụng tất liệu để trainning cho cây: ... Lấy 85% liệu để xây dựng cây, 15% để test: Khai phá liệu 15  Lần thứ tư: Lấy 45% liệu để xây dựng cây, 55% để test:  Lần thứ năm: Lấy 50% liệu để xây dựng cây, 50% để test: Khai phá liệu 16 ... toán nhân tạo liệu rút phản ứng tiêu cực từ nhà phê bình báo Khai phá liệu II XÂY DỰNG CƠ SỞ DỮ LIỆU Đề tài sử dụng dataset AutoUniv cung cấp giá trị thuộc tính phân loại cho 1000 liệu Thông tin...
  • 19
  • 537
  • 2
Tiểu luận khai phá dữ liệu: Sử dụng phần mềm Weka phân lớp cho bộ dữ liệu  golf dataset bằng cây quyết định C4.5

Tiểu luận khai phá dữ liệu: Sử dụng phần mềm Weka phân lớp cho bộ dữ liệu golf dataset bằng cây quyết định C4.5

Lập trình

... package weka. classifiers; import weka. core.Attribute; import weka. core.Capabilities; import weka. core.Capabilities.Capability; import weka. core.Instance; import weka. core.Instances; import weka. core.RevisionUtils; ... mà giá trị lại Thuật toán xây dựng định: Dữ liệu vào: Tập liệu D, tập danh sách thuộc tính, tập nhãn lớp Dữ liệu ra: Mô hình định Thuật toán: Tạocây(Tập liệu E, tập danh sách thuộc tính F, tập ... ta thu bảng số liệu sau: Chúng ta sử dụng thuật toán c4.5 để giải do: có thuộc tính temperature humidity có kiểu liệu numeric thuộc tính kiểu số Khai báo : @RELATION golf // tên liệu @ATTRIBUTE...
  • 11
  • 1,087
  • 7
Tiểu luận khai phá dữ liệu: Sử dụng phần mềm Weka cho bộ dữ liệu  forset fires dataset

Tiểu luận khai phá dữ liệu: Sử dụng phần mềm Weka cho bộ dữ liệu forset fires dataset

Lập trình

... Khám phá tri thức sở liệu hay gọi khai phá liệu (Data Mining - DM) phát triển ứng dụng rộng rãi nhiều ngành, có tính hiệu cao, hỗ trợ việc định nhanh chóng có độ xác cao Nó áp dụng nhiệm vụ phát ... trúc hệ thống FWI Trong FFMC – biểu diễn tính dễ cháy nhiên liệu đốt qua đánh giá độ ẩm nhiên liệu DMC – biểu diễn mức độ tiêu thụ nhiên liệu trung bình DC – biểu diễn mức độ hạn hán Ba yếu tố ảnh ... số nhiên liệu có sẵn sàng cháy FWI – số cường độ cháy, suy từ thành phần Fuel Moisture Code Fire Behavior, giá trị cao cho thấy mức độ cháy xảy nghiêm trọng Trong tiểu luận sử dụng liệu vụ cháy...
  • 4
  • 674
  • 15
Tiểu luận khai phá dữ liệu: Sử dụng phần mềm Weka phân lớp cho dataset Titanic

Tiểu luận khai phá dữ liệu: Sử dụng phần mềm Weka phân lớp cho dataset Titanic

Lập trình

... @relation, Khai báo tên thuộc tính từ khóa @attribute, từ khóa @data để bắt đầu đưa liệu vào Ví dụ hình : Báo cáo môn Khai phá liệu Sau tạo xong file arff tiến hành đọc liệu vào weka Báo cáo môn Khai phá ... cáo môn Khai phá liệu  Lần thứ tư: Lấy 85% liệu để xây dựng cây, 15% để test:  Lần thứ năm: Lấy 50% liệu để xây dựng cây, 50% để test: 16 Báo cáo môn Khai phá liệu  Lần thứ sáu: Lấy 96% liệu ... phá liệu Ta thấy xuất liệu cửa số Preprocess WEKA sau: Chuyển kiểu liệu attribute từ numeric sang nominal:chọn choose filter chọnNumericToNominal Báo cáo môn Khai phá liệu Bạn chỉnh sửa liệu...
  • 20
  • 578
  • 4
Tiểu luận khai phá dữ liêu: sử dụng phần mềm weka khai phá bộ dữ liệu dataset  led7digit

Tiểu luận khai phá dữ liêu: sử dụng phần mềm weka khai phá bộ dữ liệu dataset led7digit

Lập trình

... @relation, Khai báo tên thuộc tính từ khóa @attribute, từ khóa @data để bắt đầu đưa liệu vào Sau tạo xong file arff tiến hành đọc liệu vào weka Khai phá liệu Ta thấy xuất liệu cửa số Preprocess WEKA ... 50% liệu để xây dựng cây, 50% để test: 17 Khai phá liệu 17  Lần thứ sáu: Lấy 30% liệu để xây dựng cây, 70% để test:  Lần thứ bảy: Lấy 91% liệu để xây dựng cây, 9% để test: 18 Khai phá liệu ... 65% liệu để xây dựng cây, 35% để test:  Lần thứ chín: Lấy 97% liệu để xây dựng cây, 3% để test:  Lần thứ thứ 10: Lấy 92% liệu để xây dựng cây, 8% để test: 19 Khai phá liệu 19 20 Khai phá liệu...
  • 20
  • 588
  • 0

Xem thêm