mục tiêu của khai phá dữ liệu

Tiểu luận Khai phá dữ liệu : sử dụng phần mềm WEKA cho bộ dữ liệu Tic Tac Toe

Tiểu luận Khai phá dữ liệu : sử dụng phần mềm WEKA cho bộ dữ liệu Tic Tac Toe

Ngày tải lên : 03/12/2013, 16:03
... với mẫu liệu Tic Tac Toe.arff Test set  Dữ liệu xây dựng mô hình  Dữ liệu để xây dựng mơ hình: liệu gốc (original dataset), liệu phải có thuộc tính phân lớp (categorical attribute) Dữ liệu gốc ... thuộc tính tập liệu có kiểu liệu rời rạc Bài tốn phân lớp - Phân lớp theo tình trạng nước cờ, có trạng thái Positive (thuận lợi) Negative( bất lợi) Giải toán sử dụng phân lớp Xử lý liệu đầu vào: ... Model)  Chia nhỏ tập liệu theo phương pháp CV (Cross-Validation) trình huấn luyện kiểm lỗi mơ hình phân lớp Đây kỹ thuật chủ yếu sử dụng xây dựng predictive Model Trong liệu gốc chia thành n...
  • 11
  • 1.1K
  • 3
Tiểu luận Khai phá dữ liệu: Sử dụng phần mềm weka khai phá bộ dữ liệu Gamers với thuật toán phân lớp

Tiểu luận Khai phá dữ liệu: Sử dụng phần mềm weka khai phá bộ dữ liệu Gamers với thuật toán phân lớp

Ngày tải lên : 03/12/2013, 16:07
... chơi , nhà phát hành game kết luận họ có chơi game hay khơng Thuật toán phân lớp lựa chọn áp dụng liệu II Thực nghiệm WEKA Tiền xử lý liệu: Trong qui trình khai phá liệu, công việc xử lý liệu trước ... bước làm cho liệu có ban đầu qua thu thập liệu (gọi liệu gốc original data) áp dụng (thích hợp) với mơ hình khai phá liệu (data mining model) cụ thể Các công việc cụ thể tiền xử lý liệu bao gồm ... I Mô tả Cho sở liệu người chơi Games , nghiên cứu gói liệu để rút phương hướng phát hành , thu phí thị trường phát triển game ngày Đây vấn đề quan tâm , đại phận giới trẻ Bộ liệu ghi người chơi...
  • 16
  • 1.6K
  • 36
Tiểu luận Khai phá dữ liệu: Sử dụng phần mềm weka khai phá bộ dữ liệu Congressional Voting Records

Tiểu luận Khai phá dữ liệu: Sử dụng phần mềm weka khai phá bộ dữ liệu Congressional Voting Records

Ngày tải lên : 03/12/2013, 16:07
... xử lý liệu Giới thiệu tiền xử lý liệu (Data Preprocessing) - Trong qui trình khai phá liệu, cơng việc xử lý liệu trước đưa vào mơ hình cần thiết, bước làm cho liệu có ban đầu qua thu thập liệu ... ban đầu qua thu thập liệu (gọi liệu gốc original data) áp dụng (thích hợp) với mơ hình khai phá liệu (data mining model) cụ thể Các công việc cụ thể tiền xử lý liệu bao gồm công việc như: • Filtering ... Lọc mẫu (instances, patterns) liệu cho mơ hình • Clean data: Làm liệu xóa bỏ liệu bất thường (Outlier) Transformation: Chuyển đổi liệu cho phù hợp với mơ chuyển đổi liệu từ numeric qua nomial hay...
  • 19
  • 1.1K
  • 5
Tiểu luận Khai phá dữ liệu: Sử dụng phần mềm weka khai phá bộ dữ liệu meta data

Tiểu luận Khai phá dữ liệu: Sử dụng phần mềm weka khai phá bộ dữ liệu meta data

Ngày tải lên : 03/12/2013, 16:08
... -Cây định -95% liệu để xây dựng, 5% liệu test 2011 Meta Data -90% d liệu ểxâydựng, 10% d liệu test -85% d liệu ểxâydựng, 15% liệu test 2011 Meta Data -70% d liệu ểxâydựng, 30% d liệu test 2011 ... 15% liệu test 2011 Meta Data -70% d liệu ểxâydựng, 30% d liệu test 2011 Meta Data -50% d liệu ểxâydựng, 50% d liệu test 2011 Meta Data ... iscrim,ITrule,IndCART,KNN,Kohonen,LVQ,LogDisc,NewId,QuaDisc,RBF,Smart} Norm_error real -Training data 3.TIến hành Weka -Đưa liệu vào Weka 2011 Meta Data -Sử dụng toàn liệu để training 2011 Meta Data -Nội dung kếtquả === Classifier model (full...
  • 9
  • 1.4K
  • 16
Tiểu luận Khai phá dữ liệu: Sử dụng phần mềm Weka phân lớp cho khả năng phê duyệt tín dụng cho các ứng dụng thẻ tín dụng

Tiểu luận Khai phá dữ liệu: Sử dụng phần mềm Weka phân lớp cho khả năng phê duyệt tín dụng cho các ứng dụng thẻ tín dụng

Ngày tải lên : 03/12/2013, 16:10
... I ĐẶT VẤN ĐỀ Khai phá liệu ngành khoa học thực nghiệm Nó thiết kế cho bạn nhanh chống thử nghiệm cách thức sở liệu cách linh hoạt Nó cung cấp nhiều hỗ trợ cho tồn q trình xử lý số liệu thực nghiệm, ... với nhiều phương thức chho trình xử lý để ước lượng kết sơ đồ cho liệu Workbenh bao gồm phương thức chuẩn cho vấn đề khai phá liệu như: phân lớp,hồi quy, phân nhóm, phân cụm, luật kết hợp, thuộc ... tín dụng II XÂY DỰNG CƠ SỞ DỮ LIỆU Trong đề tài này, tập tin chứa ứng dụng thẻ tín dụng Tất tên thuộc tính giá trị thay biểu tượng vơ nghĩa để bảo vệ bí mật liệu, số liệu thú vị có kết hợp tốt...
  • 19
  • 2K
  • 9
Tiểu luận Khai phá dữ liệu: Sử dụng phần mềm weka khai phá bộ dữ liệu STATLOG (Vehicle Silhouettes)

Tiểu luận Khai phá dữ liệu: Sử dụng phần mềm weka khai phá bộ dữ liệu STATLOG (Vehicle Silhouettes)

Ngày tải lên : 03/12/2013, 16:11
... 11/2011 Vũ Tuấn Anh- Khai phá liệu -85% d liệu ểxâydựng, 15% test 13 11/2011 Vũ Tuấn Anh- Khai phá liệu -80% d liệu ểxâydựng, 20% test 14 11/2011 Vũ Tuấn Anh- Khai phá liệu -60% d liệu ểxâydựng, 40% ... Anh- Khai phá liệu a b c d < classified as 28 0 | a = van 19 0 | b = saab 0 26 | c = bus 16 | d = opel -Câyquyếtđịnh: -95% d liệu ểxâydựng, 5% test 11 11/2011 Vũ Tuấn Anh- Khai phá liệu -90% d liệu ểxâydựng, ... polygon) -Training data 11/2011 Vũ Tuấn Anh- Khai phá liệu 3.Tiến hành Weka -Đưa liệu vào Weka -Sử dụng toàn liệu để Training: 11/2011 Vũ Tuấn Anh- Khai phá liệu *Nội dung kếtquả === Run information...
  • 16
  • 791
  • 3
Tiểu luận Khai phá dữ liệu: Sử dụng phần mềm weka khai phá bộ dữ liệu Abalone( bào ngư) với thuật toán phân lớp

Tiểu luận Khai phá dữ liệu: Sử dụng phần mềm weka khai phá bộ dữ liệu Abalone( bào ngư) với thuật toán phân lớp

Ngày tải lên : 03/12/2013, 16:20
... trình khai phá liệu, công việc xử lý liệu trước đưa vào mơ hình cần thiết, bước làm cho liệu có ban đầu qua thu thập liệu (gọi liệu gốc original data) áp dụng (thích hợp) với mơ hình khai phá liệu ... Transformation: Chuyển đổi liệu cho phù hợp với mơ chuyển đổi liệu từ numeric qua nomial hay ordinal o Discretization (rời rạc hóa liệu) : Nếu bạn có liệu liên tục vài mơ hình áp dụng cho liệu rời rạc (như ... lý liệu bao gồm công việc như: o Filtering Attributes: Chọn thuộc tính phù hợp với mơ hình o Filtering samples: Lọc mẫu (instances, patterns) liệu cho mơ hình o Clean data: Làm liệu xóa bỏ liệu...
  • 15
  • 1.8K
  • 7
Tiểu luận Khai phá dữ liệu: Sử dụng phần mềm weka khai phá bộ dữ liệu bank-data

Tiểu luận Khai phá dữ liệu: Sử dụng phần mềm weka khai phá bộ dữ liệu bank-data

Ngày tải lên : 03/12/2013, 16:29
... “income” mơ hình khai phá luật kết hợp khơng làm việc với kiểu liệu liên tục Quá trình goi rời rạc hóa liệu (Discretization) Nạp liệu (Loading the Data) Thông thường, định dạng chuẩn file liệu Weka ... “income” ta lưu lại file liệu cuối có tên “bank-data-final.arff” B ,Khai phá luật kết hợp(Association rule mining) Bây giờ, với file liệu qua q trình lọc thuộc tính id rời rạc hóa liệu thuộc tính “children”, ... việc liệu nominal (như association rule mining) Sau kết thực thuật toán Apriori để phát luật kết hợp file liệu “bank-data-final.arff” Click vào tab "Associate" để mở giao diện thuật toán khai phá...
  • 28
  • 4.9K
  • 20
Tiểu luận KHAI PHÁ DỮ LIỆU: Sử dụng phần mềm Weka khai phá bộ dữ liệu Computer hardware với thuật toán phân lớp

Tiểu luận KHAI PHÁ DỮ LIỆU: Sử dụng phần mềm Weka khai phá bộ dữ liệu Computer hardware với thuật toán phân lớp

Ngày tải lên : 03/12/2013, 17:09
... trình khai phá liệu, cơng việc xử lý liệu trước đưa vào mơ hình cần thiết, bước làm cho liệu có ban đầu qua thu thập liệu (gọi liệu gốc ordinal data) áp dụng (thích hợp) với mơ hình khai phá liệu ... trình thực huấn luyện phân lớp với mẫu liệu machine.arff Dữ liệu để xây dựng mơ hình: + Dữ liệu gốc (original dataset) tập liệu file machine.arff + Dữ liệu phải có thuộc tính phân lớp (categorical ... Transformation: Chuyển đổi liệu cho phù hợp với mô chuyển đổi liệu từ numeric qua nomial hay ordinal Discretization (rời rạc hóa liệu) : Nếu bạn có liệu liên tục vài mơ hình áp dụng cho liệu rời rạc (như...
  • 17
  • 1.9K
  • 14
Tiểu luận khai phá dữ liệu: sử dụng phần mềm weka cho bộ dữ liệu Sick-euthyroid

Tiểu luận khai phá dữ liệu: sử dụng phần mềm weka cho bộ dữ liệu Sick-euthyroid

Ngày tải lên : 03/12/2013, 20:40
... attributes”, mục “Attribute Evaluaror” chọn WrapperSubsetEval, mục Classifier chọn NaiveBayes hình sau Page KHAI PHÁ DỮ LIỆU Trong mục Search Method chọn GredySteepWise Thu kết Page KHAI PHÁ DỮ LIỆU ... Lưu lại liệu SE2.Ta sử dụng dataset để phân lớp Thuật toán phân lớp 1.Thực thuật toán Đối với dataset sử dụng thuật toán phân lớp: định J48 Với liệu chia thành 10 phần Page KHAI PHÁ DỮ LIỆU Kết ... 0.944 KHAI PHÁ DỮ LIỆU === Confusion Matrix === a b < classified as 126 26 | a = sick-euthyroid 16 1413 | b = negative 3.Kết luân Sau lần chạy thử , ta rút kết luận lần chạy thử với liệu: 66% liệu...
  • 30
  • 920
  • 9
Tiểu luận khai phá dữ liệu: sử dụng phần mềm weka cho bộ dữ liệu dataset El Nino

Tiểu luận khai phá dữ liệu: sử dụng phần mềm weka cho bộ dữ liệu dataset El Nino

Ngày tải lên : 03/12/2013, 20:42
... Training set : gồm 783 mẫu liệu  Testing set : gồm 178080 mẫu dự liệu 12 thuộc tính III Thuật toán phân cụm K Mean Phân cụm kỹ thuật quan trọng khai phá liệu, thuộc lớp phương pháp Unsupervised Learning ... tự (Dissimilar) Mục đích phân cụm tìm chất bên nhóm liệu Các thuật toán phân cụm (Clustering Algorithms) sinh cụm (clusters) Tuy nhiên, khơng có tiêu chí xem tốt để đánh hiệu của phân tích phân ... HTTT6 DataSet : El Nino Link : http://archive.ics.uci.edu/ml/datasets/El+Nino Bài toán thực : Khai phá liệu Weka với toán phân cụm Thuật toán: Simple K-Mean I.Giới thiệu El-Nino ban đầu tên dòng...
  • 18
  • 1.1K
  • 1
Tiểu luận khai phá dữ liệu: Sử dụng weka để phân lớp trên Dataset SpamBase

Tiểu luận khai phá dữ liệu: Sử dụng weka để phân lớp trên Dataset SpamBase

Ngày tải lên : 03/12/2013, 20:56
... 2.1 Tiền xử lý liệu 2.1.1 Nạp liệu Thông thường, định dạng chuẩn file liệu Weka la file ARFF (Attribute Relation File Format), nhiên nhiều DBMS Spreadsheet cho phép tổ chức file liệu dạng file ... ((s*ns)/Ns)/((ns*s)/Ns+(nn*n)/Nn)) Còn token xuất kho ngữ liệu mà không xuất kho ngữ liệu khơng thể kết luận token xuât kho ngữ liệu spam khơng xuất kho ngữ liệu non-spam ngược lại Cách thích hợp ta gán ... (P(Bk) P(A/Bk) )/(ΣP(Bi) P(A/Bi)) Phương pháp phân loại Naïve-Bayesian Phân loại Bayesian phương pháp phân loại sử dụng tri thức xác suất qua huấn luyện Phương pháp thích hợp với lớp tốn đòi hỏi phải...
  • 17
  • 1.8K
  • 13
Tiểu luận khai phá dữ liệu: Sử dụng weka để phân lớp trên dataset Flags

Tiểu luận khai phá dữ liệu: Sử dụng weka để phân lớp trên dataset Flags

Ngày tải lên : 03/12/2013, 21:01
... nghiệm Weka Tiền xử lý liệu  Khởi động Weka Explorer  Chọn CSDL Flags cách chọn OpenFile chọn kiểu liệu (*.arff) chọn đường dẫn tới file sở liệu Acute Inflammations.csv  Xuất liệu cửa sổ PreProcess ... Bước ta sử dụng tất liệu để training cho cây: - Nhấn vào tab Classify chọn thuật toán sử dụng cách nhấn vào nút Choose; thư mục thư mục Trees/J48:  - Để tiến hành trainning toàn liệu ta chọn vào ... xử lý xong liệu click vào button để lưu lại bảng liệu Ta nhận thấy thuộc tính area population sau xử lý xong có số giá trị khơng sử dụng đến 1, 2, 3, để loại bỏ giá trị ta lưu bảng liệu lại với...
  • 30
  • 750
  • 4
Tiểu luận khai phá dữ liệu: Sử dụng weka để phân lớp trên dataset Post-Operative Patient

Tiểu luận khai phá dữ liệu: Sử dụng weka để phân lớp trên dataset Post-Operative Patient

Ngày tải lên : 03/12/2013, 21:02
... Đức – Khai phá liệu -Lấy 95% liệu để xây dựng,5% liệu để test 10 2011 Phạm Minh Đức – Khai phá liệu -Lấy 90% liệu để xây dựng,10% liệu để test 11 2011 Phạm Minh Đức – Khai phá liệu -Lấy 80% liệu ... -Training data Phạm Minh Đức – Khai phá liệu 3.Tiến hành Weka -Đưa liệu vàoWeka 2011 Phạm Minh Đức – Khai phá liệu -Sử dụng toàn liệu để training 2011 Phạm Minh Đức – Khai phá liệu -Nội dung kết quả: ... để xây dựng,20% liệu để test 12 2011 Phạm Minh Đức – Khai phá liệu -Lấy75% liệu để xây dựng,25% liệu để test 13 2011 Phạm Minh Đức – Khai phá liệu -Lấy60% liệu để xây dựng,40% liệu để test 14...
  • 15
  • 585
  • 0
Tiểu luận khai phá dữ liệu: Sử dụng weka để phân lớp trên dataset Acute Inflammationsnt

Tiểu luận khai phá dữ liệu: Sử dụng weka để phân lớp trên dataset Acute Inflammationsnt

Ngày tải lên : 03/12/2013, 21:08
... Trung Kiên – Khai phá liệu -95% liệu để xây dựng, 5% liệu test 2011 Phạm Trung Kiên – Khai phá liệu -90% d liệu ểxâydựng, 10% d liệu test 10 2011 Phạm Trung Kiên – Khai phá liệu -85% d liệu ểxâydựng, ... d liệu ểxâydựng, 15% d liệu test 11 2011 Phạm Trung Kiên – Khai phá liệu -70% d liệu ểxâydựng, 30% d liệu test 12 2011 Phạm Trung Kiên – Khai phá liệu -50% d liệu ểxâydựng, 50% d liệu test 13 2011 ... no } -Training data 3.TIến hành Weka -Đưa liệu vào Weka Phạm Trung Kiên – Khai phá liệu -Sử dụng toàn liệu để training 2011 Phạm Trung Kiên – Khai phá liệu -Nội dung kếtquả === Run information...
  • 14
  • 584
  • 0
Tiểu luận khai phá dữ liệu: Sử dụng weka để phân lớp trên dataset Balloons

Tiểu luận khai phá dữ liệu: Sử dụng weka để phân lớp trên dataset Balloons

Ngày tải lên : 03/12/2013, 21:12
... biến liệu, lỗi nhập ghi vào sở liệu, giá trị thuộc tính đánh giá không cần thiết trường hợp cụ thể • Tránh “quá vừa” liệu “Quá vừa” liệu khó khăn đáng kể học định phương pháp học khác Q vừa liệu ... lớp xác tồn case tập liệu đào tạo Đôi liệu đào tạo lại chứa đặc tính cụ thể, nên áp dụng định cho tập liệu khác độ xác khơng cao trước số phương pháp tránh vừa liệu: - Dừng phát triển sớm bình ... liệu dùng để xây dựng mơ hình (Training Data) toán phân lớp phải xác định lớp trước (pre-Labeled) Qui trình Train Test classifier - Dữ liệu để xây dựng mơ hình: liệu gốc (original dataset), liệu...
  • 19
  • 1.2K
  • 2
Tiểu luận khai phá dữ liệu: Sử dụng weka để phân lớp trên dataset weather.arff

Tiểu luận khai phá dữ liệu: Sử dụng weka để phân lớp trên dataset weather.arff

Ngày tải lên : 03/12/2013, 21:18
... theo thời tiết Tiền xử lý liệu Trong qui trình khai phá liệu, công việc xử lý liệu trước đưa vào mơ hình cần thiết, bước làm cho liệu có ban đầu qua thu thập liệu (gọi liệu gốc ordinal data) áp ... dụng (thích hợp) với mơ hình khai phá liệu (data SVTH: Nguyễn Thị Hoa Trang Khai phá liệu GVHD: Hồ Nhật Quang mining model) cụ thể Các công việc cụ thể tiền xử lý liệu bao gồm công việc như: - ... trường hợp lại SVTH: Nguyễn Thị Hoa Trang 12 Khai phá liệu SVTH: Nguyễn Thị Hoa GVHD: Hồ Nhật Quang Trang 13 Khai phá liệu GVHD: Hồ Nhật Quang b Phương pháp Percentage split: Cho biết tỉ lệ phân...
  • 20
  • 3.8K
  • 22
Tiểu luận khai phá dữ liệu: Sử dụng weka để phân lớp trên dataset Billionaires92

Tiểu luận khai phá dữ liệu: Sử dụng weka để phân lớp trên dataset Billionaires92

Ngày tải lên : 03/12/2013, 21:31
... Quy trình Train Test classifier: - Dữ liệu để xây dựng mơ hình: liệu gốc (original dataset), liệu phải có thuộc tính phân lớp gọi categorical attribute - Dữ liệu gốc chia thành phần Training Set ... biến liệu, lỗi nhập ghi vào sở liệu, giá trị thuộc tính đánh giá khơng cần thiết trường hợp cụ thể • Tránh “quá vừa” liệu “Quá vừa” liệu khó khăn đáng kể học định phương pháp học khác Quá vừa liệu ... lớp xác tồn case tập liệu đào tạo Đôi liệu đào tạo lại chứa đặc tính cụ thể, nên áp dụng định cho tập liệu khác độ xác khơng cao trước số phương pháp tránh vừa liệu: • Dừng phát triển sớm bình...
  • 20
  • 931
  • 0
Tiểu luận khai phá dữ liệu: Sử dụng phần mềm weka khai phá bộ dữ liệu  Pittsburgh Bridges dataset

Tiểu luận khai phá dữ liệu: Sử dụng phần mềm weka khai phá bộ dữ liệu Pittsburgh Bridges dataset

Ngày tải lên : 13/12/2013, 11:00
... Lấy 50% liệu để xây dựng cây, 50% để test: Khai phá liệu 15  Lần thứ sáu: Lấy 30% liệu để xây dựng cây, 70% để test:  Lần thứ bảy: Lấy 91% liệu để xây dựng cây, 9% để test: Khai phá liệu 16 ... trình sở liệu cho phép bạn chuyển liệu thành tập tin mà giá trị thuộc tính tách dấu phẩy Khai phá liệu định dạng file arff.Bạn cần đưa file vào trình soạn thảo văn từ vi xử lý; thêm tên tập liệu ... cửa số Preprocess WEKA sau: Bạn chỉnh sửa liệu cách click vào liệu xuất để bạn chỉnh sửa Khai phá liệu , lúc bảng Xây dựng định: - Bước ta sử dụng tất liệu để trainning cho cây: + Nhấn vào tab...
  • 18
  • 789
  • 3
Tiểu luận khai phá dữ liệu: Sử dụng phần mềm weka khai phá bộ dữ liệu Adult  với thuật toán phân lớp

Tiểu luận khai phá dữ liệu: Sử dụng phần mềm weka khai phá bộ dữ liệu Adult với thuật toán phân lớp

Ngày tải lên : 13/12/2013, 11:08
... xử lí liệu Giới thiệu tiền xử lý liệu (Data Preprocessing) - Trong qui trình khai phá liệu, công việc xử lý liệu trước đưa vào mơ hình cần thiết, bước làm cho liệu có ban đầu qua thu thập liệu ... liệu) : Nếu bạn có liệu liên tục vài mơ hình áp dụng cho liệu rời rạc (như luật kết hợp chẳn hạn) bạn phải thực việc rời rạc hóa liệu Tiền xử lí liệu với toán chọn Trong toán này, tiền xử lý liệu ... ban đầu qua thu thập liệu (gọi liệu gốc original data) áp dụng (thích hợp) với mơ hình khai phá liệu (data mining model) cụ thể Các công việc cụ thể tiền xử lý liệu bao gồm công việc như: o Filtering...
  • 18
  • 3.3K
  • 14

Xem thêm