1. Trang chủ
  2. » Luận Văn - Báo Cáo

Tiểu luận khai phá dữ liệu: Sử dụng weka để phân lớp trên dataset Flags

30 754 4

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 30
Dung lượng 843,77 KB

Nội dung

I. Giới thiệu Khai phá dữ liệu là một ngành khoa học thực nghiệm. Nó được thiết kế sao cho bạn có thể nhanh chống thử nghiệm những cách thức hiện tại trên cơ sở dữ liệu mới một cách linh hoạt. Nó cung cấp nhiều sự hỗ trợ cho toàn bộ quá trình xử lý số liệu thực nghiệm, bao gồm chuẩn bị dữ liệu đầu vào, việc ước lượng học những sơ đồ thống kê, và hình dung dữ liệu ra và kết quả của việc học. Weka được phát triển bởi đại học Waikato bang New Zealand, và có tên là Waikato Environment for Knowledge Analysis. Hệ thống được viết bởi java và phân phối dưới thuật ngữ GNU. Nó cung cấp một giao diện tương tự cho nhiều giải thuật học khác nhau với nhiều phương thức chho quá trình xử lý để ước lượng kết quả bằng sơ đồ cho bất kì một dữ liệu nào. Workbenh bao gồm những phương thức chuẩn cho các vấn đề của khai phá dữ liệu như: phân lớp,hồi quy, phân nhóm, phân cụm, luật kết hợp, và các thuộc tính kết hợp. Tập dữ liệu này chứa các chi tiết về lá cờ của các quốc gia, từ tập dữ liệu này ta có thể dự đoán tôn giáo của 1 quốc gia thông qua kích thước và màu sắc trong lá cờ. II. Xây dựng cơ sở dữ liệu Đề tài sử dụng dataset Flags cung cấp giá trị của 30 thuộc tính phân loại cho mỗi lá cờ của mỗi quốc gia. Thông tin về các thuộc tính: 1. Tên: Tên quốc gia. 2. Lãnh thổ: thuộc châu lục nào trong 6 châu lục, 1= Châu Bắc Mỹ, 2= Châu Nam Mỹ, 3 = Châu Âu, 4 = Châu Phi, 5 = Châu Á, 6 = Châu Đại Dương. 3. Khu vực: địa lý góc phần tư, 1= NE, 2 = SE, 3 = SW, 4 = NW. 4. Diện tích: tính đơn vị nghìn km2. 5. Dân số: tính đơn vị là triệu dân. 6. Ngôn ngữ: 1= tiếng Anh, 2= tiếng Tây Ban Nha, 3 = tiếng Pháp, 4= tiếng Đức, 5= Slavic, 6=Indo-Châu Âu, 6 = Trung quốc. 7. Tôn giáo: 0 = Công giáo, 1 = khác Kitô giáo, 2 = Hồi giáo, 3 = Phật giáo, 4 = Hindu, 5 = dân tộc, 6 = chủ nghĩa Mác, 7 = khác. 8. Thanh: Số lượng các thanh dọc trong lá cờ. 9. Sọc: Số các đường sọc ngang trong lá cờ 10. Màu sắc: Số lượng màu sắc khác nhau trong cờ 11. Màu đỏ: 0 nếu không có màu đỏ, 1 nếu có màu đỏ. 12. Màu xanh lá cây: tương tự màu đỏ 13. Màu xanh: tương tự màu đỏ 14. Màu vàng: tương tự màu đỏ 15. Màu trắng: tương tự màu đỏ 16. Màu đen: tương tự màu đỏ 17. Màu cam: tương tự màu đỏ 18. Màu chính: màu chiếm ưu thế trong lá

I. Giới thiệu  ! "#$%!&'()* !+,-& .&/0$1#2 34 56727*(3#'27/ &7.897:;&" )!: ;<=;27':>7&;?&<;;@AB #7 )C77D#*EFG+ (,8E7*,(%.&/0$ 1"*.8 H(3 +/:& ; 3 (%47+,9ID*23.A2 D2DJ2E27KLEA% 7,M9.#2NEA"O9 P.#O.K*7Q&M II. Xây dựng cơ sở dữ liệu R,$J;S+&59TUKD!-M9 -.# Thông tin về các thuộc tính: 1. L'IL'.# 2. VWXIDJ&YDJ2PZ[D\Q]^2_Z[D ]^2TZ[D`2aZ[Db2cZ[Dd2YZ[DR!e( 3. 7I5162PZ>2_Zf>2TZf:2aZ: 4. eKIK(75/_ 5. eD#IK(75&D 6. OIPZ@2_ZLDA\2TZb2aZR%2cZ f72YZgh[D`2YZL&.# 7. LOIUZ[O2PZO2_ZB32TZbE2aZ B2cZD2YZ9i]2jZ 8. LIf#&M 9. fIf#M&M 10. ]QIf#Q&M 11. ]kIUOk2Pk 12. ]0DAI(k 13. ]0I(k 14. ]7I(k 15. ]&QI(k 16. ];I(k 17. ]I(k 18. ]KI& 19. lm&mIf#7m&m&M 20. R.If#no%p. 21. ;&If#.Mq 22. If#6 23. &If#r&Mr "O 24. Vs,IPr&ts, "!2U 25. LIP/A2U! 26. \"IP/87O&7On7KJ2A,p2O U 27. RIP/8n7KJ2! 2DA2 A Mp2U! 28. 7t 8IVPI7&'Mn7KJ2(D24p2U ! 29. ;?IQ)&' '& 30. &I]Q)* '8 III. Thực nghiệm trên Weka 1. Tiền xử lý dữ liệu  ):;>0&;&  [[feVS Hu;S;"nv&??p&3 Mw*?;()@;g?7  x+&'$Xb&;b&;9:;I  ' y O z { y   z  z  y ' |  } ' z  ~ { ~   z ; } { ~ D y A &7 ~  ~ AO z  ;O ~  y  y &( ~ O y  y  z nup2' y  y & z  n ;p2O y ( z O} y & z n[pI  ' y O z { y   z  z  y ' |  } ' z  ~ ;&{ ~  ; y  &( ~  ~ O y ' z O y 'nfp7 ~  y & z ( y nl;p• | &( ~  f y  y  y & z ]nF y & z  | D y p2]0nF y & z ( y D y p2 ;nF y & z & { ~ p2RO z ' z D | nfe;7p/I  [A""9KNnumeric sang nominal Chuyển đổi kiểu dữ liệu của thuộc tính area  LA"XKarea 7*&5(%In€TUUp2\ nTUU€Z&;€PUUUp2VnPUUU€Z&;€Z__aU_p  [[;&DAJS;&;&7;2& ;2 ]>0&;  [7 "L7 "  [[;&DAJFilters unsupervised/attribute/NumericToNominal&3 " A"X"  [[;&DAJS;& unsupervised/attribute/AddValues7EO#I  [7  )K&'7•Filter, ‚0+ 8 I  [87?;&;&&;&3ƒ;;l;:„ x+ !2…P&3A†Nho‡&3u2…_&3A†Binh Thuong” &3[u2…T&3A†Lon”&3[u Chuyển đổi kiểu dữ liệu của thuộc tính Population  LKPopulation A"X(%7*&5I gnb€PUp2\LnPU€Zb€YUp2 enYU€Zb€ZPUUˆp  V(#7*K&'  .8A"X7A+A)b%&5 g2L\2e  fW0$107  "! 8 LE+A&H)K&;70$10 #&5‚O$J1, 2, 32"! k&5A  8!7*5![fl&3)!62‰A &51,2,3W 5! k IV. Xây dựng cây quyết định bằng J48. • \*6'$J+8"&DAI h +7 ClassifyE$J H+7‰ChooseŠDA JJTrees/J48I h R"&&' 7•AUse tranning set &3+Start h .8I ZZZƒ?&ZZZ f;;I<;?;&&;;‹aˆh[U_ch]_ ƒ;I?P g;IPŒa

Ngày đăng: 03/12/2013, 21:01

HÌNH ẢNH LIÊN QUAN

26. Biểu tượng :1 nếu một hình ảnh vô tri vô giác (ví dụ, một chiếc thuyền), nếu không 0 - Tiểu luận khai phá dữ liệu: Sử dụng weka để phân lớp trên dataset Flags
26. Biểu tượng :1 nếu một hình ảnh vô tri vô giác (ví dụ, một chiếc thuyền), nếu không 0 (Trang 2)
 Click vào button ở phía trên vùng Filter, sẽ xuất hiện một bảng dữ liệu như sau: - Tiểu luận khai phá dữ liệu: Sử dụng weka để phân lớp trên dataset Flags
lick vào button ở phía trên vùng Filter, sẽ xuất hiện một bảng dữ liệu như sau: (Trang 5)

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w