1. Trang chủ
  2. » Luận Văn - Báo Cáo

tìm hiểu phần mềm weka

28 442 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 28
Dung lượng 371,53 KB

Nội dung

tìm hiểu phần mềm weka

TÌM HIӆU PHҪN MӄM TÌM HIӆU PHҪN MӄM WEKAWEKA GVHD: THҪY NGUYӈN VĂN CHӬC THӴC HIӊN: NHÓM 15 Trưӡng Đҥi hӑc Kinh TӃ Đà Nҹng Khoa Thӕng Kê Tin Hӑc Môn hӑc Cơ sӣ dӳ liӋu NӜI DUNG TRÌNH BÀYNӜI DUNG TRÌNH BÀY Giӟi thiӋu chӭc năng phân lӟp Mӝt sӕ bӝ phân lӟp phә biӃn Cây quyӃt đӏnh ID3 NaiveBayes Tәng kӃt 2 NӜI DUNG TRÌNH BÀYNӜI DUNG TRÌNH BÀY Giӟi thiӋu chӭc năng phân lӟp Mӝt sӕ bӝ phân lӟp phә biӃn Cây quyӃt đӏnh ID3 NaiveBayes Tәng kӃt 3 PHÂN LӞP LÀ GÌ?PHÂN LӞP LÀ GÌ? Phân lӟp (classify) là mӝt nhiӋm vө khai thác dӳ liӋu, trong đó: cho trưӟc mӝt tұp hӧp các lӟp, tìm cách gán mӝt mүu mӟi vào phân lӟp sao cho có đӝ chính xác cao nhҩt có thӇ. Ví dө: Dӵ đoán khӕi u là u lành hay u ác. Phân loҥi văn bҧn theo chӫ đӅ tin tӭc, thӇ thao, giáo dөc Weka hӛ trӧ phân lӟp trong phҫn chӭc năng Explorer cӫa nhóm chӭc năng Applications. 4 PHÂN LӞP VӞI WEKAPHÂN LӞP VӞI WEKA 5 PHÂN LӞP VӞI WEKAPHÂN LӞP VӞI WEKA Đây là chӭc năng cho phép ngưӡi dùng chӑn lӵa mӝt trong các thuұt toán phân lӟp đã cài đһt sҹn đӇ áp dөng lên dӳ liӋu. Bưӟc 1: nhҩn nút Choose đӇ mӣ hӝp thoҥi chӑn thuұt toán. 6 PHÂN LӞP VӞI WEKAPHÂN LӞP VӞI WEKA Đây là chӭc năng cho phép ngưӡi dùng chӑn lӵa mӝt trong các thuұt toán phân lӟp đã cài đһt sҹn đӇ áp dөng lên dӳ liӋu. Bưӟc 2: nhҩn vào ô chӳ hiӇn thӏ thuұt toán đӇ mӣ hӝp thoҥi chӑn tham sӕ. 7 PHÂN LӞP VӞI WEKAPHÂN LӞP VӞI WEKA Đây là chӭc năng cho phép ngưӡi dùng chӑn lӵa mӝt trong các thuұt toán phân lӟp đã cài đһt sҹn đӇ áp dөng lên dӳ liӋu. Bưӟc 1: nhҩn nút Choose đӇ mӣ hӝp thoҥi chӑn thuұt toán. Bưӟc 2: nhҩn vào ô chӳ hiӇn thӏ thuұt toán đӇ mӣ hӝp thoҥi chӑn tham sӕ. Bưӟc 3: nhҩn nút Start đӇ chҥy thuұt toán vӟi dӳ liӋu hiӋn có. 8 PHÂN LӞP VӞI WEKAPHÂN LӞP VӞI WEKA Đây là dӳ liӋu thu đưӧc sau khi thӵc hiӋn thành công, gӗm thông tin v͙ tͅp d· li͟u , mô hình phân lͳp (cây quyӃt đӏnh, giá trӏ xác suҩt«), k͗t qu̻ dΉ đoán trên tұp dӳ liӋu kiӇm thӱ và sͩ li͟u thͩng kê. 9 PHÂN LӞP VӞI WEKAPHÂN LӞP VӞI WEKA Đây là bҧng lưu lҥi thông tin các lҫn chҥy. Ta có thӇ ghi lҥi kӃt quҧ chҥy thuұt toán sang tұp tin đӇ lưu trӳ. 10 [...]... 14.2857 % 23 PHÂN TÍCH KӂT QUҦ Confusion matrix thӇ hiӋn phân bӕ các lӟp do Weka dӵ đoán so vӟi thӵc tӃ Cӝt chӍ sӕ mүu phân bӕ vӅ lӟp tương ӭng do Weka thӵc hiӋn, dòng chӍ sӕ mүu thuӝc vӅ lӟp tương ӭng trong thӵc tӃ Ví dө: Cӝt a có 9 mүu   Weka phân lӟp 9 mүu thuӝc lӟp a, nhưng 9 mүu này thuӝc hai dòng a = yes (8) và b = no (1)   Weka phân lӟp sai 1 mүu === Confusion Matrix === a b < classified as 8 1...PHÂN LӞP VӞI WEKA Đây là bҧng chӑn lӵa chӃ đӝ kiӇm thӱ đӇ đánh giá hiӋu quҧ cӫa bӝ phân lӟp đã đưӧc xây dӵng Use training set: sӱ dөng tұp huҩn luyӋn làm tұp kiӇm thӱ 11 PHÂN LӞP VӞI WEKA Đây là bҧng chӑn lӵa chӃ đӝ kiӇm thӱ đӇ đánh giá hiӋu quҧ cӫa bӝ phân lӟp đã đưӧc xây dӵng Supplied test set: chӍ đӏnh tұp dӳ liӋu mӟi làm tұp kiӇm thӱ 12 PHÂN LӞP VӞI WEKA Đây là bҧng chӑn lӵa chӃ... lӟp đã đưӧc xây dӵng Cross-validation: kiӇm thӱ bҵng phương pháp cross-validation 13 PHÂN LӞP VӞI WEKA Đây là bҧng chӑn lӵa chӃ đӝ kiӇm thӱ đӇ đánh giá hiӋu quҧ cӫa bӝ phân lӟp đã đưӧc xây dӵng Percentage split: chia tұp dӳ liӋu ban đҫu thành tұp huҩn luyӋn và tұp kiӇm thӱ theo tӍ lӋ % 14 PHÂN LӞP VӞI WEKA Các lӵa chӑn tiӋn ích khác Lӵa chӑn thuӝc tính phân lӟp Lӵa chӑn xuҩt kӃt quҧ 15 NӜI DUNG TRÌNH... mӝt mүu (nút lá) Ví dө: ID3, J48« 18 CÁC BƯӞC THӴC HIӊN 19 PHÂN TÍCH KӂT QUҦ Thông tin tóm tҳt vӅ lưӧt chҥy: thuұt toán sӱ dөng, dӳ liӋu đҫu vào (tên, các thuӝc tính«), kiӇu test === Run information === weka. classifiers.trees.Id3 ««««« Scheme: Relation: weather.symbolic Instances: 14 Tên thuұt toán Attributes: 5 Tham sӕ đi kèm outlook temperature humidity windy play Test mode: evaluate on training data... khác Lӵa chӑn thuӝc tính phân lӟp Lӵa chӑn xuҩt kӃt quҧ 15 NӜI DUNG TRÌNH BÀY Giӟi thiӋu chӭc năng phân lӟp Mӝt sӕ bӝ phân lӟp phә biӃn Cây quyӃt đӏnh ID3 NaiveBayes Tәng kӃt 16 CÁC THUҰT TOÁN PHÂN LӞP Weka hӛ trӧ tương đӕi đa dҥng các thuұt toán phân lӟp Các thuұt toán đưӧc chia thành nhiӅu nhóm dӵa theo tính chҩt hoҥt đӝng, có thӇ kӇ đӃn mӝt sӕ đҥi diӋn như: Bayes: mҥng Bayes, NaiveBayes« Functions:... và b = no (1)   Weka phân lӟp sai 1 mүu === Confusion Matrix === a b < classified as 8 1 | a = yes 1 4 | b = no 24 NAÏVE BAYES Là mô hình phân lӟp dӵa trên xác suҩt thӕng kê theo đӏnh lý Bayes Trong Weka, chúng ta quan tâm đӃn dҥng Bayes đơn giҧn nhҩt, đó là NaiveBayesSimple Cách sӱ dөng: tương tӵ các bưӟc thӵc hiӋn trong Cây quyӃt đӏnh ID3 nhưng thay vì đҫu ra là mô hình cây quyӃt đӏnh thì sӁ là... seconds 26 NӜI DUNG TRÌNH BÀY Giӟi thiӋu chӭc năng phân lӟp Mӝt sӕ bӝ phân lӟp phә biӃn Cây quyӃt đӏnh ID3 NaiveBayes Tәng kӃt 27 TӘNG KӂT Phân lӟp (classify) đưӧc hӛ trӧ trong chӭc năng Explorer cӫa Weka Đây là chӭc năng giúp ngưӡi dùng phân lӟp dӳ liӋu dӵa trên quá trình gӗm 2 bưӟc: Huҩn luyӋn: xây dӵng bӝ phân lӟp dӵa trên dӳ liӋu huҩn luyӋn đã đưӧc phân lӟp sҹn Dӵ đoán: sӱ dөng bӝ phân lӟp đӇ quyӃt . TÌM HIӆU PHҪN MӄM TÌM HIӆU PHҪN MӄM WEKAWEKA GVHD: THҪY NGUYӈN VĂN CHӬC THӴC HIӊN: NHÓM 15 Trưӡng Đҥi hӑc Kinh TӃ Đà. phҫn chӭc năng Explorer cӫa nhóm chӭc năng Applications. 4 PHÂN LӞP VӞI WEKAPHÂN LӞP VӞI WEKA 5 PHÂN LӞP VӞI WEKAPHÂN LӞP VӞI WEKA Đây là chӭc năng cho phép ngưӡi dùng chӑn lӵa mӝt trong các thuұt. kê. 9 PHÂN LӞP VӞI WEKAPHÂN LӞP VӞI WEKA Đây là bҧng lưu lҥi thông tin các lҫn chҥy. Ta có thӇ ghi lҥi kӃt quҧ chҥy thuұt toán sang tұp tin đӇ lưu trӳ. 10 PHÂN LӞP VӞI WEKAPHÂN LӞP VӞI WEKA Đây là bҧng

Ngày đăng: 24/11/2014, 10:42

TỪ KHÓA LIÊN QUAN

w