Sau khi xây dựng được vec-tơ đặc trưng và miêu tả nĩ dưới dạng file arff ta cĩ thể sử dụng Weka để chạy hai thuật tốn phân loại SVM và Nạve Bayes.
Tải weka tại http://www.cs.waikato.ac.nz/ml/weka/downloading.html
Với mỗi thuật tốn ta thực hiện theo các bước sau: B1: Chọn Explorer
B2: Chọn File Arff bạn muốn thực hiện thuật tốn (File arff đã tính tốn trước đĩ)
B3. Chọn Thuật tốn Clasify (Nạve Bayes hoặc SMO), chọn số Folds = 5 B4. Thực hiện Start. Ta được kết quả phân loại. Lưu kết quả này ra file để đánh giá, so sánh sau này.
Hình 2.11: Các bước sử dụng Weka để phân loại dữ liệu
Kết thúc pha này, ta được các kết quả đánh giá mơ hình bài tốn với hai bộ phân loại Nạve Bayes và SVM. Đây là phụ lục 02 của luận văn.
Hình 2.12: Kết quả đánh giá mơ hình bài tốn.
Đây là chương quan trọng của luận văn, mơ tả chi tiết các bước để giải quyết bài tốn phân loại cảm xúc người dùng trong mạng xã hội.
Luận văn đã trình bày về mơ hình bài tốn tổng quát. Cách xây dựng vec-tơ đặc trưng với N-Grams và Vector Space Model. Cơ sở lý thuyết của hai thuật tốn phân loại cảm xúc Support Vector Machine và Nạve Bayes. Chi tiết các pha xây dựng mơ hình bài tốn, từ xử lý dữ liệu đầu vào, đến trích chọn, xây dựng vec-tơ đặc trưng biểu diễn dưới dạng arff, cách sử dụng Weka để đạt được kết quả sử dụng cho nghiên cứu, đánh giá, so sánh.
Trong chương tiếp theo, ta sẽ tiến hành đánh giá, so sánh kết quả của chương này xem n-grams hay VSM tốt hơn, SVM hay Nạve Bayes cái nào tốt hơn…
CHƯƠNG 3: THỬ NGHIỆM VÀ ĐÁNH GIÁ KẾT QUẢ
Trong chương này, luận văn sẽ tiến hành cơng việc thử nghiệm mơ hình bài tốn với hai cách trích chọn đặc trưng n-grams, Mơ hình khơng gian vec-tơ (Vector Space Model) và hai bộ phân loại SVM và Nạve Bayes. Từ đĩ, luận văn sẽ đưa ra những kết luận, đánh giá, so sánh tính hiệu quả của mơ hình cũng như hai bộ phân loại đã chọn.