Bài tốn 2: So sánh mơ hình Unigram và VSM trong bộ phân loại Nạve Bayes

Một phần của tài liệu Phân loại cảm xúc người dùng trong mạng xã hội (Trang 47 - 50)

Nạve Bayes

Bảng 3.3: Kết quả so sánh Unigram và VSM với Nạve Bayes

Nạve Bayes

Unigram k=5 VSM k=5 Unigram k=10 VSM k=10 Nhạc trẻ 86,18% 95,28% 86,44% 95,28% Nhạc cách mạng 85,81% 93,90% 86,06% 93,90%

Hình 3.4: Biểu đồ so sánh mơ hình Unigram và VSM trong Nạve Bayes với k-folds=5

Hình 3.5: Biểu đồ so sánh mơ hình Unigram và VSM trong Nạve Bayes với k-folds=10

Từ biểu đồ cho thấy, mơ hình trích chọn đặc trưng khơng gian vec-tơ (VSM) cĩ giá trị F-Score cao hơn so với mơ hình Unigram khi phân loại với bộ phân loại Nạve Bayes.

Trong lần thử nghiệm với k-folds=5, giá trị F-Score của mơ hình khơng gian vec-tơ (VSM) cao hơn từ 8-9%. Đối với miền dữ liệu các bài hát nhạc trẻ cĩ độ chênh lệch cao nhất, mơ hình khơng gian vec-tơ cao hơn tới 9%, đạt 95,28% so với 86,18% của Unigram.

Trong lần thử nghiệm với k-folds=10, giá trị F-Score của mơ hình trích chọn đặc trưng Unigram giảm nhẹ, vì thế giá trị F-Score của mơ hình khơng gian vec-tơ vẫn cao hơn từ 8-9%. Điều đĩ cho thấy sự vượt trội của mơ hình khơng gian vec-tơ so với mơ hình Unigram.

2.1.3. Bài tốn 3: So sánh tính hiệu quả của 2 bộ phân loại SVM và Nạve Bayes với phương pháp xây dựng vec-tơ đặc trưng Unigram

Bảng 3.4: Kết quả so sánh SVM và Nạve Bayes với Unigram

Unigram

Nạve Bayes k=5 SVM k=5 Nạve Bayes k=10 SVM k=10

Nhạc trẻ 86,18% 88,28% 86,44% 88,34 %

Nhạc cách mạng 85,81% 88,16% 86,06% 87,52 %

Tất cả 86,19% 87,72% 86,14% 86,63 %

Hình 3.6: Kết quả so sánh hai bộ phân lớp SVM và Nạve Bayes với Unigram với k-folds=5

Hình 3.7: Kết quả so sánh hai bộ phân lớp SVM và Nạve Bayes với Unigram với k-folds=10

Từ biểu đồ cho thấy, bộ phân lớp Máy vec-tơ hỗ trợ (SVM) cĩ giá trị F- Score cao hơn so với bộ phân lớp Nạve Bayes khi sử dụng mơ hình trích chọn đặc trưng Unigram. Giá trị F-Score cao hơn từ 1-3%.

Kết quả thực nghiệm đối với hai phương pháp kiểm thử k-folds=5 và k- folds=10 đều cho ra kết quả giống nhau, Máy vec-tơ hỗ trợ (SVM) cĩ giá trị F- Score cao hơn Nạve Bayes từ 1-3%.

Đối với miền dữ liệu các bài hát nhạc cách mạng cĩ độ chênh lệch cao nhất, SVM cao hơn tới 3%, giá trị F-Score đạt 88,16% so với 85,81% của Nạve bayes với k-folds=5.

Một phần của tài liệu Phân loại cảm xúc người dùng trong mạng xã hội (Trang 47 - 50)