Để thực hiện phân nhóm và gom cụm ý kiến theo một ngữ cảnh hẹp, ta d ng bộ tự điển tra cứu được tạo ra với các thông tin sau:
o Danh sách các Chủ đề mà sinh viên có khả năng phản ánh và đề cập đến như:
Tài liệu, giáo trình Giảng viên, bài giảng
Begin Dstu=TachTu(cau) I<DSTu.length DSTu(i) là từ yếu I+=1 CauChuan+=DsTu(i) I+=1 End 2 1 Return CauChuan 3 Đúng Sai Đúng Sai
Cơ sở vật chất
Lịch học, thời khoá biểu
o Với mỗi chủ để ta có các từ khóa để nhận dạng xem ý kiến đó thuộc thể loại hay chủ đề nào, t y theo từ khóa đơn giản hay phức tạp để tính điểm và trọng số của nó. Ví dụ:
Nếu ý kiến phản ánh về Giảng viên sẽ có thể xuất hiện các từ khóa như: Thầy (giáo), Cô (giáo), Giáo viên, Giáo sư
Nếu ý kiến phản ánh về Giờ giấc sẽ có thể xuất hiện các từ khóa như: đúng giờ, trễ giờ, về sớm, dạy không đủ giờ
Hoặc nếu ý kiến phản ánh về Máy móc, thiết bị sẽ có thể xuất hiện các từ khóa như: âm thanh, ánh sáng, bàn phím, chuột, máy tính, CPU, máy chiếu, máy điều hòa, micro, projector
o Nếu không rơi vào những chủ đề đã có trong bô từ điển thì ta sẽ phân vào nhóm Ý kiến khác
Sau khi đã có bộ từ điển tra cứu, khi xử lý ta sẽ sử dụng các k thuật tìm kiếm trên văn bản để so khớp và phân loại các ý kiến vào các chủ đề đang có.
2.2.5.1 Thuật toán phân tích chủ đề của ý kiến
Để phân tích chủ đề của ý kiến, trong luận văn này đề xuất thuật toán như trên hình 2.10. Bao gồm các bước sau:
o Bước 2 – Tìm Chủ đề của từng ý kiến, nếu tìm thấy sẽ cập nhật Chủ đề của ý kiến, nếu không tìm thấy sẽ đưa vào nhóm Ý kiến khác.
o Bước 3 – Sắp xếp và gom cụm các ý kiến có c ng chủ đề.
Hình 2.10 Thuật toán phân tích chủ đề ý kiến