Xây dựng và lựa chọn mơ hình

Một phần của tài liệu Phân tích quan điểm trong lĩnh vực thức ăn trẻ em sử dụng kỹ thuật học máy (Trang 50 - 51)

3. Bố cục luận văn

3.5. Xây dựng và lựa chọn mơ hình

Bước đầu chúng tơi tiến hành thu thập dữ liệu thơ từ các webstie, các diễn đàn mạng xã hội. Sau đĩ dữ liệu được tiền xử lý và lấy mẫu, gán nhãn trước khi tiến hành học máy. Dữ liệu lấy mẫu được chia thành 2 nhĩm: tập dữ liệu huấn luyện (training data), và tập dữ liệu kiểm thử (test data). Tập dữ liệu huấn luyện được sử dụng để thiết lập các mơ hình học máy, bộ dữ liệu xác nhận được sử dụng để lặp lại và tinh chỉnh các mơ hình được chọn, chúng tơi dựa trên kết quả phân lớp chính xác trên tập dữ liệu kiểm thử để tìm ra mơ hình học máy phù hợp nhất. hình 3.7 là mơ hình nghiên cứu với bộ phân lớp với các phương pháp học máy truyền thống.

Hình 3. 7: Mơ hình phân lớp học máy truyền thống 2

Trong quá trình huấn luyện (a), mơ hình học cách liên kết một đầu vào cụ thể là văn bản với đầu ra tương ứng các nhãn dựa trên các mẫu thử nghiệm được sử dụng để huấn luyện. Trích chọn đặc trưng chuyển đầu vào văn bản thành một vectơ đặc trưng. Các cặp vectơ đặc trưng và nhãn (tích cực, tiêu cực hoặc trung tính ) được đưa vào thuật tốn học máy để tạo ra một mơ hình.

Trong quy trình dự đốn (b), trình trích chọn đặc trưng được sử dụng để chuyển đổi đầu vào văn bản khơng nhìn thấy thành vectơ đặc trưng. Sau đĩ, các vectơ đặc trưng này được đưa vào mơ hình, tạo ra các nhãn được dự đốn (tích cực, tiêu cực hoặc trung tính).

Trong phạm vi luận văn này đã sử dụng các kỹ thuật học máy trong bài tốn phân tích quan điểm: Nạve Bayes, Support Vector Machine (SVM), Logistic Regression, Deep Learning (LSTM).

Một phần của tài liệu Phân tích quan điểm trong lĩnh vực thức ăn trẻ em sử dụng kỹ thuật học máy (Trang 50 - 51)

Tải bản đầy đủ (PDF)

(64 trang)