Giải pháp theo phân loại đa nhãn

Một phần của tài liệu (LUẬN văn THẠC sĩ) phân loại câu hỏi pháp quy tiếng việt sử dụng mô hình BERT (Trang 30 - 33)

Luận văn xây dựng bộ phân lớp 34 nhãn. Để xác định nhãn cho một câu hỏi mới thì luận văn cho chạy một lần phân lớp lấy xác suất rồi so sánh các xác suất đĩ với ngưỡng (chọn ngưỡng là 0.5). Lớp nào cĩ xác suất lớn hơn hoặc bằng ngưỡng thì nĩ là nhãn cho câu hỏi đĩ. Nếu trong trường hợp các lớp đều cĩ xác suất nhỏ hơn ngưỡng thì coi đĩ là bài tốn phân loại đa lớp, chọn lớp cĩ xác suất lớn nhất là nhãn của câu hỏi đĩ.

Hình 2-2 Mơ hình giải pháp phân loại theo phân loại đa nhãn

Ví dụ:

 Câu hỏi: “Tr lại xe ơ tơ vi phạm giao thơng gây chết người cho chủ sở hữu khi nào?

 Xác suất các nhãn của câu hỏi sau khi chạy qua bộ phân lớp 34 nhãn như sau: Nhãn Xác suất Cơng chứng 0,01 Dân sự 0,02 Tổ chức chính phủ 0,01 Bảo hiểm 0,01 Cư trú 0,01

Nuơi con nuơi 0,01

Thi hành án 0,01

Quản lý, sử dụng 0,01 Hơn nhân và gia đình 0

Input Bộ phân loại

Xác suất nhãn 1

Xác suất nhãn 2

Xác suất nhãn 34

Tổng hợp Tập nhãn

Quốc tịch Việt Nam 0

Đầu tư 0,01

Ban hành văn bản quy phạm pháp luật 0,01

Bảo vệ mơi trường 0

Xây dựng 0

Tổ chức cơ quan, chính quyền 0

Tố tụng 0,51

Cơng dân 0,01

Quốc phịng 0

Hình sự 0,96

Giao thơng đường bộ 0,01

Thuế 0,01

Đất đai 0,01

Đấu giá tài sản 0

Phịng, chống ma túy 0 Cán bộ, cơng chức, viên chức 0

Khiếu nại, tố cáo 0

Kinh tế 0,01

Phí và lệ phí 0

Lao động 0

Nhà ở 0,01

Lý lịch tư pháp 0

Trách nhiệm bồi thường của Nhà nước 0 Giám định tư pháp 0

 Nhãn của câu hỏi là {Tố tụng, Hình sự}.

Vấn đề cịn lại bây giờ là quy về bài tốn xây dựng các bộ phân lớp. Cĩ nhiều mơ hình để xây dựng các bộ phân lớp, một số mơ hình sẽ được trình bày ở mục tiếp theo.

Một phần của tài liệu (LUẬN văn THẠC sĩ) phân loại câu hỏi pháp quy tiếng việt sử dụng mô hình BERT (Trang 30 - 33)