BÁO CÁO NGHIÊN CỨU ĐỀ TÀI LUẬN VĂN BÁO CÁO NGHIÊN C U Đ Ứ ỀBÁO CÁO NGHIÊN C U Đ Ứ Ề TÀI LU N VĂNẬTÀI LU N VĂNẬ Giáo viên HD TS Nguyễn Cẩm Tú Học viên Đỗ Thị Nương N i dungộN i dungộ Giới thiệu đề tà[.]
BÁO CÁO NGHIÊN CỨU ĐỀ TÀI LUẬN VĂN Giáo viên HD : TS Nguyễn Cẩm Tú Học viên : Đỗ Thị Nương Nội dung Giới thiệu đề tài Phân lớp đa nhãn Các thuật toán học đa nhãn Mối quan hệ phân lớp đa nhãn Định hướng nghiên cứu 26/10/2013 Giới thiệu đề tài Tên đề tài: ◦ “Các phương pháp xác định mối quan hệ đa nhãn ứng dụng phân lớp đa nhãn tiếng Việt” Cơ sở thực tiễn: ◦ Phân lớp đa nhãn có ứng dụng nhiều lĩnh vực như: Phân loại văn tự động chuẩn đoán y học… ◦ Việc xác định mối quan hệ nhãn giữ vai trò quan trọng nâng cao chất lượng gán nhãn Ví dụ: ảnh gán nhãn “bãi biển” loại trừ nhãn "sa mạc"; Các nhãn "bóng đá, câu lạc bộ, đội bóng" thường đồng xuất với trình gán nhãn văn 26/10/2013 Phân lớp đa nhãn Bài toán phân lớp tổng quát: ◦ C = {c1, c2, …, cK}: tập K lớp ◦ X = {xi} (i=1,2,…) không gian đối tượng cần phân lớp ◦ Xây dựng ánh xạ f : X → C ◦ Ánh xạ f gọi mơ hình phân lớp (classification model, classifier) ◦ Xây dựng mơ hình f học giám sát (supervised learning) D = {(x1, c1), (x2, c2), …, (xN, cN)} xn ∈ X, cn ∈ C tập liệu huấn luyện (training data) Huấn luyện mơ hình f dựa tập huấn luyện D cho f phân lớp xác Phân lớp đơn nhãn ◦ ci bao gồm phần tử Phân lớp đa nhãn ◦ ci > phần tử 26/10/2013 Các giải thuật học đa nhãn Binary Relevance(BR) Label Powerset (LP) Classifier Chain Multi-label k-Nearest Neighbors (MLkNN) 26/10/2013 Các giải thuật học đa nhãn(tt) Không xét đến đặc trưng thể Xét tập liệu huấn luyện: Tập thể X = {1, 2, 3, 4} Xét tập lớp Y = {y1, y2, y3, y4} Instance Label {y2, y3} {y1} {y1, y2, y3} {y2, y4} 26/10/2013 Binary Relevance(BR) Ý tưởng : Sử dụng phương pháp chuyển đổi nhị phân, xây dựng nhị phân cho nhãn tập nhãn ◦ Tạo k tập liệu ( k = số lượng nhãn) cho nhãn ◦ Mỗi tập có số thể tập liệu nguồn ◦ Trong tập gán nhãn cho thể thuộc không thuộc lớp Yj ( Bộ phân lớp nhị phân) Ex Label ¬y1 y1 y1 y1 Ex Label y2 ¬y2 y2 y2 Ex Label y3 ¬y3 y3 ¬y3 26/10/2013 Ex Label ¬y4 ¬y4 ¬y4 y4 Label Powerset (LP) Ý tưởng: Xem tập nhãn tập liệu nhãn đơn ◦ Tiến hành việc phân lớp đơn nhãn ◦ Tập nhãn tạo lớn Tải FULL (14 trang): https://bit.ly/3rsAbNv Dự phòng: fb.com/TaiHo123doc.net Instance Label {y2, y3} {y1} {y1, y2, y3} {y2, y4} Instance Label y2,3 y1 y1,2,3 y2,4 26/10/2013 Các giải thuật học đa nhãn(tt) Binary Relevance(BR): Coi nhãn độc lập khơng có quan hệ với Label Powerset (LP): Có xét đến quan hệ nhãn ⇒ Vấn đề nhãn có quan hệ với nhau, số lượng nhãn lớn ⇒ Với liệu văn có kích thước lớn, chứa đựng nhiều thông tin chủ chốt, thơng tin nhiễu Vì vậy, cần có phương pháp cho việc lựa chọn đặc trưng để tối giản toán phân lớp 26/10/2013 4035833 ... Phân lớp đa nhãn Các thuật toán học đa nhãn Mối quan hệ phân lớp đa nhãn Định hướng nghiên cứu 26/10/2013 Giới thiệu đề tài Tên đề tài: ◦ ? ?Các phương pháp xác định mối quan hệ đa nhãn ứng dụng. .. dụng phân lớp đa nhãn tiếng Việt” Cơ sở thực tiễn: ◦ Phân lớp đa nhãn có ứng dụng nhiều lĩnh vực như: Phân loại văn tự động chuẩn đoán y học… ◦ Việc xác định mối quan hệ nhãn giữ vai trò quan. .. mơ hình f dựa tập huấn luyện D cho f phân lớp xác Phân lớp đơn nhãn ◦ ci bao gồm phần tử Phân lớp đa nhãn ◦ ci > phần tử 26/10/2013 Các giải thuật học đa nhãn Binary Relevance(BR) Label Powerset