Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 39 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
39
Dung lượng
839,52 KB
Nội dung
TUẦN 11: KHAI PHÁ QUAN ĐIỂM hieunk@soict.hust.edu.vn Nội dung Các toán khai phá quan ểm Phân loại cảm xúc không giám sát Phân loại cảm xúc có giám sát Các tốn khai phá quan ểm from M.D Munezero et al Are they different? Affect, feeling, emotion, sentiment, and opinion detection in text, IEEE Trans Affect Comput (2) (2014) 101–111 Các ứng dụng Chăm sóc khách hàng Quảng cáo, marketing Tín nhiệm xã hội, tài cá nhân An ninh quốc phòng Vận động tranh cử Chính sách xã hội Bài tốn 1: Phân loại cảm xúc Phân loại bình luận, đánh giá vào ba lớp: Tích cực Tiêu cực Trung tính “BPhone chất đến chi tiết.” Bài tốn 2: Tóm tắt quan điểm Bao gồm hai toán con: Xác định khía cạnh Phân loại cảm xúc với khía cạnh Bài toán 3: So sánh quan điểm So sánh quan điểm Đối tượng A đối tượng B Đối tượng A đối tượng B khía cạnh s Đối tượng A với đối tượng khác Bài tốn 4: Tìm kiếm quan điểm Tìm kiếm quan điểm (của chủ thể) đối tượng Dựa kiến trúc máy tìm kiếm Bài tốn 5: Lọc quan điểm Hype spam Defaming spam Sản phẩm tốt Sản phẩm tồi Sản phẩm trung bình Phân loại cảm xúc không giám sát 2.1 Phân loại cảm xúc Cảm xúc Ví dụ Cảm xúc Tình cảm hướng nội Thật vinh dự tự hào cho tơi xem bóng đá Việt Nam chơi sân World Cup tích cực Nur Farahain cịn tiếng giáo viên thân thiện hịa đồng Tình cảm hướng ngoại với học sinh tích cực Tâm trạng Thí sinh hồi hộp, gục bàn mệt mỏi tiêu cực Thái độ Hết lịng nhà chồng tơi bị mẹ chồng ghét tiêu cực Tính cách Em tự thấy động, biết đàn tích cực 10 CBOW Hà_Nội thủ_đô Việt_Nam 25 CBOW (tiếp) Tầng đầu vào gồm V nơ-ron biểu diễn từ ngữ cảnh theo dạng one-hot Tầng ẩn gồm n nơ-ron Tầng đầu gồm V nơ-ron dùng để dự đoán từ trung tâm Trọng số tầng đầu vào tầng ẩn sau học dùng làm bảng tra biểu diễn từ 26 king – queen = man - Véc-tơ biểu diễn ‘king’: a Véc-tơ biểu diễn ‘queen’: b Véc-tơ biểu diễn ‘man’: x Tính véc-tơ d = a – b + c Tìm từ d’ có khoảng cách (Euclide, cosine) tới d gần nhất: d’ ~ ‘woman’ 27 Trực quan hóa biểu diễn từ 28 Skip-gram Hà_Nội thủ_đô Việt_Nam 29 Kiến trúc mơ hình 30 Tầng đầu vào xi ∈ Rk biểu diễn liên tục từ thứ i Được khởi tạo ngẫu nhiên trọng số cập nhật trình học Được khởi tạo dựa biểu diễn học trước tập văn lớn Được cập nhật q trình học “Đóng băng” q trình học Văn đầu vào gồm từ x1, x2,…, xn theo thứ tự Biểu diễn văn ghép nối biểu diễn từ theo thứ tự xuất văn 31 Tầng nhân chập Mỗi lọc w ∈ Rhk quét cửa sổ gồm h từ liên tiếp xi:i+h để sinh đặc trưng ci Chiều rộng cửa sổ: h Chiều cao cửa sổ = chiều từ nhúng Mỗi lọc sinh đồ đặc trưng c ∈ Rn-h+1, c = [c1, c2, …, cn-h+1] 32 Tầng pooling Với đồ đặc trưng c, áp dụng max pooling để lấy giá trị lớn Áp dụng cửa sổ h ∈ [3, 4, 5] Ứng với giá trị h có 100 lọc Tổng số nơ-ron tầng pooling: 100 x = 300 33 Tầng liên kết đầy đủ Kĩ thuật điều chỉnh: Áp dụng drop-out t ại t ầng pooling với tỉ lệ drop-out p = 0.5 Số nơ-ron tầng đầu ra: 2: xét nhãn tích cực tiêu cực 3: tích cực, trung tính, tiêu cực 34 Tập DL MR: Bình luận phim với bình luận câu Gán nhãn tích cực/tiêu cực SST-1: Mở rộng tập MR với nhãn (rất tích cực, tích cực, trung tính, tiêu cực tiêu cực) SST-2: Tương tự SST-1 loại bỏ nhãn trung tính có hai nhãn tích cực tiêu cực CR: Đánh giá sản phẩm Gán nhãn tích cực/tiêu cực 35 Các mơ hình CNN-rand: Từ nhúng khởi tạo ngẫu nhiên cập nhật trình học CNN-static: Sử dụng từ nhúng học trước từ word2vec, biểu diễn từ (bao gồm từ OOV khởi tạo ngẫu nhiên) giữ nguyên tr ọng số CNN-non-static: Biểu diễn từ khởi tạo word2vec tinh chỉnh trình học CNN-multichannel: Kết hợp static non-static 36 Kết thực nghiệm 37 Tinh chỉnh từ nhúng 38 Q&A mailto: hieunk@soict.hust.edu.vn 39