0

Bài giảng Xử lý ngôn ngữ tự nhiên (Natural language processing): Bài 6 - Viện Công nghệ Thông tin và Truyền thông

67 8 0

Đang tải.... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Tài liệu liên quan

Thông tin tài liệu

Ngày đăng: 22/11/2022, 22:43

Bài giảng Xử lý ngôn ngữ tự nhiên (Natural language processing): Bài 6 cung cấp cho học viên những nội dung về: phân tích vai nghĩa; bài toán phân tích vai nghĩa; gán nhãn vai trò ngữ nghĩa; phương pháp luận đối với xây dựng FrameNet; tổng quan chung về các hệ thống SRL;... Mời các bạn cùng tham khảo chi tiết nội dung bài giảng! 1 PHÂN TÍCH VAI NGHĨA Một số slide tham khảo từ tutorial Scott Wen-tau Yih & Kristina Toutanova (Microsoft Research) Giới thiệu Phân tích cú pháp toán NLP kiểu phân tích thực tốt NLP? Phân tích cú pháp nhằm thực phân tách câu thành phần có nghĩa hay tìm mối quan hệ có nghĩa mà sử dụng tốn phân tích ngữ nghĩa: • Gán nhãn vai trị ngữ nghĩa hay cịn gọi phân tích vai nghĩa (chỉ làm cho ai); • phân tích ngữ nghĩa (chuyển câu thành biểu diễn logic câu); • giải nhập nhằng nghĩa từ (chỉ từ câu mang ý nghĩa gì); • xác định ngữ nghĩa hợp thành (tính ý nghĩa câu dựa ý nghĩa phần câu) Trong chương này, tìm hiểu tốn phân tích vai nghĩa hay gán nhãn vai trò ngữ nghĩa Giới thiệu • Nhiệm vụ gán nhãn vai trị ngữ nghĩa (semantic role labeling SRL) cách xác quan hệ ngữ nghĩa đắn vị từ thành phần kết hợp nó, quan hệ lấy từ danh sách xác định vai trị ngữ nghĩa vị từ • Ví dụ: [The girl on the swing]Agent [whispered]Pred to [the boy beside her]Recipient Giới thiệu • Các vai trị điển hình sử dụng SRL nhãn chẳng hạn Agent, Patient, Location thực thể tham gia kiện, Temporal Manner để đặc trưng khía cạnh khác kiện hay quan hệ tham gia khác • Cách tiếp cận theo ngơn ngữ tính tốn tốn SRL địi hỏi xây dựng từ điển ngữ nghĩa từ vựng sưu tập câu thích vai nghĩa • kho ngữ liệu xây dựng dựa Ngữ nghĩa khung (frame) sử dụng đ/v tốn SRL FrameNet PropBank Các vấn đề đ/v vai trị ngữ nghĩa • Rất khó để đưa định nghĩa hình thức cho vai trị • Có kiểu phân tách vai trị khác tùy ý • Các giải pháp đ/v vấn đề khó định nghĩa vai trị ngữ nghĩa: • Khơng ý đến nhãn vai trò ngữ nghĩa, đánh dấu vai trò/bổ ngữ động từ 0, 1, • PropBank • Xác định nhãn vai trị ngữ nghĩa đ/v miền ngữ nghĩa đặc biệt • FrameNet Frame • Các ngữ nghĩa khung (frame): • đề xuất bới Fillmore (1976); • khung mơ tả trường hợp dạng nguyên mẫu; • khung xác định vị từ (predicate); • khung bao gồm số phần tử khung (arguments; sem roles) Frame • Các tính chất ngữ nghĩa khung : • cung cấp phân tích ngữ nghĩa nơng; • mức trung gian vai trò tổng quát vai trị đặc biệt theo động từ; • tổng qt hóa tốt cho ngơn ngữ khác; • có lợi cho ứng dụng NLP khác (IR, QA) FrameNet [Fillmore et al 01] Frame: Hit_target (hit, pick off, shoot) Core Agent Target Instrument Manner Means Place Purpose Subregion Time Lexical units (LUs): Words that evoke the frame (usually verbs) Non-Core Frame elements (FEs): The involved semantic roles [Agent Kristina] hit [Target Scott] [Instrument with a baseball] [Time yesterday ] Frames FrameNet [Baker, Fillmore, Lowe, 1998] ... Scott] [A2 with a baseball] [AM-TMP yesterday] Proposition Bank (PropBank) Thêm tầng ngữ nghĩa– Continued C-A1 A1 A0 [A1 The worst thing about him] said [A0 Kristina ] [C-A1 is his laziness] Một... deserved; A2: in-exchange-for It looked to her like [A0 he] deserved [A1 this] Proposition: A sentence and a target verb Proposition Bank (PropBank) Thêm tầng ngữ nghĩa A0 A1 A2 AM-TMP [A0 Kristina] hit... dấu vai trò/bổ ngữ động từ 0, 1, • PropBank • Xác định nhãn vai trò ngữ nghĩa đ/v miền ngữ nghĩa đặc biệt • FrameNet Frame • Các ngữ nghĩa khung (frame): • đề xuất bới Fillmore (19 76) ; • khung mơ
- Xem thêm -

Xem thêm: Bài giảng Xử lý ngôn ngữ tự nhiên (Natural language processing): Bài 6 - Viện Công nghệ Thông tin và Truyền thông,