Trích chọn quan hệ ngữ nghĩa

Một phần của tài liệu Trích chọn thông tin y tế tiếng Việt cho bài toán tìm kiếm ngữ nghĩa (Trang 39 - 43)

1.4 .Trích chọn thơng tin

4.1. Tổng quan về xác định quan hệ ngữ nghĩa

4.1.2. Trích chọn quan hệ ngữ nghĩa

Mục đích của trích chọn quan hệ ngữ nghĩa là trích rút ra những quan hệ chuyên biệt, cụ thể nào đĩ giữa các thực thể trong nguồn ngữ liệu văn bản lớn. Thực chất nhiệm vụ của trich chọn quan hệ ngữ nghĩa là khi được cho một cặp thực thể x- y, phải xác định được ý nghĩa của cặp thực thể đĩ [24]. Lấy ví dụ từ câu “mất ngú do căng thẳng, hồi hộp” chúng ta cĩ thể suy ra quan hệ ngữ nghĩa: căng thẳng, hổi hộp là nguyên nhân của bệnh mất ngủ.

Hình 8. Minh họa về trích chọn quan hệ ngữ nghĩa

Các tài nguyên trich chọn quan hệ ngữ nghĩa bao gồm:

• Các tập dữ liệu: Dựa trên sự xuất hiện đồng thời và các phương pháp thống kê.

• Các tài nguyên sẵn cĩ về các quan hệ ngữ nghĩa như WordNet và các bộ chuẩn

mực.

• Sự đánh giá của con người.

Cũng như nhận dạng thực thể, nhận dạng quan hệ ngữ nghĩa cũng cĩ một số khĩ khăn riêng như sau (1) chưa cĩ được sự thống nhất về vấn đề số lượng các quan hệ ngữ nghĩa, các quan hệ ngữ nghĩa được ẩn giấu dưới các dạng khác nhau; (2) các sự kết hợp (danh từ - danh từ) khơng hồn tồn tuân theo các quy tắc ràng buộc nhất định, các quan hệ ngữ nghĩa thường là ẩn, cĩ thể cĩ nhiều mối quan hệ giữa các cặp khái niệm, việc thơng dịch cĩ thể phụ thuộc nhiều vào ngữ cảnh, khơng cĩ một tập đã được định nghĩa tốt về các quan hệ ngữ nghĩa.

32

Việc trích chọn quan hệ ngữ nghĩa là một phần của các dự án quan trọng mang tầm cỡ quốc tế trong lĩnh vực khai phá tri thức [24]. Ví dụ như ACE (Automatic Content Extraction). DARPA EELD (Evidence Extraction and Link Discovery), ARDA-AQUAINT (Question Answering for Intelligence), ARDA NIMD (Novel Intelligence from Massive Data), Global WordNet.

Hình 9. Vị trí của khai phá quan hệ ngữ nghĩa trong xử lý ngơn ngữ tự nhiên

Tùy thuộc vào từng miền, lĩnh vực mà chúng ta cĩ các quan hệ ngữ nghĩa khác nhau. Bảng trong Hình 10 minh họa một số quan hệ ngữ nghĩa trong WordNet

33

Hình 10. Minh họa các quan hệ ngữ nghĩa được chỉ ra trong WordNet [37]

Đối với miền dữ liệu y tế, qua khảo sát, chúng tơi thu thập được 12 loại quan hệ ngữ nghĩa, các quan hệ này sẽ được mơ tả chi tiết trong Chương 5.

34

Hình 11. Một số quan hệ ngữ nghĩa đã xây dựng được

Hình 11 mơ tả một số quan hệ ngữ nghĩa, ý nghĩa các quan hệ ngữ nghĩa này được mơ tả trong bảng Bảng 1.

35

Quan hệ Ý nghĩa Quan hệ đảo ngược

Gây_ra Mơ tả quan hệ nguyên_nhân gây

ra bệnh

Bị_gây_ra_bởi

Cĩ_triệu_chứng Quan hệ bệnh cĩ các triệu chứng Liên_quan

Tại Tổ_chức được đặt taị Địa_điểm Chữa_bằng Bệnh được chữa bằng thuốc Chữa Làm_việc Người làm việc ở tổ_chức

Biến_chứng Bệnh biến chứng sang bệnh khác

Tương_tác_thuốc Thuốc tương tác với thuốc Phát_hiện_tại Bệnh được phát hiện tại Tổ_chức Tác_động_tốt Thực_phẩm,Hoạt_động, Chất_hĩa_học tác động tốt đển cơ_thể_người, bệnh Tác động xấu Thực_phẩm, Hoạt_động, Chất_hĩa_học tác động xấu đển cơ_thể_người, bệnh

Bảng 1. Giải thích các mối quan hệ ngữ nghĩa

Một phần của tài liệu Trích chọn thông tin y tế tiếng Việt cho bài toán tìm kiếm ngữ nghĩa (Trang 39 - 43)

Tải bản đầy đủ (PDF)

(67 trang)