Mơ hình hệ thống hỏi đáp tiếng Việt

Một phần của tài liệu TRÍCH RÚT MỐI QUAN HỆ NGỮ NGHĨA VÀ ÁP DỤNG CHO HỆ THỐNG HỎI ĐÁP TỰ ĐỘNG TIẾNG VIỆT (Trang 39 - 42)

Từ những cơng trình liên quan được nêu ở các mục trên, khố luận này đưa ra mơ hình áp dụng trích rút mối quan hệ ngữ nghĩa vào hệ thống hỏi đáp tự động tiếng Việt. Phương pháp trích rút mối quan hệ ngữ nghĩa đã trình bày là sự kết hợp giữa hai phương pháp Snowball và phương pháp trích rút mối quan hệ sử dụng máy tìm kiếm. Phương pháp này tận dụng được nguồn tài nguyên dữ liệu trực tuyến khổng lồ nhằm mở rộng cũng như đánh giá được độ chính xác của tập dữ liệu thu được. Dưới dây là mơ hình chung của hệ thống

31

Hình 6. Mơ hình của hệ thống hỏi đáp tự động

Dựa vào mơ hình, giải quyết bài tốn qua 2 pha chính: - Pha 1: Trích rút mẫu quan hệ và tập seed

- Pha 2: Phân tích câu hỏi và trích xuất câu trả lời v Pha 1: Trích rút mẫu quan hệ ngữ nghĩa hai ngơi

ü Input: Tập các seed ban đầu được xây dựng bằng tay.

ü Output:

o Tập mẫu tổng quát sử dụng cho việc phân tích câu hỏi và trả lời

o Tập seed mới

ü Phương pháp giải quyết: Sử dụng mơ hình trích rút mối quan hệ ngữ nghĩa

[Mục 3.1]

v Pha 2: Phân tích câu hỏi và tìm câu trả lời

ü Input: Câu hỏi tự nhiên do người dùng đưa vào

ü Output: Câu trả lời ngắn gọn và chính xác

ü Phương pháp giải quyết:

Câu hỏi

Câu trả lời Phân tích câu hỏi và trích

xuất câu trả lời

Trích xuất mẫu tổng quát + seed

32

Hình 7. Mơ hình xử lý cho pha phân tích câu hỏi và trích xuất câu trả lời Bước 1: Tiền xử lý câu hỏi

- Tiến hành tách từ cho câu hỏi - Loại bỏ các từ dừng

Bước 2: Phân tích câu hỏi

- Dựa vào tập thực thể mở rộng, nhận dạng các thực thể cĩ chứa trong câu hỏi. - Xác định nhãn thực thể: Bằng cách so khớp các thực thể được nhận dạng với các

thực thể cĩ chứa trong tập seed.

- Xác định mẫu quan hệ: Sau khi xác định được thực thể và các nhãn, xác định các mối quan hệ cĩ liên quan tới thực thể đĩ và những tập mẫu tương ứng với mối quan hệ này.

- Vector hố câu hỏi bằng cách biểu diễn các từ trong câu hỏi dưới dạng vector từ

Bước 3: So khớp mẫu

- Tính độ tương đồng giữa vector câu hỏi với tập mẫu tương ứng của các mối quan hệ theo độ đo cosine

- Chọn các mẫu cĩ độ tương đồng cao nhất. Dựa vào đĩ, ta xác định được mối quan hệ mà câu hỏi đang được đề cập tới.

Tiền xử lý Câu hỏi Câu trả lời Phân tích câu hỏi Matching mẫu/ Trích rút câu trả lời Tập mối quan hệ + tập seed

33

Bước 4: Trích xuất câu trả lời.

- Sau khi xác định được mối quan hệ được hướng tới và các mẫu quan hệ tương ứng kết hợp với thực thể ban đầu cĩ trong câu hỏi đã được xác định. Tiến hành trích xuất ra câu trả lời là thành phần cịn lại của seed.

Một phần của tài liệu TRÍCH RÚT MỐI QUAN HỆ NGỮ NGHĨA VÀ ÁP DỤNG CHO HỆ THỐNG HỎI ĐÁP TỰ ĐỘNG TIẾNG VIỆT (Trang 39 - 42)

Tải bản đầy đủ (PDF)

(60 trang)