Hình 3.2 Sơ đồ quá trình xử lý câu truy vấn tiếng Việt đưới dạng ngôn ngữ tự nhiên

Một phần của tài liệu tiểu luận phương pháp nguyên cứu khoa học trong tin học ứng dụng vào việc xây dựng phương pháp trả lời các truy vấn tiếng việt cho hệ thống tìm kiếm thư viện phim (Trang 29 - 30)

Một câu truy vấn tiếng việt trước khi được chuyên thành cây cấu trúc ngữ pháp DCG phải trải qua bước tiền xử lý câu truy vấn.

Các bước thực hiện trong quá trình tiền xử lý: -_ Loại bỏ các khoảng trắng dư thừa.

- _ Chuyển chữ hoa về dạng chữ thường.

- _ Thay thế các kí tự đặc biệt như dấu phẩy, dấu hai chấm, dấu chấm phẩy... thành các chuỗi đại diện.

- _ Biến đổi chuỗi thành dạng danh sách các từ đơn.

Kết quả của quá trình này sẽ cho chúng ta một danh sách các từ đơn của câu

truy vấn.

Phân tích cú pháp bằng DCG là dựa vào các qui tắc cú pháp đã được định nghĩa bằng DCG để phân tích và xác định cấu trúc cây cú pháp của câu hỏi.

2.3. Nguyên lý linh động

Áp dụng nguyên lý linh động trong phận tích, chuyển đổi cây ngữ pháp sang ngôn ngữ truy vấn SPARQL, một thuật toán là thành phần trung giản để chuyển đổi bất kì cây ngữ pháp nào có được từ bộ phân tích câu truy vấn. Thuật toán chuyên đổi cây cú pháp sẽ nhận chuỗi input là cây cú pháp để xác định được đâu là thành phần cần truy vấn, đâu là thành phần đữ liệu, cuối cùng sẽ chuyển các thành phần đó về đạng câu truy vấn SPARQL.

Sơ đồ thiết kế bộ chuyền đổi cây cú pháp:

"1. `...

Hình 3.3 Sơ đồ khối quá trình chuyên đổi cây cú pháp sang SPARQL Ví đụ:

Input và Output của thuật toán chuyên đổi.

Giả sử chúng ta có câu truy vấn sau: “ đương di là diễn viên của phim chòm

sao tình yêu ?”

Một phần của tài liệu tiểu luận phương pháp nguyên cứu khoa học trong tin học ứng dụng vào việc xây dựng phương pháp trả lời các truy vấn tiếng việt cho hệ thống tìm kiếm thư viện phim (Trang 29 - 30)

Tải bản đầy đủ (PDF)

(37 trang)