Phương pháp Hiển thị

Một phần của tài liệu XÂY DỰNG ỨNG DỤNG TÓM LƯỢC TỰ ĐỘNG VĂN BẢN TIẾNG VIỆT (Trang 51)

c. Mô hình tập thô dung sai

3.2.4.2.Phương pháp Hiển thị

Việc hiển thị liên kết là tiếp nhận các đơn vị ngữ liệu đã được trích rút và giản lược từ các pha trước đó, phân tích mối quan hệ về nghĩa của các câu rồi thêm bớt các từ nối, từ dẫn và sắp xếp theo một thứ tự mới dựa vào những gì đã thu thập sao cho thỏa mãn yêu cầu về hiển thị và yêu cầu về độ dễ đọc, dễ hiểu của người dùng.

Đây là cả một lĩnh vực con của Xử lý ngôn ngữ tự nhiên, một lĩnh vực rất lớn và có nhiều ứng dụng. Đó là lĩnh vực Sinh ngôn ngữ tự nhiên (Natural Language Generation). Hàng năm bên cạnh các hội thảo về Trí tuệ nhân tạo, Xử lý ngôn ngữ tự nhiên thì cũng có rất nhiều các hội thảo về Sinh ngôn ngữ tự nhiên

Một phương pháp thường dùng để thực hiện công việc hiển thị liên kết này là phương pháp dựa theo mẫu có sẵn (templates) và các phân tích về quan hệ câu để sinh từ nối và liên kết các câu. Mẫu có sẵn ở đây không phải là các mẫu khuôn dạng thông tin về câu hay đoạn như trong hệ Trích chọn thông tin (Information Extraction - IE) mà là mẫu về liên kết giữa các câu với nhau. Phương pháp này xét về mặt thuật toán gần như ngược lại với phương pháp quan hệ câu (Discourse-Based) của pha Phân tích. Từ các đơn vị ngữ liệu đã có, ta xác định độ tương tự và độ tương phản về nghĩa, sau đó dựa trên Lý thuyết Cấu trúc tu từ RST để gán cho các câu các quan hệ phù hợp từ đó thêm các từ nối và sắp xếp các thứ tự phù hợp.

Một phương pháp khác là phương pháp học dựa vào tập mẫu (Corpus) đế xây dựng nên đoạn văn hay văn bản từ các đơn vị ngữ liệu.

Một phần của tài liệu XÂY DỰNG ỨNG DỤNG TÓM LƯỢC TỰ ĐỘNG VĂN BẢN TIẾNG VIỆT (Trang 51)