Nhân quả là một trong những quan hệ ngữ nghĩa quan trọng nhất góp phần tạo nên tính chặt chẽ của văn bản. Các quan hệ nguyên nhân - kết quả là một đặc tính của
nhiều quá trình trong tự nhiên, và thường xuyên dùng đến trong ngôn ngữ của con người.
Trong phần này chúng tôi đi sâu phân tích chi tiết về các cấu trúc nguyên nhân trong các văn bản bằng tiếng Anh và trình bày một cách phân lớp ngữ nghĩa và cú pháp của các mẫu cú pháp từ vựng nguyên nhân - kết quả để tự động phát hiện và trớch rỳt cỏc quan hệ nguyên nhân - kết quả. Chúng tôi còn trình bày một thuật toán nhằm phát hiện các quan hệ nguyên nhân - kết quả trong các tài liệu văn bản dựa trên tần suất xuất hiện của động từ kết nối giữa nguyên nhân - kết quả và trọng số của cặp danh từ trong quan hệ đó.
Nói chung, quan hệ nguyên nhân - kết quả thường đề cập đến cách thức tìm hiểu xem trạng thái liệu một vấn đề có gây nên vấn đề khác hay không. Mặc dù khái niệm về nhân quả đó cú từ rất lâu rồi (bắt đầu từ thời Aristotle) và qua thời gian các nhà khoa học và các nhà triết học vẫn còn tranh cãi về định nghĩa quan hệ nguyên nhân - kết quả và khi nào thì trạng thái của các sự việc là có quan hệ nguyên nhân - kết quả với nhau.
Học thuyết về quan hệ nguyên nhân - kết quả là vô cùng rộng lớn, có lẽ vì thế mà đặc tính quan trọng nhất khi làm việc trờn cỏc quan hệ nguyên nhân - kết quả trong thập niên gần đây là về tính đa dạng của nó. Người ta đã phát triển một số học thuyết này và kết quả dẫn đến có quá nhiều sách báo xuất bản, công bố các công trình nghiên cứu. Sự bùng nổ các hướng nghiên cứu này một phần là do các nhà nghiên cứu đã đưa ra quá nhiều viễn cảnh và do khái niệm về nhân quả có thể ứng dụng trong nhiều lĩnh vực rất đa dạng như : triết học, thống kê, ngôn ngữ học, vật lý, kinh tế học, sinh học, y học…
Theo Sowa, Trí tuệ Nhân tạo là một trong ba môn học lý thuyết (cùng với cỏc mụn vật lý lý thuyết và triết học ) quan tâm đến quan hệ nguyên nhân - kết quả và phát triển các học thuyết nhằm kích thích các ứng xử thông minh mức nhân loại hoặc xa hơn. Trong Trí tuệ Nhân tạo đã tiến hành rất nhiều các nghiên cứu về quan hệ nguyên nhân - kết quả như trong Planing (Lập kế hoạch), Explanation (Sự giải nghĩa), và
Computational Linguistics ( Ngôn ngữ học máy tính )
Lập kế hoạch trong AI : là các vấn đề tìm một dãy các hoạt động chính để đạt được một mục đích nào đó. Khả năng suy luận về thời gian và hành động là cơ sở cho hầu hết các thực thể thông minh cần có để đưa ra được một chuỗi các quyết định. Tuy nhiên, việc biểu diễn khái niệm về dãy cỏc hành động và về kết quả khi thực hiện dãy hành động đó mà không đề cập đến các khái niệm về thời gian và nhân quả là rất khó
khăn. Các công việc lập kế hoạch cho robot đòi hỏi phải suy luận ra nguyên nhân dẫn đến các hành động và khoảng thời gian bao lâu để thực hiện các hành động đó. Xác định nguyên nhân của một trạng thái chắc chắn nào đó của các vấn đề thì phải ưu tiên theo thứ tự thời gian xem xét vấn đề đó. Ngoài ra, Planing cũng rất quan trọng trong nhiều lĩnh vực khác của AI. Trong vấn đề Hiểu Ngôn ngữ Tự nhiên (Natural Language Understanding - NLU), ví dụ, suy luận về mục tiêu và dự định của mọi người để đưa ra nghĩa tốt nhất của những gì họ nói.
Các nhà nghiên cứu trong Hiểu Ngôn ngữ Tự nhiên ngày càng quan tâm đến sự tương tự của giữa các công việc lập kế hoạch cho khái niệm và cấu trúc của văn bản ngôn ngữ tự nhiên và của cỏc cỏc nhiệm vụ lập kế hoạch khác trong AI. Các vấn đề trong NLU như truyện, tổng quát hoá ngôn ngữ được xem là những vấn đề planing.
Giải nghĩa trong AI giải quyết các vấn đề suy luận về các hành động có lý trí, bao gồm quan hệ nguyên nhân - kết quả (định nghĩa tình huống nguyên nhân) và phân biệt các tình huống . Phép phân tích nhân quả trong lĩnh vực này chủ yếu được làm thông qua việc sử dụng cỏc cõu lệnh biểu diễn những gì xảy ra trong các tình huống khác nhau. Pearls giải thích nhân quả bằng mạng Bayseian, trong đó mỗi kết nối có một chỉ dẫn bên trong. Công việc của Pearls tập trung vào phiên dịch các phương trình biểu diễn khẳng định nhân quả như khẳng định về các kết quả của những thí nghiệm lý thuyết.
Ortiz kiểm tra độ sâu vai trò của suy luận trong học thuyết nhân quả và các loại suy luận có thể đưa vào trong lớp thuộc tính nhân quả. Ông đề xuất một ngôn ngữ nhân quả kinh nghiệm và định nghĩa quan hệ nguyên nhân - kết quả bằng các vấn đề biểu diễn những điều sẽ hoặc có thể xảy ra trong những tình huống khác nhau.
Các nhà ngôn ngữ học máy tính: cố gắng coi các khái niệm của nguyên lý nhân quả trong ngôn ngữ tự nhiên tập trung vào các cấu trúc ngữ nghĩa và từ vựng có thể biểu diễn được những quan hệ ngữ nghĩa. Bắt đầu từ một khái niệm triết học cho rằng các quan hệ nguyên nhân - kết quả ở giữa hai trạng thái của vấn đề, có nhiều nhà ngôn ngữ học định nghĩa các mô tả chuẩn về nguyên nhân dựa trên các biểu hiện hình thức về nghĩa của nguyên nhân được chỉ ra như thế nào, và dựa trên một tập nhỏ cỏc nhón miêu tả biểu thị trong các cấu trúc ngữ nghĩa.
Nhiều nghiên cứu trước đây đã thử trớch rỳt cỏc quan hệ nguyên nhân - kết quả inter-sentential không tường minh từ văn bản bằng cách dựng cỏc suy luận dựa trên tri thức. Các nghiên cứu này dựa trên lập trình bằng tay (hand-coded), các cơ sở tri thức trong một lĩnh vực cụ thể thường khó để tăng cường cho các ứng dụng thực tế.
Các nhà nghiên cứu khác [10], [17] sử dụng các mẫu ngôn ngữ để xác định các quan hệ nguyên nhân - kết quả biểu diễn tường minh trong văn bản mà không cần đến bất cứ suy luận dựa trên tri thức nào cả. Năm 1997 Garcia [10] sử dụng các văn bản tiếng Pháp để thu được các quan hệ nguyên nhân - kết quả thông qua các chỉ dẫn ngôn ngữ sắp xếp trong một mô hình ngữ nghĩa phân loại các mẫu động từ nhân quả. Garcia đã tìm ra 25 quan hệ nguyên nhân - kết quả bằng cách tiếp cận dựa trên “Force Dynamics” của Leonard Talmy. Độ chính xác trong các khẳng định của Garcia là 85%.
Khoo at al. [17] sử dụng các mẫu ngôn ngữ động từ định nghĩa trước để trích lọc thông tin nhân quả từ các văn bản bài báo về kinh doanh (1999) và y học (2001). Họ dùng một phương pháp tính toán đơn giản không cần đến các suy luận trên cơ sở tri thức hoặc phân tích cú pháp từng câu văn, phương pháp này dựa trên một tập các mẫu ngôn ngữ thường cho biết về sự có mặt của một quan hệ nguyên nhân - kết quả. Xác định các quan hệ hoàn toàn thích hợp trong văn bản với độ chính xác 68%.