i Đặt i vấn i đề
i i i i i i i i i i Trongi khoảngi bai mươii nămi gầni đây,i côngi nghệi thôngi tini đã,i đangi rấti quani tâmi nghiên i cứu i đên i lĩnh i vực i xử i lý i ngôn i ngữ i tự i nhiên i nhằm i đạt i được i mục i tiêu i làm i cho i máy i tính i có i thể i hiểu i và i trả i lời i như i con i người, i khiến i máy i tính i càng i ngày i càng i giống i người. i i i i i i i i i i Một i trong i những i hướng i nghiên i cứu i quan i trọng i trong i lĩnh i vực i xử i lý i ngôn i ngữ i tự i nhiên i là i hướng i xây i dựng i một i hệ i thống i hội i thoại i tự i động i giữa i người i và i máy i Tuy i vẫn i chưa i thể i làm i cho i máy i tính i có i thể i “giống i người” i nhưng i trong i những i năm i qua, i lĩnh i vực i này i đã i đạt i được i những i thành i công i bước i đầu i không i chỉ i với i Tiếng i Anh i mà i còn i với i cả i một i số i ngôn i ngữ i khác i nữa. i i i i i i i i i i Đểi máyi tínhi cói thểi hiểui ngôni ngữi tựi nhiên,i mộti phầni khôngi thểi thiếui đượci lài việci xửi lýi hiệni tượngi đồngi thami chiếui vài tỉnhi lượci trongi hộii thoại.i Vớii tiếngi Việt,i hiện i tượng i này i cũng i đã i bắt i đầu i được i quan i tâm i chú i ý i trong i những i năm i gần i đây, i hiện i tượng i đồng i tham i chiếu, i tỉnh i lược i đã i được i nghiên i cứu i một i cách i riêng i rẽ, i mặc i dù i vậy i một i nghiên i cứu i tổng i hợp i cả i hai i phương i diện i trên i vẫn i là i một i thiếu i sót i cần i được i bổ i sung.
i Mô i hình i tổng i quát
i i i i i i i i i i Tổng i quát i bài i toán i xử i lý i hiện i tượng i đồng i tham i chiếu i và i tỉnh i lược i trong i hội i thoại i gồm i 3 i bước i chính:
Bước i 1 i : i Quá i trình i tiền i xử i lý i câu i Quá i trình i này i tách i câu i đầu i vào i thành i các i từ i loạii tươngi ứng.
Bướci 2i :i Quái trìnhi phâni tíchi câu.i Đâyi lài quái trìnhi phứci tạpi vài quani trọngi nhấti nhằm i tìm i ra i hiện i tượng i ngôn i ngữ i xảy i ra i trong i câu i và i biện i pháp i xử i lý i phù i hợp.
Bước i 3 i : i Quá i trình i thay i thế i Đây i là i quá i trình i thay i thế i câu i đầu i vào i thành i câu i đã i được i xử i lý i thay i thế i một i từ i hoặc i một i bộ i phân i câu i để i trở i thành i câu i hoàn i chỉnh, i rõ i nghĩa.
i Các i cách i tiếp i cận i trong i phân i giải i đồng i tham i chiếu i và i hiện i tượng i tỉnh i lược i trong i hội i thoại
i Các i cách i tiếp i cận i trên i thế i giới
i i i i i i i i i i Phâni giảii đồngi thami chiếui vài hiệni tượngi tỉnhi lượci khôngi phảii lài vấni đềi mớii mẻi trong i lĩnh i vực i xử i lý i ngôn i ngữ i tự i nhiên i Chúng i đã i được i quan i tâm i nghiên i cứu i từ i rất i sớm i mà i thuật i toán i kinh i điển i đầu i tiên i đưa i vào i cài i đặt i hiệu i quả i là i thuật i toán i Hobbs i do i nhà i khoa i học i Jerry i R i Hobbs i công i bố i vào i năm i 1976 i Kể i từ i đó i đến i nay, i nhiều i cách i tiếp i cận i mới i – i có i thể i mới i chỉ i là i một i ý i tưởng i mới i hoặc i đã i được i cài i đặt i thử i nghiệm i - i đã i được i nghiên i cứu i và i công i bố i không i chỉ i với i ngôn i ngữ i nghiên i cứu i là i tiếng i Anh i mà i còn i với i nhiều i ngôn i ngữ i khác i như i tiếng i Đức, i tiếng i Pháp, i tiếng i Nhật… i i i i i i i i i i Trong i số i những i cách i giải i quyết i vấn i đề i đó, i có i thể i nhắc i đến i các i phương i pháp i như i
Centering, i Entity-Base, i Contrants i … i Độ i chính i xác i của i các i thuật i toán i này i biến i động i tùyi vàoi từngi lĩnhi vựci dữi liệu,i nhìni chungi cói thểi đạti kếti quải chínhi xáci khoảngi 70i %i đếni 80%. i i i i i i i i i i Mặc i dù i vậy, i cho i đến i nay i việc i tìm i kiếm i một i giải i pháp i hoàn i chỉnh i cho i phân i giải i đồng i tham i chiếu i và i hiện i tượng i tỉnh i lược i vẫn i là i một i bài i toán i chưa i có i lời i giải i Các i cách i tiếp i cận i tuy i nhiều i nhưng i nhìn i chung i đều i chỉ i nhằm i vào i một i phân i vùng i rất i nhỏ i của i hiện i tượng i đồng i tham i chiếu i hoặc i tỉnh i lược i – i thường i chỉ i tập i trung i vào i một i trường i hợp i nhỏ i như i là i đồng i tham i chiếu i đại i từ, i đồng i tham i chiếu i động i từ i hoặc i các i trường i hợp i tỉnh i lược i cơ i bản i ,các i kết i quả i thử i nghiệm i hầu i hết i là i trên i các i bộ i dữ i liệu i từ i hướng i lĩnh i vực i (ví i dụ i như i thuật i toán i Entity-Base i đạt i độ i chính i xác i 85 i % i với i bộ i dữ i liệu i về i thiên i tai i , i hơn i 80 i % i đối i với i bộ i dữ i liệu i về i tai i nạn i )- i i mà i không i đưa i ra i cách i xử i lý i cho i bài i toán i tổng i quát.i i i i i i i i i i i i Hiệni nay,i cáci hướngi nghiêni cứui mớii trêni thếi giớii chủi yếui hướngi vềi tậpi trungi vào i một i phân i vùng i nhỏ i của i phân i giải i đồng i tham i chiếu i hoặc i hiện i tượng i tỉnh i lược i – i thường i là i đồng i tham i chiếu i đại i từ i - i trên i môi i trường i đa i giao i diện- i môi i trường i bao i gồm i cả i tiếng i nói, i hình i ảnh i
i Những i vấn i đề i còn i tồn i tại
i i i i i i i i i i Một i điều i khẳng i định, i các i thuật i toán i được i công i bố i và i chấp i nhận i hiện i nay i chỉ i giải i quyết i một i trường i hợp i nhỏ i của i phân i giải i đồng i tham i chiếu i hoặc i tỉnh i lược. i i i i i i i i i i Như i đã i nêu i ở i trên, i mặc i dù i các i cách i giải i quyết i cho i đề i tài i này i đã i được i nghiên i cứu i từ i những i năm i 70 i của i thế i kỷ i trước i nhưng i giải i pháp i cho i bài i toán i tổng i hợp i lại i thiếu i hụt i một i cách i đáng i ngạc i nhiên i Các i thuật i toán i cài i đặt i thành i công i chủ i yếu i là i các i thuật i toán i nghiên i cứu i cho i phân i giải i đồng i tham i chiếu i đại i từ, i các i thuật i toán i cho i các i trường i hợp i kháci rấti íti vài đội chínhi xáci cũngi khôngi cao.i Điềui nàyi cũngi dễi hiểui vìi ngôni ngữi tựi nhiêni cói cấui trúci vôi cùngi phứci tạpi vài đai dạngi vài hiệni tượngi đồngi thami chiếui đạii từi cũng i là i hiện i tượng i hay i gặp i nhất i trong i thực i tế i i i i i i i i i i Vì i thế, i hướng i nghiên i cứu i của i đồ i án i này i sẽ i không i nhằm i vào i việc i xử i lý i trên i môi i trường i đa i giao i diện i như i xu i hướng i hiện i nay i mà i nhằm i vào i việc i xây i dựng i một i chương i trình i có i thể i xử i lý i được i tổng i hợp i cả i phân i giải i đồng i tham i chiếu i và i tỉnh i lược i hay i gặp i cho i những i đoạn i hội i thoại i hàng i ngày i
i Phân i giải i đồng i tham i chiếu i và i hiện i tượng i tỉnh i lược i trong i hội i thoại i tiếng i Việt
Việt i i i i i i i i i Lĩnh i vực i xử i lý i ngôn i ngữ i tự i nhiên i cho i tiếng i Việt i cũng i là i lĩnh i vực i được i quan i tâm i nghiêni cứui củai cáci nhài khoai họci Việti Nam,i trongi đó,i đượci quani tâmi nhiềui nhấti lài bàii toáni phâni tíchi cúi pháp.i Cáci giảii phápi choi phâni giảii đồngi thami chiếui đượci côngi bối rộng i rãi i còn i rất i ít i Vì i vậy, i cũng i như i các i ngôn i ngữ i khác, i giải i pháp i cho i bài i toán i tổng i thể i cho i cả i hiện i tượng i đồng i tham i chiếu i và i tỉnh i lược i lại i càng i thiếu i hụt i nghiêm i trọng, i gần i như i không i có i i i i i i i i i i Dĩ i nhiên, i việc i xử i lý i tổng i quát i một i trường i hợp i nhỏ i của i hiện i tượng i đồng i tham i chiếu i và i tỉnh i lược i đã i khó, i tích i hợp i giải i quyết i tất i cả i các i trường i hợp i đó i còn i khó i hơn i Tuy i nhiên, i i trong i thực i tế, i một i hệ i thống i hội i thoại i tự i động i giới i hạn i người i dùng i chỉ i được i sử i dụng i một i phân i dạng i nhỏ i - i như i là i chỉ i được i sử i dụng i đồng i tham i chiếu i đại i từ i - i là i hệ i thống i không i thật i sự i thuyết i phục i Ngược i lại, i việc i giới i hạn i lĩnh i vực i của i hệ i thống i là i chấpi nhậni được,i víi dụi nhưi kháchi thami quani đếni việni bảoi tàngi thìi chỉi quani tâmi đếni tấti cải cáci thôngi tini liêni quani đếni việni bảoi tàng.i Vìi thế,i đồi áni nàyi cũngi đặti rai giớii hạni lài chương i trình i i hướng i lĩnh i vực i i i i i i i i i i i Đồ i án i sẽ i nghiên i cứu i trên i đối i tượng i ngôn i ngữ i là i tiếng i Việt, i có i sử i dụng i lại i chương i trình i tách i từ i của i thầy i Lê i Hồng i Phương i
i Những i khó i khăn i chính i của i bài i toán i phân i giải i đồng i tham i chiếu i và i tỉnh i lược i trong i hội i thoại i tiếng i Việt
i Ngữ i pháp i phức i tạp
i i i i i i i i i i Mặc i dù i có i nhiều i điểm i căn i bản i giống i với i ngữ i pháp i tiếng i Anh i – i ngôn i ngữ i tự i nhiên i được i nghiên i cứu i kỹ i càng, i tỉ i mỉ i nhất i – i nhưng i do i nhiều i yếu i tố i khác i nhau i như i lịch i sử i phát i triển i lâu i dài i cùng i với i sự i tiếp i thu i của i nhiều i nền i văn i hóa, i ngữ i pháp i tiếng i Việt i i có i nhiều i điểm i khác i biệt i khiến i cho i cấu i trúc i ngữ i pháp i vô i cùng i phong i phú i Việc i xây i dựngi mộti líi thuyếti ngữi phápi hoàni chỉnhi lài điềui chưai làmi được.i Sựi phứci tạpi củai ngữi phápi tiếngi Việti làmi choi việci phâni tíchi cấui trúci câu,i phâni loạii vài nhậni diệni câui trởi nên i vô i cùng i khó i khăn… i i i i i i i i i i i Bên i cạnh i đó i ngữ i pháp i tiếng i Việt i còn i có i hiện i tượng i đồng i âm, i đồng i nghĩa, i chuyển i nghĩa i của i từ i rất i phức i tạp i Ví i dụ: i từ i “phát i triển” i trong i 2 i cụm i từ i “phát i triển i đất i nước” i và i “đất i nước i phát i triển” i là i 2 i loại i từ i khác i nhau i “Phát i triển” i trong i cụm i từ i thứ i nhất i là i động i từ i tác i động i vào i danh i từ i “đất i nước” i trong i khi i “phát i triển” i trong i cụm i từ i thứ i hai i lại i là i tính i từ i bổ i nghĩa i cho i danh i từ i đất i nước.
Nhập i nhằng i trong i việc i tách i từ i và i phân i loại i từ
i i i i i i i i i i Đặc i điểm i Tiếng i Việt i là i ngôn i ngữ i đơn i âm i tiết, i điều i này i gây i nên i khó i khăn i ngay i từ i giaii đoạni táchi vài phâni loạii từi vựng.i Víi dụi nhưi câu:
“Cụi /giài đi/i nhanh/i quá”
“Cụ i già/đi/nhanh i /quá” i i i i i i i i i i i Mặc i dù i nội i dung i trung i tâm i của i đề i tài i không i nhằm i vào i vấn i đề i này i nhưng i giai i đoạn i tách i từ i chính i là i giai i đoạn i tiền i xử i lý i của i hệ i thống, i vì i thế i sự i đúng i đắn i của i nó i có i ảnh i hưởng i rất i lớn i đến i sự i đúng i đắn i của i cả i thuật i toán.
i Sự i nhập i nhằng i , i đa i nghĩa i của i đại i từ
i i i i i i i i i i Mộti trongi nhữngi vấni đềi phứci tạpi nhấti củai tiếngi Việti lài trongi Tiếngi Việti cói rấti nhiềui đạii từi xưngi hô.i i Cặpi xưngi hôi giữai 2i ngôii thứi nhấti vài thứi haii phổi biếni nhưi :i tới - ấy, i tớ i - i cậu, i tao i mày… i i i i i i i i i i Vấn i đề i rắc i rối i nằm i ở i chỗ, i tuỳ i vào i mối i quan i hệ i giữa i người i nói i với i nhau, i hoặc i giữa i người i nói i với i người i thứ i ba i mà i các i đại i từ i xưng i hô i này i khác i nhau i Ví i dụ:
Mẹ i và i con i nói i chuyện i với i nhau i :
“Mẹ i bao i giờ i đi i làm i ?”
Haii chịi emi nớii chuyệni vớii nhaui :
“Mẹ i đã i đi i làm i chưa i nhỉ?”
“Hình i như i đi i rồi” i i i i i i “Mẹ” i trong i hai i ví i dụ i trên i rõ i ràng i là i mang i ý i nghĩa i ngữ i pháp i khác i nhau i Để i xử i lý i vấn i đềi nàyi yêui cầui cói kiếni thứci xãi hộii sâui sắc,i điềui nàyi rấti khói thựci hiệni khii xâyi dựngi cáci thuậti toán.i Cáchi tiếpi cậni khải thii nhấti đói lài hướngi vàoi việci xâyi dựngi cáci hệi thốngi cụ i thể i hướng i lĩnh i vực i Ở i đây, i bằng i mặc i định, i đồ i án i nghiên i cứu i cho i hệ i thống i hội i thoại, i do i đó i ưu i tiên i xét i quan i hệ i xưng i hô i ngôi i thứ i nhất i và i ngôi i thứ i hai i giữa i người i và i máy i
i Mục i tiêu, i giới i hạn i và i hướng i tiếp i cận i của i đồ i án
i i i i i i i i i i Mục i tiêu i của i đồ i án i là i đưa i ra i được i phương i pháp i xử i lý i không i phải i chỉ i riêng i cho i từng i trường i hợp i đồng i tham i chiếu i hay i tỉnh i lược i riêng i lẻ i mà i là i đưa i ra i phương i pháp i giải i quyết i tổng i hợp i chung, i ít i nhất i là i cho i các i trường i hợp i hội i thoại i thông i dụng i nhất. i i i i i i i i i Do i sự i phức i tạp i của i ngữ i pháp i tiếng i Việt i – i ta i sẽ i đi i sâu i vào i phần i này i hơn i ở i phần i saui củai bảni báoi cáoi nàyi –i việci đưai rai thuậti toáni cói thểi giảii quyếti đúngi đắni choi tấti cải cáci trườngi hợpi vớii tỉi lệi chínhi xáci 100%i lài khôngi thể,i hơni nữai mụci tiêui củai đồi áni tậpi trung i vào i phần i hội i thoại i Không i có i một i thuật i toán i đơn i lẻ i nào i có i thể i xử i lý i đúng i đắn i toàn i bộ i các i hiện i tượng i ngữ i pháp i Vì i thế i để i nâng i cao i tỉ i lệ i chính i xác i cho i thuật i toán, i đồ i án i sẽ i sử i dụng i phương i pháp i tiếp i cận i là i chia i để i trị i với i hai i ý i tưởng i của i thuật i toán i Centering i và i Gapping, i tập i trung i vào i các i câu i thông i thường i trong i hội i thoại.
PHẦN i II i GIẢI i QUYẾT i VẤN i ĐỀ
CHƯƠNG i 2 i PHÂN i LOẠI i HIỆN i TƯỢNG i ĐỒNG i THAM i CHIẾU i VÀ i TỈNH i
i Hiện i tượng i đồng i tham i chiếu i – i Anaphora
Định i nghĩa
i i i i i i i i i i Hiệni tượngi đồngi thami chiếui lài hiệni tượngi sửi dụngi mộti từi đểi thayi thếi choi mộti từ,i mộti cụmi từ,i mộti phầni câui đãi đượci nhắci đếni trướci đó. i i i i i i i i i i i Xéti mộti víi dụi đơni giảni củai anaphora:
Họa i sĩ i Tô i Ngọc i Vân i sống i ở i đâu?
Ông i ấy i hiện i tại i đang i ở i thành i phố i Hồ i Chí i Minh i i i i i i i i i i i i Trong i ví i dụ i trên, i “Ông i ấy” i i chính i là i đại i từ i thay i thế i cho i “họa i sĩ i Tô i Ngọc i Vân” i
Vấn i đề i đặt i ra i là i làm i sao i để i hệ i thống i nhận i diện i được i “Ông i ấy” i chính i là i từ i thay i thế i cho i
“họai sĩi Tôi ngọci Vân”. i i i i i i i i i i Víi dụi trêni chỉi lài mộti trườngi hợpi thườngi thấyi củai mộti dạngi đồngi thami chiếui mài tai gặpi hàngi ngàyi trongi cuộci sống.i Xửi i lýi đồngi thami chiếui lài mộti vấni đềi cựci kỳi khói khăn, i nó i yêu i cầu i trang i bị i cho i máy i sự i hiểu i biết i về i cấu i trúc i ngữ i pháp, i cấu i trúc i ngữ i nghĩa i của i ngôn i ngữ i tự i nhiên, i thậm i chí i trong i những i trường i hợp i phức i tạp i nó i đòi i hỏi i cả i hiểu i biết i “thực” i trong i đời i sống i Mặc i dù i vấn i đề i này i được i nhận i diện i từ i khá i sớm i nhưng i một i giải i pháp i xử i lý i đồng i tham i chiếu i hoàn i chỉnh i vẫn i chưa i có i lời i giải i cuối i cùng i Các i giải i pháp i được i nghiên i cứu i trong i những i năm i 70, i 80 i của i thế i kỷ i trước i (điển i hình i là i Hobbs i 1976) i chỉ i tập i trung i vào i ngữ i pháp i của i câu i và i chỉ i giải i quyết i được i những i trường i hợp i không i có i sự i mập i mờ i về i ngữ i nghĩa i i i i i i Xéti trườngi hợpi saui :
Johni lấyi cáii bánhi ởi trêni bàni vài ăni nó.
John i lấy i cái i bánh i ở i trên i bàn i và i rửa i nó i i i i i i i Có i thể i thấy i ngay i rằng i mặc i dù i có i cùng i một i cấu i trúc i ngữ i pháp i nhưng i nếu i i “nó” i trong i câu i thứ i nhất i chỉ i đến i “cái i bánh” i thì i “nó” i trong i câu i thứ i hai i lại i chỉ i đến i “bàn”, i ta i có i thể i dễ i dàng i đặt i ra i ràng i buộc i cho i động i từ i “ăn” i là i sự i vật i đi i đằng i sau i phải i là i “ăn i được” i nhưng i ta i không i thể i đặt i ra i luật i là i đằng i sau i “rửa” i phải i là i vật i không i ăn i được i bởi i như i rau i quải hoàni toàni vừai “ăni được”i vừai “rửai được”. i i i i i i i i i Cáci nghiêni cứui nhữngi nămi gầni đâyi chủi yếui đii theoi hướngi kếti hợpi giữai phâni tíchi cú i pháp i và i các i thuật i toán i về i ngữ i nghĩa i cùng i i nhiều i cách i tiếp i cận i khác i nhau i tuỳ i từng i loại i đồng i tham i chiếu.
i Phân i loại
i i i i Về i mặt i hình i thức, i đồng i tham i chiếu i tồn i tại i dưới i hai i dạng: i
Từ i được i thay i thế i và i từ i thay i thế i nằm i cùng i trong i một i câu i (intra-sententially)
Từ i được i thay i thế i và i từ i thay i thế i nằm i trong i nhiều i câu i (inter- i sententially i )
Cáci dạngi đồngi thami chiếui thườngi gặpi trongi Tiếngi Việti cói :
“one”i anaphora a i NP i anaphora i i i i i i i i i i i NP i – i anaphora i là i từ i dùng i để i chỉ i trường i hợp i một i từ i thay i thế i cho i một i danh i từ i hoặc i cụm i danh i từ i đã i nêu i trước i nó. i i i i i i i i i i i Các i đại i từ i thay i thế, i bao i gồm i tất i cả i các i dạng i như i anh i ta i (he, i his, i him), i cô i ta i (she, i her, i hers), i chúng i nó i (they, i them)… i là i dạng i phổ i biến i nhất i của i NP i anaphora i
Dạng i này i có i thể i xảy i ra i ở i cả i hai i hình i thức i ở i hai i câu i kahcs i nhau( i intra-) i và i trong i cùng i một i câu i (inter-sententially) i Ví i dụ:
John i cho i Mary i mượn i quyển i sách i - i quyển i sách i cô i ấy i đã i đánh i mất i i (intra-)
Johni choi Maryi mượni quyểni sách.i Côi ấyi đánhi mấti nói trêni đườngi vềi nhài
(inter-) i i i i i i i i i i Sự i thay i thế i không i nhất i thiết i phải i là i trực i tiếp i mà i có i thể i xảy i ra i gián i tiếp i như:
Tất i cả i các i ngôi i nhà i i trên i phố i cần i sửa i lại i mái(ở i đây i “mái” i có i sự i liên i quan i ngầm i với i “tất i cả i các i ngôi i nhà”).
Ross i sử i dụng i thẻ i tín i dụng i nhiều i đến i nỗi i anh i chàng i tội i nghiệp i đó i phải i tuyên i bố i phá i sản. b i VP-anaphora i i và i S-anaphora i i i i i i i i i i Đồngi thami chiếui khôngi phảii luôni luôni chỉi thayi thếi choi choi mộti cụmi danhi từi mài nhiềui lúci nói lạii cói vaii tròi thayi thếi choi hẳni mộti cụmi độngi từi hoặci thậmi chíi lài thayi thếi cho i cả i một i câu. i i i i i i i i i i VP- i anaphora i là i trường i hợp i từ i không i thay i thế i cho i một i từ i hoặc i cụm i danh i từ i phía i trước i mà i thay i thế i cho i một i cụm i động i từ i đã i nói i đến i ở i phía i trước i Xét i ví i dụ i sau:
Tuần i tới i Lan i thi i học i kỳ i à i ?
Trongi víi dụi trêni i “thế”i lài từi thayi thếi choi cụmi độngi từi “thii họci kỳ”. i i i i i i i i i i i Tươngi tự,i S-anaphorai lài trườngi hợpi mài mộti từi thayi thếi choi hẳni mộti câui đãi nêui ở i phía i trước i S i – i anaphora i được i minh i họa i thông i qua i ví i dụ i sau:
Mary i đã i mở i được i một i phòng i triển i lãm i tranh i i Đó i là i một i điều i ngạc i nhiên. i c i “One” i anaphora. i i i i i i i i i Một i dạng i đồng i tham i chiếu i nữa i không i thể i không i kể i trong i đến i là i đồng i tham i chiếu i số i từ i “one”- i anaphora i Đây i là i dạng i đồng i tham i chiếu i mà i ở i đó, i số i từ i được i thay i thế i cho i một i danh i từ i (thường i là i một i vật) i đứng i trước i nó. i i i i i i i i i Xéti víi dụi mộti câui hộii thoạii sau:
Cải haii bứci tranhi nàyi lài củai cậui à?
Không, i chỉ i một i bức i thôi i
i Hiện i tượng i tỉnh i lược i - i Elliptics
i Định i nghĩa
i i i i i i i i i Hiệni tượngi tỉnhi lượci lài hiệni tượngi lượci bỏi mộti hayi nhiềui từi trongi cấui trúci ngữi phápi khii nghĩai củai câui đói cói thểi hiểui đượci mài khôngi cầni đếni nhữngi phầni đãi đượci lược i bỏ i đó. i i i i i i i i i Cũng i như i hiện i tượng i đồng i tham i chiếu, i hiện i tượng i tỉnh i lược i cũng i là i hiện i tượng i phổ i biến i trong i ngôn i ngữ i tự i nhiên i Về i mặt i ngôn i ngữ, i ta i nhận i diện i một i câu i tỉnh i lược i mà i một i phần i nghĩa i câu i cần i được i tổ i chức i lại i dựa i vào i ngữ i cảnh i của i câu i nói i Ngữ i cảnh i đó i thường i là i một i tiền i ngữ i (antecedent), i một i mệnh i đề i ở i trong i câu i nói i trước i tương i ứng i với i phần i đã i bị i lược i bỏ i trong i câu i tỉnh i lược.
Phân i loại
i i i i i VP i - i anaphora i i có i thể i coi i là i một i dạng i đặc i biệt i của i câu i tỉnh i lược.Trong i hội i thoại, i hai i loạii câui tỉnhi lượci thườngi gặpi nhấti là:
Contextuali ellipsisi :i phầni lượci bỏi củai câui cói thểi đượci khôii phụci lạii dựai vàoi ngay i câu i phía i trước, i thường i phần i lược i bỏ i đó i là i sự i lặp i lại i của i một i từ i hoặc i một i cụm i từ i đứng i trước.
Pragmatic i ellipsis i : i phần i lược i bỏ i của i câu i được i khôi i phục i nhờ i người i nghe i dựa i trên i tình i huống i ngoài i lĩnh i vực i ngôn i ngữ i Ví i dụ: i Cả i hai i hành i khách i nhìn i thấy i một i người i đàn i ông i lạ i mặt i “Say” i – i Một i người i nói i Câu i đầy i đủ i phải i là i “ông i ta i say i rồi” i i i i i i i i i i i Vìi hệi thốngi tai xâyi dựngi lài hệi thốngi hộii thoạii giữai ngườii vài máyi nêni chúngi tai sẽi chỉi tậpi trungi vàoi contextuali ellipsis. i i i i i i i i i Việci phâni loạii giữai hiệni tượngi tỉnhi lượci vài hiệni tượngi đồngi thami chiếui chỉi mangi ý i nghĩa i tượng i trưng, i bởi i thực i tế i các i VP i anaphora i , i S i anaphora i và i “one i anaphora” i có i thể i coi i là i một i trường i hợp i của i tỉnh i lược i câu.
CHƯƠNG i 3 i i SƠ i LƯỢC i CẤU i TRÚC i TIẾNG i VIỆT
i Danh i từ i và i cụm i danh i từ
Danh i từ i riêng i là i những i danh i từ i chỉ i tên i riêng i hay i tên i địa i điểm.
Danhi từi riêngi cói cấui tạoi nhưi sau:
Chỉi cói mộti từi têni riêng:i Thúyi Anh,i Việti
Gồm i từ i chỉ i họ i và i từ i tên i riêng: i Bùi i Thúy i Anh, i Nguyễn i Việt
Tên i địa i danh i theo i khu i vực i hành i chính, i hoặc i địa i lý: i Hà i Nội, i Huế
Têni núi,i têni sông,i têni đất :i (sông)i Hồng,i (trường)i Đạii Họci Báchi Khoai Hài
Danh i từ i là i từ i loại i bao i gồm i những i từ i có i ý i nghĩa i khái i quát i sự i vật i Đó i là i những i thực i từ i chỉ i vật i thể-người, i động i vật, i thực i vật, i đồ i vật, i những i hiện i tượng i tự i nhiên, i hiện i tượng i xã i hội i và i những i khái i niệm i trừu i tượng i được i con i người i nhận i thức i và i phản i ánh i như i các i vật i thể i tồn i tại i trong i hiện i thực.
Danhi từi chỉi vậti thể:i ông,i bà,i thầyi giáo,i côngi nhân,i gà,i cam,i đèn,i áo
Danh i từ i chỉ i hiện i tượng i tự i nhiên: i mưa, i bão, i sét, i ngày, i đêm
Danh i từ i chỉ i hiện i tượng i xã i hội: i làng, i xã, i đội, i đoàn
Danh i từ i chỉ i khái i niệm i trừu i tượng: i chính i trị, i đường i lối, i đạo i đức
Danh i từ i đơn i thể i :gồm i các i danh i từ i chỉ i sự i vật i rời i rạc: i quần, i áo, i bạn i Những i danh i từ i này i phải i kết i hợp i với i danh i từ i danh i từ i đơn i vị: i chiếc i quần, i manh i áo, i ông i bạn
Danhi từi tổngi thểi :i gồmi cáci danhi từi cói cấui tạoi ghépi 2i tiếng:i quầni áo,i binhi lính,i bạn i bè, i máy i móc i Danh i từ i tổng i thể i không i kết i hợp i với i danh i từ i đơn i vị i đơn i thể i mà i kết i hợp i với i danh i từ i đơn i vị i hợp i thể: i bộ i quần i áo, i nhóm i binh i lính, i lũ i bạn i bè
Danh i từ i trừu i tượng i : i gồm i các i danh i từ i thể i hiện i về i tư i tưởng, i thái i độ, i quan i điểm, i lập i trường, i ý i nghĩ, i trí i tuệ
Danh i từ i đơn i vị i đo i lường i : i gồm i các i danh i từ i làm i phụ i tố i cho i các i danh i từ i chất i liệu,i vậti liệu,i đơni vịi thờii gian,i đơni vịi tổi chức:i líti rượu,i nắmi muối,i mẫui đất,i phúti suyi nghĩa,i tổi côngi nhân
… c i Cụm i danh i từ. i i i i i i i i i Cụm i danh i từ i là i cụm i từ i có i danh i từ i làm i thành i tố i trung i tâm i Cụm i danh i từ i biểu i thị i sự i vật i nêu i ở i thành i tố i trung i tâm i với i những i đặc i điểm i cụ i thể, i riêng i biệt i Trong i câu, i cụm i danh i từ i có i thể i giữ i các i chức i năng i ngữ i pháp i của i danh i từ: i làm i chủ i ngữ, i làm i vị i ngữ Cấu i trúc i cơ i bản:
Phần i phụ i trước Danhi từ Phần i phụ i sau
Phần i phụ i trước: i i i i i i i i i Phầni nàyi cói tốii đai bai thànhi phần:i i i i i i i i i i Víi dụ:i tấti cải nhữngi chiếci kẹo i i i i i i i i i Ở i vị i trí i 3 i là i số i từ i mang i nghĩa i tổng i thể i như i tất i cả, i hết i thảy i tiếp i theo i là i số i từ i và i loại i từ.
Có i cấu i tạo i phức i tạp i hơn i phần i phụ i trước i nhiều i Nó i có i thể i là i danh i từ, i cụm i tính i từ, i cụm i động i từ, i cụm i giới i từ
Cụmi danhi từi đơni giảni (phầni phụi saui khôngi phảii lài cụmi giớii từ,i cụmi độngi từi hay i mệnh i đề i phụ).
Ví i dụ: i cái i hộp i màu i tím.
Cụm i danh i từ i phức i tạp i với i phần i phụ i sau i là i cụm i giới i từ: i
Ví i dụ: i i bức i ảnh i của i cơ i quan
Cụm i danh i từ i phức i tạp i với i phần i phụ i sau i là i mệnh i đề i phụ
Víi dụ:i bứci ảnhi mài tôii mớii muai hômi qua.
Mộti cụmi danhi từi cói thểi thiếui phầni phụi trướci hayi phầni phụi saui nhưngi khôngi thể i thiếu i phần i trung i tâm.
i Động i từ i và i cụm i động i từ
Kí i hiệu i là i V. Động i từ i là i những i từ i có i ý i nghĩa i khái i quát i chỉ i hành i động, i trạng i thái i hoặc i chỉ i tình i thái i hay i quan i hệ, i nói i chung i là i những i dạng i thức i vận i động, i biến i chuyển i của i sự i vật i về i mặt i lí, i tâm i lí i hay i sinh i lí
Ví i dụ: i đi, i gặt, i học, i nói, i lao i động, i suy i nghĩ
Độngi từi ngoạii độngi (Vt):i gồmi cáci độngi từi chỉi hànhi độngi cói đốii tượng:i ăni bánh, i viết i thư, i là i quần i áo, i xây i dựng i nhà
Động i từ i nội i động i (Vi): i gồm i các i động i từ i chỉ i hành i động i nhưng i không i có i đối i tượng: i ngủ, i ăn, i nói, i làm i việc
Động i từ i tồn i tại i (Ve): i gồm i các i động i từ i chỉ i trạng i thái i tồn i tại i của i thực i thể/tính i chất i Cần i có i phụ i tố i để i chỉ i sự i tồn i tại: i có/còn/hết/mất tiền/máy/ngon
Động i từ i biến i hóa i (Vf): i i gồm i các i động i từ i chỉ i sự i biến i hóa i của i thực i thể/tính i chất i Cần i có i phụ i tố i đi i kèm i chỉ i kết i quá i biến i hóa: i người i hóa i (thành) i ma, i nên/thành i người,i trởi thànhi tốt
Độngi từi tiếpi thụi (Va):i gồmi cáci độngi từi chỉi trạngi tháii tiếpi thụ.i Cầni cói phụi tốti đi i kèm: i bị/phải/được/chịu i mắng/khen/làm
Động i từ i tình i thái i (Vv): i gồm i các i động i từ i chỉ i trạng i thái i ý i chí i Cần i có i phụ i tố i đi i kèm: i muốn/dám/quyết/toan nói/làm/nghỉ i ngơi
Động i từ i so i sánh i (Vc): i gồm i các i động i từ i dùng i để i so i sánh/đánh i giá i giữa i các i sự i vật i Cần i có i phụ i tốt i đi i kèm: i bằng/kém/hơn bạn/người
Độngi từi tổngi hợpi (Vg):i gồmi cáci độngi từi còni lạii ngoạii trừi độngi từi “là”:i muai bán,i đánhi đập i i i i i i i i i i Các i động i từ, i tùy i thuộc i vào i từng i nhóm i có i những i ràng i buộc i vào i chủ i ngữ, i bổ i ngữ… i khác i nhau i mà i khi i xử i lý i các i hiện i tượng i đồng i tham i chiếu i và i tỉnh i lược i đặc i thù i không i thể i không i xem i xét i đến i Chúng i ta i sẽ i làm i rõ i vấn i đề i này i ở i phần i sau i của i đồ i án. b i Động i từ i “là”. i i i i i i i i i i Đây i là i động i từ i có i vai i trò i và i đặc i thù i riêng i biệt i trong i ngữ i pháp i tiếng i Việt, i cần i phân i tích i xử i lý i khác i biệt i so i với i các i động i từ i khác, i nó i tương i đương i động i từ i “to i be” i trong i tiếng i Anh. c i Cụm i động i từ.
Cụmi độngi từi lài cụmi từi cói độngi từi làmi thànhi tối trungi tâm.i Cụmi độngi từi biểui thịi ýi nghĩa,i hànhi động,i trạngi thái,i tínhi thái i nêui ởi độngi từi trungi tâm.i Chứci năngi cúi pháp i của i cụm i động i từ i trong i câu i là i chức i năng i cú i pháp i của i động i từ i chính.
Ví i dụ: i bay i ngang i qua i bầu i trời, i đang i ăn i cơm
Phần i phụ i trước Động i từ Phần i phụ i sau
Là i các i phó i từ i Ký i hiệu i là i R i Ví i dụ: i hãy i nhìn i vào, i đừng i nhảy, i đang i ăn i cơm đangi ăni cơm (VPi (Ri đang) i (V i ăn) i (N i cơm))
Phần i phụ i sau: i Động i từ i trung i tâm i có i thể i kết i hợp i với i các i từ i loại i khác i một i cách i đa i dạng i Mỗi i cách i kết i hợp i có i thể i coi i như i một i mẫu i cú i pháp i của i động i từ: i động i từ i đi i với i danh i từ, i động i từ i đi i với i cụm i giới i từ
Phần i phụ i sau i là i cụm i danh i từ ăni cơm (VP i (V i ăn) i (NP i cơm))
Phần i phụ i sau i là i cụm i giới i từ Đưa i cho i tôi (VP i (V i đưa) i (PP i cho i tôi))
Phầni phụi saui lài haii cụmi danhi từ tặng i bạn i món i quà i sinh i nhật (VP i (V i tặng) i (NP i bạn) i (NP i món i quà i sinh i nhật))
Phần i phụ i sau i là i cụm i động i từ cầni viếti thư (VPi (Vi cần) i (VP i viết i thư))
Phần i phụ i sau i là i cụm i danh i từ i và i cụm i động i từ nhờ i bạn i chép i bàn (VP i (V i nhờ) i (NP i bạn) i (VP i chép i bài))
Phầni phụi saui lài mệnhi đềi phụ nghĩ i rằng i cô i ấy i ốm (VP i (V i nói) i (SBAR i rằng i cô i ấy i ốm)).
i Các i loại i từ i khác
a i Đại i từ i và i sự i nhập i nhằng i của i đại i từ i trong i tiếng i Việt.
Kí i hiệu i là i P. Đại i từ i là i những i từ i dùng i để i xưng i hô, i thay i thế i và i chỉ i trỏ i Đại i từ i không i phải i là i từ i loạii dùngi đểi biểui thịi kháii niệmi sựi vật,i hiệni tượngi hayi hànhi động,i trạngi thái,i tínhi chấti mài lài từi loạii dùngi thayi thếi vài đểi chỉi trỏi nhữngi từi đãi đượci nêui trongi nhữngi từi ngữi đói hoặci đãi đượci xáci địnhi trongi hoàni cảnhi nói,i viếti cụi thể.
Ví i dụ: i i tôi, i tao, i nó, i đây, i kia
Đại i từ i xưng i hô i (Pp): i gồm i các i đại i từ i thay i thế i cho i danh i từ i chỉ i người i trong i xưng i hô i Đại i từ i xưng i hô i cũng i phân i biệt i theo i ngôi i và i theo i số i giống i như i các i tiếng i khác i nhưng i không i có i sự i biến i hình i từ i giống i như i các i ngôn i ngữ i Anh, i Pháp i
Ngoài i ra i nó i còn i có i đặc i điểm i riêng i đó i là i phụ i thuộc i vào i sắc i thái i biểu i cảm i trong i quan i hệ i giữa i người i nói i và i người i nghe.
Đạii từi chỉi địnhi (Pd):i gồmi cáci đạii từi dùngi đểi thayi thếi vài chỉi trỏi đốii tượngi khôngi gian,i thờii gian:i đây,i đó,i kia,i ấy,i nay,i bấyi giờ
Đại i từ i số i lượng i (Pn): i gồm i các i đại i từ i chỉ i số i lượng: i bấy, i bấy i nhiêu, i tất i cả
Đại i từ i nghi i vấn i (Pi): i gồm i các i đại i từ i để i hỏi i về i người/vật/không i gian/thời i gian/số i lượng/hoạt i động/tính i chất: i ai/gì/đâu/bao i giờ/ i bao i nhiêu, i mấy/sao/ i thế i nào
Đại i từ i hoạt i động, i tính i chất i (Pl): i gồm i các i đại i từ i chỉ i hoạt i động, i tính i chất: i thế, i vậy,i sao i i i i i i i i i i Cũngi nhưi danhi từi vài độngi từ,i đạii từi cói vaii tròi rấti quani trọngi trongi cấui trúci ngữi pháp i của i những i câu i tỉnh i lược i và i tham i chiếu i Trong i các i loại i đại i từ, i quan i trọng i nhất i đó i là i đại i từ i xưng i hô i ( i đại i từ i nhân i xưng), i nhưng i đây i cũng i lại i là i loại i đại i từ i phức i tạp i và i dễ i nhập i nhằng i nhất i trong i tiếng i Việt. i i i i i i i i i i Khác i với i các i ngôn i ngữ i khác i như i tiếng i Anh, i tiếng i Pháp…do i đặc i điểm i ngôi i nhân i xưng i phức i tạp i của i Tiếng i Việt i mà i các i đại i từ i cũng i phong i phú i và i phức i tạp i hơn i nhiều i
Ngôi i thứ i nhất i : i tôi, i tớ, i mình, i tao…
Ngôii thứi haii i i :i cậu,i ấy,i mày,i chúi mày…
Ngôi i thứ i ba i i i i i : i cô i ấy, i anh i ấy, i cô i ta, i anh i ta, i họ…
Và i một i loạt i các i đại i từ i chỉ i quan i hệ i trong i gia i đình i như i cậu, i mợ… i i i i i i i i i i Nhưng i vấn i đề i không i chỉ i dừng i lại i ở i đó, i vấn i đề i còn i nằm i ở i sự i đồng i âm i giữa i các i đại i từ i như i cô( i she) i và i cô(aunt), i chú/ i chú i mày i (uncle) i và i (you)…Đòi i hỏi i phải i đưa i ra i các i luật i rằng i buộc i đặc i biệt i tuỳ i tình i huống i và i ứng i dụng i để i xử i lý i nếu i cần i thiết. i i i i i i i i i i Đạii từi “nó”i trongi Tiếngi Việti cói vaii tròi khái đặci biệti bởii nói cói khải năngi thayi thếi choi ngôii thứi bai củai cải ngườii vài vật,i cải sinhi vậti sốngi vài bấti độngi vật.i i i i i i Ví i dụ: i
Con i mèo i nhà i Tý i lúc i nào i cũng i thấy i nằm i ngủ i ở i sân, i bọn i trẻ i quậy i thế i mà i nó i cũng i chẳng i động i đậy i tý i nào.
Không i biết i có i chuyện i gì i xảy i ra i với i Lan i mà i bạn i bè i nói i thế i nào i mặt i nó i cứ i buồn i rười i rượi. i i i i i i i i i Nhìni chung,i việci đặti hạni chếi củai đạii từi nàyi phảii tuỳi thuộci vàoi văni cảnhi b.i Phói từ.
Phó i từ i là i những i hư i từ i chuyên i dùng i để i bổ i sung i các i ý i nghĩa i ngữ i pháp i cho i động i từ, i tính i từ i Đó i là i các i ý i nghĩa i thời-thể, i các i ý i nghĩa i về i quan i hệ i giữa i hành i động, i trạng i thái, i tính i chất i với i thực i tại i và i các i ý i nghĩa i về i cách i thức i nhận i thức i và i phản i ánh i những i quan i hệ i đó i Chức i năng i ngữ i pháp i của i phó i từ i là i làm i thành i phần i phụ i và i dấu i hiệu i ngữ i pháp i cho i các i thành i phần i câu.
Ví i dụ: i đã, i từng, i mới, i ắt, i không, i chẳng, i chưa
Phói từi chỉi hướngi (Vd):i baoi gồmi cáci phói từi chỉi hoạti độngi cói baoi hàmi phươngi hướng: i khách i đi i vào i (nhà), i máy i bay i hạ i cánh i xuống i (sân i bay), i chạy i vào, i sản i xuất i ra
Phó i từ i thời i gian i (Rt): i bao i gồm i các i phó i từ i chỉ i quan i hệ i về i thời i gian i của i hành i động, i trạng i thái, i tính i chất i được i xác i định i theo i một i điểm i mốc i tương i ứng i với i thời i điểm i thực i tại i hoặc i thời i điểm i phản i ánh, i miêu i tả: i đã, i đang, i sẽ, i từng, i mới, i liền
Phó i từ i mức i độ i (Rd): i bao i gồm i các i phó i từ i chỉ i mức i độ i cho i các i tính i từ i chỉ i tính i chấti hayi độngi từi ngoạii động:i rấti xinh/rấti yêui (tôi),i hơii mệt,i quái đẹp,i xinhi lắm
Phó i từ i so i sánh i (Rc): i bao i gồm i các i phó i từ i để i so i sánh i hoạt i động/trạng i thái/tính i chất i của i các i thực i thể: i cũng, i đều, i không i ngừng
Phó i từ i khẳng i định i (RfY): i bao i gồm i các i phó i từ i chỉ i ý i khẳng i định: i ắt, i có
Phó i từ i phủ i định i (RfN): i bao i gồm i các i phó i từ i chỉ i ý i phủ i định: i không, i chưa, i chẳng
Phói từi mệnhi lệnhi (Ri):i baoi gồmi cáci phói từi chỉi ýi cầui khiến:i hãy,i đừng,i chới,i đi,i thôi,nào
Phó i từ i kết i quả i (D): i bao i gồm i các i phó i từ i chỉ i hoạt i động, i bao i gồm i nghĩa i kết i quả: i (nghĩ) i ra, i (tìm) i được, i (rơi) i mất c.i Cáci dạngi từi còni lại. i i i i i i i i Ngoàii cáci dạngi từi đãi nêui ởi trên,i tiếngi Việti còni cói nhiềui dạngi từi kháci nhưi cụmi tính i từ, i số i từ, i trợ i từ, i cảm i từ, i số i từ… i Do i chúng i đóng i vai i trò i không i quan i trọng i lắm i trong i việc i xử i lý i hiện i tượng i đồng i tham i chiếu i nên i tôi i sẽ i lược i qua i phần i này.
i Các i dạng i câu
i i i i i i i i i i Trong i các i tài i liệu i nghiên i cứu, i các i sách i giáo i khoa i về i ngôn i ngữ i và i tiếng i Việt, i đã i có i rất i nhiều i định i nghĩa i về i câu i Có i thể i rút i ra i một i số i i điểm i chung i sau:
Câu i là i một i sản i phẩm i của i hoạt i động i giao i tiếp i bằng i ngôn i ngữ i Về i phương i diện i ngữi pháp,i câui lài lõii củai pháti ngôn,i lài đơni vịi nhỏi nhấti củai cấui tạoi văni bản.
Câui đượci cấui tạoi theoi quyi tắci cúi pháp.i Cấui tạoi cúi phápi củai câui ứngi vớii mộti ngữi điệui thểi hiệni khii pháti ngôni hayi kếti thúci câu,i vài lài cơi sởi xáci địnhi kiểui loạii câu.
Những i đặc i điểm i của i câu i thể i hiện i ở i mặt i nội i dung i ý i nghĩa, i mặt i hình i thức i cấu i tạo, i mặt i chức i năng i và i mục i đích i sử i dụng i câu i trong i giao i tiếp i (trong i văn i bản). Dưới i đây i là i cách i phân i loại i câu i đơn i giản i và i dễ i hiểu i nhất a i i Câu i trần i thuật
Câu i trần i thuật i là i kiểu i câu i dùng i để i miêu i tả, i nhận i định i về i một i sự i kiện, i một i hiện i tượng.
Xe i chúng i tôi i leo i chênh i vênh i trên i dốc i cao i của i con i đường i xuyên i tỉnh i Hoàng i Liên i Sơn i Những i đám i mây i trắng i nhỏ i sà i xuống i cửa i kính i ô i tô i tạo i nên i cảm i giác i bồng i bềnh, i huyền i ảo i Chúng i tôi i đang i đi i trên i những i thác i trắng i xóa i tựa i mây i trời, i những i rừng i cây i âm i âm, i những i bông i hoa i chuối i rực i lên i như i ánh i lửa (Ngữ i pháp i tiếng i Việt- Diệp i Quang i Ban)
Tất i cả i các i kiểu i câu i tiếng i Việt i (câu i đơn, i câu i ghép) i đều i có i thể i dùng i câu i trần i thuật i Theo i quan i điểm i coi i cấu i trúc i chủ-vị i là i cấu i trúc i cơ i bản i của i câu i tiếng i Việt, i cấu i trúc i một i câu i trần i thuật i gồm i có i chủ i ngữ i và i vị i ngữ i Chủ i ngữ i thường i là i cụm i danh i từ, i vị i ngữ i là i cụm i động i từ i hoặc i cụm i tính i từ i Xét i trong i các i kiểu i câu i thì i kiểu i câu i trần i thuật i tương i đối i thuần i nhất i so i với i các i kiểu i câu i khác.
Mộti sối trườngi hợpi đặci biệt:
Chủi ngữi lài cụmi độngi từ:i Dậyi đúngi giời rấti khó.
Vị i ngữ i là i cụm i danh i từ: i Em i bé i 7 i tuổi.
Động i từ i có i đứng i đầu: i Có i con i chuột i trong i góc i nhà. b i Câu i nghi i vấn
Lài kiểui câui nêui nộii dungi hoàii nghii đểi đượci giảii đápi nộii dungi đói bằngi mộti câui trải lời.i Víi dụ:i Emi họci lớpi mấy?i Aii vẽi tranhi này?
Câui hỏii đượci chiai thànhi haii loạii lớn:
• Hỏi i có i dự i kiến i chọn i lựa i để i trả i lời i Trong i loại i này i còn i có i thể i chia i thành i mấy i kiểu i nhỏ:
Chọn i lựa i xác i định i mang i tính i chất i khẳng i định i hay i phủ i định
Chọn i lựa i không i xác i định, i tức i là i chọn i từ i hàng i loạt i khả i năng i khác i nhau i i i i i i i i i i Thựci chấti việci phâni chiai nàyi lài dựai vàoi “cáii khôngi rõ”i nằmi ởi thànhi phầni nàoi củai câui hỏii tươngi ứngi vớii câui trải lời.i Câui nghii vấni trongi tiếngi Việti đượci cấui tạoi nhời các i phương i tiện i sau i đây i : i
Các i đại i từ i nghi i vấn: i ai, i gì, i nào, i thế i nào, i sao, i bao i nhiêu, i mấy, i bao i giờ, i bao i lâu, i đâu… i Câu i nghi i vấn i dùng i đại i từ i nghi i vấn i được i dùng i để i hỏi i vào i những i điểm i xác i định i trong i câu i điểm i hỏi i là i điểm i chứa i đại i từ i nghi i vấn i Do i đó i ngay i cả i khi i câu i bị i tách i khỏi i tình i huống i nói i và i ngữ i cảnh i cũng i có i thể i nhận i biết i được i điểm i hỏi i Có i thể i gọi i đây i là i câu i nghi i vấn i rõ i trọng i điểm.
Cái i này i là i cái i gì?
i i i i i = i i < i động i từ i “là”> i i ?
i i i i i =i i i
i i i i i = i i i ?
Kết i từ i “ i hay”: i Câu i nghi i vấn i có i kết i từ i hay i dùng i để i hỏi i có i hạn i chế i trong i khả i năng i trả i lời i một i trong i những i đề i nghị i được i đưa i ra i Vì i vậy i kiểu i câu i nghi i vấn i này i còn i được i gọi i là i câu i nghi i vấn i lựa i chọn i
i =i i hayi i ?
Các i phụ i từ i nghi i vấn: i i i i i i i i i i i Một i số i cấu i trúc i thường i gặp: i i i i 1 i có i i không?
Anh i có i tìm i được i cây i bút i không?
Cói quyểni sáchi nàoi trongi ngăni kéoi không?
i = i i (có*) i i không i ? i i = i (có*) i i không? (vd, i đi i không?)
i = i Có i i i i không i ? i i i i i 2 i có i phải i i không?
Có i phải i anh i này i không?
Cói phảii emi vẽi tranhi nàyi không?
i = i Có i phải i i i không i ?
i = i Có i phải i i không i ?
Anh i hai i đã i đi i chưa?
Coni đãi làmi bàii tậpi chưa?
i = i i đã i i chưa i ?
4 i i xong i ( i rồi, i xong i rồi) i chưa?
Anh i làm i xong i bài i tập i chưa?
i =i i i chưa/xongi chưai ?
Cáci tiểui từi chuyêni dụng:i câui nghii vấni cói tiểui từi chuyêni dụngi nếui khôngi đượci dùngi kèmi vóii cáci phươngi tiệni kháci thìi điểmi hỏii trongi câui sẽi rấti mơi hồ.i Cói thểi gọi i đây i là i kiểu i câu i nghi i vấn i không i rõ i trọng i điểm i Một i số i tiểu i từ i chuyên i dụng i là i à, i đấy i à, i nhỉ, i ư, i hả, i hở, i hử, i chăng, i không, i sao, i
i = i i i i i i i i i i i i i Những i động i từ, i tính i từ i thường i có i bổ i ngữ i là i câu i hỏi i là:
• Những i động i từ i có i ý i nghĩa i hỏi i han: i hỏi, i đòi, i nhắn, i yêu i cầu, i điều i tra, i thăm i viếng, i nói, i v.v
• Nhữngi độngi từi cói ýi nghĩai thôngi báo:i báo,i nghe,i thấy,i thuyếti minh,i trìnhi bày…
• Nhữngi độngi từi cói ýi nghĩai trạngi tháii tinhi thầni hoặci quái trìnhi nhậni thức:i quyếti tâm,i nhậni được,i gặpi gỡ,i tuâni thủ,i hiểui rõ…
• Những i tính i từ: i chắc i chắn, i thích i hợp, i quan i trọng, i để i ý, i quan i tâm… c i i Câu i cầu i khiến
Câu i cầu i khiến i có i cấu i tạo i giống i câu i trần i thuật i nhưng i lại i không i được i dùng i để i miêu i tả, i nhận i định i như i câu i trần i thuật i Câu i cầu i khiến i nhằm i đòi i hỏi i thực i hiện i một i hành i động, i một i chuyển i biến i
Cấu i trúc i chung: i Câu i cầu i khiến i được i cấu i tạo i nhờ i những i động i từ i ngoại i động i chỉ i ý i sai i khiến: i khuyên, i sai, i bảo, i cấm , i các i phó i từ i mệnh i lệnh: i hãy, i đừng, i đừng, i chớ i và i cáci trợi từ:i đi,i thôi,i lên
Víi dụ:i Khôngi đượci làmi ồn,i đii đii em d i i Câu i cảm i thán
Câu i cảm i thán i là i câu i dùng i để i bộc i lộ i tình i cảm, i cảm i xúc i Câu i cảm i thán i không i đòi i hỏi i có i phần i nghĩa i miêu i tả, i không i bắt i buộc i phải i gán i với i một i sự i kiện i hay i hiện i tượng i được i biểu i hiện i trong i cấu i trúc i của i câu.
Câu i cảm i thán i dạng i “thuần i khiết” i sử i dụng i các i cảm i từ: i ái i chà, i ôi i chao
Câu i cảm i thán i dạng i “không i thuần i khiết” i sử i dụng i các i trợ i từ i đi i kèm i cấu i trúc i câu i
Ví i dụ: i hỡi i ôi i !, i ô i kìa i !
i Hiện i tượng i đồng i tham i chiếu i trong i tiếng i Việt i và i hướng i tiếp i cận
i i Np- i anaphora i
i i i i i i i i i i Nhắci lạii địnhi nghĩa,i hiệni tượngi Np-i anaphorai lài hiệni tượngi mộti từi -i thườngi lài đạii từi -i thayi thếi choi mộti danhi từ,i mộti cụmi danhi từi đãi nhắci đếni ởi phíai trước. a i Cách i tiếp i cận i cũ i – i thuật i toán i Hobbs. i i i i i i i i i i Phải i nói i rằng, i đây i là i thuật i toán i nhận i diện i đại i từ i đầu i tiên i cho i những i kết i quả i thực i nghiệm i khả i quan i từ i những i năm i 70 i của i thế i kỷ i trước i Trước i khi i bắt i tay i vào i nghiên i cứu i những i thuật i toán i mới, i em i xin i phép i nhắc i lại i điểm i cốt i lõi i của i thuật i toán i này i i i i i i i i i i Thuật i toán i này i đòi i hỏi i xây i dựng i một i cây i phân i tích i cú i pháp, i cây i phân i tích i có i nhiệm i vụ i phân i chia i câu i thành i chủ i ngữ, i động i từ, i đại i từ, i bổ i ngữ, i tính i từ… i mà i không i thay i đổi i trật i tự i từ i hay i bỏ i qua i từ i trong i câu i theo i chiều i phân i tích i từ i trái i sang i phải i đúng i nhưi cấui trúci ngữi phápi tiếngi Anh.i
Hình i 1 i - i Mô i phỏng i thuật i toán i Hobbs i i i i i i i i i Căn i bản i dựa i trên i cây i phân i tích i cú i pháp, i thuật i toán i duyệt i qua i bề i mặt i cây i phân i tích i cú i pháp i theo i một i trật i tự i đặc i biệt, i tìm i kiếm i một i cụm i danh i từ i tương i thích i về i số i lượng i (số i ít, i số i nhiều), i kiểu i loại i (giống i đực, i giống i cái ) i i với i đại i từ i Trật i tự i duyệt i như i sau:
1 Bắt i đầu i ở i nút i NP i đại i diện i cho i đại i từ i cần i thay i thế.
2 Đi i ngược i lên i gốc i của i cây i đến i khi i gặp i nút i NP i hoặc i nút i S i đầu i tiên i Gọi i nút i này i lài X,i vài coni đườngi đểi dẫni đếni Xi lài p.
3 Duyệti tấti cải cáci nhánhi ởi dướii núti Xi vài bêni tráii nhánhi pi theoi phươngi phápi tìmi kiếm i rộng i Cho i là i mỗi i cụm i từ i bị i thay i thế i bởi i đại i từ i (antecedent) i có i một i nút i NP i hoặc i S i nằm i giữa i nó i và i X.
4 Nếu i X i là i nút i S i cao i nhất i trong i câu, i duyệt i cây i phân i tích i cú i pháp i của i câu i đứng i trước i theo i trật i tự i từ i câu i gần i nhất i vói i câu i đang i xét i Mỗi i cây i được i duyệt i kiểu i tìm i kiếm i rộng i từ i trái i sang i phải, i và i khi i gặp i một i nút i NP, i nút i đó i được i cho i là i cụm i từ i mà i đại i từ i thay i thế i (antecedent) i Nếu i X i không i phải i là i nút i S i cao i nhất i trong i cây, i tiếp i tục i bước i 5.
5 Từ i nút i X, i tiếp i tục i đi i lên i gốc i cây i cho i đến i khi i gặp i được i một i nút i S i hoặc i NP i Gọi i nút i mới i này i là i X i và i con i đường i duyệt i đến i nó i là i p.
6 Nếui Xi lài mộti núti NPi vài đườngi pi duyệti tớii Xi khôngi chứai núti i i (mỗii núti NPi cói mộti núti i i ngayi dướii nói đạii diệni phầni danhi từi chínhi củai cụmi danhi từ)i nàoi mài Xi ngayi lập i tức i bao i hàm, i gán i X i là i cụm i danh i từ i thay i thế i (antecedent).
7 Duyệt i tất i cả i các i nhánh i cây i nằm i dưới i nút i X i theo i trật i tự i tìm i kiếm i rộng i từ i trái i sang i phải i Gán i mọi i nút i NP i gặp i được i là i antecedent.
8 Nếu i X i là i một i nút i S, i duyệt i tất i cả i các i nhánh i của i nút i X i đến i nhánh i bên i phải i của i đường i p i theo i trật i tự i tìm i kiếm i rộng i từ i trái i sang i phải i nhưng i không i duyệt i xuống i dưới i bất i cứ i nút i NP i hay i S i nào i gặp i được i Gán i bất i cứ i nút i NP i nào i gặp i được i là i antecedent
9 Trở i lại i bước i 4. i i i i i Tìm i kiếm i rộng i trên i cây i là i cách i tìm i kiếm i mà i tại i đó i tất i cả i các i nút i ở i độ i sâu i n i được i tới i thămi trướci khii thămi bấti cứi núti nàoi cói đội sâui n+1.i Bướci 2i vài bướci 3i giảii quyếti vấni đềi vềi đội sâui củai câyi mài tạii đói mộti đạii từi phảni thâni cói thểi đượci sửi dụng.i Bướci 5-9i baoi quát i cây i giữa i các i nút i NP i và i S i Nút i 4 i tìm i kiếm i trong i câu i trước i đó i i i i i i i i i i Điểm i hạn i chế i của i thuật i toán i này, i đó i chính i là i việc i chỉ i hiệu i quả i trong i việc i xử i lý i các i đồng i tham i chiếu i nằm i trong i cùng i một i câu, i trong i nhiều i trường i hợp, i để i cải i thiện i hiệui quải yêui cầui phảii đưai vàoi nhữngi ràngi buộci hạni chếi nhưi là:
• Ngàyi thángi khôngi thểi dịchi chuyểni
• Địa i điểm i không i thể i di i chuyển i
• Những i vật i lớn i không i thể i dịch i chuyển i i i i i i i i i i Các i ràng i buộc i chỉ i mới i được i đưa i vào i ở i những i dạng i đơn i giản i nhất, i không i được i chú i trọng i trong i thuật i toán i một i cách i tương i xứng i với i vai i trò i của i nó. i i i i i i i i i Mặt i khác, i hiệu i quả i của i thuật i toán i cũng i phụ i thuộc i nhiều i vào i sự i đúng i đắn i của i phân i tích i cây i cú i pháp i Các i câu i trong i hội i thoại i thường i là i câu i đơn i và i có i cấu i trúc i tương i đối i đơn i giản, i sử i dụng i thuật i toán i Hobbs i có i thể i đáp i ứng i được i khoảng i 70% i các i trường i hợp i xảy i ra i Np- i anaphora i Tuy i nhiên, i một i yếu i điểm i quan i trọng i của i thuật i toán i này i khi i đưai vàoi ápi dụngi choi tiếngi Việti lài đội chínhi xáci củai thuậti toáni phụi thuộci vàoi đội chínhi xáci củai câyi cúi phápi nhưngi mộti thuậti toáni cói thểi đưai rai cấui trúci câui ngữi phápi chínhi xác i trong i tiếng i Việt i cho i đến i thời i điểm i thực i hiện i đồ i án i này i là i không i có i Vì i thế i việc i cài i đặt i thuật i toán i Hobbs i trở i nên i không i khả i thi. b i Cách i tiếp i cận i mới i – i Đa i chiến i lược. i i i i i i i i i i Ý i tưởng i của i cách i tiếp i cận i mới i này i là i thay i vì i hoàn i toàn i phụ i thuộc i vào i trật i tự i của i cây i cú i pháp i như i thuật i toán i Hobbs, i ta i chỉ i tìm i kiếm i các i tiền i ngữ i phía i trước i đại i từ i và i sử i dụng i tập i các i ràng i buộc i để i xử i lý i lựa i chọn i ra i tiền i ngữ i phù i hợp i nhất i với i đại i từ i đó. i i i i i i i i i i Giải i quyết i vấn i đề i đồng i tham i chiếu i từ i lâu i đã i được i nhận i định i là i vấn i đề i khó, i đòi i hỏi i kiến i thức i sâu i rộng i không i hạn i định i cả i về i ngữ i pháp, i ý i nghĩa i học i và i thực i tế… i Để i giảii quyếti mộti lớpi lớni cáci hiệni tượngi đồngi thami chiếu,i thayi vìi chỉi sửi dụngi mộti biệni phápi hayi cáchi tiếpi cậni đơni thuần,i thayi vàoi đói tai xâyi dựni mộti biếni phápi mớii lài kếti hợp i của i nhiều i chiến i lược i khác i nhau i Vấn i đề i ở i đây i chính i là i việc i kết i hợp i chúng i như i thế i nào. i i i i i i i i i i Không i làm i mất i tính i tổng i quát, i ta i đặt i ra i giả i thiết i là i tất i cả i các i tiền i ngữ i của i các i tham i chiếu i là i rõ i ràng i (đã i được i nhắc i đến i ở i câu i trước) i Đây i chính i là i giới i hạn i đầu i tiên i đặt i ra i Dựa i trên i ý i tưởng i của i luật i Centering, i chủ i đề i của i người i sử i dụng i ngôn i ngữ i biến i đổi i linh i động i qua i từng i câu i Mỗi i đại i từ i thay i thế i sẽ i ứng i với i một i tiền i ngữ i duy i nhất i trước i nó i (là i danh i ngữ i được i xếp i mức i ưu i tiên i cao i nhất i của i câu i trước).Nếu i gọi i tập i các i tiền i ngữ i trong i câu i thứ i n-1 i là i Cf, i tập i các i đại i từ i thay i thế i trong i câu i thứ i n i là i Cb(i), i việc i chúng i ta i phải i làm i là i tìm i ra i được i Cp i (tiền i ngữ i thích i hợp i nhất) i trong i Cf i tương i ứng i cho i từng i Cb(i).i i i i i i i i i i i Tai xâyi dựngi cáci ràngi buộci vớii cáci mứci ưui tiêni từi trêni xuốngi dướii nhưi sau.
Local i constraints i : i Tiền i ngữ i và i đại i từ i đồng i tham i chiếu i phải i thống i nhất i về i mặt i số i lượng i (số i ít, i số i nhiều), i giống i (người/ i vật, i đực/ i cái), i bản i chất i (động i vật/ i thực i vật)… i i Tất i cả i các i ứng i viên i trong i Cf i vi i phạm i rằng i buộc i này i đều i phải i bị i loại i bỏ i i i i i i i i i i i i Ví i dụ i : i John i và i Mary i đi i siêu i thị, i Anh i ấy i mua i một i cái i tủ i lạnh i mới i i Anh i ấy i phải i được i hiểu i là i John.
Casei –i rolei sentencei contraintsi :i Vaii tròi ýi nghĩai họci củai tiềni tối vài đạii từi đồngi thami chiếui phảii thốngi nhất.i Tấti cải cáci ứngi viêni vii phạmi i đềui phảii bịi loạii bỏ. i i i i i i i i Ví i dụ i : i John i lấy i cái i bánh i ở i trên i bàn i và i ăn i nó i i “nó” i là i cái i bánh i chứ i không i thể i là i bàn i được.
Disjoint-Contraints i : i Câu i Su i – i Verb i – i Ob i i tuỳ i vào i từng i động i từ i cụ i thể i mà i có i cho i phép i Su i và i Ob i là i một i hay i không i Tất i cả i các i tiền i tố i vi i phạm i ràng i buộc i này i đều i bị i loại i bỏ.
Condition-Constraint i : i Tiền i ngữ i và i đại i từ i tham i chiếu i phải i thoả i mãn i thực i tế i hànhi động. i i i i i i i Ví i dụ i : i i John i cho i Tom i một i quả i táo i Anh i ý i ăn i nó i ngay i i “Anh i ý” i phải i là i Tom i chứ i không i thể i là i John i được. i i i i Mọi i tiền i ngữ i không i thoả i mãn i đều i phải i bị i loại i bỏ.
Prefer- i Constraint: i Nếu i sau i khi i tất i cả i các i giới i hạn i trên i được i áp i i dụng i mà i vẫn i con i nhiều i hơn i 2 i ứng i viên i tiền i tố i Ta i sẽ i tính i đến i i ưu i tiên i về i vai i trò i ngữ i phápi vài ưui tiêni vềi chủi đềi câu. i i i i i i i i i i Cáci ứngi viêni tiềni ngữi đượci xáci địnhi bằngi cáchi lọci rai cáci cụmi danhi từi từi câui gầni nhất i mà i thuật i toán i tìm i được i tiền i ngữ i thích i hợp, i nếu i không i tìm i được i thì i bắt i đầu i từ i câu i gần i nhất i được i nhập i vào i Để i thuật i toán i được i chính i xác i cần i phải i phân i biệt i rõ i ràng i ràng i buộc i nào i là i bắt i buộc i và i ràng i buộc i nào i là i phần i thêm i Ràng i buộc i bắt i buộc i áp i dụng i cho i tấti cải cáci trườngi hợpi trongi khii ràngi buộci thêmi chỉi ápi dụngi choi cáci trườngi hợpi nhậpi nhằngi (cụi thểi nhưi câui cói hơni 2i ngườii vaii tròi tươngi đương).i i i i i i i i i i Khẳng i định i ràng i buộc i thêm i không i có i độ i chính i xác i 100 i %, i đó i chỉ i là i các i điều i kiện i ta i thêm i vào i để i tối i ưu i hóa i kết i quả i trong i các i trường i hợp i nhập i nhằng i ngữ i nghĩa i mà i thôi i i i i
i “One” i anaphora
i i i i i i i i i Nhắc i lại i định i nghĩa, i one- i anaphora i là i hiện i tượng i sử i dụng i số i từ i để i thay i thế i cho i từ i loại i danh i từ i đã i nhắc i đến i phía i trước. i i i i i i i i i Sối từi thườngi đượci sửi dụngi nhiềui như:i cái,i chiếc,đứa…
Víi dụi :i Trungi tâmi mớii nhậpi vềi mộti loạii thiệpi mới. i i i i i i i i i i i i Cho i tôi i xem i thử i một i chiếc. i i i i i i i i Mặc i dù i đây i là i hiện i tượng i hay i gặp i trong i hội i thoại i tiếng i Việt i nhưng i do i tính i chất i của i hội i thoại i là i liền i mạch i và i đơn i giản i nên i việc i xử i lý i one-anaphora i cũng i tương i tự i như i Np-anaphora i nhưng i các i ràng i buộc i của i nó i không i nhiều i – i chỉ i có i sự i ràng i buộc i tương i thích i giữa i danh i từ i và i số i từ.
i VP- i anaphora
i i i i i i i i Nhắc i lại i định i nghĩa, i VP-anaphora i là i hiện i tượng i sử i dụng i một i từ i để i thay i thế i cho i một i động i từ i hoặc i cụm i động i từ i đã i nhắc i đến i ở i phía i trước. i i i i i i i i Cáci trườngi hợpi VP-anaphorai trongi hộii thoạii tiếngi Việti khôngi phongi phúi lắm,i hơni nữai việci phâni chiai VP-anaphorai vài hiệni tượngi tỉnhi lượci chỉi lài tươngi đốii doi VP-i anaphora i cũng i có i thể i coi i là i một i trường i hợp i đặc i biệt i của i tỉnh i lược. i i i i i i i Ví i dụ:
Lan i muốn i ăn i kem i Tràng i Tiền.
Nhưng i tôi i không i muốn i thế. i i i i i i i Chỉ i xét i các i câu i có i cấu i trúc i đơn i giản i (vì i mục i tiêu i của i đồ i án i là i hướng i vào i ứng i dụng i hộii thoại),i đặci điểmi nhậni biếti VPi –i anaphorai lài câui cói cấui trúci ,i trongi đó,i i thườngi lài cáci độngi từi chỉi sởi thíchi nhưi thích,i muốn…i vài từi thay i thế i thường i là: i thế, i vậy.
i S- i anaphora
thếi (mài khôngi cầni đếni mộti câyi cấui trúci ngữi phápi hoàni chỉnhi vài chínhi xác).i i 4.1.4 i S- i anaphora i i i i i i i i i Nhắc i lại i định i nghĩa, i S- i anaphora i là i hiện i tượng i sử i dụng i một i từ i để i thay i thế i cho i cả i một i câu i đã i được i nhắc i đến i ở i phía i trước. i i i i i i i i i Ví i dụ:
Bức i tranh i này i hình i như i thuộc i trường i phái i trừu i tượng?
Uh, i tôi i cũng i nghĩ i thế. i i i i i i i i i S-i anaphorai cũngi lài mộti dạngi hayi gặpi trongi hộii thoạii tiếngi Việt,i vớii tínhi chấti đơn i giản i của i cấu i trúc i câu i hội i thoại, i đặc i điểm i câu i có i S- i anaphora i là i câu i có i cấu i trúc i
, i trong i đó i i thường i là i các i nội i động i từ i mang i tính i phán i đoán i như i nghĩ, i đoán… i và i từ i thay i thế i là i thế, i vậy. i i i i i i i i Cách i tiếp i cận i của i S- i anaphora i cũng i tương i tự i VP i – i anaphora. i
i Hiện i tượng i tỉnh i lược i câu i và i hướng i tiếp i cận
i Hướng i tiếp i cận
Hình i 2 i - i Mô i phỏng i quan i hệ i từ i vựng i i i i i i i i i i Bài i toán i giải i quyết i hiện i tượng i tỉnh i lược i là i bài i toán i khôi i phục i lại i đầy i đủ i cấu i trúc i củai câui đãi bịi lượci bỏ.i Giải thiếti tồni tạii mộti mốii quani hệi giữai mộti từi trongi câui tỉnhi lượci ngữi phápi vài mộti từi trongi phầni đãi bịi tỉnhi lượci –i tai gọii đâyi lài mốii quani hệi tỉnhi lược i Ví i dụ i : i cái i khóa i là i một i phần i của i cánh i cửa i , i ta i ký i hiệu: i cánh i cửa i i cái i khóa i Một i mối i qua i hệ i như i thế i là i nền i tảng i giải i quyết i bài i toán i Tìm i kiếm i mối i quan i hệ i này i là i nhiệm i vụ i cần i thực i hiện, i tuy i nhiên i việc i này i sẽ i không i được i thực i hiện i một i cách i trực i tiếp i mà i bằng i cách i tìm i kiếm i gốc i và i đích i (tiền i ngữ i bị i lược i bỏ) i của i mối i qua i hệ i này.i i i i i i i i i i i i i i i i i i Thuật i toán i xử i lý i vấn i đề i này i có i thể i tóm i lược i như i sau:
Bắt i đầu i từ i câu i tỉnh i lược i B
Tìmi kiếmi Ai ởi câui gầni đâyi nhấti choi kếti quải tiềni tố.
Kiểm i tra i mối i quan i hệ i của i A i và i B i Nếu i A i thoả i mãn i các i rằng i buộc i i Viết i lại i B i theo i A
Không i thoả i mãn i i Tìm i tiếp i ở i câu i trước i đó i i i i i i i i Chú i ý i là i với i đặc i thù i liên i tục i của i hội i thoại i và i giả i thiết i là i tất i cả i các i yếu i tố i đã i biết i
(tìm i được i i tiền i ngữ) i hầu i hết i các i tiền i ngữ i bị i lược i bỏ i phải i được i tìm i thấy i ở i câu i phía i trước. i i i i i i i i i Bởii vìi hiệni tượngi tỉnhi lượci vốni lài hiệni tượngi ngữi phápi câui khuyếti đii mộti phần,i do i đó, i cái i “gốc” i của i mối i quan i hệ i tỉnh i lược i khá i dễ i dàng i để i nhận i diện i : i phát i hiện i khiếm i khuyết i ngữ i pháp i của i câu i Về i mặt i ngữ i pháp, i các i dạng i khiếm i khuyết i hay i gặp i nhất i là i dạng:
Thiếu i vắng i chủ i thể i - i một i từ i mà i không i thể i đứng i đầu i câu i lại i không i chịu i tác i động i của i các i từ i khác i trong i câu i Ví i dụ i như i một i tính i từ i thiếu i vắng i danh i từ…như i (nghiêm i trọng i lỗi i lầm).
Thiếui i vắngi bổi ngữi -i mộti từi yêui cầui kèmi theoi thựci thểi bịi táci độngi nhưngi trongi câu i không i có i thực i thể i này i Ví i dụ i đơn i giản i như i từ i trong i câu i tỉnh i lược i là i một i bộ i phận, i một i thuộc i tính, i một i phân i lớp i của i từ i đã i bị i tỉnh i lược, i như i tranh i trường i phái i trừu i tượng i i i i i i i i i i i i i Thuật i toán i nhìn i qua i có i vẻ i khá i đơn i giản i tuy i nhiên i vấn i đề i mấu i chốt i và i phức i tạp i của i hiện i tượng i tỉnh i lược i câu i chính i là i phát i hiện i mối i quan i hệ i giữa i hai i câu i A i – i câu i tỉnh i lược i và i B- i câu i phía i trước i Giải i pháp i của i đồ i án i này i đó i là i so i sánh i từ/cấu i trúc i của i 2 i câu i vài dựi vàoi mốii quani hệi đãi đượci địnhi nghĩai trongi mộti từi điểni đượci xâyi dựngi mớii tươngi tựi WordNet.i Cấui trúci củai từi điểni nàyi sẽi đượci làmi rõi ởi phầni sau.
i Tổng i hợp
Hướng i giải i quyết i mối i quan i hệ i chủ i ngữ i - i động i từ i - i bổ i ngữ
i i i i i i i i i Mặc i dù i đồ i án i dựa i trên i cách i tiếp i cận i cố i gắng i ít i dựa i vào i phân i tích i câu i hết i mức i có i thể, i nhưng i các i ràng i buộc i động i từ i - i danh i từ i vẫn i đòi i hỏi i vai i trò i cú i pháp i của i từ i ở i một i mức i nhất i định i nào i đó. i i i i i i i i Xét i ví i dụ:
Họa i sĩ i Tô i Ngọc i Vân i sống i ở i đâu?
Ôngi ấyi sinhi rai vài lớni lêni ởi Hài Nội.
Tôi i nghĩ i rằng i bức i tranh i này i là i giả. i i i i i i i Trên i là i ba i ví i dụ i về i dạng i câu i hay i gặp i nhất, i dựa i trên i điều i kiện i là i các i câu i hội i thoại i là i câu i đơn i có i cấu i trúc i khá i đơn i giản, i ta i có i thể i tìm i kiểm i chủ i ngữ i của i động i từ i bằng i thuật i toán i đơn i giản i mà i hiệu i quả i như i sau:
Chủ i ngữ i là i danh i từ i đứng i trước i động i từ i i thay i vì i đi i phân i tích i cú i pháp i câu, i ta i đi i tìm i danh i từ i đứng i trước i động i từ i đó.
Nếui phíai trướci độngi từi lài từi nốii nhưi và,i nhưng…i chủi ngữi củai độngi từi đói lài chủi ngữi củai độngi từi phíai trướci nó.i
i Hướng i xây i dựng i cơ i sở i dữ i liệu i từ i điển i mới
4.3.2.1 i Nguyên i nhân i i i i i i i Câu i hỏi i đặt i ra i là i tại i sao i không i thể i sử i dụng i một i từ i điển i từ i vựng i thông i thường i vốn i đã i rất i sẵn i có i mà i cần i phải i tạo i một i từ i điển i động i mới i tương i tự i từ i điển i WordNet?
Việc i xây i dựng i từ i điển i mới i rõ i ràng i là i phức i tạp i và i tốn i thời i gian i hơn i nhiều i nhưng i lại i là i điều i cần i thiết i bởi i các i lý i do i sau i đây i :
Để i giải i quyết i hiện i tượng i tỉnh i lược i ta i cần i biết i mối i quan i hệ i mức i sâu i giữa i các i từ, i víi dụi nhưi :i ổi khóai lài mộti phầni củai cánhi cửa,i thầyi giáoi vài họai sĩi đềui lài từi loạii nghềi nghiệpi củai coni ngườii hayi nhưi trườngi pháii lài mộti thuộci tínhi củai bứci tranh.
Mỗi i động i từ i chỉ i phù i hợp i với i một i số i chủ i ngữ, i bổ i ngữ i nhất i định, i các i ràng i buộc i của i hiện i tượng i đồng i tham i chiếu i yêu i cầu i mối i quan i hệ i giữa i danh i từ i và i động i từ. i i i i i i i i Trên i đây i là i nguyên i nhân i căn i bản i nhất i mà i một i từ i điển i thông i dụng i không i thể i đáp i ứng i các i yêu i cầu i của i thuật i toán i i 4.3.2.2 i Cấu i trúc i từ i điển i mới. i i i i i i i i i Từ i điển i mới i được i xây i dựng i ở i cấu i trúc i cây i Xml, i dễ i dàng i cho i phép i người i dùng i nhậpi thêmi từi mớii nếui cầni thiết.i Haii đốii tượngi cầni quani tâmi nhấti củai đồi áni chínhi lài độngi từi vài danhi từ,i vìi thếi đồi áni sẽi xâyi dựngi 2i từi điểni choi 2i dạngi từi loạii này. i i i i i i i i i Cấui trúci phâni loạii từi củai từi điểni nàyi đượci xâyi dựngi dựai trêni cấui trúci câyi ngữi pháp i Vietlex i Semantic i Tree i (tham i khảo i trên i trang i web i www.vietlex.vn) i i a i Từ i điển i danh i từ. i i i i i i i Mục i tiêu i của i từ i điển i này i là i không i chỉ i liệt i kê i các i danh i từ i mà i còn i phải i – i trực i tiếp i hoặc i gián i tiếp i – i đưa i ra i được i mối i quan i hệ i giữa i các i danh i từ i nếu i có.
Cấu i trúc i tệp i xml i như i sau:
Organization Root/ConcreteThing/LivingThing/People/Organization
Supernature Root/ConcreteThing/LivingThing/People/Supernature
Animal Root/ConcreteThing/LivingThing/Animal
Mammal Root/ConcreteThing/LivingThing/Animal/Mammal
Bird Root/ConcreteThing/LivingThing/Animal/Bird
Fish Root/ConcreteThing/LivingThing/Animal/Fish
Amphibian Root/ConcreteThing/LivingThing/Animal/Amphibian
Reptile Root/ConcreteThing/LivingThing/Animal/Reptile
Worm Root/ConcreteThing/LivingThing/Animal/Worm
Insect Root/ConcreteThing/LivingThing/Animal/Insect
Shellfish Root/ConcreteThing/LivingThing/Animal/Shellfish
FictionalAnimal Root/ConcreteThing/LivingThing/Animal/FictionalAnimal
Microorganism Root/ConcreteThing/LivingThing/Microorganism
Plant Root/ConcreteThing/LivingThing/Plant
Tree Root/ConcreteThing/LivingThing/Plant/Tree
Bush Root/ConcreteThing/LivingThing/Plant/Bush
Vine Root/ConcreteThing/LivingThing/Plant/Vine
Herb Root/ConcreteThing/LivingThing/Plant/Herb
LowPlant Root/ConcreteThing/LivingThing/Plant/LowPlant
HighPlant Root/ConcreteThing/LivingThing/Plant/HighPlant
Food i Root/ConcreteThing/NonLivingThing/Food
Grain Root/ConcreteThing/NonLivingThing/Food/Grain
Vegetable Root/ConcreteThing/NonLivingThing/Food/Vegetable
Meat i Root/ConcreteThing/NonLivingThing/Food/Meat
Fruit i Root/ConcreteThing/NonLivingThing/Food/Fruit
Beverage Root/ConcreteThing/NonLivingThing/Food/Beverage
Seasoning Root/ConcreteThing/NonLivingThing/Food/Seasoning
Dish Root/ConcreteThing/NonLivingThing/Food/Dish
Artifact i Root/ConcreteThing/NonLivingThing/Artifact
Furniture i Root/ConcreteThing/NonLivingThing/Artifact/Furniture
Tool i Root/ConcreteThing/NonLivingThing/Artifact/Tool
Playthingi Root/ConcreteThing/NonLivingThing/Artifact/Plaything
Appliance Root/ConcreteThing/NonLivingThing/Artifact/Appliance
Machine i Root/ConcreteThing/NonLivingThing/Artifact/Machine
Vehicle i Root/ConcreteThing/NonLivingThing/Artifact/Vehicle
Instrument Root/ConcreteThing/NonLivingThing/Artifact/Instrument
Garmenti Root/ConcreteThing/NonLivingThing/Artifact/Garment
Raiment i Root/ConcreteThing/NonLivingThing/Artifact/Raiment
Ornament i Root/ConcreteThing/NonLivingThing/Artifact/Ornament
Cosmetic i Root/ConcreteThing/NonLivingThing/Artifact/Cosmetic
Drug i Root/ConcreteThing/NonLivingThing/Artifact/Drug
Creation i Root/ConcreteThing/NonLivingThing/Artifact/Creation
Construction Root/ConcreteThing/NonLivingThing/Artifact/Construction
Root/ConcreteThing/NonLivingThing/Artifact/BuildingConstruction
FictionalObject Root/ConcreteThing/NonLivingThing/FictionalObject
Part Root/ConcreteThing/NonLivingThing/Part
AnimalPar Root/ConcreteThing/NonLivingThing/Part/AnimalPar
PlantPar Root/ConcreteThing/NonLivingThing/Part/PlantPar
ArtifactPar Root/ConcreteThing/NonLivingThing/Part/PartOfArtifact
Substance Root/ConcreteThing/NonLivingThing/Substance
MatterRoot/ConcreteThing/NonLivingThing/Substance/Matter
Solid Root/ConcreteThing/NonLivingThing/Substance/Solid
Earth Root/ConcreteThing/NonLivingThing/Substance/Earth
LiquidRoot/ConcreteThing/NonLivingThing/Substance/Liquid
Gas Root/ConcreteThing/NonLivingThing/Substance/Gas
NaturalObjecti Root/ConcreteThing/NonLivingThing/NaturalObject
Root/ConcreteThing/NonLivingThing/NaturalObject/HeaventlyBodies
Root/ConcreteThing/NonLivingThing/NaturalObject/NaturalPhenomenon Land i Root/ConcreteThing/NonLivingThing/NaturalObject/Land
Root/ConcreteThing/NonLivingThing/NaturalObject/BodyOfWater
Concept Root/Abstraction/FieldOfKnowledge/Concept
Knowledge Root/Abstraction/FieldOfKnowledge/Knowldege
Psychology Root/Abstraction/FieldOfKnowledge/Psychology
Stay Root/Abstraction/State/Stay
Existence Root/Abstraction/State/Existence
Contact Root/Abstraction/State/Contact
Consume Root/Abstraction/State/Consume
Will Root/Abstraction/State/Will
Depend Root/Abstraction/State/Depend
BodilyRepsond Root/Abstraction/Action/BodilyRepsond
BodilyFunction Root/Abstraction/Action/BodilyFunction
Thinking Root/Abstraction/Action/Thinking
Active Root/Abstraction/Action/Active
Cognitive Root/Abstraction/Action/Cognitive
Communicate Root/Abstraction/Action/Communicate
Move Root/Abstraction/Action/Move
Create Root/Abstraction/Action/Create
Change Root/Abstraction/Action/Change
PresentAndReceive Root/Abstraction/Action/RresentAndReceive
Receive Root/Abstraction/Action/Receive
Hypotaxis Root/Abstraction/Relation/Hypotaxis
Conjugate Root/Abstraction/Relation/Conjugate
Space Root/Abstraction/Relation/Space
Time Root/Abstraction/Relation/Time
Exist Root/Abstraction/Relation/Exist
Compare Root/Abstraction/Relation/Compare
SetOrGroup Root/Abstraction/Relation/SetOrGroup
Quality i i Root/Abstraction/Attribute/Quality
Quantity i i Root/Abstraction/Attribute/Quantity
Characteristic i i Root/Abstraction/Attribute/Characteristic
Condition Root/Abstraction/Attribute/Condition
SortOrTypei i Root/Abstraction/Attribute/SortOrType
Definite i Root/Abstraction/Value/Definite
Indefinite i Root/Abstraction/Value/Indedinite
Conventionali Root/Abstraction/Unit/Conventional
Time i Root/Abstraction/Unit/Time
Administrative i Root/Abstraction/Unit/Administrative i i i i i i i i i Trong i đó, i các i từ i thuộc i cùng i một i cha i sẽ i có i ngữ i nghĩa i tương i tự i nhau, i và i các i từ i có i quan i hệ i cha i – i con i trong i cây i xml i sẽ i có i quan i hệ i phụ i thuộc i bộ i phận i hoặc i thuộc i tính i với i nhau. b.Từ i điển i động i từ. i i i i i i i Mục i tiêu i của i từ i điển i này i là i liệt i kê i động i từ i và i mối i quan i hệ i giữa i động i từ i và i danh i từ i
Vì i thế i cấu i trúc i cây i động i từ i đơn i giản i hơn i Các i nút i cây i chỉ i là i Root//HeadWord/ i i i i i i i Trongi đó,i Vxi đạii diệni mộti dạngi coni củai độngi từi (đãi nêui trongi phầni 3.2)i vài mỗii núti headwordi sẽi thêmi vàoi cáci thuộci tínhi nhưi Su,i Ob…i thểi hiệni yêui cầui ràngi buộci của i nhóm i động i từ i đó.
Tổng i hợp i các i phương i pháp
i i i i i i i i i Các i phân i tích i ở i trên i sử i dụng i chiến i thuật i chia i để i trị, i phân i loại i hiện i tượng i đồng i tham i chiếu i và i tỉnh i lược i thành i các i trường i hợp i nhỏ i hơn i và i sử i dụng i các i cách i tiếp i cận i khác i nhau i để i giải i quyết i từng i trường i hợp i Bài i toán i chỉ i hoàn i chỉnh i khi i ta i có i thể i tổng i hợp i các i phần i riêng i lẻ i lại i thành i một i khối i thống i nhất. i i i i i i i i i Trong i quá i trình i phân i tích i từng i dạng i riêng i biệt i của i hiện i tượng i tỉnh i lược i và i đồng i thami chiếu,i tai cói thểi đưai rai nhậni xéti sau:
Câui phíai trướci lài câui đãi quai xửi lýi củai hệi thốngi từi trước,i doi đói nói lài câui đầyi đủi cả i về i ngữ i nghĩa i lần i ngữ i pháp.
Mỗi i câu, i nếu i có i xảy i ra i thì i chỉ i xảy i ra i một i trong i những i trường i hợp i nhỏ i đã i nêu.
Tỉnh i lược i là i hiện i tượng i câu i thiếu i các i bộ i phận i ngữ i pháp
Đồng i tham i chiếu i là i hiện i tượng i câu i đủ i bộ i phận i ngữ i pháp i nhưng i thiếu i ngữ i nghĩa. i i i i i i i i Do i đó, i hệ i thống i sẽ i phải i xây i dựng i i modul i thích i hợp i để i phát i hiện i hiện i tượng i ngữ i pháp i xảy i ra i trong i câu i với i ưu i tiên i kiểm i tra i hiện i tượng i tỉnh i lược i trước i vì i hiện i tượng i đồngi thami chiếui íti nhiềui dựai trêni ngữi phápi câu.i i i i
PHẦN i 3 i XÂY i DỰNG i HỆ i THỐNG
CHƯƠNG i 5 i THIẾT i KẾ i HỆ i THỐNG
i Giới i hạn i bài i toán
Các i câu i đầu i vào i phải i đúng i chính i tả, i để i đơn i giản, i mặc i định i câu i hỏi i kết i thúc i bằngi dấui hỏii vài câui trải lờii kếti thúci bằngi dấui chấm.
Cáci câui phảii tuâni thủi ngữi phápi tiếngi Việti –i tuâni thủi ởi đâyi hiểui lài chỉi cói “tôii ăn i cơm” i chứ i không i thể i có i “tôi i cơm i ăn”.
Các i câu i phải i hiểu i được i – i ý i nghĩa i của i điều i này i có i nghĩa i là i luôn i có i tiền i ngữ.
Hệ i thống i sẽ i là i một i hệ i thống i hướng i lĩnh i vực, i lĩnh i vực i mặc i định i ở i đây i là i trong i viện i bảo i tàng.
Hệ i thống i tích i hợp i chương i trình i tách i từ i vntagger.
Môii trườngi hệi thốngi lài :i winformi ,i chạyi trêni cáci hệi điềui hànhi 64biti củai microsoft i (vista, i win i 7…)
i Vị i trí i của i hệ i thống i trong i hệ i thống i hội i thoại i tổng i hợp
i i i i i i i i i i Hệ i thống i i xử i lý i hiện i tượng i tỉnh i lược i và i đồng i tham i chiếu i nằm i giữa i người i sử i dụng i và i hệ i thống i sinh i câu i của i hệ i thống i hội i thoại. i i i i i i i i i Đầu i vào i : i Hệ i thống i nhận i câu i đầu i vào i từ i hai i nguồn i là i câu i của i người i dùng i và i câu i củai hệi thốngi sinhi câui phíai sau. i i i i i i i i i Đầui rai củai hệi thốngi :i Câui đầyi đủ,i chuyểni choi hệi thốngi sinhi câui i i i i i i i i
i Thiết i kế i các i usecase i chính
i Biểu i đồ i tuần i tự
Hình i 3 i - i i Biểu i đồ i tuần i tự
Biểu i đồ i trạng i thái i máy
Hình i 4 i - i Biểu i đồ i trạng i thái i máy i tổng i quát i i i i i i i i i i i i i Trong i đó i phức i tạp i nhất i chính i là i bước i phát i hiện i các i hiện i tượng i xảy i ra i trong i câu i
Hình i 5 i - i Minh i họa i sơ i đồ i hoạt i động i giai i đoạn i nhận i diện i câu
i Thiết i kế i các i gói i chương i trình
i Gói i truy i nhập i cơ i sở i dữ i liệu i – i XMLdataConnection
// i dùng i để i kết i nối i tệp i xml i danh i từ
(đường i dẫn i tệp i cơ i sở i dữ i liệu i từ i điển i danh i từ)
Phương i thức public i string i GetWordType //i đưai rai phâni loạii củai danhi từ bool i IsBsameCatagoryA
//kiểm i tra i 2 i từ i có i thuộc i cùng i nhóm i không bool i IsSameType bool i IsNounHuman
//kiểm i tra i xem i từ i có i phải i dùng i dể i chỉ i người
IsNounHumanName //kiểmi trai xemi cói phảii têni riêngi chỉi người
//kiểm i tra i xem i B i có i phải i là i một i bộ i phân i của i A i không public i string i HumanGender // i kiểm i tra i giới i tính i của i danh i từ i chỉ i người. b i Lớp i VerbConnection i
// i dùng i để i kết i nối i tệp i xml i danh i từ
(đường i dẫn i tệp i cơ i sở i dữ i liệu i từ i điển i danh i từ) Phương i thức string i GetTypeofObject
// i trả i về i loại i từ i danh i từ i thích i hợp i làm i bổ i ngữ i của i động i từ booli IsAllowDisjoint
// i kiểm i tra i sự i tương i thích i của i Su-Ob i của i động i từ string i GetTypeofSubject
//// i trả i về i loại i từ i danh i từ i thích i hợp i làm i chủ i ngữ i của i động i từ Bool i IsMeanable
// i kiểm i tra i động i từ i có i hay i kèm i phần i phụ i sau i để i rõ i nghĩa i không
i Gói i Tiền i xử i lý i – i PrepareStructure
Baoi gồmi cáci lớpi thểi hiệni cấui trúci dữi liệui củai chươngi trình a i Lớp i WordStruct
// i dùng i để i thể i hiện i cấu i trúc i của i một i từ i trong i câu
Thuộc i tính Private i string i word
// i thể i hiện i nội i dung i từ Private i string i pos
//thể i hiện i loại i từ Privatei stringi wordRoleinSentences
// i thể i hiện i vai i trò i của i từ i trong i câu Private i string i wordSubmean
// i thể i hiện i các i yếu i tố i phụ i của i từ i như i số i lượng…
// i chỉ i áp i dụng i cho i đại i từ i thay i thê Private i int i index
//chỉi mụci củai từi trongi câu Phương i thức Public i WordStruct()
//i Thểi hiệni cấui trúci củai cải mộti câu
Thuộc i tính Private i WordStruct i [ i ] i wordarray
// i Mảng i từ i ngữ Private i int i sentenceLenghth
//Chiều i dài i câu Private i string i strSentencePos
// i Mảng i cấu i trúc i từ i loại i của i câu Phươngi thức Publici SentenceStruct()
//Hàm i tạo Private i int i GetNextNounPsition(int i begin) //Hàm i tìm i kiếm i danh i từ i
//Hàm i tìm i kiếm i bổ i ngữ i của i động i từ Public i WordStruct i GetHOjectofVerb()
//Hàm i tìm i kiếm i bổ i ngữ i là i người i của i động i từ Publici WordStructi GetSubjectofVerb() //Hàmi tìmi kiếmi chủi ngữi củai từ
//Hàm i tìm i kiếm i vị i trí i động i từ Public i int i GetLasVerbPosition() //Hàm i tìm i kiếm i động i từ i từ i cuối i lên i c i Lớp i PrepareStructure
Thuộc i tính static i XMLNounConnection i conn i ;
Phương i thức Public i WordStruct i [ i ] i WordArrayFormArray(tagger i strSen)//i Hàmi chuẩni câu.
i Gói i phát i hiện i hiện i tượng i ngôn i ngữ i - i Discover
i i i i i i i i i Là i gói i bao i gồm i các i lớp i có i nhiệm i vụ i nhận i diện i hiện i tượng i ngôn i ngữ i gặp i trong i câu. a i EcllipsisDiscover:IDisCoverInterface
//i Pháti hiệni hiệni tượngi tỉnhi lượci trongi câu
Thuộc i tính Private i string i filename
// i Phát i hiện i câu i có i hiện i tượng i tỉnh i lược i hay i không Public i string i TypeOccup(…)
// i Dạng i tỉnh i lược i nếu i có. b i Lớp i NPAnaphoraDisCover
// i Phát i hiện i phân i giải i đồng i tham i chiếu i đại i từ.
Phươngi thức publici Booli IsOccup()
//i Trải vềi truei nếui câui cói đồngi thami chiếui đạii từ public i string i TypeOccup()
//Dạng i đồng i tham i chiếu i đại i từ i c i VPAnaphoraDisCover
//// i Phát i hiện i phân i giải i đồng i tham i chiếu i động i từ
Phương i thức Public i bool i IsOccup()
//i Trải vềi truei nếui câui cói đồngi thami chiếui độngi từ Publici stringi TypeOccup()
// i Loại i tham i chiếu i động i từ i mặc i định d i OneAnaphoraDisCover
//// i Phát i hiện i phân i giải i đồng i tham i chiếu i số i từ
Phương i thức Public i bool i IsOccup()
// i Trả i về i true i nếu i câu i có i đồng i tham i chiếu i số i từ Publici stringi TypeOccup()
//i Loạii thami chiếui độngi từi mặci định. e i SAnaphoraDiscover
//// i Phát i hiện i phân i giải i đồng i tham i chiếu i câu
Phương i thức Public i bool i IsOccup()
// i Trả i về i true i nếu i câu i có i đồng i tham i chiếu i câu Publici stringi TypeOccup()
//i Loạii thami chiếui độngi từi mặci định
i Gói i xử i lý i các i hiện i tượng i ngôn i ngữ
//i Lớpi xửi lýi cáci loạii thami chiếui đạii từ
Thuộc i tính Private i bool i iresolve
//Kiểm i tra i xem i đã i giải i quyết i được i đồng i tham i chiếu i hay i không
Phương i thức Static i public i void i ResolveIntraSimple
//Xử i lý i đồng i tham i chiếu i với i đại i tư i và i tiền i ngữ i ở i hai i câu Static i public i void i ResolvenIntraConplex
//Xửi lýi đồngi thami chiếui vớii đạii từi vài tiềni ngữi ởi 2i mộti câu,i cói nhậpi nhằng Static i public i void i ResolveInter
// i Xử i lý i đồng i tham i chiếu i với i đại i từ i và i tiền i ngữ i nằm i trong i cùng i một i câu. b i Lớp i VPAnaphoraResolve
//Xử i lý i hiện i tượng i đồng i tham i chiếu i động i từ
Thuộc i tính Private i bool i iresolve
//Kiểm i tra i đồng i tham i chiếu i có i được i giải i quyết i chưa.
Phương i thức Static i public i void i Resolve
//Xửi lýi đồngi thami chiếui độngi từ c.Lớpi SPAnaphoraResolve
//Xử i lý i hiện i tượng i đồng i tham i chiếu i câu
Thuộc i tính Private i bool i iresolve
//Kiểm i tra i đồng i tham i chiếu i có i được i giải i quyết i chưa.
Phương i thức Static i public i void i Resolve
//Xử i lý i đồng i tham i chiếu i câu d.Lớp i OneAnaphoraResolve
//Xử i lý i hiện i tượng i đồng i tham i chiếu i số i từ
Thuộc i tính Private i bool i iresolve
//Kiểm i tra i đồng i tham i chiếu i có i được i giải i quyết i chưa.
Phương i thức Static i public i void i Resolve
//Xử i lý i đồng i tham i chiếu i số i từ e.Lớpi EcllipsisResolve
//Xử i lý i hiện i tượng i tỉnh i lược
Thuộc i tính Private i bool i iresolve
//Kiểm i tra i hiện i tượng i tỉnh i lược i có i được i giải i quyết i chưa. Phươngi thức Statici publici voidi Resolve
//Xử i lý i hiện i tượng i tỉnh i lược. f i Lớp i MergeClass i – i Đây i là i lớp i tổng i hợp i các i thuật i toán i để i xử i lý i chung.
//Xửi lýi tổngi hợpi cáci thuậti toán
Thuộci tính Privatei sentence_taggeri cur
//Thể i hiện i cấu i trúc i câu i đang i xử i lýPrivate i sentence_tagger i pre1
//Thể i hiện i cấu i trúc i câu i đang i xử i lý1 Private i sentence_tagger i pre2
//Thể i hiện i cấu i trúc i câu i đang i xử i lý2 Privatei sentence_taggeri senresult //Thểi hiệni cấui trúci câui kếti quải
//Thể i hiện i cấu i trúc i câu i đang i xử i lý Private i SentenceStruct i preSen
//Thể i hiện i cấu i trúc i câu i đang i xử i lýPhương i thức Static i public i bool i Merge(…) i //Lớp i xử i lý i tổng i hợp
i Thiết i kế i lớp
i i i i i i i i i i Vì i cấu i trúc i các i lớp i trong i mỗi i gói i đã i được i liệt i kê i đầy i đủ i trong i các i bảng i phần i trên, i vìi thếi phầni nàyi khôngi i tậpi trungi vàoi thiếti kêi lớpi củai cải chươngi trìnhi mài chỉi tậpi trungi vào i thiết i kế i lớp i của i hai i gói i phức i tạp i và i quan i trọng i nhất i là i gói i phát i hiện i hiện i tượng i ngôn i ngữ i trong i câu i và i gói i giải i quyết i tổng i hợp
Hình i 6- i Hình i biểu i đồ i lớp i gói i nhận i diện i câu.
Hì nh i 8 i - i i Biểu i đồ i lớp i gói i xử i lý i tổng i hợp
CHƯƠNG i 6 i THỬ i NGHIỆM i VÀ i ĐÁNH i GIÁ i KẾT i QUẢ
i Kiểm i thử
i Giao i diện i của i chương i trình
i i i i i i i i i i Như i đã i phân i tích i ở i trên, i chương i trình i là i một i phần i của i hệ i thống i hội i thoại i tích i hợp, i do i đó i giao i diện i được i thống i nhất i phù i hợp i với i các i yêu i cầu i của i cả i hệ i thống i hội i thoại.i Cụi thểi ,i trêni giaoi diệni sẽi cói : i i i i i i i i i Phầni trungi tâmi baoi gồmi 3i textboxi :
Textboxi trêni cùngi lài nơii ngườii dùngi nhậpi câui hộii thoạii vớii máy.
Textbox i ở i giữa i là i nơi i chương i trình i phân i giải i đồng i tham i chiếu i và i tỉnh i lược i in i ra i câu i của i người i dùng i sau i khi i được i hệ i thống i i xử i lý.
Textbox i cuối i cùng i là i để i hệ i thống i hội i thoại i phản i hồi i lại i người i dùng i i i i i i i i i i Phầni bêni tráii vài vài bêni phảii cói cáci textboxi hiểni thịi cáci câui hộii thoạii phíai trướci
(textboxi bêni phải)i i Giaoi diệni cụi thểi :
i Thử i nghiệm i và i kết i quả
i i i i i i i i i Sau i đây i là i một i số i câu i thử i nghiệm i minh i họa i và i kết i quả i đầu i ra i của i chương i trình.
Bảng i thử i nghiệm Đầu i vào Đầu i ra.
1.John i lấy i chiếc i bánh i ở i trên i bàn i và i ăn i nó.
John i lấy i chiếc i bánh i ở i trên i bàn i và i ăn i chiếc i bánh
2.Johni lấyi chiếci bánhi ởi trêni bàni vài rửai nó.
Johni lấyi chiếci bánhi ởi trêni bàni vài rửai bàn.
3.Họa i sĩ i Tô i Ngọc i Vân i vẽ i được i 5 i tranh?
Tôi i nghĩ i họa i sĩ i Tô i Ngọc i Vân i vẽ i được i 5 i tranh.
4 i Họa i sĩ i Tô i Ngọc i Vân i có i được i 5 i tranh. Ảnh i ?
Họa i sĩ i Tô i Ngọc i Vân i có i được i mấy i ảnh i
5.i quốci tịchi củai họai sĩi Tôi Ngọci Vâni lài gìi ?
Quêi quáni củai họai sĩi Tôi Ngọci Vâni lài gì?
6.Họa i sĩ i Tô i Ngọc i Vân i nhà i ở i đâu?
Họa i sĩ i Tô i Ngọc i Vân i ngày i sinh i ở i đâu? F
7 i Bảo i tàng i trưng i bày i bao i nhiêu i i tranh i ?
Bảo i tàng i trưng i bày i 5 i tranh T
8 i Bức i tranh i “ i The i Mona i Lisa” i là i của i họa i sĩ i Leonardo i da i Vinci i phải i không?
Vâng, i bức i tranh i đó i do i ông i ấy i vẽ.
Vâng, i The i Mona i Lisa i do i Leonardo i da i Vinci i vẽ.
9.A: i Bức i họa i “ i The i Madonna i with i the i Yamwinder” i của i Leonardo i đã i bịi đánhi cắpi phảii không?
B:i Vâng,i bứci tranhi củai ôngi ấyi bịi đánhi cắpi vàoi hồii thángi 8/2003 bức i tranh i của i Leonardo i bị i đánh i cắp i vào i hồi i tháng i 8/2003
10 i Bạn i biết i họa i sĩ i Tô i Ngọc i Vân i chứ?
B: i có i chứ,”thiếu i nữ i bên i hoa i huệ i “ i có i chứ,”thiếu i nữ i bên i hoa i huệ i “ i chính i là i bức i tranh i sơn i dầu i nổi i tiếng i của i Tô i Ngọc i Vân i
T chính i là i bức i tranh i sơn i dầu i nổi i tiếng i của i ông i ấy
11.Ai i đã i phục i chế i bức i tranh i này i ?
Caroline i Fry i đã i phục i chế i bức i tranh i này i
12 i Bức i tranh i sơn i dầu i “ i hoa i mười i giờ” i do i họa i sĩ i nào i vẽ i ?
B: i Họa i sĩ i Vũ i Kim i Thanh
A: i Hiện i tại i ông i ý i sống i ở i Luân i Đôn i phải i không?
12 i Bức i tranh i sơn i dầu i “ i hoa i mười i giờ” i do i Vũ i Kim i Thanh i vẽ.
A: i Hiện i tại i Vũ i Kim i Thanh i sống i ở i Luân i Đôn i phải i không?
12Bức i tranh i “ i The i Mona i Lisa” i là i của i họa i sĩ i Leonardo i da i Vinci i phải i không?
B:i Vâng,i bứci tranhi đói doi ôngi tai vẽ.
Vâng,“ i The i Mona i Lisa” i do i Leonardo i da i Vinci i vẽ.
13.Quê i quán i của i họa i sĩ i Tô i Ngọc i
Chứng i minh i thư i của i họa i sĩ i Tô i Ngọc i Vân i ở i đâu i ?
14.John i lấy i chiếc i gậy i ở i trên i bàn i và i laui nó
John i lấy i chiếc i gậy i ở i trên i bàn i và i lau i chiếci gậy
15.: i Kiệt i tác” i ao i súng” i được i bán i với i giá i 80 i triệu i USD
B: i Nó i là i tác i phẩm i của i Claude i
A:Vâng, i ông i ta i là i danh i họa i ngưừoi i
Pháp i theo i trường i phái i ấn i tượng
Ao i Súng i là i tác i phẩm i của i Claude i Monet?
A:Vâng, i Claude i Monet i là i danh i họa i người i Pháp i theo i trường i phái i ấn i tượng
16 i Bạn i muốn i tìm i tranh i gì i ?
Tôi i muốn i tìm i tranh i trừu i tượng T
B: i Ông i ấy i là i đại i danh i họa i thế i giới i người i i Tây i Ban i Nha
Goya i là i đại i danh i họa i thế i giới i người i i Tây i Ban i Nha
19 i Mary i rất i yêu i quý i Lan Mary i thường i ngồi i hàng i giờ i nói i chuyện i T
Bà i ấy i thường i ngồi i hàng i giờ i nói i chuyện i với i cô i ấy với i Lan
Đánh i giá i kết i quả
i i i i i i i i i i i i Cáchi tiếpi cậni củai đồi áni nàyi dựai trêni ýi tưởngi tổngi hợpi cáci thuậti toáni cói tínhi khải thii caoi cải vềi đội chínhi xáci vài khải năngi hiệni thựci hóa.i Trongi quái trìnhi thựci hiệni đồi áni này,i emi cũngi đãi nghiêni cứui nhiềui ýi tưởngi mớii lạ,i tuyi nhiêni thựci tiễni chứngi minhi chúng i không i có i sự i khả i thi i cài i đặt i cao, i nhất i là i đối i với i tiếng i Việt i i i i i i i i i i i i i Chương i trình i đã i đạt i được i kết i quả i khả i quan i với i những i câu i hội i thoại i đồng i tham i chiếu i đơn i giản i Với i những i câu i đơn i giản i sự i nhập i nhằng i được i loại i bỏ i Với i những i câu i phức i tạp i hơn, i sự i chính i xác i của i chương i trình i bị i giảm i đi i Các i kết i quả i sai i hay i rơi i vào i trường i hợp i nhập i nhằng i giữa i câu i hỏi i – i trả i lời i của i câu i xảy i ra i hiện i tượng i tỉnh i lược, i như i vấn i đề i về i các i phụ i từ, i ngôi i nhân i xưng. i i i i i i i i i i Mặc i dù i hội i thoại i chỉ i bao i gồm i những i câu i đơn i giản i nhưng i không i vì i thế i mà i không i cói sựi nhậpi nhằngi xảyi ra.i Xéti víi dụi thựci nghiệmi thứi 14
Johni lấyi chiếci gậyi ởi trêni bàni vài laui nó
John i lấy i chiếc i gậy i ở i trên i bàn i và i lau i chiếc i gậy.
John i lấy i chiếc i gậy i ở i trên i bàn i và i lau i bàn i i i i i i i i i i i Không i thể i nói i được i trường i hợp i nào i là i đúng i và i trường i hợp i nào i là i sai i nếu i chỉ i dựa i vàoi phâni tíchi cúi pháp,i phảii dựai vàoi nhữngi kiếni thứci thựci tếi vềi điềui kiệni hoàni cảnhi xảyi rai câui nóii đó. i i i i i i i i i i Thuật i toán i khá i hiệu i quả i trong i các i câu i ngắn, i có i từ i 2 i đến i 3 i đại i từ i tham i chiếu i i i i
Mặc i dù i không i phải i lúc i nào i cũng i tìm i được i tiền i ngữ i thích i hợp i nhất i dù i đã i dùng i tất i cả i các i giới i hạn i Ví i dụ:
John i mang i một i cái i hộp i hộ i Bill i cho i Tom i Anh i ấy i còn i gửi i cậu i ta i cuốn i sách i của i Mary i i i i i i i i i i i Dù i có i đầy i đủ i các i tiền i ngữ i nhưng i “anh i ấy” i và i “cậu i ta” i vẫn i không i thể i xác i định i đượci lài i (John|Bill)i vài (Bill|Tom). i i i i i i i i i i i Chương i trình i sử i dụng i lại i phần i tách i từ i vntagger, i lấy i kết i quả i đó i làm i đầu i vào i nên i độ i chính i xác i của i chương i trình i thu i được i sẽ i là i tích i số i của i độ i chính i xác i thuật i toán i và i độ i chínhi xáci củai chươngi trìnhi vntagger.i
Pi (chươngi trình)i =i Pi (vntagger)i *i Pi (thuậti toán).
Do i cách i tiếp i cận i này i đòi i hỏi i phải i có i một i từ i điển i mới i chứa i thông i tin i về i ngữ i nghĩa i của i từ i nhưng i em i chỉ i có i nguồn i là i cấu i trúc i cây i Semantic i và i một i từ i điển i từ i thông i dụng i chưa i có i phân i loại, i vì i thế i em i phải i tự i xây i dựng i thủ i công i nên i số i từ i chưa i nhiều i i Do i đó, i số i từ i là i chưa i nhiều i và i em i chưa i có i nhiều i thời i gian i để i thực i hiện i thử i nghiệm i chương i trình i với i nhiều i câu i và i có i một i kết i quả i đánh i giá i chính i xác i nhất i về i chương i trình. i i i i i i i i i i Chương i trình i được i xây i dựng i hướng i lĩnh i vực, i cụ i thể i ở i đây i là i lĩnh i vực i liên i qua i đếni việni bảoi tàng.i Bội từi điểni xâyi dựngi cũngi dựai trêni lĩnhi vựci này.i Lýi doi emi xâyi dựngi cáci bội từi điểni hướngi lĩnhi vựci lài đểi hạni chếi sựi nhậpi nhằngi ngữi nghĩai củai từi loại,i quai đói nângi caoi đội chínhi xáci củai chươngi trình.i Trongi thờii giani tớii emi sẽi xâyi dựngi vài thử i nghiệm i thêm i các i bộ i từ i điển i ở i lĩnh i vực i khác i để i cho i ra i kết i quả i chính i xác i nhất i