1. Trang chủ
  2. » Luận Văn - Báo Cáo

Do an phan giai dong tham chieu va hien tuong tinh luoc

70 6 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 70
Dung lượng 488,25 KB

Cấu trúc

  • 1.1 i Đặt i vấn i đề (11)
  • 1.2. i Mô i hình i tổng i quát (11)
  • 1.3. i Các i cách i tiếp i cận i trong i phân i giải i đồng i tham i chiếu i và i hiện i tượng i tỉnh i lược i trong i hội i thoại (12)
    • 1.3.1. i Các i cách i tiếp i cận i trên i thế i giới (12)
    • 1.3.2. i Những i vấn i đề i còn i tồn i tại (12)
    • 1.3.3. i Phân i giải i đồng i tham i chiếu i và i hiện i tượng i tỉnh i lược i trong i hội i thoại i tiếng i Việt (13)
  • 1.4. i Những i khó i khăn i chính i của i bài i toán i phân i giải i đồng i tham i chiếu i và i tỉnh i lược i trong i hội i thoại i tiếng i Việt (13)
    • 1.4.1. i Ngữ i pháp i phức i tạp (13)
    • 1.4.2. Nhập i nhằng i trong i việc i tách i từ i và i phân i loại i từ (14)
    • 1.4.3. i Sự i nhập i nhằng i , i đa i nghĩa i của i đại i từ (14)
  • 1.5. i Mục i tiêu, i giới i hạn i và i hướng i tiếp i cận i của i đồ i án (15)
  • 2.1. i Hiện i tượng i đồng i tham i chiếu i – i Anaphora (16)
    • 2.1.1. Định i nghĩa (16)
    • 2.1.2. i Phân i loại (17)
  • 2.2. i Hiện i tượng i tỉnh i lược i - i Elliptics (19)
    • 2.2.1. i Định i nghĩa (19)
    • 2.2.2. Phân i loại (19)
  • 3.1. i Danh i từ i và i cụm i danh i từ (20)
  • 3.2. i Động i từ i và i cụm i động i từ (22)
  • 3.3. i Các i loại i từ i khác (25)
  • 3.4. i Các i dạng i câu (28)
  • 4.1. i Hiện i tượng i đồng i tham i chiếu i trong i tiếng i Việt i và i hướng i tiếp i cận (0)
    • 4.1.1 i . i Np- i anaphora i (33)
    • 4.1.2. i “One” i anaphora (37)
    • 4.1.3. i VP- i anaphora (37)
    • 4.1.4. i S- i anaphora (0)
  • 4.2. i Hiện i tượng i tỉnh i lược i câu i và i hướng i tiếp i cận (38)
    • 4.2.1. i Tỉnh i lược i ngữ i pháp i - i Contextual i ellipsis i (0)
    • 4.2.2. i Hướng i tiếp i cận (40)
  • 4.3. i Tổng i hợp (41)
    • 4.3.1. Hướng i giải i quyết i mối i quan i hệ i chủ i ngữ i - i động i từ i - i bổ i ngữ (41)
    • 4.3.2. i Hướng i xây i dựng i cơ i sở i dữ i liệu i từ i điển i mới (42)
      • 4.3.2.1. i Nguyên i nhân (42)
      • 4.3.2.2. i Cấu i trúc i từ i điển i mới (0)
    • 4.3.3. Tổng i hợp i các i phương i pháp (48)
  • 5.1. i Giới i hạn i bài i toán (50)
  • 5.2. i Vị i trí i của i hệ i thống i trong i hệ i thống i hội i thoại i tổng i hợp (50)
  • 5.3. i Thiết i kế i các i usecase i chính (51)
    • 5.3.1. i Biểu i đồ i tuần i tự (51)
    • 5.3.2. Biểu i đồ i trạng i thái i máy (52)
  • 5.4. i Thiết i kế i các i gói i chương i trình (52)
    • 5.4.1. i Gói i truy i nhập i cơ i sở i dữ i liệu i – i XMLdataConnection (53)
    • 5.4.2. i Gói i Tiền i xử i lý i – i PrepareStructure (53)
    • 5.4.3. i Gói i phát i hiện i hiện i tượng i ngôn i ngữ i - i Discover (55)
    • 5.4.4. i Gói i xử i lý i các i hiện i tượng i ngôn i ngữ (57)
  • 5.5. i Thiết i kế i lớp (60)
  • 6.1. i Kiểm i thử (62)
    • 6.1.1. i Giao i diện i của i chương i trình (62)
    • 6.1.2. i Thử i nghiệm i và i kết i quả (63)
  • 6.2. Đánh i giá i kết i quả (65)
  • CHƯƠNG 7. KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN (0)
    • 7.1. i Nhận i xét i ưu i và i khuyết i điểm (67)
      • 7.1.1. i Ưu i điểm (67)
      • 7.1.2. Khuyết i điểm i và i tồn i tại (67)
    • 7.2. Hướng i phát i triển i cho i tương i lai (68)

Nội dung

i Đặt i vấn i đề

i i i i i i i i i i Trongi khoảngi bai mươii nămi gầni đây,i côngi nghệi thôngi tini đã,i đangi rấti quani tâmi nghiên i cứu i đên i lĩnh i vực i xử i lý i ngôn i ngữ i tự i nhiên i nhằm i đạt i được i mục i tiêu i làm i cho i máy i tính i có i thể i hiểu i và i trả i lời i như i con i người, i khiến i máy i tính i càng i ngày i càng i giống i người. i i i i i i i i i i Một i trong i những i hướng i nghiên i cứu i quan i trọng i trong i lĩnh i vực i xử i lý i ngôn i ngữ i tự i nhiên i là i hướng i xây i dựng i một i hệ i thống i hội i thoại i tự i động i giữa i người i và i máy i Tuy i vẫn i chưa i thể i làm i cho i máy i tính i có i thể i “giống i người” i nhưng i trong i những i năm i qua, i lĩnh i vực i này i đã i đạt i được i những i thành i công i bước i đầu i không i chỉ i với i Tiếng i Anh i mà i còn i với i cả i một i số i ngôn i ngữ i khác i nữa. i i i i i i i i i i Đểi máyi tínhi cói thểi hiểui ngôni ngữi tựi nhiên,i mộti phầni khôngi thểi thiếui đượci lài việci xửi lýi hiệni tượngi đồngi thami chiếui vài tỉnhi lượci trongi hộii thoại.i Vớii tiếngi Việt,i hiện i tượng i này i cũng i đã i bắt i đầu i được i quan i tâm i chú i ý i trong i những i năm i gần i đây, i hiện i tượng i đồng i tham i chiếu, i tỉnh i lược i đã i được i nghiên i cứu i một i cách i riêng i rẽ, i mặc i dù i vậy i một i nghiên i cứu i tổng i hợp i cả i hai i phương i diện i trên i vẫn i là i một i thiếu i sót i cần i được i bổ i sung.

i Mô i hình i tổng i quát

i i i i i i i i i i Tổng i quát i bài i toán i xử i lý i hiện i tượng i đồng i tham i chiếu i và i tỉnh i lược i trong i hội i thoại i gồm i 3 i bước i chính:

 Bước i 1 i : i Quá i trình i tiền i xử i lý i câu i Quá i trình i này i tách i câu i đầu i vào i thành i các i từ i loạii tươngi ứng.

 Bướci 2i :i Quái trìnhi phâni tíchi câu.i Đâyi lài quái trìnhi phứci tạpi vài quani trọngi nhấti nhằm i tìm i ra i hiện i tượng i ngôn i ngữ i xảy i ra i trong i câu i và i biện i pháp i xử i lý i phù i hợp.

 Bước i 3 i : i Quá i trình i thay i thế i Đây i là i quá i trình i thay i thế i câu i đầu i vào i thành i câu i đã i được i xử i lý i thay i thế i một i từ i hoặc i một i bộ i phân i câu i để i trở i thành i câu i hoàn i chỉnh, i rõ i nghĩa.

i Các i cách i tiếp i cận i trong i phân i giải i đồng i tham i chiếu i và i hiện i tượng i tỉnh i lược i trong i hội i thoại

i Các i cách i tiếp i cận i trên i thế i giới

i i i i i i i i i i Phâni giảii đồngi thami chiếui vài hiệni tượngi tỉnhi lượci khôngi phảii lài vấni đềi mớii mẻi trong i lĩnh i vực i xử i lý i ngôn i ngữ i tự i nhiên i Chúng i đã i được i quan i tâm i nghiên i cứu i từ i rất i sớm i mà i thuật i toán i kinh i điển i đầu i tiên i đưa i vào i cài i đặt i hiệu i quả i là i thuật i toán i Hobbs i do i nhà i khoa i học i Jerry i R i Hobbs i công i bố i vào i năm i 1976 i Kể i từ i đó i đến i nay, i nhiều i cách i tiếp i cận i mới i – i có i thể i mới i chỉ i là i một i ý i tưởng i mới i hoặc i đã i được i cài i đặt i thử i nghiệm i - i đã i được i nghiên i cứu i và i công i bố i không i chỉ i với i ngôn i ngữ i nghiên i cứu i là i tiếng i Anh i mà i còn i với i nhiều i ngôn i ngữ i khác i như i tiếng i Đức, i tiếng i Pháp, i tiếng i Nhật… i i i i i i i i i i Trong i số i những i cách i giải i quyết i vấn i đề i đó, i có i thể i nhắc i đến i các i phương i pháp i như i

Centering, i Entity-Base, i Contrants i … i Độ i chính i xác i của i các i thuật i toán i này i biến i động i tùyi vàoi từngi lĩnhi vựci dữi liệu,i nhìni chungi cói thểi đạti kếti quải chínhi xáci khoảngi 70i %i đếni 80%. i i i i i i i i i i Mặc i dù i vậy, i cho i đến i nay i việc i tìm i kiếm i một i giải i pháp i hoàn i chỉnh i cho i phân i giải i đồng i tham i chiếu i và i hiện i tượng i tỉnh i lược i vẫn i là i một i bài i toán i chưa i có i lời i giải i Các i cách i tiếp i cận i tuy i nhiều i nhưng i nhìn i chung i đều i chỉ i nhằm i vào i một i phân i vùng i rất i nhỏ i của i hiện i tượng i đồng i tham i chiếu i hoặc i tỉnh i lược i – i thường i chỉ i tập i trung i vào i một i trường i hợp i nhỏ i như i là i đồng i tham i chiếu i đại i từ, i đồng i tham i chiếu i động i từ i hoặc i các i trường i hợp i tỉnh i lược i cơ i bản i ,các i kết i quả i thử i nghiệm i hầu i hết i là i trên i các i bộ i dữ i liệu i từ i hướng i lĩnh i vực i (ví i dụ i như i thuật i toán i Entity-Base i đạt i độ i chính i xác i 85 i % i với i bộ i dữ i liệu i về i thiên i tai i , i hơn i 80 i % i đối i với i bộ i dữ i liệu i về i tai i nạn i )- i i mà i không i đưa i ra i cách i xử i lý i cho i bài i toán i tổng i quát.i i i i i i i i i i i i Hiệni nay,i cáci hướngi nghiêni cứui mớii trêni thếi giớii chủi yếui hướngi vềi tậpi trungi vào i một i phân i vùng i nhỏ i của i phân i giải i đồng i tham i chiếu i hoặc i hiện i tượng i tỉnh i lược i – i thường i là i đồng i tham i chiếu i đại i từ i - i trên i môi i trường i đa i giao i diện- i môi i trường i bao i gồm i cả i tiếng i nói, i hình i ảnh i

i Những i vấn i đề i còn i tồn i tại

i i i i i i i i i i Một i điều i khẳng i định, i các i thuật i toán i được i công i bố i và i chấp i nhận i hiện i nay i chỉ i giải i quyết i một i trường i hợp i nhỏ i của i phân i giải i đồng i tham i chiếu i hoặc i tỉnh i lược. i i i i i i i i i i Như i đã i nêu i ở i trên, i mặc i dù i các i cách i giải i quyết i cho i đề i tài i này i đã i được i nghiên i cứu i từ i những i năm i 70 i của i thế i kỷ i trước i nhưng i giải i pháp i cho i bài i toán i tổng i hợp i lại i thiếu i hụt i một i cách i đáng i ngạc i nhiên i Các i thuật i toán i cài i đặt i thành i công i chủ i yếu i là i các i thuật i toán i nghiên i cứu i cho i phân i giải i đồng i tham i chiếu i đại i từ, i các i thuật i toán i cho i các i trường i hợp i kháci rấti íti vài đội chínhi xáci cũngi khôngi cao.i Điềui nàyi cũngi dễi hiểui vìi ngôni ngữi tựi nhiêni cói cấui trúci vôi cùngi phứci tạpi vài đai dạngi vài hiệni tượngi đồngi thami chiếui đạii từi cũng i là i hiện i tượng i hay i gặp i nhất i trong i thực i tế i i i i i i i i i i Vì i thế, i hướng i nghiên i cứu i của i đồ i án i này i sẽ i không i nhằm i vào i việc i xử i lý i trên i môi i trường i đa i giao i diện i như i xu i hướng i hiện i nay i mà i nhằm i vào i việc i xây i dựng i một i chương i trình i có i thể i xử i lý i được i tổng i hợp i cả i phân i giải i đồng i tham i chiếu i và i tỉnh i lược i hay i gặp i cho i những i đoạn i hội i thoại i hàng i ngày i

i Phân i giải i đồng i tham i chiếu i và i hiện i tượng i tỉnh i lược i trong i hội i thoại i tiếng i Việt

Việt i i i i i i i i i Lĩnh i vực i xử i lý i ngôn i ngữ i tự i nhiên i cho i tiếng i Việt i cũng i là i lĩnh i vực i được i quan i tâm i nghiêni cứui củai cáci nhài khoai họci Việti Nam,i trongi đó,i đượci quani tâmi nhiềui nhấti lài bàii toáni phâni tíchi cúi pháp.i Cáci giảii phápi choi phâni giảii đồngi thami chiếui đượci côngi bối rộng i rãi i còn i rất i ít i Vì i vậy, i cũng i như i các i ngôn i ngữ i khác, i giải i pháp i cho i bài i toán i tổng i thể i cho i cả i hiện i tượng i đồng i tham i chiếu i và i tỉnh i lược i lại i càng i thiếu i hụt i nghiêm i trọng, i gần i như i không i có i i i i i i i i i i Dĩ i nhiên, i việc i xử i lý i tổng i quát i một i trường i hợp i nhỏ i của i hiện i tượng i đồng i tham i chiếu i và i tỉnh i lược i đã i khó, i tích i hợp i giải i quyết i tất i cả i các i trường i hợp i đó i còn i khó i hơn i Tuy i nhiên, i i trong i thực i tế, i một i hệ i thống i hội i thoại i tự i động i giới i hạn i người i dùng i chỉ i được i sử i dụng i một i phân i dạng i nhỏ i - i như i là i chỉ i được i sử i dụng i đồng i tham i chiếu i đại i từ i - i là i hệ i thống i không i thật i sự i thuyết i phục i Ngược i lại, i việc i giới i hạn i lĩnh i vực i của i hệ i thống i là i chấpi nhậni được,i víi dụi nhưi kháchi thami quani đếni việni bảoi tàngi thìi chỉi quani tâmi đếni tấti cải cáci thôngi tini liêni quani đếni việni bảoi tàng.i Vìi thế,i đồi áni nàyi cũngi đặti rai giớii hạni lài chương i trình i i hướng i lĩnh i vực i i i i i i i i i i i Đồ i án i sẽ i nghiên i cứu i trên i đối i tượng i ngôn i ngữ i là i tiếng i Việt, i có i sử i dụng i lại i chương i trình i tách i từ i của i thầy i Lê i Hồng i Phương i

i Những i khó i khăn i chính i của i bài i toán i phân i giải i đồng i tham i chiếu i và i tỉnh i lược i trong i hội i thoại i tiếng i Việt

i Ngữ i pháp i phức i tạp

i i i i i i i i i i Mặc i dù i có i nhiều i điểm i căn i bản i giống i với i ngữ i pháp i tiếng i Anh i – i ngôn i ngữ i tự i nhiên i được i nghiên i cứu i kỹ i càng, i tỉ i mỉ i nhất i – i nhưng i do i nhiều i yếu i tố i khác i nhau i như i lịch i sử i phát i triển i lâu i dài i cùng i với i sự i tiếp i thu i của i nhiều i nền i văn i hóa, i ngữ i pháp i tiếng i Việt i i có i nhiều i điểm i khác i biệt i khiến i cho i cấu i trúc i ngữ i pháp i vô i cùng i phong i phú i Việc i xây i dựngi mộti líi thuyếti ngữi phápi hoàni chỉnhi lài điềui chưai làmi được.i Sựi phứci tạpi củai ngữi phápi tiếngi Việti làmi choi việci phâni tíchi cấui trúci câu,i phâni loạii vài nhậni diệni câui trởi nên i vô i cùng i khó i khăn… i i i i i i i i i i i Bên i cạnh i đó i ngữ i pháp i tiếng i Việt i còn i có i hiện i tượng i đồng i âm, i đồng i nghĩa, i chuyển i nghĩa i của i từ i rất i phức i tạp i Ví i dụ: i từ i “phát i triển” i trong i 2 i cụm i từ i “phát i triển i đất i nước” i và i “đất i nước i phát i triển” i là i 2 i loại i từ i khác i nhau i “Phát i triển” i trong i cụm i từ i thứ i nhất i là i động i từ i tác i động i vào i danh i từ i “đất i nước” i trong i khi i “phát i triển” i trong i cụm i từ i thứ i hai i lại i là i tính i từ i bổ i nghĩa i cho i danh i từ i đất i nước.

Nhập i nhằng i trong i việc i tách i từ i và i phân i loại i từ

i i i i i i i i i i Đặc i điểm i Tiếng i Việt i là i ngôn i ngữ i đơn i âm i tiết, i điều i này i gây i nên i khó i khăn i ngay i từ i giaii đoạni táchi vài phâni loạii từi vựng.i Víi dụi nhưi câu:

 “Cụi /giài đi/i nhanh/i quá”

 “Cụ i già/đi/nhanh i /quá” i i i i i i i i i i i Mặc i dù i nội i dung i trung i tâm i của i đề i tài i không i nhằm i vào i vấn i đề i này i nhưng i giai i đoạn i tách i từ i chính i là i giai i đoạn i tiền i xử i lý i của i hệ i thống, i vì i thế i sự i đúng i đắn i của i nó i có i ảnh i hưởng i rất i lớn i đến i sự i đúng i đắn i của i cả i thuật i toán.

i Sự i nhập i nhằng i , i đa i nghĩa i của i đại i từ

i i i i i i i i i i Mộti trongi nhữngi vấni đềi phứci tạpi nhấti củai tiếngi Việti lài trongi Tiếngi Việti cói rấti nhiềui đạii từi xưngi hô.i i Cặpi xưngi hôi giữai 2i ngôii thứi nhấti vài thứi haii phổi biếni nhưi :i tới - ấy, i tớ i - i cậu, i tao i mày… i i i i i i i i i i Vấn i đề i rắc i rối i nằm i ở i chỗ, i tuỳ i vào i mối i quan i hệ i giữa i người i nói i với i nhau, i hoặc i giữa i người i nói i với i người i thứ i ba i mà i các i đại i từ i xưng i hô i này i khác i nhau i Ví i dụ:

 Mẹ i và i con i nói i chuyện i với i nhau i :

“Mẹ i bao i giờ i đi i làm i ?”

 Haii chịi emi nớii chuyệni vớii nhaui :

“Mẹ i đã i đi i làm i chưa i nhỉ?”

“Hình i như i đi i rồi” i i i i i i “Mẹ” i trong i hai i ví i dụ i trên i rõ i ràng i là i mang i ý i nghĩa i ngữ i pháp i khác i nhau i Để i xử i lý i vấn i đềi nàyi yêui cầui cói kiếni thứci xãi hộii sâui sắc,i điềui nàyi rấti khói thựci hiệni khii xâyi dựngi cáci thuậti toán.i Cáchi tiếpi cậni khải thii nhấti đói lài hướngi vàoi việci xâyi dựngi cáci hệi thốngi cụ i thể i hướng i lĩnh i vực i Ở i đây, i bằng i mặc i định, i đồ i án i nghiên i cứu i cho i hệ i thống i hội i thoại, i do i đó i ưu i tiên i xét i quan i hệ i xưng i hô i ngôi i thứ i nhất i và i ngôi i thứ i hai i giữa i người i và i máy i

i Mục i tiêu, i giới i hạn i và i hướng i tiếp i cận i của i đồ i án

i i i i i i i i i i Mục i tiêu i của i đồ i án i là i đưa i ra i được i phương i pháp i xử i lý i không i phải i chỉ i riêng i cho i từng i trường i hợp i đồng i tham i chiếu i hay i tỉnh i lược i riêng i lẻ i mà i là i đưa i ra i phương i pháp i giải i quyết i tổng i hợp i chung, i ít i nhất i là i cho i các i trường i hợp i hội i thoại i thông i dụng i nhất. i i i i i i i i i Do i sự i phức i tạp i của i ngữ i pháp i tiếng i Việt i – i ta i sẽ i đi i sâu i vào i phần i này i hơn i ở i phần i saui củai bảni báoi cáoi nàyi –i việci đưai rai thuậti toáni cói thểi giảii quyếti đúngi đắni choi tấti cải cáci trườngi hợpi vớii tỉi lệi chínhi xáci 100%i lài khôngi thể,i hơni nữai mụci tiêui củai đồi áni tậpi trung i vào i phần i hội i thoại i Không i có i một i thuật i toán i đơn i lẻ i nào i có i thể i xử i lý i đúng i đắn i toàn i bộ i các i hiện i tượng i ngữ i pháp i Vì i thế i để i nâng i cao i tỉ i lệ i chính i xác i cho i thuật i toán, i đồ i án i sẽ i sử i dụng i phương i pháp i tiếp i cận i là i chia i để i trị i với i hai i ý i tưởng i của i thuật i toán i Centering i và i Gapping, i tập i trung i vào i các i câu i thông i thường i trong i hội i thoại.

PHẦN i II i GIẢI i QUYẾT i VẤN i ĐỀ

CHƯƠNG i 2 i PHÂN i LOẠI i HIỆN i TƯỢNG i ĐỒNG i THAM i CHIẾU i VÀ i TỈNH i

i Hiện i tượng i đồng i tham i chiếu i – i Anaphora

Định i nghĩa

i i i i i i i i i i Hiệni tượngi đồngi thami chiếui lài hiệni tượngi sửi dụngi mộti từi đểi thayi thếi choi mộti từ,i mộti cụmi từ,i mộti phầni câui đãi đượci nhắci đếni trướci đó. i i i i i i i i i i i Xéti mộti víi dụi đơni giảni củai anaphora:

 Họa i sĩ i Tô i Ngọc i Vân i sống i ở i đâu?

 Ông i ấy i hiện i tại i đang i ở i thành i phố i Hồ i Chí i Minh i i i i i i i i i i i i Trong i ví i dụ i trên, i “Ông i ấy” i i chính i là i đại i từ i thay i thế i cho i “họa i sĩ i Tô i Ngọc i Vân” i

Vấn i đề i đặt i ra i là i làm i sao i để i hệ i thống i nhận i diện i được i “Ông i ấy” i chính i là i từ i thay i thế i cho i

“họai sĩi Tôi ngọci Vân”. i i i i i i i i i i Víi dụi trêni chỉi lài mộti trườngi hợpi thườngi thấyi củai mộti dạngi đồngi thami chiếui mài tai gặpi hàngi ngàyi trongi cuộci sống.i Xửi i lýi đồngi thami chiếui lài mộti vấni đềi cựci kỳi khói khăn, i nó i yêu i cầu i trang i bị i cho i máy i sự i hiểu i biết i về i cấu i trúc i ngữ i pháp, i cấu i trúc i ngữ i nghĩa i của i ngôn i ngữ i tự i nhiên, i thậm i chí i trong i những i trường i hợp i phức i tạp i nó i đòi i hỏi i cả i hiểu i biết i “thực” i trong i đời i sống i Mặc i dù i vấn i đề i này i được i nhận i diện i từ i khá i sớm i nhưng i một i giải i pháp i xử i lý i đồng i tham i chiếu i hoàn i chỉnh i vẫn i chưa i có i lời i giải i cuối i cùng i Các i giải i pháp i được i nghiên i cứu i trong i những i năm i 70, i 80 i của i thế i kỷ i trước i (điển i hình i là i Hobbs i 1976) i chỉ i tập i trung i vào i ngữ i pháp i của i câu i và i chỉ i giải i quyết i được i những i trường i hợp i không i có i sự i mập i mờ i về i ngữ i nghĩa i i i i i i Xéti trườngi hợpi saui :

 Johni lấyi cáii bánhi ởi trêni bàni vài ăni nó.

 John i lấy i cái i bánh i ở i trên i bàn i và i rửa i nó i i i i i i i Có i thể i thấy i ngay i rằng i mặc i dù i có i cùng i một i cấu i trúc i ngữ i pháp i nhưng i nếu i i “nó” i trong i câu i thứ i nhất i chỉ i đến i “cái i bánh” i thì i “nó” i trong i câu i thứ i hai i lại i chỉ i đến i “bàn”, i ta i có i thể i dễ i dàng i đặt i ra i ràng i buộc i cho i động i từ i “ăn” i là i sự i vật i đi i đằng i sau i phải i là i “ăn i được” i nhưng i ta i không i thể i đặt i ra i luật i là i đằng i sau i “rửa” i phải i là i vật i không i ăn i được i bởi i như i rau i quải hoàni toàni vừai “ăni được”i vừai “rửai được”. i i i i i i i i i Cáci nghiêni cứui nhữngi nămi gầni đâyi chủi yếui đii theoi hướngi kếti hợpi giữai phâni tíchi cú i pháp i và i các i thuật i toán i về i ngữ i nghĩa i cùng i i nhiều i cách i tiếp i cận i khác i nhau i tuỳ i từng i loại i đồng i tham i chiếu.

i Phân i loại

i i i i Về i mặt i hình i thức, i đồng i tham i chiếu i tồn i tại i dưới i hai i dạng: i

 Từ i được i thay i thế i và i từ i thay i thế i nằm i cùng i trong i một i câu i (intra-sententially)

 Từ i được i thay i thế i và i từ i thay i thế i nằm i trong i nhiều i câu i (inter- i sententially i )

Cáci dạngi đồngi thami chiếui thườngi gặpi trongi Tiếngi Việti cói :

 “one”i anaphora a i NP i anaphora i i i i i i i i i i i NP i – i anaphora i là i từ i dùng i để i chỉ i trường i hợp i một i từ i thay i thế i cho i một i danh i từ i hoặc i cụm i danh i từ i đã i nêu i trước i nó. i i i i i i i i i i i Các i đại i từ i thay i thế, i bao i gồm i tất i cả i các i dạng i như i anh i ta i (he, i his, i him), i cô i ta i (she, i her, i hers), i chúng i nó i (they, i them)… i là i dạng i phổ i biến i nhất i của i NP i anaphora i

Dạng i này i có i thể i xảy i ra i ở i cả i hai i hình i thức i ở i hai i câu i kahcs i nhau( i intra-) i và i trong i cùng i một i câu i (inter-sententially) i Ví i dụ:

 John i cho i Mary i mượn i quyển i sách i - i quyển i sách i cô i ấy i đã i đánh i mất i i (intra-)

 Johni choi Maryi mượni quyểni sách.i Côi ấyi đánhi mấti nói trêni đườngi vềi nhài

(inter-) i i i i i i i i i i Sự i thay i thế i không i nhất i thiết i phải i là i trực i tiếp i mà i có i thể i xảy i ra i gián i tiếp i như:

 Tất i cả i các i ngôi i nhà i i trên i phố i cần i sửa i lại i mái(ở i đây i “mái” i có i sự i liên i quan i ngầm i với i “tất i cả i các i ngôi i nhà”).

 Ross i sử i dụng i thẻ i tín i dụng i nhiều i đến i nỗi i anh i chàng i tội i nghiệp i đó i phải i tuyên i bố i phá i sản. b i VP-anaphora i i và i S-anaphora i i i i i i i i i i Đồngi thami chiếui khôngi phảii luôni luôni chỉi thayi thếi choi choi mộti cụmi danhi từi mài nhiềui lúci nói lạii cói vaii tròi thayi thếi choi hẳni mộti cụmi độngi từi hoặci thậmi chíi lài thayi thếi cho i cả i một i câu. i i i i i i i i i i VP- i anaphora i là i trường i hợp i từ i không i thay i thế i cho i một i từ i hoặc i cụm i danh i từ i phía i trước i mà i thay i thế i cho i một i cụm i động i từ i đã i nói i đến i ở i phía i trước i Xét i ví i dụ i sau:

 Tuần i tới i Lan i thi i học i kỳ i à i ?

Trongi víi dụi trêni i “thế”i lài từi thayi thếi choi cụmi độngi từi “thii họci kỳ”. i i i i i i i i i i i Tươngi tự,i S-anaphorai lài trườngi hợpi mài mộti từi thayi thếi choi hẳni mộti câui đãi nêui ở i phía i trước i S i – i anaphora i được i minh i họa i thông i qua i ví i dụ i sau:

 Mary i đã i mở i được i một i phòng i triển i lãm i tranh i i Đó i là i một i điều i ngạc i nhiên. i c i “One” i anaphora. i i i i i i i i i Một i dạng i đồng i tham i chiếu i nữa i không i thể i không i kể i trong i đến i là i đồng i tham i chiếu i số i từ i “one”- i anaphora i Đây i là i dạng i đồng i tham i chiếu i mà i ở i đó, i số i từ i được i thay i thế i cho i một i danh i từ i (thường i là i một i vật) i đứng i trước i nó. i i i i i i i i i Xéti víi dụi mộti câui hộii thoạii sau:

 Cải haii bứci tranhi nàyi lài củai cậui à?

 Không, i chỉ i một i bức i thôi i

i Hiện i tượng i tỉnh i lược i - i Elliptics

i Định i nghĩa

i i i i i i i i i Hiệni tượngi tỉnhi lượci lài hiệni tượngi lượci bỏi mộti hayi nhiềui từi trongi cấui trúci ngữi phápi khii nghĩai củai câui đói cói thểi hiểui đượci mài khôngi cầni đếni nhữngi phầni đãi đượci lược i bỏ i đó. i i i i i i i i i Cũng i như i hiện i tượng i đồng i tham i chiếu, i hiện i tượng i tỉnh i lược i cũng i là i hiện i tượng i phổ i biến i trong i ngôn i ngữ i tự i nhiên i Về i mặt i ngôn i ngữ, i ta i nhận i diện i một i câu i tỉnh i lược i mà i một i phần i nghĩa i câu i cần i được i tổ i chức i lại i dựa i vào i ngữ i cảnh i của i câu i nói i Ngữ i cảnh i đó i thường i là i một i tiền i ngữ i (antecedent), i một i mệnh i đề i ở i trong i câu i nói i trước i tương i ứng i với i phần i đã i bị i lược i bỏ i trong i câu i tỉnh i lược.

Phân i loại

i i i i i VP i - i anaphora i i có i thể i coi i là i một i dạng i đặc i biệt i của i câu i tỉnh i lược.Trong i hội i thoại, i hai i loạii câui tỉnhi lượci thườngi gặpi nhấti là:

 Contextuali ellipsisi :i phầni lượci bỏi củai câui cói thểi đượci khôii phụci lạii dựai vàoi ngay i câu i phía i trước, i thường i phần i lược i bỏ i đó i là i sự i lặp i lại i của i một i từ i hoặc i một i cụm i từ i đứng i trước.

 Pragmatic i ellipsis i : i phần i lược i bỏ i của i câu i được i khôi i phục i nhờ i người i nghe i dựa i trên i tình i huống i ngoài i lĩnh i vực i ngôn i ngữ i Ví i dụ: i Cả i hai i hành i khách i nhìn i thấy i một i người i đàn i ông i lạ i mặt i “Say” i – i Một i người i nói i Câu i đầy i đủ i phải i là i “ông i ta i say i rồi” i i i i i i i i i i i Vìi hệi thốngi tai xâyi dựngi lài hệi thốngi hộii thoạii giữai ngườii vài máyi nêni chúngi tai sẽi chỉi tậpi trungi vàoi contextuali ellipsis. i i i i i i i i i Việci phâni loạii giữai hiệni tượngi tỉnhi lượci vài hiệni tượngi đồngi thami chiếui chỉi mangi ý i nghĩa i tượng i trưng, i bởi i thực i tế i các i VP i anaphora i , i S i anaphora i và i “one i anaphora” i có i thể i coi i là i một i trường i hợp i của i tỉnh i lược i câu.

CHƯƠNG i 3 i i SƠ i LƯỢC i CẤU i TRÚC i TIẾNG i VIỆT

i Danh i từ i và i cụm i danh i từ

Danh i từ i riêng i là i những i danh i từ i chỉ i tên i riêng i hay i tên i địa i điểm.

Danhi từi riêngi cói cấui tạoi nhưi sau:

 Chỉi cói mộti từi têni riêng:i Thúyi Anh,i Việti

 Gồm i từ i chỉ i họ i và i từ i tên i riêng: i Bùi i Thúy i Anh, i Nguyễn i Việt

 Tên i địa i danh i theo i khu i vực i hành i chính, i hoặc i địa i lý: i Hà i Nội, i Huế

 Têni núi,i têni sông,i têni đất :i (sông)i Hồng,i (trường)i Đạii Họci Báchi Khoai Hài

Danh i từ i là i từ i loại i bao i gồm i những i từ i có i ý i nghĩa i khái i quát i sự i vật i Đó i là i những i thực i từ i chỉ i vật i thể-người, i động i vật, i thực i vật, i đồ i vật, i những i hiện i tượng i tự i nhiên, i hiện i tượng i xã i hội i và i những i khái i niệm i trừu i tượng i được i con i người i nhận i thức i và i phản i ánh i như i các i vật i thể i tồn i tại i trong i hiện i thực.

 Danhi từi chỉi vậti thể:i ông,i bà,i thầyi giáo,i côngi nhân,i gà,i cam,i đèn,i áo

 Danh i từ i chỉ i hiện i tượng i tự i nhiên: i mưa, i bão, i sét, i ngày, i đêm

 Danh i từ i chỉ i hiện i tượng i xã i hội: i làng, i xã, i đội, i đoàn

 Danh i từ i chỉ i khái i niệm i trừu i tượng: i chính i trị, i đường i lối, i đạo i đức

 Danh i từ i đơn i thể i :gồm i các i danh i từ i chỉ i sự i vật i rời i rạc: i quần, i áo, i bạn i Những i danh i từ i này i phải i kết i hợp i với i danh i từ i danh i từ i đơn i vị: i chiếc i quần, i manh i áo, i ông i bạn

 Danhi từi tổngi thểi :i gồmi cáci danhi từi cói cấui tạoi ghépi 2i tiếng:i quầni áo,i binhi lính,i bạn i bè, i máy i móc i Danh i từ i tổng i thể i không i kết i hợp i với i danh i từ i đơn i vị i đơn i thể i mà i kết i hợp i với i danh i từ i đơn i vị i hợp i thể: i bộ i quần i áo, i nhóm i binh i lính, i lũ i bạn i bè

 Danh i từ i trừu i tượng i : i gồm i các i danh i từ i thể i hiện i về i tư i tưởng, i thái i độ, i quan i điểm, i lập i trường, i ý i nghĩ, i trí i tuệ

 Danh i từ i đơn i vị i đo i lường i : i gồm i các i danh i từ i làm i phụ i tố i cho i các i danh i từ i chất i liệu,i vậti liệu,i đơni vịi thờii gian,i đơni vịi tổi chức:i líti rượu,i nắmi muối,i mẫui đất,i phúti suyi nghĩa,i tổi côngi nhân

 … c i Cụm i danh i từ. i i i i i i i i i Cụm i danh i từ i là i cụm i từ i có i danh i từ i làm i thành i tố i trung i tâm i Cụm i danh i từ i biểu i thị i sự i vật i nêu i ở i thành i tố i trung i tâm i với i những i đặc i điểm i cụ i thể, i riêng i biệt i Trong i câu, i cụm i danh i từ i có i thể i giữ i các i chức i năng i ngữ i pháp i của i danh i từ: i làm i chủ i ngữ, i làm i vị i ngữ Cấu i trúc i cơ i bản:

Phần i phụ i trước Danhi từ Phần i phụ i sau

Phần i phụ i trước: i i i i i i i i i Phầni nàyi cói tốii đai bai thànhi phần:i i i i i i i i i i Víi dụ:i tấti cải nhữngi chiếci kẹo i i i i i i i i i Ở i vị i trí i 3 i là i số i từ i mang i nghĩa i tổng i thể i như i tất i cả, i hết i thảy i tiếp i theo i là i số i từ i và i loại i từ.

Có i cấu i tạo i phức i tạp i hơn i phần i phụ i trước i nhiều i Nó i có i thể i là i danh i từ, i cụm i tính i từ, i cụm i động i từ, i cụm i giới i từ

 Cụmi danhi từi đơni giảni (phầni phụi saui khôngi phảii lài cụmi giớii từ,i cụmi độngi từi hay i mệnh i đề i phụ).

Ví i dụ: i cái i hộp i màu i tím.

 Cụm i danh i từ i phức i tạp i với i phần i phụ i sau i là i cụm i giới i từ: i

Ví i dụ: i i bức i ảnh i của i cơ i quan

 Cụm i danh i từ i phức i tạp i với i phần i phụ i sau i là i mệnh i đề i phụ

Víi dụ:i bứci ảnhi mài tôii mớii muai hômi qua.

Mộti cụmi danhi từi cói thểi thiếui phầni phụi trướci hayi phầni phụi saui nhưngi khôngi thể i thiếu i phần i trung i tâm.

i Động i từ i và i cụm i động i từ

Kí i hiệu i là i V. Động i từ i là i những i từ i có i ý i nghĩa i khái i quát i chỉ i hành i động, i trạng i thái i hoặc i chỉ i tình i thái i hay i quan i hệ, i nói i chung i là i những i dạng i thức i vận i động, i biến i chuyển i của i sự i vật i về i mặt i lí, i tâm i lí i hay i sinh i lí

Ví i dụ: i đi, i gặt, i học, i nói, i lao i động, i suy i nghĩ

 Độngi từi ngoạii độngi (Vt):i gồmi cáci độngi từi chỉi hànhi độngi cói đốii tượng:i ăni bánh, i viết i thư, i là i quần i áo, i xây i dựng i nhà

 Động i từ i nội i động i (Vi): i gồm i các i động i từ i chỉ i hành i động i nhưng i không i có i đối i tượng: i ngủ, i ăn, i nói, i làm i việc

 Động i từ i tồn i tại i (Ve): i gồm i các i động i từ i chỉ i trạng i thái i tồn i tại i của i thực i thể/tính i chất i Cần i có i phụ i tố i để i chỉ i sự i tồn i tại: i có/còn/hết/mất tiền/máy/ngon

 Động i từ i biến i hóa i (Vf): i i gồm i các i động i từ i chỉ i sự i biến i hóa i của i thực i thể/tính i chất i Cần i có i phụ i tố i đi i kèm i chỉ i kết i quá i biến i hóa: i người i hóa i (thành) i ma, i nên/thành i người,i trởi thànhi tốt

 Độngi từi tiếpi thụi (Va):i gồmi cáci độngi từi chỉi trạngi tháii tiếpi thụ.i Cầni cói phụi tốti đi i kèm: i bị/phải/được/chịu i mắng/khen/làm

 Động i từ i tình i thái i (Vv): i gồm i các i động i từ i chỉ i trạng i thái i ý i chí i Cần i có i phụ i tố i đi i kèm: i muốn/dám/quyết/toan nói/làm/nghỉ i ngơi

 Động i từ i so i sánh i (Vc): i gồm i các i động i từ i dùng i để i so i sánh/đánh i giá i giữa i các i sự i vật i Cần i có i phụ i tốt i đi i kèm: i bằng/kém/hơn bạn/người

 Độngi từi tổngi hợpi (Vg):i gồmi cáci độngi từi còni lạii ngoạii trừi độngi từi “là”:i muai bán,i đánhi đập i i i i i i i i i i Các i động i từ, i tùy i thuộc i vào i từng i nhóm i có i những i ràng i buộc i vào i chủ i ngữ, i bổ i ngữ… i khác i nhau i mà i khi i xử i lý i các i hiện i tượng i đồng i tham i chiếu i và i tỉnh i lược i đặc i thù i không i thể i không i xem i xét i đến i Chúng i ta i sẽ i làm i rõ i vấn i đề i này i ở i phần i sau i của i đồ i án. b i Động i từ i “là”. i i i i i i i i i i Đây i là i động i từ i có i vai i trò i và i đặc i thù i riêng i biệt i trong i ngữ i pháp i tiếng i Việt, i cần i phân i tích i xử i lý i khác i biệt i so i với i các i động i từ i khác, i nó i tương i đương i động i từ i “to i be” i trong i tiếng i Anh. c i Cụm i động i từ.

Cụmi độngi từi lài cụmi từi cói độngi từi làmi thànhi tối trungi tâm.i Cụmi độngi từi biểui thịi ýi nghĩa,i hànhi động,i trạngi thái,i tínhi thái i nêui ởi độngi từi trungi tâm.i Chứci năngi cúi pháp i của i cụm i động i từ i trong i câu i là i chức i năng i cú i pháp i của i động i từ i chính.

Ví i dụ: i bay i ngang i qua i bầu i trời, i đang i ăn i cơm

Phần i phụ i trước Động i từ Phần i phụ i sau

Là i các i phó i từ i Ký i hiệu i là i R i Ví i dụ: i hãy i nhìn i vào, i đừng i nhảy, i đang i ăn i cơm đangi ăni cơm (VPi (Ri đang) i (V i ăn) i (N i cơm))

Phần i phụ i sau: i Động i từ i trung i tâm i có i thể i kết i hợp i với i các i từ i loại i khác i một i cách i đa i dạng i Mỗi i cách i kết i hợp i có i thể i coi i như i một i mẫu i cú i pháp i của i động i từ: i động i từ i đi i với i danh i từ, i động i từ i đi i với i cụm i giới i từ

 Phần i phụ i sau i là i cụm i danh i từ ăni cơm (VP i (V i ăn) i (NP i cơm))

 Phần i phụ i sau i là i cụm i giới i từ Đưa i cho i tôi (VP i (V i đưa) i (PP i cho i tôi))

 Phầni phụi saui lài haii cụmi danhi từ tặng i bạn i món i quà i sinh i nhật (VP i (V i tặng) i (NP i bạn) i (NP i món i quà i sinh i nhật))

 Phần i phụ i sau i là i cụm i động i từ cầni viếti thư (VPi (Vi cần) i (VP i viết i thư))

 Phần i phụ i sau i là i cụm i danh i từ i và i cụm i động i từ nhờ i bạn i chép i bàn (VP i (V i nhờ) i (NP i bạn) i (VP i chép i bài))

 Phầni phụi saui lài mệnhi đềi phụ nghĩ i rằng i cô i ấy i ốm (VP i (V i nói) i (SBAR i rằng i cô i ấy i ốm)).

i Các i loại i từ i khác

a i Đại i từ i và i sự i nhập i nhằng i của i đại i từ i trong i tiếng i Việt.

Kí i hiệu i là i P. Đại i từ i là i những i từ i dùng i để i xưng i hô, i thay i thế i và i chỉ i trỏ i Đại i từ i không i phải i là i từ i loạii dùngi đểi biểui thịi kháii niệmi sựi vật,i hiệni tượngi hayi hànhi động,i trạngi thái,i tínhi chấti mài lài từi loạii dùngi thayi thếi vài đểi chỉi trỏi nhữngi từi đãi đượci nêui trongi nhữngi từi ngữi đói hoặci đãi đượci xáci địnhi trongi hoàni cảnhi nói,i viếti cụi thể.

Ví i dụ: i i tôi, i tao, i nó, i đây, i kia

 Đại i từ i xưng i hô i (Pp): i gồm i các i đại i từ i thay i thế i cho i danh i từ i chỉ i người i trong i xưng i hô i Đại i từ i xưng i hô i cũng i phân i biệt i theo i ngôi i và i theo i số i giống i như i các i tiếng i khác i nhưng i không i có i sự i biến i hình i từ i giống i như i các i ngôn i ngữ i Anh, i Pháp i

Ngoài i ra i nó i còn i có i đặc i điểm i riêng i đó i là i phụ i thuộc i vào i sắc i thái i biểu i cảm i trong i quan i hệ i giữa i người i nói i và i người i nghe.

 Đạii từi chỉi địnhi (Pd):i gồmi cáci đạii từi dùngi đểi thayi thếi vài chỉi trỏi đốii tượngi khôngi gian,i thờii gian:i đây,i đó,i kia,i ấy,i nay,i bấyi giờ

 Đại i từ i số i lượng i (Pn): i gồm i các i đại i từ i chỉ i số i lượng: i bấy, i bấy i nhiêu, i tất i cả

 Đại i từ i nghi i vấn i (Pi): i gồm i các i đại i từ i để i hỏi i về i người/vật/không i gian/thời i gian/số i lượng/hoạt i động/tính i chất: i ai/gì/đâu/bao i giờ/ i bao i nhiêu, i mấy/sao/ i thế i nào

 Đại i từ i hoạt i động, i tính i chất i (Pl): i gồm i các i đại i từ i chỉ i hoạt i động, i tính i chất: i thế, i vậy,i sao i i i i i i i i i i Cũngi nhưi danhi từi vài độngi từ,i đạii từi cói vaii tròi rấti quani trọngi trongi cấui trúci ngữi pháp i của i những i câu i tỉnh i lược i và i tham i chiếu i Trong i các i loại i đại i từ, i quan i trọng i nhất i đó i là i đại i từ i xưng i hô i ( i đại i từ i nhân i xưng), i nhưng i đây i cũng i lại i là i loại i đại i từ i phức i tạp i và i dễ i nhập i nhằng i nhất i trong i tiếng i Việt. i i i i i i i i i i Khác i với i các i ngôn i ngữ i khác i như i tiếng i Anh, i tiếng i Pháp…do i đặc i điểm i ngôi i nhân i xưng i phức i tạp i của i Tiếng i Việt i mà i các i đại i từ i cũng i phong i phú i và i phức i tạp i hơn i nhiều i

 Ngôi i thứ i nhất i : i tôi, i tớ, i mình, i tao…

 Ngôii thứi haii i i :i cậu,i ấy,i mày,i chúi mày…

 Ngôi i thứ i ba i i i i i : i cô i ấy, i anh i ấy, i cô i ta, i anh i ta, i họ…

 Và i một i loạt i các i đại i từ i chỉ i quan i hệ i trong i gia i đình i như i cậu, i mợ… i i i i i i i i i i Nhưng i vấn i đề i không i chỉ i dừng i lại i ở i đó, i vấn i đề i còn i nằm i ở i sự i đồng i âm i giữa i các i đại i từ i như i cô( i she) i và i cô(aunt), i chú/ i chú i mày i (uncle) i và i (you)…Đòi i hỏi i phải i đưa i ra i các i luật i rằng i buộc i đặc i biệt i tuỳ i tình i huống i và i ứng i dụng i để i xử i lý i nếu i cần i thiết. i i i i i i i i i i Đạii từi “nó”i trongi Tiếngi Việti cói vaii tròi khái đặci biệti bởii nói cói khải năngi thayi thếi choi ngôii thứi bai củai cải ngườii vài vật,i cải sinhi vậti sốngi vài bấti độngi vật.i i i i i i Ví i dụ: i

 Con i mèo i nhà i Tý i lúc i nào i cũng i thấy i nằm i ngủ i ở i sân, i bọn i trẻ i quậy i thế i mà i nó i cũng i chẳng i động i đậy i tý i nào.

 Không i biết i có i chuyện i gì i xảy i ra i với i Lan i mà i bạn i bè i nói i thế i nào i mặt i nó i cứ i buồn i rười i rượi. i i i i i i i i i Nhìni chung,i việci đặti hạni chếi củai đạii từi nàyi phảii tuỳi thuộci vàoi văni cảnhi b.i Phói từ.

Phó i từ i là i những i hư i từ i chuyên i dùng i để i bổ i sung i các i ý i nghĩa i ngữ i pháp i cho i động i từ, i tính i từ i Đó i là i các i ý i nghĩa i thời-thể, i các i ý i nghĩa i về i quan i hệ i giữa i hành i động, i trạng i thái, i tính i chất i với i thực i tại i và i các i ý i nghĩa i về i cách i thức i nhận i thức i và i phản i ánh i những i quan i hệ i đó i Chức i năng i ngữ i pháp i của i phó i từ i là i làm i thành i phần i phụ i và i dấu i hiệu i ngữ i pháp i cho i các i thành i phần i câu.

Ví i dụ: i đã, i từng, i mới, i ắt, i không, i chẳng, i chưa

 Phói từi chỉi hướngi (Vd):i baoi gồmi cáci phói từi chỉi hoạti độngi cói baoi hàmi phươngi hướng: i khách i đi i vào i (nhà), i máy i bay i hạ i cánh i xuống i (sân i bay), i chạy i vào, i sản i xuất i ra

 Phó i từ i thời i gian i (Rt): i bao i gồm i các i phó i từ i chỉ i quan i hệ i về i thời i gian i của i hành i động, i trạng i thái, i tính i chất i được i xác i định i theo i một i điểm i mốc i tương i ứng i với i thời i điểm i thực i tại i hoặc i thời i điểm i phản i ánh, i miêu i tả: i đã, i đang, i sẽ, i từng, i mới, i liền

 Phó i từ i mức i độ i (Rd): i bao i gồm i các i phó i từ i chỉ i mức i độ i cho i các i tính i từ i chỉ i tính i chấti hayi độngi từi ngoạii động:i rấti xinh/rấti yêui (tôi),i hơii mệt,i quái đẹp,i xinhi lắm

 Phó i từ i so i sánh i (Rc): i bao i gồm i các i phó i từ i để i so i sánh i hoạt i động/trạng i thái/tính i chất i của i các i thực i thể: i cũng, i đều, i không i ngừng

 Phó i từ i khẳng i định i (RfY): i bao i gồm i các i phó i từ i chỉ i ý i khẳng i định: i ắt, i có

 Phó i từ i phủ i định i (RfN): i bao i gồm i các i phó i từ i chỉ i ý i phủ i định: i không, i chưa, i chẳng

 Phói từi mệnhi lệnhi (Ri):i baoi gồmi cáci phói từi chỉi ýi cầui khiến:i hãy,i đừng,i chới,i đi,i thôi,nào

 Phó i từ i kết i quả i (D): i bao i gồm i các i phó i từ i chỉ i hoạt i động, i bao i gồm i nghĩa i kết i quả: i (nghĩ) i ra, i (tìm) i được, i (rơi) i mất c.i Cáci dạngi từi còni lại. i i i i i i i i Ngoàii cáci dạngi từi đãi nêui ởi trên,i tiếngi Việti còni cói nhiềui dạngi từi kháci nhưi cụmi tính i từ, i số i từ, i trợ i từ, i cảm i từ, i số i từ… i Do i chúng i đóng i vai i trò i không i quan i trọng i lắm i trong i việc i xử i lý i hiện i tượng i đồng i tham i chiếu i nên i tôi i sẽ i lược i qua i phần i này.

i Các i dạng i câu

i i i i i i i i i i Trong i các i tài i liệu i nghiên i cứu, i các i sách i giáo i khoa i về i ngôn i ngữ i và i tiếng i Việt, i đã i có i rất i nhiều i định i nghĩa i về i câu i Có i thể i rút i ra i một i số i i điểm i chung i sau:

 Câu i là i một i sản i phẩm i của i hoạt i động i giao i tiếp i bằng i ngôn i ngữ i Về i phương i diện i ngữi pháp,i câui lài lõii củai pháti ngôn,i lài đơni vịi nhỏi nhấti củai cấui tạoi văni bản.

 Câui đượci cấui tạoi theoi quyi tắci cúi pháp.i Cấui tạoi cúi phápi củai câui ứngi vớii mộti ngữi điệui thểi hiệni khii pháti ngôni hayi kếti thúci câu,i vài lài cơi sởi xáci địnhi kiểui loạii câu.

 Những i đặc i điểm i của i câu i thể i hiện i ở i mặt i nội i dung i ý i nghĩa, i mặt i hình i thức i cấu i tạo, i mặt i chức i năng i và i mục i đích i sử i dụng i câu i trong i giao i tiếp i (trong i văn i bản). Dưới i đây i là i cách i phân i loại i câu i đơn i giản i và i dễ i hiểu i nhất a i i Câu i trần i thuật

Câu i trần i thuật i là i kiểu i câu i dùng i để i miêu i tả, i nhận i định i về i một i sự i kiện, i một i hiện i tượng.

Xe i chúng i tôi i leo i chênh i vênh i trên i dốc i cao i của i con i đường i xuyên i tỉnh i Hoàng i Liên i Sơn i Những i đám i mây i trắng i nhỏ i sà i xuống i cửa i kính i ô i tô i tạo i nên i cảm i giác i bồng i bềnh, i huyền i ảo i Chúng i tôi i đang i đi i trên i những i thác i trắng i xóa i tựa i mây i trời, i những i rừng i cây i âm i âm, i những i bông i hoa i chuối i rực i lên i như i ánh i lửa (Ngữ i pháp i tiếng i Việt- Diệp i Quang i Ban)

Tất i cả i các i kiểu i câu i tiếng i Việt i (câu i đơn, i câu i ghép) i đều i có i thể i dùng i câu i trần i thuật i Theo i quan i điểm i coi i cấu i trúc i chủ-vị i là i cấu i trúc i cơ i bản i của i câu i tiếng i Việt, i cấu i trúc i một i câu i trần i thuật i gồm i có i chủ i ngữ i và i vị i ngữ i Chủ i ngữ i thường i là i cụm i danh i từ, i vị i ngữ i là i cụm i động i từ i hoặc i cụm i tính i từ i Xét i trong i các i kiểu i câu i thì i kiểu i câu i trần i thuật i tương i đối i thuần i nhất i so i với i các i kiểu i câu i khác.

Mộti sối trườngi hợpi đặci biệt:

 Chủi ngữi lài cụmi độngi từ:i Dậyi đúngi giời rấti khó.

 Vị i ngữ i là i cụm i danh i từ: i Em i bé i 7 i tuổi.

 Động i từ i có i đứng i đầu: i Có i con i chuột i trong i góc i nhà. b i Câu i nghi i vấn

Lài kiểui câui nêui nộii dungi hoàii nghii đểi đượci giảii đápi nộii dungi đói bằngi mộti câui trải lời.i Víi dụ:i Emi họci lớpi mấy?i Aii vẽi tranhi này?

Câui hỏii đượci chiai thànhi haii loạii lớn:

• Hỏi i có i dự i kiến i chọn i lựa i để i trả i lời i Trong i loại i này i còn i có i thể i chia i thành i mấy i kiểu i nhỏ:

 Chọn i lựa i xác i định i mang i tính i chất i khẳng i định i hay i phủ i định

 Chọn i lựa i không i xác i định, i tức i là i chọn i từ i hàng i loạt i khả i năng i khác i nhau i i i i i i i i i i Thựci chấti việci phâni chiai nàyi lài dựai vàoi “cáii khôngi rõ”i nằmi ởi thànhi phầni nàoi củai câui hỏii tươngi ứngi vớii câui trải lời.i Câui nghii vấni trongi tiếngi Việti đượci cấui tạoi nhời các i phương i tiện i sau i đây i : i

 Các i đại i từ i nghi i vấn: i ai, i gì, i nào, i thế i nào, i sao, i bao i nhiêu, i mấy, i bao i giờ, i bao i lâu, i đâu… i Câu i nghi i vấn i dùng i đại i từ i nghi i vấn i được i dùng i để i hỏi i vào i những i điểm i xác i định i trong i câu i điểm i hỏi i là i điểm i chứa i đại i từ i nghi i vấn i Do i đó i ngay i cả i khi i câu i bị i tách i khỏi i tình i huống i nói i và i ngữ i cảnh i cũng i có i thể i nhận i biết i được i điểm i hỏi i Có i thể i gọi i đây i là i câu i nghi i vấn i rõ i trọng i điểm.

 Cái i này i là i cái i gì?

 i i i i i = i i < i động i từ i “là”> i i ?

 i i i i i =i i i

 i i i i i = i i i ?

 Kết i từ i “ i hay”: i Câu i nghi i vấn i có i kết i từ i hay i dùng i để i hỏi i có i hạn i chế i trong i khả i năng i trả i lời i một i trong i những i đề i nghị i được i đưa i ra i Vì i vậy i kiểu i câu i nghi i vấn i này i còn i được i gọi i là i câu i nghi i vấn i lựa i chọn i

 i =i i hayi i ?

 Các i phụ i từ i nghi i vấn: i i i i i i i i i i i Một i số i cấu i trúc i thường i gặp: i i i i 1 i có i i không?

 Anh i có i tìm i được i cây i bút i không?

 Cói quyểni sáchi nàoi trongi ngăni kéoi không?

i = i i (có*) i i không i ? i i = i (có*) i i không? (vd, i đi i không?)

i = i Có i i i i không i ? i i i i i 2 i có i phải i i không?

 Có i phải i anh i này i không?

 Cói phảii emi vẽi tranhi nàyi không?

i = i Có i phải i i i không i ?

i = i Có i phải i i không i ?

 Anh i hai i đã i đi i chưa?

 Coni đãi làmi bàii tậpi chưa?

i = i i đã i i chưa i ?

4 i i xong i ( i rồi, i xong i rồi) i chưa?

 Anh i làm i xong i bài i tập i chưa?

i =i i i chưa/xongi chưai ?

 Cáci tiểui từi chuyêni dụng:i câui nghii vấni cói tiểui từi chuyêni dụngi nếui khôngi đượci dùngi kèmi vóii cáci phươngi tiệni kháci thìi điểmi hỏii trongi câui sẽi rấti mơi hồ.i Cói thểi gọi i đây i là i kiểu i câu i nghi i vấn i không i rõ i trọng i điểm i Một i số i tiểu i từ i chuyên i dụng i là i à, i đấy i à, i nhỉ, i ư, i hả, i hở, i hử, i chăng, i không, i sao, i

i = i i i i i i i i i i i i i Những i động i từ, i tính i từ i thường i có i bổ i ngữ i là i câu i hỏi i là:

• Những i động i từ i có i ý i nghĩa i hỏi i han: i hỏi, i đòi, i nhắn, i yêu i cầu, i điều i tra, i thăm i viếng, i nói, i v.v

• Nhữngi độngi từi cói ýi nghĩai thôngi báo:i báo,i nghe,i thấy,i thuyếti minh,i trìnhi bày…

• Nhữngi độngi từi cói ýi nghĩai trạngi tháii tinhi thầni hoặci quái trìnhi nhậni thức:i quyếti tâm,i nhậni được,i gặpi gỡ,i tuâni thủ,i hiểui rõ…

• Những i tính i từ: i chắc i chắn, i thích i hợp, i quan i trọng, i để i ý, i quan i tâm… c i i Câu i cầu i khiến

Câu i cầu i khiến i có i cấu i tạo i giống i câu i trần i thuật i nhưng i lại i không i được i dùng i để i miêu i tả, i nhận i định i như i câu i trần i thuật i Câu i cầu i khiến i nhằm i đòi i hỏi i thực i hiện i một i hành i động, i một i chuyển i biến i

Cấu i trúc i chung: i Câu i cầu i khiến i được i cấu i tạo i nhờ i những i động i từ i ngoại i động i chỉ i ý i sai i khiến: i khuyên, i sai, i bảo, i cấm , i các i phó i từ i mệnh i lệnh: i hãy, i đừng, i đừng, i chớ i và i cáci trợi từ:i đi,i thôi,i lên

Víi dụ:i Khôngi đượci làmi ồn,i đii đii em d i i Câu i cảm i thán

Câu i cảm i thán i là i câu i dùng i để i bộc i lộ i tình i cảm, i cảm i xúc i Câu i cảm i thán i không i đòi i hỏi i có i phần i nghĩa i miêu i tả, i không i bắt i buộc i phải i gán i với i một i sự i kiện i hay i hiện i tượng i được i biểu i hiện i trong i cấu i trúc i của i câu.

Câu i cảm i thán i dạng i “thuần i khiết” i sử i dụng i các i cảm i từ: i ái i chà, i ôi i chao

Câu i cảm i thán i dạng i “không i thuần i khiết” i sử i dụng i các i trợ i từ i đi i kèm i cấu i trúc i câu i

Ví i dụ: i hỡi i ôi i !, i ô i kìa i !

i Hiện i tượng i đồng i tham i chiếu i trong i tiếng i Việt i và i hướng i tiếp i cận

i i Np- i anaphora i

i i i i i i i i i i Nhắci lạii địnhi nghĩa,i hiệni tượngi Np-i anaphorai lài hiệni tượngi mộti từi -i thườngi lài đạii từi -i thayi thếi choi mộti danhi từ,i mộti cụmi danhi từi đãi nhắci đếni ởi phíai trước. a i Cách i tiếp i cận i cũ i – i thuật i toán i Hobbs. i i i i i i i i i i Phải i nói i rằng, i đây i là i thuật i toán i nhận i diện i đại i từ i đầu i tiên i cho i những i kết i quả i thực i nghiệm i khả i quan i từ i những i năm i 70 i của i thế i kỷ i trước i Trước i khi i bắt i tay i vào i nghiên i cứu i những i thuật i toán i mới, i em i xin i phép i nhắc i lại i điểm i cốt i lõi i của i thuật i toán i này i i i i i i i i i i Thuật i toán i này i đòi i hỏi i xây i dựng i một i cây i phân i tích i cú i pháp, i cây i phân i tích i có i nhiệm i vụ i phân i chia i câu i thành i chủ i ngữ, i động i từ, i đại i từ, i bổ i ngữ, i tính i từ… i mà i không i thay i đổi i trật i tự i từ i hay i bỏ i qua i từ i trong i câu i theo i chiều i phân i tích i từ i trái i sang i phải i đúng i nhưi cấui trúci ngữi phápi tiếngi Anh.i

Hình i 1 i - i Mô i phỏng i thuật i toán i Hobbs i i i i i i i i i Căn i bản i dựa i trên i cây i phân i tích i cú i pháp, i thuật i toán i duyệt i qua i bề i mặt i cây i phân i tích i cú i pháp i theo i một i trật i tự i đặc i biệt, i tìm i kiếm i một i cụm i danh i từ i tương i thích i về i số i lượng i (số i ít, i số i nhiều), i kiểu i loại i (giống i đực, i giống i cái ) i i với i đại i từ i Trật i tự i duyệt i như i sau:

1 Bắt i đầu i ở i nút i NP i đại i diện i cho i đại i từ i cần i thay i thế.

2 Đi i ngược i lên i gốc i của i cây i đến i khi i gặp i nút i NP i hoặc i nút i S i đầu i tiên i Gọi i nút i này i lài X,i vài coni đườngi đểi dẫni đếni Xi lài p.

3 Duyệti tấti cải cáci nhánhi ởi dướii núti Xi vài bêni tráii nhánhi pi theoi phươngi phápi tìmi kiếm i rộng i Cho i là i mỗi i cụm i từ i bị i thay i thế i bởi i đại i từ i (antecedent) i có i một i nút i NP i hoặc i S i nằm i giữa i nó i và i X.

4 Nếu i X i là i nút i S i cao i nhất i trong i câu, i duyệt i cây i phân i tích i cú i pháp i của i câu i đứng i trước i theo i trật i tự i từ i câu i gần i nhất i vói i câu i đang i xét i Mỗi i cây i được i duyệt i kiểu i tìm i kiếm i rộng i từ i trái i sang i phải, i và i khi i gặp i một i nút i NP, i nút i đó i được i cho i là i cụm i từ i mà i đại i từ i thay i thế i (antecedent) i Nếu i X i không i phải i là i nút i S i cao i nhất i trong i cây, i tiếp i tục i bước i 5.

5 Từ i nút i X, i tiếp i tục i đi i lên i gốc i cây i cho i đến i khi i gặp i được i một i nút i S i hoặc i NP i Gọi i nút i mới i này i là i X i và i con i đường i duyệt i đến i nó i là i p.

6 Nếui Xi lài mộti núti NPi vài đườngi pi duyệti tớii Xi khôngi chứai núti i i (mỗii núti NPi cói mộti núti i i ngayi dướii nói đạii diệni phầni danhi từi chínhi củai cụmi danhi từ)i nàoi mài Xi ngayi lập i tức i bao i hàm, i gán i X i là i cụm i danh i từ i thay i thế i (antecedent).

7 Duyệt i tất i cả i các i nhánh i cây i nằm i dưới i nút i X i theo i trật i tự i tìm i kiếm i rộng i từ i trái i sang i phải i Gán i mọi i nút i NP i gặp i được i là i antecedent.

8 Nếu i X i là i một i nút i S, i duyệt i tất i cả i các i nhánh i của i nút i X i đến i nhánh i bên i phải i của i đường i p i theo i trật i tự i tìm i kiếm i rộng i từ i trái i sang i phải i nhưng i không i duyệt i xuống i dưới i bất i cứ i nút i NP i hay i S i nào i gặp i được i Gán i bất i cứ i nút i NP i nào i gặp i được i là i antecedent

9 Trở i lại i bước i 4. i i i i i Tìm i kiếm i rộng i trên i cây i là i cách i tìm i kiếm i mà i tại i đó i tất i cả i các i nút i ở i độ i sâu i n i được i tới i thămi trướci khii thămi bấti cứi núti nàoi cói đội sâui n+1.i Bướci 2i vài bướci 3i giảii quyếti vấni đềi vềi đội sâui củai câyi mài tạii đói mộti đạii từi phảni thâni cói thểi đượci sửi dụng.i Bướci 5-9i baoi quát i cây i giữa i các i nút i NP i và i S i Nút i 4 i tìm i kiếm i trong i câu i trước i đó i i i i i i i i i i Điểm i hạn i chế i của i thuật i toán i này, i đó i chính i là i việc i chỉ i hiệu i quả i trong i việc i xử i lý i các i đồng i tham i chiếu i nằm i trong i cùng i một i câu, i trong i nhiều i trường i hợp, i để i cải i thiện i hiệui quải yêui cầui phảii đưai vàoi nhữngi ràngi buộci hạni chếi nhưi là:

• Ngàyi thángi khôngi thểi dịchi chuyểni

• Địa i điểm i không i thể i di i chuyển i

• Những i vật i lớn i không i thể i dịch i chuyển i i i i i i i i i i Các i ràng i buộc i chỉ i mới i được i đưa i vào i ở i những i dạng i đơn i giản i nhất, i không i được i chú i trọng i trong i thuật i toán i một i cách i tương i xứng i với i vai i trò i của i nó. i i i i i i i i i Mặt i khác, i hiệu i quả i của i thuật i toán i cũng i phụ i thuộc i nhiều i vào i sự i đúng i đắn i của i phân i tích i cây i cú i pháp i Các i câu i trong i hội i thoại i thường i là i câu i đơn i và i có i cấu i trúc i tương i đối i đơn i giản, i sử i dụng i thuật i toán i Hobbs i có i thể i đáp i ứng i được i khoảng i 70% i các i trường i hợp i xảy i ra i Np- i anaphora i Tuy i nhiên, i một i yếu i điểm i quan i trọng i của i thuật i toán i này i khi i đưai vàoi ápi dụngi choi tiếngi Việti lài đội chínhi xáci củai thuậti toáni phụi thuộci vàoi đội chínhi xáci củai câyi cúi phápi nhưngi mộti thuậti toáni cói thểi đưai rai cấui trúci câui ngữi phápi chínhi xác i trong i tiếng i Việt i cho i đến i thời i điểm i thực i hiện i đồ i án i này i là i không i có i Vì i thế i việc i cài i đặt i thuật i toán i Hobbs i trở i nên i không i khả i thi. b i Cách i tiếp i cận i mới i – i Đa i chiến i lược. i i i i i i i i i i Ý i tưởng i của i cách i tiếp i cận i mới i này i là i thay i vì i hoàn i toàn i phụ i thuộc i vào i trật i tự i của i cây i cú i pháp i như i thuật i toán i Hobbs, i ta i chỉ i tìm i kiếm i các i tiền i ngữ i phía i trước i đại i từ i và i sử i dụng i tập i các i ràng i buộc i để i xử i lý i lựa i chọn i ra i tiền i ngữ i phù i hợp i nhất i với i đại i từ i đó. i i i i i i i i i i Giải i quyết i vấn i đề i đồng i tham i chiếu i từ i lâu i đã i được i nhận i định i là i vấn i đề i khó, i đòi i hỏi i kiến i thức i sâu i rộng i không i hạn i định i cả i về i ngữ i pháp, i ý i nghĩa i học i và i thực i tế… i Để i giảii quyếti mộti lớpi lớni cáci hiệni tượngi đồngi thami chiếu,i thayi vìi chỉi sửi dụngi mộti biệni phápi hayi cáchi tiếpi cậni đơni thuần,i thayi vàoi đói tai xâyi dựni mộti biếni phápi mớii lài kếti hợp i của i nhiều i chiến i lược i khác i nhau i Vấn i đề i ở i đây i chính i là i việc i kết i hợp i chúng i như i thế i nào. i i i i i i i i i i Không i làm i mất i tính i tổng i quát, i ta i đặt i ra i giả i thiết i là i tất i cả i các i tiền i ngữ i của i các i tham i chiếu i là i rõ i ràng i (đã i được i nhắc i đến i ở i câu i trước) i Đây i chính i là i giới i hạn i đầu i tiên i đặt i ra i Dựa i trên i ý i tưởng i của i luật i Centering, i chủ i đề i của i người i sử i dụng i ngôn i ngữ i biến i đổi i linh i động i qua i từng i câu i Mỗi i đại i từ i thay i thế i sẽ i ứng i với i một i tiền i ngữ i duy i nhất i trước i nó i (là i danh i ngữ i được i xếp i mức i ưu i tiên i cao i nhất i của i câu i trước).Nếu i gọi i tập i các i tiền i ngữ i trong i câu i thứ i n-1 i là i Cf, i tập i các i đại i từ i thay i thế i trong i câu i thứ i n i là i Cb(i), i việc i chúng i ta i phải i làm i là i tìm i ra i được i Cp i (tiền i ngữ i thích i hợp i nhất) i trong i Cf i tương i ứng i cho i từng i Cb(i).i i i i i i i i i i i Tai xâyi dựngi cáci ràngi buộci vớii cáci mứci ưui tiêni từi trêni xuốngi dướii nhưi sau.

 Local i constraints i : i Tiền i ngữ i và i đại i từ i đồng i tham i chiếu i phải i thống i nhất i về i mặt i số i lượng i (số i ít, i số i nhiều), i giống i (người/ i vật, i đực/ i cái), i bản i chất i (động i vật/ i thực i vật)… i i Tất i cả i các i ứng i viên i trong i Cf i vi i phạm i rằng i buộc i này i đều i phải i bị i loại i bỏ i i i i i i i i i i i i Ví i dụ i : i John i và i Mary i đi i siêu i thị, i Anh i ấy i mua i một i cái i tủ i lạnh i mới i  i Anh i ấy i phải i được i hiểu i là i John.

 Casei –i rolei sentencei contraintsi :i Vaii tròi ýi nghĩai họci củai tiềni tối vài đạii từi đồngi thami chiếui phảii thốngi nhất.i Tấti cải cáci ứngi viêni vii phạmi i đềui phảii bịi loạii bỏ. i i i i i i i i Ví i dụ i : i John i lấy i cái i bánh i ở i trên i bàn i và i ăn i nó i i “nó” i là i cái i bánh i chứ i không i thể i là i bàn i được.

 Disjoint-Contraints i : i Câu i Su i – i Verb i – i Ob i i tuỳ i vào i từng i động i từ i cụ i thể i mà i có i cho i phép i Su i và i Ob i là i một i hay i không i Tất i cả i các i tiền i tố i vi i phạm i ràng i buộc i này i đều i bị i loại i bỏ.

 Condition-Constraint i : i Tiền i ngữ i và i đại i từ i tham i chiếu i phải i thoả i mãn i thực i tế i hànhi động. i i i i i i i Ví i dụ i : i i John i cho i Tom i một i quả i táo i Anh i ý i ăn i nó i ngay i  i “Anh i ý” i phải i là i Tom i chứ i không i thể i là i John i được. i i i i Mọi i tiền i ngữ i không i thoả i mãn i đều i phải i bị i loại i bỏ.

 Prefer- i Constraint: i Nếu i sau i khi i tất i cả i các i giới i hạn i trên i được i áp i i dụng i mà i vẫn i con i nhiều i hơn i 2 i ứng i viên i tiền i tố i Ta i sẽ i tính i đến i i ưu i tiên i về i vai i trò i ngữ i phápi vài ưui tiêni vềi chủi đềi câu. i i i i i i i i i i Cáci ứngi viêni tiềni ngữi đượci xáci địnhi bằngi cáchi lọci rai cáci cụmi danhi từi từi câui gầni nhất i mà i thuật i toán i tìm i được i tiền i ngữ i thích i hợp, i nếu i không i tìm i được i thì i bắt i đầu i từ i câu i gần i nhất i được i nhập i vào i Để i thuật i toán i được i chính i xác i cần i phải i phân i biệt i rõ i ràng i ràng i buộc i nào i là i bắt i buộc i và i ràng i buộc i nào i là i phần i thêm i Ràng i buộc i bắt i buộc i áp i dụng i cho i tấti cải cáci trườngi hợpi trongi khii ràngi buộci thêmi chỉi ápi dụngi choi cáci trườngi hợpi nhậpi nhằngi (cụi thểi nhưi câui cói hơni 2i ngườii vaii tròi tươngi đương).i i i i i i i i i i Khẳng i định i ràng i buộc i thêm i không i có i độ i chính i xác i 100 i %, i đó i chỉ i là i các i điều i kiện i ta i thêm i vào i để i tối i ưu i hóa i kết i quả i trong i các i trường i hợp i nhập i nhằng i ngữ i nghĩa i mà i thôi i i i i

i “One” i anaphora

i i i i i i i i i Nhắc i lại i định i nghĩa, i one- i anaphora i là i hiện i tượng i sử i dụng i số i từ i để i thay i thế i cho i từ i loại i danh i từ i đã i nhắc i đến i phía i trước. i i i i i i i i i Sối từi thườngi đượci sửi dụngi nhiềui như:i cái,i chiếc,đứa…

Víi dụi :i Trungi tâmi mớii nhậpi vềi mộti loạii thiệpi mới. i i i i i i i i i i i i Cho i tôi i xem i thử i một i chiếc. i i i i i i i i Mặc i dù i đây i là i hiện i tượng i hay i gặp i trong i hội i thoại i tiếng i Việt i nhưng i do i tính i chất i của i hội i thoại i là i liền i mạch i và i đơn i giản i nên i việc i xử i lý i one-anaphora i cũng i tương i tự i như i Np-anaphora i nhưng i các i ràng i buộc i của i nó i không i nhiều i – i chỉ i có i sự i ràng i buộc i tương i thích i giữa i danh i từ i và i số i từ.

i VP- i anaphora

i i i i i i i i Nhắc i lại i định i nghĩa, i VP-anaphora i là i hiện i tượng i sử i dụng i một i từ i để i thay i thế i cho i một i động i từ i hoặc i cụm i động i từ i đã i nhắc i đến i ở i phía i trước. i i i i i i i i Cáci trườngi hợpi VP-anaphorai trongi hộii thoạii tiếngi Việti khôngi phongi phúi lắm,i hơni nữai việci phâni chiai VP-anaphorai vài hiệni tượngi tỉnhi lượci chỉi lài tươngi đốii doi VP-i anaphora i cũng i có i thể i coi i là i một i trường i hợp i đặc i biệt i của i tỉnh i lược. i i i i i i i Ví i dụ:

 Lan i muốn i ăn i kem i Tràng i Tiền.

 Nhưng i tôi i không i muốn i thế. i i i i i i i Chỉ i xét i các i câu i có i cấu i trúc i đơn i giản i (vì i mục i tiêu i của i đồ i án i là i hướng i vào i ứng i dụng i hộii thoại),i đặci điểmi nhậni biếti VPi –i anaphorai lài câui cói cấui trúci ,i trongi đó,i i thườngi lài cáci độngi từi chỉi sởi thíchi nhưi thích,i muốn…i vài từi thay i thế i thường i là: i thế, i vậy.

i S- i anaphora

thếi (mài khôngi cầni đếni mộti câyi cấui trúci ngữi phápi hoàni chỉnhi vài chínhi xác).i i 4.1.4 i S- i anaphora i i i i i i i i i Nhắc i lại i định i nghĩa, i S- i anaphora i là i hiện i tượng i sử i dụng i một i từ i để i thay i thế i cho i cả i một i câu i đã i được i nhắc i đến i ở i phía i trước. i i i i i i i i i Ví i dụ:

 Bức i tranh i này i hình i như i thuộc i trường i phái i trừu i tượng?

 Uh, i tôi i cũng i nghĩ i thế. i i i i i i i i i S-i anaphorai cũngi lài mộti dạngi hayi gặpi trongi hộii thoạii tiếngi Việt,i vớii tínhi chấti đơn i giản i của i cấu i trúc i câu i hội i thoại, i đặc i điểm i câu i có i S- i anaphora i là i câu i có i cấu i trúc i

, i trong i đó i i thường i là i các i nội i động i từ i mang i tính i phán i đoán i như i nghĩ, i đoán… i và i từ i thay i thế i là i thế, i vậy. i i i i i i i i Cách i tiếp i cận i của i S- i anaphora i cũng i tương i tự i VP i – i anaphora. i

i Hiện i tượng i tỉnh i lược i câu i và i hướng i tiếp i cận

i Hướng i tiếp i cận

Hình i 2 i - i Mô i phỏng i quan i hệ i từ i vựng i i i i i i i i i i Bài i toán i giải i quyết i hiện i tượng i tỉnh i lược i là i bài i toán i khôi i phục i lại i đầy i đủ i cấu i trúc i củai câui đãi bịi lượci bỏ.i Giải thiếti tồni tạii mộti mốii quani hệi giữai mộti từi trongi câui tỉnhi lượci ngữi phápi vài mộti từi trongi phầni đãi bịi tỉnhi lượci –i tai gọii đâyi lài mốii quani hệi tỉnhi lược i Ví i dụ i : i cái i khóa i là i một i phần i của i cánh i cửa i , i ta i ký i hiệu: i cánh i cửa i i cái i khóa i Một i mối i qua i hệ i như i thế i là i nền i tảng i giải i quyết i bài i toán i Tìm i kiếm i mối i quan i hệ i này i là i nhiệm i vụ i cần i thực i hiện, i tuy i nhiên i việc i này i sẽ i không i được i thực i hiện i một i cách i trực i tiếp i mà i bằng i cách i tìm i kiếm i gốc i và i đích i (tiền i ngữ i bị i lược i bỏ) i của i mối i qua i hệ i này.i i i i i i i i i i i i i i i i i i Thuật i toán i xử i lý i vấn i đề i này i có i thể i tóm i lược i như i sau:

 Bắt i đầu i từ i câu i tỉnh i lược i B

 Tìmi kiếmi Ai ởi câui gầni đâyi nhấti choi kếti quải tiềni tố.

 Kiểm i tra i mối i quan i hệ i của i A i và i B i Nếu i A i thoả i mãn i các i rằng i buộc i  i Viết i lại i B i theo i A

 Không i thoả i mãn i  i Tìm i tiếp i ở i câu i trước i đó i i i i i i i i Chú i ý i là i với i đặc i thù i liên i tục i của i hội i thoại i và i giả i thiết i là i tất i cả i các i yếu i tố i đã i biết i

(tìm i được i i tiền i ngữ) i hầu i hết i các i tiền i ngữ i bị i lược i bỏ i phải i được i tìm i thấy i ở i câu i phía i trước. i i i i i i i i i Bởii vìi hiệni tượngi tỉnhi lượci vốni lài hiệni tượngi ngữi phápi câui khuyếti đii mộti phần,i do i đó, i cái i “gốc” i của i mối i quan i hệ i tỉnh i lược i khá i dễ i dàng i để i nhận i diện i : i phát i hiện i khiếm i khuyết i ngữ i pháp i của i câu i Về i mặt i ngữ i pháp, i các i dạng i khiếm i khuyết i hay i gặp i nhất i là i dạng:

 Thiếu i vắng i chủ i thể i - i một i từ i mà i không i thể i đứng i đầu i câu i lại i không i chịu i tác i động i của i các i từ i khác i trong i câu i Ví i dụ i như i một i tính i từ i thiếu i vắng i danh i từ…như i (nghiêm i trọng i lỗi i lầm).

 Thiếui i vắngi bổi ngữi -i mộti từi yêui cầui kèmi theoi thựci thểi bịi táci độngi nhưngi trongi câu i không i có i thực i thể i này i Ví i dụ i đơn i giản i như i từ i trong i câu i tỉnh i lược i là i một i bộ i phận, i một i thuộc i tính, i một i phân i lớp i của i từ i đã i bị i tỉnh i lược, i như i tranh i trường i phái i trừu i tượng i i i i i i i i i i i i i Thuật i toán i nhìn i qua i có i vẻ i khá i đơn i giản i tuy i nhiên i vấn i đề i mấu i chốt i và i phức i tạp i của i hiện i tượng i tỉnh i lược i câu i chính i là i phát i hiện i mối i quan i hệ i giữa i hai i câu i A i – i câu i tỉnh i lược i và i B- i câu i phía i trước i Giải i pháp i của i đồ i án i này i đó i là i so i sánh i từ/cấu i trúc i của i 2 i câu i vài dựi vàoi mốii quani hệi đãi đượci địnhi nghĩai trongi mộti từi điểni đượci xâyi dựngi mớii tươngi tựi WordNet.i Cấui trúci củai từi điểni nàyi sẽi đượci làmi rõi ởi phầni sau.

i Tổng i hợp

Hướng i giải i quyết i mối i quan i hệ i chủ i ngữ i - i động i từ i - i bổ i ngữ

i i i i i i i i i Mặc i dù i đồ i án i dựa i trên i cách i tiếp i cận i cố i gắng i ít i dựa i vào i phân i tích i câu i hết i mức i có i thể, i nhưng i các i ràng i buộc i động i từ i - i danh i từ i vẫn i đòi i hỏi i vai i trò i cú i pháp i của i từ i ở i một i mức i nhất i định i nào i đó. i i i i i i i i Xét i ví i dụ:

 Họa i sĩ i Tô i Ngọc i Vân i sống i ở i đâu?

 Ôngi ấyi sinhi rai vài lớni lêni ởi Hài Nội.

 Tôi i nghĩ i rằng i bức i tranh i này i là i giả. i i i i i i i Trên i là i ba i ví i dụ i về i dạng i câu i hay i gặp i nhất, i dựa i trên i điều i kiện i là i các i câu i hội i thoại i là i câu i đơn i có i cấu i trúc i khá i đơn i giản, i ta i có i thể i tìm i kiểm i chủ i ngữ i của i động i từ i bằng i thuật i toán i đơn i giản i mà i hiệu i quả i như i sau:

 Chủ i ngữ i là i danh i từ i đứng i trước i động i từ i  i thay i vì i đi i phân i tích i cú i pháp i câu, i ta i đi i tìm i danh i từ i đứng i trước i động i từ i đó.

Nếui phíai trướci độngi từi lài từi nốii nhưi và,i nhưng…i chủi ngữi củai độngi từi đói lài chủi ngữi củai độngi từi phíai trướci nó.i

i Hướng i xây i dựng i cơ i sở i dữ i liệu i từ i điển i mới

4.3.2.1 i Nguyên i nhân i i i i i i i Câu i hỏi i đặt i ra i là i tại i sao i không i thể i sử i dụng i một i từ i điển i từ i vựng i thông i thường i vốn i đã i rất i sẵn i có i mà i cần i phải i tạo i một i từ i điển i động i mới i tương i tự i từ i điển i WordNet?

Việc i xây i dựng i từ i điển i mới i rõ i ràng i là i phức i tạp i và i tốn i thời i gian i hơn i nhiều i nhưng i lại i là i điều i cần i thiết i bởi i các i lý i do i sau i đây i :

 Để i giải i quyết i hiện i tượng i tỉnh i lược i ta i cần i biết i mối i quan i hệ i mức i sâu i giữa i các i từ, i víi dụi nhưi :i ổi khóai lài mộti phầni củai cánhi cửa,i thầyi giáoi vài họai sĩi đềui lài từi loạii nghềi nghiệpi củai coni ngườii hayi nhưi trườngi pháii lài mộti thuộci tínhi củai bứci tranh.

 Mỗi i động i từ i chỉ i phù i hợp i với i một i số i chủ i ngữ, i bổ i ngữ i nhất i định, i các i ràng i buộc i của i hiện i tượng i đồng i tham i chiếu i yêu i cầu i mối i quan i hệ i giữa i danh i từ i và i động i từ. i i i i i i i i Trên i đây i là i nguyên i nhân i căn i bản i nhất i mà i một i từ i điển i thông i dụng i không i thể i đáp i ứng i các i yêu i cầu i của i thuật i toán i i 4.3.2.2 i Cấu i trúc i từ i điển i mới. i i i i i i i i i Từ i điển i mới i được i xây i dựng i ở i cấu i trúc i cây i Xml, i dễ i dàng i cho i phép i người i dùng i nhậpi thêmi từi mớii nếui cầni thiết.i Haii đốii tượngi cầni quani tâmi nhấti củai đồi áni chínhi lài độngi từi vài danhi từ,i vìi thếi đồi áni sẽi xâyi dựngi 2i từi điểni choi 2i dạngi từi loạii này. i i i i i i i i i Cấui trúci phâni loạii từi củai từi điểni nàyi đượci xâyi dựngi dựai trêni cấui trúci câyi ngữi pháp i Vietlex i Semantic i Tree i (tham i khảo i trên i trang i web i www.vietlex.vn) i i a i Từ i điển i danh i từ. i i i i i i i Mục i tiêu i của i từ i điển i này i là i không i chỉ i liệt i kê i các i danh i từ i mà i còn i phải i – i trực i tiếp i hoặc i gián i tiếp i – i đưa i ra i được i mối i quan i hệ i giữa i các i danh i từ i nếu i có.

Cấu i trúc i tệp i xml i như i sau:

Organization Root/ConcreteThing/LivingThing/People/Organization

Supernature Root/ConcreteThing/LivingThing/People/Supernature

Animal Root/ConcreteThing/LivingThing/Animal

Mammal Root/ConcreteThing/LivingThing/Animal/Mammal

Bird Root/ConcreteThing/LivingThing/Animal/Bird

Fish Root/ConcreteThing/LivingThing/Animal/Fish

Amphibian Root/ConcreteThing/LivingThing/Animal/Amphibian

Reptile Root/ConcreteThing/LivingThing/Animal/Reptile

Worm Root/ConcreteThing/LivingThing/Animal/Worm

Insect Root/ConcreteThing/LivingThing/Animal/Insect

Shellfish Root/ConcreteThing/LivingThing/Animal/Shellfish

FictionalAnimal Root/ConcreteThing/LivingThing/Animal/FictionalAnimal

Microorganism Root/ConcreteThing/LivingThing/Microorganism

Plant Root/ConcreteThing/LivingThing/Plant

Tree Root/ConcreteThing/LivingThing/Plant/Tree

Bush Root/ConcreteThing/LivingThing/Plant/Bush

Vine Root/ConcreteThing/LivingThing/Plant/Vine

Herb Root/ConcreteThing/LivingThing/Plant/Herb

LowPlant Root/ConcreteThing/LivingThing/Plant/LowPlant

HighPlant Root/ConcreteThing/LivingThing/Plant/HighPlant

Food i Root/ConcreteThing/NonLivingThing/Food

Grain Root/ConcreteThing/NonLivingThing/Food/Grain

Vegetable Root/ConcreteThing/NonLivingThing/Food/Vegetable

Meat i Root/ConcreteThing/NonLivingThing/Food/Meat

Fruit i Root/ConcreteThing/NonLivingThing/Food/Fruit

Beverage Root/ConcreteThing/NonLivingThing/Food/Beverage

Seasoning Root/ConcreteThing/NonLivingThing/Food/Seasoning

Dish Root/ConcreteThing/NonLivingThing/Food/Dish

Artifact i Root/ConcreteThing/NonLivingThing/Artifact

Furniture i Root/ConcreteThing/NonLivingThing/Artifact/Furniture

Tool i Root/ConcreteThing/NonLivingThing/Artifact/Tool

Playthingi Root/ConcreteThing/NonLivingThing/Artifact/Plaything

Appliance Root/ConcreteThing/NonLivingThing/Artifact/Appliance

Machine i Root/ConcreteThing/NonLivingThing/Artifact/Machine

Vehicle i Root/ConcreteThing/NonLivingThing/Artifact/Vehicle

Instrument Root/ConcreteThing/NonLivingThing/Artifact/Instrument

Garmenti Root/ConcreteThing/NonLivingThing/Artifact/Garment

Raiment i Root/ConcreteThing/NonLivingThing/Artifact/Raiment

Ornament i Root/ConcreteThing/NonLivingThing/Artifact/Ornament

Cosmetic i Root/ConcreteThing/NonLivingThing/Artifact/Cosmetic

Drug i Root/ConcreteThing/NonLivingThing/Artifact/Drug

Creation i Root/ConcreteThing/NonLivingThing/Artifact/Creation

Construction Root/ConcreteThing/NonLivingThing/Artifact/Construction

Root/ConcreteThing/NonLivingThing/Artifact/BuildingConstruction

FictionalObject Root/ConcreteThing/NonLivingThing/FictionalObject

Part Root/ConcreteThing/NonLivingThing/Part

AnimalPar Root/ConcreteThing/NonLivingThing/Part/AnimalPar

PlantPar Root/ConcreteThing/NonLivingThing/Part/PlantPar

ArtifactPar Root/ConcreteThing/NonLivingThing/Part/PartOfArtifact

Substance Root/ConcreteThing/NonLivingThing/Substance

MatterRoot/ConcreteThing/NonLivingThing/Substance/Matter

Solid Root/ConcreteThing/NonLivingThing/Substance/Solid

Earth Root/ConcreteThing/NonLivingThing/Substance/Earth

LiquidRoot/ConcreteThing/NonLivingThing/Substance/Liquid

Gas Root/ConcreteThing/NonLivingThing/Substance/Gas

NaturalObjecti Root/ConcreteThing/NonLivingThing/NaturalObject

Root/ConcreteThing/NonLivingThing/NaturalObject/HeaventlyBodies

Root/ConcreteThing/NonLivingThing/NaturalObject/NaturalPhenomenon Land i Root/ConcreteThing/NonLivingThing/NaturalObject/Land

Root/ConcreteThing/NonLivingThing/NaturalObject/BodyOfWater

Concept Root/Abstraction/FieldOfKnowledge/Concept

Knowledge Root/Abstraction/FieldOfKnowledge/Knowldege

Psychology Root/Abstraction/FieldOfKnowledge/Psychology

Stay Root/Abstraction/State/Stay

Existence Root/Abstraction/State/Existence

Contact Root/Abstraction/State/Contact

Consume Root/Abstraction/State/Consume

Will Root/Abstraction/State/Will

Depend Root/Abstraction/State/Depend

BodilyRepsond Root/Abstraction/Action/BodilyRepsond

BodilyFunction Root/Abstraction/Action/BodilyFunction

Thinking Root/Abstraction/Action/Thinking

Active Root/Abstraction/Action/Active

Cognitive Root/Abstraction/Action/Cognitive

Communicate Root/Abstraction/Action/Communicate

Move Root/Abstraction/Action/Move

Create Root/Abstraction/Action/Create

Change Root/Abstraction/Action/Change

PresentAndReceive Root/Abstraction/Action/RresentAndReceive

Receive Root/Abstraction/Action/Receive

Hypotaxis Root/Abstraction/Relation/Hypotaxis

Conjugate Root/Abstraction/Relation/Conjugate

Space Root/Abstraction/Relation/Space

Time Root/Abstraction/Relation/Time

Exist Root/Abstraction/Relation/Exist

Compare Root/Abstraction/Relation/Compare

SetOrGroup Root/Abstraction/Relation/SetOrGroup

Quality i i Root/Abstraction/Attribute/Quality

Quantity i i Root/Abstraction/Attribute/Quantity

Characteristic i i Root/Abstraction/Attribute/Characteristic

Condition Root/Abstraction/Attribute/Condition

SortOrTypei i Root/Abstraction/Attribute/SortOrType

Definite i Root/Abstraction/Value/Definite

Indefinite i Root/Abstraction/Value/Indedinite

Conventionali Root/Abstraction/Unit/Conventional

Time i Root/Abstraction/Unit/Time

Administrative i Root/Abstraction/Unit/Administrative i i i i i i i i i Trong i đó, i các i từ i thuộc i cùng i một i cha i sẽ i có i ngữ i nghĩa i tương i tự i nhau, i và i các i từ i có i quan i hệ i cha i – i con i trong i cây i xml i sẽ i có i quan i hệ i phụ i thuộc i bộ i phận i hoặc i thuộc i tính i với i nhau. b.Từ i điển i động i từ. i i i i i i i Mục i tiêu i của i từ i điển i này i là i liệt i kê i động i từ i và i mối i quan i hệ i giữa i động i từ i và i danh i từ i

Vì i thế i cấu i trúc i cây i động i từ i đơn i giản i hơn i Các i nút i cây i chỉ i là i Root//HeadWord/ i i i i i i i Trongi đó,i Vxi đạii diệni mộti dạngi coni củai độngi từi (đãi nêui trongi phầni 3.2)i vài mỗii núti headwordi sẽi thêmi vàoi cáci thuộci tínhi nhưi Su,i Ob…i thểi hiệni yêui cầui ràngi buộci của i nhóm i động i từ i đó.

Tổng i hợp i các i phương i pháp

i i i i i i i i i Các i phân i tích i ở i trên i sử i dụng i chiến i thuật i chia i để i trị, i phân i loại i hiện i tượng i đồng i tham i chiếu i và i tỉnh i lược i thành i các i trường i hợp i nhỏ i hơn i và i sử i dụng i các i cách i tiếp i cận i khác i nhau i để i giải i quyết i từng i trường i hợp i Bài i toán i chỉ i hoàn i chỉnh i khi i ta i có i thể i tổng i hợp i các i phần i riêng i lẻ i lại i thành i một i khối i thống i nhất. i i i i i i i i i Trong i quá i trình i phân i tích i từng i dạng i riêng i biệt i của i hiện i tượng i tỉnh i lược i và i đồng i thami chiếu,i tai cói thểi đưai rai nhậni xéti sau:

 Câui phíai trướci lài câui đãi quai xửi lýi củai hệi thốngi từi trước,i doi đói nói lài câui đầyi đủi cả i về i ngữ i nghĩa i lần i ngữ i pháp.

 Mỗi i câu, i nếu i có i xảy i ra i thì i chỉ i xảy i ra i một i trong i những i trường i hợp i nhỏ i đã i nêu.

 Tỉnh i lược i là i hiện i tượng i câu i thiếu i các i bộ i phận i ngữ i pháp

 Đồng i tham i chiếu i là i hiện i tượng i câu i đủ i bộ i phận i ngữ i pháp i nhưng i thiếu i ngữ i nghĩa. i i i i i i i i Do i đó, i hệ i thống i sẽ i phải i xây i dựng i i modul i thích i hợp i để i phát i hiện i hiện i tượng i ngữ i pháp i xảy i ra i trong i câu i với i ưu i tiên i kiểm i tra i hiện i tượng i tỉnh i lược i trước i vì i hiện i tượng i đồngi thami chiếui íti nhiềui dựai trêni ngữi phápi câu.i i i i

PHẦN i 3 i XÂY i DỰNG i HỆ i THỐNG

CHƯƠNG i 5 i THIẾT i KẾ i HỆ i THỐNG

i Giới i hạn i bài i toán

 Các i câu i đầu i vào i phải i đúng i chính i tả, i để i đơn i giản, i mặc i định i câu i hỏi i kết i thúc i bằngi dấui hỏii vài câui trải lờii kếti thúci bằngi dấui chấm.

 Cáci câui phảii tuâni thủi ngữi phápi tiếngi Việti –i tuâni thủi ởi đâyi hiểui lài chỉi cói “tôii ăn i cơm” i chứ i không i thể i có i “tôi i cơm i ăn”.

 Các i câu i phải i hiểu i được i – i ý i nghĩa i của i điều i này i có i nghĩa i là i luôn i có i tiền i ngữ.

 Hệ i thống i sẽ i là i một i hệ i thống i hướng i lĩnh i vực, i lĩnh i vực i mặc i định i ở i đây i là i trong i viện i bảo i tàng.

 Hệ i thống i tích i hợp i chương i trình i tách i từ i vntagger.

 Môii trườngi hệi thốngi lài :i winformi ,i chạyi trêni cáci hệi điềui hànhi 64biti củai microsoft i (vista, i win i 7…)

i Vị i trí i của i hệ i thống i trong i hệ i thống i hội i thoại i tổng i hợp

i i i i i i i i i i Hệ i thống i i xử i lý i hiện i tượng i tỉnh i lược i và i đồng i tham i chiếu i nằm i giữa i người i sử i dụng i và i hệ i thống i sinh i câu i của i hệ i thống i hội i thoại. i i i i i i i i i Đầu i vào i : i Hệ i thống i nhận i câu i đầu i vào i từ i hai i nguồn i là i câu i của i người i dùng i và i câu i củai hệi thốngi sinhi câui phíai sau. i i i i i i i i i Đầui rai củai hệi thốngi :i Câui đầyi đủ,i chuyểni choi hệi thốngi sinhi câui i i i i i i i i

i Thiết i kế i các i usecase i chính

i Biểu i đồ i tuần i tự

Hình i 3 i - i i Biểu i đồ i tuần i tự

Biểu i đồ i trạng i thái i máy

Hình i 4 i - i Biểu i đồ i trạng i thái i máy i tổng i quát i i i i i i i i i i i i i Trong i đó i phức i tạp i nhất i chính i là i bước i phát i hiện i các i hiện i tượng i xảy i ra i trong i câu i

Hình i 5 i - i Minh i họa i sơ i đồ i hoạt i động i giai i đoạn i nhận i diện i câu

i Thiết i kế i các i gói i chương i trình

i Gói i truy i nhập i cơ i sở i dữ i liệu i – i XMLdataConnection

// i dùng i để i kết i nối i tệp i xml i danh i từ

(đường i dẫn i tệp i cơ i sở i dữ i liệu i từ i điển i danh i từ)

Phương i thức public i string i GetWordType //i đưai rai phâni loạii củai danhi từ bool i IsBsameCatagoryA

//kiểm i tra i 2 i từ i có i thuộc i cùng i nhóm i không bool i IsSameType bool i IsNounHuman

//kiểm i tra i xem i từ i có i phải i dùng i dể i chỉ i người

IsNounHumanName //kiểmi trai xemi cói phảii têni riêngi chỉi người

//kiểm i tra i xem i B i có i phải i là i một i bộ i phân i của i A i không public i string i HumanGender // i kiểm i tra i giới i tính i của i danh i từ i chỉ i người. b i Lớp i VerbConnection i

// i dùng i để i kết i nối i tệp i xml i danh i từ

(đường i dẫn i tệp i cơ i sở i dữ i liệu i từ i điển i danh i từ) Phương i thức string i GetTypeofObject

// i trả i về i loại i từ i danh i từ i thích i hợp i làm i bổ i ngữ i của i động i từ booli IsAllowDisjoint

// i kiểm i tra i sự i tương i thích i của i Su-Ob i của i động i từ string i GetTypeofSubject

//// i trả i về i loại i từ i danh i từ i thích i hợp i làm i chủ i ngữ i của i động i từ Bool i IsMeanable

// i kiểm i tra i động i từ i có i hay i kèm i phần i phụ i sau i để i rõ i nghĩa i không

i Gói i Tiền i xử i lý i – i PrepareStructure

Baoi gồmi cáci lớpi thểi hiệni cấui trúci dữi liệui củai chươngi trình a i Lớp i WordStruct

// i dùng i để i thể i hiện i cấu i trúc i của i một i từ i trong i câu

Thuộc i tính Private i string i word

// i thể i hiện i nội i dung i từ Private i string i pos

//thể i hiện i loại i từ Privatei stringi wordRoleinSentences

// i thể i hiện i vai i trò i của i từ i trong i câu Private i string i wordSubmean

// i thể i hiện i các i yếu i tố i phụ i của i từ i như i số i lượng…

// i chỉ i áp i dụng i cho i đại i từ i thay i thê Private i int i index

//chỉi mụci củai từi trongi câu Phương i thức Public i WordStruct()

//i Thểi hiệni cấui trúci củai cải mộti câu

Thuộc i tính Private i WordStruct i [ i ] i wordarray

// i Mảng i từ i ngữ Private i int i sentenceLenghth

//Chiều i dài i câu Private i string i strSentencePos

// i Mảng i cấu i trúc i từ i loại i của i câu Phươngi thức Publici SentenceStruct()

//Hàm i tạo Private i int i GetNextNounPsition(int i begin) //Hàm i tìm i kiếm i danh i từ i

//Hàm i tìm i kiếm i bổ i ngữ i của i động i từ Public i WordStruct i GetHOjectofVerb()

//Hàm i tìm i kiếm i bổ i ngữ i là i người i của i động i từ Publici WordStructi GetSubjectofVerb() //Hàmi tìmi kiếmi chủi ngữi củai từ

//Hàm i tìm i kiếm i vị i trí i động i từ Public i int i GetLasVerbPosition() //Hàm i tìm i kiếm i động i từ i từ i cuối i lên i c i Lớp i PrepareStructure

Thuộc i tính static i XMLNounConnection i conn i ;

Phương i thức Public i WordStruct i [ i ] i WordArrayFormArray(tagger i strSen)//i Hàmi chuẩni câu.

i Gói i phát i hiện i hiện i tượng i ngôn i ngữ i - i Discover

i i i i i i i i i Là i gói i bao i gồm i các i lớp i có i nhiệm i vụ i nhận i diện i hiện i tượng i ngôn i ngữ i gặp i trong i câu. a i EcllipsisDiscover:IDisCoverInterface

//i Pháti hiệni hiệni tượngi tỉnhi lượci trongi câu

Thuộc i tính Private i string i filename

// i Phát i hiện i câu i có i hiện i tượng i tỉnh i lược i hay i không Public i string i TypeOccup(…)

// i Dạng i tỉnh i lược i nếu i có. b i Lớp i NPAnaphoraDisCover

// i Phát i hiện i phân i giải i đồng i tham i chiếu i đại i từ.

Phươngi thức publici Booli IsOccup()

//i Trải vềi truei nếui câui cói đồngi thami chiếui đạii từ public i string i TypeOccup()

//Dạng i đồng i tham i chiếu i đại i từ i c i VPAnaphoraDisCover

//// i Phát i hiện i phân i giải i đồng i tham i chiếu i động i từ

Phương i thức Public i bool i IsOccup()

//i Trải vềi truei nếui câui cói đồngi thami chiếui độngi từ Publici stringi TypeOccup()

// i Loại i tham i chiếu i động i từ i mặc i định d i OneAnaphoraDisCover

//// i Phát i hiện i phân i giải i đồng i tham i chiếu i số i từ

Phương i thức Public i bool i IsOccup()

// i Trả i về i true i nếu i câu i có i đồng i tham i chiếu i số i từ Publici stringi TypeOccup()

//i Loạii thami chiếui độngi từi mặci định. e i SAnaphoraDiscover

//// i Phát i hiện i phân i giải i đồng i tham i chiếu i câu

Phương i thức Public i bool i IsOccup()

// i Trả i về i true i nếu i câu i có i đồng i tham i chiếu i câu Publici stringi TypeOccup()

//i Loạii thami chiếui độngi từi mặci định

i Gói i xử i lý i các i hiện i tượng i ngôn i ngữ

//i Lớpi xửi lýi cáci loạii thami chiếui đạii từ

Thuộc i tính Private i bool i iresolve

//Kiểm i tra i xem i đã i giải i quyết i được i đồng i tham i chiếu i hay i không

Phương i thức Static i public i void i ResolveIntraSimple

//Xử i lý i đồng i tham i chiếu i với i đại i tư i và i tiền i ngữ i ở i hai i câu Static i public i void i ResolvenIntraConplex

//Xửi lýi đồngi thami chiếui vớii đạii từi vài tiềni ngữi ởi 2i mộti câu,i cói nhậpi nhằng Static i public i void i ResolveInter

// i Xử i lý i đồng i tham i chiếu i với i đại i từ i và i tiền i ngữ i nằm i trong i cùng i một i câu. b i Lớp i VPAnaphoraResolve

//Xử i lý i hiện i tượng i đồng i tham i chiếu i động i từ

Thuộc i tính Private i bool i iresolve

//Kiểm i tra i đồng i tham i chiếu i có i được i giải i quyết i chưa.

Phương i thức Static i public i void i Resolve

//Xửi lýi đồngi thami chiếui độngi từ c.Lớpi SPAnaphoraResolve

//Xử i lý i hiện i tượng i đồng i tham i chiếu i câu

Thuộc i tính Private i bool i iresolve

//Kiểm i tra i đồng i tham i chiếu i có i được i giải i quyết i chưa.

Phương i thức Static i public i void i Resolve

//Xử i lý i đồng i tham i chiếu i câu d.Lớp i OneAnaphoraResolve

//Xử i lý i hiện i tượng i đồng i tham i chiếu i số i từ

Thuộc i tính Private i bool i iresolve

//Kiểm i tra i đồng i tham i chiếu i có i được i giải i quyết i chưa.

Phương i thức Static i public i void i Resolve

//Xử i lý i đồng i tham i chiếu i số i từ e.Lớpi EcllipsisResolve

//Xử i lý i hiện i tượng i tỉnh i lược

Thuộc i tính Private i bool i iresolve

//Kiểm i tra i hiện i tượng i tỉnh i lược i có i được i giải i quyết i chưa. Phươngi thức Statici publici voidi Resolve

//Xử i lý i hiện i tượng i tỉnh i lược. f i Lớp i MergeClass i – i Đây i là i lớp i tổng i hợp i các i thuật i toán i để i xử i lý i chung.

//Xửi lýi tổngi hợpi cáci thuậti toán

Thuộci tính Privatei sentence_taggeri cur

//Thể i hiện i cấu i trúc i câu i đang i xử i lýPrivate i sentence_tagger i pre1

//Thể i hiện i cấu i trúc i câu i đang i xử i lý1 Private i sentence_tagger i pre2

//Thể i hiện i cấu i trúc i câu i đang i xử i lý2 Privatei sentence_taggeri senresult //Thểi hiệni cấui trúci câui kếti quải

//Thể i hiện i cấu i trúc i câu i đang i xử i lý Private i SentenceStruct i preSen

//Thể i hiện i cấu i trúc i câu i đang i xử i lýPhương i thức Static i public i bool i Merge(…) i //Lớp i xử i lý i tổng i hợp

i Thiết i kế i lớp

i i i i i i i i i i Vì i cấu i trúc i các i lớp i trong i mỗi i gói i đã i được i liệt i kê i đầy i đủ i trong i các i bảng i phần i trên, i vìi thếi phầni nàyi khôngi i tậpi trungi vàoi thiếti kêi lớpi củai cải chươngi trìnhi mài chỉi tậpi trungi vào i thiết i kế i lớp i của i hai i gói i phức i tạp i và i quan i trọng i nhất i là i gói i phát i hiện i hiện i tượng i ngôn i ngữ i trong i câu i và i gói i giải i quyết i tổng i hợp

Hình i 6- i Hình i biểu i đồ i lớp i gói i nhận i diện i câu.

Hì nh i 8 i - i i Biểu i đồ i lớp i gói i xử i lý i tổng i hợp

CHƯƠNG i 6 i THỬ i NGHIỆM i VÀ i ĐÁNH i GIÁ i KẾT i QUẢ

i Kiểm i thử

i Giao i diện i của i chương i trình

i i i i i i i i i i Như i đã i phân i tích i ở i trên, i chương i trình i là i một i phần i của i hệ i thống i hội i thoại i tích i hợp, i do i đó i giao i diện i được i thống i nhất i phù i hợp i với i các i yêu i cầu i của i cả i hệ i thống i hội i thoại.i Cụi thểi ,i trêni giaoi diệni sẽi cói : i i i i i i i i i Phầni trungi tâmi baoi gồmi 3i textboxi :

 Textboxi trêni cùngi lài nơii ngườii dùngi nhậpi câui hộii thoạii vớii máy.

 Textbox i ở i giữa i là i nơi i chương i trình i phân i giải i đồng i tham i chiếu i và i tỉnh i lược i in i ra i câu i của i người i dùng i sau i khi i được i hệ i thống i i xử i lý.

 Textbox i cuối i cùng i là i để i hệ i thống i hội i thoại i phản i hồi i lại i người i dùng i i i i i i i i i i Phầni bêni tráii vài vài bêni phảii cói cáci textboxi hiểni thịi cáci câui hộii thoạii phíai trướci

(textboxi bêni phải)i i Giaoi diệni cụi thểi :

i Thử i nghiệm i và i kết i quả

i i i i i i i i i Sau i đây i là i một i số i câu i thử i nghiệm i minh i họa i và i kết i quả i đầu i ra i của i chương i trình.

Bảng i thử i nghiệm Đầu i vào Đầu i ra.

1.John i lấy i chiếc i bánh i ở i trên i bàn i và i ăn i nó.

John i lấy i chiếc i bánh i ở i trên i bàn i và i ăn i chiếc i bánh

2.Johni lấyi chiếci bánhi ởi trêni bàni vài rửai nó.

Johni lấyi chiếci bánhi ởi trêni bàni vài rửai bàn.

3.Họa i sĩ i Tô i Ngọc i Vân i vẽ i được i 5 i tranh?

Tôi i nghĩ i họa i sĩ i Tô i Ngọc i Vân i vẽ i được i 5 i tranh.

4 i Họa i sĩ i Tô i Ngọc i Vân i có i được i 5 i tranh. Ảnh i ?

Họa i sĩ i Tô i Ngọc i Vân i có i được i mấy i ảnh i

5.i quốci tịchi củai họai sĩi Tôi Ngọci Vâni lài gìi ?

Quêi quáni củai họai sĩi Tôi Ngọci Vâni lài gì?

6.Họa i sĩ i Tô i Ngọc i Vân i nhà i ở i đâu?

Họa i sĩ i Tô i Ngọc i Vân i ngày i sinh i ở i đâu? F

7 i Bảo i tàng i trưng i bày i bao i nhiêu i i tranh i ?

Bảo i tàng i trưng i bày i 5 i tranh T

8 i Bức i tranh i “ i The i Mona i Lisa” i là i của i họa i sĩ i Leonardo i da i Vinci i phải i không?

Vâng, i bức i tranh i đó i do i ông i ấy i vẽ.

Vâng, i The i Mona i Lisa i do i Leonardo i da i Vinci i vẽ.

9.A: i Bức i họa i “ i The i Madonna i with i the i Yamwinder” i của i Leonardo i đã i bịi đánhi cắpi phảii không?

B:i Vâng,i bứci tranhi củai ôngi ấyi bịi đánhi cắpi vàoi hồii thángi 8/2003 bức i tranh i của i Leonardo i bị i đánh i cắp i vào i hồi i tháng i 8/2003

10 i Bạn i biết i họa i sĩ i Tô i Ngọc i Vân i chứ?

B: i có i chứ,”thiếu i nữ i bên i hoa i huệ i “ i có i chứ,”thiếu i nữ i bên i hoa i huệ i “ i chính i là i bức i tranh i sơn i dầu i nổi i tiếng i của i Tô i Ngọc i Vân i

T chính i là i bức i tranh i sơn i dầu i nổi i tiếng i của i ông i ấy

11.Ai i đã i phục i chế i bức i tranh i này i ?

Caroline i Fry i đã i phục i chế i bức i tranh i này i

12 i Bức i tranh i sơn i dầu i “ i hoa i mười i giờ” i do i họa i sĩ i nào i vẽ i ?

B: i Họa i sĩ i Vũ i Kim i Thanh

A: i Hiện i tại i ông i ý i sống i ở i Luân i Đôn i phải i không?

12 i Bức i tranh i sơn i dầu i “ i hoa i mười i giờ” i do i Vũ i Kim i Thanh i vẽ.

A: i Hiện i tại i Vũ i Kim i Thanh i sống i ở i Luân i Đôn i phải i không?

12Bức i tranh i “ i The i Mona i Lisa” i là i của i họa i sĩ i Leonardo i da i Vinci i phải i không?

B:i Vâng,i bứci tranhi đói doi ôngi tai vẽ.

Vâng,“ i The i Mona i Lisa” i do i Leonardo i da i Vinci i vẽ.

13.Quê i quán i của i họa i sĩ i Tô i Ngọc i

Chứng i minh i thư i của i họa i sĩ i Tô i Ngọc i Vân i ở i đâu i ?

14.John i lấy i chiếc i gậy i ở i trên i bàn i và i laui nó

John i lấy i chiếc i gậy i ở i trên i bàn i và i lau i chiếci gậy

15.: i Kiệt i tác” i ao i súng” i được i bán i với i giá i 80 i triệu i USD

B: i Nó i là i tác i phẩm i của i Claude i

A:Vâng, i ông i ta i là i danh i họa i ngưừoi i

Pháp i theo i trường i phái i ấn i tượng

Ao i Súng i là i tác i phẩm i của i Claude i Monet?

A:Vâng, i Claude i Monet i là i danh i họa i người i Pháp i theo i trường i phái i ấn i tượng

16 i Bạn i muốn i tìm i tranh i gì i ?

Tôi i muốn i tìm i tranh i trừu i tượng T

B: i Ông i ấy i là i đại i danh i họa i thế i giới i người i i Tây i Ban i Nha

Goya i là i đại i danh i họa i thế i giới i người i i Tây i Ban i Nha

19 i Mary i rất i yêu i quý i Lan Mary i thường i ngồi i hàng i giờ i nói i chuyện i T

Bà i ấy i thường i ngồi i hàng i giờ i nói i chuyện i với i cô i ấy với i Lan

Đánh i giá i kết i quả

i i i i i i i i i i i i Cáchi tiếpi cậni củai đồi áni nàyi dựai trêni ýi tưởngi tổngi hợpi cáci thuậti toáni cói tínhi khải thii caoi cải vềi đội chínhi xáci vài khải năngi hiệni thựci hóa.i Trongi quái trìnhi thựci hiệni đồi áni này,i emi cũngi đãi nghiêni cứui nhiềui ýi tưởngi mớii lạ,i tuyi nhiêni thựci tiễni chứngi minhi chúng i không i có i sự i khả i thi i cài i đặt i cao, i nhất i là i đối i với i tiếng i Việt i i i i i i i i i i i i i Chương i trình i đã i đạt i được i kết i quả i khả i quan i với i những i câu i hội i thoại i đồng i tham i chiếu i đơn i giản i Với i những i câu i đơn i giản i sự i nhập i nhằng i được i loại i bỏ i Với i những i câu i phức i tạp i hơn, i sự i chính i xác i của i chương i trình i bị i giảm i đi i Các i kết i quả i sai i hay i rơi i vào i trường i hợp i nhập i nhằng i giữa i câu i hỏi i – i trả i lời i của i câu i xảy i ra i hiện i tượng i tỉnh i lược, i như i vấn i đề i về i các i phụ i từ, i ngôi i nhân i xưng. i i i i i i i i i i Mặc i dù i hội i thoại i chỉ i bao i gồm i những i câu i đơn i giản i nhưng i không i vì i thế i mà i không i cói sựi nhậpi nhằngi xảyi ra.i Xéti víi dụi thựci nghiệmi thứi 14

 Johni lấyi chiếci gậyi ởi trêni bàni vài laui nó

 John i lấy i chiếc i gậy i ở i trên i bàn i và i lau i chiếc i gậy.

 John i lấy i chiếc i gậy i ở i trên i bàn i và i lau i bàn i i i i i i i i i i i Không i thể i nói i được i trường i hợp i nào i là i đúng i và i trường i hợp i nào i là i sai i nếu i chỉ i dựa i vàoi phâni tíchi cúi pháp,i phảii dựai vàoi nhữngi kiếni thứci thựci tếi vềi điềui kiệni hoàni cảnhi xảyi rai câui nóii đó. i i i i i i i i i i Thuật i toán i khá i hiệu i quả i trong i các i câu i ngắn, i có i từ i 2 i đến i 3 i đại i từ i tham i chiếu i i i i

Mặc i dù i không i phải i lúc i nào i cũng i tìm i được i tiền i ngữ i thích i hợp i nhất i dù i đã i dùng i tất i cả i các i giới i hạn i Ví i dụ:

 John i mang i một i cái i hộp i hộ i Bill i cho i Tom i Anh i ấy i còn i gửi i cậu i ta i cuốn i sách i của i Mary i i i i i i i i i i i Dù i có i đầy i đủ i các i tiền i ngữ i nhưng i “anh i ấy” i và i “cậu i ta” i vẫn i không i thể i xác i định i đượci lài i (John|Bill)i vài (Bill|Tom). i i i i i i i i i i i Chương i trình i sử i dụng i lại i phần i tách i từ i vntagger, i lấy i kết i quả i đó i làm i đầu i vào i nên i độ i chính i xác i của i chương i trình i thu i được i sẽ i là i tích i số i của i độ i chính i xác i thuật i toán i và i độ i chínhi xáci củai chươngi trìnhi vntagger.i

 Pi (chươngi trình)i =i Pi (vntagger)i *i Pi (thuậti toán).

Do i cách i tiếp i cận i này i đòi i hỏi i phải i có i một i từ i điển i mới i chứa i thông i tin i về i ngữ i nghĩa i của i từ i nhưng i em i chỉ i có i nguồn i là i cấu i trúc i cây i Semantic i và i một i từ i điển i từ i thông i dụng i chưa i có i phân i loại, i vì i thế i em i phải i tự i xây i dựng i thủ i công i nên i số i từ i chưa i nhiều i i Do i đó, i số i từ i là i chưa i nhiều i và i em i chưa i có i nhiều i thời i gian i để i thực i hiện i thử i nghiệm i chương i trình i với i nhiều i câu i và i có i một i kết i quả i đánh i giá i chính i xác i nhất i về i chương i trình. i i i i i i i i i i Chương i trình i được i xây i dựng i hướng i lĩnh i vực, i cụ i thể i ở i đây i là i lĩnh i vực i liên i qua i đếni việni bảoi tàng.i Bội từi điểni xâyi dựngi cũngi dựai trêni lĩnhi vựci này.i Lýi doi emi xâyi dựngi cáci bội từi điểni hướngi lĩnhi vựci lài đểi hạni chếi sựi nhậpi nhằngi ngữi nghĩai củai từi loại,i quai đói nângi caoi đội chínhi xáci củai chươngi trình.i Trongi thờii giani tớii emi sẽi xâyi dựngi vài thử i nghiệm i thêm i các i bộ i từ i điển i ở i lĩnh i vực i khác i để i cho i ra i kết i quả i chính i xác i nhất i

Ngày đăng: 28/07/2023, 07:51

HÌNH ẢNH LIÊN QUAN

Hình i  4.3. i  Cây i  Semantic i  1 - Do an phan giai dong tham chieu va hien tuong tinh luoc
Hình i 4.3. i Cây i Semantic i 1 (Trang 43)
Hình i  3 i  - i i  Biểu i  đồ i  tuần i  tự - Do an phan giai dong tham chieu va hien tuong tinh luoc
Hình i 3 i - i i Biểu i đồ i tuần i tự (Trang 51)
Bảng i  thử i  nghiệm - Do an phan giai dong tham chieu va hien tuong tinh luoc
Bảng i thử i nghiệm (Trang 63)
w