Câu ghép

Một phần của tài liệu BÀI TẬP LỚN MÔN XỬ LÝ NGÔN NGỮ TỰ NHIÊN Tìm hiểu về bài toán phân loại văn bản và thu thập thông tin (Trang 31)

3. Các giải pháp áp dụng cho Vietnamese Text Mining 1 Đặc trưng của văn bản tiếng Việt

3.1.4.2 Câu ghép

Về mặt ngữ pháp, câu ghép bao gồm bộ phận chủ yếu là một nòng cốt ghép, được tạo nên bởi ít nhất hai vế và mỗi vế thường bao gồm một nòng cốt đơn. Ví dụ:

Mây tan, mưa tạnh.

Tuy rằng câu đơn chỉ có một nòng cốt đơn nhưng không phải bao giờ câu đơn cũng ngắn hơn câu ghép, có những câu rất đơn giản như câu trên cũng là một câu ghép. Người ta có thể chia câu ghép thành hai loại: câu ghép song song và câu ghép qua lại [3].

3.1.4.2.1 Câu ghép song song

Là loại câu ghép có thể có hai vế hay nhiều hơn, tuy nhiên sự liên kết giữa các vế là lỏng lẻo, có thể tách thành các câu đơn mà vẫn bảo toàn nghĩa. Trong một số trường hợp các vế có quan hệ, sử dụng các kết từ, tuy nhiên ý nghĩa độc lập của các vế vẫn tương đối rõ ràng. Ví dụ:

Khán giả hò reo, cờ phất rực trời, cuộc đấu diễn ra quyết liệt. Nó vẫy tôi và tôi tiến lại phía nó.

3.1.4.2.2 Câu ghép qua lại

Là loại câu có hai vế và vế này là điều kiện tồn tại của vế kia. Có cả hai vế thì câu mới có ý nghĩa trọn vẹn. Nối giữa hai vế là các liên từ, thông thường người ta dùng cả cặp liên từ. Ta có thể biểu diễn câu ghép là câu có dạng như sau:

xN1 + yN2

Một trong các liên từ có thể được loại bỏ. Ta có một số ví dụ như sau:

- (Bởi) N1 (cho) nên/ mà N2.

- Để N1 (cho) nên/ N2.

- Nếu N1 thì N2.

- Không những N1 mà còn N2

- ...

Tôi đi thì nó chết

Ă

3.1.4.2.3 Các thành phần câu.

- Chủ ngữ: Thành phần chủ yếu của câu.

- Vị ngữ: Thành phần chính, bổ sung, giải thích ý nghĩa cho thành

phần chủ ngữ.

- Trạng ngữ: Thành phần thứ yếu, bổ sung ý nghĩa cho câu, chỉ nơi

chốn, thời gian, không gian

- Bổ ngữ: Thành phần phụ thuộc, bổ sung ý nghĩa cho động từ làm vị

ngữ.

- Định ngữ: Thành phần phụ thuộc, bổ sung ý nghĩa cho vị ngữ.

Một phần của tài liệu BÀI TẬP LỚN MÔN XỬ LÝ NGÔN NGỮ TỰ NHIÊN Tìm hiểu về bài toán phân loại văn bản và thu thập thông tin (Trang 31)

w