Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 25 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
25
Dung lượng
524,65 KB
Nội dung
Nghiên cứu nội dung cấu trúc cho ngân hàng câu tiếng Việt giải ngữ pháp Nguyễn Phương Thái , Vũ Xuân Lương , Nguyễn Thị Minh Huyền SP 7.3 - VLSP Giới thiệu Quá trình xây dựng treebank có số bước là: tìm hiểu, thiết kế, xây dựng cơng cụ, thu thập ngữ liệu thô, gán nhãn liệu Trong tài liệu chúng tơi trình bày kết giai đoạn tìm hiểu Tài liệu tổ chức thành hai phần Phần thứ trình bày loại treebank, tiếp cận xây dựng, kinh nghiệm xây dựng treebank ngôn ngữ khác Ở phần hai chúng tơi trình bày đặc điểm ngữ pháp tiếng Việt Nội dung Tìm hiểu Penn Treebank Nguyễn Phương Thái, Vũ Xuân Lương, Nguyễn Thị Minh Huyền Tìm hiểu ngữ pháp tiếng Việt Vũ Xuân Lương JAIST Trung Tâm Từ Điển Học ĐH KHTN, ĐH QGHN Tìm hiểu Penn Treebank Nguyễn Phương Thái, Vũ Xuân Lương, Nguyễn Thị Minh Huyền SP 7.3 – Dự án VLSP Nội dung: - Xây dựng tập nhãn từ loại - Xây dựng tập nhãn cú pháp - Công cụ - Chọn văn thơ - Kích thước corpus - Mã hóa cú pháp - Gán nhãn - Quá trình xây dựng tài liệu hướng dẫn gán nhãn Giới thiệu Trong tài liệu chúng tơi trình bày tiếp cận xây dựng treebank Marcus cộng (1993) Các vấn đề trình bày bao gồm: tập nhãn, tài liệu hướng dẫn gán nhãn, công cụ, cách tiến hành trình gán nhãn Đây tiếp cận kiểm chứng qua việc áp dụng cho nhiều ngôn ngữ khác như: tiếng Anh, ngôn ngữ thuộc họ Ấn-Âu; tiếng Trung, họ ngôn ngữ riêng; tiếng Hàn; tiếng Ả-rập Do kinh nghiệm xây dựng treebank ngôn ngữ đề cập Tiếp cận xây dựng treebank có sở ngơn ngữ học vững Theo chúng tơi tìm hiểu, bao gồm lý thuyết văn phạm cảm sinh khởi xướng Chomsky lý thuyết ngữ pháp chức Đây lý thuyết có ảnh hưởng lớn nghiên cứu ngơn ngữ học lẫn ngơn ngữ học tính tốn Đối với tiếng Việt, ảnh hưởng thể điển hình qua nghiên cứu Vũ Dũng (2004) Cao Xn Hạo (2006) Chúng tơi trình bày tổng quan vấn đề tài liệu khác Xây dựng tập nhãn từ loại 1.1 Các thông tin chứa nhãn từ loại Về nguyên tắc, thơng tin từ chứa từ loại bao gồm: từ loại sở (danh từ, động từ, v.v.), thơng tin hình thái (số ít, số nhiều, thì, ngơi, v.v.), thơng tin phân loại (ví dụ động từ với danh từ, động từ với mệnh đề that, v.v.), thông tin ngữ nghĩa, hay số thơng tin cú pháp khác Ví dụ nhãn NNS Penn Treebank (PTB) cho biết từ loại danh từ số nhiều, nhãn VBZ cho biết từ loại động từ ngơi thứ ba số Có điểm đáng ý nhãn từ loại treebank thường chứa thông tin từ loại sở thơng tin hình thái (phần 1.2 1.3 phân tích lại vậy) Như tập nhãn treebank nhỏ gọn nhiều tập nhãn mà nhãn thành phần chứa thơng tin khác Ví dụ tập nhãn PTB có từ loại động từ: + VB: động từ nguyên mẫu + VBZ: động từ thứ ba số ít, + VBP: động từ khơng phải ngơi thứ ba số + VBD: động từ q khứ + VBN: động từ khứ phân từ + VBG: danh động từ động từ phân từ Tập nhãn CTB có từ loại động từ (chú ý tiếng Trung khơng biến hình từ): + VA: tính từ vị ngữ Ví dụ câu: “Cơ đẹp”, “đẹp” có nhãn VA + VC: động từ nối Ví dụ câu “Anh sinh viên” , “là” có nhãn VC + VE: dành cho động từ câu “có năm sinh viên lớp”, “có” gán nhãn VE + VV: động từ khác (nội động từ, ngoại động từ, động từ tình thái, v.v.) (Trong ví dụ loại động từ CTB, tơi dùng ví dụ tiếng Việt cho dễ hiểu) Một ví dụ tập nhãn phân loại mịn từ điển OALD (Oxford Advanced Learner Dictionary), tập nhãn chứa tới 30 nhãn động từ nhãn có thơng tin phân loại (subcategorization) Từ điển COMLEX phân loại mịn với số nhãn từ loại động từ lớn gấp nhiều lần 1.2 Tính gia tăng vấn đề XLNNTN Phần tìm cách giải thích cho câu hỏi không đưa thông tin ngữ nghĩa hay thông tin phân loại vào nhãn từ loại? http://nlp.cs.nyu.edu/comlex/index.html Trước hết cần ý vấn đề XLNNTN tổ chức theo kiểu tăng dần độ phức tạp: - Phân đoạn từ - Gán nhãn từ loại - Phân tích cú pháp nơng - Phân tích cú pháp đầy đủ - Phân tích ngữ nghĩa Các nghiên cứu cho thấy cấu trúc phân cấp hiệu Khi giải vấn đề mức i, thông thường kết mức trước sử dụng Chẳng hạn phân tích ngữ nghĩa, người ta giả sử câu phân tích cú pháp đầy đủ Ngược lại, có thơng tin ngữ nghĩa có cải tiến phân tích cú pháp hay gán nhãn từ loại không? Câu trả lời thường cải tiến chí mang lại kết ngược với mong muốn Đó lý người ta không đưa ngược thông tin mức vào mức Đến ta hiểu treebank không đưa thông tin ngữ nghĩa (mức phân tích ngữ nghĩa) hay thơng tin phân loại (mức phân tích cú pháp đầy đủ) vào nhãn từ loại (mức gán nhãn từ loại) Ngay nghiên cứu ngôn ngữ học, nhiều tác giả phân loại từ dựa vào thông tin ngữ nghĩa Tuy nhiên phổ biến quan điểm phân biệt phạm trù ngữ pháp, ngữ nghĩa, ngữ dụng Khi phân biệt ta nghiên cứu lĩnh vực cách độc lập tương đối 1.3 Tính khơi phục So với số corpus khác, PTB có tập nhãn từ loại đơn giản hóa Ngồi lý nêu phần 1.2, cịn có lý quan trọng khác làm giảm tượng liệu thưa Chiến lược chủ yếu để làm giảm kích thước tập nhãn cân nhắc thông tin từ vựng thông tin cú pháp Bằng cách sử dụng thông tin từ vựng, PTB tránh dùng nhãn đặt cho từ cụ thể Ta lấy từ “have” làm ví dụ Từ vừa động từ, vừa trợ động từ Mới nhìn qua ta thấy nên đặt nhãn khác cho Tuy nhiên cần gán nhãn động từ cho trường hợp xong, việc từ trợ động từ khơng xác định dựa vào ngữ cảnh vào thông tin từ vựng (tức cần, ta dùng thủ tục đơn giản để chuyển đổi sang nhãn trợ động từ cách tự động) Tương tự vậy, từ loại mà khơi phục sử dụng thông tin cấu trúc cú pháp ta bỏ Các ví dụ có đại từ, giới từ, XLNNTN tiếp cận thống kê Vì treebank phục vụ cho nghiên cứu ngôn ngữ xử lý ngôn ngữ tiếp cận thống kê động từ với phân loại phần 1.1 (chỉ cần đặt loại thay chia thành nhiều loại) 1.4 Tính quán Một tập nhãn tốt giúp cho việc gán nhãn có tính qn cao Giảm thiểu trường hợp nhập nhằng mà người gán nhãn cảm thấy có nhiều lựa chọn Một ví dụ tập nhãn PTB khơng có nhãn RN Brown Corpus (RN loại phó từ) mà có nhãn RB cho phó từ Nếu dùng RN từ “here” “then” gán nhãn RB gán nhãn RN – chí ngữ cảnh cú pháp giống hệt 1.5 Chức ngữ pháp Có số trường hợp, nhãn từ loại xác định dựa vào chức cú pháp từ Ví dụ cụm từ “the one”, “one” gán nhãn NN (danh từ) thay CD (số từ) Lý “one” từ trung tâm cụm từ “the one” 1.6 Các trường hợp không xác định Cho dù tập nhãn thiết kế thỏa mãn tất tiêu chí kể trên, có trường hợp người gán nhãn khơng thể xác định nhãn cho từ Đối với trường hợp cần liệt kê nhãn hợp lý cho từ phân cách dấu ‘|’ thay chọn ngẫu nhiên nhãn Xây dựng tập nhãn cú pháp 2.1 Nhãn thành phần cú pháp Loại nhãn mô tả thành phần cú pháp cụm từ mệnh đề Nhãn thành phần cú pháp thông tin cú pháp, tạo thành xương sống cú pháp Tập nhãn cú pháp ngôn ngữ khác khác (ở tỉ lệ định) hai nguyên nhân Nguyên nhân khác biệt ngôn ngữ Chẳng hạn tiếng Trung, từ loại có chức làm bổ nghĩa trước cho danh từ Từ loại lại kết hợp với số từ phần phụ trước cụm danh từ Vì nhóm thiết kế Chinese Treebank (CTB) đặt nhãn cụm từ loại Đây điểm khác biệt với treebank tiếng Anh Nguyên nhân thứ hai kỹ thuật thiết kế tập nhãn Chẳng hạn với cụm từ nghi vấn, PTB có loại nhãn WHNP, WHPP, Nhiều lý thuyết cú pháp dựa cấu trúc xương sống WHADJP, WHADVP Trong CTB lại đặt nhãn chức WH Nhãn dùng kèm với nhãn cụm từ cụm từ có từ dùng để hỏi Như đủ để mô tả cụm từ nghi vấn (NP-WH, PP-WH, ADJP-WH, ADVP-WH) 2.2 Nhãn chức cú pháp Nhãn chức thành phần cú pháp cho biết vai trị thành phần cú pháp mức cao Nhãn chức cú pháp gán cho thành phần câu chủ ngữ, vị ngữ, tân ngữ Nhờ thông tin nhãn chức cung cấp ta xác định loại quan hệ ngữ pháp sau đây: - Chủ-vị - Đề-thuyết - Phần chêm - Bổ ngữ - Phụ ngữ - Sự kết hợp Ngồi nhãn chức tương ứng với loại phụ ngữ đó, ví dụ thời gian, nơi chốn, hay mục đích Như loại nhãn chức chứa thông tin ngữ nghĩa “nơng” thành phần cú pháp Hình ví dụ, cụm danh từ “the committee” có nhãn chức SBJ cho biết chủ từ câu, cịn mệnh đề trạng ngữ “while eating lunch” có nhãn chức TMP cho biết thời gian 2.3 Nhãn thành phần rỗng Đây loại thành phần đặc biệt Nó tồn (được ngầm hiểu) thành phần cú pháp cho dù khơng xuất vị trí Thơng thường thành phần rỗng gán số thành phần mà đại diện Hình ví dụ: Hình Một cú pháp tiếng Anh Công cụ Công cụ hỗ trợ người gán nhãn làm việc hiệu Có hai nội dung hỗ trợ soạn thảo cú pháp (giao diện) gán nhãn trước, sau người sửa lại Kinh nghiệm xây dựng treebank cho thấy công cụ giúp tăng tốc độ gán nhãn lên nhiều Hình công cụ soạn thảo cú pháp Tiger Treebank, treebank tiếng Đức (Sabine Brants cộng sự, 2003) Tùy điền kiện mà ta lựa chọn cơng cụ gán nhãn tự động thích hợp Chẳng hạn với việc gán nhãn từ loại, có sẵn chương trình gán nhãn từ loại ta sử dụng làm cơng cụ ln Nếu khơng ta chấp nhận việc phải gán nhãn từ đầu (bằng tay hoàn tồn) cho phần ngữ liệu thơ Sau huấn luyện hệ gán nhãn từ loại dựa phần dùng làm cơng cụ xử lý phần cịn lại kho ngữ liệu thơ Việc lặp lại trình làm việc Hình Công cụ Tiger Treebank Chọn văn thô Đối với corpus văn không gán nhãn phục vụ cho nghiên cứu từ vựng, từ điển thường lấy mẫu phạm vi rộng, bao trùm nhiều chủ đề Tuy nhiên với corpus gán nhãn cú pháp đầy đủ kích thước corpus nhỏ chủ đề hẹp Thông thường lấy chủ đề, corpus có kích thước vài chục ngàn Trên Internet có sẵn số hệ mã nguồn mở, ta tùy biến để dùng cho ngơn ngữ câu Chẳng hạn treebank tiếng Trung báo XinHua (Fei Xia cộng sự, 2000) Treebank tiếng Anh (Marcus cộng sự, 2003) gồm nhiều chủ đề, treebank lớn xây dựng công phu Giới nghiên cứu phân tích cú pháp hay sử dụng phần Wall Street Journal corpus Giả sử ta chọn báo đó, lấy theo chủ đề lấy khoảng thời gian định Cách làm giảm tượng liệu thưa Kích thước corpus Kích thước corpus vấn đề Về lý thuyết, nhiều liệu tốt, đặc biệt tool mà huấn luyện dựa vào treebank Tuy nhiên giới hạn thời gian kinh phí, thực tế corpus hạn chế kích thước Các nghiên cứu phân tích cú pháp tiếng Anh cho thấy số điều thú vị Độ xác test Penn Treebank hệ phân tích cú pháp tiếng Anh tốt đạt khoảng 90% Đường cong Hình tương quan số câu huấn luyện độ xác hệ phân tích cú pháp (Steedman Osborne, 2003) Theo hình vẽ để đạt chất lượng gần 88%, cần khoảng 10000 câu huấn luyện Đối với gán nhãn từ loại tiếng Anh, độ xác tối đa khoảng vào khoảng 97% Theo Hình 4, ta có 10000 câu (ứng với 200000 từ tố, độ dài trung bình câu khoảng 20 từ tố), chất lượng đạt 95% (Brants, 2000) Như với tiếng Anh, hai trường hợp ta đạt xấp xỉ 98% độ xác tối đa với 10000 câu huấn luyện Đây việc chọn 10000 câu làm mục tiêu cho giai đoạn 2007-2009 xây dựng treebank tiếng Việt Hình Tương quan số câu huấn luyện độ xác phân tích cú pháp Hình Tương quan số câu huấn luyện độ xác gán nhãn từ loại Mã hóa cú pháp Có hai cách thường sử dụng để mã hóa cú pháp Cách thứ đơn giản sử dụng cấu trúc dấu ngoặc Hình Theo cách thành phần cú pháp có cặp dấu ngoặc bao quanh Ngay sau dấu ngoặc ký hiệu ngữ pháp thuộc tính (nếu có) Sau danh sách thành phần cú pháp Cách thứ hai sử dụng lược đồ mã hóa XML Cách nghiên cứu kỹ lưỡng áp dụng Vì tính đơn giản mà cách sử dụng rộng rãi xây dựng treebank vào số dự án xử lý ngôn ngữ Châu Âu 10 Sau ví dụ biểu diễn cú pháp câu “I love you” lược đồ này: I love you Gán nhãn Quá trình gán nhãn câu gồm ba bước: tách từ, gán nhãn từ loại, phân tích cú pháp Qui trình thực gán nhãn tương tự nhau, nhiên bước yêu cầu kiến thức có đặc trưng riêng Trước tiên, người gán nhãn cần huấn luyện cách gán nhãn, tập nhãn, cách sử dụng cơng cụ Sau họ gán nhãn cho phần corpus thô Sau phần qui trình test kiểm tra chéo đề biết mức độ đồng thuận Cách kiểm tra chéo so sánh xem kết gán nhãn văn người (hay nhóm người) khác Nếu khác biệt q lớn có vấn đề hooặc phía người gán nhãn tài liệu hướng dẫn (thiết kế) Để so sánh, ta dùng người dùng phương pháp tự động đó, ví dụ Parseval Ngồi ra, q trình gán nhãn cần có tương tác chặt chẽ nhóm gán nhãn nhóm thiết kế có tượng ngữ pháp chưa có hướng dẫn Q trình xây dựng tài liệu hướng dẫn gán nhãn Đây tài liệu quan trọng Nó bao gồm khơng thơng tin tập nhãn, mà cịn hướng dẫn gán nhãn cho tượng cụ thể với ví dụ minh họa Để xây dựng tài liệu này, nghiên cứu tài liệu ngữ pháp kinh nghiệm xây dựng treebank có việc cần làm Ngồi cịn cần cộng tác chặt chẽ với nhà ngôn ngữ để xử lý tượng khó Khi gặp tượng khó có vài lựa chọn, chủ động chọn cần chuyển đổi sang Tham gia tổ chức workshop 10 http://www.xml-ces.org/ 10 vấn đề liên quan Nếu có điều kiện mời chuyên gia nước cố vấn Những người gán nhãn khuyến khích đưa câu hỏi trình làm việc Khi xây dựng phiên tài liệu này, nhóm thiết kế cần tự tay phân tích tập câu mẫu lấy từ sách ngữ pháp, vừa phân tích vừa viết tài liệu Kết bao trùm cấu trúc tượng ngữ pháp Bước phân tích câu lấy từ ngữ liệu thực tế (kết bước chọn văn thô) Việc quan trọng, giúp nhóm thiết kế đưa tài liệu sát với thực tế dựa vào câu mẫu sách Các vấn đề ngôn ngữ phát sinh xây dựng treebank đa dạng phức tạp nhiều so với sách ngữ pháp (Han cộng sự, 2002) Do tài liệu hướng dẫn cịn chỉnh sửa, nâng cấp, bổ xung trình gán nhãn văn Tài liệu tham khảo [1 Thorsten Brants, 2000 TnT - A Statistical Part-of-Speech Tagger In Proceedings of the Sixth Applied Natural Language Processing Conference ANLP-2000, Seattle, WA [2] Sabine Brants et al The TIGER Treebank 2003 COLING [3] Vũ Dũng 2003 Tiếng Việt ngôn ngữ học đại sơ khảo cú pháp VIET Stuttgart – Germany, 2004 [4] Chung-hye Han et al Development and Evaluation of a Korean Treebank and its Application to NLP 2002 LREC [5] Cao Xuân Hạo 2006 Tiếng Việt sơ thảo ngữ pháp chức NXB KHXH, 2006 [6] Mitchell P Marcus et al Building a Large Annotated Corpus of English: The Penn Treebank 1993 Computational Linguistics [7] Mark Steedman, Miles Osborne 2003 Bootstrapping Statistical Parsers from Small Datasets EACL 2003 [8] Mark Steedman, Rebecca Hwa 2003 Example Selection for Bootstrapping Statistical Parsers NA-ACL 2003 [9] Fei Xia et al Developing Guidelines and Ensuring Consistency for Chinese Text Annotation 2000 COLING [10] Nianwen Xue et al Building a Large-Scale Annotated Chinese Corpus 2002 COLING 11 TÌM HIỂU NGỮ PHÁP TIẾNG VIỆT Vũ Xuân Lương – Trung tâm Từ điển học I GIỚI THIỆU Để miêu tả ngôn ngữ đòi hỏi phải xác định đặc điểm ngữ pháp ngơn ngữ Ngữ pháp ngôn ngữ hệ thống bao gồm đơn vị, kết cấu quan hệ thuộc nhiều tầng bậc khác Trong ngôn ngữ, từ, ngữ câu thường biểu cụ thể ngữ pháp lại có tính khái quát cao Ngữ pháp hướng đến quy tắc cấu tạo từ, kết hợp từ quy tắc tạo câu ngôn ngữ Ngữ pháp ngơn ngữ thường có tính bền vững, hay nói hơn, có biến đổi biến đổi chậm Ngữ pháp ngơn ngữ có điểm giống khác với ngôn ngữ khác, khơng thể có chung quy tắc ngữ pháp cho ngôn ngữ Nghiên cứu ngữ pháp có hai phận từ pháp học (hình thái học) cú pháp học Từ pháp học nghiên cứu quy tắc cấu tạo từ, hình thái từ từ loại Cú pháp học nghiên cứu quy tắc kết hợp từ thành đơn vị lớn từ (cụm từ, câu), đặc điểm, chức chúng Phân tích ngữ pháp ngôn ngữ nhằm cấu tạo nên hệ thống quy tắc ngữ pháp Với lập luận là: Từ tập hợp (corpus) đủ lớn mẫu câu khác lấy từ thể loại văn khác nhau, dựa vào thành tựu nghiên cứu ngữ pháp ngữ nghĩa tiếng Việt, phân tích câu tiếng Việt thành đơn vị nhỏ hơn, tiến hành phân loại mô hình hố, tổ chức lại thành sở ngữ liệu Dựa vào sở ngữ liệu xây dựng cơng cụ phân tích tự động văn phạm tiếng Việt máy tính Cơng việc cụ thể q trình hình dung sau: - Dựa vào bảng từ từ điển, xây dựng bảng từ vựng tiếng Việt có gán nhãn từ loại; - Căn vào quy tắc ngữ pháp mối quan hệ ngữ nghĩa tiếng Việt, xây dựng chương trình máy tính có nhiệm vụ phân tích câu văn mẫu thành đơn vị từ vựng; - Xây dựng chương trình máy tính có nhiệm vụ sử dụng bảng từ (có gán nhãn từ loại) để gán nhãn từ loại tự động trở lại cho đơn vị từ vựng văn mẫu; - Dùng tri thức chuyên gia kiểm tra lại kết gán nhãn từ loại tự động Khôi phục lại văn dạng gồm đơn vị câu; - Phân tích câu gán nhãn từ loại thành đơn vị ngữ pháp nhỏ câu ngữ; phân tích ngữ thành đơn vị nhỏ ngữ từ Mã hố chúng dạng mơ hình; - Tổ chức đơn vị câu ngữ thành sở ngữ liệu, thống kê đưa mẫu mơ hình câu mơ hình ngữ; 12 - Từ đơn vị hữu hạn mơ hình câu mơ hình ngữ, xây dựng chương trình phân tích văn phạm tiếng Việt Thao tác phân tích thành tố trực tiếp thao tác mở rộng áp dụng việc phân tích câu Quy tắc viết lại Chomsky áp dụng để miêu tả mã hoá câu đơn vị câu II XÁC ĐỊNH ĐƠN VỊ NGỮ PHÁP TIẾNG VIỆT A TỪ PHÁP HỌC Do tiếng Việt ngơn ngữ đơn lập, từ có hình thức khơng thể biến đổi biến dạng phái sinh, nên phạm vi báo cáo, không đề cập đến phần nghiên cứu hình thái từ Chúng tơi tập trung đề cập tới phận nghiên cứu từ vựng từ loại Từ từ vựng Từ vựng vốn từ ngôn ngữ Vốn từ tập hợp tất từ đơn vị tương đương với từ (cụm từ cố định / ngữ cố định) ngôn ngữ Thông thường, từ vựng phản ánh từ điển Từ điển khoa học tập hợp vốn từ cho mục đích thực dụng ngơn ngữ Từ tiếng Việt, cấu tạo, khơng có tố phụ tố; ngữ nghĩa, khơng có ý nghĩa thuộc phạm trù hình thái; hoạt động tạo câu, mối liên hệ ngữ pháp không biểu biến hình mà biểu trật tự từ Trong tiếng Việt, có đơn vị dễ nhận biết mà trước quen gọi “tiếng” hay “chữ” Gọi “tiếng” vào ngữ âm, ví dụ: nói dằn tiếng một; gọi “chữ” vào văn tự, ví dụ: “Chữ tài liền với chữ tai vần”, câu thơ có bảy chữ - Tiếng đơn vị phát âm tự nhiên nhỏ nhất, coi trùng với âm tiết - Tiếng đơn vị nhỏ mang nghĩa, góc độ ngữ pháp gọi hình vị, góc độ cấu tạo từ gọi từ tố - Tiếng đơn vị nhỏ nhất, đóng vai trị làm đơn vị dùng để tạo thành phần câu, coi vai trò từ Từ ba nhận xét ta phân tiếng tiếng Việt thành loại sau: a) Những tiếng mang ý nghĩa thực sông, núi, đi, đứng, nhớ, thương độc lập làm thành phần câu có đầy đủ tư cách ngữ nghĩa, ngữ pháp gọi từ điển hình b) Những tiếng nhưng, mà, tuy, nên không độc lập làm thành phần câu sử dụng với chức tạo thành phần câu có ý nghĩa ngữ pháp từ điển hình gọi từ công cụ c) Những tiếng gốc Hán sơn, thuỷ, gia, bất tiếng mờ nghĩa, thường khơng đứng mà tổ hợp với tiếng khác cộ (xe cộ), đẽ (đẹp đẽ), vẻ 13 (vui vẻ) đơn vị có chức tạo từ, lâm thời sử dụng từ Như vậy, từ tiếng Việt đơn vị nhỏ có nghĩa hồn chỉnh cấu tạo ổn định, dùng để tạo thành phần câu Từ vừa đối tượng nghiên cứu từ vựng-ngữ nghĩa học, vừa đối tượng nghiên cứu ngữ pháp học - Chỉ có tiếng loại (a) loại (b) coi từ Đó từ đơn tiết Từ đơn tiết đơn vị từ vựng tiếng Việt, có tần số sử dụng cao, nên có khả chuyển nghĩa khả tạo từ đa tiết lớn - Từ đa tiết từ có tiếng, gồm hai loại: từ láy từ ghép + Từ láy từ có tiếng, cấu tạo theo dạng thức đặc thù tiếng Việt, dạng thức hồ phối ngữ âm từ đơn vị có Từ tạo theo dạng láy thường đồng nghĩa (nhưng không hồn tồn) với đơn vị gốc, chúng có khác nhiều sắc thái ngữ nghĩa khả tổ hợp Ví dụ: trắng - trăng trắng; đẹp - đèm đẹp, bé - be bé, v.v + Từ ghép từ có tiếng, có quan hệ ghép nghĩa cấu tạo Những từ ghép hai yếu tố song kết liên hợp lại có ý nghĩa thuộc phạm trù, gọi từ ghép đẳng lập (vd thầy trị, giảng dạy, ăn mặc, ) Những từ ghép gồm yếu tố làm trung tâm ngữ pháp, ngữ nghĩa yếu tố phụ hạn định bổ sung nét nghĩa khu biệt cho nó, gọi từ ghép phụ (vd dưa lê, dưa gang, đậu đũa, xe lửa, làm duyên, ăn cánh, ) Những tiếng ghép lại với không rõ ghép nghĩa khơng theo quy luật hồ phối ngữ âm nào, để tạo từ ngẫu kết gọi từ ghép ngẫu kết (vd bù nhìn, bồ kết, bùng nhùng, mặc cả, tắc kè, ) - Ngoài từ đơn, từ láy từ ghép ra, tiếng Việt có tổ hợp từ ổn định cấu tạo, có nghĩa dùng đơn vị để tạo thành phần câu Đó tổ hợp từ cố định (cụm từ cố dịnh / ngữ cố định) Tổ hợp từ cố định có hai loại, thành ngữ quán ngữ + Thành ngữ tổ hợp từ cố định quen dùng, nghĩa thường khơng giải thích cách đơn giản nghĩa yếu tố tạo nên cộng lại, mà thường có nghĩa bóng, có tính biểu cảm (vd áo gấm đêm, ăn hương ăn hoa, ) Tuy gọi "ngữ", thành ngữ có kết cấu chủ-vị, chức để tạo thành phần câu, chức từ + Quán ngữ tổ hợp từ cố định dùng lâu thành quen, cơng thức có sẵn, nghĩa suy từ nghĩa yếu tố tạo thành (vd lên lớp, lên mặt, nghĩ cho cùng, nói tóm lại, ) Tóm lại, phân tích văn bản, ta thu đơn vị ngữ pháp xếp theo thứ bậc thấp dần Cái đơn vị tìm sau câu ngữ, sau ngữ từ Từ chỉnh thể tự nhiên hữu hạn ngôn ngữ Từ loại Từ đơn vị hữu hạn, số lượng lên tới hàng vạn Mỗi từ có nét nghĩa riêng, tìm thấy nét giống ý nghĩa khái quát, khả 14 kết hợp với từ ngữ khác câu Phân loại từ theo đặc điểm ý nghĩa khái quát khả hoạt động cú pháp, ta có từ loại Từ loại phạm trù ngữ pháp bao gồm đặc điểm ngữ pháp, quan hệ cú pháp ý nghĩa khái quát đơn vị từ vựng Căn vào từ loại nhận chức đơn vị từ vựng hoạt động ngôn ngữ, chẳng hạn chức chủ ngữ danh từ, vị ngữ động từ, v.v Do đặc thù tiếng Việt có đơn vị từ vựng chưa xác định từ loại Những đặc điểm có tính chất khái quát nêu từ vựng từ loại phản ánh tương đối rõ ràng từ điển tiếng Việt Vì vậy, thay xây dựng bảng từ vựng từ đầu, dựa vào danh sách từ vựng từ điển tiếng Việt cụ thể, có đưa thêm vào đơn vị từ vựng xuất hiện, tiến hành gán nhãn (tag) từ loại cho đơn vị từ vựng Chúng dựa vào cách phân chia từ loại từ điển đưa danh sách từ loại cần phải gán nhãn sau: từ loại ý nghĩa từ vựng quan hệ cú pháp danh từ động từ tính từ đại từ có ý nghĩa thực (thực từ) có khả làm trung tâm thành phần câu phụ từ kết từ trợ từ cảm từ ý nghĩa thực (hư từ) khơng có khả làm trung tâm thành phần câu B CÚ PHÁP HỌC Trong ngơn ngữ, bên cạnh từ, cịn có đơn vị khác có khả hoạt động độc lập từ Đó cụm từ (ngữ) * câu Khái lược ngữ Trong hoạt động ngôn ngữ, từ làm thành tố cú pháp, kết hợp với số từ khác làm thành tố cú pháp Ví dụ: * a) Nó đọc sách sách làm thành tố cú pháp b) Nó đọc sách văn học sách kết hợp với thực từ làm thành tố cú pháp: sách văn học Từ trở gọi ngữ 15 c) Nó nói sách văn học sách kết hợp với hư từ làm thành tố cú pháp: sách văn học Thông thường, thực tế sử dụng ngôn ngữ để giao tiếp, dùng loại câu có thành tố cú pháp từ, mà chủ yếu dùng câu có thành tố cú pháp ngữ Chẳng hạn câu: Những hoa vườn nở thắm (1) (2) (3) Ngữ (1) (2) mang đặc điểm ngữ pháp danh từ hoa vườn; ngữ (3) mang đặc điểm ngữ pháp động từ nở, ngữ có chức câu Như vậy, ngữ đơn vị cú pháp trung gian từ câu, có cấu tạo gồm từ trung tâm liên kết với thành phần phụ quan hệ phụ Từ trung tâm quy định đặc điểm ngữ pháp chức toàn kết cấu 1.1 Cấu tạo ngữ Ở dạng đầy đủ, ngữ gồm thành phần: phần phụ trước - trung tâm - phần phụ sau Ví dụ: tất bơng hoa vừa hái phần phụ trước trung tâm phần phụ sau - Trung tâm thành tố chi phối xuất thành tố phụ trước sau ngữ Từ đóng vai trị trung tâm phải thực từ, hư từ Từ trung tâm thuộc từ loại ngữ mang đặc điểm ngữ pháp chức từ loại - Phần phụ ngữ, mặt ngữ pháp thành tố phụ có tác dụng bổ sung ý nghĩa cho từ làm trung tâm Chúng kết chi phối đặc điểm ngữ pháp từ trung tâm nhu cầu giao tiếp Ví dụ: một hầu hết con con mèo mèo mèo mèo mèo đen đen đen đen Các ví dụ cho thấy có mặt thành tố trung tâm ngữ bắt buộc Ngữ dạng đầy đủ gồm phần, dạng khuyết xuất thêm hai phần phụ 1.2 Chức ngữ Ngữ kết thao tác mở rộng theo quan hệ phụ từ trung tâm Do đó, ngữ mang đặc điểm ngữ pháp chức từ trung tâm Từ trung tâm danh từ ngữ mang đặc điểm chức danh từ, gọi ngữ danh từ (danh ngữ) Từ 16 trung tâm động từ ngữ mang đặc điểm chức động từ, gọi ngữ động từ (động ngữ) Từ trung tâm tính từ ngữ mang đặc điểm chức tính từ, gọi ngữ tính từ (tính ngữ) 1.2.1 Ngữ danh từ Ở dạng đầy đủ, ngữ danh từ có phần: phần phụ trước - trung tâm - phần phụ sau Phần phụ danh ngữ gọi định tố Ngữ danh từ có chức làm thành tố ngữ (vd Cháu yêu đội), làm thành phần câu (Những dịng sơng đỏ nặng phù sa) a) Trung tâm danh ngữ Trung tâm danh ngữ danh từ Việc xác định trung tâm danh ngữ thuận lợi, khó khăn có hai từ đứng liền nhau, danh từ đơn vị danh từ nội dung cụ thể đơn vị Ví dụ: hai dao sách mười cam Có quan điểm để xác định từ trung tâm: - Quan điểm thứ cho danh từ đứng sau trung tâm xác định trung tâm ngữ nghĩa, đồng thời trung tâm ngữ pháp ngữ - Quan điểm thứ hai cho hai danh từ liên hợp với làm trung tâm ghép ngữ - Quan điểm thứ ba cho có danh từ làm trung tâm, tức cho dao, sách, cam danh từ trung tâm - Quan điểm thứ tư cho danh từ đứng trước trung tâm ngữ phù hợp với cách nhìn người ngữ nhận thức thực khách quan, phù hợp với trật tự quan hệ chính-phụ thơng thường tiếng Việt Chúng tơi chọn quan điểm thứ tư, vì: Nếu chọn quan điểm thứ có nhiều trường hợp khó xác định ranh giới từ trung tâm với thành tố phụ ngữ Ví dụ: “khe đá nứt” hiểu đá nứt thành khe hay khe có tồn đá nứt? Việc hiểu định cách miêu tả Nếu chấp nhận quan điểm thứ hai mâu thuẫn với quan điểm xác định trung tâm ngữ thường từ từ có quan hệ đẳng lập với đảm nhiệm (vd Hà Nội, Hải Phòng nhiều thành phố khác) Nếu chấp nhận quan điểm thứ ba phải chấp nhận dao, sách, cam từ Điều dẫn đến quan niệm lại cấu tạo từ tiếng Việt b) Định tố danh ngữ - Định tố trước danh ngữ thường từ lượng, chia làm nhóm Nhóm gồm đại từ danh từ tổng số: tất cả, thảy, cả, tồn Nhóm gồm danh từ số phụ từ lượng: một, những, các, mọi, vài, mỗi, 17 - Định tố sau danh ngữ tương đối phức tạp, từ, ngữ, kết cấu chủ-vị Ví dụ: cột tre cột tre cột tre gãy hôm qua (định tố từ) (định tố ngữ) (định tố kết cấu chủ-vị) Định tố sau có tác dụng hạn định loại cho trung tâm, thường danh từ khơng đếm danh ngữ có trung tâm danh từ không đếm (vd cân thịt, cân thịt nạc vai ) Định tố sau có tác dụng hạn định đặc trưng cho trung tâm, thường động từ, động ngữ, tính từ, tính ngữ (vd nhân viên bảo vệ, nhân viên bảo vệ sân bay, màu vàng, màu vàng no ấm ) Định tố sau nhằm xác minh cho trung tâm, thường có cấu tạo kết cấu có quan hệ từ kết cấu chủ-vị (vd sách mẹ mua hôm qua ) Định tố sau nhằm định cho trung tâm thường đại từ định thường nằm vị trí cuối ngữ danh từ (vd người bạc ác ) 1.2.2 Ngữ động từ Ở dạng đầy đủ ngữ động từ có phần: phần phụ trước - trung tâm - phần phụ sau Phần phụ động ngữ gọi bổ tố a) Trung tâm động ngữ Trung tâm động ngữ động từ Việc xác định trung tâm động ngữ, nói chung, tương đối dễ dàng Chỉ khó khăn xác định trường hợp có hai động từ đứng liền nhau, ví dụ: ngồi xem phim, định đọc sách Có nhiều quan điểm khác trường hợp - Quan điểm thứ cho động từ đứng sau trung tâm, cho động từ đứng sau trung tâm ngữ pháp ngữ Động từ đứng trước coi không hoạt động độc lập, có hoạt động độc lập bổ sung ý nghĩa cho hoạt động biểu thị động từ đứng sau Chẳng hạn: nằm xem phim, có người hỏi: Anh làm đấy? trả lời: nằm xem phim, ngồi xem Như vậy, trọng tâm thông báo “đang xem phim”, “ngồi xem phim” hay “nằm xem phim” - Quan điểm thứ hai xác định trung tâm động từ đứng trước, cho phù hợp với cảm nhận người ngữ phù hợp với trật tự quan hệ chính-phụ thơng thường tiếng Việt Chúng chấp nhận quan điểm thứ hai, vì: Nếu theo quan điểm thứ khó lí giải trường hợp sau: cần làm | cần tiền muốn ăn | muốn cam BT BT TT TT BT TT TT BT (TT: trung tâm; BT: bổ tố) Chấp nhận quan điểm thứ hai thuận lợi thao tác phân tích ngữ động từ 18 b) Bổ tố động ngữ - Bổ tố trước động ngữ thường phụ từ tình thái đảm nhận Gồm: Phụ từ cầu khiến: hãy, đừng, Phụ từ khẳng định hay phủ định: có, khơng, chưa, chẳng Phụ từ thời gian: đã, từng, đang, sẽ, Phụ từ so sánh: cũng, vẫn, cứ, cịn, ln, ln luôn, mãi, mãi Phụ từ mức độ: rất, hơi, - Bổ tố sau động ngữ, số lượng khơng hạn chế, nhu cầu giao tiếp chi phối Tuy nhiên, chi phối đặc điểm ngữ pháp động từ trung tâm, xuất số bổ tố vị trí xuất chúng xác định Ví dụ: (Bộ đội) kéo pháo sang sơng (Tơi) hiểu điều anh nói có mùa hoa cải bị cảm cúm dạy học hát gửi lại cho anh nửa vầng trăng, v.v Cũng định tố sau danh ngữ, bổ tố sau động ngữ từ, ngữ, cụm chủ-vị, chí liên hợp chủ-vị Ngữ động từ có chức làm thành tố ngữ (vd Cầu thủ đoạt giải bóng vàng người Braxin), làm thành phần câu (Chết vinh sống nhục) 1.2.3 Ngữ tính từ Ở dạng đầy đủ ngữ tính từ có phần: phần phụ trước - trung tâm - phần phụ sau Phần phụ tính ngữ gọi bổ tố a) Trung tâm tính ngữ Trung tâm tính ngữ tính từ (vd sành âm nhạc, giỏi hùng biện, xanh màu xanh hi vọng) Việc xác định trung tâm tính ngữ có khó khăn thành tố trung tâm tính ngữ có liên quan đến thành tố trung tâm ngữ động từ Ví dụ: bình tĩnh bám vào hăng hái tiến cơng và bám vào bình tĩnh tiến công hăng hái - Quan điểm thứ theo trật tự quan hệ phụ tiếng Việt cho rằng, thành tố đứng trước trung tâm - Quan điểm thứ hai mặt ngữ nghĩa cho rằng, tính từ bình tĩnh, hăng hái tổ hợp có tác dụng bổ nghĩa cho động từ bám tiến công Cho dù vị trí thành tố thay đổi quan hệ ngữ pháp ý nghĩa không thay đổi - Quan điểm thứ ba xử lí tương tự quan điểm thứ hai, lại thừa nhận có thay đổi ngữ nghĩa vị trí thành tố thay đổi Chúng tơi chấp nhận quan điểm thứ 19 b) Bổ tố tính ngữ - Bổ tố trước tính ngữ giống bổ tố trước động ngữ Tuy nhiên cần lưu ý thêm số đặc điểm sau: + Hầu hết tính từ có khả kết hợp với phụ từ mức độ, khả xuất phụ từ loại thường xuyên (vd anh hùng, béo, thơng minh ) + Chỉ có số tính từ có khả kết hợp với phụ từ mệnh lệnh, cầu khiến (vd dại dột thế, dũng cảm lên, đừng xanh bạc vơi) - Bổ tố sau tính ngữ: Tính từ không chi phối xuất số lượng bổ tố sau, mà số lượng bổ tố sau phụ thuộc vào nhu cầu mục đích giao tiếp Cũng giống động ngữ, bổ tố sau tíng ngữ từ, ngữ, kết cấu chủ-vị, liên hợp kết cấu chủ-vị Ngữ tính từ có chức làm thành tố ngữ (vd đỏ rực màu lửa), làm thành phần câu (Hèn nhát điều tưởng tượng nổi, Biển bạc đầu thương nhớ) Khái lược câu Câu đơn vị lời nói, từ ngữ tạo thành, có ngữ điệu định, diễn đạt ý trọn vẹn Trong hoạt động lời nói, sử dụng câu có thành phần câu từ, mà chủ yếu ngữ Câu ngữ tạo thành gồm có nịng cốt thành phần phụ bổ sung cho nòng cốt Nòng cốt câu gồm hai thành phần chính, chủ yếu chủ ngữ vị ngữ Trong thực tế sử dụng, câu có đầy đủ thành phần, rút gọn Thơng thường câu nịng cốt đơn có phần đề phần thuyết Tuy nhiên, nhu cầu q trình tư duy, giao tiếp mà câu có cấu tạo đơn giản hay phức hợp, có nòng cốt đơn hay nòng cốt ghép 2.1 Các thành phần câu 2.1.1 Chủ ngữ Chủ ngữ hai thành phần yếu câu đơn thơng thường, nêu đối tượng mà hành động, tính chất, trạng thái nói rõ vị ngữ Như vậy, mặt ngữ pháp, chủ ngữ thành phần chi phối xuất vị ngữ Trong tiếng Việt, chi phối thể trật tự chủ - vị Về mặt ý nghĩa, chủ ngữ thơng báo, cịn gọi phần đề Chủ ngữ tiếng Việt đa dạng Nói chung, tất kết cấu ngữ pháp trực tiếp làm chủ ngữ Tuy nhiên, đặc trưng phần nêu đối tượng, nên phần lớn câu tiếng Việt danh ngữ đảm nhiệm Về mặt thông báo, chủ ngữ thường biết nói rõ vị ngữ, nên tình giao tiếp cụ thể, rút bớt cho gọn Ví dụ: Có đâu mà phải sợ! Vả lại làm quan mà khơng ăn lộc, làm quan làm quái gì? 2.1.2 Vị ngữ 20 Cũng chủ ngữ, vị ngữ thành phần yếu câu đơn, nói rõ hành động, tính chất, trạng thái đối tượng nêu chủ ngữ Trong tiếng Việt, mặt ngữ pháp, vị ngữ thường đứng sau chủ ngữ Về mặt thông báo, vị ngữ phần nêu rõ nói tới chủ ngữ, nên cịn gọi phần thơng báo phần thuyết (thuyết minh cho phần đề) Tuy nhiên, tình sử dụng ngơn ngữ cụ thể, mục đích dụng pháp, mà có thay đổi trật tự quan hệ chủ-vị Ví dụ: Từ xa tiến lại người cao to, vạm vỡ Nhớ nước đau lòng cuốc cuốc Thương nhà mỏi miệng gia gia Vị ngữ tiếng Việt đa dạng, tất kết cấu ngữ pháp có khả đảm nhiệm thành phần này, phổ biến động từ ngữ động từ tính từ ngữ tính từ đảm nhiệm Các kết cấu ngữ pháp khác đảm nhiệm chức vị ngữ thường phải có điều kiện, chẳng hạn phải có mặt từ quan hệ Ví dụ: Cháu cháu nói Chúng vợ chồng Chồng anh Vợ tơi 2.2 Các thành phần phụ câu 2.2.1 Trạng ngữ Trạng ngữ thành phần phụ quan trọng câu, biểu thị ý nghĩa tình thời gian, địa điểm, nguyên nhân, mục đích, phương tiện cho thơng báo câu Vị trí trạng ngữ nằm đầu câu, câu cuối câu Nhưng phổ biến nằm đầu câu Ví dụ: Hiện tơi Hà Nội Tàu đỗ ga Hà Nội Hai cậu bé tiến lại từ đằng xa Vai trò trạng ngữ thường liên quan đến toàn câu phần chủ ngữ Đảm nhiệm chức trạng ngữ thường phụ từ (trạng từ) hay tính từ 2.2.2 Khởi ngữ Trong tiếng Việt có thành phần phụ đặc biệt, nằm trước nòng cốt, gọi khởi ngữ, khởi ý hay đề ngữ Về ý nghĩa, khởi ngữ thường thành phần nêu lên ý mở đầu Giá trị thơng báo tập trung thành phần Về cấu tạo, thành phần khởi ngữ đưa trở lại làm phụ tố cho thành phần nòng cốt, lặp lại nòng cốt hay đại từ Ví dụ so sánh: Tấm áo ấy, thường mặc - Con thường mặc áo Nhà, ơng có hàng dãy phố - Ơng có hàng dãy nhà phố Giàu, giàu Thần tốc táo bạo, hiệu tiến cơng qn đội ta 2.2.3 Hô ngữ 21 Hô ngữ thành phần dùng để than gọi, thường đại từ xưng hô danh từ riêng kết hợp với cảm từ, từ khác bẩm, thưa, kính, tạo thành Ví dụ: Người ơi, người đừng Em ạ, Cuba lịm đường Bẩm cụ, Cụ cho cho gọi ! Này, anh nói ? Vị trí hơ ngữ đầu câu, câu cuối câu Giữa hô ngữ thành phần khác câu phải có quãng ngắt nói có dấu phẩy viết Ví dụ: Anh em ơi, nhân dân quên Tỉnh dậy em ơi, qua ác mộng 2.2.4 Thành phần thích Thành phần thích dùng để giải thích thêm thành phần nịng cốt, cho yếu tố thành phần đó, bổ sung ý nghĩa tình thái cho câu Ví dụ: Người lớn – chắn – ln Ngày sinh, ngày 19 tháng 8, ngày rực nắng Đẹp quá, đàn cò trắng bay qua đồng Vị trí thành phần thích thường nằm nịng cốt, đứng trước nịng cốt 2.2.5 Thành phần chuyển tiếp Thành phần chuyển tiếp dùng để dẫn vào nội dung thông báo với tác dụng tiếp ý phần trước, với tác dụng đưa đẩy Thành phần thường quán ngữ đảm nhận Do đóng vai trị chuyển tiếp câu, nên thành phần thường đứng đầu câu đơn, xen vào Ví dụ: Tóm lại, thực theo kế hoạch định Nhìn chung, nên nhìn nhận lại tất xảy Dù nữa, tâm thực ý định Tưởng tốt, trái lại, ngày tồi 2.3 Phân loại câu Căn theo cấu tạo ngữ pháp câu để phân loại câu Việt hướng phân loại quan trọng Cách phân loại dẫn đến việc dễ dàng nhận cấu tạo ngữ pháp câu, quan trọng hơn, tạo câu theo mơ hình cho trước Câu tiếng Việt nhìn chung phân thành ba loại: câu đơn, câu phức câu ghép 2.3.1 Câu đơn Câu đơn câu cấu tạo kết cấu chủ-vị, “nòng cốt đơn”, cịn gọi câu đơn bình thường Ví dụ: 22 Khỉ mẹ có hai khỉ CN VN Bữa người ta rượt đuổi khỉ mẹ CN VN Câu đơn mà nòng cốt ngữ tạo thành gọi câu đơn đặc biệt Ví dụ: Vợ với chả con! Chết thật! (Ai xui dại không biết) Do ngữ trở thành câu đơn đặc biệt phải phụ thuộc vào bối cảnh giao tiếp mục đích thơng báo, nên khơng thể xác định đâu chủ ngữ, đâu vị ngữ câu đơn bình thường Vì vậy, miêu tả, miêu tả theo cấu trúc quan hệ ngữ Câu đơn bình thường, bối cảnh giao tiếp mục đích thơng báo cho phép, nhờ quy luật tiết kiệm ngơn ngữ, lược bớt thành phần câu gọi câu đơn rút gọn Ví dụ: Thế nào, xong đám cưới ! Không muốn ăn ? Không ăn uống ! Khác với câu đơn đặc biệt, câu đơn rút gọn xác định đâu chủ ngữ, đâu vị ngữ Khi miêu tả, chúng tơi miêu tả câu đơn bình thường, thành phần câu rút gọn để trống giá trị 2.3.2 Câu phức Câu phức câu có kết cấu chủ-vị, mà kết cấu chủ-vị nịng cốt cịn có kết cấu chủ-vị (C-V) làm thành vế thuộc câu phụ, vd: Vì mây tan nên mưa tạnh CN VN CN VN làm phần phụ ngữ thuộc thành phần câu, vd: Thực tế chứng minh anh vô tội C CN V VN Câu phức biểu qua kết cấu ngữ pháp có quan hệ phụ Về ý nghĩa, biểu thị phán đốn phức hợp, suy lí suy từ trật tự lơgic Nếu thay đổi trật tự lơgic nội dung suy lí bị thay đổi So sánh: Khi nói “Mây tan, mưa tạnh” “mây tan” nêu nguyên nhân dẫn đến kết “mưa tạnh” Khi đảo thành “Mưa tạnh, mây tan” nội dung câu bị thay đổi khơng cịn tính chất “suy lí” Tức dẫn đến nội dung phi lí so với nhận thức thông thường: kết dẫn đến nguyên nhân 23 Cần phân biệt câu phức với câu đơn bình thường có thành phần phụ, ví dụ: Khi có tiền, tơi mua xe Làm thế, ơng thưởng Những câu kiểu như: Thế ; Vậy coi câu phức đặc biệt Khi miêu tả, gặp nhiều khó khăn, cần phải nghiên cứu thêm 2.3.3 Câu ghép Câu ghép biểu hai kết cấu chủ-vị trở lên có quan hệ đẳng lập với Thực chất liên hợp kết cấu chủ-vị thuộc bậc câu với câu Về quan hệ ngữ nghĩa kết cấu chủ-vị quan hệ liệt kê, quan hệ nối tiếp, Dấu hiệu phân biệt biểu quan hệ từ, dấu câu Ví dụ: Anh đến tơi hay tơi đến anh Con cá, yêu nước ; chim ca, yêu trời Câu ghép có hình thức gây cảm giác giống với câu đơn bình thường có nhiều vị ngữ, nên cần phải ý phân biệt Ví dụ: Ơng bình tĩnh bám vào khe đá leo lên nhẹ nhàng Chị yêu chồng, thương Những câu kiểu như: Nghèo vui ; Khơng chồng vợ coi câu ghép đặc biệt, gặp khó khăn miêu tả giống câu phức đặc biệt Kết luận Trên chúng tơi trình bày hướng phân tích câu tiếng Việt thành đơn vị ngữ pháp kết cấu ngữ pháp Có thể áp dụng quy tắc cấu trúc ngữ đoạn Ngữ pháp tạo sinh để miêu tả câu tiếng Việt Tổ chức câu miêu tả thành sở ngữ liệu để rút danh sách mơ hình cấu tạo câu ngữ tiếng Việt Từ mô hình hữu hạn xây dựng chương trình phân tích văn phạm tiếng Việt Kết phân tích văn phạm đạt chất lượng phụ thuộc vào số lượng câu phân tích mẫu, phụ thuộc vào thao tác phân tích thành phần câu có xác hay khơng Tuy nhiên, theo hướng đề cập không tránh khỏi nhược điểm thường gặp, chẳng hạn khó khăn miêu tả số mẫu câu đơn câu ghép đặc biệt tiếng Việt Kiểu như: Gió ! Mưa ! Bão bùng! Thế thơi ! v.v Nhìn xa hơn, có sở ngữ liệu mẫu đủ lớn, với kĩ thuật tin học, hi vọng công việc mà thực giúp phần làm sáng tỏ quy tắc ngữ pháp tiếng Việt 24 TÀI LIỆU THAM KHẢO Uỷ ban Khoa học Xã hội Việt Nam, Ngữ pháp tiếng Việt, Nhà xuất KHXH, Hà nội, 1983 Uỷ ban Khoa học Xã hội Việt Nam, Viện Thông tin Khoa học Xã hội, Ngôn ngữ học khuynh hướng – lĩnh vực – khái niệm, Tập 1, Nhã xuất KHXH, 1984 Nguyễn Tài Cẩn, Từ loại danh từ tiếng Việt, Nhà xuất KHXH, Hà Nội, 1975 Nguyễn Tài Cẩn, Ngữ pháp tiếng Việt, Nhà xuất Đại học Quốc gia, Hà Nội Nguyễn Thiện Giáp (chủ biên) – Đoàn Thiện Thuật – Nguyễn Minh Thuyết, Dẫn luận ngôn ngữ học, Nhà xuất Giáo dục, 1995 Cao Xuân Hạo, Tiếng Việt - vấn đề ngữ âm, ngữ pháp, ngữ nghĩa, Nhà xuất Giáo dục, 1998 Cao Xuân Hạo (chủ biên) – Hoàng Xuân Tâm – Nguyễn Văn Bằng – Bùi Tất Tươm, Câu tiếng Việt (quyển 1), Nhà xuất Giáo dục, 1982 Bùi Tất Tươm (chủ biên) –Nguyễn Văn Bằng – Hoàng Xuân Tâm – Nguyễn Thị Quy – Hồng Diệu Minh, Giáo trình tiếng Việt, Nhà xuất Giáo dục, 1994 Hồ Lê, Cú pháp tiếng Việt (quyển 3), Nhà xuất KHXH, Hà Nội, 1993 10 Nguyễn Văn Hiệp, Các thành phần phụ câu tiếng Việt, Luận án phó tiến sĩ khoa học ngữ văn, Hà Nội 1992 11 Noam Chomsky, Topics in the Theory of Generative Grammar, The Hague – Paris, 1966 12 Nancy Ide and Jean Véronis, Text Encoding Initiative, Kluwer Academic Publishers (Reprinted from Computer & the Humanities, volume 29, Nos 1,2 & (1995)) (Bản dịch tiếng Việt Ngô Trung Việt) 25 ... chậm Ngữ pháp ngơn ngữ có điểm giống khác với ngôn ngữ khác, khơng thể có chung quy tắc ngữ pháp cho ngôn ngữ Nghiên cứu ngữ pháp có hai phận từ pháp học (hình thái học) cú pháp học Từ pháp học nghiên. .. Có thể áp dụng quy tắc cấu trúc ngữ đoạn Ngữ pháp tạo sinh để miêu tả câu tiếng Việt Tổ chức câu miêu tả thành sở ngữ liệu để rút danh sách mơ hình cấu tạo câu ngữ tiếng Việt Từ mơ hình hữu hạn... quy tắc ngữ pháp Với lập luận là: Từ tập hợp (corpus) đủ lớn mẫu câu khác lấy từ thể loại văn khác nhau, dựa vào thành tựu nghiên cứu ngữ pháp ngữ nghĩa tiếng Việt, phân tích câu tiếng Việt thành