Nội dung chính của bài viết trình bày mô tả thông tin từ vựng trong từ điển dùng cho máy tính. Để hiểu rõ hơn, mời các bạn tham khảo chi tiết nội dung bài viết này.
HƯỚNG DẪN MÔ TẢ THÔNG TIN TỪ VỰNG TRONG TỪ ĐIỂN DÙNG CHO MÁY TÍNH SP 7.2 – Đề tài KC.01.01.05/06-10 Vũ Xuân Lương1, Nguyễn Thị Minh Huyền2, Hồ Tú Bảo3 Mục lục A THƠNG TIN HÌNH THÁI – MORPHOLOGICAL I THÔNG TIN CẤU TẠO TỪ Tiêu chí xác định Thực hành gán nhãn thông tin cấu tạo từ 2.1 Từ đơn : simple word 2.2 Từ ghép (compound word); 2.3 Từ láy (reduplicative word) B THÔNG TIN CÚ PHÁP – SYNTACTIC I THÔNG TIN TỪ LOẠI Tiêu chí xác định từ loại Thực hành gán nhãn thông tin cú pháp 2.1 Danh từ (Nouns - N) 2.1.1 Danh từ riêng : Proper Noun 2.1.2 Danh từ đơn thể : Concrete Noun 2.1.3 Danh từ tổng hợp : Collective Noun 2.1.4 Danh từ trừu tượng : Abstract Noun 2.1.5 Danh từ loại thể : Classify Noun 10 2.1.6 Danh từ đơn vị : Unit Noun 10 2.2 Động từ (Verbs – V) 11 2.2.1 Nội động từ (intransitive verb) 11 2.2.2 Ngoại động từ (transitive verb), 11 2.2.3 Động từ trạng thái (state verb) 11 Trung tâm Từ điển học (Vietlex) Đại học Khoa học Tự nhiên – Đại học Quốc gia Hà Nội JAIST 2.2.4 Trợ động từ (auxiliary verb) 12 2.3 Tính từ (Adjective – A) 12 2.3.1 Tính từ tính chất 12 2.3.2 Tính từ quan hệ 13 2.3.3 Tính từ tượng : Onomatopoetic Adjective 13 2.3.4 Tính từ tượng hình : Pictographic Adjective 13 2.4 Đại từ (Pronoun – P) 14 2.4.1 Đại từ xưng hô 14 2.4.2 Đại từ định 14 2.4.3 Đại từ nghi vấn 14 2.5 Số từ (Numeral – M) 14 2.5.1 Số đếm 14 2.5.1 Số thứ tự 14 2.6 Lượng từ (Numeral – M) 14 2.7 Phụ từ (Adverb – R) 14 2.8 Giới từ (Preposition – O) 15 2.9 Liên từ (Conjunction – C) 15 2.10 Trợ từ (Introductory word – I) 15 2.11 Cảm từ (Emotivity word – E) 15 C THÔNG TIN NGỮ NGHĨA - SEMANTIC 16 I LOGICAL CONSTRAINT: 16 Tiêu chí xác định 16 Thực hành gán nhãn thông tin ngữ nghĩa 16 2.1 Con người : People 16 2.1.1 Người : Person 16 2.1.2 Tổ chức : Organization 16 2.1.3 Nhân vật siêu nhiên : Supernatural Being 16 2.2 Động vật : Animal 17 2.2.1 Thú : Animal 17 2.2.2 Chim : Bird 17 2.2.3 Cá : Fish 17 2.2.4 Lưỡng cư : Amphibian 17 2.2.5 Bò sát : Reptile 17 2.2.6 Sâu : Worm 18 2.1.2.7 Côn trùng : Insect 18 2.1.2.8 Động vật thân mềm : Shellfish 18 2.1.2.9 Động vật giáp xác : 18 2.1.2.10 động vật hư cấu : Fictional Animal 19 2.3 Vi sinh vật : Microorganism 19 2.4 Thực vật : Plant 19 2.4.1 thân gỗ : Tree 19 2.4.2 bụi : Bush 19 2.4.3 thân leo : Vine 19 2.4.4 thân cỏ : Herb 19 2.5 Thức ăn : Food 19 2.6 Vật dụng : Artifact 19 2.7 Vật hư cấu : Fictional Object 19 2.8 Bộ phận : Part 19 2.9 Chất liệu : Substance 20 2.10 Tự nhiên : Natural Object 20 2.11 Vị trí : Location 20 2.12 Lĩnh vực tri thức : Field Of Knowledge 20 2.13 Trạng thái : State 20 2.14 Hoạt động : Action 20 2.15 Quan hệ : Relation 20 2.16 Tình thái : 20 2.17 Thuộc tính: Attribute 20 2.18 Giá trị : Value 20 2.19 Đơn vị : Unit 20 II SEMANTIC CONSTAINT: 20 Tiêu chí xác định 20 Thực hành gán nhãn thông tin Semantic constraint 21 2.1 Subject : chủ thể 21 2.2 Object : khách thể Error! Bookmark not defined 2.2.1 Direct object (Dob) : bổ ngữ trực tiếp 21 2.2.2 Indirect object (iob) : bổ ngữ gián tiếp 22 2.2.3 Object (Obj) : bổ ngữ tự 23 2.3 Location (Loc) : vị trí, địa điểm 24 A THƠNG TIN HÌNH THÁI – MORPHOLOGICAL I THÔNG TIN CẤU TẠO TỪ Tiêu chí xác định Trong phạm vi đề tài, cấu tạo từ xét mặt sau đây: a) Căn vào mặt ý nghĩa khả hoạt động để phân biệt từ đơn với từ phức b) Từ đơn từ chứa tiếng, tiếng phải có nghĩa có khả hoạt động độc lập Chúng nằm vốn từ tiếng Việt, phần lớn số từ gốc (hiểu theo nghĩa từ có khả dùng để cấu tạo hàng loạt từ phức) c) Từ phức từ gồm hai tiếng trở lên kết hợp chặt chẽ với nhau, có ý nghĩa cho sẵn mà xác định cách rõ ràng việc suy từ ý nghĩa tiếng d) Muốn nhận từ phức phải tìm tiếng có nghĩa e) Trong loại từ phức, vào phương thức cấu tạo để phân biệt từ ghép với từ láy dạng láy Thực hành gán nhãn thông tin cấu tạo từ 2.1 Từ đơn : simple word Đặc điểm: - Gồm từ có tiếng vừa có nghĩa, vừa hoạt động độc lập - Những từ có nhiều tiếng (bao gồm từ vay mượn Việt hố, có hình thức phiên âm gần giống với tiếng Việt), tiếng tự khơng có ý nghĩa (phải khối gồm nhiều tiếng gộp lại có ý nghĩa) xếp vào loại từ đơn Ví dụ: bồ nơng, bồ hóng, bù nhìn, mạt chược, ca la thầu, ba lô, béc giê, cà phê, căng tin, xi măng, xích lơ, blốc, crếp, v.v - Những từ có nhiều tiếng có hình thức cấu tạo giống từ láy chia tiếng mà tiếng khơng có ý nghĩa hết xếp vào loại từ đơn Ví dụ: ba ba, chuồn chuồn, cào cào, châu chấu, đu đủ, su su, thuồng luồng, v.v Danh sách: trâu, bò, lợn, gà, sách, đèn, bàn, ghế, ông, bà, cha, mẹ, núi, sông, cây, hoa, máy, xe, con, cục, cái, ăn, học, ngủ, đi, đứng, khóc, cười, đẹp, xấu, tốt, đã, sẽ, đang, bồ nông, bồ hóng, bù nhìn, mạt chược, ba ba, chuồn chuồn, ca la thầu, ba lô, béc giê, cà phê, căng tin, xi măng, xích lơ, blốc, crếp, v.v 2.2 Từ ghép (compound word); Đặc điểm: - Từ ghép cấu tạo theo phương thức phối hợp ngữ nghĩa tiếng dùng làm yếu tố cấu tạo - Từ ghép gồm chủ yếu từ có hai tiếng, từ nhiều tiếng, tiếng có nghĩa rõ rệt hoạt động từ đơn - Căn vào phương thức phối hợp ngữ nghĩa lại phân biệt thành từ ghép song song (từ ghép đẳng lập) từ ghép phụ - Từ ghép song song có phối hợp ngữ nghĩa hai tiếng theo quan hệ bình đẳng, song song, khơng có tiếng chính, tiếng phụ (ví dụ: nhà cửa, ruộng vườn, quần áo, núi sông), thường mang ý nghĩa khái quát Trật tự trước sau hai tiếng thay đổi (ví dụ: nhà cửa - cửa nhà, chờ mong – mong chờ, chèo chống – chống chèo) - Từ ghép phụ có phối hợp ngữ nghĩa hai tiếng theo quan hệ khơng bình đẳng Đó phối hợp tiếng có ý nghĩa khái qt tiếng phụ có ý nghĩa hạn định (ví dụ: xe đạp, tàu hoả, nhà ga, nhà thương, nhà rông, rượu chanh, bánh mì, cơm chay) - Những từ hai tiếng có cấu tạo theo phương thức lặp lại hoàn toàn (giống từ láy), có nghĩa ngữ pháp “số nhiều đặn” xếp vào loại từ ghép Ví dụ: ai, chiều chiều, đâu đâu, ngày ngày, người người, sáng sáng, tối tối, v.v Ghi chú: Trong phạm vi đề tài này, không phân biệt hai loại từ ghép song song từ ghép phụ Danh sách: nhà cửa, cửa nhà, ruộng vườn, quần áo, núi sông, chờ mong, mong chờ, chèo chống, chống chèo, xe đạp, tàu hoả, nhà ga, nhà thương, nhà rông, rượu chanh, bánh mì, cơm chay, ai, chiều chiều, đâu đâu, ngày ngày, người người, sáng sáng, tối tối… 2.3 Từ láy (reduplicative word) Đặc điểm: - Từ láy cấu tạo theo phương thức láy, phương thức lặp lại có tính chất hồ phối ngữ âm toàn tiếng gốc hay lặp lại phận tiếng gốc tiếng khác gọi tiếng láy (âm tiết láy) - Từ láy gồm chủ yếu từ có hai tiếng (có số từ ba bốn tiếng), có tiếng có nghĩa, có nhiều tiếng có nghĩa Ví dụ: long lanh (long có nghĩa), long tong (tong có nghĩa), xanh xanh (cả hai tiếng có nghĩa), (căn phòng trơng) tối tối (cả hai tiếng có nghĩa), v.v - Căn vào phương thức phối hợp ngữ âm phân biệt kiểu từ láy: láy phận (chúm chím, bập bềnh, lênh khênh, ) láy tồn (lăm lăm, đùng đùng, oang oang, ) Để có tính chất hồ phối ngữ âm, việc láy khơng đơn lặp lại tiếng gốc ban đầu, mà thường kèm theo biến đổi định mặt âm (đo đỏ, lành lạnh, nho nhỏ, vành vạnh, ) - Căn vào số lần lặp lại hình thức ngữ âm phân biệt kiểu từ láy: láy đôi (gọn gàng, vững vàng, chắn, ), láy ba (dửng dừng dưng, sành sanh, tẻo tèo toe, ), láy tư (đủng đa đủng đỉnh, long la long lanh, nhí nha nhí nhảnh) - Chú ý phân biệt từ láy dạng láy, chẳng hạn đủng đỉnh, long lanh, nhí nhảnh (từ láy) đủng đa đủng đỉnh, loang la long lanh, nhí nha nhí nhảnh (dạng láy) - Chú ý phân biệt từ ghép dạng láy; chẳng hạn đỏ hoét (từ ghép) đỏ hoen hoét (dạng láy), đỏ hỏn (từ ghép) đỏ hon hỏn (dạng láy), xanh lè (từ ghép) xanh lè lè (dạng láy), xanh lét (từ ghép) xanh len lét (dạng láy), v.v - Chú ý phân biệt từ láy dạng lặp từ ghép Chẳng hạn, tối tối với nghĩa “tối vậy” dạng lặp (từ ghép); tối tối (hay tơi tối) với nghĩa “lúc gần tối, chưa tối hẳn” (Có tiếng chim mổ kêu quang quác lồng kẽm chỗ tối tối) từ láy - Chú ý phân biệt từ láy từ đơn Chẳng hạn tổ hợp ba ba, cào cào, châu chấu, chuồn chuồn, (quả) đu đủ, (quả) su su, thuồng luồng hình thức ngữ âm có cấu tạo giống từ láy, xét riêng yếu tố tổ hợp chúng khơng mang ý nghĩa hết, lẽ chúng xếp vào danh sách từ đơn Ghi chú: Trong phạm vi đề tài này, không phân biệt kiểu từ láy, đồng thời xếp chung dạng láy vào loại từ láy, Danh sách: ào, bập bềnh, bập bà bập bềnh, bập bùng, chí chát, chí cha chí chát, chơng chênh, đỏ hon hỏn, lênh khênh, long bong, long tong, ma mảnh, mơn mởn, … B THÔNG TIN CÚ PHÁP – SYNTACTIC I THƠNG TIN TỪ LOẠI Tiêu chí xác định từ loại 1.1 Tiêu chí ý nghĩa khái quát: ý nghĩa khái quát hiểu ý nghĩa nhận biết thông qua ý nghĩa hay cách sử dụng loạt từ định (ý nghĩa ngữ pháp), thông qua ý nghĩa hay cách sử dụng từ cụ thể (ý nghĩa từ vựng) Chẳng hạn: ý nghĩa vật xếp thành loại danh từ; ý nghĩa hành động trạng thái xếp thành loại động từ; ý nghĩa tính chất xếp thành loại tính từ, v.v 1.2 Tiêu chí khả kết hợp: - Từ có khả làm đầu tố trong cụm từ phụ; - Từ có tham gia vào cụm từ phụ không làm đầu tố; - Từ không tham gia vào cụm từ phụ, có quan hệ với cụm từ phụ trường hợp cụ thể 1.3 Tiêu chí chức cú pháp: - Chức từ đóng vai trò thành phần câu Dùng chức từ để góp phần làm cho việc phân định từ loại rõ ràng - Có thể nhận chức từ hoạt động ngôn ngữ, chẳng hạn chức chủ ngữ danh từ, vị ngữ động từ, v.v Thực hành gán nhãn thông tin cú pháp 2.1 Danh từ (Nouns - N) 2.1.1 Danh từ riêng : Proper Noun Đặc điểm: - Không kết hợp với số từ, đại từ định, trừ danh từ tên người trường hợp đặc biệt Vd: lớp có hai Tuấn; thêm Thứ vừa bảy Danh sách: Nguyễn Du, Việt Nam, Hải Phòng, Trường Đại học Bách khoa, Mộc tinh, 2.1.2 Danh từ đơn thể : Concrete Noun Đặc điểm: - Chỉ vật thể mà ta dùng cảm quan thông thường để phân biệt cách cụ thể - Chỉ vật thể tưởng tượng gắn với đời sống tâm linh người - Đứng sau danh từ loại sau số từ + danh từ loại - Đứng trước đại từ định (này, kia, ấy, nọ) Danh sách: bàn, ghế, sách, vở, dao, thuyền, xe đạp, xe lửa, tàu thuỷ, cầu, đường, nhà ga, cửa sổ, gà, ngựa, giáo viên, học sinh, bác sĩ, thần, thánh, tiên, bụt, ma, quỷ, sông, hồ, núi, âm phủ, thiên đàng, niết bàn, 2.1.3 Danh từ tổng hợp : Collective Noun Đặc điểm: - Chỉ vật khác loại thường kèm với thành tập hợp hoàn chỉnh - Không đứng sau số từ + danh từ loại, trừ vài trường hợp đặc biệt - Không đứng sau số từ - Không đứng sau danh từ loại - Không đứng trước đại từ định (này, kia, ấy, nọ) Danh sách: nhà cửa, gà q, thầy trò, đồ đạc, cối, chim mng, quần áo, ngồi, dưới, quan qn, binh lính, binh mã, người ngựa, nhân dân, quân đội, uỷ ban, ban chấp hành, sư đồn, tỉnh thành, thành phố, nơng thơn, thủ đô, 2.1.4 Danh từ trừu tượng : Abstract Noun Đặc điểm: - Chỉ khái niệm khái qt hố tư - Khơng đứng sau số từ, danh từ loại, trừ trường hợp đặc biệt; chẳng hạn: dân chủ, nỗi tâm tư, tình u, tật, thói Danh sách: sách, chủ trương, tư tưởng, tâm tư, tình cảm, trị, lí luận, kinh tế, kế hoạch, nghề nghiệp, nghiệp vụ, phán đốn, định luật, định lí, bệnh tật, tật, thói, vùng, miền, trong, trên, ngồi, dưới, 2.1.5 Danh từ loại thể : Classify Noun Đặc điểm: - Chỉ cá thể, đơn vị vật, tượng xác định - Chỉ tập hợp vật loại - Khơng đảm nhiệm vai trò định danh - Đứng trước làm phụ tố cho danh từ đơn thể đảm nhiệm vai trò tố - Thường đứng sau số từ - Trong chu cảnh cụ thể, thay cho danh từ đơn thể để đảm nhiệm vai trò tố, chẳng hạn: chuồng ni hai ngựa, (một) béo, (một) gầy Danh sách: con, cây, cục, cái, chiếc, tấm, phiến, tờ, tập, tệp, mẩu, mảnh, miếng, cuốn, quyển, pho, ngọn, quả, lá, cọng, ngơi, tồ, túp, căn, thửa, tiếng, tia, cột, bó, chồng, mớ, giàn, xiên, xâu, bánh, luồng, hạt, dòng, cụ, ơng, người, tên, thằng, đứa, cậu, chú, cơ, cuộc, sự, nỗi, niềm, toán, bầy, đàn, lũ, tốp, bộ, đợt, trận, cơn, ván, bàn, 2.1.6 Danh từ đơn vị : Unit Noun Đặc điểm: - Danh từ đơn vị khoa học, đơn vị đo lường nhà khoa học đặt quy ước chung, gam, mét, lít Các danh từ loại đứng trước làm phụ tố cho danh từ đơn thể chất liệu đảm nhiệm vai trò tố - Danh từ đơn vị dân gian, vốn có nghĩa phái sinh từ danh từ đồ đựng hay hành động tạo lượng nhân dân quy ước, đấu, thùng, bồ, nắm, ngụm Các danh từ loại thường đứng sau số từ - Danh từ đơn vị tiền tệ (đồng, hào, yên, bảng, ); luôn đứng sau số từ - Danh từ đơn vị thời gian, khoảng thời gian xác định không xác định; thường đứng sau số từ (giờ, phút, canh, khắc, ); luôn đứng sau số từ.; thường dùng làm tố ngữ danh từ - Danh từ đơn vị tổ chức (làng, xã, phường, huyện, bang, lớp, ); luôn đứng sau số từ; thường dùng làm tố ngữ danh từ; thường đứng trước danh từ riêng địa danh Danh sách: cm, kg, tấn, tạ, ca, thùng, đấu, bơ, bò, nắm, ngụm, nhúm, … giờ, phút, giây, canh, khắc, ngày, tháng, năm, quý, lúc, làng, bản, thơn, xóm, xã, phường, huyện, quận, tỉnh, nhóm, tổ, đội, lớp, bang, 2.2 Động từ (Verbs – V) 2.2.1 Nội động từ : intransitive verb Đặc điểm: - Chỉ động từ hoạt động không bắc cầu sang vật ngồi - Khi động từ làm tố (vị ngữ chính) câu khơng đòi hỏi phải có bổ ngữ đối tượng trực tiếp nghĩa câu hiểu đầy đủ Danh sách: ngủ, ngồi, khóc, cười, thở, tắm, chạy, bay, hót, hát, sủa, kêu, làm lụng, nghỉ ngơi, suy nghĩ, 2.2.2 Ngoại động từ : transitive verb Đặc điểm: - Chỉ động từ hoạt động có bắc cầu sang vật ngồi - Khi động từ làm tố (vị ngữ chính) câu đòi hỏi phải có bổ ngữ đối tượng trực tiếp, bổ ngữ đối tượng gián tiếp, bổ ngữ tự nghĩa câu hiểu đầy đủ Danh sách: đọc (đọc sách, đọc thư), viết, đá, đặt, chặt, đẽo, bẻ, hái, nghe, nhớ, tin, nghi ngờ, biết, mua, bán, cho, tặng, xây dựng, cải tiến, 2.2.3 Động từ trạng thái : state verb Đặc điểm: - Chỉ động từ biểu thị tình trạng, cách thức tồn vật - Khi động từ hoạt động làm tố (vị ngữ chính) sau phải có phụ tố nội dung (còn tiền, của, bẩn, ăn, mèo già hoá cáo, nên người, thành vợ chồng ) Danh sách: có, còn, hết, được, mất, hoá, thành, nên, trở thành, trở nên, thua 2.2.4 Trợ động từ : auxiliary verb Đặc điểm: - Chỉ động từ chuyên dùng phụ thêm cho động từ khác để làm thành vị ngữ câu - Những động từ đứng trước sau động từ - Một số biểu thị điều kiện thái độ chủ thể hành động - Một số biểu thị hướng hành động Danh sách: bị, được, chịu, phải, muốn, toan, quyết, phải, định, dám, nên, cần, đâm, sinh, xuống (lặn xuống, xẹp xuống), lên (lớn lên ~ lửa bùng lên ~ thét lên ~ tức phát điên lên ~ đỏ bừng mặt lên), (ra kết ~ nhận lỗi ~ hiểu ra), 2.3 Tính từ (Adjective – A) 2.3.1 Tính từ tính chất Đặc điểm: - Những từ mang ý nghĩa loại phẩm chất, như: tốt, đẹp, xấu, hay, dở, sạch, bẩn, đục, trong, đúng, sai, quan trọng, tầm thường, - Những từ mang ý nghĩa lượng thuộc nhiều mặt mật độ, độ dài, trọng lượng, hình dạng, màu sắc, mùi vị, âm thanh: nhiều, ít, đơng, thưa, dài, ngắn, to, nhỏ, cao, thấp, nông, sâu, cong, thẳng, vênh, xanh, đỏ, thơm, thối, vang, dội, ồn, lặng, - Thường sau phụ từ thời gian (đã, đang, ), thang độ (rất, hơi, khí, ), tần xuất (thường, hay, ), tính khẳng định phủ định (có, khơng, chưa, chẳng ) - Thường trước phụ từ (xong rồi, đẹp rồi, đỏ rồi, hỏng ), phụ từ hướng phát triển ra, lên, đi, lại (đẹp ra, nhanh lên, xấu đi, nhỏ đi, nhỏ lại, chậm lại, trắng lại) Danh sách: tốt, đẹp, xấu, hay, dở, sạch, bẩn, đục, trong, đúng, sai, trái, phải, quan trọng, tầm thường, nhiều, ít, đơng, thưa, dài, ngắn, to, nhỏ, cao, thấp, nông, sâu, cong, thẳng, vênh, xanh, đỏ, thơm, thối, vang, dội, ồn, lặng, gập ghềnh, chông chênh, lênh khênh, sừng sỏ, hùng hổ, 2.3.2 Tính từ quan hệ Đặc điểm: - Tính từ quan hệ nảy sinh có ảnh hưởng, phụ thuộc tác động qua lại lẫn vật, tượng Ví dụ: chung - riêng, nội – ngoại, công – tư, trái – phải (bên trái – bên phải), - Tính từ quan hệ chuyển loại từ danh từ Chỉ danh từ thêm vào trước coi tính từ quan hệ Ví dụ: tác phong (rất) công nhân, cung cách (rất) quý phái, thái độ (rất) cửa quyền, nhìn (rất) Việt nam, giọng lưỡi (rất) Chí Phèo Danh sách: chung, riêng, cơng, tư, nội, ngoại, cơng hữu, tư hữu, riêng tư 2.3.3 Tính từ tượng : Onomatopoetic Adjective Đặc điểm: - Những từ có nguồn gốc hành động tạo âm thanh, có tác dụng mơ âm vốn có tự nhiên để biểu thị vật mặt âm - Có khả kết hợp với phụ từ mức độ rất, hơi, khí Danh sách: leng keng, kẽo kẹt, loảng xoảng, cót két, cọt kẹt, choang, choang choang, ồng, ùng ồng, ì ầm, ầm ì, róc rách, 2.3.4 Tính từ tượng hình : Pictographic Adjective Đặc điểm: - Những từ có quy chiếu hình ảnh vật lí cụ thể vật tri giác, có tác dụng gợi tả hình ảnh, dáng điệu vật - Rất dễ dàng kết hợp với phụ từ mức độ rất, hơi, khí Danh sách: lom khom, còm nhom, khẳng khiu, lênh khênh, lung linh, khum khum, trùng trục, lũn cũn, bè bè, 2.4 Đại từ (Pronoun – P) 2.4.1 Đại từ xưng hô Đặc điểm: Danh sách: tơi, tao, tui, mình, ta, chúng tơi, chúng 2.4.2 Đại từ định Đặc điểm: Danh sách: đây, đấy, đó, kia, ấy, nọ, này, nay, bây giờ, thế, 2.4.3 Đại từ nghi vấn Đặc điểm: Danh sách: ai, gì, chi, đâu, bao giờ, bao nhiêu, mấy, sao, 2.5 Số từ (Numeral – M) 2.5.1 Số đếm Đặc điểm: Danh sách: một, hai, ba, bốn, 2.5.1 Số thứ tự Đặc điểm: Danh sách: nhất, nhì, ba, tư, 2.6 Lượng từ (Quantity – Q) Đặc điểm: Danh sách: những, các, mấy, mỗi, mọi, từng, 2.7 Phụ từ (Adverb – R) Đặc điểm: Danh sách: đã, đang, sẽ, vừa, mới, sắp, từng, liền, bèn, rồi, , rất, khá, khí, hơi, q, lắm, thật, hết sức, cực kì, bỗng, , cũng, vẫn, đề, còn, cứ, mãi, luôn, luôn, liên tục, liên tiếp, không ngừng, , khơng, chẳng, chưa, chửa , có, quyết, định, …, hãy, đừng, chớ, nên, phải, , (làm được), (nghĩ ra), 2.8 Giới từ (Preposition – O) Đặc điểm: Danh sách: của, để, ở, về, tại, trên, dưới, trong, ngoài, vào 2.9 Liên từ (Conjunction – C) Đặc điểm: Danh sách: và, với, cũng, hay, hoặc, nhưng, vì, song, thì, càng, cho nên, khơng những, mà còn, bằng, 2.10 Trợ từ (Introductory word – I) Đặc điểm: Danh sách: à, ư, nhỉ, nhé, chỉ, thì, mà, đích thị, cả, đến cả, 2.11 Cảm từ (Emotivity word – E) Đặc điểm: Danh sách: chà, chao ôi, ôi, ôi chao, ái, ối, trời ơi, bớ, ê, C THÔNG TIN NGỮ NGHĨA - SEMANTIC I LOGICAL CONSTRAINT: Tiêu chí xác định Thực hành gán nhãn thông tin ngữ nghĩa 2.1 Con người : People 2.1.1 Người : Person Đặc điểm: - Chỉ người riêng lẻ, phân biệt với tập thể Danh sách: ông, bà, nam, nữ, nô tì, phi cơng, thuyền trưởng, y tá, phát viên, biên tập viên, trưởng phòng, sư trưởng, ơng, bà, cha, mẹ, học sinh, bác sĩ, công nhân, đội, Chú ý: - Các đơn vị từ vựng có ý nghĩa người nói chung (ý nghĩa khái quát, tổng qt) xếp vào nhóm Khái niệm Ví dụ: cái, cháu chắt, cha anh, bác, cộng đồng - Dấu hiệu nhận diện: thường không với số từ (một, hai), lượng từ (những, các) 2.1.2 Tổ chức : Organization Đặc điểm: - Chỉ tập hợp người hoạt động quyền lợi chung, nhằm mục đích chung, phân biệt với cá nhân Danh sách: ban chấp hành, chi uỷ, chi đoàn, câu lạc bộ, lớp, tổ, ca, 2.1.3 Nhân vật siêu nhiên : Supernatural Being Đặc điểm: - Chỉ lực lượng có tính chất, khả vượt khỏi phạm vi tự nhiên, giải thích quy luật tự nhiên Danh sách: Phật, A Di Đà, Ngọc Hoàng, Cuội, Hằng Nga, Diêm Vương Tinh, thần, tiên, … 2.2 Động vật : Animal 2.2.1 Thú : Animal Đặc điểm: - Chỉ động vật có xương sống bậc cao, có lơng mao tuyến vú, ni sữa Danh sách: chó, mèo, sư tử, cá voi 2.2.2 Chim : Bird Đặc điểm: - Chỉ động vật có xương sống, đẻ trứng, đầu có mỏ, thân phủ lơng vũ, có cánh để bay Danh sách: gà, bồ câu, hải âu, đà điểu 2.2.3 Cá : Fish Đặc điểm: - Chỉ động vật có xương sống, sống nước, thở mang, bơi vây Danh sách: trắm, mè, thu, nhụ, đé, 2.2.4 Lưỡng cư : Amphibian Đặc điểm: - Động vật có xương sống, sinh nước sống cạn Danh sách: ếch, ếch bò, nhái, nhái bén, nhái xanh, cóc, cóc tía, chẫu chàng, chẫu chuộc, ễnh ương, cá cóc, sa giơng, kì giơng, 2.2.5 Bò sát : Reptile Đặc điểm: - Chỉ động vật có xương sống, thở phổi, chuyển dịch cách bò sát đất Danh sách: rắn, rết, thằn lằn, thạch sùng 2.2.6 Sâu : Worm Đặc điểm: - Chỉ dạng ấu trùng côn trùng (thường ăn hại cối), loài giun sán nói chung Danh sách: sâu róm, sâu que, rầy nâu, sâu đục thân, 2.1.2.7 Côn trùng : Insect Đặc điểm: - Chỉ động vật chân đốt, thể chia thành ba phần, có đơi râu, ba đơi chân, phần lớn có cánh Danh sách: kiến, ong, ve, bọ xít, bọ rùa, bọ vừng, bọ hung, ruồi, muỗi, 2.1.2.8 Động vật thân mềm : Shellfish Đặc điểm: - Động vật không xương sống, thể khối thịt mềm, ẩn lớp vỏ khơng có vỏ, phần lớn sống biển nước ngọt, số sống cạn Danh sách: trai, điệp, nghêu, sò, ngao, ốc, hến, trùng trục, vẹm, ốc sên, ơcs bưu vàng, hàu, hà, bào ngư, tu hài, hải sâm, mực, 2.1.2.9 Động vật giáp xác : Đặc điểm: - Động vật khơng xương sống, có vỏ cứng ngồi thể, thở mang, đầu có mắt kép, hai đôi râu Danh sách: tôm, tôm sú, tôm he, tôm hùm, tép, cua, ghẹ, ghẹ xanh, rạm, cua đồng, cáy, còng, dã tràng, sam, 2.1.2.10 động vật hư cấu : Fictional Animal Đặc điểm: - Chỉ động vật tưởng tượng, khơng có thực tế Danh sách: rồng, thuồng luồng, ma cà rồng, ma gà, quỷ Dạ Xoa, 2.3 Vi sinh vật : Microorganism Danh sách: virus, vi khuẩn, vi trùng, amib, trùng roi, trùng sốt rét, 2.4 Thực vật : Plant 2.4.1 thân gỗ : Tree Danh sách: lim, gụ, sến, đa, phi lao, tre, luồng, 2.4.2 bụi : Bush Danh sách: cúc tần, duối, sim, mua, găng, 2.4.3 thân leo : Vine Danh sách: mướp, gấc, bầu, bí , mùng tơi, tơ hồng, tầm xuân, hoa giấy 2.4.4 thân cỏ : Herb Danh sách: lúa, khoai lang, khoai môn, ráy, dọc mùng, rau dền, rau sam, rau muống, cỏ tranh, lau, cói, nhơ, kê, lạc, vừng, mía, loa kèn, cẩm chướng, sen, súng, đồng tiền, cúc, hướng dương, v.v 2.5 Thức ăn : Food 2.6 Vật dụng : Artifact 2.7 Vật hư cấu : Fictional Object 2.8 Bộ phận : Part 2.9 Chất liệu : Substance 2.10 Tự nhiên : Natural Object 2.11 Vị trí : Location 2.12 Lĩnh vực tri thức : Field Of Knowledge 2.13 Trạng thái : State 2.14 Hoạt động : Active 2.15 Quan hệ : Relation 2.16 Tình thái : Model 2.17 Thuộc tính: Attribute 2.18 Giá trị : Value 2.19 Đơn vị : Unit II SEMANTIC CONSTAINT: Tiêu chí xác định - Động từ làm vị ngữ thường định khung vai nghĩa cấu cấu trúc câu Căn vào đặc điểm để xác định thành phần chịu ràng buộc động từ - Khơng dựa vào dấu hiệu hình thức mà dựa vào loại nội dung ý nghĩa bổ ngữ (complement) biểu thị để phân biệt hai loại bổ ngữ trực tiếp (direct object) bổ ngữ gián tiếp (indirect object) Chẳng hạn: a) Nó tặng mẹ bó hoa b) Nó tặng bó hoa cho mẹ bó hoa bổ ngữ trực tiếp, mẹ bổ ngữ gián tiếp - Chỉ xác định bổ ngữ trực tiếp bổ ngữ gián tiếp cho động từ ngoại động điển hình làm vị ngữ, trường hợp thành phần với động từ đối tượng chịu tác dụng trực tiếp hành động đối tượng “vì nó” mà diễn hành động - Trường hợp động từ ngoại động điển hình làm vị ngữ thành phần bổ nghĩa sau xác định bổ ngữ nói chung bổ ngữ tự (object) Chẳng hạn: d) Tôi thấy mệt mỏi e) Tôi thấy anh mệt mỏi v.v Thực hành gán nhãn thông tin Semantic constraint 2.1 Subject : chủ thể Đặc điểm: - Chủ thể đối tượng gây hành động - Động từ hành động phải động từ làm vị ngữ câu Ví dụ: – Chim bay – Chó sủa Sub: N (Animal) – Thầy giáo giảng – Học sinh nghe nhạc Sub: N (Person) Dob: N 2.2 Direct object (Dob) : bổ ngữ trực tiếp Đặc điểm: - Bổ ngữ trực tiếp thành phần đối tượng chịu tác dụng trực tiếp hành động nêu động từ làm vị ngữ - Chỉ xác định trường hợp động từ ngoại động làm vị ngữ Ví dụ: 2.2.1 Bổ ngữ vật tạo tác: – Họ xây nhà – Nó xây tường Sub: N (Person) Dob: N (Building) – Nàng Bân may áo cho chồng – Tôi vừa may xong túi ba gang Sub: N (Person) Dob: N (Artifact) 2.2.2 Bổ ngữ vật bị làm tiêu biến: – Bộ đội phá cầu – Công nhân phá đá Sub: N (Person) Dob: N (Non-LivingThing) 2.2.3 Bổ ngữ vật bị thay đổi tính chất đặc điểm vật lí: – Cô ta nhuộm đầu – Họ nhuộm vải Sub: N (Person) Dob: N – Công an bắt cướp – Trọng tài bắt lỗi việt vị Sub: N (Person) Dob: N – Ai dám trả lời! – Nó dám lấy vợ Sub: N (Person) Obj: V, VP 2.3 Indirect object (iob) : bổ ngữ gián tiếp Đặc điểm: - Bổ ngữ đối tượng không chịu tác dụng trực tiếp hành động, “vì nó” mà diễn hành động nêu động từ - Bổ ngữ gián tiếp xác định có xuất bổ ngữ trực tiếp - Khi bổ ngữ gián tiếp đứng sau bổ ngữ trực tiếp phải có giới từ, cho, vì, để… - Bổ ngữ gián tiếp đứng trước bổ ngữ trực tiếp (ngay sau động từ) khơng dùng giới Ví dụ: 2.3.1 Các động từ trao nhận làm vị ngữ yêu cầu bổ ngữ bắt buộc, vật trao nhận người tiếp nhận, bổ ngữ danh từ hay danh ngữ: – Tơi tặng bó hoa/con ngựa đua cho mẹ – Tôi tặng hoa cho ban chấp hành chi đoàn Sub: N (Person) < ! người cụ thể> Dob: N < ! thứ có ý nghĩa> Iob: N (People) < ! người nói chung> – Tơi tặng mẹ bó hoa/con ngựa đua – Tơi tặng ban chấp hành chi đoàn lẵng hoa Sub: N (Person) < ! người cụ thể> Iob: N (People) < ! người nói chung> Dob: N < ! thứ có ý nghĩa> 2.3.2 Các động từ mệnh lệnh – sai khiến làm vị ngữ yêu cầu bổ ngữ bắt buộc, người bị sai khiến hành động sai khiến, bổ ngữ động từ hay động ngữ: - Bà bắt cháu ăn Sub: N (Person) < ! bà> Dob: N (Person) < ! cháu > Iob: V < ! ăn> – Ông bắt trâu cày thông tầm Sub: N (Person) Dob: N (Animal) < ! cháu > Iob: VP < ! cày thông tầm> Mẫu chung cho bắt (ở nghĩa này…): Sub: N (Person) < ! người> Dob: N (LivingThing) < ! vật sống, động vật> Iob: V, VP < ! hành động cụ thể> 2.4 Object (Obj) : bổ ngữ tự Đặc điểm: - Ngoài hai bổ ngữ trực tiếp bổ ngữ gián tiếp thể động từ ngoại động điển hình, động từ ngoại động điển hình có loại bổ ngữ từ cụm từ có chức làm cho nghĩa động từ (làm vị ngữ) đầy đủ - Loại bổ ngữ thường với động từ biểu thị tình trạng, cách thức tồn vật Ví dụ: – Tơi thấy đói – Tôi thấy mệt người Sub: N (Person) Obj: V, VP – Tơi mẹ già – Chị có – Ngân hàng hết tiền – Lồi thú có lơng Sub: N (LivingThing) Obj: N – Da bắt nắng – Vải bắt bụi Sub: N Obj: N 2.5 Location (Loc) : vị trí, địa điểm Đặc điểm: - Với động từ hoạt động có bao hàm phương hướng đòi hỏi thành phần bổ ngữ sau để xác định rõ vị trí, hướng, đích mà hành động nhắm đến - Với động từ hoạt động khơng có bao hàm phương hướng, cần xác định vị trí, đích mà hành động hướng đến tác động đến thường phải có động từ có hoạt động bao hàm hướng kèm, như: lao (vào), (ra), bay (lên), lặn (xuống), vươn (tới), quành (sang), tạt (qua), … Ví dụ: – Khách vào nhà nghỉ – Đồn xe vào Nam lúc sáng Sub: N (Person) Loc: N – Nó đập tay xuống bàn – Con trâu đập đầu vào tường Sub: N (LivingThing) Dob: N Loc: N – Tôi lao xe qua cầu – Con thú lao đầu vào vách đá Sub: N (LivingThing) Dob: N Loc: N Tài liệu tham khảo [1] Hoàng Phê, Nguyễn Ngọc Trâm (1997), Một số vấn đề từ điển học, Nhà xuất Khoa học Xã hội [2] Hoàng Phê (2003), Logic-Ngôn ngữ học, Nhà xuất Đà Nẵng – Trung tâm Từ điển học [3] Uỷ ban Khoa học Xã hội Việt Nam (1983), Ngữ pháp tiếng Việt, Nhà xuất Khoa học Xã hội [4] Nguyễn Văn Hiệp (2006), Ngữ nghĩa học dẫn luận (dịch từ JOHN LYONS, Linguistic Semantics, Cambridge University Press, 1995), Nhà xuất Giáo dục [5] Nguyễn Minh Thuyết, Nguyễn Văn Hiệp (2004), Thành phần câu tiếng Việt, Nhà xuất Giáo dục [6] Diệp Quang Ban (2005), Ngữ pháp tiếng Việt, Nhà xuất Giáo dục [7] Nguyễn Kim Thản (1997), Nghiên cứu ngữ pháp tiếng Việt, Nhà xuất Giáo dục [8] Đinh Văn Đức (1986), Ngữ pháp tiếng Việt, Nhà xuất Đại học Trung học chuyên nghiệp [9] Cao Xuân Hạo (1998), Tiếng Việt: vấn đề ngữ âm - ngữ pháp - ngữ nghĩa, Nhà xuất Giáo Dục [10] Vũ Xuân Lương (2002), Thiết lập giao diện biên soạn từ điển ngơn ngữ máy tính, Tạp chí Ngơn ngữ, Số ...2.2.4 Trợ động từ (auxiliary verb) 12 2.3 Tính từ (Adjective – A) 12 2.3.1 Tính từ tính chất 12 2.3.2 Tính từ quan hệ 13 2.3.3 Tính từ tượng : Onomatopoetic... loại tính từ, v.v 1.2 Tiêu chí khả kết hợp: - Từ có khả làm đầu tố trong cụm từ phụ; - Từ có tham gia vào cụm từ phụ khơng làm đầu tố; - Từ khơng tham gia vào cụm từ phụ, có quan hệ với cụm từ. .. b) Từ đơn từ chứa tiếng, tiếng phải có nghĩa có khả hoạt động độc lập Chúng nằm vốn từ tiếng Việt, phần lớn số từ gốc (hiểu theo nghĩa từ có khả dùng để cấu tạo hàng loạt từ phức) c) Từ phức từ