Hệ thống từ loại tiếng Anh

Một phần của tài liệu Mô hình xử lý khoảng trống từ vựng trong dịch máy anh việt (Trang 91)

Các tiêu chí xây dựng từđiển tiếng Anh bao gồm xác định giới hạn các mục từ, xây dựng tập từ loại và định dạng từng loại từ theo văn phạm nét HPSG.

Về giới hạn mục từ, chỉ các từ gốc mới cĩ mặt trong từ điển. Vì từ tiếng Anh cĩ khả năng biến hình và luật biến hình chặt chẽ, nên việc đưa các mục từ

biến hình vào sẽ làm tăng kích thước từđiển và giảm tốc độ tìm kiếm. Ví dụ: động từ “see” (nhìn) sẽ cĩ mặt trong từ điển trong khi các biến hình của nĩ là “saw”, “seeing”,”seen” sẽ khơng cĩ mặt. Tuy nhiên các từ biến hình bất quy tắc khơng thể

áp dụng luật thì vẫn cần đưa vào từ điển để cĩ thể sử dụng như một từ riêng rẽ. Chẳng hạn “child” (em bé) và số nhiều là “children” (các em bé) sẽđược coi là hai từ mục riêng. Một tiêu chí nữa là từ ghép trong tiếng Anh do hai hay nhiều từ ghép lại cũng cĩ trong từ điển. Hiện khơng cĩ giải thuật nào chỉ ra sự phụ thuộc tường minh của từ ghép vào các thành phần và nĩi chung các từ ghép cũng thường cĩ nghĩa riêng. Ví dụ từ “above-ground” cĩ nghĩa “lúc cịn sống ở trên đời” khơng thể

suy từ thành phần ghép. Một số từđược ghép theo dạng bổ sung tiếp đầu ngữ, tiếp vĩ ngữ cũng được coi là các mục từ riêng. Điều này phù hợp với các từđiển giấy thơng dụng. Ví dụ từ “disherit” cĩ hai thành phần là “dis”(hết) và “herit” (thừa kế) cĩ nghĩa “tước quyền thừa kế của ai”.

Hệ thống từ loại của từ điển tiếng Anh cho các từ gốc cĩ 8 loại chính là danh từ, động từ, tính từ, phĩ từ, giới từ, đại từ, liên từ và thán từ. Ngồi ra cĩ 2 chỉ định từ (cịn gọi là mạo từ) “a” và “the” Để thuận tiện cho việc sử dụng từ

vựng cũng như phân tích ngữ pháp câu tiếng Anh, các từ loại thường đươc chia nhỏ hơn, chẳng hạn động từ chia thành nội động từ, ngoại động từ, đại từ chia thành đại từ nghi vấn (“who”, “which”…), đại từ sở hữu (“mine”, “yours”…) ... (bảng 5.2).

78

Bảng 5.2. Các từ loại tiếng Anh sử dụng trong luận án Từ loại Ký hiệu Ví dụ

đại từ nhân xưng PP I, you, he

đại từ chỉđịnh PPT this, that

đại từ nghi vấn PPR what, whom

đại từ phản thân PPF herself, yourselves

đại từ quan hệ PPL whom

đại từ sở hữu PPS yours, mine

danh từ NN book, action

động từ VB built, eat

giới từ IN without

liên từ CC and, or

mạo từ DT the, a

ngoại động từ TVB abandon, nội động từ IVB abstain, zoom

phĩ từ ADV absolutely

số từ CD one, two

thán từ UH oh,

tính từ ADJ abnormal, active

trợđộng từ MD shall, can

Về mặt từ loại, một từ cĩ thể cĩ nhiều từ loại. Trong các từ điển thơng dụng nếu một từ cĩ các từ loại khác nhau thì được coi là các mục riêng. Ví dự “azure” –

động từ “nhuộm xanh da trời” và “azure” – danh từ “màu xanh da trời” là hai mục từ. Điều này là cần thiết vì chức năng ngữ pháp của từng từ mục trong câu là khác nhau.

Một phần của tài liệu Mô hình xử lý khoảng trống từ vựng trong dịch máy anh việt (Trang 91)

Tải bản đầy đủ (PDF)

(167 trang)