Tri thức về từ loại và hình thái

Một phần của tài liệu Xử lý ngữ nghĩa trong hệ dịch tự động Anh-Việt cho các tài liệu tin học (Trang 67 - 69)

Như đã trình bày ởChương 1, thơng tin từ loại của từ là một nguồn tri thức đáng kểđể khử nhập nhằng nghĩa cho từ dù rằng thơng tin này chưa đủđể khử nhập nhằng tồn bộ ngữ nghĩa. Thơng tin từ loại cĩ thểđược dùng làm mộtbộ lọcđể hạn chế số nghĩa cần xem xét. Trong câu My/POS bank/NN is/AUX on/IN the/DT

corner/NN, nhờ thơng tin từ loại, khối xử lý ngữ nghĩa đã loại bỏ được các nghĩa

gửi ngân hàng, hay đắp bờ (các nghĩa động từ của từ bank), mà chỉ xét đến các nghĩabờ sơng, hayngân hàngcủa từ này (các nghĩa cĩ từ loại danh từ).

Trong một ví dụ (Ví dụ1-1) được nêuở phầnVai trị và chức năng của xửlý ngữ nghĩa (phần 1.2.1), câu I can can a can hồn tồn cĩ thể khử nhập nhằng tốt với điều kiện cĩ được một bộ gán nhãn từ loại tốt. Từ can cĩ 3 nghĩa khác nhau, mỗi nghĩa lại cĩ một từ. Do đĩ, thơng qua bộ gán nhãn từ loại, câu này được gán nhãn thànhI/PRPcan/MDcan/VBa/DTcan/NN. Khi đĩ,ứng với mỗi từ loại, ta dễ dàng chọn được một nghĩa thích hợp cho từcan (cĩ thể (MD – động từ hình thái),

Khoa C NTT - Ð H KHTN TP.H CM Khoa C NTT - Ð H KHTN TP.H CM

Luận Văn Tốt Nghiệp :XửLý Ngữ Nghĩa Trong Hệ Dịch Anh-Việt Cho Các Tài Liệu Tin Học

MƠ HÌNH CÀIĐẶT

55

to/AUX book/VB two/CD books/NNS. Như vậy, nhờ từ loại khác nhau, book/VB (đặt trước) cĩ thể phân biệt được với books/NNS (quyển sách).

Tuy nhiên, ở đây chúng ta giả sử rằng cơng đoạn gán nhãn từ loại đã được làm tốt, và những luật giải quyết nhập nhằng của chúng ta sẽ được áp dụng trên những văn bản đãđược chú thích về từ loại. Chúng ta sẽ tập trung vào những từ mà khơng thể giải quyết nhập nhằng nếu chỉ sử dụng thơng tin về từ loại. Chẳng hạn nhưđể xác định nghĩa của từ boxervõ sĩ quyền anh(danh từ) hay là chĩ bơcxơ

(danh từ) chúng ta phải cần thơng tin về ngữ cảnh.

Một số từ cĩ thểđược giải quyết nhập nhằng bằng cách xác định từ loại của từ liên quan trong ngữ cảnh. Chẳng hạn, danh từwaycĩ thể cĩ hai nghĩa khác nhau:

con đường (danh từ) hay phương pháp/cách thức (danh từ). Trong cả hai trường hợp này danh từwaycĩ thểđược theo sau bởi từto. Nếu chúng ta biết được từtocĩ từ loại là giới từ (IN - preposition) hay là một phần tạo nên dạng nguyên thể của động từ (AUX - infinitive) thì chúng ta cĩ thể sử dụng thơng tin này để xác định nghĩa của danh từ way. Trong Ví dụ 3-1, từ to là một giới từ và vì thế nghĩa dịch đúng của danh từwaysẽ làcon đường, đường. Trong Ví dụ3-2, từtolà thành phần của một infinitivetheo sau bởi động từ, cho nên danh từway trong Ví dụ3-2, sẽ cĩ nghĩa làphương pháp/cách thức.

Ví dụ3-1 : Từwayđược khửnhập nhằng nhờ vào giới từtođi sau nĩ.

¾ In a report, for example, the body text lines may reach all thewayto

the left and right margins, but quoted material may be indented 1 inch from each margin.

¾ Nonetheless, UNIX never really caught on as a consumer operating system, giving way to DOS, Windows, and the Mac OS, which generally have been perceived as easier to learn and use.

¾ Even though Cho and Hermione were on the way to becoming friends, they didn't have a relationship anything like Harry had with Cho.

Khoa C NTT - Ð H KHTN TP.H CM Khoa C NTT - Ð H KHTN TP.H CM MƠ HÌNH CÀIĐẶT

Ví dụ3-2 :Từwayđược khử nhập nhằng nhờ vàoto Infđi sau nĩ.

¾ One might think that pen-based systems would be a handy way to entertext into the computer for word processing.

¾ Adding RAM is a relatively inexpensive way to boost a system's overall performance.

¾ The F1 key, for example, became the universal way to accessonline help.

Một ví dụ khác là việc sử dụng danh từstagevới các từ cĩ từ loại chỉ số thứ tự (ORD – Ordinal number) hay sốđếm (CD – Cardinal number). Khi danh từ này được đi trước bởi một từ chỉ thứ tự (Ví dụ3-3) hoặc theo sau bởi một từ chỉ sốđếm (Ví dụ3-4) thì dường như nĩ cĩ nghĩa làgiai đoạnhơn làsân khấu.

Ví dụ 3-3 : Từ stageđược khử nhập nhằng nhờ vào một số thứ tự đứng trước :

¾ In next stage, this system will connect to the character recognization system in order to translate texts automatically.

¾ Besides, I also send my sincere thanks to all professors who help me inlaststage.

Ví dụ 3-4 : Từ stage được khử nhập nhằng nhờ vào một từ chỉ số đếm

đứng sau :

¾ instagetwo

¾ Stage1 (adsbygoogle = window.adsbygoogle || []).push({});

Một phần của tài liệu Xử lý ngữ nghĩa trong hệ dịch tự động Anh-Việt cho các tài liệu tin học (Trang 67 - 69)