Dịch máy dựa trên cơ sở tri thức (KBMT: Knowlegde-Based MT)

Một phần của tài liệu Nghiên cứu một số công cụ phục vụ cho việc phát triển hệ thống hỗ trợ dịch Trung Việt (Trang 29 - 30)

MT)

Lập luận chính của việc dịch dựa trên cơ sở tri thức (KBMT) là: “muốn dịch được thì trước hết phải hiểu được”. Mà muốn hiểu được thì máy phải được trang bị tri thức ngôn ngữ và tri thức về thế giới thực y như con người. Với cách tiếp cận này [20], trước nhất người ta phải xậy dựng một hệ cơ sở tri thức khổng lồ bào trùm

mọi tri thức về thế giới thực ở mọi lĩnh vực. Mà điều này thì không khả thi, nên

người ta chỉ giới hạn trong một lĩnh vực hẹp nào đó và mô hình tri thức của lĩnh vực này bằng cách xây dựng các lớp ngữ nghĩa (semantic class) và các thực thể

(instance) để biểu diễn tất cả các khái niệm (concept) trong miền lĩnh vực đó. Mỗi

khài niệm bao gồm:

• Tên khái niệm (concept name/head)

• Các khe (slot): các vai ngữ nghĩa (semantic role) được phép

• Bộ lọc (filter): những lớp khài niệm được phép mà các vai trò có thể chứa chúng khử nhập nhằng bởi các bộ lọc hạn chế lại các vai mà thỏa ngữ nghĩa hợp lý. Cơ chế nhận biết tri thức có thể là tự động hay bán tự động.

Theo cách tiếp cận này, chúng ta phải xậy dựng một hệ thống phân loại bản

thể học (ontology) để phân loại tri thức, xậy dựng một cơ chế suy diễn tự động

(inference engine) và biểu diễn liên ngôn ngữ. Tuy nhiên, việc xậy dựng một hệ thống phân loại tri thức hoàn chỉnh là điều khó có thể thực hiện được.

Ví dụ: “toy-gun” (súng đồ chơi) thì xếp vào nhóm “đồ chơi” (toy) hay “vũ

khí” (weapon)? Về mức độ chi tiết của các lớp cũng là 1 vấn đề nan giải, vì có

những khái niệm mà sự khác nhau rất tinh tế (về văn hóa ngôn ngữ, về mặt xã hội

học của ngôn ngữ, về tâm lý học ngôn ngữ, …) đến nỗi khó mà chia chi tiết thỏa

Một phần của tài liệu Nghiên cứu một số công cụ phục vụ cho việc phát triển hệ thống hỗ trợ dịch Trung Việt (Trang 29 - 30)