Tạo thêm thành phần tích hợp trên khung làm việc GATE

Một phần của tài liệu LUẬN VĂN: NHẬN DẠNG THỰC THỂ TRONG VĂN BẢN TIẾNG VIỆT doc (Trang 30 - 33)

Một thành phần tích hợp (Plugin) có thể gồm ba loại: thành phần ngôn ngữ (Language Resources), thành phần xử lý (processing Resource), thành phần thể hiện (Visual Resource) (tham khảo khái niệm ở mục 3.1). Thành phần tích hợp được sử dụng để tạo nên các ứng dụng trong GATE (mục 3.6). Ví dụ: hệ thống nhận dạng thực thể trong văn bản tiếng Việt của chúng tôi gồm 3 thành phần tích hợp (mục 4.3):

23 Bộ từ điển – VNEgazetteer.

Bộ luật – VNEtransducer.

Ở đây với bài toán nhận dạng thực thể, tôi chỉ giới thiệu sâu về cách tạo một thành phần xử lý (processing Resource).

Việc tạo ra một thành phần xử lý rất đơn giản, được thực hiện qua các bước:

Tạo lớp Plugin (tên thành phần xử lý) kế thừa (extends) lớp AbstractProcessingResource và thể hiện (implements) lớp ProcessingResource. Tạo file creole.xml khai báo thành phần xử lý mới. Ví dụ:

<?xml version="1.0"?> <CREOLE-DIRECTORY> <CREOLE> <RESOURCE> <NAME>Coltech.NLP.tokenizer</NAME> <JAR>Vtokenizer.jar</JAR> <CLASS>Vtokenizer</CLASS>

<PARAMETER NAME="document" RUNTIME="true"> gate.Document </PARAMETER> <PARAMETER NAME="annotationOutputSetName" RUNTIME="true" OPTIONAL="true"> java.lang.String </PARAMETER> </RESOURCE> </CREOLE>

Chương 3. Giới thiệu GATE Nguyễn Bá Đạt

24

</CREOLE-DIRECTORY>

Sau khi đã có thành phần tích hợp (Plugin), có hai cách để thêm thành phần này vào khung làm việc của GATE.

Cách 1: đặt thư mục chứa toàn bộ thành phần tích hợp vào trong %GATE- HOME%/plugins. Chạy lệnh “bin/ant plugins.build”, hệ thống GATE sẽ tự động thêm thành phần tích hợp vào hệ thống.

Cách 2: Chọn File -> Manage CREOLE plugins -> Add new CREOLE repository -> Select a directory và chọn thư mục chứa thành phần tích hợp mới tạo (hình 3.2).

Như vậy, ta đã có một thành phần tích hợp mới sẵn sàng hoạt động trên khung làm việc GATE.

25

Hình 3.3 - Chọn các thành phần cho ứng dụng GATE

Một phần của tài liệu LUẬN VĂN: NHẬN DẠNG THỰC THỂ TRONG VĂN BẢN TIẾNG VIỆT doc (Trang 30 - 33)

Tải bản đầy đủ (PDF)

(73 trang)