2 MỘT SỐ VẤN ĐỀ CHUNG VỀ CÂU
4.3 GATE Embedded
Hình 7: Giao diện lập trình ứng dụng của GATE
Nhúng xử lý ngôn ngữ dựa trên GATE vào trong ứng dụng khác sử dụng GATE Embedded (GATE API) rất đơn giản:
Thêm $GATE_HOME/bin/gate.jar và các tập tin JAR trong $GATE_HOME/lib vào CLASSPATH của Java ($GATE_HOME là
thư mục gốc của GATE).
Báo cho Java biết GATE Unicode Kit là một mở rộng: -Djava.ext.dirs=$GATE_HOME/lib/ext
Khởi tạo GATE với gate.Gate.init(); Lập trình cho framework API.
GVHD: TS. Nguyễn Tuấn Đăng Trang 22
Ví dụ, đoạn mã sau sẽ tạo hệ thống chiết xuất thông tin ANNIE:
1 2 3 4 5 6
// initialise the GATE library
Gate.init();
// load ANNIE as an application from a gapp file
SerialAnalyserController controller = (SerialAnalyserController) PersistenceManager.loadObjectFromFile(new File(new File(
Gate.getPluginsHome(), ANNIEConstants.PLUGIN_DIR), ANNIEConstants.DEFAULT_FILE));
Bảng 1: Đoạn mã khởi tạo ANNIE
Nếu muốn sử dụng các tài nguyên từ bất kỳ plugin nào, cần phải nạp các
plugin trước khi gọi createResource:
1 2 3 4 5 6 7 8 9 10 11 Gate.init();
// need Tools plugin for the Morphological analyser
Gate.getCreoleRegister().registerDirectories( new File(Gate.getPluginsHome(), "Tools").toURL() );
...
ProcessingResource morpher = (ProcessingResource) Factory.createResource("gate.creole.morph.Morph");
Bảng 2: Đoạn mã nạp plugin và khởi tạo tài nguyên
Thay vì sử dụng Factory tạo các tài nguyên xử lý một cách riêng rẽ, ta có thể tạo
ứng dụng trong GATE Developer, lưu nó bằng tuỳ chọn ‘save application state’ rồi nạp trạng thái đã lưu từ trong mã lệnh. Điều này giúp nạp tự động bất kỳ plugin nào đã được nạp khi lưu trạng thái, ta không cần phải nạp bằng tay.
1 2 3 4 5 6 Gate.init();
CorpusController controller = (CorpusController)
PersistenceManager.loadObjectFromFile(new File("savedState.xgapp"));
// loadObjectFromUrl is also available
Bảng 3: Đoạn mã nạp trạng thái đã lưu