Quá trình thử nghiệm của luận văn được thực hiện trên hệ thống máy chủ IBM xSeries 3800 được cài đặt hệ điều hành Debian 4.0r1 (Etch) với các phiên bản phần mềm Java 1.6.0_03, GCC 4.1.2.
Các công cụ phần mềm được sử dụng trong quá trình thử nghiệm được liệt kê và mô tả trong Bảng 2.
Bảng 2. Danh sách các công cụ phần mềm sử dụng để thử nghiệm
STT Tên phần mềm Mô tả
1 jTextTiling Tác giả: Nguyễn Việt Cường
Công dụng: Thực hiện phân đoạn văn bản sử dụng mối
liên kết từ vựng. Kết quả là một văn bản được phân đoạn tuyến tính. Công cụ này được triển khai trên ngôn ngữ Java dựa trên mã nguồn của TextTiling viết bằng C của Marti Hearst, đồng thời có bổ sung một số đề xuất của luận văn.
3 C99 Tác giả: Freddy Choi
Site: http://www.lingware.co.uk/homepage/freddy.choi/
Công dụng: Phân đoạn văn bản sử dụng mối liên kết từ vựng kết hợp với đồ thị dotplotting. Kết quả là một văn bản được phân đoạn tuyến tính.
1 LT CHUNK Tác giả: Edinburgh Language Technology Group
Site: http://www.ltg.ed.ac.uk/
Công dụng: Thực hiện gán nhãn từ loại cho các từ trong một văn bản, đồng thời nhận diện ra các cụm danh từ và cụm động từ.
4 SUMMA Tác giả: Marie-Francine Moens
Site: http://www.cs.kuleuven.be/~liir/
Công dụng: Sinh tiêu đề cho một đoạn văn bản dựa trên khái niệm chủ đề của câu.
Trong quá trình thực hiện thử nghiệm, tôi có tiến hành chỉnh sửa công cụ SUMMA để phù hợp hơn với bài toán xây dựng mục lục cho văn bản và thử nghiệm các đề xuất đã nêu trong Chương 3 về đảm bảo tính hợp lí của mục lục.