Kết quả phân đoạn văn bản được trình bày trong Bảng 7 và được biểu diễn trực quan hơn trong Hình 6. Trong Bảng 7 có 3 cột chính, mỗi cột tương ứng với từng cách phân đoạn, trong mỗi cột có 3 cột con gồm số thứ tự của đoạn văn bản, số thứ tự của câu đầu tiên và số thứ tự của câu cuối cùng của văn bản đó.
Bảng 7. Kết quả phân đoạn văn bản
Văn bản gốc C99 jTextTiling
STT Đầu Cuối STT Đầu Cuối STT Đầu Cuối
1 1 6 1 1 6 1 1 7
3 17 22 3 18 19 3 14 20 4 23 29 4 20 28 4 21 28 5 30 45 5 29 35 5 29 34 6 36 45 6 35 45 6 46 52 7 46 51 7 46 52 7 53 60 8 52 58 8 61 63 9 59 63 8 53 63 Trong Hình 6, dòng đầu tiên là mô hình phân đoạn có sẵn, dòng thứ 2 là mô hình phân đoạn do công cụ C99 sinh ra và dòng thứ 3 là mô hình phân đoạn do công cụ jTextTiling sinh ra. Các dấu “-“ thể hiện cho các câu, các dấu “.” thể hiện vị trí giữa các câu trong cùng một đoạn, còn các dấu “|” thể hiện đường biên phân tách giữa các đoạn.
|-.-.-.-.-.-.-|-.-.-.-.-.-.-.-.-.-|-.-.-.-.-.-|-.-.-.-.-.-.-|-.-.-.-.-.-.-.-.-.-.-.-.-.-.-.-|-.-.-.-.-.-.-|-.-.-.-.-.-.-.-|-.-.-| |-.-.-.-.-.-.-|-.-.-.-.-.-.-.-.-.-.-|-.-|-.-.-.-.-.-.-.-.-|-.-.-.-.-.-.-|-.-.-.-.-.-.-.-.-.-|-.-.-.-.-.-|-.-.-.-.-.-.-|-.-.-.-.-| |-.-.-.-.-.-.-.-|-.-.-.-.-.-|-.-.-.-.-.-.-|-.-.-.-.-.-.-.-|-.-.-.-.-.-|-.-.-.-.-.-.-.-.-.-.-|-.-.-.-.-.-.-|-.-.-.-.-.-.-.-.-.-.-|
Hình 6. Kết quả phân đoạn văn bản