Kết quả phân đoạn văn bản

Một phần của tài liệu (Luận văn thạc sĩ) tự động sinh mục lục cho văn bản luận văn ths công nghệ thông tin 60 48 05 (Trang 39 - 40)

Kết quả phân đoạn văn bản được trình bày trong Bảng 7 và được biểu diễn trực quan hơn trong Hình 6. Trong Bảng 7 có 3 cột chính, mỗi cột tương ứng với từng cách phân đoạn, trong mỗi cột có 3 cột con gồm số thứ tự của đoạn văn bản, số thứ tự của câu đầu tiên và số thứ tự của câu cuối cùng của văn bản đó.

Bảng 7. Kết quả phân đoạn văn bản

Văn bản gốc C99 jTextTiling

STT Đầu Cuối STT Đầu Cuối STT Đầu Cuối

1 1 6 1 1 6 1 1 7

3 17 22 3 18 19 3 14 20 4 23 29 4 20 28 4 21 28 5 30 45 5 29 35 5 29 34 6 36 45 6 35 45 6 46 52 7 46 51 7 46 52 7 53 60 8 52 58 8 61 63 9 59 63 8 53 63 Trong Hình 6, dòng đầu tiên là mô hình phân đoạn có sẵn, dòng thứ 2 là mô hình phân đoạn do công cụ C99 sinh ra và dòng thứ 3 là mô hình phân đoạn do công cụ jTextTiling sinh ra. Các dấu “-“ thể hiện cho các câu, các dấu “.” thể hiện vị trí giữa các câu trong cùng một đoạn, còn các dấu “|” thể hiện đường biên phân tách giữa các đoạn.

|-.-.-.-.-.-.-|-.-.-.-.-.-.-.-.-.-|-.-.-.-.-.-|-.-.-.-.-.-.-|-.-.-.-.-.-.-.-.-.-.-.-.-.-.-.-|-.-.-.-.-.-.-|-.-.-.-.-.-.-.-|-.-.-| |-.-.-.-.-.-.-|-.-.-.-.-.-.-.-.-.-.-|-.-|-.-.-.-.-.-.-.-.-|-.-.-.-.-.-.-|-.-.-.-.-.-.-.-.-.-|-.-.-.-.-.-|-.-.-.-.-.-.-|-.-.-.-.-| |-.-.-.-.-.-.-.-|-.-.-.-.-.-|-.-.-.-.-.-.-|-.-.-.-.-.-.-.-|-.-.-.-.-.-|-.-.-.-.-.-.-.-.-.-.-|-.-.-.-.-.-.-|-.-.-.-.-.-.-.-.-.-.-|

Hình 6. Kết quả phân đoạn văn bản

Một phần của tài liệu (Luận văn thạc sĩ) tự động sinh mục lục cho văn bản luận văn ths công nghệ thông tin 60 48 05 (Trang 39 - 40)

Tải bản đầy đủ (PDF)

(48 trang)