Chương trình tóm tắt văn bản

Một phần của tài liệu (LUẬN văn THẠC sĩ) tóm tắt văn bản dựa vào trích xuất câu (Trang 42 - 44)

Chương trình tóm tắt văn bản được viết bằng NetBeans IDE 8.1 có các chức năng cơ bản cho soạn thảo, xây dựng mô hình suy lận chủ đề ẩn và tóm tắt văn bản. Với giao diện đồ họa và mô tả chức năng dạng biểu tượng kết hợp chú thích tiếng Việt nên chương trình rất dễ sử dụng. Dưới đây là các nhóm chức năng chính của chương trình.

Nhóm các chức năng xử lý tệp thực hiện việc

chọn cơ sở dữ liệu tổng thể, thêm tệp dữ liệu (tệp văn bản đang mở) vào cơ sở dữ liệu tổng thể, mở tệp văn bản, tạo mới tệp văn bản, ghi tệp đang mở, xóa tệp và in tệp đang mở.

Nhóm các chức năng soạn thảo

thực hiện các chức năng soạn thảo cơ bản: đánh dấu, lựa chọn vùng văn bản, sao chép, cắt, dán, undo, redo, chọn font, chọn cỡ chữ, tìm kiếm chuỗi ký tự,...

Nhóm các chức năng xử lý dữ liệu thực hiện tách từ - tách câu, chuẩn hóa văn bản, tóm tắt văn bản, xây dựng chủ đề ẩn , hiển thị danh sách câu -

trọng số, hiển thị ma trận dộ tương đồng câu,...

Chức năng đặt thông số dùng thay đổi các thông số của chương trình.

Giao diện của chương trình gồm thanh công cụ cung cấp các chức năng

phục vụ cho tóm tắt văn bản; Panel chứa các cửa sổ hiển thị văn bản gốc, kết quả tách từ - tách câu và kết quả tóm tắt; Panel chứa các cửa sổ thể hiện kết quả xử lý dữ liệu. Các cửa sổ trong mỗi Panel có thể thay đổi kích thước khá linh hoạt giúp mở rộng diện tích quan sát kết quả.

Một phần của tài liệu (LUẬN văn THẠC sĩ) tóm tắt văn bản dựa vào trích xuất câu (Trang 42 - 44)

Tải bản đầy đủ (PDF)

(57 trang)