Thông tin về thời gian thu thập các bộ dữ liệu sử dụng để thử nghiệm cho các mơ hình tóm tắt văn bản đề xuất được trình bày trong bảng dưới đây.
Bộ dữ liệu Ngày được cập nhật lần cuối Ngày thu thập các bộ dữ liệu
CNN/Daily Mail 07/12/2015 08/09/2017 DUC 2001 18/03/2014 19/02/2020 DUC 2002 18/03/2014 19/02/2020 DUC 2004 24/03/2011 21/07/2019 DUC 2007 24/03/2011 30/01/2019 Corpus_TMV 01/11/2013 14/02/2021 ViMs 18/11/2020 27/03/2021 Baomoi 28/07/2017 28/07/2017 B.1. Bộ dữ liệu CNN
Biểu đồ phân bố độ dài trung bình văn bản nguồn
Biểu đồ phân bố độ dài trung bình văn
bản tóm tắt
Biểu đồ phân bố độ dài trung bình văn
Biểu đồ phân bố độ dài trung bình văn bản tóm tắt
Biểu đồ phân bố độ dài trung bình
Biểu đồ phân bố độ dài trung bình văn
bản tóm tắt
B.4. Bộ dữ liệu DUC 2002
Biểu đồ phân bố độ dài trung bình văn
Biểu đồ phân bố độ dài trung bình văn
bản tóm tắt
Biểu đồ phân bố độ dài trung bình văn
bản nguồn
Biểu đồ phân bố độ dài trung bình
văn bản tóm tắt
Biểu đồ phân bố độ dài trung bình văn
Biểu đồ phân bố độ dài trung bình văn
bản tóm tắt
Biểu đồ phân bố độ dài trung bình văn
Biểu đồ phân bố độ dài trung bình văn bản tóm tắt
Biểu đồ phân bố độ dài trung bình văn
Biểu đồ phân bố độ dài trung bình văn bản tóm tắt
Biểu đồ phân bố độ dài trung bình văn
Biểu đồ phân bố độ dài trung bình văn bản tóm tắt