[1] Nguyễn Ngọc Bình, Phan Thanh Liêm, Trần Văn Quang, Hồ Tú Bảo (2006), “Ứng dụng mô hình tập thô dung sai trong xử lý văn bản tiếng Việt”, Hội nghị KH Kỷ niệm 30 năm ngày thành lập Viện CNTT, Hà Nội, 27/12/2006, pp. 481-490.
[2] Nguyễn Linh Giang, Nguyễn Mạnh Hiển (2006), “Phân loại văn bản tiếng Việt với bộ phân loại vectơ hỗ trợ SVM”, Đặc san Tạp chí BCVT & CNTT, số 7/2006.
[3] Hà Thành Lê, Lương Chi Mai, Huỳnh Quyết Thắng, Đinh Thị Phương Thu (2005), “Kết hợp các phương pháp chọn câu quan trọng xây dựng ứng dụng tóm tắt văn bản Tiếng Việt”,
Hội thảo Quốc gia VIII,, Hải Phòng, 24-25/8/2005, pp. 413-421.
[4] Đỗ Phúc, Hoàng Kiếm (2004), “Rút trích ý chính từ văn bản Tiếng Việt hỗ trợ tạo tóm tắt nội dung”, Tạp chí Các công trình nghiên cứu –triển khai viễn thông và công nghệ thông tin, số 13, pp. 59-63.
[5] Đỗ Phúc, Hồ Anh Thư (2005), “Rút trích và tóm tắt nội dung văn bản Tiếng Việt”,
FAIR’05, Hồ Chí Minh, 23-24/09/2005, pp. 317-328.
[6] Vũ Đức Thi, Hoàng Văn Dũng (2007), “Áp dụng kỹ thuật phân cụm dữ liệu trong phân cụm kết quả tìm kiếm”, Hội thảo quốc gia lần thứ X, Một số vấn đề chọn lọc của CNTT và truyền thông, Vĩnh Phúc, 14-15/9/2007, pp. 32-39.
[7] Achananuparp P., Hu X., Shen X. (2008), “The Evaluation of Sentence Similarity Measures”,
DaWaK’ 2008, Turin, Italy, 1-5/9/2008, pp. 305-316.
[8] Aery M., Chakravarthy S. (2005), “eMailSift: Email Classification Based on Structure and Content”, ICDM’2005, Houston, USA, 27-30/11/2005, pp. 18-25.
[9] Baeza-Yates R., Ribeiro-Neto B. (1999), “Modern Information Retrieval”, Addison Wesley. [10] Carbonell J., Goldstein J. (1998), “Use of MMR, diversity-based reranking for reordering
documents and producing summaries”, ACM SIGIR’1998, 24-28/8/1998, pp. 335–336.
[11] Do P., Hoang K. (2005), “Improving Learning Algorithm of Self Organizing Map for Document Clustering”, RIVF’05, Can Tho, Vietnam, 21-24/2/2005, pp. 173-176.
[12] Dinh Dien, Vu Thuy (2006), “A maximum entropy approach for Vietnamese word segmentation”, RIVF’2006, Ho Chi Minh, Vietnam, 12-16/2/2006, pp. 247 – 252.
[13] Edmundson H.P. (1969), “New Methods in Automatic Extracting”, Journal of the ACM, 16(2), pp. 264-285.
[14] Erkan G., Radev R. (2004), “LexRank: Graph-based Lexical Centrality as Salience in Text Summarization”, Journal of Articial Intelligence Research, 22, pp. 457-479.
[15] Ester M., Kriegel H-P., Sander J., Wimmer M., Xu X. (1998), “Incremental Clustering for Mining in a Data Warehousing Environment”, VLDB’1998, USA, 24-27/8/1998, pp. 1-11. [16] Hammouda M., Kamel M. (2003), “Incremental Document Clustering using Cluster Similarity
Histogram”, IEEE/WIC Int’l Conf. on Web Intelligence, China, 20-24/9/2004, pp. 597-601. [17] Hammouda M., Kamel M. (2004), “Efficient Phrase-Based Document Clustering for Web
Document Clustering”, IEEE TKDE, Vol.16, pp. 1279-1285.
[18] Hearst M. (1999), “Untangling Text Data Mining”, ACL’1999, College Park, USA, 20- 26/6/1999 , pp. 3-10.
[19] Hung Nguyen, Ha Nguyen, Thuc Vu, Nghia Tran, Kiem Hoang (2005), “Internet and Genetics Algorithm-based Text Categorization for Documents in Vietnamese”, RIVF’2005, Can Tho, Vietnam, 21-24/2/2005, pp. 168-172.
[20] Lin C.Y., Hovy E.H. (2003), “Automatic evaluation of summaries using n-gram co- occurrence statistics”, HLT-NAACL‟2003, Edmonton, Canada, 27/5-1/6/2003, pp. 71-78. [21] Liu T., Liu S., Chen Z., Ma W-Y. (2003), “An Evaluation on Feature Selection for Text
Clustering”, ICML’2003, Washington, DC, USA, 21-24/8/2003, pp. 488-495.
[22] Mani I, Maybury M. (1999), “Advances in automatic text summarization”, MIT Press. [23] Markov A., Last M.(2005), “Efficient graph-based representation of web documents”,
MGTS’2005, Porto, Portugal, 3-7/10/2005, pp. 52–62.
[24] Markov A., Last M., Kandel A. (2008), “The Hybrid Representation Model for Web Document Classification”, International Journal of Intelligent Systems, 23(6), pp. 654-679. [25] Mihalcea R., Tarau P. (2004), “TextRank: Bringing Order into Texts”, EMNLP’2004,
Barcelona, Spain, 25-26/7/2004, pp. 404-411.
[26] Mihalcea R., Tarau P. (2005), “A language independent algorithm for single and multiple document summarization”, IJCNLP’2005.
[27] Nguyen G. S., Gao X., Andreae P. M. (2009), „Text Categorization for Vietnamese Documents‟, WI-IAT’2009, Milan, Italy, 15-18/9/2009, pp. 466-469.
[28] Oracle Text - An Oracle White Paper (3/2002),
[29] Salton G., Wong A., Yang C.S. (1975), “A vector space model for automatic indexing”,
Communication of ACM,18(11), pp. 613-620.
[30] Schenker A., Last M., Bunke H., Kandel A. (2003), “A Comparison of Two Novel Algorithms for Clustering Web Documents”, IWWDA’2003, pp. 71-74.
[31] Schenker A., Last M., Bunke H., Kandel A. (2004), “Classification Of Web Documents Using Graph Matching”, Inter. Journal of Pattern Recognition and Artificial Intelligence, Special Issue on Graph Matching in Computer Vision and Pattern Recognition, 18(3), pp. 475-479. [32] Sebastiani F. (2002), “Machine Learning in Automated Text Categorization”, ACM
Computing Surveys, 34(1), pp. 1- 47.
[33] Sowa J.F. (1976), “Conceptual Graphs for a DataBase Interface”, IBM Journal of Research and Development, 20(4), pp. 336–357.
[34] Wong W., Fu A. (2000), “Incremental Document Clustering for Webpage Classification”,
IEEE 2000Int’l Conf. on Information Soc. in the 21st Century: Emerging Technologies and New Challenges, Fukushima, Japan, 5-8/11/2000.
[35] Worlein M., Meinl T., Fisher I., Philippsen M. (2005), “A Quantative Comparision of the Subgraph Miners MoFa, gSpan, FFSM, and Gaston”, PKDD’2005, Porto, Portugal, 3- 7/10/2005, LNAI 3721, pp. 392-403.
[36] Yan X., Han J. (2002), “gSpan: Graph-Based Substructure Pattern Mining”, ICDM’2002, Maebashi, Japan, 9-12/12/2002, pp.721-723.
[37] Yang Y., Liu X. (1999), “A re-examination of text categorization methods”, ACM SIGIR’1999, Berkeley, USA, 15-19/8/1999, pp. 42-49.
[38] Yang Y., Pedersen J.O. (1997), “A comparative studyon feature selection in text categorization”, ICML’1997, Nashville, USA, 8-12/7/1997, pp. 412-420.
[39] Zha H. (2002), “Generic Summarization and Keyphrase Extraction Using Mutual Reinforcement Principle and Sentence Clustering”, ACM SIGIR’2002, Tampere, Finland, 11- 15/8/2002, pp. 113-200.