1. Trang chủ
  2. » Luận Văn - Báo Cáo

Phân lớp thư điện tử sử dụng máy Vector hỗ trợ

69 480 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 69
Dung lượng 1,2 MB

Nội dung

Ngày đăng: 25/03/2015, 10:03

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
[1]. Đoàn Sơn (2002), Một số giải pháp cho bài toán tìm kiếm trong cơ sở dữ liệu Hypertext. Luận văn thạc sỹ Công nghệ thông tin 2002 Khoa Công Nghệ - Đại Học Quốc Gia Hà Nội Sách, tạp chí
Tiêu đề: Một số giải pháp cho bài toán tìm kiếm trong cơ sở dữ liệu Hypertext
Tác giả: Đoàn Sơn
Năm: 2002
[2]. Nguyễn Thị Thùy Linh, Nguyễn Thu Trang, Nguyễn Thị Hương Thảo, Hà Quang Thụy (2007), Một giải pháp học bán giám sát SVM phân lớp trang web tiếng Việt. Báo cáo tại Hội thảo FAIR'07, Nha Trang, 8-2007 Sách, tạp chí
Tiêu đề: Một giải pháp học bán giám sát SVM phân lớp trang web tiếng Việt
Tác giả: Nguyễn Thị Thùy Linh, Nguyễn Thu Trang, Nguyễn Thị Hương Thảo, Hà Quang Thụy
Năm: 2007
[3]. Phan Xuân Hiếu (2003), Khai phá song song luật kết hợp mờ. Luận văn thạc sỹ Công nghệ thông tin 2003 - Khoa Công Nghệ - Đại Học Quốc Gia Hà Nội Sách, tạp chí
Tiêu đề: Khai phá song song luật kết hợp mờ
Tác giả: Phan Xuân Hiếu
Năm: 2003
[4]. Hà Quang Thuỵ, Đặng Thanh Hải, Nguyễn Cẩm Tú, Nguyễn Việt Cường, Nguyễn Thu Trang, Nguyễn Thị Thùy Linh, Nguyễn Thị Hương Thảo, Trần Thị Oanh (2007). Nghiên cứu, phân tích và đánh giá các thuật toán lọc văn bản theo nội dung. Báo cáo chuyên đề Đề tài cấp Nhà nước KC.01.02/06-10, 10-2007.Tiếng Anh Sách, tạp chí
Tiêu đề: Nghiên cứu, phân tích và đánh giá các thuật toán lọc văn bản theo nội dung
Tác giả: Hà Quang Thuỵ, Đặng Thanh Hải, Nguyễn Cẩm Tú, Nguyễn Việt Cường, Nguyễn Thu Trang, Nguyễn Thị Thùy Linh, Nguyễn Thị Hương Thảo, Trần Thị Oanh
Năm: 2007
[5]. Alan Rea (1996). Data Mining – An Introduction. http://www.pcc.qub.ac.uk/tec/courses/datamining/ohp/dm-OHP-final_1.html Sách, tạp chí
Tiêu đề: Data Mining – An Introduction
Tác giả: Alan Rea
Năm: 1996
[7]. Pierre Baldi, Paolo Frasconi, Padhraic Smyth (2003). Modeling the Internet and the Web: Probabilistic Methods and Algorithms. Wiley, 2003, ISBN: 0-470-84906-1 Sách, tạp chí
Tiêu đề: Modeling the Internet and the Web: Probabilistic Methods and Algorithms
Tác giả: Pierre Baldi, Paolo Frasconi, Padhraic Smyth
Năm: 2003
[9]. Greg Kochanski (2005), Markov Models, Hidden and Otherwise. http://www.kochanski.org/gpk 2005/02/28 Sách, tạp chí
Tiêu đề: Markov Models, Hidden and Otherwise
Tác giả: Greg Kochanski
Năm: 2005
[10]. Jiawei Han and Micheline Kamber (2001), Data Mining: Concepts and Techniques. University of Illinois, Morgan Kaufmann Publishers 2001 Sách, tạp chí
Tiêu đề: Data Mining: Concepts and Techniques
Tác giả: Jiawei Han and Micheline Kamber
Năm: 2001
[11]. J.D.Brutlag, C.Meek (2000). Challenges of the Email Domain for Text Classification ICML 2000 : 103-110 Sách, tạp chí
Tiêu đề: Challenges of the Email Domain for Text Classification
Tác giả: J.D.Brutlag, C.Meek
Năm: 2000
[12]. Manoel Mendonca (2000), Mining Software Engineering Data: A Survey. University of Maryland, Department of Computer Science, A. V.Williams Building #3225 College Park, MD 20742. 2000 Sách, tạp chí
Tiêu đề: Mining Software Engineering Data: A Survey
Tác giả: Manoel Mendonca
Năm: 2000
[13]. Nancy R. Zhang (2001), Hidden Markov Models for Information Extraction. June, 2001 Sách, tạp chí
Tiêu đề: Hidden Markov Models for Information Extraction
Tác giả: Nancy R. Zhang
Năm: 2001
[14] P.S.Keila, D.B.Skillicorn (2005). Structure in the enron email dataset Proceeding of SIAM international conference on data mining, 2005 Sách, tạp chí
Tiêu đề: Structure in the enron email dataset
Tác giả: P.S.Keila, D.B.Skillicorn
Năm: 2005
[15]. R. Agrawal, M. Mehta, J. Shafer, R. Srikant, A. Arning, T. Bollinger (1996). The Quest Data Mining System. Proceedings of 1996 International Conference on Data Mining and Knowledge Discovery (KDD’96), Portland, Oregon, August 1996 Sách, tạp chí
Tiêu đề: The Quest Data Mining System
Tác giả: R. Agrawal, M. Mehta, J. Shafer, R. Srikant, A. Arning, T. Bollinger
Năm: 1996
[16]. Ron Bekkerman, Andrew McCallum, Gary Huang (2004). Automatic Categorization of Email into Folders : Benchmark Experiments on enron and SRI corpora Technical report IR-418 2004 Sách, tạp chí
Tiêu đề: Automatic Categorization of Email into Folders : Benchmark Experiments on enron and SRI corpora
Tác giả: Ron Bekkerman, Andrew McCallum, Gary Huang
Năm: 2004
[17]. Soumen Chakrabaki (2003), Mining the Web: Discovering Knowledge from Hypertext Data. Morgan Kaufmann Publishers, 2003 Sách, tạp chí
Tiêu đề: Mining the Web: Discovering Knowledge from Hypertext Data
Tác giả: Soumen Chakrabaki
Năm: 2003
[18] Steve Martin, Anil Sewani, Blaine Nelson, Karl Chen, Anthony D.Joseph (2005). Analyzing behaviorial features for email classification Second conference on email and antispam (CEAS 2005) Sách, tạp chí
Tiêu đề: Analyzing behaviorial features for email classification
Tác giả: Steve Martin, Anil Sewani, Blaine Nelson, Karl Chen, Anthony D.Joseph
Năm: 2005
[19] Svetlana Kiritchenko, Stan Matwin (2001). Email classification with co- training Proceedings of the 2001 conference of the centre of advanced studies on collaborative research Sách, tạp chí
Tiêu đề: Email classification with co-training
Tác giả: Svetlana Kiritchenko, Stan Matwin
Năm: 2001
[20]. U. M. Fayyad, G. Piatetsky-Shapio, P. Smyth, and R. Uthurusamy (eds.) (1996), Advances in Knowledge Discovery and Data Mining. AAAI/MIT Press, 1996 Sách, tạp chí
Tiêu đề: Advances in Knowledge Discovery and Data Mining
Tác giả: U. M. Fayyad, G. Piatetsky-Shapio, P. Smyth, and R. Uthurusamy (eds.)
Năm: 1996
[21]. Sen Slattery (2002). Hypertext Classification. Doctoral dissertation (CMU-CS-02-142). School of Computer Science. Carnegie Mellon University, 2002 Sách, tạp chí
Tiêu đề: Hypertext Classification
Tác giả: Sen Slattery
Năm: 2002
[6]. C.C. Chang and C.J. Lin (2007). LIBSVM: a library for support vector machines. http://www.csie.ntu.edu.tw/~cjlin/libsvm/ Link

HÌNH ẢNH LIÊN QUAN

Hình 1 - Lượng dữ liệu được tích lũy tăng mạnh theo thời gian - Phân lớp thư điện tử sử dụng máy Vector hỗ trợ
Hình 1 Lượng dữ liệu được tích lũy tăng mạnh theo thời gian (Trang 10)
Hình 2 - Các bước trong quá trình khám phá tri thức (KDD)  1.1.2 Các hướng tiếp cận và các dạng dữ liệu trong Khai phá dữ liệu  a) Các hướng tiếp cận - Phân lớp thư điện tử sử dụng máy Vector hỗ trợ
Hình 2 Các bước trong quá trình khám phá tri thức (KDD) 1.1.2 Các hướng tiếp cận và các dạng dữ liệu trong Khai phá dữ liệu a) Các hướng tiếp cận (Trang 13)
Hình 3. Các nội dung trong khai phá Web - Phân lớp thư điện tử sử dụng máy Vector hỗ trợ
Hình 3. Các nội dung trong khai phá Web (Trang 23)
Hình 4.  Mô hình của bài toán phân lớp - Phân lớp thư điện tử sử dụng máy Vector hỗ trợ
Hình 4. Mô hình của bài toán phân lớp (Trang 24)
Hình 6.  Mô hình phân lớp-đánh giá độ chính xác của mô hình - Phân lớp thư điện tử sử dụng máy Vector hỗ trợ
Hình 6. Mô hình phân lớp-đánh giá độ chính xác của mô hình (Trang 26)
Hình 7.  Mối quan hệ giữa các siêu phẳng phân cách - Phân lớp thư điện tử sử dụng máy Vector hỗ trợ
Hình 7. Mối quan hệ giữa các siêu phẳng phân cách (Trang 43)
Hình 8. Biên giới của siêu phẳng phân cách - Phân lớp thư điện tử sử dụng máy Vector hỗ trợ
Hình 8. Biên giới của siêu phẳng phân cách (Trang 44)
Hình 9.  Mô phỏng một điểm dữ liệu nhiễu - Phân lớp thư điện tử sử dụng máy Vector hỗ trợ
Hình 9. Mô phỏng một điểm dữ liệu nhiễu (Trang 46)
Hình 10. Minh họa cho trường hợp tập dữ liệu  không thể phân tách tuyến tính được - Phân lớp thư điện tử sử dụng máy Vector hỗ trợ
Hình 10. Minh họa cho trường hợp tập dữ liệu không thể phân tách tuyến tính được (Trang 47)
Hình 11- Một minh họa khác bằng ảnh khi ánh xạ sang không gian mới  ta có thể phân tách tuyến tính tập dữ liệu - Phân lớp thư điện tử sử dụng máy Vector hỗ trợ
Hình 11 Một minh họa khác bằng ảnh khi ánh xạ sang không gian mới ta có thể phân tách tuyến tính tập dữ liệu (Trang 48)
Bảng 1: Thống kê tập dữ liệu sử dụng - Phân lớp thư điện tử sử dụng máy Vector hỗ trợ
Bảng 1 Thống kê tập dữ liệu sử dụng (Trang 53)
Hình 12. Thực nghiệm với kiểu hàm nhân tuyến tính đối với người dùng Becks - Phân lớp thư điện tử sử dụng máy Vector hỗ trợ
Hình 12. Thực nghiệm với kiểu hàm nhân tuyến tính đối với người dùng Becks (Trang 59)
Bảng 4: Độ chính xác của bộ phân lớp ứng với từng hàm nhân - Phân lớp thư điện tử sử dụng máy Vector hỗ trợ
Bảng 4 Độ chính xác của bộ phân lớp ứng với từng hàm nhân (Trang 59)
Hình 13 - Đồ thị biểu diễn độ chính xác của bộ phân lớp  SVM khi áp dụng các hàm nhân khác nhau - Phân lớp thư điện tử sử dụng máy Vector hỗ trợ
Hình 13 Đồ thị biểu diễn độ chính xác của bộ phân lớp SVM khi áp dụng các hàm nhân khác nhau (Trang 60)
Hình 14. Sử dụng svm-train để huấn luyện trên tập   dữ liệu huấn luyện train_scale.tr - Phân lớp thư điện tử sử dụng máy Vector hỗ trợ
Hình 14. Sử dụng svm-train để huấn luyện trên tập dữ liệu huấn luyện train_scale.tr (Trang 61)

TỪ KHÓA LIÊN QUAN

TRÍCH ĐOẠN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w