1. Trang chủ
  2. » Thể loại khác

CÁC PHƯƠNG PHÁP PHÂN LỚP ĐA NHÃN VĂN BẢN TIẾNG VIỆT KHÓA LUẬN TỐT NGHIỆP ĐẠ HỌC HỆ CHÍNH QUY

53 2 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Các Phương Pháp Phân Lớp Đa Nhãn Văn Bản Tiếng Việt
Tác giả Nguyễn Thị Thảo
Người hướng dẫn TS. Nguyễn Cẩm Tú, ThS. Phạm Thị Ngân
Trường học Đại Học Quốc Gia Hà Nội
Chuyên ngành Công Nghệ Thông Tin
Thể loại khóa luận tốt nghiệp
Năm xuất bản 2013
Thành phố Hà Nội
Định dạng
Số trang 53
Dung lượng 1,24 MB

Nội dung

Ngày đăng: 17/05/2022, 01:53

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
[1] Tao. Li, Mitsunori Ogihara and George Tzanetakis, "Detecting emotion in music," In Proceedings of the International Symposium on Music Information Retrieval, pp. 239-240, Washington D.C, USA 2003 Sách, tạp chí
Tiêu đề: Detecting emotion in music
[2] Sotiris Diplaris, Grigorios Tsoumakas and Pericles A., "Protein Classification with Multiple Algorithms," In Bozanis, P. Houstis, pp. 448-456, PCI 2005. LNCS, vol.3746 Springer, Heidelberg 2005 Sách, tạp chí
Tiêu đề: Protein Classification with Multiple Algorithms
[3] Volker Roth and Bernd Fischer, "Improved functional prediction of proteins by learning kernel combinations in multilabel settings," In Proceeding of 2006 Workshop on Proba-billistic Modeling and Machine Learning in Structural and System Biology (PMSB 2006), Tuusula, Finland (2006) Sách, tạp chí
Tiêu đề: Improved functional prediction of proteins by learning kernel combinations in multilabel settings
[4] Xipeng Shen, Matthew Boutell, Jiebo Luo and Christoph, "Learn-ing multi-label scene classification.," Pattern Recognition, pp. 1757-1771, 2004 Sách, tạp chí
Tiêu đề: Learn-ing multi-label scene classification
[5] Kang, Jin and Sukthankar, "Correlated label propagation with application to multi- label learning," In: CVPR: Proceedings of the 2006 IEEE Computer Society Conference on Computer Vision and Pattern Recognition, New York City, IEEE Computer Society Press, Los Alamitos, pp. 1719-1726, 2006 Sách, tạp chí
Tiêu đề: Correlated label propagation with application to multi-label learning
[6] Cam-Tu Nguyen, Xuan-Hieu Phan, Natsuda Kaothanthon and Takeshi Tokuyama, "A feature-word-topic model for image annotation," pp. 1481-1484, 2010 Sách, tạp chí
Tiêu đề: A feature-word-topic model for image annotation
[7] Vlahavas, Grigorios Tsoumakas and Ioannis, "Random k-Labelsets: An Ensemble Method for Multilabel Classification," 2007 Sách, tạp chí
Tiêu đề: Random k-Labelsets: An Ensemble Method for Multilabel Classification
[8] Jesse Read, Bernhard Pfahringer, Geoff Holmes and Eib, "Classifier Chains for Multi-label Classification," In: Buntine, W.Grobelnik, M. Mladenic, D. Shawe - Taylor, J. (eds.) ECML PKDD, Part II. LNCS (LNAI), vol. 5782, pp. 254 - 269, 2009 Sách, tạp chí
Tiêu đề: Classifier Chains for Multi-label Classification
[9] David M. Blei, Andrew Y. Ng and Michael I.Jordan, "Latent Dirichlet Allocation," The Journal of Machine Learning Research, vol. 3, pp. 993-1022, 2003 Sách, tạp chí
Tiêu đề: Latent Dirichlet Allocation
[10] Zhi-Hua Zhou*, Min-Ling Zhang, Sheng-Jun Huang and Yu, "Multi-Instance Multi-Label Learning with Application to Scene Classification," National Key Laboratory for Novel Software Technology, Nanjing University, Nanjing 210046, China, pp. 2291-2320, January, 2012 Sách, tạp chí
Tiêu đề: Multi-Instance Multi-Label Learning with Application to Scene Classification
[12] I. K. Grigorios Tsoumakas, "Multi-Label Classification: An Overview," International Journal of Data Warehousing and Mining, 2007 Sách, tạp chí
Tiêu đề: Multi-Label Classification: An Overview
[13] Min-Ling Zhang and Zhi-Hua Zhou*, "ML-KNN: A Lazy Learning Approach to Multi-Label Learning," National Laboratory for Novel Software Technology Nanjing University, Nanjing 210093, China, pp. 2038-2048, 2007 Sách, tạp chí
Tiêu đề: ML-KNN: A Lazy Learning Approach to Multi-Label Learning
[14] Xindong Wu, Vipin Kumar and J. Ross Quinlan Joydeep , "Top 10 algorithms in data mining," Knowledge and Information Systems, March, 2008 Sách, tạp chí
Tiêu đề: Top 10 algorithms in data mining
[15] Zoulficar Younes, Fahed Abdallah and Thierry Denceux, "Multi-label classification algorithm derived from k-Nearest neighbor rule with label dependencies," In: Proc. of the 16th European Signal Processing Conference, Lausanne, Switzerland, August, 2008 Sách, tạp chí
Tiêu đề: Multi-label classification algorithm derived from k-Nearest neighbor rule with label dependencies
[16] Hofmann and Thomas, "Unsupervised Learning by Probabilistic Latent Semantic Analysis," Machine Learning, pp. 177-196, 2001 Sách, tạp chí
Tiêu đề: Unsupervised Learning by Probabilistic Latent Semantic Analysis
[17] Xuan-Hieu Phan, Cam-Tu Nguyen, Dieu-Thu Le, Le-Minh Nguyen, Susumu Horiguchi and Quang-Thuy Ha, "A Hidden Topic-Based Framework toward Building Applications with Short Web Documents," IEEE Transactions on Knowledge and Data Engineering, vol. 23, pp. 1617-1621, july 2011 Sách, tạp chí
Tiêu đề: A Hidden Topic-Based Framework toward Building Applications with Short Web Documents
[18] Heinrich and Gregor, "Parameter estimation for text analysis," In Proc UAI, Technical report, 2005 Sách, tạp chí
Tiêu đề: Parameter estimation for text analysis
[19] Maron, "Automatic indexing," An experimental inquiry, pp. 404-417, J.ACM 8, 3 1961 Sách, tạp chí
Tiêu đề: Automatic indexing

HÌNH ẢNH LIÊN QUAN

Hình 1.1 Ví dụ dữ liệu đa nhãn - CÁC PHƯƠNG PHÁP PHÂN LỚP ĐA NHÃN  VĂN BẢN TIẾNG VIỆT   KHÓA LUẬN TỐT NGHIỆP ĐẠ HỌC HỆ CHÍNH QUY
Hình 1.1 Ví dụ dữ liệu đa nhãn (Trang 15)
Hình 1.3 Học đa nhãn [10] - CÁC PHƯƠNG PHÁP PHÂN LỚP ĐA NHÃN  VĂN BẢN TIẾNG VIỆT   KHÓA LUẬN TỐT NGHIỆP ĐẠ HỌC HỆ CHÍNH QUY
Hình 1.3 Học đa nhãn [10] (Trang 16)
Hình 1.4 Bài tốn phân lớp văn bản - CÁC PHƯƠNG PHÁP PHÂN LỚP ĐA NHÃN  VĂN BẢN TIẾNG VIỆT   KHÓA LUẬN TỐT NGHIỆP ĐẠ HỌC HỆ CHÍNH QUY
Hình 1.4 Bài tốn phân lớp văn bản (Trang 17)
Bảng 2.1Biểu diễn dữ liệu theo phương pháp nhị phân - CÁC PHƯƠNG PHÁP PHÂN LỚP ĐA NHÃN  VĂN BẢN TIẾNG VIỆT   KHÓA LUẬN TỐT NGHIỆP ĐẠ HỌC HỆ CHÍNH QUY
Bảng 2.1 Biểu diễn dữ liệu theo phương pháp nhị phân (Trang 19)
Hình 2.1 Mã giả thuật tốn ML-kNN - CÁC PHƯƠNG PHÁP PHÂN LỚP ĐA NHÃN  VĂN BẢN TIẾNG VIỆT   KHÓA LUẬN TỐT NGHIỆP ĐẠ HỌC HỆ CHÍNH QUY
Hình 2.1 Mã giả thuật tốn ML-kNN (Trang 22)
2.2 Phương pháp và một số độ đo đánh giá các mơ hình phân lớp đa nhãn - CÁC PHƯƠNG PHÁP PHÂN LỚP ĐA NHÃN  VĂN BẢN TIẾNG VIỆT   KHÓA LUẬN TỐT NGHIỆP ĐẠ HỌC HỆ CHÍNH QUY
2.2 Phương pháp và một số độ đo đánh giá các mơ hình phân lớp đa nhãn (Trang 24)
Bảng 2.1 Chuyển đổi nhị phân giữa BR và CC [8] - CÁC PHƯƠNG PHÁP PHÂN LỚP ĐA NHÃN  VĂN BẢN TIẾNG VIỆT   KHÓA LUẬN TỐT NGHIỆP ĐẠ HỌC HỆ CHÍNH QUY
Bảng 2.1 Chuyển đổi nhị phân giữa BR và CC [8] (Trang 24)
Trong đĩ, mỗi phần của mơ hình được coi như một mơ hình trộn hữu hạn trên cơ sở tập các xác suất của chủ đề - CÁC PHƯƠNG PHÁP PHÂN LỚP ĐA NHÃN  VĂN BẢN TIẾNG VIỆT   KHÓA LUẬN TỐT NGHIỆP ĐẠ HỌC HỆ CHÍNH QUY
rong đĩ, mỗi phần của mơ hình được coi như một mơ hình trộn hữu hạn trên cơ sở tập các xác suất của chủ đề (Trang 27)
Hình 2.4 Mã giả các bước xử lí trong mơ hình LDA - CÁC PHƯƠNG PHÁP PHÂN LỚP ĐA NHÃN  VĂN BẢN TIẾNG VIỆT   KHÓA LUẬN TỐT NGHIỆP ĐẠ HỌC HỆ CHÍNH QUY
Hình 2.4 Mã giả các bước xử lí trong mơ hình LDA (Trang 28)
Bảng 2.3 Mơ hình chủ đề 5 - CÁC PHƯƠNG PHÁP PHÂN LỚP ĐA NHÃN  VĂN BẢN TIẾNG VIỆT   KHÓA LUẬN TỐT NGHIỆP ĐẠ HỌC HỆ CHÍNH QUY
Bảng 2.3 Mơ hình chủ đề 5 (Trang 30)
Bảng 2.5Mơ hình chủ đề 33 - CÁC PHƯƠNG PHÁP PHÂN LỚP ĐA NHÃN  VĂN BẢN TIẾNG VIỆT   KHÓA LUẬN TỐT NGHIỆP ĐẠ HỌC HỆ CHÍNH QUY
Bảng 2.5 Mơ hình chủ đề 33 (Trang 31)
Bảng 2.4 Mơ hình chủ đề 11 - CÁC PHƯƠNG PHÁP PHÂN LỚP ĐA NHÃN  VĂN BẢN TIẾNG VIỆT   KHÓA LUẬN TỐT NGHIỆP ĐẠ HỌC HỆ CHÍNH QUY
Bảng 2.4 Mơ hình chủ đề 11 (Trang 31)
Hình 3.1 Mơ hình đề xuất - CÁC PHƯƠNG PHÁP PHÂN LỚP ĐA NHÃN  VĂN BẢN TIẾNG VIỆT   KHÓA LUẬN TỐT NGHIỆP ĐẠ HỌC HỆ CHÍNH QUY
Hình 3.1 Mơ hình đề xuất (Trang 34)
Dựa vào mơ hình đề xuất ở chương 3, khĩa luận tiến hành thực nghiệm việc đánh giá phân lớp dữ liệu tiếng Việt với gần 3000 bài báo trên http://vn.expresss.net  - CÁC PHƯƠNG PHÁP PHÂN LỚP ĐA NHÃN  VĂN BẢN TIẾNG VIỆT   KHÓA LUẬN TỐT NGHIỆP ĐẠ HỌC HỆ CHÍNH QUY
a vào mơ hình đề xuất ở chương 3, khĩa luận tiến hành thực nghiệm việc đánh giá phân lớp dữ liệu tiếng Việt với gần 3000 bài báo trên http://vn.expresss.net (Trang 39)
Bảng 4.2 Cơng cụ phát triển - CÁC PHƯƠNG PHÁP PHÂN LỚP ĐA NHÃN  VĂN BẢN TIẾNG VIỆT   KHÓA LUẬN TỐT NGHIỆP ĐẠ HỌC HỆ CHÍNH QUY
Bảng 4.2 Cơng cụ phát triển (Trang 40)
Bảng 4.3 Danh sách một số nhãn - CÁC PHƯƠNG PHÁP PHÂN LỚP ĐA NHÃN  VĂN BẢN TIẾNG VIỆT   KHÓA LUẬN TỐT NGHIỆP ĐẠ HỌC HỆ CHÍNH QUY
Bảng 4.3 Danh sách một số nhãn (Trang 41)
Bảng 4.4 Kết quả thực nghiệm 1 - CÁC PHƯƠNG PHÁP PHÂN LỚP ĐA NHÃN  VĂN BẢN TIẾNG VIỆT   KHÓA LUẬN TỐT NGHIỆP ĐẠ HỌC HỆ CHÍNH QUY
Bảng 4.4 Kết quả thực nghiệm 1 (Trang 45)
Bảng 4.5 Kết quả thực nghiệm 2 - CÁC PHƯƠNG PHÁP PHÂN LỚP ĐA NHÃN  VĂN BẢN TIẾNG VIỆT   KHÓA LUẬN TỐT NGHIỆP ĐẠ HỌC HỆ CHÍNH QUY
Bảng 4.5 Kết quả thực nghiệm 2 (Trang 46)
Thực nghiệm 3: Thực hiện bổ sung đặc trưng từ mơ hình chủ đề ẩn LDA vào các - CÁC PHƯƠNG PHÁP PHÂN LỚP ĐA NHÃN  VĂN BẢN TIẾNG VIỆT   KHÓA LUẬN TỐT NGHIỆP ĐẠ HỌC HỆ CHÍNH QUY
h ực nghiệm 3: Thực hiện bổ sung đặc trưng từ mơ hình chủ đề ẩn LDA vào các (Trang 47)
Hình 4.2 So sánh thời gian giữa ba thực nghiệm - CÁC PHƯƠNG PHÁP PHÂN LỚP ĐA NHÃN  VĂN BẢN TIẾNG VIỆT   KHÓA LUẬN TỐT NGHIỆP ĐẠ HỌC HỆ CHÍNH QUY
Hình 4.2 So sánh thời gian giữa ba thực nghiệm (Trang 48)
Hình 4.3 So sánh độ chính xác trung bình giữa 3 thực nghiệm - CÁC PHƯƠNG PHÁP PHÂN LỚP ĐA NHÃN  VĂN BẢN TIẾNG VIỆT   KHÓA LUẬN TỐT NGHIỆP ĐẠ HỌC HỆ CHÍNH QUY
Hình 4.3 So sánh độ chính xác trung bình giữa 3 thực nghiệm (Trang 49)

TRÍCH ĐOẠN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN