Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 11 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
11
Dung lượng
512,22 KB
Nội dung
ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ Phan Thị Thơm PHÂN LỚP ĐA NHÃN, ĐA THỂ HIỆN VÀ ÁP DỤNG TRONG QUẢN LÝ DANH TIẾNG LUẬN VĂN THẠC SỸ HÀ NỘI - 2015 ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ Phan Thị Thơm PHÂN LỚP ĐA NHÃN, ĐA THỂ HIỆN VÀ ÁP DỤNG TRONG QUẢN LÝ DANH TIẾNG Ngành: Công nghệ thông tin Chuyên ngành: Hệ thống thông tin Mã số: 60.48.01.04 LUẬN VĂN THẠC SỸ NGƯỜI HƯỚNG DẪN KHOA HỌC: PGS.TS Hà Quang Thụy HÀ NỘI – 2015 Lời cảm ơn Trước tiên, em xin bày tỏ lòng biết ơn chân thành sâu sắc tới Thầy giáo, PGS.TS Hà Quang Thụy tận tình bảo, hướng dẫn, động viên giúp đỡ em suốt trình thực đề tài luận văn Em xin gửi lời cảm ơn sâu sắc tới Thầy Cô Khoa Công nghệ thông tin truyền đạt kiến thức quý báu cho em sáu năm học vừa qua Em xin gửi lời cảm ơn tới thầy cô, anh chị, bạn, em sinh viên nhóm “Khai phá liệu” phịng thí nghiệm KT-Sislab đề tài cấp ĐHQGHN GQ.14.13 giúp em nhiều việc hỗ trợ kiến thức chun mơn để hồn thành tốt luận văn Con xin nói lên lịng biết ơn vơ hạn Cha Mẹ nguồn động viên, chăm sóc khích lệ bước đường học vấn Cuối cùng, xin chân thành cảm ơn Anh Chị Bạn Bè, thành viên lớp K53CB, K53CLC K19HTTT ủng hộ, giúp đỡ suốt thời gian học tập giảng đường thực đề tài luận văn Tôi xin chân thành cảm ơn! Hà Nội, ngày 09 tháng 04 năm 2015 Học viên Phan Thị Thơm PHÂN LỚP ĐA NHÃN, ĐA THỂ HIỆN VÀ ÁP DỤNG TRONG QUẢN LÝ DANH TIẾNG Phan Thị Thơm Khóa K19HTTT, ngành cơng nghệ thơng tin Tóm tắt Luận văn: Hệ thống quản lý danh tiếng hệ thống quan trọng việc quản lý thương hiệu, sử dụng rộng rãi nhiều công ty tổ chức khác Đối với công ty hay sản phẩm, hệ thống quản lý danh tiếng tiến hành thu thập nhận xét người dùng, phân tích quan điểm nhận xét đấy, tạo tổng kết quan điểm người dùng lớp đặc trưng sản phẩm hay công ty Tuy nhiên, số nhận xét người dùng thường có chứa nhiều nội dung, đa phần liệu đa nhãn đa thể Vì vậy, vấn đề trọng tâm hệ thống quản lý danh tiếng việc xử lý liệu đa nhãn đa thể Theo Zhou cộng sự, 2012 [2], hướng tiếp cận để giải toán phân lớp liệu đa nhãn, đa thể (MIML) sử dụng phương pháp phân rã toán MIML thành tốn đơn giản Trong thuật toán học máy MIML phát triển dựa thuật toán học máy (SVM, Bayes, Boost, ) MIMLSVM, MIML Bayes, MIMLBoost Từ luận văn đề xuất mơ hình phân lớp quan điểm người dùng toán quản lý danh tiếng cách áp dụng MIMLSVM Thực nghiệm miền liệu tập nhận xét người dùng 1000 khách sạn Việt Nam website (http://chudu24.com ) Kết phân lớp áp dụng phương pháp phân lớp thông thường SVM 84.84% kết áp dụng mơ hình phân lớp quan điểm luận văn đề xuất 85.76% Kết cho thấy phương pháp xây dựng mơ hình phân lớp quan điểm áp dụng MIMLSVM có tính hiệu cao Lời cam đoan Tôi xin cam đoan mơ hình phân lớp quan điểm người dùng toán quản lý danh tiếng cách áp dụng MIMLSVM trình bày luận văn tơi thực hướng dẫn PGS.TS Hà Quang Thụy Tất tham khảo từ nghiên cứu liên quan đề nêu nguồn gốc rõ ràng từ danh mục tài liệu tham khảo luận văn Trong luận văn, khơng có việc chép tài liệu, cơng trình nghiên cứu người khác mà khơng rõ tài liệu tham khảo Hà Nội, ngày 09 tháng 04 năm 2015 Tác giả Phan Thị Thơm Mục lục Mở đầu Error! Bookmark not defined Chương 1: Giới thiệu chung quản lý danh tiếng Error! Bookmark not defined 1.1 Tổng quan hệ thống quản lý danh tiếng Error! Bookmark not defined 1.1.1 Hệ thống quản lý danh tiếng Error! Bookmark not defined 1.1.2 Tầm quan trọng hệ thống quản lý danh tiếng Error! Bookmark not defined 1.2 Bài toán phân lớp liệu đa nhãn đa thể quản lý danh tiếng Error! Bookmark not defined Tổng kết chương Error! Bookmark not defined Chương : Tổng quan phân lớp đa nhãn đa thể MIML Error! Bookmark not defined 2.1 Phân lớp đa nhãn đa thể Error! Bookmark not defined 2.2 Phương pháp chuyển đổi toán học máy MIML Error! Bookmark not defined 2.2.1 MIMLSVM Error! Bookmark not defined 2.2.2 MIMLBOOST Error! Bookmark not defined Tổng kết chương hai Error! Bookmark not defined Chương 3: Áp dụng phương pháp MIMLSVM toán quản lý danh tiếng Error! Bookmark not defined 3.1 Mô tả phương pháp Error! Bookmark not defined 3.2 Mơ hình đề xuất Error! Bookmark not defined 3.3 Pha 1: Huấn luyện mơ hình Error! Bookmark not defined 3.3.1 Tiền xử lý xây dựng vector đặc trưng Error! Bookmark not defined 3.3.2 Chuyển đổi từ MIML thành SIML Error! Bookmark not defined 3.3.3 Chuyển đổi từ SIML thành SISL Error! Bookmark not defined 3.4 Pha 2: Phân lớp sử dụng mơ hình huấn luyện Error! Bookmark not defined Tổng kết chương ba Error! Bookmark not defined Chương Thực nghiệm đánh giá Error! Bookmark not defined 4.1 Môi trường công cụ sử dụng thực nghiệm Error! Bookmark not defined 4.1.1 Cấu hình phần cứng Error! Bookmark not defined 4.1.2 Các phần mềm sử dụng Error! Bookmark not defined 4.2 Xây dựng tập liệu thử nghiệm Error! Bookmark not defined 4.3 Thử nghiệm Error! Bookmark not defined 4.4 Kết thực nghiệm Error! Bookmark not defined 4.5 Đánh giá hệ thống Error! Bookmark not defined Kết luận Error! Bookmark not defined Tài liệu tham khảo 11 Danh sách hình vẽ Hình 1.1 : Sơ đồ phân loại danh tiếng Error! Bookmark not defined Hình 1.2: Hai mơ hình hệ thống Error! Bookmark not defined Hình 1.2: Mơ hình 3(a) 3(b) thực tế Error! Bookmark not defined Hình 2.1: Dữ liệu đa nhãn đa thể Error! Bookmark not defined Hình 3.1: Mơ hình đề xuất Error! Bookmark not defined Hình 3.2 : Bốn tập liệu tổ chức phân lớp theo chuyển đổi nhị phân Error! Bookmark not defined Hình 4.1: So sánh thực nghiệm Error! Bookmark not defined Danh sách bảng biểu Bảng 4.1 Cấu hình hệ thống thử nghiệm Error! Bookmark not defined Bảng 4.2: Công cụ phần mềm sử dụng Error! Bookmark not defined Bảng 4.3 : Tập liệu thực nghiệm Error! Bookmark not defined Bảng 4.4: Tập liệu huấn luyện Error! Bookmark not defined Bảng 4.5: Kết thực nghiệm Error! Bookmark not defined Bảng 4.6: Kết thực nghiệm Error! Bookmark not defined Danh sách từ viết tắt MIML Multi instance multi label SVM Support Vector Machine MISL Multi-instance, single-label learning SISL Single-instance single-label learning SIML Single-instance, multi-label learning MIMLSVM Multi instance multi label Support Vector Machine MIMLBOOST Multi instance multi label boost Tài liệu tham khảo [1] Pierce, J “The world internet project report 2009” Technical report, The World Internet Project, 2008 [2] Z.-H Zhou, M.-L Zhang, S.-J Huang, and Y.-F Li “Multi-instance multilabel learning” Artificial Intelligence, 2012, 176(1): 2291-2320 [3] Jianjun He, Hong Gu, Zhelong Wang (2012) “Bayesian multi-instance multilabel learning using Gaussian process prior” Machine Learning, 88 (1-2): 273-295, July 2012 [4] Yao Wang “Trust and Reputation Management in Decentralized Systems” A Thesis Submitted to the College of Graduate Studies and Research, 2010 [5] Resnick P and Zeckhauser R., “Trust among Strangers in Internet Transactions: Empirical Analysis of eBay’s Reputation System” NBER Workshop on Empirical Studies of Electronic Commerce, 2000 [6] Bing Liu “Opinion Mining & Summarization - Sentiment Analysis”, Tutorial given at WWW-2008, April 21, 2008 in Beijing [7] Laudon, J and Laudon, K “Management Information Systems: Managing the Digital Firm & Multimedia” Prentice Hall, 2007, 10th edition [8] Stair, R M., Reynolds, G and Reynolds, G W “Principles of Information System” Course Technology, 2010, 9th edition [9] Hoffman, K., Zage, D and Nita-Rotaru, C “A survey of attack and defense techniques for reputation systems” ACM Computing Surveys, 2009 42(1), 1-31 [10] Zheng, W and Jin, L “Online reputation systems in web 2.0 era” In Americas Conference on Information Systems (AMCIS) Proceedings, 2009 296-306 [11] Grigorios Tsoumakas , Ioannis Katakis “Multi-label Classification : An Overview” International Journal of Data Warehousing & Mining, 3(3), 1-13, JulySeptember 2007 [12] Fabrizio Sebastiani “Machine Learning in Automated Text Categorization” ACM Computing Survey, 34(1) pages 1-47, 2002 [13] Thi-Ngan Pham, Thi-Thom Phan, Phuoc-Thao Nguyen, Quang-Thuy Ha (2013)."Hidden Topic Models for Multi-label Review Classification: An Experimental Study", Computational Collective Intelligence Technologies and Applications, Lecture Notes in Computer Science Volume 8083:603-611 11 ... LỚP ĐA NHÃN, ĐA THỂ HIỆN VÀ ÁP DỤNG TRONG QUẢN LÝ DANH TIẾNG Phan Thị Thơm Khóa K19HTTT, ngành cơng nghệ thơng tin Tóm tắt Luận văn: Hệ thống quản lý danh tiếng hệ thống quan trọng việc quản lý. ..ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ Phan Thị Thơm PHÂN LỚP ĐA NHÃN, ĐA THỂ HIỆN VÀ ÁP DỤNG TRONG QUẢN LÝ DANH TIẾNG Ngành: Công nghệ thông tin Chuyên ngành: Hệ thống thông tin... việc xử lý liệu đa nhãn đa thể Theo Zhou cộng sự, 2012 [2], hướng tiếp cận để giải toán phân lớp liệu đa nhãn, đa thể (MIML) sử dụng phương pháp phân rã toán MIML thành toán đơn giản Trong thuật