1. Trang chủ
  2. » Luận Văn - Báo Cáo

Phân loại nhóm tuổi người dùng mạng xã hội

65 146 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 65
Dung lượng 582,38 KB
File đính kèm 0353764719.rar (11 MB)

Nội dung

Phân loại nhóm tuổi người dùng mạng xã hộỉ sử dụng ngôn ngữ tiếng Vỉệt:Nghiên cứu lý thuyết về mạng xã hội, ngôn ngữ sử dụng trên mạng xã hội, môỉ liên hệ nhóm tuôỉ và đặc trưng của ngôn ngữ sử dụng trên mạng xã hợi.Nghiên cứu các phương pháp về phân loại nhóm tuổi người dùng mạng xã hộỉ.Đồ xuất phương pháp phân loại nhỏm tuổi người dùng mạng xã hội sử dụng ngôn ngữ tiếng Việt.Hiện thực, đánh giá và phân tích kết quả thực nghiệm

ĐẠI HỌC QUỐC GIA THÀNH PHỐ HỒ CHÍ MINH TRƯỜNG ĐẠI HỌC BÁCH KHOA PHẠM TIẾN PHÚC PHÂN LOẠI NHÓM TUỔI NGƯỜI DÙNG MẠNG Xà HỘI NGÀNH: KHOA HỌC MÁY TÍNH Mà NGÀNH: 60480101 LUẬN VẤN THẠC SĨ TP HỒ CHÍ MINH, tháng năm 2018 CƠNG TRÌNH ĐƯỢC HỒN THÀNH TẠI TRƯỜNG ĐẠI HỌC BÁCH KHOA -ĐHQG -HCM Cán hướng dẫn khoa học: PGS.TS Quản Thành Thơ Cán chấm nhận xét 1: TS Lê Thanh Vân Cán chấm nhận xét 2: TS Nguyễn Thị Thanh Sang Luận văn thạc sĩ bảo vệ Trường Đại học Bách Khoa, ĐHQG Tp HCM ngày 24 tháng năm 2018 Thành phần Hội đồng đánh giá luận văn thạc sĩ gồm: Chủ tịch: PGS.TS Dương Tuấn Anh Thư ký: TS Võ Thị Ngọc Châu Phản biện 1: TS Lê Thanh Vân Phản biện 2: TS Nguyễn Thị Thanh Sang ủy viên: TS Nguyễn Đức Dũng Xác nhận Chủ tịch Hội đồng đánh giá Luận vãn Trưởng Khoa quản lý chuyên ngành sau luận vãn sửa chữa (nếu có) CHỦ TỊCH HỘI ĐỒNG PGS.TS Dương Tuấn Anh TRƯỞNG KHOA KH&KTMT ĐẠI HỌC QUỐC GIA TP.HCM TRƯỜNG ĐẠI HỌC BÁCH KHOA CỘNG HÒA Xà HỘI CHỦ NGHĨA VIỆT NAM Độc lập - Tự - Hạnh phúc NHIỆM VỤ LUẬN VĂN THẠC SĨ Họ tên học viên: Phạm Tiến Phúc MSHV:7140253 Ngày, tháng, năm sinh: 04/08/1978 Nơi sinh: Cần Thơ Ngành: Khoa học Máy tính Mã số : 60480101 l TÊN ĐỀ TÀI: PHÂN LOẠI NHĨM TI NGƯỜI DÙNG MẠNG Xà HỘI IL NHIỆM VỤ VÀ NỘI DUNG: Phân loại nhóm tuổi người dùng mạng xã hộỉ sử dụng ngôn ngữ tiếng Vỉệt: -Nghiên cứu lý thuyết mạng xã hội, ngôn ngữ sử dụng mạng xã hội, mơỉ liên hệ nhóm tuôỉ đặc trưng ngôn ngữ sử dụng mạng xã hợi -Nghiên cứu phương pháp phân loại nhóm tuổi người dùng mạng xã hộỉ - Đồ xuất phương pháp phân loại nhỏm tuổi người dùng mạng xã hội sử dụng ngôn ngữ tiếng Việt - Hiện thực, đánh giá phân tích kết thực nghiệm m NGÀY GIAO NHIỆM vụ : 15/01/2018 IV NGÀY HOÀN THÀNH NHIỆM VỤ: 17/6/2018 V CÁN BỘ HƯỚNG DẪN PGS.TS Quản Thành Thơ Tp HCM, ngày 17 tháng năm 2018 TRƯỜNG KHOA KH & KTMT CÁN BỘ HƯỚNG DẴN PGS.TS Quản Thành Thơ i ỉ LỜI CẢM ƠN Trước hết, tơi xin bày tỏ lòng biết ơn chân thành sâu sắc đến Thầy hướng dẫn tôi, PGS.TS Quản Thành Thơ Trong suốt trình làm luận văn, bận, Thầy tận tình, kiên nhẫn dẫn, hỗ trợ thực Sự hướng dẫn, hỗ trợ quý báu thầy động lực to tớn để tơi hồn thành luận văn Tơi xin chân thành cảm ơn tận tình giảng dạy giúp đỡ tất quý Thầy Cô trường Đại học Bách Khoa thành phố Hồ Chí Minh, đặc biệt thầy khoa Khoa học Kỹ thuật Máy tính Tơi xin chân thành cảm ơn Công ty cổ phần Younet Social Media giúp đỡ, hỗ trợ công nghệ liệu cho trình nghiên cứu thực đề tài Tôi xin gửi lời cảm ơn đến Ban lãnh đạo Sở Thông tin Truyền thông thành phố cần Thơ, Trung tâm Công nghệ Thông tin cần Thơ, nơi công tác, tạo điều kiện thuận lợi cho thời gian tham gia học tập Cuốitập nghiệp cùng, ủng xin cảmluận hộ, ơn gia động viên đình tơi vàtrong bạn suốt bè, q đồng trình học vàln hồn thành văn TĨM TẮT Ngày nay, Internet mạng xã hội Facebook, Twitter, Zalo phổ biến gần trỏ' thành phần sống hàng ngày nhiều người Không phương thân, mạng xã hội phương tiện để người tìm kiếm thông tin, chia sẻ liên kết người Tuy nhiên, nhiều nguyên nhân, người dùng không cập nhật đầy đủ vào hồ sơ cá nhân, cung cấp thơng tin giả tính riêng tư nên che dấu thơng tin gây nên khó khăn xác định sử dụng thông tin Mục tiêu đề tài thực phương pháp sử dụng máy học vector hỗ trợ (Support Vector Machines - SVM) để xác định phân loại nhóm tuổi người dùng mạng xã hội sử dụng ngôn ngữ tiếng Việt dựa nội dung mà người dùng dùng hình thức văn ngắn, ngơn ngữ biến thể lệch chuẩn Vì đề tài hữu ích đề xuất phương pháp sở dựa số thơng tin người dùng để khai phá thông tin ẩn khác nhằm phục vụ yêu cầu khác ABSTRACT Today, Internet and Social networks such as Facebook, Twitter, Zalo are very popular with peoples It became part of the fabric of everyday life around the world We have the ability to see what others are doing, often within seconds of them doing it Or even better, browsing, searching, and linking tool Peoples will be yourself on Social networks However, user may be not submit fulfill their information, using fake account, or they set their profile to private mode The purpose of this thesis is using Support Vector Machines (SVM) to classify groups of user social network using Vietnamese language The classifier process information via short messages and nonstandard language variations It would therefore be useful if user profiles can be checked on the basis of text analysis, and false profiles recovered for other requhements LỜI CAM ĐOAN Tôi xin cam đoan rằng, ngoại trừ kết tham khảo từ công trình khác ghi rõ luận văn, nội dung trình bày luận văn tơi thực chưa có phần nội dung luận văn nộp để lấy cấp trường khác TP HCM, ngày 17 tháng năm 2018 Phạm Tiến Phúc V DANH MỤC TỪ VIẾT TẮT MXH kNN Mạng xã hội k Nearest Neighbors LR Linear Regression CNNs Convolutional Neural Network DT Decision Trees BoW Bag of Word SVM Support Vector Machines TF-IDF Term Frequency - Inverse Document Frequency Từ viết tắt TVIÔ _• 2* Diên giải DANH SÁCH CÁC BÁNG STT Bảng Tên bảng ă Trang ỏ ể Ở ẽ i MỤC LỤC 4.6.1 Ma trận Confusion_matrix Actual[472 21 140 24] [130 120 352 45] [ 23 296 123 220] [19 258 48351] ABcD Predict Từ kết ma trận confusion matrix ta thấy việc phân nhầm lớp lớp liền kề cao so với lớp có độ tuổi tách biệt Ngồi có phân nhầm sang nhóm cách (A -> C) 4.6.2 Thống kê unigram 45 đặc trung tiêu bỉểu nhóm ẻ ầ Ế Ễ Ể ẳ ầ Ế ố ể ầ â ỏ l ệ Ẳ í ổỐ â Ễ Eo AA ã ỏ ểềảẳ Bảng 4.7 Dữ liệu phân loại sai từ A sang B 4.63.2 Số lượng mẫu nhóm B phân nhầm nhóm A À Ẽ Ễ' óầ ii ếe EEÁ ầ ã ii Ổảá ố ■A ẽ đ ã ẻ ỉ Ề ỉ Ị ỏ ĩ 10 OA Ong tÕt\r\n\r\n 3941 ( - )\r\nbo học thi học kỳ năm học - (A-A) 4833 (A-A)\r\nvẽ đâu mái tóc người thương A A 3038 ( - )\r\nlâu lâu có dịp gặp mà nhóm m A A ẻ é 40 41 42 C íÁ ỏng cÀn thl- chAp^ 10036 ( - )\r\nsan fam khuyên kg có màu 10011 (A-A)\r\nhơm mẹ rời qua đ 11797 (A-A) bí ki-p phụ nữ việt đá muỏi massage góc A A Bảng 4.12 Dữ liệu phân loại saỉ từ D sang c 4.63.7 Số lưọng mẫu nhóm B phân nhầm nhóm D STT 43 44 45 46 47 48 49 Nội dung 5255 (A-A)\r\ntrị an - thạnh phú - hcm\r\nhotlin 9374 (A-A)\r\nĐủ kiêu thích ib trực tiữp 9622 (A-A) bien hoa young só hố - iapple hổng 8041 (A-A)\r\nĐại gia đà n-ìng vẻ quê (A-A)\r\nsửu n 6896 (A-A)\r\nthe beauty is everywhere moment of br 6523 (A-A)\r\nĐây thật sản phim khó với tơi b 5384 (A-A)\r\nvua lam vua nghe nhạc ne nice day nh Bảng 4.13 Dữ liệu phân loại sai từ B sang D Từ kết bảng 4.7,4.8, 4.9,4.10,4.11,4.12 ta thấy nguyên nhân cho việc phân loại sai phân bố độ tuổi nhóm có biên gần Ví dự nhóm A tuổi 22, 23,24 người nhóm B tuổi 25, 26, 27 có khả sử dụng ngơn ngữ sở thích giống Vì dẫn đến việc nhiễu Từ bảng 4.13 từ B sang nhóm D Có thể tập liệu thực đơn lấy từ mạng xã hội chưa qua bước tiền xử lý, độ nhiễu liêu cao Trong tập liệu có nhiều tài khoản tồn đăng tin bán hàng, độ đa dạng sử dụng ngơn ngữ khơng có Bên cạnh đó, việc tiền xử lý chưa tốt nên biểu tượng mã, việc chuyển đổi chữ thường nhiều từ bị lỗi Để giải vấn đề tác giả tiếp tục lọc đưa đặc trưng thu thập bị nhiễu vào danh sách stopword để loại bỏ xóa hẳn tài khoản danh sách huấn luyện kiểm tra Thục thêm giải thuật lọc danh sách đặc trưng có độ IDF cao (xuất hiên nhiều văn toàn tập) để đưa vào stopword CHƯƠNG TÔNG KẾT 5.1 Kết luận Nghiên cứu phân loại tuổi nguời dùng mạng xã hội nhằm xác định đuợc thơng tin cá nhân nhóm tuổi nguời dùng mạng xã hội dụa ngôn ngữ văn tiếng Việt đề tài có giá trị có mức ứng dụng thục tiễn Do đặc điểm ngôn ngữ tiếng Việt ngôn ngữ sủ dụng mạng xã hội nên việc tìm phuơng pháp phân loại nhóm tuổi với kết tin cậy quan trọng Phuong pháp phân loại nhóm tuổi dụa vào giải thuật SVM với kết phân loại có độ xác cao giải thuật phân loại khác nhu KNN, Decision Tree, hay Naive Bayes ngôn ngữ tiếng Việt Tuy nhiên, kết chua đuợc cao so với ngơn ngữ tiếng Anh Qua q trình thục nghiệm với tham số khác nhau, số luợng liệu kiểm tra khác cho thấy kết ban đầu đáng khích lệ sở để nâng cao độ xác chuơng trình, để tìm kiếm tham số tối ưu mơ hình thực thách thức thời gian tài nguyên xử lý Kết chương trình cho thấy, độ xác chương trình phụ thuộc lớn vào đặc trưng liệu nhóm Việc thu thập đặc trưng người dùng mạng xã hội nhiều giúp cho việc xác định kết cao Như việc việc thu thập thói quen, sở thích, nhóm tham gia, kiện tham gia, trang fanpage tham gia Ket chương trình đòi hỏi thực mơ hình liệu lớn hơn, với nhiều tài khoản hơn, việc tiền xử lý liệu đóng vai trò quan trọng việc nâng cao kết phân loại Tuy nhiên, trình thực đề tài dù hỗ trợ, nhiên để có liệu có đầy đủ hành vi sở thích người dùng lớn từ 10000 tài khoản gặp khó khăn, ảnh hưởng việc nâng cao tính tổng qt mơ hình q trình huấn luyện, góp phần vào việc cải tiến kết tính tốn Ưu điểm phương pháp - Dễ dàng thực thi chương trình - Có hỗ trự tốt thư viện có sẵn Nhược điểm phương pháp: Phụ thuộc lớn vào tập liệu, độ xác gán nhãn, đặc trưng độ tuổi Chương trình thực thi chậm, tiêu tốn nhiều tài nguyên, lượng văn có số chiều lớn ảnh hưởng đến tốc độ xử lý 5.2 Những kết đạt Luận văn đáp ứng mục tiêu đặt khả sử dụng giải thuật SVM phân loại nhóm tuổi người dùng mạng xã hội sử dụng ngôn ngữ tiếng Việt 5.3 Hướng phát triển Nghiên cứu đặc điểm, thơng tin ngồi văn text mà người dùng tiếng Việt trao đổi trình bày, làm sở tăng đặc trưng để phân loại nhóm tuổi Thử nghiệm với liệu lớn 10.000 tài khoản Tiền xử lý liệu cập nhật danh sách đặc trưng nhiễu tập huấn luyện Thu thập thêm đặc trưng người dùng như: trang tham gia, kiện tham gia Vì thời gian hạn tài nguyên hạn chế nên trình làm luận văn chưa áp dụng giải pháp Nghiên cứu hướng tiếp cận giải thuật deep learning mạng nơron tích chập vào tốn phân loại nhóm tuổi TÀI LIỆU THAM KHẢO TÀI LIỆU TIẾNG VIỆT [1] VNNIC, http://vnta.gov vn/thongke/Trang/dulieuthongke.aspx# [2] Số liệu thống kê, http://nhipsongso.tuoitre.vn/nhip-songso/viet-nam-dungthu-7-the-gioi-ve-so-nguoi-dung-facebook20170714103459444.htm [3] Nghị định số 72/2013/NĐ-CP 15 tháng 07 năm 2013 Chính phủ Quản lý, cung cấp, sủ dụng dịch vụ internet thông tin mạng [4] Số liệu thống kê mức độ phổ biến trang mạng xã hội toàn giới năm 2017 https://www.statista.com/statistics/272014/global-socialnetworks-ranked-by-number-of-users/ [5] Số liệu thống kê nguời sủ dụng internet mạng xã hội tính công bố tháng 01 năm 2017 https://www.smartinsights.com/socialmediamarketing/social-media-strategy/new-global-socialmedia-research/ [6] PGS.TS Hà Quang Thụy ThS Trần Mai Vũ, Phân tích khai phá mạng xã hội, Đại học Công nghệ Hà Nội, 2016 [7] Khổng Bùi Trung, Phân loại giới tính nguời dùng mạng xã hội dụa vào tin nhắn văn W0RD2VE, Đại học Quốc gia Hà Nội, 2016 [8] Truơng Cơng Hải, Dụ đốn giới tính nguời dùng mạng xã hội dụa vào nội dung văn bản, Học viện cơng nghệ buu viễn thơng Hà Nội, 2017 [9] Vũ Thị Thu Huơng, Phát cộng đồng sủ dụng thuật toán Conga khai phá quan điểm cộng đồng mạng xã hội, Đại học Quốc gia Hà Nội (2016) [10] TS Nguyễn Hữu Tuân, Xây dựng hệ thống nhận dạng mặt tụ động sủ dụng LPQ, Truờng Đại học Hàng hải Hải Phòng, 2016 [14] GS.TS Trần Hữu Luyến, Mạng xã hội: khái niệm, đặc điểm, tính năng, áp lục ý nghĩa (2014) Truờng đại học Ngoại ngữ quốc gia Hà Nội [15] GS.TS Nguyễn Vãn Khang, Một số vấn đề ngôn ngữ mạng tiếng Việt, Kỷ yếu cơng trình khoa học 2015 - Phần II, Đại học Thăng Long [18] Nguyễn Minh Quang, Phân loại vãn định, Luận vãn thạc sĩ, Truờng Đại học Bách Khoa thành phố Hồ Chí Minh, 2004 [21] Nguyễn An Nhơn, Phân loại văn theo chủ đề phương pháp Support Vector Machines kết hợp với kỹ thuật hỗ trợ, Luận văn thạc sĩ, Trường Đại học Bách Khoa thành phố Hồ Chí Minh, 2005 TÀI LIỆU TIẾNG ANH [11] Nina Cesare, Christan Grant, Elaine o Nsoesie, Detection of User Demographics on Social Media: A Review of Methods and Recommendations for Best Practices, Department of Sociology, University of Washington, Institute for Health Metrics and Evaluation, University of Washington, School of Computer Science, University of Oklahoma, 2016 [12] Rita Georgina Guimaraes, Renata L Rosa, Denise De Gaetano, Demóstenes Z.Rodriguez, Age Groups Classification in Social Network Using Deep Learning, https://ieeexplore.ieee.org, 2017 [13] Thorsten Joachims, Text Categorization with Support Vector Machines: Learning with Many Relevant Features, Lecture Notes in Computer Science 1398,137-142,1998 [16] Jian Hu, Hua-Jun Zeng, Hua Li, Cheng Niu, Zheng Chen, Prediction Based on User’s Browsing Behavior, ACM 978-159593-654-7/07/0005, 2007 [17] Sara Rosenthal, Kathleen McKeown, Age Prediction in Blogs: A Study of Style, Content, and Online Behavior in Pre- and Post-Social Media Generations, Proceedings of the 49th Annual Meeting of the Association for Computational Linguistics, pages 763-772, Portland, Oregon, June 19- 24, 2011 [18] Tony Ojeda, Rebecca Bilbro, Benjamin Bengfort, Applied Text Analysis with python, O’reilly Media, Inc, 2018 [20] William B Cavnar and John M Trenkle, N-Gram-Based Text Categorization In Proceedings of SDAIR-94, 3rd Annual Symposium on Document Analysis and Information Retrieval, Page 161-175 1994 [28] p S Ludu, Inferring gender of a Twitter user using celebrities it follows, ArXiv Prepr ArXivl4056667, 2014 [29] Digital in 2017: A study of Internet, Social Media, and Mobile use throughout the region of Southeast Asia, https://wearesocial.com/special- reports/digital-southeast-asia2017 [30] Anand Rajaraman, Jure Leskovec, and Jeffrey D Ullman, Mining of Massive Datasets, 2014 [31] Cham c Aggarwal Editor, IBM Thomas J Watson Research Center, Social Network Data Analytics, Springer [32] United Nations, Provisional Guidelines on Standard International Age Classifications, 1982 WEBSITE: [19] http://www.tfidf.com/ [22] https://www.dtreg.com/solution/view/20, https://d0cs.0pencv.0rg/3.3 l/d4/dbl/tutorial_py_svm_basics.html, sVM - Support Vector Machines [23] http://scikit-leam.org/ [24 ] Van-Duyet Le, Danh sách stopword tiếng Việt, 2015, https://blog.vietnamlab.vn [25] Thư viện liệu lập trình, https://developers.facebook.com/tools/explorer [26] Susan Li, https://towardsdatascience.eom/@actsusanli [27 ] Vũ Hữu Tiệp, https://machineleamingcoban.com PHỤ LỤC CÁC GIẢI THUẬT CỦA CHƯƠNG TRÌNH Giải thuật tiền xử lý chia tập liệu Đọc file liệu Xóa bò dòng khơng đầy đủ thơng tin For -> hết file Đọc dòng liệu lấy cột tuổi, cột nội dung post, nội dung like Từng nội dung post Tìm kiếm thay biểu tuọng cảm xúc imotion chuỗi đại diện icon_số_tuong ứng cùa biểu tuọng danh sách Xóa bò ký tự đặc biệt Gom nhiều khoản trắng thành Chuyển đổi sang chữ thuòng Ghi liệu text vào thu mục tuong ứng Data = [] For l-> nhóm For -> số mẫu Đọc file liệu cùa nhóm Data.append ({ 'age_category': topic, 'post': dataContent }) if i == số mẫu muốn tạo break else: i += Ghi file liệu vừa tạo Giải thuật tách từ Danh sách post = câu dòng liệu ngăn cách delimiter Token= [] For l-> danh sách post Chuyển đổi văn sang chữ thường Token.append (sừ dụng ViTokenizer tách từ câu) Giải thuật tìm kiếm tham số tối ưu Đọc file liệu tập huấn luyện, tập test Encode liệu sang utf-8 vectorize = TfidfVectorizer() model = SVC() estimator = Pipline(vectorize, model) estimator = GridsearchCV (từng tham số: [các tham số c cùa model], [các tham số nguõng mindf ,maxdfcùa tfidf] [các tham số kernel cùa model], [các tham số ngram cùa tfidf] ) Estimator.fit (X-train, Y-train) Estimator.predict(X-test) Hiển thị tham số trình thực thi tham số tốt Giải thuật xử lý Stopword Đọc dòng liệu file tự điển stopword Danh sách stopword=[] For -> cuối file Encode Unicode liễu Nếu từ đôi, từ nối vói _ Thêm từ xử lý vào danh sách stopword Giải thuật xử lý phân loại Đọc liệu file train, test sử dụng file chia tỷ lệ 7:3 để thủ mô minh giẩm thời gian xù lý cà tập liệu For l-> cuối tập liệu Vector hóa từ Gọi hàm tách từ Luọt bò stopword Tính tdifd Ngram Lựa chọn đặc trưng Gọi phương pháp thống kê Chi2 Gọi giải thuật phân lớp SVM In kết theo độ đo ma trận confustion Giải thuật thống kê đặc trưng nhóm Đọc liệu file train, test sử dụng file chia tỷ lệ 7:3 để thủ mô minh giảm thời gian xủ lý tập liệu For l-> cuối tập liệu Vector hóa từ Gọi hàm tách từ Lượt bò stopword Tính tdifd Ngram Hiển thị số lượng đặc trưng danh sách tên nhóm = unique(tập nhân) for i=l-> danh sách tên nhóm Thống kê chi2 Danh sách đặc trưng = vector tfidf.get_feature_names())[=chỉ sô Chi2J Hiển thị thống kê kết hợp số lượng ( cho n-gram, cho bigram, ) Giải thuật phân tích liệu phân nhóm sai Đọc kết ma trận confusion (y test, y_predict) For i=l-> danh sách nhóm For j=l-> danh sách nhóm If i!=j and confusion > ngưỡng cần thống kê Hiển thị cột "post " tập liệu tài dòng có y_test = j and y_predict=i LÝ LỊCH TRÍCH NGANG Họ tên: PHẠM TIẾN PHÚC Giới tính: nam Sinh ngày tháng năm: 04/08/1978 Nơi sinh: Cần Thơ Nơi nay: 28/35E, đường Huỳnh Phan Hộ, phường Trà An, quận Bình Thủy, thành phố Cần Thơ Dân tộc: Kinh Tôn giáo: không Ngày vào Đoàn TNCS HCM: 26/3/1992 Ngày vào Đảng CSVN: 01/5/2008 QUÁ TRÌNH ĐÀO TẠO Năm 1997 đến 2002: sinh viên CNTT, Khoa Công nghệ thông tin, trường Đại học Cần Thơ Năm 2014 đến 2018: học viên cao học ngành Khoa học máy tính, khoa Khoa học Kỹ thuật máy tính trường Đại học Bách Khoa TPHCM Q TRÌNH CƠNG TÁC Năm 2001 đến 7/2002: lập trình viên cơng ty Phần mềm Thịnh Phát Năm 2002 đến 2012: Phòng Đào tạo, Trung tâm Công nghệ Phần mềm thành phố Cần Thơ Năm 2012 đến 2016: Phòng HCQT, Trung tâm Công nghệ Phần mềm - Sở Thông tin Truyền thơng thành phố Cần Thơ Năm 2016 đến nay: Phòng HCTH, Trung tâm Công nghệ thông tin Truyền thôngSở Thông tin Truyền thông thành phố Cần Thơ ... PHÂN LOẠI NHĨM TI NGƯỜI DÙNG MẠNG Xà HỘI IL NHIỆM VỤ VÀ NỘI DUNG: Phân loại nhóm tuổi người dùng mạng xã hộỉ sử dụng ngôn ngữ tiếng Vỉệt: -Nghiên cứu lý thuyết mạng xã hội, ngôn ngữ sử dụng mạng. .. mạng xã hội, mơỉ liên hệ nhóm tỉ đặc trưng ngơn ngữ sử dụng mạng xã hợi -Nghiên cứu phương pháp phân loại nhóm tuổi người dùng mạng xã hộỉ - Đồ xuất phương pháp phân loại nhỏm tuổi người dùng mạng. .. phương pháp để dự đoán tuổi người dùng mạng xã hội - Xây dựng phân lớp cho liệu thuộc nhiều nhóm tuổi người dùng mạng xã hội khác nhau, thay đổi độ tuổi cần phân loại - Đánh giá phân tích liệu liên

Ngày đăng: 23/12/2019, 08:45

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
[2] Số liệu thống kê, http://nhipsongso.tuoitre.vn/nhip-song-so/viet-nam-dung-thu-7-the-gioi-ve-so-nguoi-dung-facebook-20170714103459444.htm Link
[4] Số liệu thống kê mức độ phổ biến của các trang mạng xã hội trên toàn thếgiới năm 2017https://www.statista.com/statistics/272014/global-social-networks-ranked-by-number-of-users/ Link
[5] Số liệu thống kê về nguời sủ dụng internet và mạng xã hội tính công bốtháng 01 năm 2017 https://www.smartinsights.com/social-media-marketing/social-media-strategy/new-global-social-media-research/ Link
[12] Rita Georgina Guimaraes, Renata L. Rosa, Denise De Gaetano, Demóstenes Z.Rodriguez, Age Groups Classification in Social Network Using Deep Learning,https://ieeexplore.ieee.org, 2017 Link
[3] Nghị định số 72/2013/NĐ-CP ngày ngày 15 tháng 07 năm 2013 của Chínhphủ về Quản lý, cung cấp, sủ dụng dịch vụ internet và thông tin trên mạng Khác
[6] PGS.TS. Hà Quang Thụy và ThS. Trần Mai Vũ, Phân tích và khai phá mạngxã hội, Đại học Công nghệ Hà Nội, 2016 Khác
[7] Khổng Bùi Trung, Phân loại giới tính nguời dùng mạng xã hội dụa vào tinnhắn văn bản và W0RD2VE, Đại học Quốc gia Hà Nội, 2016 [8] Truơng Công Hải, Dụ đoán giới tính nguời dùng mạng xã hội dụa vào nộidung văn bản, Học viện công nghệ buu chính viễn thông Hà Nội, 2017 Khác
[9] Vũ Thị Thu Huơng, Phát hiện cộng đồng sủ dụng thuật toán Conga và khaiphá quan điểm cộng đồng trên mạng xã hội, Đại học Quốc gia Hà Nội (2016) Khác
[10] TS Nguyễn Hữu Tuân, Xây dựng hệ thống nhận dạng mặt tụ động sủ dụng LPQ, Truờng Đại học Hàng hải Hải Phòng, 2016 Khác
[14] GS.TS. Trần Hữu Luyến, Mạng xã hội: khái niệm, đặc điểm, tính năng, áp lục và ý nghĩa (2014) Truờng đại học Ngoại ngữ quốc gia Hà Nội Khác
[15] GS.TS Nguyễn Vãn Khang, Một số vấn đề về ngôn ngữ mạng tiếng Việt, Kỷ yếu công trình khoa học 2015 - Phần II, Đại học Thăng Long Khác
[18] Nguyễn Minh Quang, Phân loại vãn bản bằng cây quyết định, Luận vãn thạc sĩ, Truờng Đại học Bách Khoa thành phố Hồ Chí Minh, 2004 Khác
[13] Thorsten Joachims, Text Categorization with Support Vector Machines: Learning with Many Relevant Features, Lecture Notes in Computer Science 1398,137-142,1998 Khác
[16] Jian Hu, Hua-Jun Zeng, Hua Li, Cheng Niu, Zheng Chen, Prediction Based on User’s Browsing Behavior, ACM 978-1- 59593-654-7/07/0005, 2007 Khác
[17] Sara Rosenthal, Kathleen McKeown, Age Prediction in Blogs: A Study of Style, Content, and Online Behavior in Pre- and Post-Social Media Generations, Proceedings of the 49th Annual Meeting of the Association for Computational Linguistics, pages 763-772, Portland, Oregon, June 19- 24, 2011 Khác
[18] Tony Ojeda, Rebecca Bilbro, Benjamin Bengfort, Applied Text Analysis with python, O’reilly Media, Inc, 2018 Khác
[20] William B. Cavnar and John M. Trenkle, N-Gram-Based Text Categorization In Proceedings of SDAIR-94, 3rd Annual Khác

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w