Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 76 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
76
Dung lượng
1,85 MB
Nội dung
BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC CÔNG NGHỆ TP HCM - NGUYỄN HOÀNG MINH HUY PHÁT TRIỂN HỆ THỐNG QUẢNG CÁO THÔNG MINH TRÊN MẠNG XÃ HỘI LUẬN VĂN THẠC SĨ Chuyên ngành : Công nghệ thông tin Mã số ngành: 60480201 TP HỒ CHÍ MINH, tháng 10 năm 2015 BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC CÔNG NGHỆ TP HCM - NGUYỄN HOÀNG MINH HUY PHÁT TRIỂN HỆ THỐNG QUẢNG CÁO THÔNG MINH TRÊN MẠNG XÃ HỘI LUẬN VĂN THẠC SĨ Chuyên ngành : Công nghệ thông tin Mã số ngành: 60480201 CÁN BỘ HƯỚNG DẪN KHOA HỌC: PGS.TS QUẢN THÀNH THƠ TP HỒ CHÍ MINH, tháng 10 năm 2015 CƠNG TRÌNH ĐƯỢC HỒN THÀNH TẠI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ TP HCM Cán hướng dẫn khoa học : PGS.TS Quản Thành Thơ (Ghi rõ họ, tên, học hàm, học vị chữ ký) Luận văn Thạc sĩ bảo vệ Trường Đại học Công nghệ TP HCM ngày 17 tháng 10 năm 2015 Thành phần Hội đồng đánh giá Luận văn Thạc sĩ gồm: (Ghi rõ họ, tên, học hàm, học vị Hội đồng chấm bảo vệ Luận văn Thạc sĩ) TT Họ tên Chức danh Hội đồng PGS.TSKH Nguyễn Xuân Huy Chủ tịch TS Lư Nhật Vinh Phản biện TS Nguyễn Thị Thúy Loan Phản biện TS Trần Đức Khánh TS Võ Đình Bảy Ủy viên Ủy viên, Thư ký Xác nhận Chủ tịch Hội đồng đánh giá Luận sau Luận văn sửa chữa (nếu có) Chủ tịch Hội đồng đánh giá LV TRƯỜNG ĐH CÔNG NGHỆ TP HCM CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM PHÒNG QLKH – ĐTSĐH Độc lập – Tự – Hạnh phúc TP HCM, ngày 17 tháng 10 năm 2015 NHIỆM VỤ LUẬN VĂN THẠC SĨ Họ tên học viên: NGUYỄN HOÀNG MINH HUY Giới tính: Nam Ngày, tháng, năm sinh: 27/03/1985 Nơi sinh: TP.HCM Chuyên ngành: Công nghệ thông tin MSHV: 1341860041 I- Tên đề tài: PHÁT TRIỂN HỆ THỐNG QUẢNG CÁO THÔNG MINH TRÊN MẠNG XÃ HỘI II- Nhiệm vụ nội dung: Nghiên cứu giải thuật TF-IDF ứng dụng xây dựng hệ thống quảng cáo mạng xã hội III- Ngày giao nhiệm vụ: 03/04/2015 IV- Ngày hoàn thành nhiệm vụ: 10/09/2015 V- Cán hướng dẫn: PGS.TS Quản Thành Thơ CÁN BỘ HƯỚNG DẪN (Họ tên chữ ký) PGS.TS Quản Thành Thơ KHOA QUẢN LÝ CHUYÊN NGÀNH (Họ tên chữ ký) i LỜI CAM ĐOAN Tơi xin cam đoan cơng trình nghiên cứu riêng Các số liệu, kết đánh giá, nhận xét đề xuất cải tiến nêu Luận văn trung thực chưa cơng bố cơng trình khác Tôi xin cam đoan giúp đỡ cho việc thực Luận văn trích dẫn hay tài liệu học thuật tham khảo cảm ơn đến tác giả hay ghi rõ ràng nguồn gốc thơng tin trích dẫn Luận văn Học viên thực Luận văn ii LỜI CÁM ƠN Trước tiên, Em xin bày tỏ lòng biết ơn sâu sắc đến thầy PGS.TS Quản Thành Thơ, người dìu dắt, định hướng cho em từ bước em làm quen với đường nghiên cứu khoa học Thầy khơng tận tình hướng dẫn, truyền đạt cho em kiến thức chuyên môn quý báu, tạo điều kiện thuận lợi cho em suốt trình làm luận văn Em xin gửi lời chân thành đến tồn thể q thầy Khoa Cơng Nghệ Thơng Tin, người trang bị cho em kiến thức tảng, tận tình bảo, dìu dắt em suốt năm học qua Để hoàn thành luận văn này, em không quên gửi lời cảm ơn chân thành đến bạn Nguyễn Cơng Đính tồn thể bạn lớp cao học 13SCT21 trường Đại học Công Nghệ TPHCM tạo điều kiện giúp đỡ để em hồn thành luận văn Với lịng biết ơn sâu sắc xin gửi đến gia đình tơi, nguồn động viên to lớn, chỗ dựa vững cho tôi, bên lúc thành công thất bại Lời cảm ơn sau xin dành cho bạn bè tôi, người gần gũi chia giúp đỡ động viên vượt qua khó khăn để hồn thành luận văn NGUYỄN HỒNG MINH HUY iii TÓM TẮT Với phát triển ngày mạnh mẽ mạng xã hội, thay đổi xu hướng người tiêu dùng cách truyền thông doanh nghiệp.Truyền thông truyền thống dần thay truyền thông trực tuyến (emarketting) với trợ giúp phát triển Internet Một hình thức truyền thơng trực tuyến tiếp thị mạng xã hội (social-media marketting) Với phát triển nhanh chóng mạng xã hội , tiếp thị mạng xã hội hướng đầy tiềm cho lĩnh vực kinh tế nói chung Cơng nghệ thơng tin nói riêng Làm để doanh nghiệp chọn mạng xã hội để quảng cáo hiệu thương hiệu với chi phí thấp? Đó câu hỏi đặt khơng cho lĩnh vực Marketting mà cịn cho lĩnh vực Cơng nghệ thông tin Đề tài “Phát triển hệ thống quảng cáo thông minh mạng xã hội” thực mơ hình tiếp thị mạng xã hội Kết thực nghiệm cho thấy bước đầu nghiên cứu xây dựng thành cơng hệ thống phân tích liệu (thường mẫu quảng cáo) sau hệ thống phân tích xong, đề xuất số pages groups cho người dùng đăng quảng cáo tìm hiểu thơng tin cần, ngồi hệ thống cho người dùng biết ước lượng phần trăm tỉ lệ xác hệ thống phân tích iv ABSTRACT Together with rapid growth of social networking sites, people are changing their ways of buying things, and companies are changing their ways of marketing too Traditional marketing has been replaced by e-marketing thanks to the Internet And one of the online marketing types is social-media marketing The dramatic development of social networking sites has opened an untapped potential for economy and internet technology How a company can choose an effective and cost-saving social networking site? It is an issue not only for marketing but also for internet technology Project of “Smart advertisement system on social networking sites” will create a new marketing model on social networking sites Practical results show that the project can research and build a data analysis system (of advertisements) After analyzing, the tool will suggest some pages or group-pages to the user, and then they can post their advertisement and search for their desired information In addition, the tool also gives user an estimated percentage rate of accuracy v MỤC LỤC LỜI CAM ĐOAN i LỜI CÁM ƠN ii TÓM TẮT iii ABSTRACT iv DANH MỤC CÁC BẢNG viii DANH MỤC CÁC HÌNH ix CHƯƠNG MỞ ĐẦU .1 1.1/ Giới thiệu đề tài .1 1.2/ Tính cấp thiết đề tài 1.3/ Mục tiêu đề tài CHƯƠNG TỔNG QUAN VỀ MẠNG XÃ HỘI VÀ TỔNG QUAN VỀ PHÁT TRIỂN HỆ THỐNG QUẢNG CÁO THÔNG MINH TRÊN MẠNG XÃ HỘI 2.1/ Mạng xã hội (Social Network) 2.1.1/ Định nghĩa 2.1.2/ Phân loại mạng xã hội 2.1.2.1/ Facebook .7 2.1.2.2/ Youtube .7 2.1.2.3/ Instagram 2.1.2.4/ Tumblr 2.1.2.5/ Twitter 2.1.2.6/ Flickr 2.1.2.7/ Pinterest .10 2.1.2.8/ LinkedIn 10 2.1.2.9/ Lief 11 2.2/ Quảng cáo mạng xã hội 12 2.2.1/ Định nghĩa 12 2.2.2/ Tiềm quảng cáo mạng xã hội 15 2.2.3 Các cách thức quảng cáo mạng xã hội 16 2.2.3.1/ Quảng cáo tìm kiếm (Search Marketing) 16 2.2.3.2/ Quảng cáo theo mạng lưới Internet (Ad-network) 16 2.2.3.3/ Quảng cáo mạng xã hội (Social Media Marketing) 16 vi 2.2.3.4/ Marketing tin đồn (Buzz Marketing) 17 2.2.3.5/ E-mail marketing 17 2.2.4/ Ba hình thức quảng cáo cụ thể Facebook 18 2.2.4.1/ Facebook Ads 18 2.2.4.2/ Sponsored Stories 19 2.2.4.3/ Post Engagement hay Promoted Post .20 2.3/ Tổng quan phát triển hệ thống quảng cáo thông minh mạng xã hội 22 2.3.1/ Quảng cáo thông minh mạng xã hội 22 2.3.2/ Hệ thống quảng cáo thông minh mạng xã hội: 22 2.3.3/ Khai phá liệu để xây dựng hệ thống quảng cáo thông minh mạng xã hội 23 2.3.3.1/ Các công cụ khai phá văn 26 2.3.3.2/ Các kho liệu môi trường truyền thông xã hội Big Data 27 CHƯƠNG 28 CƠ SỞ LÝ THUYẾT 28 3.1/ Các đề tài nghiên cứu giới 28 3.2/ Kỹ thuật trích xuất thơng tin từ văn 29 3.2.1/ Khái niệm 29 3.2.2/ Nội dung .29 3.3/ Vector Space Model 30 3.4/ Công cụ thu thập liệu môi trường Internet(Crawler) 31 3.4.1/ Botnet 31 3.4.2/ Các thành phần cỗ máy tìmn kiếm tự động 31 3.4.4/ Cấu trúc hoạt động crawler điển hình 32 3.5/ Giải thuật TF-IDF (TERM FREQUENCY – INVERSE DOCUMENT) .33 CHƯƠNG 36 HỆ THỐNG ĐỀ NGHỊ .36 4.1/ Các thành phần hệ thống Information Retrieval Social Media 37 4.2/ Thiết kế liệu sử dụng ngơn ngữ lập trình hệ thống 41 4.2.1/ Thiết kế liệu 41 4.2.2/ Mơ hình hóa tài liệu 42 4.2.2.1/ Token hóa 42 4.2.2.2/ Mơ hính hố tài liệu 43 4.2.3/ Ngôn ngữ sử dụng cho hệ thống 43 49 Với liệu đầu vào là: Mua bán nhà đất Đưa câu truy vấn vào hệ thống phân tích kết sau: Hình 5.4: Kết hệ thống phân tích thí nghiệm Đánh giá hiệu hệ thống với câu truy vấn trên: Người dùng dự kiến đăng 10 tin page group kết so với hệ thống chạy giống với dự kiến người dùm tin Precision = = 0.7 10 = 0.7 10 0.7 ∗ 0.7 F − measure = ∗ = 0.7 0.7 + 0.7 Recall = 50 Thí nghiệm 4: Giả sử: người dùng mong muốn quảng cáo “Mua bán nhà đất hà nội”, người dùng dự kiến đăng page group Facebook bảng sau: Bảng 5.4: Bảng người dùng dự kiến thực nghiệm No Link Type Like Member Nhà đất thổ cư khu vực hà nội Group 578 Nhà đất thổ cư Hà Nội Hội mua bán nhà đất Hà Nội Nhà đất Hà Nội Môi giới mua bán nhà đất Hà Nội Mua bán nhà đất Thanh Xuân- Hoàng Mai Hà Nội Mua bán Nhà Đất Hà Nội Mua bán nhà đất quận Ba Đính chủ Hội mua bán nhà đất , hộ, chung cư Hà Nội Mua bán chung cư giá rẻ Hà Nội Group Group Group Page Group 0 182 178 2836 144 3580 Group Page Group 125 120 310 Page 1290 10 Với liệu đầu vào là: Mua bán nhà đất hà nội Đưa câu truy vấn vào hệ thống phân tích kết sau: Hình 5.5: Kết hệ thống phân tích thí nghiệm 51 Đánh giá hiệu hệ thống với câu truy vấn trên: Người dùng dự kiến đăng 10 tin page group kết so với hệ thống chạy giống với dự kiến người dùm tin Precision = Recall = = 0.8 10 = 08 10 F − measure = ∗ 0.8 ∗ 0.8 = 0,8 0.8 + 0.8 Thí nghiệm 5: Giả sử: người dùng mong muốn quảng cáo “Mua máy tính giá rẻ”, người dùng dự kiến đăng page group Facebook bảng sau: Bảng 5.5: Bảng người dùng dự kiến thực nghiệm No Link Type Like Member Mua bán máy tính – máy in – máy fax – chuyên nghiệp Mua bán máy tính giá rẻ Cửa hàng mua bán máy tính, máy tính bảng Nhóm kinh doanh mua bán máy tính sinh viên Mua bán máy tính cũ Thanh lý mua bán máy tính linh kiện máy tính Chuyên mua bán máy tính linh kiện máy tính Bán laptop xách tay giá rẻ Mua bán máy tính cũ Hà Nội Mua bán máy tính, laptop, iphone, máy tính bảng Group 1879 Group Page 1120 587 Group 99 Page Group 570 0 3536 Page 980 Page Page Page 1542 1200 11690 10 52 Với liệu đầu vào là: Mua máy tính giá rẻ Đưa câu truy vấn vào hệ thống phân tích kết sau: Hình 5.6: Kết hệ thống phân tích thí nghiệm Đánh giá hiệu hệ thống với câu truy vấn trên: Người dùng dự kiến đăng 10 tin page group kết so với hệ thống chạy giống với dự kiến người dùm tin Precision = Recall = = 0.9 10 F − measure = ∗ Thí nghiệm 6: = 0.9 10 0.9 ∗ 0.9 = 0,9 0.9 + 0.9 53 Giả sử: người dùng mong muốn quảng cáo “Mua bán xe máy cũ”, người dùng dự kiến đăng page group Facebook bảng sau: Bảng 5.6: Bảng người dùng dự kiến thực nghiệm No Link Type Like Member Chợ mua bán xe củ Quảng Ngãi Group 654 Hội Mua Bán Xe Máy Cũ Điện Thoại Cũ Sài Gòn Mua Bán Xe Máy Cũ Mới Giá Cao Hội giao lưu mua bán xe máy cũ Mua bán xe máy cũ Đà Nẵng Hội mua bán xe máy cũ hà nội Chợ mua bán xe cũ Huế HỘI MUA BÁN XE MÁY CŨ - BỈM SƠN - THANH HÓA MUA BÁN XE MÁY CŨ QUY NHƠN Hội mua bán xe máy củ thị xã long khánh đồng nai Group 515 Page Group Group Group Group Group 5128 0 2925 9618 3038 65725 6111 Group Group 0 709 2136 10 Với liệu đầu vào là: Mua bán xe máy cũ Đưa câu truy vấn vào hệ thống phân tích kết sau: Hình 5.7: Kết hệ thống phân tích thí nghiệm 54 Đánh giá hiệu hệ thống với câu truy vấn trên: Người dùng dự kiến đăng 10 tin page group kết so với hệ thống chạy giống với dự kiến người dùm tin Precision = Recall = F − measure = ∗ = 0.9 10 = 0.9 10 0.9 ∗ 0.9 = 0,9 = 90% 0.9 + 0.9 Thí nghiệm 7: Giả sử: người dùng mong muốn quảng cáo “mua bán xe máy yamaha fulture tphcm”, người dùng dự kiến đăng page group Facebook bảng sau: Bảng 5.7: Bảng người dùng dự kiến thực nghiệm No Link Type Like Member Hội chung mua bán xe Yamaha Group 5476 Hội mua bán xe cũ Fulture BIÊN HOÀ - HỘI MUA BÁN XE MÁY HONDA - YAMAHA- SYM Mua Bán Xe Fulture Không Giấy Tờ Mua Bán Xe Máy fulture Tp.HCM ,Yamaha Mua Bán Xe Và Phụ Tùng Độ Kiểng Độ Ex Trên Khắp Mọi Miền Hội giao lưu xe máy cũ Hội mua bán xe máy cũ điện thoaị cũ sài gòn Mua xe máy Fultture Hội nhiều chạy Yamaha Group Group 0 290 1620 Group Page Group 1959 676 8990 410 Group Group 0 9618 515 Page Group 1200 0 1479 10 Với liệu đầu vào là: mua bán xe máy yamaha fulture 55 Đưa câu truy vấn vào hệ thống phân tích kết sau: Hình 5.8: Kết hệ thống phân tích thí nghiệm Đánh giá hiệu hệ thống với câu truy vấn trên: Người dùng dự kiến đăng 10 tin page group kết so với hệ thống chạy giống với dự kiến người dùm tin Precision = Recall = = 0.8 10 = 0.8 10 F − measure = ∗ 0.8 ∗ 0.8 = 0,8 0.8 + 0.8 56 Thí nghiệm 8: Giả sử: người dùng mong muốn quảng cáo “Nhà trọ sinh viên giá rẻ tphcm”, người dùng dự kiến đăng page group Facebook bảng sau: Bảng 5.8: Bảng người dùng dự kiến thực nghiệm No Link Type Like Member Nha tro sinh vien tp.hcm Group 116 Nhà Trọ Sinh Viên - Ở Ghép TP.HCM Việc Làm Parti Việc làm - Nhà trọ TP.HCm Nhà trọ sinh viên TPHCM NHÀ TRỌ SV ĐẠI HỌC Y DƯỢC TPHCM Nhà trọ SV Đại học Kinh Tế TPHCM Hội người tìm nhà trọ Kênh nhà trọ TP.HCM Hệ thống Căn hộ Nhà trọ TPHCM HỘI SINH VIÊN TÌM NHÀ TRỌ GIỚI THIỆU NHÀ TRỌ Group 10306 Group Page Group 3303 21311 8990 Group Group Page Page Group 0 7510 4128 2995 1475 709 29011 10 Với liệu đầu vào là: Nhà trọ sinh viên giá rẻ Đưa câu truy vấn vào hệ thống phân tích kết sau: Hình 5.9: Kết hệ thống phân tích thí nghiệm 57 Đánh giá hiệu hệ thống với câu truy vấn trên: Người dùng dự kiến đăng 10 tin page group kết so với hệ thống chạy giống với dự kiến người dùm tin Precision = Recall = = 0.9 10 = 0.9 10 F − measure = ∗ 0.9 ∗ 0.9 = 0,9 0.9 + 0.9 5.2/ Đánh giá thí nghiệm Thách thức điểm quan trọng hệ thống quảng cáo thông minh mạng xã hội vấn đề tìm kiếm thơng tin, xếp hạng tài liệu theo thứ tự giảm dần mức độ liên quan với nhu cầu thông tin người dùng, thường dạng truy vấn, loại bỏ tài liệu không liên quan Nên xây dựng hệ thống này, hoạt động gần giống hệ thống tìm kiếm thơng tin Để đánh giá hiệu hệ thống tìm kiếm thơng tin người ta sử dụng hai độ đo: độ xác (Precision độ bao phủ (recall) hệ thống tập liệu 58 Với kết thu sau lần chạy thí nghiệm Câu truy vấn liệu dầu vào Mua bán điện thoại samsung Recall Precision F-measure 0.9 0.9 0.9 Mua bán điện thoại cũ 0.8 0.8 0.8 Mua bán nhà đất 0.7 0.7 0.7 Mua bán nhà đất hà nội 0.8 0.8 0.8 0.9 0.9 0.9 0.9 0.9 0.9 0.9 0.9 0.9 0.9 0.9 0.9 Mua máy tính giá rẻ Mua bán xe máy cũ Mua bán xe máy yamaha fulture Nhà trọ sinh viên giá rẻ 59 CHƯƠNG KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 6.1/ Kết luận Đây hệ thống phân tích mẫu quảng cáo giúp người dùng dể dàng tìm kiếm thơng tin link đến diễn đàn mạng xã hội dựa vào kết đưa từ hệ thống (gồm link) từ người dùng truy cập đăng quảng cáo Kết thực mơ hình thí nghiệm cho thấy bước đầu xây dựng thành công hệ thống quảng cáo thông minh mạng xã hội (Information Retrieval Social Media) bao gồm chức năng: Hệ thống tập liệu có sẵn từ trang mạng xã hội để làm liệu Lọc liệu phân loại liệu, sau biểu diễn chúng thành vector tính tốn Hệ thống tính tốn dựa vào liệu đầu vào (biểu diễn thành vector) với tập liệu có sẵn đưa kết mong muốn Nhìn chung, thấy kỹ thuật phân tích tài liệu phức tạp so với kỹ thuật Data Mining truyền thống bời phải thực liệu văn vốn dạng phi cấu trúc có tính mờ (Fuzzy) Tuy nhiên, thực tế cho thấy người sử dụng ưa thích dùng ngày nhiều hệ thống lưu trữ phân tích liệu dạng văn Từ ta thấy hệ thống phân tích mẫu quảng cáo cho người dùng khả thi hệ thống có tính thương mại cao 6.2/ Hướng nghiên cứu tiếp theo: Trong tương lai hệ thống tiếp tục phát triển trang mạng xã hội khác; bao gồm: Flicker, YouTube, Windows Live đặc biệt hệ thống phát triển thêm chức khác (phân loại theo domain hay categories) để giúp người dùng dể dàng tìm kiếm thơng tin liệu tốt Dù chưa làm thực nghiệm dựa cớ sở lý thuyết nghiên cứu được, mạnh dạn đề xuất số hướng nghiên cứu để kết hợp với “ tên 60 đề tài” tạo nên công cụ tối ưu giúp cho doanh nghiệp phát triển việc quảng cáo thương hiệu mạng xã hội Các đề xuất sau: Tiếp tục xây dựng hệ thống crwal liệu từ mạng xã hội Facebook, Twitter, Google + để ln cập nhật sỏ liệu Phát triển hệ thống tiếp thị liên kết mạng xã hội bao gồm hạng mục nghiên cứu: Xây dựng sở liệu gồm từ khóa đường link tới sản phẩm, dịch vụ tương ứng, nghiên cứu thuật toán để hiệu suất tạo từ khóa nhanh, xác, phù hợp với người dùng thực tế, áp dụng Với lượng liệu tổng hợp từ nguồn đem lại lớn gây nhiều thời gian việc load trang website, đó, với tùy nội dung trang mạng xã hội khác nhau, việc chọn lọc đưa từ khóa phù hợp với nội dung trang mạng xã hội cần giải quyết, sau số giải pháp Phân loại từ khóa thành lĩnh vực, mạng xã hội chọn lựa lĩnh vực phù hợp với nội dung mạng xã hội hoạt động Tạo trang liệu cache, lấy số lượng từ khóa định từ tập sở liệu để tăng tốc độ load website Sắp xếp sở liệu đưa mức độ ưu tiên từ khóa 61 TÀI LIỆU THAM KHẢO Ah-Hwee Tan, Text mining: The state of the art and the challenges, Proceedings of the PAKDD 1999 Workshop on Knowledge Disocovery from Advanced Databases 1999/4/26 Chris, “The long tail: Why the future of business is selling less of more,” 2006 L Berger, V J D Pietra, and S A D Pietra, “A maximum entropy approach to natural language processing,” Computational linguistics, vol 22, no 1, pp 39–71, 1996 S Campbell, P P Maglio, A Cozzi, and B Dom, “Expertise identification using email communications,” in Proceedings of the twelfth international conference on Information and knowledge management ACM, 2003, pp.528– 531 Cooper D., Schindler P., Business research methods, McGraw Hill (2006) Steven White, All things marketing, Sosial media growth from 2006 to 2012 (2013) Dr M Saravanakumar , Dr.T.SuganthaLakshmi Social Media Marketing Life Science Journal 2012;9(4) Agichtein, E Brill, S Dumais, and R Ragno, “Learning user interaction models for predicting web search result preferences,” in Proceedings of the 29th annual international ACM SIGIR conference on Research and development in information retrieval ACM, 2006, pp 3–10 J Burstein and M Wolska, “Toward evaluation of writing style: finding overly repetitive word use in student essays,” in Proceedings of the tenth conference on European chapter of the Association for Computational LinguisticsVolume Association for Computational Linguistics, 2003, pp.35–42 10 J Burstein, K Kukich, S Wolff, C Lu, M Chodorow, L Braden-Harder, and M D Harris, “Automated scoring using a hybrid feature identification technique,” in Proceedings of the 17th international conference on 62 Computational linguistics-Volume Association for Computational Linguistics, 1998, pp 206–210 11 J Kincaid, R Fishburn, R Rogers, and B Chissom, “Derivation of new readability formulas for navy enlisted personnel (research branch report 875),” Memphis, TN: Naval Air Station, Millington, Tennessee, 1975 12 K Ali and M Scarr, “Robust methodologies for modeling web click distributions,” in Proceedings of the 16th international conference on World Wide Web ACM, 2007, pp 511–520 13 P Jurczyk and E Agichtein, “Discovering authorities in question answer communities by using link analysis,” in Proceedings of the sixteenth ACM conference on Conference on information and knowledge management ACM, 2007, pp 919–922 14 Pawel Jurczyk, Eugene Agichtein “Hits on question answer portals: exploration of link analysis for author ranking,” in Proceedings of the 30th annual international ACM SIGIR conference on Research and development in information retrieval ACM, 2007, pp 845–846 15 R Feldman and I Dagan Kdt - knowledge discovery in texts In Proc.of the First Int Conf on Knowledge Discovery (KDD), pages 112–117,1995 16 Richard M Schwartz, David R H Miller, Timothy R Leek, Information retrieval system, US7162468 B2 (2007/01/09) 17 T Joachims, L Granka, B Pan, H Hembrooke, and G Gay, “Accurately interpreting clickthrough data as implicit feedback,” in Proceedings of the 28th annual international ACM SIGIR conference on Research and development in information retrieval ACM, 2005, pp 154–161 18 Tie-Yan Liu, Learning to Rank for Information Retrieval, Journal Foundations and Trends in Information Retrieval, Volume Issue 3, March 2009 Pages 225-331 63 19 Xuerui Wang, Topical N-Grams: Phrase and Topic Discovery, with an Application to Information Retrieval, Data Mining, 2007 ICDM 2007 Seventh IEEE International Conference on Page(s): 697 – 702 20 Y Attali and J Burstein, “Automated essay scoring with e-rater R v 2,” The Journal of Technology, Learning and Assessment, vol 4, no 3, 2006 21 http://wearesocial.net/blog/2015/01/digital-social-mobile-worldwide-2015/ ... quảng cáo thông minh mạng xã hội 22 2.3.1/ Quảng cáo thông minh mạng xã hội 22 2.3.2/ Hệ thống quảng cáo thông minh mạng xã hội: 22 2.3.3/ Khai phá liệu để xây dựng hệ thống quảng cáo. .. mục tiêu nhà kinh doanh 2.3/ Tổng quan phát triển hệ thống quảng cáo thông minh mạng xã hội 2.3.1/ Quảng cáo thông minh mạng xã hội Các thông tin mạng xã hội lan truyền cách nhanh chóng, dựa vào... VỀ MẠNG XÃ HỘI VÀ TỔNG QUAN VỀ PHÁT TRIỂN HỆ THỐNG QUẢNG CÁO THÔNG MINH TRÊN MẠNG XÃ HỘI 2.1/ Mạng xã hội (Social Network) 2.1.1/ Định nghĩa 2.1.2/ Phân loại mạng xã hội