Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 27 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
27
Dung lượng
3,2 MB
Nội dung
15 Tổng quan tình hình nghiên cứu, luận giải mục tiêu nội dung nghiên cứu nhiệm vụ 15.1 Đánh giá tổng quan tình hình nghiên cứu thuộc lĩnh vực nhiệm vụ 15.1.1 Ngoài nước (Phân tích đánh giá cơng trình nghiên cứu có liên quan kết nghiên cứu lĩnh vực nghiên cứu nhiệm vụ; nêu bước tiến trình độ KH&CN kết nghiên cứu đó) 15.1.1.1 Khái niệm mạng xã hội phương tiện truyền thông xã hội Nhà xã hội học John Arundel Barnes (người Úc) coi người đưa thuật ngữ "mạng xã hội" (social network) vào ngữ cảnh nghiên cứu khoa học vào năm 1954 [Barnes54] Theo David Easley Jon Kleinberg, 2010 [EK10], mạng xã hội cấu trúc xã hội bao gồm tập cá nhân/ tổ chức tập quan hệ xã hội cá nhân/tổ chức mạng Mạng xã hội thường biểu diễn dạng đồ thị cá nhân/tổ chức biểu diễn nút quan hệ xã hội mạng biểu diễn cạnh kết nối nút mạng Mạng xã hội trực tuyến (online social network) mạng xã hội thi hành dịch vụ mạng xã hội trực tuyến (online social network service) Dưới đây, cụm từ "mạng xã hội" "mạng xã hội trực tuyến" khơng có dẫn riêng Khái niệm "phương tiện truyền thông xã hội" (social media) ý nghĩa nội dung với dịch vị mạng xã hội Thông qua phương tiện truyền thông xã hội, khối lượng nội dung người dùng tạo (user-generated content: UGC) trở thành thành phần có tỷ trọng lớn tập liệu tổng thể mà người có Jure Leskovec, 2011 [Lesk11] cho phương tiện truyền thông xã hội thiết kế thi hành để phổ biến tới cộng đồng (community) mối quan hệ xã hội Sheng Yu Subhash Kak, 2012 [YK12] nhận định phương tiện truyền thông xã hội bao gồm tảng để người dùng tạo trao đổi nội dung với cộng đồng người dùng mạng Phương tiện truyền thông xã hội đa dạng hình thức, bao gồm blog, trang web mạng xã hội, giới xã hội ảo, dự án hợp tác, cộng đồng nội dung giới trò chơi ảo Tồn phương tiện truyền thơng xã hội mà khơng bao gói dáng cấu trúc xã hội, chẳng hạn, blogspot.com khung blog tiếng khơng có liên kết xã hội blogger Andreas M Kaplan Michael Haenlein, 2010 [KH10] cho truyền thông xã hội hiểu "một nhóm ứng dụng dựa Internet xây dựng tảng tư tưởng công nghệ Web 2.0, cho phép tạo trao đổi nội dung người dùng tạo ra" Theo tác giả, thời đại phương tiện truyền thông xã hội đời trang web ‘‘Open Diary’’ (Nhật ký mở) Bruce Susan Abelson (vào tháng 5/2012, Open Diary có 381 nghìn nhật ký mở) Hai chiều đặc trưng phân biệt loại phương tiện truyền thông xã hội diện xã hội/phong phú phương tiện truyền thông (social presence/media richness) tự trình bày/ tự tiết lộ (self-presentation/self-disclosure) Các tác giả giải thích chi tiết nội dung ngữ nghĩa hai chiều đặc trưng đưa bảng phân loại phương tiện truyền thông xã hội theo hai chiều đặc trưng nói (Hình 1) Hình Phân loại mạng xã hội theo diện tính xã hội/phong phú phương tiện truyền thơng (social presence/media richness) đặc trưng tự trình bày/tự tiết lộ (self-presentation /selfdisclosure) [KH10] Các phát biểu có nội dung khơng trùng khít song thống điểm phương tiện truyền thơng xã hội có tính xã hội hóa gắn liền với internet Phương tiện truyền thơng xã hội có phân biệt với phương tiện truyền thông truyền thống (sách, báo, truyền hình) chủ thể hình thức xuất nội dung Tuy nhiên, số phương tiện truyền thông truyền thống (chẳng hạn, kênh tin tức lớn) có tài khoản Twitter Facebook Phương tiện truyền thông xã hội cách thức mà người dùng xã hội có thẻ chia sẻ đóng góp nội dung, bày tỏ quan điểm kết nối với người khác, phương tiện truyền thông xã hội mang thở sống đời thường diễn với tính động cao 15.1.1.2 Sự phát triển mạng xã hội Do lợi mình, mạng xã hội trực tuyến ngày hấp dẫn người sử dụng liệu, mạng xã hội tăng nhanh cách đáng kể Mới xuất vào năm 2004 tới tháng 8/2012 Facebook có xấp xỉ tỷ người dùng Cùng thời điểm đó, Twitte đạt tới số 500 triệu người dùng [Ben12] Hình mơ tả tăng trưởng số lượng người sử dụng Facebook Twitter http://www.opendiary.com/ Hình 2a Sự tăng trưởng số lượng người sử dụng Facebook [Ben 12] Hình 2b Sự tăng trưởng số lượng người sử dụng Twitter [Ben 12] Hơn nữa, mạng xã hội hấp dẫn người trẻ tuổi, người làm việc trí tuệ người có tính động cao xã hội vậy, mạng xã hội có tác động to lớn tới cộng đồng xã hội thực 15.1.1.3 Tác động mạng xã hội a) Tác động xã hội Mạng xã hội thừa kế sức quảng bá thông tin phương tiện truyền thông truyền thống với sức lan tỏa nhanh tới cộng đồng động cao xã hội Vì vậy, tác động xã hội mạng xã hội lớn Về bản, mạng xã hội góp phần tăng cường nguồn vốn xã hội (social capital) cho quốc gia nghiên cứu nhiều tác giả (Nicole B Ellison cộng sự, 2007 [ESL07], Homero Gil de Zúnĩga cộng sự, 2012 [ZJV12]), nhiên, khơng trường hợp, mạng xã hội cản trở phát triển vốn xã hội.Dưới ví dụ điển hình tác động xã hội mạng xã hội + Facebook với phong trào "Mùa xuân Ả rập" năm 2011 Tác động Facebook tới phong trào "Mùa xuân Ả rập" tháng năm 2011 nội dung nghiên cứu nhiều công bố khoa học, chẳng hạn Ban Al-Ani cộng sự, 2012 [AMCJ12], Elizabeth Iskander, 2011 [Iskan11] Nhiều tác giả cho Facebook yếu tố quan trọng tạo nên phong trào nnói Ai Cập dẫn tới sụp đổ chế độ Tổng thống Mubarak Racha Mourtada Fadi Salem, 2011 [MS11] đưa số liệu thống kê hình thức sử dụng Facebook Ai Cập Tuy-ni-zi phong trào “Mùa xuân Ả rập” (Hình 3) thông kê cho thấy việc sử dụng Facebook cho hoạt động liên quan đến phong trào nói chiếm trọng số lớn Hình Hình thức sử dụng Facebook Phong trào Dân kiện đầu năm 2011 [MS11] + Facebook với bạo loạn Anh năm 2011 Casill, Antonio A Paola Tubaro, 2012 [AT12] trình bày nghiên cứu thực nghiệm mô mối liên quan mức độ bạo lực với kiểm duyệt Facebook Kết nghiên cứu tác giả cho thấy lời giải tối ưu mang tính hệ thống giải pháp hồn tồn khơng kiểm duyệt Facebook trường hợp đó, khơng giảm mức độ bạo lực theo thời gian mà cịn cho phép khoảng thời gian hịa bình dài đáng kế sau đợt bùng phát bạo lực Kết nghiên cứu gợi ý rằng, giải pháp tối ưu nhằm ngăn chặn thâm nhập khuyếch tán quan điểm không lành mạnh, để nắm bắt dẫn dắt dư luận Facebook giải pháp tối ưu chúng cần phải tham gia cởi mở cung cấp thơng tin lành mạnh xác khơng áp đặt vào Facebook Thông qua việc kiểm chứng bốn giả thuyết mối liên quan công dân với việc sử dụng mạng xã hội trực tuyến tin tức, Homero Gil de Zúnĩga cộng sự, 2012 [ZJV12] việc sử dụng mạng xã hội trực tuyến tương ứng với vai trị "phóng viên nhân dân" có tác động lớn đáng kể tích cực tới cá nhân hoạt động dân trị Kết là, nguồn vốn xã hội đất nước tăng thêm tạo tiền đề cho phát triển quốc gia + Sự kiện chống quyền lợi Mỹ vào tháng 9/2012 Từ tháng 9/2012, hoạt động chống Mỹ giới Hồi giáo lại bùng phát với điểm xuất phát từ việc xuất quảng bá đoạn video xúc phạm đạo Hồi Facebook sử dụng để quảng bá khuyến khích hoạt động phản đối tưởng niệm công ngày 11/9/2001 Đại sứ Mỹ Lybi bị giết hại chiến quyền Mỹ lực lượng Hồi giáo chống Mỹ lại bước sang giai đoạn Trong chiến đó, mạng xã hội nhiều phía khai thác khơng theo khía cạnh tích cực mà cịn theo khía cạnh tiêu cực + Twiter trợ giúp giảm thiểu thảm họa kép "Động đất + Sóng thần" Nhật Bản Khai thác tính thời gian thực trao đổi thơng điệp Twitter, coi người dùng Twitter cảm biến mạng cảm biến, Takeshi Sakaki cộng sự, 2010 [SOM10] xây dựng mơ hình hệ thống dựa tảng mơ hình xác suất để dự báo động đất lan truyền thông tin động đất tới người dùng Thông báo động đất hệ thống lan truyền tới người dùng nhanh nhiều so với thơng báo Cơ quan khí tượng Nhật Bản http://seattletimes.com/html/nationworld/2019169492_mideastphonecall16.html Thảm họa kép "Động đất + Sóng thần" (The Great Eastern Japan Earthquake [STM11]) Nhật Bản vào ngày 11/3/2011 làm nhiều người rơi vào tình khẩn cấp mạng xã hội Twitter trở thành phương tiện truyền thông hữu dụng để người gặp nguy cấp gửi thông điệp cầu cứu ngắn tới bạn bè tổ chức cứu trợ Twitter truyền đạt lại thông điệp tư vấn, hướng dẫn trợ giúp thông tin cho người khẩn cấp Trong trường hợp đó, thơng tin định vị thiết bị gửi thông điệp người kêu cứu sử dụng để hướng dẫn người tới đia điểm an tồn địa điểm có trợ giúp Takeshi Sakaki cộng sự, 2011 [STM11], Nigen Collier, Son Doan cộng sự, 2011 [CD11, DVC11] đề xuất phương án nhận thông đệp cầu cứu người dùng gửi thông điệp tư vấn tới người dùng thông qua Twitter b) Tác động khoa học Sự phát triển mạng xã hội trực tuyến kéo theo hình thành chủ đề số ngành khoa học mà điển hình xã hội học khoa học máy tính + Ngành xã hội học Theo Robert E Wilson cộng sự, 2012 [WGG12], nghiên cứu xã hội học dựa Facebook định hướng tới năm nhóm chủ đề Phân tích mơ tả người sử dụng, Động lực sử dụng Facebook, Trình bày danh tính, Vai trị Facebook tương tác xã hội, Tính riêng tư việc tiết lộ thông tin Thêm nữa, mạng xã hội thúc đẩy chủ đề nghiên cứu "Netnography" = “Inter[net]” and “eth[nography]”, "Child-led Research" xã hội học Netnography cung cấp thông tin mẫu biểu tượng, mẫu ngữ nghĩa mẫu tiêu dùng nhóm người mua trực tuyến việc tiêu dùng cộng đồng trực tuyến không quan hệ với ngoại trừ trao đổi thông tin mạng xã hội trực tuyến Child-led Research để hoạt động tạo cho nhóm người bất lực cách tương đối (tuổi vị thành niên, khuyết tật) thiết lập chương trình nghị dẫn dắt nghiên cứu riêng họ + Khai phá liệu Cliff Lampe cộng sự, 2012 [LVGE12], Facebook (tổng quát hóa mạng xã hội trực tuyến) có vai trị nguồn tài ngun thơng tin , vậy, mạng xã hội trực tuyến chứa đựng nguồn liệu với dung lượng lớn có giá trị Sự phát triển khai phá liệu phương tiện truyền thông xã hội mối quan hệ liên ngành công nghệ thông tin xã hội học Một số nội dung điển hình khai phá liệu phương tiện truyền thơng xã hội có phần 15.1.1.4 Khai phá liệu mạng xã hội Chúng ta sử dụng thuật ngữ “khai phá liệu mạng xã hội” để nghiên cứu triển khai khai phá liệu từ phương tiện truyền thông xã hội từ mạng xã hội trực tuyến, nội dung người dùng tạo mối liên quan chặt chẽ chúng với phương tiện truyền thông xã hội Dữ liệu phương tiện truyền thông xã hội trải miền rộng lớn lĩnh vực đời sống xã hội, đặc biệt chúng phản ánh tính "hiện thời" đời sống khai phá liệu mạng xã hội nội dung chủ yếu "phân tích sống" (living analytics 3) Có thể nói khai phá liệu mạng xá hội hội tụ nhiều nội dung nghiên cứu thời mạng xã hội, khai phá liệu, tiếp thị kinh doanh, hành vi người Rất nhiều cơng trình nghiên cứu khai phá liệu phương tiện truyền thông xã hội công bố David Easley Jon Kleinberg [EK10], Jiawei Han cộng sự, 2010 [HSYY10], Jure Leskovec, 2011 [Lesk11] cung cấp khía cạnh khác khung nhìn tổng thể khai phá liệu phương tiện truyền thông xã hội bao gồm khái niệm nội dung phương tiện truyền thông xã hội, ý nghĩa kinh tế xã hội nghiên cứu phương tiện truyền thông xã hội Hai kiểu đối tượng nghiên cứu khai phá liệu mạng xã hội nội dung có mạng xã hội trực tuyến cấu trúc mạng xã hội Khai phá liệu nội dung mạng xã hội để hoạt động khai phá liệu nội dung văn mà người dùng tạo phương tiện truyền thông xã hội Thành phần tạo thành miền ứng dụng rộng lớn Khai phá liệu cấu trúc mạng xã hội để hoạt động khai phá liệu cấu trúc mạng xã hội tương ứng với phương tiện truyền thông xã hội Hơn nữa, khai phá liệu tiến hành dựa kết hợp nội dung cấu trúc phương tiện truyền thông xã hội a) Khai phá liệu nội dung mạng xã hội Khai phá liệu nội dung mạng xã hội đề cập tới toàn nội dung hai lớp tốn khai phá liệu mơ tả dự báo; huy động phạm vi tồn diện thuật toán khai phá liệu [HSYY10, Lesk11] Khai phá liệu nội dung mạng xã hội trực tuyến có phạm vi ứng dụng rộng lớn quản lý danh tiếng (reputation management), tiếp thị phương tiện truyền thông http://www.larc.smu.edu.sg/ xã hội (Social media marketing), phản ứng cơng dân (citizen response), phân tích hành vi người (Human behavior analysic), phóng viên cơng dân thời gian thực (Real time citizen journalist) nhiều ứng dụng khác Chẳng hạn, Craig Macdonald cộng sự, 2010 [MSOS10] cho phân tích nghiên cứu khai phá liệu blogs khuôn khổ TREC giai đoạn 2006-2009 ba toán: phát quan điểm (opinion-finding) đối tượng ("Người sử dụng blogs nghĩ đối tượng X cho ? "), chưng cất blog (blog distillation) để tìm blog quan tâm tới đối tượng X ("Tìm blog quan tâm chính, định kỳ tới đối tượng X ?") phát tin bật (top news) từ blogs ("tìm tin có giá trị gần ?") Hàng chục cơng trình nghiên cứu tham gia TREC-Blogs Track cung cấp phổ rộng lớn giải pháp khai phá liệu để giải ba tốn nói Theo tác giả, toán phát quan điểm (bài tốn đầu tiên) từ blogs khơng có nhiều khác biệt so với tốn khai phá quan điểm nói chung Chúng ta xem xét nghiên cứu khác khai phá liệu microblogs Huina Mao cộng sự, 2011 [MCB11] Đặc thù độ dài thông điệp ngắn, cấu trúc liên kết thành viên thông điệp tạo số yếu tố bổ sung cho khai phá liệu nội dung từ microblogs Tính cập nhật thông tin nhanh microblogs tiền đề cho giải pháp dự báo ngắn hạn microblogs Trong [MCB11], Huina Mao cộng cung cấp khảo sát công phu số tâm trạng nhà đầu tư chứng khốn gồm có tỷ lệ phần trăm tăng giá DSI (DSI bullish percentage: DSI), số thông minh nhà đầu tư (Investor Intelligence: II), đánh giá nhà đầu tư Twitter (Twitter Investor Sentiment: TIS), lượng thuật ngữ tìm kiếm tài Twest (Tweet volumes of financial search terms: TV-FST), đánh giá tin tức tiêu cực (Negative News Sentiment: NNS), lượng tìm kiếm Google thuật ngữ tài (Google search volumes of financial search terms: GIS) Qua thực nghiệm theo thời gian tuần, tác giả phát GIS có độ liên quan đáng kể với số tài phân biệt (different financial indexes: DJIA) GIS thay số dự báo tài Tuy nhiên, số thơng minh nhà đầu tư (II) khơng có vai trị Độ xác dự báo cải thiện làm giàu đặc trưng Thực nghiệm theo thời gian ngày cho thấy TIS TV-FST cho phép dự báo tốt đáng kể theo thống kê hoàn vốn thị trường hàng ngày DSI khơng cho phép NNS cho kết theo chiều hướng tương tự TSI TV-FST độ liên quan b) Khai phá liệu cấu trúc mạng xã hội Khai phá liệu cấu trúc mạng xã hội đề cập tới mẫu tính động cấu trúc mạng xã hội trực tuyến Mẫu cấu trúc mạng xã hội trực tuyến phù hợp với tính chất chung mạng xã hội đặc tính riêng mạng xã hội trực tuyến Tính chất chung mạng xã hội gồm tính chất giới nhỏ (small world), liên kết mạnh – yếu (strong – weak tie), phân bố luật lũy thừa (power law distribution), cấu trúc cộng đồng (community) Tinh chất giới nhỏ độ dài đường liên kết hai đỉnh mạng xã hội không vượt số nguyên dương nhỏ Tính chất Stanley Milgram phát thực nghiệm từ năm 1969 Tính chất liên kết mạnh – yếu liên kết hai nút mạng xã hội không giống đươc chia thành hai lớp liên kết mạnh liên kết yếu Về mặt xã hội, liên kết mạnh thể mối quan hệ người thân, liên kết yếu thể mối quan hệ tiếp xúc Trong nhiều trường hợp, liên kết mạnh - yếu chuyển đổi thành liên kết dương - âm để mối liên kết đồng thuận trái ngược Phân bố luật lũy thừa (power law distribution): số nút có k liên kết tới khoảng 1/k với số k>2, cấu trúc cộng đồng (community): tập tất nút phân chia thành số nhóm nút có tính chất chung Dự báo liên kết toán quan trọng khai phá liệu cấu trúc mạng xã hội trực tuyến L Liu T Zhou, 2010 [LZ10] cung cấp tổng quan dự báo liên kết mạng xã hội Cho đồ thị vô hướng mạng xã hội G = (V, E) V tập n nút (đỉnh), E tập cung có tập U gồm tất n*(n-1)/2 cung có Bài tốn đặt tìm cung có tương lai từ tập U\E Các tác giả hệ thống hóa thuật tốn giải toán dự báo liên kết, bao gồm thuật toán dựa độ tương tự, thuật toán dựa theo cực đại hóa khả năng, thuật tốn dựa mơ hình xác suất J Leskovec cộng sự, 2010 [LHK10] đề xuất phương pháp học máy hồi quy để dự báo liên kết âm – dương mạng xã hội Số lượng mẫu quan hệ liên kết thu gọn dựa lý thuyết cân (balance theory) lý thuyết trạng thái (status theory) [EK10], vậy, mơ hình học máy dự báo hồi quy thi hành hiệu 15.1.1.6 Nghiên cứu khai phá liệu mạng xã hội số tổ chức, nhóm nghiên cứu a) Nghiên cứu Viện Tiêu chuẩn Công nghệ quốc gia Mỹ Viện Tiêu chuẩn Công nghệ quốc gia Mỹ (National Institute of Standards and Technology: NIST) tiến hành nhiều hội nghị khoa học chủ đề khoa học – công nghệ quan tâm nước Mỹ giới Chuỗi hội nghị “thu hồi” văn (Text REtrieval Conference: TREC) NIST Bộ Quốc phòng Mỹ phối hợp tổ chức với tham gia cộng đồng nghiên cứu triển khai thu hồi thông tin (Information Retrieval) giới Liên quan tới nội dung đề tài, diễn số hội nghị phận (Track) khuôn khổ hội nghị TREC sau đây: - Blog Track 2010 Craig Macdonald cộng sự, 2010 [MSOS10] cung cấp mô tả khái quát kho ngữ liệu sử dụng (Blogs06 Blogs08), kết nghiên cứu 45 nhóm nghiên cứu thu hồi thơng tin Blogsphore ba toán Phát quan điểm (Opinion-Finding), Tìm kiếm blog thú vị (Blog Distillation) Phát tin nóng (Top news) Những giải pháp cho ba toán Phát quan điểm (dựa theo phân lớp, dựa theo từ vựng), Tìm kiếm blog thú vị (tiếp cận lựa chọn tài nguyên, tiếp cận tìm kiếm chuyên gia), Phát tin nóng (phương pháp bỏ phiếu, phương pháp xếp hạng) Craig Macdonald cộng tổng hợp từ công bố cụ thể 45 nhóm nghiên cứu nhóm thực đề tài nghiên cứu triển khai thử nghiệm có kết sơ - Microblog Track 2011, 2012 (https://sites.google.com/site/microblogtrack/2011-guidelines, https://sites.google.com/site/microblogtrack/2012-guidelines) NIST tạo 60 chủ đề cho toán người tham gia giải toán thời gian thực Số lượng tweest ngày lên tới 200 triệu, yêu cầu thời gian thực thách thức lớn việc tìm kiếm xếp hạng tweest Các giải pháp công bố Microblog Track năm 2011 nhóm thực đề tài khảo sát để áp dụng (http://trec.nist.gov/pubs/trec20/t20.proceedings.html) Cơng trình nghiên cứu Richard M C McCreadie cộng sự, 2012 [CSMOC12] nhóm thực đề tài khảo sát để áp dụng việc xây dựng nâng cấp kho ngữ liệu (scopus) cho toán phạm vi đề tài b) Nghiên cứu Viện Tin học Quốc gia Nhật Bản Trường ĐHCN, ĐHQGHN (trực tiếp Phịng thí nghiệm Cơng nghệ Tri thức: KTLab) Viện Tin học Quốc gia Nhật Bản (trực tiếp nhóm nghiên cứu GS Nigel Collier) cộng tác khoa học cơng nghệ thực số tốn khai phá liệu từ thông điệp người dùng mạng xã hội Twitter (i) Hiểu yêu cầu người dùng gặp tình khẩn cấp; (ii) Theo dõi biến đổi khí hậu; (iii) Phân tích danh tiếng sản phẩm; (iv) Khám phá theo dõi chủ đề phân tích quan điểm người sử dụng liên quan tới thảm họa 10 thiết liên quan tới vai trò thực nghiệm tập liệu Twitter tìm kiếm vai trị người tiếng (Celebrity), người lãnh đạo quan điểm (Information propagators), người phát kiến (Promoters) người vận động quảng bá (Early adopters) Kết nghiên cứu hai tác giả nhóm thực đề tài phân tích khai thác Bùng nổ kiện mạng xã hội phản ánh tính cao trào kiện tương ứng xã hội thực dự báo bùng nổ kiện mạng xã hội cho phép dự báo kiện xã hội thực Trong [STM11], Takeshi Sakaki cộng phân tích xu hướng Tweet người sử dụng xung quanh kiện thảm họa kép "động đật – sóng thần" Nhật Bản Tập liệu Tweet tiếng Nhật 1,3 triệu người dùng thu thập giải pháp crawling trực tiếp Các mẫu phổ biến Tweet trước sau ngày 11/3/2011 mẫu mẫu phổ biến Tweet ngày 11/3/2011 vùng lãnh thổ khác đối sánh Tweet điện thoại di động, thiết bị thông minh chiếm ưu vùng bị tác động trực tiếp thảm họa Dự báo bùng nổ kiện mạng xã hội chủ đề nghiên cứu Trung tâm nghiên cứu phân tích sống LARC ĐH quản lý Singapore Wayne Xin Zhao cộng [ZJHS11, ZSJSL12], Qiming Diao cộng [DJZL12] phân tích yếu tố góp phần tạo bùng nổ kiện từ cho phép dự báo bùng nổ kiện Phân tích chủ đề ẩn để phát chủ đề quan trọng hướng phân tích hữu dụng 15.1.2 Trong nước 15.1.2.1 Tình hình chung * Mạng xã hội Việt Nam Tại Việt Nam, sử dụng mạng xã hội trở thành xu không lớp trẻ mà nhiều lướp đối tượng khác Theo thống kê công bố vào tháng 02/2012 VinaLink Media [Tuan12], tố 10 mạng xã hội sử dụng nhiều Việt Nam có tới mạng xã hội Việt Nam mà ZingMe mạng xã hội Việt Nam lớn nhất, đứng vị trí thứ ba sau YouTube Facebook Mạng xã hội nước ngồi phủ tới 83% cịn mạng xã hội Việt Nam phủ tới 75% số người dùng Internet Việt Nam Dù thống kê VinaLink Media không cho biết lượng người dùng tích cực (Active user) song số liệu cho thấy sức hấp dẫn mạng xã hội người dùng Internet Đã có nghiên cứu sử dụng mạng xã hội cho kinh doanh Tuan Ha, 2012 [Tuan12] cung cấp số liệu thống kê tiếp thị mạng xã hội với 0,4% doanh nghiệp với Facebook, 0,07% doanh nghiệp với YouTube 0,2% doanh nghiệp với mạng xã hội lại Nguyen Huu Chi 13 Christophe J Nordman [CN12] làm sáng tô mối liên hệ mạng xã hội hộ gia đình, kinh doanh hộ gia đình với hiệu kinh doanh hộ gia đình phi nơng nghiệp Ngồi số mối tương quan khác, giả nhận thấy cộng đồng kinh doanh hộ gia đình có tác dụng tới hiệu kinh doanh hộ gia đình * Nghiên cứu phát vai trò bùng nổ kiện mạng xã hội Tại tổ chức thực phối hợp thực đề tài (tập trung Phịng Thí nghiệp Cơng nghệ Tri thức), số nghiên cứu bước đầu phát vai trò bùng nổ kiện mạng xã hội thực Một số kết nghiên cứu trực tiếp gián tiếp liên quan tới hai nội dung nghiên cứu đề tài mà nhóm thực đề tài thực trình bày chi tiết phần Ngoài nghiên cứu liên quan tổ chức thực đề tài, chưa thấy cơng bố khoa học có giá trị liên quan tới phát vai trò bùng nổ kiện mạng xã hội Việt Nam 15.1.2.2 Tình hình nghiên cứu nhóm thực đề tài a) Lọc nội dung Internet 14 Proxy Hệ thống cache Bộ chuẩn hoá DL Firewall Người dùng Bộ lọc ảnh Bộ lọc URL/PICS Bộ định Bộ kiểm sốt Bộ xác định ngơn ngữ Bộ lọc tiếng Anh Bộ lọc tiếng Việt Bộ phân tích nội dung Hình Kiến trúc hệ thống lọc nội dung Internet [HNNL11] Trong giai đoạn 2007-2009, chủ trì đề tài Nguyễn Lương Hoàng Hoa nhiều thành viên tham 15 gia thực đề tài nguồn nhân lực chủ chốt thực hoàn thành đề tài cấp Nhà nước mã số KC.01.02/06-10 "Nghiên cứu, phát triển hệ thống lọc nội dung hỗ trợ quản lý đảm bảo an tồn – an ninh thơng tin mạng Internet" Tiến sỹ, Thiếu tướng Nguyễn Viết Thế, Cục trưởng Cục Tin học nghiệp vụ, Bộ Công an làm Chủ nhiệm đề tài Đề tài Hội đồng nghiệm thu đánh giá xếp loại Khá Kiến trúc tổng quát hệ thống lọc nội dung sản phẩm đề tài KC.01.02/06-10 mơ tả Hình Bộ phân tích nội dung hệ thống giải toán xử lý văn tiếng Việt tiếng Anh xây dựng mơ hình phân lớp đồn nhận ngơn ngữ xếp hạng văn để lọc văn theo nội dung Các thành phần nói đề tài KC.01.02/06-10 có liên quan trực tiếp tới nội dung trích chọn thơng tin (vai trò, kiện) đề tài Kinh nghiệm thực giải tốn nói có ích cho việc thực đề tài b) Khai phá quan điểm theo đặc trưng từ nhận xét đánh giá sản phẩm Khai phá quan điểm (opinion mining / sentiment analysic) tốn nhận biết, phân tích tổng hợp nhận xét, đánh giá người dùng tượng, vật, người tổ chức Đầu tiên cần phải lọc văn coi không chứa nhận xét đánh giá từ tập văn thu thập Sau đó, câu chứa nhận xét đánh giá lựa chọn Đặc trưng đối tượng đánh giá người dùng đối tượng trích xuất Cuối cùng, đánh giá chung đối tượng tập hợp thành đánh giá chung Nhóm thực đề tài có số kết nghiên cứu khai phá quan điểm [QTHC11, THCQ11, HTMQ11], theo từ tập nhận xét đánh giá sản phẩm người dùng, cần trích xuất đánh giá người dùng theo đặc trưng sản phẩm sau tích hợp lại Mơ hình Trích xuất tổng hợp quan điểm theo đặc trưng từ đánh giá sản phẩm thể Hình 16 Hình Trích xuất tổng hợp quan điểm theo đặc trưng từ đánh giá sản phẩm [QTHC11, THCQ11, HTMQ11] Các giải pháp trích chọn đặc trưng sản phẩm quan điểm người dùng đặc trưng hưu dụng giải toán phát kiện đặc trưng liên quan tới kiện mà thi hành hệ thống xác định vai trò bùng nổ kiện mạng xã hội c) Dự báo chứng khoán từ liệu Twitter Tien Thanh Vu cộng sự, 2012 [TSQN12] đề xuất phương pháp lai dạy chuỗi mơ hình dự báo thay đổi phân cực giá mở cửa thị trường bốn cổ phiếu công nghệ Apple (AAPL), Google (GOOG), Microsoft (MSFT) Amazon (AMZN) trình bày Hình Dữ liệu gồm 5.001.460 tweet người dùng hàng ngày bốn thành phố nước Mỹ (New York, Chicago, Los Angeles San Francisco) thu thập nhờ công cụ giao diện trình ứng dụng Twitter trực tuyến trực tiếp API từ ngày 01/4/2011 đến ngày 31/5/2011 Ba nhóm đặc trưng (đánh giá tích cực – tiêu cực, độ tin cậy khách hàng vào cổ phiếu, lên-xuống cổ phiếu ba ngày trước đó) sử dụng phân lớp định (C4.5) Tree cho độ xác 82,93%, 80,49%, 75,61% 75,00% dự báo thay đổi lên - xuống hàng ngày Apple 17 (AAPL), Google (GOOG), cổ phiếu Microsoft (MSFT) Amazon (AMZN) Hình Mơ hình dự báo lên – xuống thị trường chứng khốn từ Twitter [TSQN12] Cơng trình nghiên cứu trực tiếp khai thác liệu từ mạng xã hội Twitter cung cấp tảng tri thức miền ứng dụng đề tài thực Không thế, số kỹ thuật trích chọn đặc trưng cụ thể cho miền liệu tái sử dụng nâng cấp trình thực đề tài d) Giám sát kiện từ phương tiện truyền thơng xã hội 18 Hình Hệ thống giám sát kiện VnLoc [MMSMX12] Mai-Vu Tran cộng sự, 2012 [MMSMX12] thi hành mô hình xây dựng hệ thống trích chọn kiện từ trang báo điện tử Hình trình bày thể trực quan hệ thống Hệ thống sử dụng kỹ thuật cực đại entropy để trích chọn kiện với nhóm đặc trưng tên kiện, người tạo kiện, thời gian, địa điểm tác động kiện Các kỹ thuật thi hành hệ thống giám sát kiện sử dụng đề tài e) Trích chọn thơng tin từ Internet Một toán cốt lõi để thi hành hệ thống tốn trích chọn thông tin từ Internet Dữ liệu thu thập từ Internet (theo phạm vi xác định toán) tiền xử lý để tìm thực thể (entity/object) đặc trưng thực thể, sau đó, tổng hợp thơng tin thực thể để có mẫu, tri thức từ liệu miền ứng dụng 19 Hình Mơ hình chủ đề ẩn trích chọn thơng tin từ Internet [PNLLS11, TTT09, TTT08] Phương pháp mơ hình chủ đề phương pháp tiên tiến trích chọn thơng tin, theo đó, tập liệu "tổng thể" miền ứng dụng tập hợp phân tích chủ đề tạo nên mơ hình chủ đề cho miền ứng dụng Hình trình bày kết nghiên cứu sử dụng mơ hình chủ đề trích chọn thơng tin Internet Các giải pháp mơ hình chủ đề ẩn ứng dụng đề tài 20 15.2 Luận giải việc đặt mục tiêu nội dung cần nghiên cứu nhiệm vụ Như luận giải, tăng cường vốn xã hội quốc gia vai trò quan trọng mạng xã hội Đồng thời, phản ánh sống xã hội thực đặc trưng cốt lõi mạng xã hội Khơng kiện lớn đời sống xã hội thực hình thành phát triển từ mạng xã hội bùng nổ kiện mạng xã hội dấu hiệu trình hình thành phát triển kiện Từ dấu hiệu dự đoán bùng nổ kiện mạng xã hội qua dự đốn kiện xảy xã hội thực Dự đoán bùng nổ kiện cho phép đặt giải pháp lành mạnh hóa luồng thông tin liên quan tới kiện, định hướng kiện theo mục tiêu tăng cường vốn xã hội cho quốc gia Những giải pháp Takeshi Sakaki cộng [STM11], Wayne Xin Zhao cộng [ZJHS11, ZSJSL12], Qiming Diao cộng [DJZL12] định hướng cho giải pháp nhóm thực đề tài Người tiếng, người lãnh đạo quan điểm, người phát kiến người vận động quảng bá [TS12] cá nhân có vai trị quan trọng việc hình thành phát triển kiện bùng nổ kiện Vì vậy, việc phát vai trị cá nhân mạng xã hội cần tiến hành giải pháp tiền đề dự báo bùng nổ kiện mạng xã hội Những giải pháp Chi Wang cộng [WHJTZ10], Vanesa Junquero-Trabado David Dominguez-Sal [TS12] định hướng cho giải pháp nhóm thực đề tài Một trường hợp riêng dự báo bùng nổ kiện bùng nổ kiện có liên quan tới cá nhân, nhóm cá nhân thuộc bốn lớp vai trị cần quan tâm giải đề tài Hoạt động phối hợp nghiên cứu khoa học – triển khai cơng nghệ nhóm thực đề tài với nhóm GS Nigel Collier Viện Tin học Quốc gia Nhật Bản, với nhóm nghiên cứu GS Lim Ee Peng (Trung tâm nghiên cứu phân tích sống: LARC) Đại học Quản lý Singapore, với nhóm nghiên cứu GS Bart Baesens Đại học KU Leuven (Bỉ) cần khai thác cho giải pháp đề tài Như luận giải, để giải tốn phát vai trị dự báo bùng nổ kiện mạng xã hội, toán thu thập dự liệu từ mạng xã hội, tiền xử lý liệu trích chọn thơng tin từ văn cần giải Kinh nghiệm nhóm nghiên cứu chủ đề vận dụng hiệu trình thực đề tài Phát vai trò dự báo bùng nổ kiện mạng xã hội tốn khó, đnag chủ đề khoa học – công nghệ thời giới Trong miền ứng dụng cụ thể, cộng tác chuyên gia miền ứng dụng (các chuyên gia nghiệp vụ) cần khai thác để hệ thống 21 sản phẩm đề tài đạt hiệu tốt miền ứng dụng Sự cộng tác nhóm thực đề tài từ quan chủ trì đề tài quan phối hợp thực đề tài giải pháp thi hành nội dung Tính thời đề tài, phát huy kết nghiên cứu có phát triển hợp tác KH-CN quốc tế có tiền đề để giải pháp đề xuất trình thực đề tài đáp ứng yêu cầu công bố khoa học quốc tế (01 bài) quốc gia (01 bài), đồng thời, sản phẩm hệ thống phần mềm đáp ứng yêu cầu dự báo bùng nổ kiện trêng mạng xã hội hỗ trợ hoạt động nghiệp vụ 16 Liệt kê danh mục cơng trình nghiên cứu, tài liệu có liên quan đến đề tài trích dẫn đánh giá tổng quan 16.1 Các cơng trình khoa học liên quan tới nội dung đề tài tác giả khác [Tuan12] Tuan Ha (2012) Mạng xã hội Việt Nam (Phần 2), Social Media Marketing Conference, Hanoi Feb 2012 [AMCJ12] Ban Al-Ani, Gloria Mark, Justin Chung, Jennifer Jones (2012) The Egyptian Blogosphere: A Counter-Narrative of the Revolution, Proceedings of the ACM 2012 conference on Computer Supported Cooperative Work: 17-26 [AT12] Casilli, Antonio A and Paola Tubaro (2012) Social media censorship in times of political unrest: A social simulation experiment on the UK riots, Bulletin of Sociological Methodology, 115 (1): 5-20 [Barnes54] Barnes, J (1954) Class and Committees in a Norwegian Island Parish, Human Relations, 7, 39-58 [Ben12], Shea Bennet (2012) Twitter On Track For 500 Million Total Users By March, 250 Million Active Users By End Of 2012, http://www.mediabistro.com/alltwitter/twitter-active-totalusers_b17655 [BM11] Johan Bollen, Huina Mao: Twitter Mood as a Stock Market Predictor, IEEE Computer 44(10): 91-94 (2011) [BS12] Adam Bermingham, Alan F Smeaton (2012) An Evaluation of the Role of Sentiment in Second Screen Microblog Search Tasks, ICWSM 2012 [CD11] Nigel Collier, Son Doan (2011) Syndromic Classification of Twitter Messages, eHealth 2011: 186-195 [CN12] Nguyen Huu Chi, Christophe J Nordman (2012) Household Entrepreneurship and Social Networks: Panel Data Evidence from Vietnam, Technical Report, “Unlocking potential: Tackling economic, institutional and social constraints of informal entrepreneurship in Sub-Saharan Africa” 22 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 Project [CSMOC12] Richard M C McCreadie, Ian Soboroff, Jimmy Lin, Craig Macdonald, Iadh Ounis, Dean McCullough (2012) On building a reusable Twitter corpus, SIGIR 2012: 1113-1114 [DJZL12] Qiming Diao, Jing Jiang, Feida Zhu and Ee-Peng Lim (2012) Finding bursty topics from microblogs, ACL'12: 536-544, 2012 [DVC11] Son Doan, Bao-Khanh Ho Vo, Nigel Collier (2011) An Analysis of Twitter Messages in the 2011 Tohoku Earthquake, eHealth 2011: 58-66 [EK10] David Easley and Jon Kleinberg (2010) Networks, Crowds, and Markets: Reasoning about a Highly Connected World, Cambridge University Press, 2010 [ESL07] Nicole B Ellison, Charles Steinfield, Cliff Lampe (2007) The Benefits of Facebook "Friends: "Social Capital and College Students' Use of Online Social Network Sites, J ComputerMediated Communication 12(4): 1143-1168 (2007) [HSYY10] Jiawei Han, Yizhou Sun, Xifeng Yan, Philip S Yu (2010) Mining Knowledge from Databases: An Information Network Analysis Approach, ACM SIGMOD Conference Tutorial, 2010 [HWNC11] Andrew Bengry-Howell, Rose Wiles, Melanie Nind, Graham Crow (2011) A Review of the Academic Impact of Three Methodological Innovations: Netnography, Child-Led Research and Creative Research Methods, ESRC National Centre for Research Methods, http://eprints.ncrm.ac.uk/1844/ [Iskan11] Elizabeth Iskander (2011) Connecting the National and the Virtual: Can Facebook Activism Remain Relevant After Egypt’s January 25 Uprising?, International Journal of Communication (2011): 1225–1237 [KH10] Andreas M Kaplan and Michael Haenlein (2010) Users of the world, unite! The challenges and opportunities of Social Media, Business horizons (2010), 53:59-68 [Lesk08] Jure Leskovec (2008) Dynamics of large networks, PhD Thesis, Carnegie Mellon University [Lesk11] Jure Leskovec (2011) Social Media Analytics, Tutorial at the ACM SIGKDD International Conference on Knowledge Discovery and Data Mining (Part 1: Information flow, Part2: Rich Interactions), 2011 [LHK10] J Leskovec, D Huttenlocher, J Kleinberg (2010) Predicting Positive and Negative Links in Online Social Networks, WWW’2010, ACM Press, New York [LVGE12] Cliff Lampe, Jessica Vitak, Rebecca Gray, Nicole B Ellison (2012) Perceptions of facebook's value as an information source, CHI 2012: 3195-3204 [LZ10] L Lu and T Zhou (2010) Link prediction in complex networks: A survey, Physica A, 390:1150–1170, 2010 [MCB11] Huina Mao, Scott Counts, Johan Bollen (2011) Predicting Financial Markets: Comparing Survey, News, Twitter and Search Engine Data, CoRR abs/1112.1051: (2011), arXiv:1112.1051v1 [q-fin.ST] Dec 2011 23 25 26 27 28 29 30 31 32 33 34 35 36 37 [MS11] Racha Mourtada and Fadi Salem (2011) Civil Movements: The Impact of Facebook and Twitter, Arab Social Media Report, (2): 1-30 [MSOS10] Craig Macdonald, Rodrygo L T Santos, Iadh Ounis, Ian Soboroff (2010) Blog track research at TREC, SIGIR Forum 44(1): 58-75 (2010) [Russ11] Matthew A Russell (2011) Mining the social web, O'Reilly, 2011 [SOM10] Takeshi Sakaki, Makoto Okazaki, Yutaka Matsuo (2010) Earthquake shakes Twitter users: real-time event detection by social sensors, WWW 2010: 851-860 [STM11] Takeshi Sakaki, Fujio Toriumi, Yutaka Matsuo (2011) Tweet trend analysis in an emergency situation, SWID '11: [TS12] Vanesa Junquero-Trabado, David Dominguez-Sal (2012) Building a role search engine for social media WWW (Companion Volume) 2012: 1051-1060 [WGG12] Robert E Wilson, Samuel D Gosling, and Lindsay T Graham (2012) A Review of Facebook Research in the Social Sciences, Perspectives on Psychological Science 7(3) 203– 220 [WHJTZ1] Chi Wang, Jiawei Han, Yuntao Jia, Jie Tang, Duo Zhang, Yintao Yu, Jingyi Guo (2010) Mining advisor-advisee relationships from research publication networks, KDD 2010: 203-212 [YK12] Sheng Yu, Subhash Kak (2012) A Survey of Prediction Using Social Media CoRR abs/1203.1647: (2012) [ZF11] X Zhang and H Fuehres (2011) Predicting Stock Market Indicators through Twitter ‘I hope it is not as bad as I fear’, CONs, 2010 [ZJHS11] Wayne Xin Zhao, Jing Jiang, Jing He, Yang Song, Palakorn Achanauparp, Ee-Peng Lim and Xiaoming Li (2011) Topical keyphrase extraction from Twitter, ACL-HLT'11: 379-388, 2011 [ZJV12] Homero Gil de Zúnĩga, Nakwon Jung, Sebastián Valenzuela (2012) Social Media Use for News and Individuals’ Social Capital, Civic Engagement and Political Participation, Journal of Computer-Mediated Communication 17 (2012) 319–336 [ZSJSL12] Wayne Xin Zhao, Baihan Shu, Jing Jiang, Yang Song, Hongfei Yan and Xiaoming Li (2012) Identifying Event-related Bursts via Social Media Activities, EMNLP-CoNLL'12:1466-1477, 2012 16.2 Các cơng trình khoa học liên quan tới nội dung đề tài nhóm thực đề tài [HNNL11] Hà Quang Thụy, Nguyễn Ngọc Hóa, Nguyễn Viết Thế, Lương Nguyễn Hồng Hoa (2011) Mơ hình giải pháp lọc nội dung hỗ trợ quản lý đảm bảo an toàn – an ninh Internet , Chun san cơng trình nghiên cứu, phát triển ứng dụng CNTT & Truyền thông, V-1 (6/26): 260270, 9-2011 [DMTQ11] Duc-Trong Le, Mai-Vu Tran, Tri-Thanh Nguyen, Quang-Thuy Ha (2011) Coreference Resolution in Vietnamese Documents Based on Support Vector Machines, IALP 2011: 8993, Penang, Malaysia [HMNNQ11] Hoang-Quynh Le, Mai-Vu Tran, Nhat-Nam Bui, Nguyen-Cuong Phan, Quang-Thuy Ha (2011) An Integrated Approach Using Conditional Random Fields for Named Entity Recognition 24 10 11 12 13 14 15 and Person Property Extraction in Vietnamese Text, IALP 2011 :115-118, Penang, Malaysia [HTMQ11] Huyen-Trang Pham, Tien-Thanh Vu, Mai-Vu Tran, Quang-Thuy Ha (2011) A Solution for Grouping Vietnamese Synonym Feature Words in Product Reviews, IEEE APSCC’2011: 503-508, Jeju, Korea [MMSMX12] Mai-Vu Tran, Minh-Hoang Nguyen, Sy-Quan Nguyen, Minh-Tien Nguyen, XuanHieu Phan (2012) VnLoc: A Real–time News Event Extraction Framework for Vietnamese, KSE'2012:161-166, Da Nang, August 17-19, 2012 [MTTH10] Mai-Vu Tran, Tien-Tung Nguyen, Thanh-Son Nguyen, Hoang-Quynh Le (2010) Automatic Named Entity Set Expansion Using Semantic Rules and Wrappers for Unary Relations, IALP 2010: 170-173, Harbin, Heilongjiang China; December 28-30, 2010 [MXH10] Mai-Vu Tran, Xuan-Tu Tran, Huy-Long Uong (2010) "User Interest Analysis with Hidden Topic in News Recommendation System, IALP 2010: 211-214, Harbin, Heilongjiang China; December 28-30, 2010 [NKQ10] Nam-Khanh Tran, Kim-Cuong Pham, Quang-Thuy Ha (2010) XPath-Wrapper Induction for Data Extraction, IALP 2010 (Harbin, Heilongjiang China; December 28-30, 2010): 150153 [NNH09] Huong-Thao Nguyen, Phuong-Thai Nguyen, Quang-Thuy Ha, and Le-Minh Nguyen (2009) Vietnam Noun Phrase Chunking based on Conditional Random Field, The First International Conference on Knowledge and System Engineering (KSE): 172-178, Hanoi, Vietnam, 2009 [OCT09] Tran Thi Oanh, Le Anh Cuong, Ha Quang Thuy and Quynh Hoang Le (2009) An Experimental Study on Vietnamese POS tagging, International Conference on Asian Language Processing (IALP 2009): 23-27, Dec 7-9, 2009, Singapore [PNLLS11] Xuan-Hieu Phan, Cam-Tu Nguyen, Dieu-Thu Le, Le-Minh Nguyen, Susumu Horiguchi, and Quang-Thuy Ha (2011) A Hidden Topic-Based Framework Towards Building Applications with Short Web Documents, IEEE Transactions on Knowledge and Data Engineering, 23(7): 961-976, July 2011 (SCI Journal) [QTH11] Quang-Thuy Ha, Tien-Thanh Vu, Huyen-Trang Pham, Cong-To Luu (2011) An Upgrading Feature-based Opinion Mining Model on Product Reviews in Vietnamese, AMT’2011: 173185, Lanzhou, China [QTTT12] Quang-Thuy Ha, Thi-Oanh Ha, Thi-Dung Nguyen, Thuy-Linh Nguyen (2012) Refining the Judgement Threshold to Improve Recognizing Textual Entailment Using Similarity, ICCCI 2012, Ho Chi Minh City, Vietnam, November, 2012 (accepted) [TD11] Tien-Thanh Vu, Dat Quoc Nguyen (2011) A Vietnamese Information Retrieval System for Product-Price, GrC 2011: 691-696, HKaoh-siung, Taiwan [THC11] Tien-Thanh Vu, Huyen-Trang Pham, Cong-To Luu, Quang-Thuy Ha (2011) A Featurebased Opinion Mining Model on Product Reviews in Vietnamese, Studies in Computational Intelligence, SCI 381 (Semantic Methods for Knowledge Management and Communication): 23-33 25 16 17 18 19 20 21 [TLH10] Tran Thi Oanh, Le Anh Cuong, Ha Quang Thuy (2010) Improving Vietnamese Word Segmentation and POS Tagging using MEM with Various Kinds of Resources, Journal of Natural Language Processing, 17 (3):41-60, 2010 [TLQ12] Thi-Ngan Pham, Le-Minh Nguyen, Quang-Thuy Ha (2012) Named Entity Recognition for Vietnamese documents using semi-supervised learning method of CRFs with Generalized Expectation Criteria, IALP 2012, Ha Noi, Vietnam, November 13-15, 2012 (accepted) [TSQN12] Tien Thanh Vu, Shu Chang, Quang Thuy Ha, Nigel Collier (2012) An Experiment in Integrating Sentiment Features for Tech Stock Prediction in Twitter, Colling 2012 (being submitted) [TTT08] Dieu-Thu Le, Cam-Tu Nguyen, Quang-Thuy Ha, Xuan-Hieu Phan, and Susumu Horiguchi (2008) Matching and Ranking with Hidden Topics towards Online Contextual Advertising, The 2008 IEEE/WIC/ACM International Conference on Web Intelligence (WI-08): 888-891, Sydney, Australia [TTT09] Cam-Tu Nguyen, Xuan-Hieu Phan, Susumu Horiguchi, Thu-Trang Nguyen, Quang-Thuy Ha (2009) Web Search Clustering and Labeling with Hidden Topics, ACM Transactions on Asian Language Information Processing, 8(3), 12 (August 2009), 40 pages [VVU09] Vu Tran, Vinh Nguyen, Uyen Pham, Oanh Tran and Quang Thuy Ha (2009) An Experimental Study of Vietnamese Question Answering System, IALP 2009: 152-155, Dec 7-9, 2009, Singapore 26 ... hình chủ đề ẩn ứng dụng đề tài 20 15.2 Luận giải việc đặt mục tiêu nội dung cần nghiên cứu nhiệm vụ Như luận giải, tăng cường vốn xã hội quốc gia vai trò quan trọng mạng xã hội Đồng thời, phản... Thành, HVCH Lê Hoàng Quỳnh) thực nội dung hợp tác nghiên cứu phát triển kết nhóm GS Nigel Collier có liên quan tới chủ đề nghiên cứu nói c) Nghiên cứu Trung tâm nghiên cứu phân tích sống, ĐH Quản... trợ hoạt động nghiệp vụ 16 Liệt kê danh mục cơng trình nghiên cứu, tài liệu có liên quan đến đề tài trích dẫn đánh giá tổng quan 16.1 Các cơng trình khoa học liên quan tới nội dung đề tài tác giả