ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM Độc lập - Tự - Hạnh phúc *********** THÔNG TIN VỀ LUẬN VĂN THẠC SĨ Họ tên học viên: Trịnh Việt Dũng Giới tính: Nam Ngày sinh: 31/12/1981 Nơi sinh: Hà Nội Quyết định công nhận học viên số: 857/QĐ-ĐT, ngày 29 tháng 10 năm 2012 Các thay đổi trình đào tạo: Tên đề tài luận văn: Xây dựng hệ thống khảo duyệt Web phân tán thu thập liệu phục vụ hệ hỗ trợ định Chuyên ngành: Truyền liệu Mạng máy tính Mã số: Chương trình đào tạo thí điểm 10 Cán hướng dẫn khoa học: TS Nguyễn Đại Thọ 11 Tóm tắt kết luận văn: - Luận văn tìm giải pháp cho việc xây dựng hệ thống khảo duyệt thu thập liệu từ Website (Web Crawler) mạng xã hội Twitter (Twitter Crawler) - Thiết kế, xây dựng hệ thống theo giải pháp chọn thông qua việc nghiên cứu hệ thống thu thập liệu trình bày khoa học công cụ triển khai thực tế - Đưa hướng phát triển để nâng cấp hệ thống giúp hệ thống vận hành hiệu hơn, có khả mở rộng cao 12 Khả ứng dụng thực tiễn: - Hệ thống khảo duyệt Web thu thập liệu sử dụng hệ thống máy tìm kiếm, hệ thống phân tích, làm sở cho hệ hỗ trợ định - Hệ thống sử dụng để xây dựng dịch vụ tìm kiếm ngữ nghĩa, phân loại phân cụm liệu, phân tích, trực quan hoá liệu, đồng thời triển khai tới quan, doanh nghiệp Hàn Quốc Nhật Bản 13 Những hướng nghiên cứu tiếp theo: - Web Crawler: hỗ trợ giao thức FTP cho hệ thống thu thập liệu web - Twitter Crawler: tìm giải pháp cho việc thu thập đủ liệu tweet - MongoDB: triển khai replica set cho hệ thống lưu trữ liệu 14 Các công trình công bố có liên quan đến luận văn: Ngày 22 tháng 10 năm 2015 Xác nhận cán hướng dẫn (Kí ghi rõ họ tên) Ngày 22 tháng 10 năm 2015 Học viên (Kí ghi rõ họ tên) Nguyễn Đại Thọ Trịnh Việt Dũng VIETNAM NATIONAL UNIVERSITY, HANOI UNIVERSITY OF TECHNOLOGY AND ENGINEERING SOCIALIST REPUBLIC OF VIETNAM Independence – Freedom – Happiness *********** INFORMATION ON MASTER’S THESIS Full name: Trinh Viet Dung Sex: Male Date of birth: 31/12/1981 Place of birth: Hanoi Admission decision number: 857/QĐ-ĐT Dated: 29/10/2012 Changes in academic process: Official thesis title: Design distributed Web Crawling System to Support Decision Management Systems Major: Data Communication and Computer Networks Code: 10 Supervisors: Dr Nguyen Dai Tho 11 Summary of the findings of the thesis: - The thesis states a solution to design distributed Web Crawling system (named Web Cralwer) It specifies a solution to design distributed Twitter Social Network crawling as well (named Twitter Crawler) - Design and implement following by the selected solution - Deploy and evaluate the Web Crawling system - Introduce next step to improve current system 12 Practical applicability, if any: - The system could become a main component in search engine, analysis system and it could be considered as fundamental for decision management system - This system works with other systems implemented by Saltlux such as synmantic search, classification and clustering, analysis, and visualization for providing certain services It also is deployed to companies, enterprises in South Korea and Japan 13 Further research directions, if any: - Web Crawler: support FTP protocol - Twitter Crawler: find new solution to get full of tweet - MongoDB: implement replica set in database 14 Thesis-related publications: (List them in chronological order) Date: 22/10/2015 Date: 22/10/2015 Signature: ………………… Signature: ………………… Full name: Dr Nguyen Dai Tho Full name: Trinh Viet Dung Note: “Information on Master’s Thesis” must be processed on Microsoft Word, font Unicode Times New Roman, letter size 13 “Summary of the findings of the thesis” should be one-A4 page long