giải pháp biểu diễn và so sánh mức độ tương đồng giữa các hồ sơ cá nhân trên mạng xã hội

37 390 0
giải pháp biểu diễn và so sánh mức độ tương đồng giữa các hồ sơ cá nhân trên mạng xã hội

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

GIẢI PHÁP BIỂU DIỄN VÀ SO SÁNH MỨC ĐỘ TƢƠNG ĐỒNG GIỮA CÁC HỒ SƠ CÁ NHÂN TRÊN MẠNG XÃ HỘI GVHD: TS. Phạm Trần Vũ HVTH: Đỗ Quốc Bảo Kết quả thực nghiệm, đánh giá 4 Nội dung Đặt vấn đề, lý do, tổng quan, mục tiêu 1 Giới thiệu hồ sơ cá nhân, so sánh độ tương đồng 2 Quy trình thực hiện 3 Kết luận, hướng phát triển 5 Slide 1  Từ sự thành công và phát triển của các mạng xã hội như: Facebook, Linkedin, Youtube  Cộng đồng online này đã tạo ra số lượng lớn các tài liệu số trên web  Cộng đồng này thuộc đa ngành nghề và cách trở về mặt địa lý Đặt vấn đề 3 Slide 2  Việc tìm những người có cùng sở thích, cùng mối quan tâm là không dễ dàng  Nhu cầu giao lưu, giải trí, kết bạn là khá lớn và thiết thực trong đời sống xã hội hiện tại  Các hệ thống thông minh cung cấp các thông tin, dịch vụ phù hợp nhất cho con người là xu hướng của xã hội hiện đại Đặt vấn đề - lý do 4 Slide 3  Thế giới • “Using Profile Matching and Text Categorization for Answer Extraction in TREC Genomics”, Haiqing Zheng và cộng sự, Department of Computer Science and Engineering, Fudan Univerisity, China. Linear Least Squares Fit, Logistic Regression, SVM. Đặt vấn đề - tổng quan 5 Slide 4  Thế giới • “Profile-Matching Techniques for On-Demand Software Management in Sensor Networks”, Falko Dressler và cộng sự, Department of Computer Science, University of Erlangen, Germany. Học máy tạo bộ dữ liệu đặc trưng mẫu Đặt vấn đề - tổng quan 6 Slide 5  Trong nước • “Một mô hình tạo lớp học thích nghi trong đào tạo điện tử”, Nguyễn Việt Anh, khoa Công nghệ thông tin, trường Đại học Công Nghệ, Đại học Quốc gia Hà Nội. Sử dụng mạng xác suất Bayes, đánh giá kiến thức người học, sử dụng cơ chế thích nghi để phân tích, so sánh sự khác nhau về tiến trình học. Đặt vấn đề - tổng quan 7 Slide 6  Trong nước • “Dynamic Profile Representation and Matching in Distributed Science Networks”, Phạm Trần Vũ, Trường Đại học Bách Khoa, Đại học Quốc gia TP.HCM. So trùng các hồ sơ dựa trên các phân tích về mặt ngữ nghĩa (LSA), có khả năng thực hiện các so sánh liên quan đến ngữ nghĩa, dựa vào các phương pháp thống kê. Đặt vấn đề - tổng quan 8 Slide 7  Với mục tiêu: • Xây dựng giải pháp biểu diễn hồ sơ cá nhân người sử dụng từ các thông tin trên mạng xã hội. • Xây dựng giải pháp đánh giá mức độ tương đồng giữa các hồ sơ cá nhân. Đặt vấn đề - mục tiêu 9 Slide 8  Hồ sơ cá nhân là một tập hợp gồm những thông tin của một cá nhân. Tùy theo lĩnh vực ứng dụng cụ thể, hồ sơ cá nhân sẽ có những thông tin khác nhau phù hợp cho miền ứng dụng đó, chẳng hạn: • Hồ sơ cá nhân trong hệ thống bán hàng qua mạng • Hồ sơ cá nhân trong hệ thống e - Learning Giới thiệu hồ sơ cá nhân 10 Slide 9 [...]... (LDA), phương án được đánh giá khả thi và hiệu quả, tập trung vào việc bổ sung các thành phần ngữ nghĩa hỗ trợ cho độ đo tương đồng Cosine Slide 17 18 Quy trình so sánh hồ sơ cá nhân  Qua tìm hiểu nghiên cứu, tác giả rút ra quy trình so sánh mức độ tương đồng cho các hồ sơ cá nhân: Slide 18 19 Quy trình so sánh hồ sơ cá nhân Slide 19 20 Quy trình so sánh hồ sơ cá nhân Slide 20 21 Quy trình chi tiết –... thập hồ sơ cá nhân Slide 28 29 Kết quả thực nghiệm  Hình ảnh đặc trưng một số thuộc tính (sự phân phối kết hợp giữa các từ) Slide 29 30 Kết quả thực nghiệm  Kết quả bắt cặp so sánh mức độ tương đồng giữa các hồ sơ khảo sát được bằng quan sát và khi thực hiện trên hệ thống Slide 30 31 Kết quả thực nghiệm  Hình ảnh so sánh mức độ tương đồng giữa các hồ sơ Slide 31 32 Nhận xét  Nhận xét: • Xét thấy trên. .. diễn profile người sử dụng theo một cấu trúc Xây dựng giải pháp đánh giá mức độ tương đồng giữa các profile  Việc thu thập hồ sơ cá nhân là tĩnh, biểu diễn thông tin hồ sơ dưới dạng vector bao gồm các vector con  Xây dựng các đặc trưng thuộc tính hồ sơ dựa trên các nghiên cứu về phân tích chủ đề ẩn (LDA)  Kết hợp độ đo tương đồng Cosine với phân tích chủ đề ẩn giúp hạn chế trường hợp liên quan đến... tìm ra mối quan hệ giữa các từ: Wordnet, Brown Corpus, Penn TreeBank… • Tính độ tương đồng sử dụng độ đo Cosine • Tính độ tương đồng dựa vào độ đo khoảng cách Euclide • Tính độ tương đồng dựa vào độ đo khoảng cách Mahattan Slide 16 17 Phƣơng pháp tính độ tƣơng đồng đƣợc chọn  Sử dụng độ đo Cosine, tuy nhiên Cosine tính toán hạn chế khi cần xét đến yếu tố ngữ nghĩa, hay ngữ nghĩa tương tự được bỏ qua... Rất khó để đo sự tương đồng, sự tương đồng là một đại lượng (con số) phản ánh cường độ của mối quan hệ giữa hai đối tượng hoặc hai đặc trưng Đại lượng này thường ở trong phạm vi từ -1 đến 1 hoặc 0 đến 1 • Ví dụ: Hàm S(di,dj) được gọi là độ đo sự tương đồng giữa 2 văn bản di và dj Slide 15 16 Các phƣơng pháp tính độ tƣơng đồng  Các phương pháp tính độ tương đồng • Phương pháp sử dụng các tập dữ liệu... nét tiêu biểu của người dùng hệ thống (Individual traits) Slide 12 13 Cấu trúc hồ sơ cá nhân Lê Đức Long  Cấu trúc hồ sơ cá nhân cho hệ thống đào tạo trực tuyến của Lê Đức Long và cộng sự Slide 13 14 Cấu trúc hồ sơ cá nhân tác giả đề xuất  Qua nghiên cứu tìm hiểu, tác giả đề xuất một mô hình cấu trúc hồ sơ cá nhân Slide 14 15 Giới thiệu độ tƣơng đồng • Trong toán học, một độ đo là một hàm số tương ứng... thiệu hồ sơ cá nhân  Để xây dựng được hồ sơ cá nhân tốt cho hệ thống thì cần phải xác định được những đặc trưng nào của người dùng sẽ cần thiết, hữu ích cho hệ thống Chẳng hạn: • Trong e- Commerce, các đặc trưng của hồ sơ cá nhân về sở thích là quan trọng nhất • Trong e-Learning thì các đặc trưng liên quan đến trình độ học tập, kiến thức nền mới là quan trọng nhất Slide 10 11 Cấu trúc hồ sơ cá nhân. .. nhánh đề tài “Xử lý văn bản tiếng Việt”, GS Hồ Tú Bảo chủ trì) Slide 24 25 Quy trình chi tiết – các bƣớc tiền xử lý  Loại bỏ dấu câu, từ dừng • Loại bỏ các dấu câu: ( , “ ” ~ ! @# $ % ^ & * ( ) - + =|\{ }[]„?/> . mục tiêu: • Xây dựng giải pháp biểu diễn hồ sơ cá nhân người sử dụng từ các thông tin trên mạng xã hội. • Xây dựng giải pháp đánh giá mức độ tương đồng giữa các hồ sơ cá nhân. Đặt vấn. giả rút ra quy trình so sánh mức độ tương đồng cho các hồ sơ cá nhân: Quy trình so sánh hồ sơ cá nhân 19 Slide 18 Quy trình so sánh hồ sơ cá nhân 20 Slide 19 . GIẢI PHÁP BIỂU DIỄN VÀ SO SÁNH MỨC ĐỘ TƢƠNG ĐỒNG GIỮA CÁC HỒ SƠ CÁ NHÂN TRÊN MẠNG XÃ HỘI GVHD: TS. Phạm Trần Vũ HVTH: Đỗ Quốc

Ngày đăng: 27/11/2014, 08:06

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan