Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 47 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
47
Dung lượng
0,92 MB
Nội dung
ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ Nguyễn Sỹ Quân DỰ ĐOÁN LIÊN KẾT ÂM, LIÊN KẾT DƯƠNG TRONG MẠNG XÃ HỘI KHOÁ LUẬN TỐT NGHIỆP ĐẠI HỌC HỆ CHÍNH QUY Ngành: Cơng nghệ thơng tin HÀ NỘI - 2012 ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CƠNG NGHỆ Nguyễn Sỹ Qn DỰ ĐỐN LIÊN KẾT ÂM, LIÊN KẾT DƯƠNG TRONG MẠNG XÃ HỘI KHỐ LUẬN TỐT NGHIỆP ĐẠI HỌC HỆ CHÍNH QUY Ngành: Công nghệ thông tin Cán hướng dẫn: PGS TS Hà Quang Thụy Cán đồng hướng dẫn: ThS Nguyễn Tuấn Quang HÀ NỘI - 2012 LỜI CẢM ƠN Trước tiên, xin gửi lời cảm ơn chân thành lòng biết ơn sâu sắc tới PGS TS Hà Quang Thụy, Th.S.Nguyễn Tuấn Quang, người hướng dẫn bảo tận tình cho tơi suốt q trình thực khóa luận tốt nghiệp Tơi xin chân thành cảm ơn thầy cô, cán trường Đại học Công nghệ - Đại học Quốc gia Hà Nội tạo cho điều kiện thuận lợi suốt trình học tập nghiên cứu Tôi xin gửi lời cảm ơn tới thầy cơ, anh chị bạn Phịng thí nghiệm KT-LAB bảo giúp đỡ tơi nhiều kiến thức chuyên môn kỹ nghiên cứu để tơi hồn thành tốt khóa luận tốt nghiệp Cuối cùng, muốn gửi lời cảm ơn tới gia đình, bạn bè, người thân người ln bên cung động viên tơi suốt q trình học tập, nghiên cứu thực khóa luận tốt nghiệp Tôi xin chân thành cảm ơn! Hà Nội, ngày 23 tháng năm 2012 Sinh viên Nguyễn Sỹ Quân DỰ ĐOÁN LIÊN KẾT ÂM, LIÊN KẾT DƯƠNG TRONG MẠNG XÃ HỘI Nguyễn Sỹ Qn Khóa QHI-2008-I/CQ , ngành Cơng nghệ Thơng tin Tóm tắt Khóa luận tốt nghiệp: Bài tốn dự đốn liên kết mạng có cấu trúc phức tạp nhận nhiều quan tâm nhà khoa học lĩnh vực vật lý, khoa học máy tính truyền thơng… Đặc biệt lĩnh vực khoa học máy tính truyền thơng , tốn dự đoán liên kết toán quan trọng có ý nghĩa thực tiễn Nó giúp cho việc xác định thông tin bị thiếu, bị mất, xác định tương tác giả mạo hay giúp đánh giá chế mở rộng mạng Bài toán dự đoán liên kết toán tốn phân tích mạng xã hội Trong khóa luận này, chúng tơi tập trung nghiên cứu phương pháp dự đoán mối quan hệ mạng xã hội trình bày mơ hình mơ hình dự đốn liên kết âm dương kết hợp với việc sử dụng đặc trưng tính cá nhân để nâng cao kết cho q trình dự đốn Từ khóa: predict links, ties strength, social network LỜI CAM ĐOAN Tất báo, khóa luận, tài liệu, công cụ phần mềm tác giả khác sử dụng lại khóa luận dẫn tường minh tác giả có danh sách tài liệu tham khảo Tất báo, khóa luận, tài liệu, cơng cụ phần mềm tác giả khác sử dụng lại khóa luận dẫn tường minh tác giả có danh sách tài liệu tham khảo Hà Nội, ngày 23 tháng năm 2012 Sinh viên Nguyễn Sỹ Quân Mục lục Mục lục CHƯƠNG 1: BÀI TOÁN DỰ ĐOÁN LIÊN KẾT ÂM, LIÊN KẾT DƯƠNG TRONG MẠNG XÃ HỘI 1.1 Bài toán dự đoán liên kết mạng xã hội 1.1.1 Dự đoán liên kết mạng xã hội 1.1.2 Liên kết mạng xã hội 1.2 Bài toán dự đoán liên kết âm liên kết dương mạng xã hội 1.3 Kết luận chương CHƯƠNG 2: CÁC PHƯƠNG PHÁP DỰ ĐOÁN LIÊN KẾT TRONG MẠNG XÃ HỘI 2.1 Phát biểu toán dự đoán liên kết âm, liên kết dương 2.2 Các thuật toán dự đoán liên kết dựa vào độ tương đồng 2.2.1 Các độ tương đồng cục 2.2.2 Các độ tương đồng toàn cục 12 2.3 Các mơ hình xác suất 15 2.3.1 Mơ hình quan hệ xác suất 15 2.3.2 Mơ hình quan hệ thực thể xác suất 17 2.4 Kết luận chương 18 CHƯƠNG 3: MƠ HÌNH DỰ ĐỐN LIÊN KẾT ÂM, LIÊN KẾT DƯƠNG TRONG MẠNG XÃ HỘI 19 3.1 Lý thuyết cân cấu trúc 19 3.1.1 Cân cấu trúc 19 3.1.2 Đặc điểm cấu trúc mạng cân 22 3.2 Lý thuyết trạng thái 25 3.3 Tính cá nhân mạng xã hội 26 3.4 Mơ hình dự đoán liên kết âm, liên kết dương mạng xã hội 27 3.4.1 Đặc trưng mơ hình 27 3.4.2 Phương pháp 28 3.5 Kết luận chương 29 CHƯƠNG 4: THỰC NGHIỆM VÀ ĐÁNH GIÁ 30 4.1 Dữ liệu thực nghiệm 30 4.2 Môi trường thực nghiệm 31 4.3 Các công cụ phần mềm 31 4.4 Kết đánh giá 32 4.5 Kết luận chương 34 KẾT LUẬN VÀ PHƯƠNG HƯỚNG 35 DANH SÁCH CÁC HÌNH VẼ Hình Ví dụ mạng xã hội Hình Mạng xã hội Epinions Hình Mạng liên minh châu Âu thời kỳ 1872 - 1907 Hình Bài toán dự đoán dấu cung đồ thị Hình Khả hình thành mối quan hệ có bạn chung 10 Hình Cân cấu trúc không cân cấu trúc 20 Hình Ví dụ cấu trúc cân 22 Hình 8.Tính chất cân cấu trúc 23 Hình Mơ hình cân cấu trúc mơ hình trạng thái 26 Hình 10 Các tam giác quan hệ đồ thị vô hướng 27 Hình 11 Các tam giác quan hệ đồ thị có hướng 28 Hình 12 Dự đoán liên kết dựa vào đặc trưng 29 Hình 13 Minh họa liệu đồ thị gán nhãn cung 31 Hình 14 Biểu đồ kết thực nghiệm 34 DANH SÁCH CÁC BẢNG Bảng Môi trường thực nghiệm 31 Bảng Công cụ phần mềm 32 Bảng 3: Độ xác phân lớp dự đoán 33 DANH SÁCH CÁC TỪ VIẾT TẮT CN Common Neighbour AUC Area Under the Curve PRM Probability Relation Model PERM Probability Entity Relation Model RBNs Relation Bayes Networks RDNs Relation Dependence Networks HPI Hub Promoted Index HDI Hub Depressed Index LHN1 Leicht-Holm-Newman Index (local) LHN2 Leicht-Holm-Newman Index (global) PA Preferential Attachment AA Adamic-Adar Index RA Resource Allocation ACT Average Commute Time RWR Random Walk with Restart nhau, người X kẻ thù người Y (Xem sơ đ minh họa i k đồ hình 5.3) Hình 8.Tính ch cân cấu trúc[7] chất Bạn kiểm tra m mạng cân bằng: tam giác bao ng t gồm toàn nhóm có ba nhãn +, tam giác v hai người t t với nhóm người nhóm cịn lại có xác nhãn + i Vì vậy, mơ tả hai cách để đạt cấu trúc cân bằng: ho tất c ng: người thích nhau; giới bao gồm hai nhóm bạn bè v đối lập c th n với hồn tồn nhóm Thự tế đáng ngạc nhiên là: cách nh để có ực ây mạng cân Chúng ta trình bày rõ ràng thực tế định lý cân b ng nh bằng, cung cấp Frank Harary năm 1953: i n Định lý cân bằng: đồ thị đầy đủ có gán nhãn cân bằng, ho tất ng, cặp đỉnh bạn, hoạc đỉnh phân thành hai nhóm X Y, n, ho cặp đỉnh X thích nhau, cặp đ nh đỉnh Y thích nhau, người X kẻ thù người Y i k Định lý cân tất thực tế rõ ràng, “nor should it be initially ng ph clear why it is true” Về bả nói tính chất hồn tồn c bộ, ản, t cục tính chất cân cấu trúc, để áp dụng cho ba đỉnh thời diểm, cho u đ i di thấy bao hàm tính chất toàn cầu mạnh mẽ: tất mọ người t ch ọi giới nhóm ho giới bị chia thành hai phe phái đ lập t đối Chúng ta cho thấy nhận định thực tế nh th 23 Chứng định lý cân bằng: chứng minh định lý yêu cầu chứng: giả sử có đồ thị đầy đủ gán nhãn tùy ý, giả sử cân bằng, kết luận tất người bạn, có tập X Y mơ tả yêu cầu Nhớ rằng, làm việc thông qua chứng chương tốt, sử dụng giả định đơn giản “triadic closure” mạng xã hội để kết luận tất bridge cục mạng phải mối quan hệ yếu Bằng chứng dài chút, tự nhiên không phức tạp – sử dụng trực tiếp định nghĩa cân để có kết luận định lý Để bắt đầu, giả sử có đồ thị đầy đủ gán nhãn, tất biết cân Chúng ta phải hiển thị có cấu trúc định lý Nếu khơng có cung tiêu cực, người bạn “we’re all set” Nếu khơng, có cung tiêu cực, cách cần phải đến với phận đỉnh tập X Y, với đối lập hoàn toàn chúng Khó khăn là, biết đồ thị nó cân bằng, không rõ ràng để giả thiết làm xác định X Y Chọn đỉnh mạng – gọi A – xem xét thứ từ quan điểm A Mọi đỉnh khác bạn A kẻ thù A Do đó, cách tự nhiên, ứng viên vào tập X Y: xác định tập X A tất bạn nó, xác định Y tất kẻ thù A Vì vậy, đỉnh bạn A kẻ thù A Nhớ lại cần hiển thị hai tập X Y để thỏa mãn điều kiện yêu cầu: (i) Mỗi hai đỉnh X bạn (ii) Mỗi hai đỉnh Y bạn (iii) Mỗi đỉnh X kẻ thù đỉnh Y Lập luận điều kiện thực tế cho lựa chọn X Y Điều có nghĩa X Y thỏa mã điều kiện yêu cầu hoàn thành việc chứng minh Phần lại đối số, chứng minh (i), (ii) (iii), minh họa sơ đồ hình 5.4 Đối với (i), biết A bạn với tất đỉnh khác X Làm để hai đỉnh khác X (gọi chúng B C) – phải bạn? Chúng ta biết A bạn với B C, B C kẻ thù A, B C tạo thành tam giác với hai nhãn + => vi phạm điều kiện cân Từ biết mạng cân bằng, điều xảy ra, thực tế B C phải 24 bạn B C là tên hai đỉnh X, kết luận rằng, hai đỉnh X bạn Chúng ta thử đối số loại (ii) Xem xét hai đỉnh Y (gọi chúng D E) – chúng phải bạn Chúng ta biết A kẻ thù hai D E, D E kẻ thù nhau, A, D E tạo thành tam giác khơng có nhãn + => điều vi phạm điều kiện cân Do vậy, thực tế, D E phải bạn Vì D E tên hai đỉnh Y, kết luận hai đỉnh Y bạn Cuối cùng, chứng minh điều kiện (iii) Theo kiểu đối số (i) (ii), coi đỉnh X (gọi B) đỉnh Y(gọi D) – phải kẻ thù Chúng ta biết A bạn B kẻ thù D, B D bạn A, B D tạo thành tam giác có hai nhãn + => vi phạm điều kiện cân Vì vậy, thực tế B D phải kẻ thù nhau.Vì B D tên đỉnh X đỉnh Y nên kết luân cặp là cặp kẻ thù Vì vậy, kết luận, giả sử mạng cân bằng, mô tả phận đỉnh hai tập X Y, kiểm tra điều kiện (i), (ii) (iii) Điều làm cho định lý cân chứng minh 3.2 Lý thuyết trạng thái Lý thuyết trạng thái cách tiếp cân khác để dự đoán liên kết mạng xã hội Lý thuyết trạng thái phát biểu sau: “Một liên kết dương từ A đến B có nghĩa B bạn A, B có trạng thái cao A Tương tự liên kết âm từ A đến đến B có nghĩa B kẻ thù A có nghĩa B có trạng thái thấp A.”[6] Với lý thuyết cân cấu trúc lý thuyết trạng thái, việc dự đoán cung liên kết cho kết khác (Hình 9) 25 Hình Mơ hình cân b cấu trúc mơ hình trạng thái ng 3.3 Tính cá nhân m mạng xã hội Để dự đoán liên kết âm liên kết dương mạng xã hội c t k i dùng độ đo tính cá nhân Tính cá nhân người thể tính cách, cách c n suy nghĩ, tương tác với người khác mạng xã hội Dựa vào tính cách i ngư a nhìn thấy khả kết nối người, tương tác gi người ng người hay người nhóm người mạng i ngư Tính cá nhân mạng xã hội biểu diễn thơng qua mơ hình “Big Five” ng h n – năm tính cách cá nhân tiêu bi sau[26]: m biểu • Tính mở (sự cởi mở, thẳng thắn, chân thật): Tị mị, thơng minh, giàu trí im t): tưởng tưởng Những người có số "tính mở" cao thường nh ng Nh ng người có xu hướ nghệ thuật đạt nhiều kỹ vi đánh ớng ng việc giá, đưa ý tưởng t • Tính lương tâm (ngay thẳng): Có trách nhiệm, có tổ chức kiên trì ng th c cơng việc Những người có số điểm lương tâm cao th c Nh ng thường đáng tin cậy, có thành tích cao, ch hay đưa k hoạch y, chăm a kế • Tính hướng ngoạ Hướng ngoại, động, đoán Thân thi ại: oán thiện động, người mang tính cách hướng ngoại thường l cảm ng ng ng lấy hứng làm việc từ hoạt động xã hội • Tính hịa đồng (tính dễ chịu, dễ thích ứng với mơi trường): Hòa đồng ng d ng): với người, dễ thích ứng cộng tác với người xung quanh Nh i, d i Những người mang tính cách thích hợp với cơng việc hịa giải, đem lại i h ,đ lạc quan tin tưởng cho người khác ng ng • Tính nhạy cảm ( nhạy cảm thần kinh, dễ kích động hay nổ nóng ): m nh ổi Nhạy cảm, dễ lo lắng, buồn rầu, căng thẳng, dễ mắc vào tiêu c l c cực 26 Ứng dụng "Big Five": a • Trong giáo dục ( Phát huy ưu điểm sinh viên, ví dụ: Chia nhóm c có hỗ trợ nhiều tính cách) a nhi • Quảng cáo: Trong bối cảnh quảng cáo tiếp thị, Big Five đ dự ng b , đốn xác sở thích người tiêu dùng cho thương hi quốc oán m ương hiệu gia thương hiệu độc lập Các nghiên cứu cho th ương hi thấy tương lai đầy hẹn cho tích hợp phân tính cá nhân h sơ ứa a hồ người tiêu dùng i • Trong tương tác người máy: Mỗi giao diện thiết kế phù h cho ng ng hợp tính cách để đạt hiệu cao công việc (môi trường chuyên ể ng nghiệp) 3.4 Mơ hình dự đốn liên kết âm, liên kết dương m oán k ng mạng xã hội Phần xây dựng mơ hình dự đốn liên kết dựa ti d a tiếp cận học máy Để xây dự mơ hình cần xác định đặc trưng ựng nh mơ hình phương pháp học mơ hình Tiếp theo vào chi ti ng h tiết phần mơ hình 3.4.1 Đặc trưng mơ hình a Dựa vào tiếp cận học máy, cần định nghĩa đặc trư cho mơ nh c trưng hình Các đặc trưng chia làm hai lớp Lớp thứ dựa vào nhãn c c l a cung, đặc trưng mô tả quan hệ đỉnh đồ thị v đỉnh n t với khác Lớp thứ dựa nguyên lý xã hội, hiểu m quan hệ a h t mối u v dựa vào đối tượng trung gian w Ví dụ, có liên k it kết dương đến u v có khả liên kết u v hình thành cao ả t Đặc trưng lớp thứ dựa số liên kết xuất phát từ đỉnh v số ା ି liên kết đến đỉnh v Chúng ta kí hiệu ݀ ሺݒሻ ݀ ሺݒሻ, cho liên kết dương âm hi ương ା ି vào v Tương tự ta có ݀௨௧ ሺݒሻ ݀௨௧ ሺݒሻ cho liên kết dương âm t đỉnh v ሻ ng từ a thuyết Lớp đặc trưng thứ hai đư mô tả tam giác quan hệ dựa vào lý thuy cân cấu trúc lý thuyết trạng thái Với đồ thị vơ hướng có lo c thuy ng loại tam giác(Hình 10) Với đồ thị có hướng số tam giác 16(Hình 11) Hình 10 Các tam giác quan hệ đồ thị vơ hướng h 27 Hình 11 Các tam giác quan hệ đồ thị có hướng[6] h [6] Đặc trưng đượ sử dụng vào mơ hình dự đoán đặc trưng ợc oán độ gắn kết đỉnh u v ký hiệu C(u,v) Đặc trưng biểu di cho số u diễn bạn chung hai đỉnh u v Đặc trưng đượ sử dụng mô hình đặc trưng tính cá nhân ợc hai người với Nếu hai người có liên kết với đặc u ng c điểm cá nhân họ giống khả Các đặc trưng tính cá nhân dựa vào mơ hình “Big ăng a Five” gồm năm tính cách cá nhân khác trình bày phần 3.3[26] m n 3.4.2 Phương pháp Trong phần s sử dụng phương pháp học máy hồi quy k n i kết đặc trưng mà mô tả phần cho phân lớp dự đoán liên k âm ã t kết liên kết dương Công thức hồi quy thể sau[6]: i ) ࡼሺ+|࢞ሻ = ାࢋష(࢈ శ∑ ࢈ ࢞ ) (27) Trong x vector đặc trưng (x1, x2, …, xn), b0, … bn tham số xác định từ ưng ( c liệu huấn luyện 28 Hình 12 Dự đốn liên kết dựa vào đặc trưng D 3.5 Kết luận chương Trong chương khóa luận trình bày mơ hình cho việc dự đoán liên k âm ng lu kết liên kết dương dựa vào lý thuy cân cấu trúc kết hợp với phương pháp h máy a thuyết ng học hồi quy Trong chương tiếp theo, tiến hành thực nghiệm đánh giá k p theo kết mơ hình trình bày để thấy tính xác mơ hình 29 CHƯƠNG 4: THỰC NGHIỆM VÀ ĐÁNH GIÁ Trong chương khóa luận trình bày số thực nghiệm để chứng minh tính đắn tính thực tiễn mơ hình Mơ hình thực nghiệm ba mạng xã hội Epions, Slashdot Zoo Wikipedia Dữ liệu mạng chuyển thành đồ thị kết đạt tương đối khả quan 4.1 Dữ liệu thực nghiệm Dữ liệu phần thực nghiệm ba mạng xã hội lớn với liên kết mạng gán nhãn âm dương Đó ba mạng Epinions, Slashdot Zoo Wikipedia Mạng Epinions: Wesite đánh giá sản phNm với cộng đồng người sử dụng tích cực Người dùng với thông qua tin cậy hay không tin cậy vào mạng, kết hợp việc đánh giá sản phNm người dùng đưa lên đánh giá người dùng Dữ liệu website thu thập từ năm 1999 đến tháng Tám năm 2003 Mạng Epinions chứa 119,217 đỉnh 841,000 cung, với 85% liên kết dương Trong có 80,668 người dùng có liên kết âm dương Mạng Slashdot Zoo: mạng tin tức công nghệ Năm 2002 Slashdot Zoo giới thiệu cho phép người dùng gán nhãn người dùng khác bạn hay kẻ thù Cách thức gán nhãn cho cung tương tự với mạng Epinions, quan hệ bạn bè có nghĩa người dùng thích hay có bình luận tốt người dùng khác, quan hệ kẻ thù có nghĩa người dùng khơng thích có bình luận khơng tốt người dùng khác Dữ liệu mạng Slashdot thu thập từ tháng Hai năm 2009 với 82,144 người dùng 549,202 cung với 77.4% liên kết dương Mạng Wikipedia: mạng từ điển bách khoa toàn thư với cộng đồng người dùng hoạt động tích cực Mạng Wikipedia cho phép người dùng bỏ phiếu tín nhiệm với người dùng khác cho vị trị quản trị viên Nếu người dùng đồng ý cho việc người dùng khác làm quản trị viên liên kết liên kết dương ngược lại với liên kết âm Theo thống kê mạng Wikipedia 7,115 người dùng tham gia bỏ phiếu có 103,689 phiếu tín nhiệm đưa có 78,7 % liên kết liên kết dương Dữ liệu biểu diễn dạng đồ thị file text với định dạng dòng cung gồm đỉnh xuất phát,đỉnh tới dấu của cung đó.Các dịng có ký tự # dịng ghi Hình 12 mơ tả cấu trúc file text: 30 Hình 13 Minh họa liệu đồ thị gán nhãn cung h c 4.2 Môi trường thực nghiệm c Thực nghiệm tiến hành môi trường phần sau: a ứng Bảng Môi trường thực nghiệm B Thành phần n Chỉ số Bộ vi xử lý (CPU) Intel Core Due 2.2 GHz Bộ nhớ (RAM) 4096 MB Ổ cứng (HDD) 320 GB Hệ điều hành (OS) Windows 7-64 bits 4.3 Các công cụ phần mềm n Trong phần thực nghiệm khóa luận sử dụng phần mềm thư viện sau đây: lu vi 31 Bảng Công cụ phần mềm STT Tên phần mềm Mô tả Bộ công cụ phân tích mạng xã hội SNAP Tác giả:Jure Leskovec http://snap.stanford.edu/snap/download.html Visual C++ 2010 Express Tác giả: Microsoft http://www.microsoft.com/visualstudio/enus/products/2010-editions/visual-cpp-express 4.4 Kết đánh giá Mơ hình đánh giá thơng qua độ đo AUC, độ đo AUC biểu diễn thông qua xác suất ngNu nhiên chọn liên kết bị cho số điểm cao xác suất chọn liên kết không tồn Tại lần chọn ngẫu nhiên liên kết bị liên kết khơng tồn để so sánh điểm số, có n′ lần liên kết bị có điểm số cao n′′ lần liên kết bị liên kết khơng tồn có điểm số, giá trị AUC hay độ xác tính sau: AUC = ᇲ ା.ହᇲᇲ (28) Trong thực nghiệm tiến hành hành chia liệu thành kiểm thử chéo theo phương pháp 10-folds, phần liệu training phần làm liệu test Kết đạt độ xác xấp xỉ 80%, kết khả quan (Bảng 3) 32 Bảng 3: Độ xác phân lớp dự đoán Epinions Slashdot Zoo Wikipedia Fold 83.33% 76.92% 80.00% Fold 78.57% 84.61% 81.48% Fold 92.30% 92.30% 92.30% Fold 63.15% 92.30% 75.00% Fold 78.57% 84.61% 81.48% Fold 71.42% 76.92% 74.06% Fold 85.71% 92.30% 88.88% Fold 84.61% 84.61% 84.61% Fold 66.67% 61.53% 64.00% Fold 10 80% 92.30% 85.71% Trung bình 78.43% 83.84% 80.75% 33 100 90 80 70 60 Epinions 50 Slashdot Zoo 40 Wikipedia 30 20 10 Fold Fold Fold Fold Fold Fold Fold Fold Fold Fold 10 Hình 14 Biểu đồ kết thực nghiệm 4.5 Kết luận chương Chương trình bày độ đo AUC để đánh giá phân lớp dự đoán liên kết âm liên kết dương việc thực nghiệm đánh giá kết phân lớp dự đoán liên kết âm liên kết dương Chương mô tả môi trường thực nghiệm, liệu đưa kết đánh giá cho thực nghiệm Kết đạt xấp xỉ 80%, kết cao việc dự đoán liên kết âm liên kết dương 34 KẾT LUẬN VÀ PHƯƠNG HƯỚNG Mạng xã hội toán dự đoán liên kết mạng xã hội vấn đề nhiều nhà nghiên cứu quan tâm Các toán dự đoán liên kết mạng xã hội áp dụng nhiều lĩnh vực đời sống kinh tế, trị, giáo dục, y tế khoa học cơng nghệ… Khóa luận mơ tả tổng quan tốn dự đoán liên kết âm liên kết dương mạng xã hội khái niệm liên quan, phương pháp để dự đoán liên kết mạng nói chung mạng xã hội nói riêng Khóa luận trọng trình bày lý thuyết cân cấu trúc lý thuyết trạng thái qua xây dựng đặc trưng cho toán dự đoán liên kết âm liên kết dương mạng xã hội Tiếp khóa luận trình bày phương pháp dự đoán liên kết âm liên kết dương mạng xã hội trình bày trình thực nghiệm đánh giá để thấy tính xác đắn mơ hình dự đốn liên kết âm liên kết dương Hướng nghiên cứu khóa luận tập trung mở rộng tập đặc trưng mơ hình dự đốn cách kết hợp tính cá nhân mạng xã hội để làm tăng độ xác cho mơ hình dự đốn liên kết âm liên kết dương mạng xã hội 35 TÀI LIỆU THAM KHẢO [1] C T Butts, “Network inference, error, and information (in)accuracy: A Bayesian approach”, Social Networks 25 (2003) 103 [2] C von Mering, R Krause, B Snel, M Cornell, S G Oliver, S Field, P Bork, “Comparative assessment of large-scale data sets of protein-protein interactions”, Nature 417 (2002) 399 [3] D Liben-Nowell and J Kleinberg, “The link-prediction problem for social networks” J Amer Soc Inf Sci and Tech.,58(7):1019–1031, 2007 [4] E Gilbert and K Karahalios, “Predicting Tie Strength with Social Media”, In Proc of CHI, 2009 [5] H Yu et al., “High-quality binary protein interaction map of the yeast interactome network”, Science 322 (2008) 104 [6] J Leskovec, D Huttenlocher, J Kleinberg, “Predicting Positive and Negative Links in Online Social Networks”, In Proceedings of WWW’2010, ACM Press, New York, 2010 [7] Jon Kleinberg, David Easley “Networks, Crowds, and Markets: Reasoning about a Highly Connected World” (2010) 47-83, 119-152 [8] L da F Costa, F A Rodrigues, G Travieso, P R U Boas, “Characterization of complex networks: A survey of measurements”, Adv Phys 56 (2007) 167 [9] L Schafer, J W Graham, Missing data: “Our view of the state of the art”, Psychol Methods (2002) 147 [10] Linyuan Lu, Tao Zhou, “Link Prediction in Complex Networks: A Survey”, Physica A 390 (2011) 1150-1170 [11] Mark Granovetter The strength of weak ties American Journal of Sociology, 78:1360{1380, 1973} [12] M E J Newman “The structure and function of complex networks” SIAM Review, 45:167–256, 2003 [13] M E J Newman, “Clustering and preferential attachment in growing networks”, Phys Rev E 64 (2001) 025102 [14] M E J Newman, “The Structure and Function of Complex Net works”, SIAM.Rev 45 (2003) 167 [15] M P H Stumpf, T Thorne, E de Silva, R Stewart, H J An, M Lappe, C Wiuf, “Estimating the size of the human interactome”, Proc Natl Acad Sci U.S.A 105 (2008) 6959 [16] Peter Bearman and James Moody, “Suicide and friendships among American adolescents” American Journal of Public Health, 94(1):89{95, 2004} [17] J W Neal, “Kracking - the Missing Data Problem: Applying Krackhardt’s Cognitive Social Structures to School-Based Social Networks”, Sociol Educ 81 (2008) 140 [18] R Albert, A.-L Barab´asi, “Statistical mechanics of complex networks”, Rev Mod Phys 74 (2002) 47 [19] R Guimera, M Sales-Pardo, “Missing and spurious interactions and the reconstruction of complex networks”, Proc Natl Acad Sci U.S.A 106 (2009) 22073 36 [20] S N Dorogovtsev, J F F Mendes, “Evolution of networks”, Adv Phys 51 (2002) 1079 [21] S Boccaletti, V Latora, Y Moreno, M Chavez, D.-U Huang, “Complex networks: Structure and dynamics”, Phys Rep 424 (2006) 175 [22] S Zhou, R J Mondrag´on, “Accurately modeling the internet topology”, Phys Rev E 70 (2004) 066108 [23] S Carmi, S Havlin, S Kirkpatrick, Y Shavitt, E Shir, “A model of Internet topology using k-shell decomposition”, Proc Natl Acad Sci U.S.A 104 (2007) 11150 [24] Uzzi, B 1999 “Embeddedness in the Making of Financial Capital: How Social Relations and Networks Benefit Firms Seeking Finaning” American Sociological Review, 64(4), 481–505 [25] Z Xu, V Tresp, K Yu, S Yu, H.-P Kriegel, “Dirichlet enhanced relational learning”, In Proceedings of the 22nd internatonal conference on machine learning, Bonn, Germany, 2005, p 1004 [26] Golbeck, J., Robles, C., Turner, K, “Predicting Personality with Social Media”, Proceedings of the 2011 annual conference extended abstracts on Human factors in computing systems, 2011 37 ... TOÁN DỰ ĐOÁN LIÊN KẾT ÂM, LIÊN KẾT DƯƠNG TRONG MẠNG XÃ HỘI 1.1 Bài toán dự đoán liên kết mạng xã hội 1.1.1 Dự đoán liên kết mạng xã hội 1.1.2 Liên kết mạng xã hội ... toán dựa đoán liên k mạng xã hội độ mạnh liên kết, liên kết oán kết nh k mạnh, liên kết yếu hay liên kết âm liên kết dương? ?? Qua th u k ó thấy ứng dụng thực tế toán dự đoán liên kết âm, liên kết dương. .. toán dự đoán liên kết âm liên kết dương mạng xã hội 1.3 Kết luận chương CHƯƠNG 2: CÁC PHƯƠNG PHÁP DỰ ĐOÁN LIÊN KẾT TRONG MẠNG XÃ HỘI 2.1 Phát biểu toán dự đoán liên