1. Trang chủ
  2. » Luận Văn - Báo Cáo

Đề xuất mô hình khuyến nghị cộng tác mới cho mạng đồng tác giả dựa trên chỉ số cộng tác và tương quan

6 3 0

Đang tải... (xem toàn văn)

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 6
Dung lượng 744,68 KB

Nội dung

Trong bài báo này, các tác giả đề xuất một mô hình khuyến nghị cộng tác mới trên mạng đồng tác giả nhằm hỗ trợ các nhà nghiên cứu trong việc xác định các mối cộng tác đã có và tăng cường quan hệ hợp tác trong tương lai. Mô hình đề xuất dựa trên ý tưởng về cải tiến hệ tư vấn trong mạng đồng tác giả với hai chỉ số cộng tác và tương quan nhằm cải tiến hiệu năng khuyến nghị.

Khoa học Tự nhiên Đề xuất mơ hình khuyến nghị cộng tác cho mạng đồng tác giả dựa số cộng tác tương quan Phạm Minh Chuẩn1,2*, Lê Hồng Sơn3, Trần Đình Khang2, Lê Thanh Hương2 Trường Đại học Sư phạm Kỹ thuật Hưng Yên Trường Đại học Bách khoa Hà Nội Trường Đại học Khoa học Tự nhiên, Đại học Quốc gia Hà Nội Ngày nhận 11/9/2017; ngày chuyển phản biện 14/9/2017; ngày nhận phản biện 16/10/2017; ngày chấp nhận đăng 18/10/2017 Tóm tắt: Trong báo này, tác giả đề xuất mơ hình khuyến nghị cộng tác mạng đồng tác giả nhằm hỗ trợ nhà nghiên cứu việc xác định mối cộng tác có tăng cường quan hệ hợp tác tương lai Mơ hình đề xuất dựa ý tưởng cải tiến hệ tư vấn mạng đồng tác giả với hai số cộng tác tương quan nhằm cải tiến hiệu khuyến nghị Chỉ số cộng tác xây dựng dựa liên kết tác giả số báo viết khứ Chỉ số tương quan xác định từ việc phân tích chủ đề nội dung báo thơng qua phương pháp phân tích chủ đề LDA Hệ khuyến nghị khả liên kết dựa ngưỡng số tương quan cộng tác Hệ thống đề xuất thử nghiệm đánh giá mạng đồng tác giả xây dựng từ tập báo đăng tạp chí “Biophysical Journal” từ năm 2006 đến 2017 Từ khóa: Chỉ số cộng tác, số tương quan, hệ thống khuyến nghị, mạng cộng tác, phân tích chủ đề Chỉ số phân loại: 1.2 Mở đầu Ngày nay, với phát triển mạng internet giúp người toàn giới dễ dàng kết nối thông qua mạng xã hội Facebook, Twitter , đồng thời làm bùng nổ thông tin lưu trữ mạng, dẫn đến người dùng khó khăn việc tìm kiếm, lựa chọn thơng tin phù hợp [1] Hệ khuyến nghị hay hệ tư vấn (Recommender Systems) [2] giải pháp trợ giúp người dùng định lựa chọn tìm kiếm thơng tin phù hợp thời gian ngắn Hệ tư vấn có ý nghĩa đặc biệt quan trọng bối cảnh cách mạng công nghiệp 4.0 nhiều nhà (khoa học, doanh nghiệp, phủ, người dân) kết nối với thơng qua cổng thơng tin Khi hệ tư vấn đóng vai trị cầu nối, giúp gợi ý cho doanh nghiệp công nghệ lõi phù hợp với đặc thù phát triển kinh tế nhà khoa học thiết kế, người dân tìm thấy sáng chế, ý tưởng dựa việc đánh giá sản phẩm phù hợp với nhu cầu thông qua chế khuyến nghị hệ tư vấn Trên mạng xã hội (chẳng hạn mạng Facebook), hệ tư vấn thể rõ ràng thông qua việc khuyến nghị người dùng việc xác định người bạn cũ kết nối với người bạn cách nhanh chóng hiệu Trong tư vấn bán hàng trực tuyến (như Amazone), hệ tư vấn giúp xác định mặt hàng phù hợp sở thích người dùng Cịn nhiều ví dụ minh họa tiềm ứng dụng hệ tư vấn Trong báo này, quan tâm đến ứng dụng cụ thể hệ tư vấn việc tìm nhóm nhà khoa học phù hợp với người nghiên cứu (hay gọi toán mạng đồng tác giả) Mạng đồng tác giả giúp ích nhiều cơng việc, hợp tác cơng bố kết tạp chí hội thảo uy tín nhà khoa học Đây toán đươc quan tâm nhiều nước giới cộng đồng khoa học nói riêng giúp hỗ trợ chuyển giao tri thức cho cộng đồng nói chung Ý nghĩa hệ thống khuyến nghị đề xuất nhằm tạo tảng cho hệ thống hỗ trợ định, giúp nhà khoa học dễ dàng tìm kiếm người cộng tác khoa học có nhiều điểm tương đồng hướng nghiên cứu tạo mối cộng tác khoa học Trong năm gần đây, ngày có nhiều nhóm tiến hành nghiên cứu việc tăng cường chất lượng dự báo hệ khuyến nghị cho mạng đồng tác giả, kể đến nghiên cứu tiêu biểu Yu cs (2014), Makarov cs (2016) [1, 3-7] Những nghiên cứu đặt móng cho việc phát triển hệ khuyến nghị cộng tác mạng đồng tác giả với mục đích giúp nhà nghiên cứu tăng cường cộng tác có thiết lập mối cộng tác với nhà nghiên cứu mà chưa có mối cộng tác Lopes cs (2010) [2] đề xuất mơ hình khuyến nghị cộng tác với hai số cộng tác tương quan để đưa khuyến nghị cho người dùng Lee cs (2011) [8] nghiên cứu mối tương đồng tác giả thông qua thông tin báo cơng bố họ từ khóa đại diện vị trí tác giả báo Phương pháp khuyến nghị dựa nội dung lọc cộng tác dựa mối quan hệ mạng đồng tác giả đề xuất kèm theo chiến lược lai ghép hệ khuyến nghị Xia cs (2014) [7] đề xuất phương pháp MVCWalker việc khuyến nghị Tác giả liên hệ: Tel: 0983081120; Email: chuanpm@gmail.com * 22(11) 11.2017 Khoa học Tự nhiên A approach for a new collaboration recommendation in co-authorship networks based on Global Cooperation and Global Correlation Minh Chuan Pham1,2*, Hoang Son Le3, Dinh Khang Tran2, Thanh Huong Le2 Hung Yen Univertity of Technology and Education Hanoi University of Science and Technology VNU University of Science Received 11 Septemrber 2017; accepted 18 October 2017 Abstract: xuất phát từ đề xuất Newman (2001) [5] việc tính trọng số liên kết hai tác giả báo; 2) Đưa phương pháp để xác định hồ sơ tác giả dựa báo mà họ viết thơng qua phương pháp phân tích chủ đề, ví dụ Latent Dirichlet Allocation (LDA) [9] sử dụng nhiều lĩnh vực khai phá liệu, phân lớp văn trích rút thơng tin… Trong mơ hình khuyến nghị mới, số cộng tác xây dựng dựa liên kết tác giả số báo viết khứ Chỉ số tương quan xác định từ việc phân tích chủ đề nội dung báo thông qua phương pháp LDA Hệ khuyến nghị khả liên kết dựa ngưỡng đối số tương quan cộng tác Hệ thống đề xuất thử nghiệm đánh giá mạng đồng tác giả xây dựng từ tập báo đăng tạp chí “Biophysical Journal” từ năm 2006 đến 2017 In this paper, we propose a new collaboration recommendation in co-authorship networks to assist researchers in specifying existing research collaborations Đề xuất hệ thống khuyến nghị cộng tác mạng đồng and strengthening them in the future It is based on tác giả Global Cooperation and Global Correlation to further Trong mơ hình khuyến nghị đề xuất, đưa improve the recommendation performance Global cơng thức tính số cộng tác tổng thể (Global Cooperation) Cooperation relies on the connection between authors dựa loại trọng số liên kết [5] Ngoài ra, số and their common research works Global Correlation tương quan tổng thể (Global Correlation) is determined through a topic modeling method, namely đề xuất cách xác định khác lấy ý tưởng từ Chuan Trong mơ hình khuyến nghị đề xuất, chúng tơi đưa cơng thức tính số Latent Dirichlet Allocation (LDA) The proposed system cộngcstác(2017) áp dụng dviệc xây tổng thể[3] (Global Cooperation) ựa loạidựng trọng số liênđộ kếtđo [5].tương Ngoài ra, đối determines the outcome based on specified thresholds với đồng dựa phương pháp LDA [9] Mơ hình tổng số tương quan ổt ng thể (Global Correlation) đềthể xuấtcủa cách khuyến cộngvàtác mạng đồngtrong tác vi giả for the Global Cooperation and Global Correlation It is xác hệ địnhthống khác lấy ý tưởngnghị từ Chuan cs (2017) [ 3] áp dụng ệc xây dựng dựahình phương pháp LDA [9] Mơ hình tổng thể hệ thống thểtương đồng experimentally validated on a dataset of co-authorship độ đo networks published in the “Biophysical Journal” from khuyến nghị cộng tác mạng đồng tác giả thể hình 2006 to 2017 Keywords: Collaborative networks, global cooperation, global correlation, recommendation system, topic modeling Lựa chọn danh sách tạp chí Classification number: 1.2 Xây dựng mạng cộng tác Lựa chọn tập báo T ập liệu báo Phân tích báo theo K chủ đề (sử dụng phương pháp LDA) người cộng tác hữu hiệu thông qua trọng số liên kết tác giả theo yếu tố: Vị trí tác giả báo, thời gian cộng tác gần số lần cộng tác Ngoài nghiên cứu tiêu biểu trên, nhiều nghiên cứu khác, nhiên phần lớn ý tưởng chung đề xuất mơ hình phương pháp dự báo nhằm làm tăng cường mối cộng tác có tạo mối cộng tác phù hợp Trong báo này, đề xuất mơ hình khuyến nghị cộng tác mạng đồng tác giả dựa số cộng tác tương quan Mơ hình cải tiến mơ hình nghiên cứu Lopes cs (2010) [2], cụ thể: 1) Đề xuất cách tính số cộng tác dựa số báo viết chung hai tác giả mà xem xét đến số lượng tác giả báo Điều 22(11) 11.2017 Khuyến nghị cộng tác Tạo hồ sơ tác giả Hình Mơ hình tổng thể hệ thống khuyến nghị cộng tác đề xuất Trong mơ hình khuyến nghị cộng tác (hình 1), trình thực diễn bước chính, gồm: 1) Lựa chọn danh sách tạp chí để xây dựng mạng cộng tác thực trình khuyến nghị; 2) Lựa chọn tập báo tạp chí chọn từ nguồn liệu số lưu trữ thông tin báo mạng internet; 3) Xây dựng mạng cộng tác thông qua tác giả lựa chọn từ tập báo nhận bước 2, gồm liên kết tác giả viết chung bài, số báo viết chung nội dung báo; 4) Sử dụng phương pháp phân tích chủ đề LDA [9] để biểu diễn báo dạng véc tơ K chiều; 5) Tạo hồ 10 Khoa học Tự nhiên sơ cho tác giả dựa công thức (8) (ở phần sau) dựa   kết bước để biểu diễn hồ sơ tác giả  v co _ authorship p∑  n ∈ P 1 j ij p −1  (2) (2) ω = + véc tơ K chiều, xác định trung bình chung t _ Ca ( vi → v j )  vi author 2 ∑ tập véc tơ ứng với báo mà tác giả viết;   f ∈ Pi n f −   6) Tính tốn số cộng tác theo cơng thức (2) số tương quan theo công thức (7) Lựa chọn tác giả dựa Trong đó, Pij tập báo viết chung hai số cộng tác tổng thể tương quan tổng thể để hai tác giả vi vj; Pi tập báo viết tác khuyến nghị giả vi Trong mơ hình Lopes cs [2], hồ sơ tác Để minh họa cho công thức (2), xem xét giả mạng cộng tác sử dụng hệ thống khuyến nghị đươc xây dựng dựa thơng tin có sẵn ví dụ tác giả u, v, z sau: Giả sử tập báo tác giả sở liệu báo phân loại tác giả u Pu ={p1, p2, p3, p4, p5} tương ứng với số lượng báo tác giả [10] Bài báo dựa cách thức tác giả báo {2, 2, 4, 3, 3} tập khác để xây dựng hồ sơ tác giả dựa phương báo viết chung hai tác giả u, v P = {p , p , p } uv pháp phân tích chủ đề [9] tập báo viết chung hai tác giả u z Puz = {p2, p3, p4} Khi đó, theo cơng thức (1) chúng Chỉ số cộng tác tổng thể dựa trọng số liên kết Trong nghiên cứu Lopes cs (2010) [2], nhóm tác ta tính mức độ cộng tác tổng thể giả mơ hình hóa mạng xã hội (Social Network - SN) ωt_Ca ( u→z ) = ωt_Ca ( v →z) = 3/5 = 0,6, áp dụng công thức (2) quan hệ cộng tác a cặp: SNa = (N, E), mức độ cộng tác tổng thể đề xuất u N E tương ứng tập đỉnh tập cạnh có hướng z; v z tính biểu thức (3) (4) Mỗi cạnh e ∈ E có dạng , cạnh có 1 hướng từ vi đến vj; t ký hiệu kiểu cộng tác vi vj; ω + + −1 −1 −1 (3) ωt _ Ca(u→ z ) = 0.6/ + × = 0,3 + = 0,3 + = 0,65 (3) trọng số tác động quan hệ cộng tác t nhận giá trị số 1 1 10 20 khoảng (0, 1) Khi đó, số cộng tác tổng thể (ωt_Ca) + + + + −1 −1 −1 −1 −1 tính theo cơng thức sau: ωt _ Ca ( v → v ) = i v j co _ authorship vi author j (1) Trong đó: ωt_Ca ( v →v ) tương ứng số cộng tác (trọng số từ vi→vj khác với trọng số từ vj→v­i); |vjco_authorship| số lần mà tác giả vj cộng tác viết báo với tác giả vi; |vjauthor| tương ứng với tổng số báo mà tác giả vi cơng bố i j Ngồi ra, giá trị ωt_Ca ( v →v ) cao có nghĩa mức độ liên quan (phù hợp) vj với v­i nhiều i j Trong báo này, xem xét số lượng báo mà hai tác giả cộng tác, chúng tơi cịn dựa loại trọng số đề xuất nghiên cứu Newman (2001) [5] Ý nghĩa loại trọng số xuất phát từ thực tế mối liên kết hai tác giả báo phụ thuộc vào số lượng tác giả báo Nghĩa số lượng tác giả báo mức độ liên kết tác giả báo cao ngược lại Khi đó, số cộng tác tổng thể mà chúng tơi đề xuất tính theo cơng thức sau: 22(11) 11.2017 1 11 + + 11 −1 −1 −1 (4) ωt _(1) = 0,3 + 12 = 0,3 + = 0,575 (4) Ca ( v→ z ) = 0,6/ + × 10 + + + + 40 −1 −1 −1 −1 −1 Kết tính theo biểu thức (3) (4) cho thấy, mức độ cộng tác hai tác giả việc phụ thuộc vào số báo viết chung cịn phụ thuộc vào số lượng tác giả báo mà hai tác giả viết chung Nếu báo, số lượng tác giả tham gia mức độ liên kết tác giả báo cao ngược lại Chỉ số tương quan tổng thể dựa phân tích chủ đề LDA Đối với khuyến nghị cộng tác, điều quan trọng nằm việc xác định mối tương quan tổng thể tác giả Mức độ tương quan tổng thể xác định thông qua mức độ khác biệt lĩnh vực nghiên cứu Trong nghiên cứu Lopes cs [2], nhóm tác giả đề xuất cách thức xác định mức độ tương quan tổng thể công thức (5) 11 Khoa học Tự nhiên Khuyến nghị cộng tác n global_correlation(vi , v j ) = ∑ ωRa (vi , xk ) ×ωRa (v j , xk ) k =1 n n ∑ (ωRa (vi , xk ) ) × ∑ (ωRa (v j , xk ) ) 2 Hệ thống khuyến nghị cộng tác nhằm đưa gợi (5) ý giúp cặp người dùng (tác giả) đưa (5) định xem có nên hay khơng nên tăng cường mối cộng tác nghiên cứu dựa hai số cộng tác tổng thể tương quan tổng thể [2] =k =k Trong đó, n số lĩnh vực; ωRa ( vi ,xk ) trọng số ứng với lĩnh vực nghiên cứu xk mà tác giả vi đóng góp vào so với toàn báo tác giả vi tính theo cơng thức (6) Trong mơ hình khuyến nghị cộng tác đề xuất, tập trung tăng cường cho cặp tác giả có liên kết có số cộng tác thấp (nhỏ giá trị ngưỡng) lại có số tương quan tổng thể cao (lớn vi authorresearch _ area _ x ngưỡng đó) Giả sử có tập tác giả cộng (6) (6) ωRa (vi , x) = vi author tác với tác giả u Pu, tập tác giả cần khuyến nghị cộng tác tăng cường với tác giả u xác định biểu Với vi authorresearch _ area _ x số báo mà tác giả vi thức (9) đăng lĩnh vực x RS(u) = v ∈ Pu :ωt _ Ca (u →v ) ≤ a and global_correlation(u,v)> b (9) Trong nghiên cứu Lopes cs (2010) [2], nhóm tác giả xác định lĩnh vực báo dựa ontology Trong đó, số α, β xác định thông qua thực xây dựng sẵn Điều gặp khó khăn số lượng nghiệm báo lớn, phân bố nhiều lĩnh vực khác việc xây dựng tập mẫu để huấn luyện không dễ dàng Trên thực Minh họa hệ thống khuyến nghị cộng tác tế mảng nghiên cứu phân vào lĩnh Để minh họa cho mơ hình khuyến nghị cộng tác đề xuất, vực khác lĩnh vực nghiên cứu diễn tiến hành thử nghiệm mạng đồng tác giả đạt với tên khác Để giải vấn đề này, chúng xây dựng từ tập báo đăng tạp chí tơi áp dụng phương pháp LDA [9] LDA áp dụng “Biophysical Journal” [11] từ năm 2006 đến 2017 Sở dĩ nhiều lĩnh vực khai phá liệu, phân lớp văn lựa chọn tập báo đăng tạp chí trích rút thơng tin Chúng tơi sử dụng LDA để phân tích số lượng báo công bố năm từ 2006 báo vào K chủ đề khác nhau, thông tin đến 2017 đủ lớn tác giả mã hóa tránh việc báo sử dụng để phân tích chủ đề bao gồm tên, từ nhầm lẫn tên tác giả hai tác giả tên viết khóa nội dung tóm tắt báo với mong muốn xác tắt chưa thuộc tác giả Tổng số báo định lĩnh vực nghiên cứu tác giả thông qua thu 7.845, tổng số tác giả 22.106 tổng số liên nội dung báo cách xác có tính kết 72.186 Tuy nhiên, để đánh giá mơ hình khuyến tương đồng cao ngữ nghĩa thông qua phương pháp LDA nghị cộng tác đề xuất, xây dựng kịch thực { nghiệm sau: Giả sử hai tác giả u, v có hai tập báo Pu = {pu1,… ,pum} Pv = {pv1,…, pvn} (m, n nguyên dương), sau phân tích theo K chủ đề, nhận véc tơ biểu diễn cho báo không gian K chiều sau: Xu = {xu1,…, xum} Xv = {xv1,…, xvn} Khi đó, mức độ tương quan tổng thể mà chúng tơi đề xuất tính theo cơng thức (7) (1) Xây dựng đơn đồ thị vô hướng G, bao gồm 22.106 đỉnh (mỗi đỉnh tác giả), hai tác giả viết chung báo khoảng 2006-2017 có cạnh nối hai tác giả (đỉnh) K global_correlation(u,v) = ∑ xu (i) × xv (i) i =1 K K ∑ ( xu (i) ) × ∑ ( xv (i) ) 2 (7)(7) =i =i Trong đó, xu xv hai véc tơ trung bình chung tính thông qua tập hai véc tơ Xu Xv công thức (8) m = xu (i ) ∑ xuj (i) j =1 = , i 1, K m 22(11) 11.2017 (8) } (2) Xác định thành phần liên thông lớn đồ thị G (tức đồ thị G’ liên thông lớn G) (3) Lựa chọn tập tác giả tập đỉnh xuất G’ Và lựa chọn tập tác giả có số lượng báo từ năm 2006 đến 2017 lớn 4, kết lựa chọn 615 tác giả thỏa mãn điều kiện có số báo lớn (4) Xây dựng tập liệu để kiểm chứng mơ hình khuyến nghị (8) cộng tác Gọi T1 = [2006-2011] tập năm từ 2006 đến 2011; T2 = [2012-2017]; sử dụng tập 12 (9) Khoa học Tự nhiên báo xuất năm T1 để xây dựng mơ hình khuyến nghị cộng tác; tập báo xuất năm T2 để kiểm chứng mơ hình khuyến nghị cộng tác Để đánh giá mức độ xác cho mơ hình khuyến nghị cộng tác, chúng tơi lựa chọn tập tác giả thỏa mãn điều kiện bước có cộng tác với 14 tác giả năm T1, đồng thời năm T2 lại tiếp tục có mối cộng tác với tác giả cộng tác năm T1 Ví dụ, giả sử tác giả A năm T1 có mối cộng tác với 14 tác giả {A1, A2, A3, A4, A5,…, A14}, năm T2 lại tiếp tục cộng tác với tác giả {A1, A2, A4, A5} tác giả A lựa chọn để đánh giá mức độ xác mơ hình khuyến nghị cộng tác Với cách lựa chọn vậy, lựa chọn 65/615 tác giả dùng để đánh giá mô hình Hình Kết trung bình chung F1-measure giá trị ngưỡng a b thực nghiệm trường hợp số cộng tác tính theo công thức (1) (5) Tổng số báo năm T1 4.856, báo sử dụng để phân tích theo K (trong báo chọn K = 50) chủ đề (LDA [9]), làm sở cho việc xây dựng hồ sơ tác giả tính tốn số tương quan tổng thể Chúng tơi sử dụng tiêu chí đánh giá độ bao phủ (Recall), độ xác (Precision) F1-measure xác định công thức từ (10) đến (12) để đánh giá mơ hình khuyến nghị cộng tác Recall = TP (10) TP + FN Precision = TP (11) TP + FP F1-measure = * Recall * Precision Recall+Precision (12) Trong đó, TP tập tác giả khuyến nghị cộng tác tăng cường đúng; FN tập tác giả cộng tác tăng cường không khuyến nghị cộng tác; FP tập tác giả khuyến nghị cộng tác tăng cường không Chúng tiến hành thực nghiệm với hai trường hợp, gồm: 1) Sử dụng số cộng tác tổng thể nhóm tác giả Lopes cs [2] đề xuất biểu thức (1); 2) Sử dụng số cộng tác tổng thể đề xuất biểu thức (2) Đối với số tương quan tổng thể sử dụng theo công thức (7) chúng tơi đề xuất Do khơng có đủ liệu mẫu để xây dựng ontology lĩnh vực nhóm tác giả Lopes cs [2] thực hiện, nên thực nghiệm theo số tương quan tổng thể biểu thức (5) 22(11) 11.2017 Hình Kết trung bình chung F1-measure giá trị ngưỡng a b thực nghiệm trường hợp số cộng tác tính theo cơng thức (2) Để xác định giá trị α β, tiến hành thực nghiệm với giá trị khác α = {0,3, 0,31,…, 0,4} β = {0,4, 0,41,…, 0,5}, kết F1-measure trung bình chung 65 tác giả biễu diễn hình hình tương ứng với hai trường hợp thực nghiệm Quan sát hình hình nhận thấy, giá trị trung bình chung F1-measure hai trường hợp đạt giá trị cao α = 0,4 β ≥ 0,45, F1-measure trung bình đạt lớn α = 0,4 β = 0,47, giá trị α, β tối ưu nhận ứng với giá trị F1-measure lớn thông qua chạy thực nghiệm với giá trị α, β khoảng (0, 1) Hình cho biết giá trị trung bình Recall, Precision F1-measure hai trường hợp ứng với α, β tối ưu Các giá trị trung bình Recall, Precision F1measure trường hợp thứ (sử dụng công thức (2) số cộng tác toàn phần đề xuất) nhỉnh so với trường hợp 1, cụ thể Precision đạt 0,225309 so với 0,218866 F1-measure 0,352285 so với 0,344331, giá trị Recall hai trường hợp cao xấp xỉ 0,922564 0,921026 Tuy kết cải thiện chưa nhiều thấy việc áp dụng tính số cộng tác tổng thể theo cơng thức (2) làm cho giá trị số mịn (phân tách hơn), giúp việc lựa chọn ứng cử viên khuyến nghị cộng tác thêm xác 13 Khoa học Tự nhiên Kết luận Hình Kết trung bình chung Recall, Precision F1-measure hai trường hợp Để so sánh cách chi tiết giá trị số F1measure tác giả thực khuyến nghị cộng tác áp dụng số cộng tác theo công thức (1) (2), liệt kê giá trị F1-measure tác giả có khác biệt áp dụng số cộng tác tổng thể theo công thức (1) (2) bảng Cụ thể, có 18/65 tác giả kết F1-measure nhận có khác biệt, số cộng tác theo cơng thức (2) có 15 tác giả nhận giá trị F1-measure cao so với cơng thức (1) có tác giả nhận giá trị F1-measure thấp so với công thức (1) Về tỷ lệ phần trăm cải thiện, công thức (2) tỷ lệ cải thiện thấp 3,57% cao 42,86% Tuy nhiên, ba tác giả có giá trị F1-measure ứng với cơng thức (2) thấp công thức (1) chiếm tỷ lệ thấp 5, 25,93 18,18% Bảng So sánh giá trị số F1-measure số cộng tác theo công thức (1) (2) ứng với tác giả khuyến nghị STT Id tác giả Chỉ số cộng tác theo công thức (1) Chỉ số cộng tác theo công thức (2) Mức độ cải thiện công thức (2) so với (1) (%) 10 11 16 23 25 27 31 34 36 41 43 0,421053 0,344828 0,333333 0,4 0,1 0,157895 0,705882 0,266667 0,285714 0,416667 0,296296 0,47619 0,357143 0,363636 0,47619 0,142857 0,15 0,736842 0,352941 0,333333 0,434783 0,344828 13,10% 3,57% 9,09% 19,05% 42,86% -5,00% 4,39% 32,35% 16,67% 4,35% 16,38% 12 49 0,3 0,222222 -25,93% 13 50 0,105263 0,117647 11,76% 14 54 0,416667 0,434783 4,35% 15 55 0,428571 0,5 16,67% 16 56 0,428571 0,5 16,67% 17 63 0,333333 0,375 12,50% 18 64 0,333333 0,272727 -18,18% 22(11) 11.2017 Trong báo này, chúng tơi đề xuất mơ hình khuyến nghị cộng tác cho mạng đồng tác giả, nhằm trợ giúp nhà nghiên cứu có sở để định xem mối cộng tác cần tăng cường Mơ hình dựa số cộng tác số tương quan toàn phần nhằm tăng cường hiệu cho hệ thống khuyến nghị cộng tác Kết thực nghiệm mạng đồng tác giả xây dựng từ tập báo đăng tạp chí “Biophysical Journal” từ năm 2006 đến 2017 cho thấy, F1-measure phương pháp đề xuất đạt giá trị cao α = 0,4 β > 0,45; F1measure trung bình đạt lớn α = 0,4 β = 0,49 Và giá trị trung bình chung F1-measure áp dụng số cộng tác với biểu thức (2) mà đề xuất 0,35229 so với 0,34433 số cộng tác tính theo biểu thức (1) Tuy nhiên, mơ hình đề xuất cịn nhiều tiềm để phát triển, chẳng hạn việc tính tốn số tương quan tổng thể xem xét thêm yếu tố khác như: Lĩnh vực nghiên cứu quan tâm, địa Do vậy, thời gian tới, tiếp tục nghiên cứu để đề xuất mơ hình khuyến nghị cộng tác hợp lý hiệu để áp dụng vào thực tế TÀI LIỆU THAM KHẢO [1] Q Yu, C Long, Y Lv, H Shao, P He, Z Duan (2014), “Predicting coauthor relationship in medical co-authorship networks”,  PloS one,  9(7), e101214 [2] G.R Lopes, M.M Moro, L.K Wives, J.P.M De Oliveira (2010), “Collaboration recommendation on academic social networks”, International Conference on Conceptual Modeling, pp.190-199 [3] P.M Chuan, C.N Giap, L.H Son, B Chintan, T.D Khang (2017), “Enhance Link Prediction in Online Social Networks Using Similarity Metrics, Sampling and Classification”, Proceedings of the 4th International Conference on Information System Design and Intelligent Applications (INDIA) (Accepted) [4] I Makarov, O Bulanov, L.E Zhukov (2016), “Co-author Recommender System”, International Conference on Network Analysis, pp.251-257 [5] M.E Newman (2001), “Scientific collaboration networks I Network construction and fundamental results”, Physical review E., 64(1), pp.16-31 [6] M Pavlov, R Ichise (2007), “Finding experts by link prediction in coauthorship networks”,  Proceedings of the 2nd International Conference on Finding Experts on the Web with Semantics, pp.42-55 [7] F Xia, Z Chen, W Wang, J Li, L.T Yang (2014), “Mvcwalker: Random walk-based most valuable collaborators recommendation exploiting academic factors”,  IEEE Transactions on Emerging Topics in Computing,  2(3), pp.364375 [8] D.H Lee, P Brusilovsky, T Schleyer (2011), “Recommending collaborators using social features and mesh terms”,  Proceedings of the Association for Information Science and Technology, pp.1-10 [9] D.M Blei (2012), “Probabilistic topic models”, Communications of the ACM, 55(4), pp.77-84 [10] S Loh, D Lichtnow, T Borges, G Piltcher, M Freitas (2006), “Constructing domain ontologies for indexing texts and creating users’ profiles”, In  Work on Ontologies and Metamodeling in Software and Data Engineering, Brazilian Symp on Databases, UFSC, Florianópolis, pp.72-82 [11] https://www.journals.elsevier.com/biophysical-journal/, Accessed on 10/7/2017 14 ... mối cộng tác phù hợp Trong báo này, đề xuất mơ hình khuyến nghị cộng tác mạng đồng tác giả dựa số cộng tác tương quan Mơ hình cải tiến mơ hình nghiên cứu Lopes cs (2010) [2], cụ thể: 1) Đề xuất. .. số cộng tác dựa số báo viết chung hai tác giả mà xem xét đến số lượng tác giả báo Điều 22(11) 11.2017 Khuyến nghị cộng tác Tạo hồ sơ tác giả Hình Mơ hình tổng thể hệ thống khuyến nghị cộng tác. .. này, chúng tơi đề xuất mơ hình khuyến nghị cộng tác cho mạng đồng tác giả, nhằm trợ giúp nhà nghiên cứu có sở để định xem mối cộng tác cần tăng cường Mơ hình dựa số cộng tác số tương quan toàn phần

Ngày đăng: 19/05/2021, 20:15

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w