Trắc lượng thư mục có ý nghĩa đánh giá công trình nghiên cứu khoa học đối với người nghiên cứu, đồng thời, thể hiện năng lực của tổ chức nghiên cứu khoa học và tổ chức quản lý khoa học. Để triển khai hoạt động này, cần có cơ sở dữ liệu, cho phép cung cấp thông tin để thực hiện đo lường/đánh giá. Bài viết phân tích và đề xuất, thiết kế cơ sở dữ liệu với SQL server, nhằm hỗ trợ việc tổ chức, lưu trữ và xử lý thông tin liên quan đến trắc lượng thư mục.
NGHIÊN CỨU - TRAO ĐỔI CƠ SỞ DỮ LIỆU TRẮC LƯỢNG THƯ MỤC1 TS Nguyễn Huy Chương Khoa TT-TV, Trường Đại học KHXH&NV, ĐHQG Hà Nội PGS TS Đỗ Trung Tuấn Khoa Toán Cơ Tin, Trường Đại học KHTN, ĐHQG Hà Nội Tóm tắt: Trắc lượng thư mục có ý nghĩa đánh giá cơng trình nghiên cứu khoa học người nghiên cứu, đồng thời, thể lực tổ chức nghiên cứu khoa học tổ chức quản lý khoa học Để triển khai hoạt động này, cần có sở liệu, cho phép cung cấp thông tin để thực đo lường/đánh giá Bài viết phân tích đề xuất, thiết kế sở liệu với SQL server, nhằm hỗ trợ việc tổ chức, lưu trữ xử lý thông tin liên quan đến trắc lượng thư mục Từ khóa: Cơ sở liệu; trắc lượng thư mục; nghiên cứu khoa học; SQL; Đại học Quốc gia Hà Nội Bibliometric databases Abstract: Bibliometrics is used to evaluate the work of a researcher as well as the capacity of a research institution and a research management organization In order to conduct bibliometric analysis, it’s necessary to have databases to provide information for monitoring and evaluation The article analyzes the current status of bibliometric databases and recommends to design bibliometric database with SQL server in order to organize, store and analyze bibliometric-related information Keywords: Databases; bibliometrics; scientific research; SQL; Vietnam National University Hanoi Đặt vấn đề Đánh giá chất lượng sản phẩm thông tin cần có dạng sở liệu chuyên dụng Thực tế cho thấy, Việt Nam thiếu sở liệu trắc lượng thư mục phù hợp Để khắc phục vấn đề này, cần phải nhờ đến giải pháp thực từ nhiều năm trước, bao gồm: (i) tải liệu; (ii) làm nó; (iii) lưu trữ vào sở liệu thích hợp cho nhiệm vụ trắc lượng thư mục Đối với đơn vị nghiên cứu, vấn đề làm sở liệu xây dựng để đáp ứng tốt nhu cầu trắc lượng thư mục [1] Để việc đánh giá tiện cho người dùng không chuyên công nghệ thông tin, giao diện người dùng cần thân thiện, phù hợp Nhiều tiêu chí đặt giao diện người-máy; với hệ thống trắc lượng thư mục, cần có tiêu chí phù hợp với cơng tác TT-TV hệ thống cần có phần tương tác người dùng theo cách trực quan [2] Vì vậy, mục đích viết nhằm mô tả cấu trúc sở liệu quan hệ, thích hợp cho hầu hết phân tích, thiết kế tính tốn số trắc Bài viết thực tiến hành đề tài nghiên cứu tài trợ Đại học Quốc gia Hà Nội 16 THÔNG TIN VÀ TƯ LIỆU - 4/2017 NGHIÊN CỨU - TRAO ĐỔI lượng thư mục Gần đây, nhu cầu sở liệu chuyên dùng cho mục đích trắc lượng thư mục khẳng định xuất hướng mô hình liệu Người ta sử dụng tiếp cận quan hệ - đối tượng Tuy nhiên, điều khơng có nghĩa sở liệu quan hệ túy lỗi thời, mà việc sử dụng công nghệ hướng đối tượng nhằm thích hợp với hoạt động trắc lượng thư mục Bài viết nhằm mô tả cấu trúc sở liệu quan hệ, thích hợp cho hầu hết phân tích, thiết kế tính tốn số trắc lượng thư mục Trong chưa có sở liệu quan hệ mẫu, viết phân tích, thiết kế sở liệu quan hệ phù hợp với công tác trắc lượng thư mục Đại học Quốc gia Hà Nội Phân tích sở liệu trắc lượng thư mục Phân tích sử dụng số trắc lượng thư mục phân thành: (i) trắc lượng thư mục mô tả; (ii) trắc lượng thư mục đánh giá Trong trắc lượng thư mục mô tả theo tiếp cận từ xuống, cố gắng để có tranh lớn, chẳng hạn kết nghiên cứu quốc gia lĩnh vực khác nhau, tỷ lệ lĩnh vực khác thay đổi theo thời gian, trắc lượng thư mục công cụ để đánh giá hoạt động nghiên cứu đơn vị nhỏ nhóm nghiên cứu chí cá nhân sử dụng phương pháp tiếp cận từ lên, thu thập tất ấn phẩm (có liên quan) đơn vị tương ứng Rõ ràng, trắc lượng thư mục đánh giá đặt yêu cầu cao chất lượng liệu Tính tốn số trắc lượng thư mục đếm số ấn phẩm trích dẫn Liên quan đến vấn đề có số ý kiến sau: • Cơng việc đề cập số định lượng, vấn đề quan trọng đảm bảo chất lượng liệu Chất lượng liệu xác định qua đặc trưng, tức từ khóa mà người ta lựa chọn để thống kê [3]; • Một số đặc trưng liên quan đến người, tiểu sử cá nhân, xem xét, khảo cứu để tra cứu, đánh giá cơng trình [4]; • Tác động cơng trình đến cơng trình khác tác động trực tiếp Tuy nhiên, cơng trình thứ hai lại có ảnh hướng đến cơng trình thứ ba, thứ tư… Do vậy, việc truy vết tác động cơng trình cần thể sở liệu Kinh nghiệm cho thấy cần xác định đường cơng trình mạng lưới cơng trình [7]; • Trong sở liệu trắc lượng thư mục, đối tượng coi đặc trưng xác định đặc trưng khác, chẳng hạn thuộc tính khóa sở liệu Nên xác định tên đối tượng số hóa hệ thống đánh giá có uy tín, Web khoa học Scopus [5] 2.1 Trắc lượng thư mục Trong này, sử dụng số tiêu chí số trắc lượng thư mục sở tham khảo tiêu chí Nicolai Mallig [6] với ký pháp Việc sử dụng lại ký pháp nhằm thuận tiện cho việc đối chiếu, so sánh • P Số lượng ấn phẩm; • C Số trích dẫn nhận được; • CPP2 (Số trung bình) trích dẫn ấn phẩm; • CPPex3 (Số trung bình) trích dẫn xuất bản; khơng tính tự trích dẫn; CPP : Citation per publication CPPex : CPP, self citation excluded THÔNG TIN VÀ TƯ LIỆU - 4/2017 17 NGHIÊN CỨU - TRAO ĐỔI • % Pnc Tỷ lệ phần trăm báo không trích dẫn (trong khoảng thời gian xem xét); Toàn theo chuẩn7 Mỗi tác giả tham gia điểm 1/n, với n số tác giả báo; • JCS4 Tỷ số trích dẫn tạp chí (số trung bình trích dẫn xuất bản, theo loại báo tạp chí); Trực tiếp8 Tác giả nhận điểm; tác giả khác khơng tính điểm; • FCS5 Tỷ số trích dẫn lĩnh vực (số trung bình trích dẫn xuất bản, theo loại tạp chí lĩnh vực hẹp); • JCSm Tỷ lệ trích dẫn trung bình gói tạp chí (đánh trọng số theo số lượng ấn phẩm gói báo xét); • FCSm Tỷ lệ trích dẫn trung bình theo lĩnh vực (đánh trọng số theo số lượng ấn phẩm gói báo xét); • % SELFCIT Tỷ lệ tự trích dẫn; • CPP/JCSm Trích dẫn theo xuất bản, so với tỷ lệ trích dẫn gói tạp chí; • CPP/FCSm Trích dẫn theo xuất bản, so với tỷ lệ trích dẫn lĩnh vực hẹp; • JCSm/FCSm Tỷ lệ trích dẫn gói tạp chí, so với tỷ lệ trích dẫn lĩnh vực hẹp Nicolai Mallig [6] đề xuất thêm số khác, thường sử dụng đánh giá hợp tác (quốc tế), số: CoP Số xuất (cùng với đơn vị khác) Đếm ấn phẩm hoạt động nhằm tính điểm cho ấn phẩm Các điểm gộp lại, theo mức độ, chẳng hạn theo tác giả, tổ chức hay quốc gia Những phương pháp đếm thường sử dụng gồm: Toàn bộ6 Mỗi đơn vị có liên quan (tác giả) thêm điểm; 10 JCS : Journal Citation Score FCS : Field Citation Score Complete Complete normalized Straight Whole Whole normalized 18 THÔNG TIN VÀ TƯ LIỆU - 4/2017 Tất cả9 Mỗi đơn vị tham gia, theo mức độ gộp lại, điểm 1; Tất bình thường10 Mỗi đối tượng có liên quan, theo mức độ gộp lại, tăng thêm 1/n điểm; với n số lượng đơn vị tham gia, theo mức độ Hai phương pháp hồn tồn bình thường, tự nhiên, loại phương pháp đếm phần, hay toàn phần Chẳng hạn báo với hai tác giả Việt Nam tác giả người Pháp • Nếu đếm phần, tác giả Việt Nam 2/3 điểm; tác giả Pháp 1/3 im; ã Nu m ton phn, tc y , ẵ điểm cho Việt Nam, ½ điểm cho Pháp Về sở liệu để phân tích trắc lượng thư mục có giới, người ta thường kể đến: (i) ISI Web of Science (Thomson Reuters); (ii) Scopus (Elsevier); (iii) Google Scholar (Google Inc); (iv) Các thư mục cục 2.2 Cơ sở liệu bổ sung, nhằm truy vết trích dẫn Truy vết ấn phẩm cần thiết [7] Một số nhà xuất sở liệu cung cấp thông tin theo dõi trích dẫn Dưới danh sách số sở liệu Thư viện kỹ thuật số ACM: CSDL gồm NGHIÊN CỨU - TRAO ĐỔI báo hội nghị khoa học máy tính cơng nghệ thơng tin Việc tìm kiếm tác giả công việc cụ thể dễ dàng Đối với cơng việc, số lượng trích dẫn số lượng tải hiển thị; IEEE Xplore: Gồm báo kỷ yếu hội nghị cơng nghệ khoa học máy tính; MathSciNet: Gồm báo, kỷ yếu hội nghị, sách tốn học; Tạp chí ScienceDirect: Gồm báo y học, khoa học, số ngành khoa học xã hội, nhân văn,… Đề xuất lược đồ sở liệu quan hệ Để xác định thành phần cấu trúc báo mối quan hệ chúng, cần xem xét khái niệm tổng quan liên quan đến báo, bao Tổ chức gồm: • Bài viết có tiêu đề tóm tắt tên • Có số từ khóa (được cung cấp tác giả) • Bài báo có danh sách tài liệu tham khảo đến báo khác • Mỗi tài liệu tham khảo có chứa thông tin đầy đủ (trong trang đầu báo trích dẫn) Liên quan đến tổ chức thơng tin, có đối tượng quan trọng như: (i) báo; (ii) tạp chí; (iii) người (tác giả); (iv) quan Các mối quan hệ xác định, tức thực thể liên kết, là: • tác giả (liên kết người viết); • xuất (liên kết báo tạp chí); Cơng tác Địa • Bài báo viết nhiều tác giả (thứ tự xuất thơng tin quan trọng) Người tên họ Trích Tham chiếu Tác giả Nhan đề Được trích Tạp chí Năm xuất Bài báo Tóm tắt tên tập • Bài viết đăng tải tạp chí có tên Xuất • Bài viết xuất theo vấn đề cụ thể tạp chí Đặc trưng chất lượng, ngày xuất Tạp chí • Bài viết có ngày email Vị trí Viết • Tác giả liên kết với tổ chức (hoặc số) có địa • Tác giả có địa e-mail tác giả gửi ngày tạp chí nhận Ngày xuất số tên Hình Sơ đồ ER THƠNG TIN VÀ TƯ LIỆU - 4/2017 19 NGHIÊN CỨU - TRAO ĐỔI • liên kết (liên kết người tổ chức); • tài liệu tham khảo/trích dẫn (liên kết viết với viết, liên kết trích dẫn với trích dẫn) Ở sử dụng mơ hình thực thể- quan hệ (ER) để hình dung thực thể với thuộc tính mối quan hệ xác định Một sơ đồ thực thể- quan hệ thể trừu tượng liệu, thường sử dụng để mơ hình hóa liệu Các đối tượng hiển thị như: (i) hình hộp ứng với thực thể; (ii) thuộc tính ứng với hình bầu dục; (iii) mối quan hệ ứng với hình thoi; (iv) mũi tên với nhãn Các thực thể mối quan hệ xác định hiển thị Hình Thực tế báo công bố tạp chí thể thơng qua mối quan hệ liên kết xuất báo cho tạp chí Các tác giả thiết lập liên kết báo người viết nó, theo quan hệ viết Một người thuộc tổ chức thể mối quan hệ công tác Các mối quan hệ tài liệu tham khảo liên kết trích dẫn vào báo trích dẫn, tức liên kết hai lần, theo quan hệ tham chiếu Hình Các thuộc tính quan hệ Bài báo Mối quan hệ tham chiếu phức tạp Nó có ý nghĩa cho việc đánh giá thân viết Vì vậy, thuộc tính mối quan hệ tham chiếu thơng tin dự phịng chứa liệu viết trích dẫn Để cụ thể hóa lược đồ quan hệ, thực thể, mối quan hệ thuộc tính mơ hình ER phải tương ứng với thuộc tính bảng quan hệ mơ hình quan hệ Sự chuyển đổi đơn giản: thực thể mối quan hệ ánh xạ vào bảng thuộc tính ánh xạ vào cột bảng tương ứng Mối quan hệ tạo nên quan hệ Hệ quản trị sở liệu đề xuất sử dụng SQL Server Đây hệ quản trị thông dụng, phổ cập quan/trường học/thư viện Việt Nam Dưới lược đồ trình bày theo ngơn ngữ hệ quản trị Hình Các thuộc tính quan hệ Người Hình Sơ đồ lược đồ quan hệ 20 THÔNG TIN VÀ TƯ LIỆU - 4/2017 Hình Các thuộc tính quan hệ Tạp chí NGHIÊN CỨU - TRAO ĐỔI Kết luận Đối với chương trình xử lý liệu, vấn đề quan trọng liệu cần thể dạng thuận tiện người dùng Hình Các thuộc tính quan hệ Tổ chức Hình Các thuộc tính mối quan hệ Xuất Hình Các thuộc tính mối quan hệ Viết Hình Các thuộc tính mối quan hệ Cơng tác Hình 10 Các thuộc tính mối quan hệ Tham chiếu Đề xuất lược đồ sở liệu phần hồn tồn đáp ứng nhu cầu đánh giá, hỗ trợ xếp hạng trắc lượng thư mục Lược đồ sở liệu phù hợp với thực tiễn hoạt động thông tin thư mục trường đại học Việt Nam nên cần triển khai áp dụng rộng rãi TÀI LIỆU THAM KHẢO Andrea Bonaccorsi, Tindaro Cicero (2016) Nondeterministic ranking of university departments, Journal of Informetrics, 10 (2016), p 224-237 Feng Feng et al (2015) Visualization and quantitative study in bibliographic databases: A case in the field of university-industry cooperation, Journal of Informetrics, (2015), p 118-134 Guo Chen, Lu Xiao (2016) Selecting publication keywords for domain analysis in bibliometrics: A comparison of three methods, Journal of Informetrics, 10 (2016), p 212-223 Ilia Reznik, Vladimir Shatalov, Hidden revolution of human priorities: An analysis of biographical data from Wikipedia, Journal of Informetrics 10 (2016) 124-131 Juan Gorraiz et al (2016) Availability of digital object identifiers (DOIs) in Web of Science and Scopus, Journal of Informetrics, 10 (2016), p 98-109 Nicolai Mallig (2010) A relational database for bibliometric analysis, Innovation Systems and Policy Analysis, No 22, ISSN 16121430, Karlsruhe Qi Yu et al (2015) Tracing database usage: Detecting main paths in database link networks, Journal of Informetrics, (2015), p 1-15 (Ngày Tòa soạn nhận bài: 10-3-2017; Ngày phản biện đánh giá: 28-4-2017; Ngày chấp nhận đăng: 28-6-2017) THÔNG TIN VÀ TƯ LIỆU - 4/2017 21 ... số trắc lượng thư mục Trong chưa có sở liệu quan hệ mẫu, viết phân tích, thiết kế sở liệu quan hệ phù hợp với công tác trắc lượng thư mục Đại học Quốc gia Hà Nội Phân tích sở liệu trắc lượng thư. .. tích sở liệu trắc lượng thư mục Phân tích sử dụng số trắc lượng thư mục phân thành: (i) trắc lượng thư mục mô tả; (ii) trắc lượng thư mục đánh giá Trong trắc lượng thư mục mô tả theo tiếp cận từ... ràng, trắc lượng thư mục đánh giá đặt yêu cầu cao chất lượng liệu Tính tốn số trắc lượng thư mục đếm số ấn phẩm trích dẫn Liên quan đến vấn đề có số ý kiến sau: • Cơng việc đề cập số định lượng,