Bài viết đề xuất một giải pháp đề xây dựng kho dữ liệu tập trung về quản lý khoa học và đề xuất một hệ thống để quản lý và vận hành công tác quản lý khoa học công nghệ. Tác giả cũng đề xuất một số giải pháp để phân tích khai phá kho dữ liệu đề xuất ở trên để nhằm nâng cao chất lượng công tác nghiên cứu khoa học trong Nhà trường phù hợp với nhu cầu thực tiễn.
TẠP CHÍ KHOA HỌC CƠNG NGHỆ GIAO THƠNG VẬN TẢI, SỐ 20 - 08/2016 ĐỀ XUẤT MƠ HÌNH TỔ CHỨC QUẢN LÝ KHO DỮ LIỆU CƠNG TRÌNH KHOA HỌC VÀ CÔNG NGHỆ TẠI TRƯỜNG ĐẠI HỌC GIAO THÔNG VẬN TẢI THÀNH PHỐ HỒ CHÍ MINH PROPOSED ORGANIZATIONAL MODEL DATA STORAGE MANAGEMENT PROJECTS THE SCIENCE AND TECHNOLOGY IN HO CHI MINH CITY UNIVERSITY OF TRANSPORT Vũ Ngọc Bích(1), Đặng Nhân Cách(2), Hồ Hải Vinh(3) Phòng Khoa học cơng nghệ - Nghiên cứu Phát triển (2) Trung tâm Dữ liệu Cơng nghệ thơng tin (1), (3) Tóm tắt: Trong năm qua, công tác nghiên cứu khoa học, xuất tạp chí, viết giáo giáo trình Trường Đại học Giao thơng vận tải Thành phố Hồ Chí Minh có đóng góp đáng kể vào giải nhu cầu thực tiễn Nhà trường, địa phương Bộ - Ngành Tuy nhiên, việc tổ chức quản lý vận hành chưa hiệu Chúng ta lưu trữ file rải rác đơn vị khác Bài viết đề xuất giải pháp đề xây dựng kho liệu tập trung quản lý khoa học đề xuất hệ thống để quản lý vận hành công tác quản lý khoa học công nghệ Tác giả đề xuất số giải pháp để phân tích khai phá kho liệu đề xuất để nhằm nâng cao chất lượng công tác nghiên cứu khoa học Nhà trường phù hợp với nhu cầu thực tiễn Từ khóa: Kho liệu, khai phá liệu, hệ hỗ trợ định, hệ tư vấn Abstract: Scientific research in universities is among the criteria for assessing the quality of higher education, especially in the current context Over the years, the scientific research activity of Ho Chi Minh City University of Transport has made a significant contribution to solving the practical needs of The university, locality as well as ministries - sectors However, the quantity of research works hasn’t been corresponding to the potential of our teaching staff, students, and graduate students Also, the quality of the studies doesn’t satisfy our desire The paper outlines the current status of the scientific research activity at Ho Chi Minh City University of Transport, analyze the causes, and propose some solutions in order to improve the quality of the scientific research activity at the university in accordance with practical needs Keywords: Data warehouse, data mining, making a decision system, recommender system Giới thiệu Trong năm qua, công tác nghiên cứu khoa học, xuất tạp chí, viết giáo trình Trường Đại học Giao thơng vận tải Thành phố Hồ Chí Minh có đóng góp đáng kể vào giải nhu cầu thực tiễn Nhà trường, địa phương Bộ - Ngành Chiến lược phát triển dài hạn (2010 - 2020) tầm nhìn đến năm 2030 [1] báo [2] xác định Nhà trường cần tăng cường công tác nghiên cứu khoa học (NCKH) quản lý khoa học Tuy nhiên, này, việc tổ chức quản lý vận hành chưa hiệu Bài viết đề xuất giải pháp để xây dựng kho liệu tập trung quản lý khoa học đề xuất hệ thống để quản lý - vận hành công tác quản lý khoa học công nghệ Tác giả đề xuất số giải pháp để phân tích khai phá kho liệu đề xuất để nhằm nâng cao chất lượng công tác nghiên cứu khoa học Nhà trường phù hợp với nhu cầu thực tiễn Cơ sở lý thuyết vấn đề liên quan 2.1 Kho liệu Kho liệu (Data Warehouse - DW) hệ thống sở liệu (kho liệu) máy tính thiết kế, xếp có mục đích định hướng rõ ràng tổ chức nhằm mục đích quản lý, cung cấp thơng tin cách kịp thời, xác, đồng thời tảng cho việc xây dựng ứng dụng phân tích liệu, hỗ trợ định [3] Theo John Ladley [4], Công nghệ kho liệu (Data Warehouse Technology) tập phương pháp, kỹ thuật cơng cụ kết hợp, hỗ trợ để cung cấp thông tin cho người sử dụng sở tích hợp từ Journal of Transportation Science and Technology, Vol 20, Aug 2016 nhiều nguồn liệu, nhiều môi trường khác Trong năm qua, đặc biệt giai đoạn 2011 - 2015, công tác NCKH Nhà trường đạt kết đáng khích lệ số lượng chất lượng (bảng 1, 2, 3, 5), phần đáp ứng nhu cầu ngành giao thông vận tải, mặt khác góp phần giải số vấn đề công tác giảng dạy học tập hợp tác, liên kết quốc tế đào tạo Nhà trường Bảng Số lượng đề tài NCKH giai đoạn 2011-2015 Năm Cấp Bộ 07 07 08 06 05 2011 2012 2013 2014 2015 Loại đề tài NCKH/Dự án Cấp Cơ sở 14 15 24 12 39 Sinh viên 14 16 17 24 16 Nguồn: Báo cáo thống kê - phòng KHCN-NC&PT Bảng Số cán giảng viên, người học tham gia NCKH giai đoạn 2011-2015 Năm Cấp Bộ 85 80 96 76 68 2011 2012 2013 2014 2015 Loại đề tài NCKH/Dự án Cấp Cơ sở 70 75 120 36 103 Sinh viên 56 62 66 70 58 Nguồn: Báo cáo thống kê - phòng KHCN-NC&PT Bảng Số báo khoa học cơng bố Tạp chí/Hội nghị, hội thảo khoa học giai đoạn 2011-2015 Số báo khoa học đăng tạp chí khoa học chuyên ngành Năm 2011 2012 2013 2014 2015 Số báo khoa học đăng kỷ yếu hội nghị, hội thảo Quốc tế Quốc gia Quốc tế Quốc gia 08 08 13 17 23 46 51 89 102 91 14 18 13 15 05 13 68 79 105 Nguồn: Báo cáo thống kê - phòng KHCN-NC&PT Bảng Số giáo trình, giảng đăng ký biên soạn giai đoạn 2011-2015 Loại giáo trình/bài giảng Năm 2011 2012 2013 2014 2015 Giáo trình Bài giảng 10 08 04 14 13 02 05 07 28 18 Tài liệu tham khảo/bài tập 01 01 01 Nguồn: Báo cáo thống kê - phòng KHCN-NC&PT TẠP CHÍ KHOA HỌC CƠNG NGHỆ GIAO THÔNG VẬN TẢI, SỐ 20 - 08/2016 Bảng Số lượng báo đăng tạp chí, ấn phẩm xuất có số, giai đoạn 2011-2015 Loại ấn phẩm Năm 2011 2012 2013 2014 2015 Tạp chí Kỷ yếu hội nghị có số Kỷ yếu hội nghị khơng có ISBN số ISBN 19 101 118 106 76 45 81 - Nguồn: Báo cáo thống kế - phòng KHCN-NC&PT Việc quản lý đề tài, báo, giáo trình, tài liệu tham khảo chủ yếu cứng, thông tin đăng tải mạng nội dừng lại mức thống kê Với tốc độ phát triển ngày nhiều đề tài, cơng trình nghiên cứu,… việc quản lý triển khai, khai thác không đáp ứng nhu cầu thực tiễn, mặt khác việc truy xuất liệu phục vụ báo cáo khoa học công nghệ tốn nhiều thời gian, bất tiện, khơng khoa học Vì vậy, việc xây dựng kho liệu tập trung quản lý KHCN nhu cầu tất yếu để khắc phục hạn chế 2.2 Khai phá liệu Khai phá liệu (Data mining) [5] trình khám phá tri thức tri thức có ích dạng tiềm nguồn liệu có Khai phá liệu bước trình khai thác tri thức (Knowledge Discovery Process), bao gồm: - Xác định vấn đề không gian liệu để giải vấn đề (Problem understanding and data understanding) - Chuẩn bị liệu (Data preparation), bao gồm trình làm liệu (data cleaning), tích hợp liệu (Data integration), chọn liệu (Data selection), biến đổi liệu (Data transformation) - Khai thác liệu (Data mining): Xác định nhiệm vụ khai thác liệu lựa chọn kỹ thuật khai thác liệu Kết cho ta nguồn tri thức thô - Đánh giá (Evaluation): Dựa số tiêu chí tiến hành kiểm tra lọc nguồn tri thức thu - Triển khai (Deployment) Q trình khai thác tri thức khơng trình từ bước đến bước cuối mà trình lặp có quay trở lại bước qua Mơ hình quản lý khoa học cơng nghệ 3.1 Kho liệu Kho liệu Chúng thiết kế mô hình kho liệu KHCN có cấu trúc, dựa liệu có sẵn Nhà trường đưa tất tập trung vào kho liệu Tất yêu cầu truy xuất đến liệu kho liệu cho kết nối theo chuẩn quy định Ngồi bốn mơ đun chức thiết kế để phục vụ cho công tác quản lý khoa học chúng tơi tạo cổng giao tiếp riêng cho phép ứng dụng khác kết nối vào để truy vấn liệu Hình Mơ hình kho liệu KHCN 3.2 Hệ thống quản lý KHCN - Quản lý đề tài: Cho phép quản lý tất loại đề tài CB - CNV trường như: Đề cấp sơ cở; đề cấp bộ; đề tài cấp nhà nước….Chức hỗ trợ tốt Journal of Transportation Science and Technology, Vol 20, Aug 2016 cho phép chọn lọc đề tài nghiệm thu, hay chưa nghiệm thu… - Quản lý tạp chí: Tất báo số tạp chí tổ chức quản lý theo số xuất tạp chí theo định kỳ Từ đó, dễ dàng tìm kiếm báo cho lúc cần thiết - Quản lý báo: Tất báo hội nghị, báo tạp chí nước hay quốc đề tổ chức cập nhật thường xuyên thông qua chức - Quản lý giáo trình: Quản lý tất giảng chi tiết hay giáo trình Nhà trường nhằm phục vụ sinh viên… 3.3 Phân tích liệu Trên sở mô đun thiết kế cho phép tương tác qua kho liệu như: Thêm, xóa sửa, cập nhật thơng tin Với liệu ngày cập nhật thêm vào, sở đó, trích xuất khai phá, phân tích liệu để hỗ trợ định hay đưa tư vấn cho vấn đề liên quan đến cơng tác KHCN Có thể dựa thuật toán đưa thống kê phân tích tự động nhanh chóng Hoặc trích xuất xử dụng cơng cụ hỗ trợ phân tích Weka [6] để phân tích Kết luận Trong báo này, tác giả giới thiệu mơ hình tổng quan việc quản lý hoạt động KHCN Nhà trường Như: Xây dựng kho liệu KHCN tập trung; giới thiệu hệ thống kết nối đến kho liệu tập trung đưa số giải pháp để phân tích khai phá liệu khoa học nhằm phục vụ công tác Nhà trường Nếu thực đồng giải pháp nêu chắn, tranh KHCN Trường ta ngày sáng nét hơn; kết mà NCKH chuyển giao cơng nghệ tạo chắn có chất lượng cao, đủ khả ứng dụng, góp phần giải vấn đề quan trọng địa phương, ngành, quốc gia, mà trước mắt góp phần đắc lực nâng cao công tác quản lý KH CN Nhà trường Tài liệu tham khảo [1] Kế hoạch chiến lược phát triển dài hạn (2010-2020) tầm nhìn đến năm 2030, Trường Đại học Giao thông vận tải Thành phố Hồ Chí Minh [2] Vũ Ngọc Bích, Hồ Hải Vinh, Nguyễn Hải Dương, Nâng cao chất lượng công tác nghiên cứu khoa học trường đại học Giao thơng vận tải Tp Hồ Chí Minh, Tạp chí khoa học công nghệ giao thông vận tải, số 13, tháng 11/2014, trang 03-06 [3] Nguyễn Vân Anh, Lê Vũ Toàn (2012), Tạp chí hoạt động khoa học –Bộ KH&CN, số ISSN 1859-4794, số 635, tháng 4/2012, trang 57-60 [4] Bischoff, J and T Alexander, Data warehouse: practical advice from the experts1997: Prentice-Hall, Inc [5] https://vi.wikipedia.org/wiki/Khai_phá_dữ_lliệu [6] https://en.wikipedia.org/wiki/Weka_(machine_lea rning) Ngày nhận bài: 25/07/2016 Ngày chuyển phản biện: 29/07/2016 Ngày hoàn thành sửa bài: 16/08/2016 Ngày chấp nhận đăng: 23/08/2016 ... Nguyễn Hải Dương, Nâng cao chất lượng công tác nghiên cứu khoa học trường đại học Giao thơng vận tải Tp Hồ Chí Minh, Tạp chí khoa học cơng nghệ giao thơng vận tải, số 13, tháng 11/2014, trang 03-06... khác kết nối vào để truy vấn liệu Hình Mơ hình kho liệu KHCN 3.2 Hệ thống quản lý KHCN - Quản lý đề tài: Cho phép quản lý tất loại đề tài CB - CNV trường như: Đề cấp sơ cở; đề cấp bộ; đề tài cấp... mà trình lặp có quay trở lại bước qua Mơ hình quản lý khoa học cơng nghệ 3.1 Kho liệu Kho liệu Chúng thiết kế mơ hình kho liệu KHCN có cấu trúc, dựa liệu có sẵn Nhà trường đưa tất tập trung vào