Đề xuất về tiêu chí dữ liệu trên hệ tri thức Việt số hóa

4 1 0
Đề xuất về tiêu chí dữ liệu trên hệ tri thức Việt số hóa

Đang tải... (xem toàn văn)

Thông tin tài liệu

Hệ tri thức Việt số hoá là một đề án của Chính phủ nhằm mục tiêu xây dựng nền tảng dữ liệu dùng chung trong các lĩnh vực khoa học, công nghệ và kinh tế - xã hội. Bài báo này trao đổi và đề xuất các tiêu chí đối với một số loại dữ liệu đang được đưa lên chia sẻ trên Hệ tri thức Việt số hoá

NGHIÊN CỨU - TRAO ĐỔI ĐỀ XUẤT VỀ TIÊU CHÍ DỮ LIỆU TRÊN HỆ TRI THỨC VIỆT SỐ HÓA ThS Nguyễn Mạnh Duy Bộ Khoa học Cơng nghệ Tóm tắt: Hệ tri thức Việt số hoá đề án Chính phủ nhằm mục tiêu xây dựng tảng liệu dùng chung lĩnh vực khoa học, công nghệ kinh tế - xã hội Để lựa chọn liệu đạt tiêu chuẩn để đưa lên Hệ tri thức Việt số hoá, cần xây dựng tiêu chí chuẩn cho loại liệu cụ thể nhằm tạo thuận lợi thống trình thu thập, xử lý, quản trị chia sẻ liệu Bài báo trao đổi đề xuất tiêu chí số loại liệu đưa lên chia sẻ Hệ tri thức Việt số hố Từ khóa: Hệ tri thức Việt số hố; liệu mở; tiêu chí liệu PROPOSAL ON STANDARD DATA CRITERIA OF VIETNAMESE DIGITAL KNOWLEDGE PLATFORM Abstract: The Vietnamese Digital Knowledge Platform is a project of the Government aimed at building a shared data platform in the fields of science, technology and socio-economics In order to select qualified data to upload to the digitized Vietnamese Digital Knowledge Platform, it is necessary to develop a set of standard criteria for specific types of data in order to facilitate and unify in the process of collection and processing, managing and data sharing This article discusses and proposes criteria for some types of data being shared on the platform Keywords: Vietnamese Digital Knowledge Platform; open data; data criteria MỞ ĐẦU Đề án “Phát triển Hệ tri thức Việt số hóa” phê duyệt theo Quyết định số 677/QĐ-TTg ngày 18 tháng năm 2017 Thủ tướng Chính phủ Đây hoạt động cụ thể nhằm triển khai Chỉ thị 16/CT-TTg Thủ tướng Chính phủ tăng cường lực tiếp cận Cách mạng công nghiệp lần thứ tư Mục tiêu Đề án xây dựng tảng liệu tri thức lĩnh vực, lĩnh vực liên quan trực tiếp đến đời sống người dân giáo dục, y tế, chăm sóc sức khỏe, nơng nghiệp, văn hóa,… nhằm tạo điều kiện cho học tập, làm chủ tri thức, nghiên cứu phát triển ứng dụng công nghệ thông tin tảng AI BigData phục vụ cho cộng đồng xã hội Đề án thử nghiệm triển khai thành công mơ hình hợp tác nhà nước - viện trường - doanh nghiệp - cộng đồng việc phát giải vấn đề cấp thiết đất nước, thông qua việc ứng dụng công nghệ thông tin để tạo dựng tảng liệu dùng chung, huy động tham gia cộng đồng đóng góp tạo lập, khai thác sử dụng liệu Nhiều dự án hình thành khn khổ Đề án, triển khai thử nghiệm thành công chuyển giao cho đơn vị có đủ lực để tiếp tục trì, phát triển Một số dự án liệu dùng chung triển khai Hệ tri thức Việt số hoá gồm: (1) Dự án Dữ liệu khoa học dùng chung: Đây dự án với phối hợp Viện nghiên cứu VinBigdata, Viện Công nghệ thông tin - Viện Hàn Lâm Khoa học Công nghệ Việt Nam số đơn vị liên quan, nhằm xây dựng tảng cho phép lưu trữ, quản lý chia sẻ liệu khoa học mở (openscience) sở ứng dụng công nghệ Cloud Big Data Các liệu nghiên cứu khoa học (raw data) nguồn tài nguyên khoa học quý giá lâu chưa chia sẻ sử dụng rộng rãi Dự án giúp tạo môi trường để tổ chức, cá nhân tham gia đóng góp, sử dụng tài nguyên liệu có giá trị để phục vụ cho hoạt động nghiên cứu khoa học, phát triển công nghệ sản xuất, kinh doanh (2) Dự án Bản đồ số Việt Nam - Vmap: Dự án nhằm tạo lập tảng thu thập chia sẻ liệu đồ (tọa độ) địa danh, địa toàn quốc Đây sơ để doanh nghiệp sử dụng để tạo ứng dụng nhiều lĩnh vực như: giáo dục, văn hóa, du lịch,… Thơng THƠNG TIN VÀ TƯ LIỆU - 1/2023 21 NGHIÊN CỨU - TRAO ĐỔI qua đồ số Việt Nam, người dùng dễ dàng tìm đường cụ thể đến tận lớp địa ngõ, hẻm thôn, xã (3) Dự án Hệ thống thông tin Nhân đạo số - iNhandao: Dự án nhằm tạo lập hệ thống thu thập cung cấp địa nhân đạo toàn quốc, cho phép kết nối người cần trợ giúp với nhà tài trợ người làm công tác thiện nguyện Thông qua hệ thống giúp kết nối người cho, người nhận người làm từ thiện với (4) Dự án Giáo dục số - iGiaoduc: Dự án với mục tiêu xây dựng tảng học liệu số (câu hỏi trắc nghiệm, giảng điện tử, học liệu STEM,…) cho cấp học, góp phần thúc đẩy giáo dục trực tuyến học tập suốt đời Dự án thiết lập tảng Kho học liệu số với 7.000 giảng điện tử (5) Dự án Bách khoa toàn thư số Việt Nam: Dự án với tham gia hợp tác Đề án Hệ tri thức Việt số hóa Đề án Biên soạn Bách khoa tồn thư Việt Nam, nhằm tạo tảng số nhằm kêu gọi cộng đồng chung sức đóng góp tài liệu viết tri thức nhân loại tất lĩnh vực Nền tảng hoạt động nguyên tắc mở, minh bạch tôn vinh cá nhân có đóng góp Đến nay, dự án xây dựng xong tảng bách khoa toàn thư số đưa 60.000 mục từ vào hệ thống kêu gọi cộng đồng tham gia đóng góp chỉnh sửa viết TIÊU CHÍ DỮ LIỆU CỦA HỆ TRI THỨC VIỆT SỐ HÓA Hệ tri thức Việt số hóa Đề án Chính phủ với mục tiêu xây dựng Hệ tri thức tổng hợp lĩnh vực, góp phần thúc đẩy, tạo điều kiện để người dân học tập suốt đời, làm chủ tri thức, tăng cường nghiên cứu sáng tạo, ứng dụng tiến khoa học công nghệ, thúc đẩy phát triển đất nước Hệ tri thức Việt số hóa xây dựng cập nhật theo hình thức xã hội hóa, thu hút khuyến khích người dân doanh nghiệp tham gia, với vai trò vừa khai thác vừa đóng góp để làm giàu tài nguyên tri 22 THƠNG TIN VÀ TƯ LIỆU - 1/2023 thức số hóa Việt Nam Góp phần khơi dậy, lan tỏa niềm đam mê khoa học công nghệ, khát vọng sáng tạo, cống hiến người việc tạo lập phổ biến tri thức Mọi nội dung liên quan Hệ tri thức Việt số hóa lưu giữ đăng tải website: itrithuc.vn Chính sách đăng Itrithuc.vn cho phép người dùng đăng viết ý kiến chủ đề tri thức Mọi người dùng cần phải đăng ký đăng nhập sử dụng tên thật để đăng thảo luận hệ thống Bài viết tác giả hiển thị cơng khai Do đó, website sử dụng sách kiểm duyệt để đảm bảo đăng phù hợp không gây hại cho nhà nước, cộng đồng người khác Các quan điểm thể viết phản ánh quan điểm tác giả không phản ánh quan điểm thức Hệ tri thức Việt số hóa Về nguyên tắc, website đăng liệu người dùng cung cấp, liệu thông tin đưa lên nói chung lịch sự, khách quan, trung lập, có trích dẫn nguồn tài liệu tham khảo rõ ràng tuân thủ quy định quyền sở hữu trí tuệ Website khơng hiển thị đăng: - chứa ngôn ngữ khiêu dâm, khiếm nhã, tục tĩu; - chứa mối đe dọa, tuyên bố phỉ báng; - chứa nội dung vu khống, bôi nhọ lãnh đạo Đảng, Nhà nước, xuyên tạc chủ trương, đường lối Đảng, tuyên truyền chống Nhà nước Cộng hòa xã hội chủ nghĩa Việt Nam; - chứa lời nói phân biệt chủng tộc, màu da, giới tính, nguồn gốc quốc gia, dân tộc, tuổi tác, tơn giáo tàn tật; - tiết lộ thông tin cá nhân/nhạy cảm người khác mà khơng phép (ví dụ: số điện thoại, CMT,…); - chứa thông tin đăng vi phạm pháp luật, khuyến khích hoạt động bất NGHIÊN CỨU - TRAO ĐỔI hợp pháp tiết lộ thông tin mật Nhà nước; - quảng cáo dịch vụ sản phẩm, bao gồm liên kết đến trang web thương mại bên (lưu ý liên kết phi thương mại có liên quan đến chủ đề đăng chấp nhận được); - chứa nội dung nằm chủ đề, spam chủ yếu nhằm quảng bá liên kết Người dùng khơng đăng tài liệu có quyền hay thương hiệu lên website trừ trường hợp chứng minh phép làm Bằng cách gửi đăng tác phẩm mình, tác giả cho phép xem website Hệ tri thức quyền chép, phân phối, tạo dẫn xuất, hiển thị trình diễn tác phẩm người đăng cách cơng khai miễn phí Đối với đăng vi phạm quy định nêu trên, website có quyền yêu cầu tác giả chỉnh sửa nội dung cho phù hợp xóa bỏ đăng mà không cần phải thông báo trước cho tác giả Liên kết tới Hệ tri thức Itrithuc.vn trang web thức Hệ tri thức Việt số hóa Bạn liên kết tới itrithuc.vn miễn phí Khi bạn liên kết tới itrithuc.vn, vui lòng giới thiệu website cổng tri thức miễn phí cho người họ cần tìm liệu, thơng tin, kiến thức thuộc lĩnh vực Dữ liệu mở Kho liệu mở thuộc đề án Hệ tri thức Việt số hóa nguồn lực chiến lược quốc gia, với tham gia đóng góp quan Nhà nước, tổ chức, doanh nghiệp người dân Dữ liệu mở liệu tự sử dụng, sử dụng lại phân phối lại, yêu cầu ghi nhận nguồn chia sẻ tương tự Đối với quan nhà nước, liệu mở giúp Chính phủ cải thiện tính minh bạch cơng khai, giúp cải tiến quy trình quản lý, tổ chức liệu, tăng hiệu hoạt động quan Các doanh nghiệp dựa vào nguồn liệu mở để tối ưu hoá hoạt động kinh doanh, cải tiến tiếp thị phát triển sản phẩm Dữ liệu mở mở giúp định hướng đầu tư kinh doanh, cải thiện hội việc làm thúc đẩy tăng trưởng kinh tế Đối với người dân, liệu mở giúp người dân có thơng tin cần thiết để so sánh đối chiếu, tạo điều kiện thuận lợi cho thực quyền dân chủ tham gia quản lý Dữ liệu mở quan nhà nước bao gồm liệu thông tin tạo ra, thu thập, xử lý, phổ biến quan nhà nước Các liệu cần đảm bảo nguyên tắc sau đây: Sẵn có, Cơng khai, Có cấu trúc, Cho phép người dùng tái sử dụng không hạn chế Mỗi quan, tổ chức cử 01 đầu mối để cung cấp (upload) liệu đơn vị lên Hệ tri thức Đồng thời hỗ trợ hướng dẫn người dùng sử dụng liệu cách Bản quyền liệu mở thuộc tổ chức cá nhân phát hành chúng, đó, sử dụng liệu người dùng cần trích dẫn nguồn phù hợp tơn trọng quyền sở hữu trí tuệ Đảm bảo chất lượng liệu Hệ tri thức khuyến khích người dùng đăng viết tác phẩm có giá trị chất lượng cao, cung cấp tri thức khoa học hữu dụng, văn phong mạch lạc sử dụng từ ngữ dễ hiểu, khách quan, trích dẫn nguồn tư liệu rõ ràng Bên cạnh đó, website sử dụng cơng cụ tự động đội ngũ chuyên gia để đánh giá chất lượng đăng Các đăng kiểm định chất lượng gắn tem đánh dấu để người dùng nhận biết Yêu cầu liệu dùng chung Dữ liệu dùng chung loại liệu bộ, ngành, địa phương thu thập tạo q trình hoạt động công khai cho công chúng truy cập khai thác mà khơng có hạn chế Dữ liệu dùng chung bao gồm liệu Bộ, ngành, địa phương quan, tổ chức trực thuộc Dữ liệu dùng chung phải liệu phân tích, xử lý, khai thác để tạo giá trị gia tăng Tức là, khơng THƠNG TIN VÀ TƯ LIỆU - 1/2023 23 NGHIÊN CỨU - TRAO ĐỔI bao gồm loại thơng tin, liệu mang tính chất tin tức, thơng báo, báo cáo,… Dữ liệu dùng chung đảm bảo an tồn, an ninh thơng tin, khơng tiết lộ bí mật nhà nước thông tin cá nhân Dữ liệu dùng chung cung cấp dạng máy đọc được, tức có gắn kèm siêu liệu mơ tả (metadata) giúp người dùng sử dụng cơng cụ để đọc khai phá liệu Trách nhiệm Bộ, ngành, địa phương Lập danh sách mô tả tất loại liệu mà Bộ, ngành, địa phương cơng khai chia sẻ khơng hạn chế truy cập Danh sách phải đăng công khai lên trang dành riêng cho bộ, ngành, địa phương website Hệ tri thức Việt số hóa bao gồm thơng tin sau đây: - Tên liệu - Mô tả nội dung liệu - Tần suất cập nhật - Địa URL liệu (link tới website chứa liệu webservice) - Các điều khoản điều kiện sử dụng liệu - Thông tin đầu mối liên hệ trường hợp người dùng cần thêm thông tin dẫn liệu Hằng năm, Bộ, ngành, địa phương có trách nhiệm cập nhật danh sách Ngoài ra, Bộ, ngành đăng tải (upload) liệu dùng chung bộ, ngành, địa phương lên Hệ tri thức Việt số hóa theo danh sách liệu tần suất cập nhật công bố công khai Trong trường hợp liệu có sẵn dạng sở liệu đặt quan chủ quản cung cấp địa URL liên kết tới nguồn liệu webservice để khai thác liệu KẾT LUẬN Hệ tri thức Việt số hóa Đề án Chính phủ với mục tiêu xây dựng Hệ tri thức tổng hợp lĩnh vực, góp phần thúc đẩy, tạo điều kiện để người dân học tập suốt đời, làm chủ tri thức, tăng cường nghiên cứu sáng tạo, ứng dụng tiến 24 THÔNG TIN VÀ TƯ LIỆU - 1/2023 khoa học công nghệ, thúc đẩy phát triển đất nước Hệ tri thức Việt số hóa xây dựng cập nhật theo hình thức xã hội hóa, thu hút khuyến khích người dân doanh nghiệp tham gia, với vai trị vừa khai thác vừa đóng góp để làm giàu tài nguyên tri thức số hóa Việt Nam Góp phần khơi dậy, lan tỏa niềm đam mê khoa học công nghệ, khát vọng sáng tạo, cống hiến người việc tạo lập phổ biến tri thức Hệ tri thức Việt số hóa cho phép người dùng đăng viết ý kiến chủ đề tri thức Mọi người dùng cần phải đăng ký đăng nhập sử dụng tên thật để đăng thảo luận hệ thống Đề án khuyến khích người dùng chia sẻ kiến thức suy nghĩ chủ đề đưa thảo luận câu hỏi Bài viết bạn hiển thị cơng khai Do đó, website sử dụng sách kiểm duyệt để đảm bảo đăng bạn phù hợp không gây hại cho nhà nước, cộng đồng người khác Về nguyên tắc chung, Đề án mong liệu đưa lên từ phía người dùng phải đảm bảo yếu tố khách quan, trung lập, có trích dẫn nguồn tài liệu tham khảo rõ ràng tuân thủ quy định quyền sở hữu trí tuệ TÀI LIỆU THAM KHẢO Quyết định số 677/QĐ-TTg ngày 18/5/2017 Thủ tướng Chính phủ phê duyệt Đề án “Phát triển Hệ tri thức Việt số hoá” http://opendatahandbook.org/guide/en/ how-to-open-up-data/ https://yourdatastories.eu/the-eu-opendata-handbook/ https://opendatacharter.net/principles/ https://project-open-data.cio.gov/principles/ EU open dataThe basics for EU data providers (2016 EDITION) (Ngày Tòa soạn nhận bài: 15-122022; Ngày phản biện đánh giá: 6-01-2023; Ngày chấp nhận đăng: 15-01-2023)

Ngày đăng: 11/04/2023, 15:06

Tài liệu liên quan