- Mục tiêu của bảo quản tài liệu điện tử bao gồm: Bảo quản các loại tài liệu điện tử từ nguồn: Được tạo lập từ việc sử dụng bất kỳ loại ứng dụng nào;
3. Vai trò, trách nhiệm của PAC trong lƣu trữ tài liệu số
3.2. Ứng dụng CNTT trong quản lý và khai thác tài liệu
3.2.1. Ứng dụng CNTT trong công tác Quản lý tài liệu
Được sự quan tâm của Tập đoàn, việc ứng dụng công nghệ thông tin trong quản lý, khai thác tài liệu đã được Trung tâm đầu tư một cách bài bản từ trang thiết bị máy móc cho đến các phần mềm chuyên dụng. Hiện nay, Trung tâm đang sử dụng các loại phần mềm để quản lý, khai thác tài liệu là các phần mềm chuyên dụng cho ngành Dầu khí, được phát triển bởi các công ty Dầu khí nổi tiếng trên thế giới, bao gồm:
68
- Phần mềm eSearch: Quản lý đối tượng trong kho (tài liệu, mẫu vật,…), phân cấp, phân quyền User truy cập khai thác, sử dụng;
- Phần mềm Prosource Enterprise (PSE): Quản lý dữ liệu thăm dò khai thác;
- Phần mềm Prosource Log (PSL): Quản lý dữ liệu Địa vật lý giếng khoan; - Phần mềm Prosourcer Seismic (PSS): Quản lý dữ liệu Địa chấn.
Trung tâm đã đầu tư trang bị hệ thống máy chủ, hệ thống lưu trữ trực tuyến; hệ thống sao chép băng từ và đã khai thác sử dụng khá hiệu quả. Tài liệu được Trung tâm phân loại theo từng lĩnh vực chuyên môn và quản lý trên các phần mềm phù hợp như:
- Đối với việc quản lý kho vật lý, kho điện tử và bộ siêu dữ liệu (Meta Data) cho mỗi thực thể tài liệu có thể tồn tại một hoặc nhiều định dạng: cứng (giấy, film, đất đá), điện tử (TIF, PDF, CGM…), số (DOC, XLS,…), PAC dùng phần mềm eSearch.
- Đối với tài liệu địa vật lý giếng khoan dạng số (DLIS, LAS…), PAC sử dụng phần mềm Prosource Log, cho phép quản lý nội dung toàn file số cho đến chi tiết từng đoạn của đường cong của mỗi phương pháp.
- Đối với tài liệu Địa chấn dạng số, PAC sử dụng phần mềm Prosource Seismic để quản lý, hiệu chỉnh thông số header parameter đảm bảo kết xuất dữ liệu không vi phạm quy chế bảo mật chính xác đến từng điểm nổ và chuẩn cho các phần mềm chuyên dụng minh giải, phân tích.
- Đối với dữ liệu thăm dò và khai thác, quản lý thông tin ở mức gia tăng giá trị tài liệu, Trung tâm sử dụng phần mềm Prosource Enterprise.
3.2.2. Ứng dụng CNTT trong công tác Khai thác tài liệu a) Nguyên tắc khai thác
Phần lớn tài liệu tại Trung tâm được quản lý theo chế độ tài liệu MẬT, dung lượng file dữ liệu lớn, vì vậy việc tổ chức khai thác tài liệu chuyên ngành trên máy tính được thực hiện giới hạn trong phạm vi mạng nội bộ (LAN) của Trung tâm, máy tính kết nối cơ sở dữ liệu (CSDL) không kết nối internet.
69
Ngoài ra để tạo điều kiện thuận lợi cho người sử dụng trong một số trường hợp cần thiết dữ liệu chuyên ngành có thể được truyền qua kênh đường cơ yếu.
b) Khai thác tài liệu
Phần lớn tài liệu chuyên ngành đã được điện tử hóa, nên Trung tâm chủ yếu khai thác trên tài liệu điện tử. Trung tâm được Tập đoàn trang bị hệ thống lưu trữ tài liệu điện tử tương đối hoàn chỉnh, không những đáp ứng được nhu cầu khai thác, sử dụng tài liệu một cách nhanh chóng, thuận tiện và hiệu quả cao mà còn đảm bảo được vấn đề an toàn, bảo mật đối với tài liệu.
Dữ liệu điện tử được lưu trữ vào máy chủ lưu trữ với cấu hình RAID 5, đảm bảo an toàn tài liệu cao và được sao lưu (backup) định kỳ hàng tuần bằng hệ thống sao lưu trực tuyến (Net Backup Online) và được sao chép ra thành 2 bộ, được lưu tại Hà Nội và cơ sở của Trung tâm tại thành phố Hồ Chi Minh.
Hình 2: Mô hình lưu trữ tài liệu điện tử
Nội dung tài liệu điện tử được lưu vào Máy chủ lưu trữ, để khai thác được Trung tâm sử dụng phầm mềm eSearch - Phần mềm chuyên về quản lý tài liệu, quản trị, phân quyền cho từng người dùng theo Tên truy cập/mã số (user/password), theo dõi tình trạng tài liệu,…
70
c) Khai thác dữ liệu số
Bên cạnh việc khai thác các tài liệu truyền thống là các báo cáo, bản vẽ bản điện tử, Trung tâm hướng tới việc khai thác các dữ liệu số được quản lý trong phần mềm PSE, PSL, PSS như đã được trình bày ở trên.
Bằng việc cung cấp dịch vụ khai thác dữ liệu số, các nhà thầu/đơn vị khi đến PAC tham khảo tài liệu sẽ khai thác dữ liệu hiệu quả hơn, rút ngắn thời gian tìm hiểu, tra cứu thu thập, liên kết thông tin.