báo cáo về tài liệu trong môi trường cơ sở dữ liệu
Lược dịch từ “Cẩm nang quản lý tài liệu điện tử” TS. Nguyễn Lệ Nhung 0912581997 www.vanthuluutru.com 45 6. Tài liệu trong môi trường cơ sở dữ liệu 6.1. Các cơ sở dữ liệu - nội dung, cấu trúc và bối cảnh Một cơ sở dữ liệu là một tập hợp có tổ chức (có cấu trúc) của các dữ liệu có liên quan với nhau. Cơ sở dữ liệu bao gồm 2 phần cơ bản là các phần tử hay từng phần dữ liệu riêng biệt có chứa trong cơ sở dữ liệu (nội dung), và các cấu trúc để tổ chức các phần dữ liệu đó. Cả nội dung và các cấu trúc là những phần đặc biệt quan trọng của các tài liệu cơ sở dữ liệu. Ở một hình thái đơn giản nhất của mình, một cơ sở dữ liệu là một cuốn sổ đăng ký. Như vậy, một số cơ sở dữ liệu có bản song trùng ở dưới dạng các sổ đăng ký trên giấy truyền thống (chẳng hạn như sổ đăng ký ở giáo xứ và các tài liệu cá nhân khác) và các tệp (hồ sơ). Một số khác có cấu trúc quá phức tạp để có thể so sánh với bất kỳ loại tài liệu nào ở thế giới giấy truyền thống. Một cơ sở dữ liệu được tổ chức một cách lô gíc như là một bảng với các cột hàng ngang và hàng dọc. Các cơ sở dữ liệu hiện đại phức tạp hơn bao gồm một số bảng có quan hệ qua lại với nhau và ngoài ra, còn có các chỉ dẫn tham chiếu từ thông tin ở một bảng này sang thông tin tương ứng ở bảng khác. Ví dụ, trong một cơ sở dữ liệu về người lao động thông thường sẽ có một bảng với những thông tin cơ bản về từng người lao động, một bảng mô tả vị trí công tác mà một người lao động có thể nắm giữ, một bảng xác định từng phòng, ban mà một vị trí có thể liên kết với v.v . Sau đó, đối với từng người trong bảng người lao động sẽ có một chỉ dẫn tham chiếu về vị trí làm việc của người đó ở bảng vị trí và từ đó có một chỉ dẫn tham chiếu tới phòng, ban (trong bảng phòng, ban) của vị trí công tác đó. Những chỉ dẫn như vậy có nhiều kiểu khác nhau. Một số trong đó hoàn toàn phụ thuộc vào phần mềm và đôi khi là cả phần cứng. Tuy nhiên, đa số các cơ sở dữ liệu hiện đại đã được chuẩn hoá dựa trên các nguyên tắc của các cơ sở dữ liệu quan hệ - tức là, chỉ dẫn từ một bảng này sang bảng khác chính là chìa khoá nhận diện của yếu tố mà nó muốn đề cập tới - một nguyên tắc độc lập với phần cứng và phần mềm. Sự phát triển của các cơ sở dữ liệu đã đi từ những cơ sở dữ liệu đơn giản và chưa được chuẩn hoá (thế hệ thứ nhất) cho tới các cơ sở dữ liệu quan hệ phức tạp hơn và chuẩn hoá (thế hệ thứ ba?). Tuy nhiên, cấu trúc lô gíc chính - các bảng với các hàng ngang và hàng dọc và các chỉ dẫn theo một dạng nào đó giữa các bảng - thì hoàn toàn giống nhau và các cơ sở dữ liệu cũ chưa chuẩn hoá trong nhiều trường hợp có thể (và chắc hẳn là cần phải) được chuyển đổi sang một cấu trúc cơ sở dữ liệu quan hệ để xử lý chúng bằng các phần mềm tiêu chuẩn. Tuy vậy, các cơ sở dữ liệu hiện đại ngày càng phát triển vượt ra ngoài cấu trúc cơ sở dữ liệu quan hệ, chẳng hạn như chúng kết hợp các tệp văn bản, các ảnh và âm thanh v.v . Những hệ thống liên hợp thống nhất như vậy, bao gồm cả hypertext, các hệ thống đa phương tiện, các cơ sở dữ liệu phân tán và các cơ sở dữ liệu hướng đối tượng sẽ không được xem xét cụ thể ở đây. Lược dịch từ “Cẩm nang quản lý tài liệu điện tử” TS. Nguyễn Lệ Nhung 0912581997 www.vanthuluutru.com 46 Theo các nguyên tắc được thừa nhận rộng rãi trong việc phát triển hệ thống thì một sơ đồ lô gíc hay một mô hình dữ liệu lô gíc sẽ được xây dựng và nó xác định những dữ liệu nào sẽ được đưa vào hệ thống và chúng sẽ được tổ chức như thế nào. Sơ đồ đó cần phải có trước khi bất kỳ một hoạt động áp dụng cơ sở dữ liệu nào. Việc áp dụng, hay nói cách khác là cấu trúc lô gíc của cơ sở dữ liệu, cần chứa đựng sơ đồ lô gíc. Tuy nhiên, đôi khi cấu trúc lô gíc của cơ sở dữ liệu không tuân thủ một cách chính xác theo sơ đồ lô gíc do những khiếm khuyết của các phần mềm hiện có. Cả sơ đồ lô gíc, có vai trò hướng dẫn cho việc thiết kế cơ sở dữ liệu, cũng như cấu trúc lô gíc của cơ sở dữ liệu đó khi được áp dụng sẽ phải được duy trì trong cùng một khoảng thời gian mà bất kỳ một dữ liệu nào được duy trì nhằm bảo đảm rằng cơ sở dữ liệu có thể đóng một vai trò như một hệ thống tài liệu. Sơ đồ lô gíc đối với cơ sở dữ liệu cũng đồng thời là những thông tin bối cảnh đặc biệt quan trọng, liên kết cơ sở dữ liệu với các chức năng hoạt động và các nhu cầu mà nó phục vụ. Cấu trúc lô gíc của cơ sở dữ liệu, một khi được áp dụng, sẽ là thông tin cấu trúc cần thiết để truy nhập, tiếp cận khai thác và diễn giải một cách đúng đắn những dữ liệu trong cơ sở dữ liệu. Các cấu trúc cơ sở dữ liệu, ngoài những cấu trúc lô gíc nói trên, còn có các cấu trúc trình bày/biểu thị. Trong khi các cấu trúc lô gíc dùng để tổ chức các dữ liệu để lưu trữ và xử lý thì các cấu trúc trình bày là những cấu trúc có thể nhìn thấy được mà các cá nhân sử dụng để nhập dữ liệu vào cơ sở dữ liệu và để tiếp cận khai thác và xem dữ liệu. Các cấu trúc này bao gồm các biểu mẫu, báo cáo, bản câu hỏi, khuôn hình và các tệp thu được. Nội dung (các dữ liệu) của một cơ sở dữ liệu có thể và thường là sẽ thay đổi theo thời gian. Trong thực tế, một trong những vấn đề chủ yếu xét từ khía cạnh lưu trữ là một số cơ sở dữ liệu ít nhiều đều được cập nhật thường xuyên - một bộ phận của nội dung sẽ bị xoá đi và thay thế bằng những thông tin mới. Đó chính là thách thức lớn nhất đối với người làm lưu trữ trong việc xác định, lựa chọn và nắm bắt những tài liệu mang tính chất cố định trong các hệ thống như vậy. Tuy nhiên, có rất ít lưu trữ quốc gia trên thế giới đã xây dựng các quy trình và có kinh nghiệm tương đối lâu năm trong việc lựa chọn và bảo quản những tài liệu loại này. . lý tài liệu điện tử” TS. Nguyễn Lệ Nhung 0912581997 www.vanthuluutru.com 45 6. Tài liệu trong môi trường cơ sở dữ liệu 6.1. Các cơ sở dữ liệu. trọng của các tài liệu cơ sở dữ liệu. Ở một hình thái đơn giản nhất của mình, một cơ sở dữ liệu là một cuốn sổ đăng ký. Như vậy, một số cơ sở dữ liệu có bản