2.3 Khuôn mẫu và mô hình dữ liệu
2.3.1 Các nguồn dữ liệu
Để xây dựng được một hệ thống tích hợp dữ liệu tốt, chúng ta cần hiểu rõ chúng ta sẽ lấy thông tin từ đâu. Hiện tại có rất nhiều kiểu dữ cơ sở dữ liệu:
Cơ sở dữ liệu quan hệ
Cơ sở dữ liệu quan hệ là một trong các chuẩn kỹ thuật tiêu biểu cho các ứng dụng dùng cơ sở dữ liệu. Cơ sở dữ liệu quan hệ ra đời vào những năm 1970, trọng tâm của nó là mô hình dữ liệu quan hệ. Sau đó vào những năm 1976, mô hình thực thể quan hệ được đề xuất, nó đã trở thành một mô hình thuận tiện, mạnh mẽ và đơn
Trang 30
giản của lược đồ cơ sở dữ liệu quan hệ. Hầu hết các hệ quản trị CSDL hiện nay đều hỗ trợ dạng CSDL quan hệ như: SQL Server, Oracle, DB2, MySQL, MS Access,…
Cơ sở dữ liệu hƣớng đối tuợng
Cơ sở dữ liệu hướng đối tượng (Object Oriented Database) là một kiểu cơ sở dữ liệu, mà trong đó, các dữ liệu được lưu trữ dưới dạng các đối tượng. Hay cơ sở dữ liệu hướng đối tượng được xây dựng bằng cách kết hợp các yếu tố của cơ sở dữ liệu và kỹ thuật lập trình hướng đối tượng nhằm mục đích lưu trữ các đối tượng dữ liệu. Từ đó, có thể tận dụng, phát huy được những ưu điểm, lợi ích, và thế mạnh của các kỹ thuật, công nghệ được sử dụng, đồng thời khắc phục những yếu điểm, khó khăn của các kiểu cơ sở dữ liệu khác.
Một hệ quản trị cơ sở dữ liệu hướng đối tượng (Object Database ManagementSystem - ODBMS) là kết quả của sự kết hợp các nguyên lý của lập trình hướng đối tượng và các nguyên lý của hệ quản trị cơ sở dữ liệu. Các thuật ngữ khác như OODBMS (Object Oriented Database Management System), ODB (Object Database), OODMS (Object - Oriented Database Management System), … cũng được dùng và gọi chung là ODBMS – Hệ quản trị cơ sở dữ liệu hướng đối tượng.
Cơ sở dữ liệu đa phƣơng tiện
Cơ sở dữ liệu đa phương tiện là một tập các loại dữ liệu đa phương tiên như văn bản, hình ảnh, video, âm thanh, các đối tượng đồ hoạ….Một hệ quản trị CSDL đa phương tiện (MDBMS) cung cấp và hỗ trợ các loại dữ liệu đa phương tiện trong việc tạo lập, lưu trữ, truy cập, truy vấn và kiểm soát.
Sự khác nhau của các kiểu dữ liệu trong CSDL MULTIMEDIA có thể đòi hỏi các phương thức đặc biệt để tối ưu hoá việc lưu trữ, truy cập, chỉ số hoá và khai thác. MDBMS cần phải cung cấp các yêu cầu đặc biệt này bằng cách cung cấp các
Trang 31
cơ chế tóm tắt bậc cao để quản lý các kiểu dữ liệu khác nhau cũng như các giao diện thích hợp để thể hiện chúng.
Cơ sở dữ liệu không gian
Hệ thống CSDL không gian là một tập các dữ liệu không gian. Hệ thống CSDL được thiết kế để xử lý dữ liệu không gian. Hệ thống CSDL không gian được sử dụng trong nhiều lĩnh vực, từ dữ liệu không gian địa lý tới tri thức y học. Khai phá dữ liệu không gian đóng một vai trò quan trọng trong việc rút ra những mô hình và các đặc tính không gian hữu ích; nắm bắt được bản chất các mối quan hệ giữa dữ liệu không gian và dữ liệu phi không gian; biểu thị các quy tắc dữ liệu một cách chuẩn mực và ở mức khái niệm cao hơn; giúp tổ chức lại các CSDL không gian để điều chỉnh các ngữ nghĩa dữ liệu cũng như để nhận được những biểu diễn tốt hơn.
Dữ liệu không gian mô tả thông tin liên quan tới không gian bao trùm bởi các đối tượng. Dữ liệu bao gồm thông tin hình học (có thể là dữ liệu liên tục hoặc rời rạc). Dữ liệu rời rạc là những điểm đơn lẻ trong không gian nhiều chiều, tuy nhiên dữ liệu không gian rời rạc không giống dữ liệu phi không gian vì nó sử dụng một thuộc tính khoảng cách để định vị dữ liệu trong không gian. Dữ liệu liên tục mở rộng ra một miền không gian. Dữ liệu này có thể bao gồm các hình ảnh y học, miền ánh xạ hoặc các dải sao, …
Hiện nay có rất nhiều các hệ thống tích hợp dữ liệu nghiên cứu việc áp dụng nó trong cơ sở dữ liệu không gian.
Một số loại nguồn dữ liệu khác
CSDL quan hệ - hướng đối tượng ( object - related databases): là một kiểu cơ sở dữ liệu lai giữa dạng quan hệ và dạng đối tượng.
Trang 32
CSDL thời gian ( temporal, and time-series data): là dạng dữ liệu có tích hợp thuộc tính về thời gian (ví dụ: dữ liệu về thị trường chứng khoán).
CSDL giao dịch (transaction databases): đây là cũng là một dạng CSDL tác nghiệp, nhưng các bản ghi thường là các giao dịch. Dạng dữ liệu này phổ biến trong lĩnh vực thương mại và tài chính ngân hàng.
CSDL đa chiều (Multidimentional structures, data warehouses, data smart ): là các kho dữ liệu được tập hợp, chọn lọc từ nhiều nguồn khác nhau. Dạng dữ liệu này có mang tính lịch sử (mang tính thời gian) và chủ yếu phục vụ cho quá trình phân tích cũng như khai phá tri thức nhằm hỗ trợ quá trình ra quyết định.
Dữ liệu là các tệp tin có cấu trúc: các tệp dữ liệu cũng có thể cung cấp dữ liệu và cho phép hệ thống lấy thông tin trên đó.
Dữ liệu trên các dịch vụ Web: chúng ta có thể truy vấn và lấy thông tin từ các dịch vụ cung cấp thông tin trên Web thậm chí ngay cả thông tin trên trang Web.
…