Database system (DBS) nói chung một hệ thống lưu trữ dữ liệu. Database management system (DBMS) là một tập hợp các chương trình cho phép quản lý database. Một số chức năng chính của DBS: Định nghĩa dữ liệu: tạo và quản lý các quan hệ, phụ thuộc, hạn chế tính nhất quán, xem dữ liệu Điều chỉnh dữ liệu: chèn, cập nhật, xóa, rút trích, tái cấu trúc và tổng hợp dữ liệu. An ninh hệ thống và dữ liệu: quản lý truy cập vào hệ thống, nguồn lực và dữ liệu Hỗ trợ ngôn ngữ lập trình Các thành phần của một DBS bao gồm: Phần cứng và hệ điều hành DBMS Database Các hệ thống phần mềm vàhoặc các ứng dụng Người dùng bao gồm cả người dùng kỹ thuật và người dùng cuối.
Chapter Giới thiệu hệ thống sở liệu 1.1 Định nghĩa lý Database system (DBS) nói chung hệ thống lưu trữ liệu Database management system (DBMS) tập hợp chương trình cho phép quản lý database Một số chức DBS: - Định nghĩa liệu: tạo quản lý quan hệ, phụ thuộc, hạn chế tính quán, xem liệu - Điều chỉnh liệu: chèn, cập nhật, xóa, rút trích, tái cấu trúc tổng hợp liệu - An ninh hệ thống liệu: quản lý truy cập vào hệ thống, nguồn lực liệu - Hỗ trợ ngơn ngữ lập trình Các thành phần DBS bao gồm: - Phần cứng hệ điều hành - DBMS - Database - Các hệ thống phần mềm và/hoặc ứng dụng - Người dùng- bao gồm người dùng kỹ thuật người dùng cuối H1 Mơ hình DBS Bất kỳ hệ thống phần mềm cần có database để lưu trữ liệu truy cập liệu cách liên tục 1.2 Khái niệm Data Independence Độc lập liệu vật lý ngụ ý chế độ xem người dùng độc lập với tổ chức tập tin vật lý, máy phương tiện lưu trữ Độc lập liệu logic có nghĩa người dùng (hoặc chương trình ứng dụng) có chế độ xem logic riêng khơng cần chế độ xem toàn cục liệu logic sở liệu Các ngơn ngữ lập trình cấp cao (HLPL) có hệ thống xử lý tập tin tích hợp sẵn mà bạn chắn thành thạo sử dụng Những HLPL khơng hỗ trợ tính độc lập liệu Khi bạn sử dụng chúng để xác định tệp liệu mình, khơng có tách biệt tệp liệu bạn muốn thao tác chương trình ứng dụng sử dụng chúng Một hệ thống sở liệu giải tình trạng tiến thoái lưỡng nan cách giới thiệu lớp bổ sung ảo người lập trình ứng dụng tệp liệu thao tác nhiều chương trình ứng dụng 1.3 Các phương pháp thiết kế sở liệu Khi xem xét đến quản lý liệu thơng qua hệ thống máy tính, có năm cách tiếp cận thực vài thập kỷ qua: - Hệ thống nhỏ tức thì: sử dụng tệp tin - Hệ thống xử lý tệp: bao gồm nhiều tệp - Các hệ thống phi quan hệ truyền thống, ví dụ: phương pháp phân cấp, danh sách đảo ngược mạng - Cơ sở liệu quan hệ: tiên phong cá nhân bật Edgar Codd, Ronald Fagin, Christopher Date - Cơ sở liệu đối tượng — cách tiếp cận khác Năm cách tiếp cận thực xếp lại thành ba nhóm lớn sau: - Tệp thông thường: với phương pháp chương trình ứng dụng tồn để cập nhật tệp truy xuất thông tin từ tệp Tuy nhiên vấn đề với phương pháp khơng có liệu độc lập Để minh họa vấn đề, xem xét hệ thống thông tin bao gồm 30 tệp liệu 150 chương trình ứng dụng thao tác với tệp Giả sử tệp liệu tác động đến 10–15 chương trình ứng dụng Sau đó, cần điều chỉnh cấu trúc tệp liệu, cần phải theo dõi 10–15 chương trình ứng dụng điều chỉnh chúng Đây cách hiệu để quản lý hệ thống phần mềm phức tạp Figure 1.2 Thiết kế dựa tệp truyền thống - Các cách tiếp cận sở liệu lỗi thời mơ hình phân cấp, mơ hình mạng mơ hình danh sách đảo ngược Các mơ hình bị bỏ gặp phải số vấn đề - Các cách tiếp cận sở liệu đương đại chiếm ưu mơ hình quan hệ mơ hình hướng đối tượng Từ năm 1970 sở liệu quan hệ chiếm ưu lĩnh vực hệ thống sở liệu Cơ sở liệu hướng đối tượng tạo quan tâm nhiên thay mơ hình EAV, Hadoop NoSQL Dù sở liệu quan hệ chiếm ưu Ngoài phương pháp tiếp cận sở liệu đương đại chiếm ưu thế, có ba phương pháp tiếp cận sở liệu đáng đề cập Chúng tóm tắt đây: - Hadoop: khung xử lý phân tán tập liệu lớn - Mơ hình Thực thể–Thuộc tính–Giá trị (EAV): Cách tiếp cận giảm sở liệu thành ba thực thể lưu trữ chính- thực thể để xác định thực thể khác; thực thể để xác định thuộc tính (thuộc tính) thực thể; thực thể EAV kết nối hai thực thể khác lưu trữ giá trị kết hợp thuộc tínhthực thể - NoSQL: Từ viết tắt “NoSQL” thường hiểu “không Truy vấn có cấu trúc ngơn ngữ." Cách tiếp cận đề cập đến họ cách tiếp cận sở liệu phi quan hệ thiết kế để quản lý tập liệu lớn, đồng thời cung cấp lợi ích tính linh hoạt, khả mở rộng, sẵn có, chi phí thấp khả đặc biệt Bốn phương pháp liên quan key value stores, graph stores, column stores, and document stores