Nội dung Các định nghĩa cơ bản Hệ thống xử lý tập tin truyền thống và nhược điểm của nó Cơ sở dữ liệu và các ưu điểm Chức năng và thành phần cuả hệ quản trị CSDL DBMS... Databa
Trang 1Chương 1: Giới thiệu về Database
Database System 1
Trang 2Database System 2
Trang 3Nội dung
Các định nghĩa cơ bản
Hệ thống xử lý tập tin truyền thống và
nhược điểm của nó
Cơ sở dữ liệu và các ưu điểm
Chức năng và thành phần cuả hệ quản trị CSDL (DBMS)
Trang 4Các định nghĩa cơ bản
Data (dữ liệu) và information (thông tin)
◦ Data: bao gồm sự việc (fact), văn bản(text), đồ
họa(graphics), hình ảnh (images), âm thanh (sound)
◦ Information: dữ liệu đã được xử lý
Phân biệt giữa data và information??
Database System 4
Trang 5Các định nghĩa cơ bản (tt)
Siêu dữ liệu (metadata): mô tả các tính chất
hoặc các đặc điểm của dữ liệu khác
Database System 5
Make Model OwnerID ID Name Age
Honda Accord 12 12 Nemo 22
Honda Accord 156 156 Dory 21
Trang 6◦ Hạn chế việc dùng chung dữ liệu
◦ Thời gian phát triển lâu
◦ Chi phí bảo trì chương trình cao
Database System 6
Trang 7Hệ thống xử lý tập tin truyền thống
Data are not stored on disk
Programmer defines both logical data structure
and physical structure (storage structure, access
methods, I/O modes, etc)
One data set per program High data redundancy.
PROGRAM 2 Data
Management
PROGRAM 3 Data
Management
PROGRAM 1 Data
Trang 8Problems with early data management
◦ All data may not fit available memory
Programmer productivity low
◦ The programmer has to do a lot of tedious work.
8 Database System
Trang 9File Processing -
Recent (and Current) History
Data are stored in files with interface between programs and files.
Various access methods exist (e.g., sequential, indexed,
random)
One file corresponds to one or several programs.
PROGRAM 1 Data
PROGRAM 3 Data
Management
File System Services
9 Database System
Trang 10File System Functions
Mapping between logical files and physical files
◦ Logical files: a file viewed by users and programs.
Data may be viewed as a collection of bytes or
as a collection of records (collection of bytes with a particular structure)
Programs manipulate logical files
◦ Physical files: a file as it actually exists on a storage
device.
Data usually viewed as a collection of bytes
located at a physical address on the device
Operating systems manipulate physical files.
A set of services and an interface (usually
called application independent interface – API)
10 Database System
Trang 11Problems With File Systems
Data are highly redundant
◦ sharing limited and at the file level
Data is unstructured
◦ “flat” files
High maintenance costs
◦ data dependence; accessing data is difficult
◦ ensuring data consistency and controlling access to data
Sharing granularity is very coarse
Difficulties in developing new applications
11 Database System
Trang 12PROGRAM 1
PROGRAM 1
PROGRAM 2
IntegratedDatabase
DBMS
Query Processor Transaction Mgr
…
Database Approach
12 Database System
Trang 13 Database: Là một tập hợp dữ liệu có liên quan
luận lý với nhau chứa thông tin về 1 tổ chức nào
đó có tổ chức và được dùng chung đáp ứng nhu cầu khai thác thông tin của người dùng
Hệ quản trị CSDL ( Database Management
System - DBMS ): là 1 bộ phần mềm cho phép
người sử dụng định nghĩa, tạo lập, bảo trì và điều khiển truy xuất CSDL
Database System 13
Trang 14Ba thuộc tính cơ bản của Database
Persistent
Interrelated
Shared
Database System 14
Trang 15Ba thuộc tính cơ bản của
Database
Persistent:
◦ Dữ liệu được lưu trữ trong bộ nhớ ổn định như đĩa cứng Khi dữ liệu không cần dùng nữa thì có thể xoá hay sao lưu lại.
Database System 15
Trang 16Ba thuộc tính cơ bản của Database
Trang 17Ba thuộc tính cơ bản của
Database
Shared:
◦ Database có thể có nhiều người dùng và nhiều người
dùng có thể sử dụng cùng 1 database tại cùng 1 thời
điểm
◦ Bài toán đồng thời (concurrency problem)
Database System 17
Trang 18Các bước phát triển của công
nghệ Database
Thế hệ 1: hỗ trợ việc dò tìm ngẫu nhiên và tuần
tự, người dùng phải viết chương trình để truy
Trang 19Các bước phát triển của công
nghệ Database
Thế hệ 3: xuất hiện DBMS quan hệ
Đã bắt đầu có ngôn ngữ phi thủ tục
Trang 20 Là 1 đơn vị công việc ( work unit) được xử lý một cách chắc chắn mà không cần có sự can thịêp từ người dùng khác và không bị mất dữ liệu do lỗi
Ví dụ: dịch vụ rút tiền ATM, đặt vé máy bay
trước,…
Database System 20
Trang 21Four module của Database System
several disparate sources, with some degree of
pre-aggregation performed, in order to save query time.
Database System 21
Trang 22Four module của Database System
hiện đại
By the amount of data that needs to be stored, and concurrency
◦ Data Warehouse – Grand data store for holding
nearly all organization data and its history.
◦ Data Mart – Specialized data store optimized for
aggregations, used for specific situations, and
heldas a subset of the data warehouse - processed
using a technology known as Online Analytical
Processing (OLAP)
Database System 22
Trang 23Database System 23
Trang 24Phân loại DBMS
Enterprise DBMS : thường chạy trên server công suất lớn và chi phí cao, database mà DBMS quản lý thường phản ánh mọi chức năng của cả tổ chức
Desktop DBMS : chạy trên PC, server nhỏ, chi phí thấp và hỗ trợ có giới hạn việc xử
Database System 24
Trang 25Cách tiếp cận Database
Người sử dụng tương tác với CSDL thông qua
chương trình ứng dụng ( application program)
Người sử dụng có thể nhìn thấy dữ liệu họ cần
thông qua khung nhìn (View - tiện ích của DBMS)
Database System 25
Trang 26Cách tiếp cận Database (tt)
Ưu điểm:
◦ Độc lập dữ liệu – chương trình
◦ Giảm tối thiểu dư thừa dữ liệu
◦ Nâng cao tính nhất quán dữ liệu
◦ Nâng cao việc dùng chung dữ liệu
◦ Tăng hiệu suất phát triển ứng dụng
◦ Tuân thủ các tiêu chuẩn
◦ Nâng cao chất lượng của dữ liệu
◦ Nâng cao tính truy xuất và tính đáp ứng của dữ liệu
◦ Giảm chi phí bảo trì chương trình
Database System 26
Trang 27◦ Tốn thêm chi phí cho phần cứng
◦ Tốn chi phí chuyển đổi
◦ Giảm hiệu súât của ứng dụng
◦ Bị ảnh hưởng nhiều do hư hỏng
Database System 27
Trang 28◦ Người quản trị dữ liệu (DA – Data administration)
◦ Người thiết kế CSDL ( Database designer)
◦ Người phát triển ứng dụng (application developer)
◦ Người dùng cuối (end-user)
Database System 28
Trang 30Chu kỳ phát triển hệ thống
Chu kỳ phát triển hệ thống (SDLC – System
Development Life Cycle): là phương pháp luận
truyền thống được dùng để phát triển, bảo trì và thay thế các hệ thống thông tin
Database System 30
Trang 31◦ Thiết kế luận lý (logical design)
◦ Thiết kế vật lý (physical design)
◦ Thực hiện (implementation)
◦ Bảo trì (maintenance)
Database System 31
Trang 32Project initiation and planning
Analysis
Logical design
Physical design
Physical design
Physical design
Physical design
Maintenance
Trang 33Quá trình phát triển Database
Dựa trên chu kỳ phát triển hệ thống
Gồm 6 giai đoạn sau:
◦ Mô hình hóa xí nghiệp (Enterprise modeling) Tương ứng với giai đoạn 1 của SDLC
◦ Mô hình hóa dữ liệu ý niệm (Conceptual data modeling)
Tương ứng với giai đoạn 2 và 3 cùa SDLC
◦ Thiết kế Database luận lý ( logical database design)
Tương ứng với giai đoạn 4 của SDLC
Database System 33
Trang 34Quá trình phát triển Database (tt)
◦ Thiết kế và định nghĩa database vật lý (physical database design and definition) Tương ứng với giai đoạn 5
của SDLC
◦ Thực hiện database( database implementation) Tương
ứng với giai đoạn 6 của SDLC
◦ Bảo trì database ( database maintenance) Tương ứng với giai đoạn cuối của SDLC
Database System 34
Trang 35Kiến trúc database ba mức
Mức vật lý (lược đồ trong) được xây dựng trong giai đoạn thiết kế vật lý, mô tả dữ liệu thực sự
được lưu trữ như thế nào trong CSDL
Mức ý niệm được xây dựng trong giai đoạn phân tích, mô tả dữ liệu nào được lưu trữ trong CSDL
và mối quan hệ nào giữa chúng Nó biểu diễn các thức thể, thuộc tính và mối quan hệ giữa các
thực thể đó
Mức ngoài ( khung nhìn của người dùng) được
xây dựng trong giai đoạn phân tích và thiết kế,
mô tả chỉ 1 phần dữ liệu thích hợp với 1 người
dùng nhất định Mức này bao gồm nhiều khung nhìn (view) khác nhau
Database System 35
Trang 36Database System 36
Conceptual schema
Internal schema
User view 1 User view 2 User view 3
Trang 37Kiến trúc ba mức
Mức logic nằm giữa mức khung nhìn và
mức vật lý, coi như đây là cách cảm nhận của người dùng về dữ liệu Tại mức logic tồn tại cả 2 ánh xạ đến 2 mức còn lại tạo nên sự độc lập đối với nhau của 2 mức đó
Mục đích của kiến trúc 3 mức là tách biệt quan niệm về CSDL của người dùng với
chi tiết biểu diễn vật lý của CSDL tạo ra
sự độc lập dữ liệu (data independence)
Database System 37
Trang 38Độc lập dữ liệu
Có 2 loại độc lập dữ liệu
◦ Độc lập dữ liệu vật lý: khả năng sửa đổi lược đồ vật lý
mà không làm thay đổi lược đồ khái niệm, không phải
viết lại chương trình ứng dụng.
◦ Độc lập dữ liệu logic: khả năng sửa đổi lược đồ logic mà không làm thay đổi khung nhìn
Database System 38
Trang 40Kiến trúc truyền thống
Còn gọi là hệ xử lý từ xa (teleprocessing)
Gồm 1 máy tính CPU và 1 số trạm đầu cuối
( terminal)
◦ Tất cả xử lý tập trung trên cùng 1 máy tính
◦ Các trạm đầu cuối gửi yêu cầu về máy trung tâm
Database System 40
Trang 41Kiến trúc truyền thống
Database System 41
Trang 42Kiến trúc file – server
Việc xử lý không tập trung vào 1 máy
trung tâm mà phân tán trên mạng.
File-server lưu giữ các tệp dữ liệu mà các ứng dụng và hệ QTCSDL cần đến
◦ Dữ liệu truyền trên mạng nhiều
◦ Mỗi trạm phải cài đặt một bản sao đầy đủ của
hệ QTCSDL
◦ Tính nhất quán dữ liệu phức tạp hơn vì có
nhiều hệ QTCSDL truy cập vào cùng tệp dữ
liệu
Database System 42
Trang 43Kiến trúc file – server
Trang 44Kiến trúc Client/Server
Khắc phục được nhược điểm của 2 kiểu
trên
Các bộ phận phần mềm tương tác với
nhau tạo nên 1 hệ thống:
◦ Tiến trình client quản trị giao diện người dùng và ứng
dụng logic Tiến trình client nhận yêu cầu người dùng,
kiểm tra, gửi thông điệp về server
◦ Tiến trình server tiếp nhận, xử lý yêu cầu, gửi trả kết
quả về lại client.
Database System 44
Trang 45Kiến trúc client – server
Database System 45
LAN
Các yêu cầu vể dữ liệu
Dữ liệu được chọn gửi
về máy chủ Máy khách 1