5.1. TỔNG QUAN VỀ THIẾT KẾ DỮ LIỆU
5.1.1. Mục đích
Trong phần thiết kế tổng thể đã quan tâm đến dữ liệu nhưng đó chỉ là thiết kế logic, trong phần này chúng ta quan tâm đến thiết kế vật lý của dữ liệu.
Mục đích của thiết kế cơ sở dữ liệu (CSDL) là xây dựng CSDL từ biểu đồ cấu trúc dữ liệu có thơng tin đầy đủ và cho phép truy cập nhanh.
5.1.2. Phương thức tiến hành
Đầu vào là biểu đồ cấu trúc dữ liệu (mơ hình thực thể liên kết hay mơ hình quan hệ).
Có hai phương thức tiến hành: Dựa trên hệ quản trị CSDL có sẵn mối quan hệ, có ngơn ngữ định nghĩa dữ liệu riêng cho phép khai báo cấu trúc dữ liệu. Sử dụng tệp: người dùng phải biết tổ chức tệp của mình. Các hệ quản trị tệp khơng giúp quản lý CSDL. Ví dụ Pascal, C,….
5.2. PHÂN TÍCH SỬ DỤNG DỮ LIỆU5.2.1. Nghiên cứu các yêu cầu truy nhập 5.2.1. Nghiên cứu các yêu cầu truy nhập
Các yêu cầu thông tin cho từng chức năng đã được xem xét trong sơ đồ luồng dữ liệu. Tuy nhiên, trong sơ đồ luồng dữ liệu lại không chỉ ra cách thức truy cập các kho dữ liệu. Ở đây ta cần chỉ ra cách thức truy cập dữ liệu bao gồm các thông tin đầu vào, truy cập tệp nào, sử dụng khóa nào, thao tác gì.
Ví dụ. Xét tiến trình "Lập phiếu địi sách mượn q hạn". Việc thực hiện tiến trình này địi hỏi một số truy nhập tới một phần của lược đồ dữ liệu trong hệ thống quản lý thư viện.
Hình
• u cầu 1: biết Số thẻ, u cầu tìm số Cá biệt các sách có, ngày trả, ngày hẹn trả
• Yêu cầu 2: biết Số thẻ, yêu cầu tìm Tên bạn đọc và Địa chỉ bạn đọc.
• Yêu cầu 3: biết Số các biệt, yêu cầu tìm Tên sách, Tác giả, Nhà xuất bản và Năm xuất bản.
Phân tích và xây dựng các biểu đồ sử dụng dữ liệu cho các yêu cầu Xét yêu cầu 1:
• Bảng dữ liệu: MƯỢN/TRẢ
• Khóa tìm kiếm: Số thẻ
• Tra cứu: Số thẻ, Ngày trả, Ngày hẹn trả
• Tần suất truy nhập: 50 lần/tuần Xét yêu cầu 2:
• Bảng dữ liệu: BẠN ĐỌC
• Khóa tìm kiếm: Số thẻ
• Tra cứu: Tên bạn đọc, Địa chỉ
• Tần suất truy nhập: 50 lần/tuần Xét u cầu 3:
• Bảng dữ liệu: SÁCH
• Khóa tìm kiếm: Số các biệt
• Tra cứu: Tên sách, Tác giả, Nhà xuất bản, Năm xuất bản
• Tần suất truy nhập: 50 lần/tuần
5.2.2. Đánh giá không gian lưu trữ
Số lượng các bản ghi trong mỗi bảng dữ liệu được gọi là dung lượng của bảng dữ liệu. Thông tin này cần được bổ sung vào mô tả bảng.
Tuy nhiên trong thực tế, số lượng các bản ghi thường biến động. Chúng có thể tăng lên theo thời gian, hoặc đôi khi lại bị giảm đi. Thông thường, người ta ghi số lượng
trung bình trong một khoảng thời gian nào đó ứng với một chu trình hoạt động của hệ thống.
Trong ví dụ với mơ hình thư viện vừa xét, người ta thường lấy chu kỳ thời gian là một năm: sau một năm thẻ bạn đọc thường được xem xét để gia hạn, đầu năm thường được xét cấp kinh phí để mua sắm sách, cuối mỗi năm thanh lý sách cũ, xử lý sách quá hạn lâu ngày, xử lý bạn đọc có nhiều sách q hạn.
Việc tính tốn, ước lượng dung lượng của các bảng dữ liệu có ảnh hưởng lớn tới việc lựa chọn thiết bị lưu trữ sau này.
5.3. CHUYỂN MƠ HÌNH DỮ LIỆU THÀNH TỆP DỮ LIỆU5.3.1. Thiết kế cơ sở dữ liệu vật lý 5.3.1. Thiết kế cơ sở dữ liệu vật lý
Thiết kế cơ sở dữ liệu là tiến trình tạo ra các định nghĩa dữ liệu cho hệ thống và thiết lập cấu trúc các tệp dữ liệu chính trong hệ thống. Trong tiến trình thiết kế cơ sở dữ liệu vật lý người ta thường phải sử dụng các thông tin về những ràng buộc thực hiện như môi trường phần cứng, phần mềm của người sử dụng, thời gian đáp ứng các yêu cầu, điều kiện kiểm sốt, và điều kiện an tồn của hệ thống.
Ngoài ra, các chi tiết về phân tích và sử dụng dữ liệu như mơ hình quan hệ, sơ đồ dòng dữ liệu hệ thống cũng cần thiết cho quá trình thiết kế cơ sở dữ liệu vật lý. Thơng thường, bước đầu người ta chuyển đổi mơ hình dữ liệu logic thành tập hợp ban đầu các tệp phù hợp với phần mềm được chọn để xử lý. Tiếp theo,thực hiện tối ưu hóa các tệp này cho đến khi đạt các yêu cầu về tính hiệu quả của hệ thống.
Khi thiết kế cơ sở dữ liệu vật lý nhà thiết kế phải lưu ý về an toàn và toàn vẹn dữ liệu.
- Tổ hợp được các kiểm tra an toàn và toàn vẹn cần thiết bên trong bản thân cơ sở dữ liệu. Các yêu cầu cho những điều này có thể đã được xac định ngay trong bước phân tích ban đầu, nhưng nó được hình thức hóa trong bước xác định các kiểm soát cần thiết.
- Điều bắt buộc là dữ liệu khơng chính xác và khơng nhất qn phải khơng được làm hỏng cơ sở dữ liệu, các thâm nhập vô phép vào thông tin cơ sở dữ liệu phải bị ngăn cản.
5.3.2. Chuyển đổi mơ hình dữ liệu thành tệp dữ liệu
dữ liệu quan hệ mỗi kiểu thực thể tương ứng một tệp và có thể thêm các thuộc tính tình huống. Phân rã: căn cứ vào sử dụng nếu xảy ra những nhóm thuộc tính hay dùng và ít dùng khi phân rã chúng ra. Những thuộc tính hay dùng cho vào một tệp. Ví dụ: Kiểu thực thể ĐIỂM THI gồm các thuộc tính: SBD, Số phách, Điểm thi. Nhưng để đảm bảo bí mật thường được tách thành hai tệp PHÁCH (Số báo danh, Số phách) và BÀI THI (Số phách, Điểm thi).
Gộp hai hay nhiều kiểu thực thể khi việc sử dụng chúng thường đi liền với nhau. Ví dụ: với hai kiểu thực thể ĐƠN HÀNG và DÒNG ĐƠN HÀNG thường gộp vào một tệp.
Lặp lại các thuộc tính từ các tệp khác nhau. Ví dụ: các thuộc tính để kết nối giữa các tệp.
Lập các tệp chỉ dẫn căn cứ vào đường truy cập và theo các thuộc tính có tần số sử dụng cao. Ví dụ: trong hệ thống tuyển sinh vì yêu cầu xem điểm nhiều nên có thể tạo một tệp có các thuộc tính SBD và Điểm để giúp cho việc tìm kiếm thơng tin được nhanh chóng