CÁC YÊU CẦU NGHIỆP VỤ
Bài 4 PHÂN TÍCH DỮ LIỆU
4.2. MÔ HÌNH PHÂN TÍCH DỮ LIỆU
4.2.1. Phân tích thực thể trừu tượng thành lược đồ quan hệ
Khái niệm thực thể trừu tượng là một thực thể với một số hữu hạn thuộc tính đặc trưng, có dạng giống như hồ sơ dữ liệu điển hình trong thực tế. Ví dụ như ĐƠN ĐẶT HÀNG.
Quá trình phân tích một thực thể trừu tượng thành lược đồ quan hệ gồm 2 bước:
- Xác định danh sách thuộc tính cần quản lý
- Xác định lược đồ gồm đủ 3 thành phần: tên, danh sách thuộc tính, thuộc tính khóa.
Phân tích và thiết kế hệ thống thông tin - Bài 4 Trang 11
Bước 1-Chính xác hóa dữ liệu (tiền xử lý) gồm một số nội dung sau:
1: loại bỏ hiện tượng “đồng danh”, “đồng nghĩa”.
2: Thêm/ bớt các thuộc tính:
- Thêm thuộc tính định danh cần cho quản lý.
- Bớt thuộc tính không cần thiết (STT), trung gian (thành tiền, tổng cộng…). 3: Xác định và đánh dấu các thuộc tính lặp.
Ví dụ:
Cho thực thể ĐƠNĐẶTHÀNG như trên.
Bước 1- Xác định được danh sách các thuộc tính cần cho quản lý
DONDATHANG
Số:
Ngày:
Mã khách (thêm) Tên khách
Địa chỉ
Mã hàng* (thêm) Tên hàng*
Mô tả hàng*
ĐV tính*
Số lượng * (thuộc tính “lặp” có dấu *)
Phân tích và thiết kế hệ thống thông tin - Bài 4 Trang 12
Bước 2-Xác định lược đồ quan hệ từ danh sách thuộc tính thu được ở bước 1
Tên: DONDATHANG
Danh sách thuộc tính : gồm các thuộc tính đã được chính xác hóa ở bước 1
Xác định khóa nhờ việc xác định phụ thuộc hàm:
Số->Ngày,Mã khách,Tên khách,Địa chỉ
Mã khách->Tên khách,Địa chỉ
Mã hàng ->Tên hàng,Mô tả hàng,ĐV tính
Số, mã hàng ->Số lượng
KHÓA={số, mã hàng}
Kết quả có lược đồ:
DONDATHANG(Số,Ngày,Mã khách,Tên khách,Địa chỉ, Mã hàng*,Tên hàng*,Mô tả hàng*,ĐV tính*,Số lượng *)
4.2.2. Nhận diện chuẩn 1NF, 2NF, 3NF
Có 3 dạng chuẩn cơ bản là 1NF, 2NF, 3NF:
1. Chuẩn 1 (first-normal-form: 1NF): Một quan hệ đạt chuẩn 1 nếu nó không chứa
các thuộc tính lặp.
Ví dụ:
DON1(Số,Ngày,Mã khách,Tên khách,Địa chỉ, Mã hàng*,Tên hàng*,Mô tả hàng*,ĐV tính*,Số lượng *)
không đạt 1NF
2. Chuẩn 2 (second- normal- form: 2NF) (phụ thuộc hoàn toàn vào khóa)
Một quan hệ đạt chuẩn 2 nếu:
Phân tích và thiết kế hệ thống thông tin - Bài 4 Trang 13
Đạt chuẩn 1
Không tồn tại thuộc tính ngoài khoá mà phụ thuộc vào một phần của khoá.
Ví dụ:
DON2 (Số, Mã hàng, Tên hàng, Mô tả hàng, ĐV tính, Số lượng)
không đạt 2NF vì Mã hàng->Tên hàng,Mô tả hàng,ĐV tính
3. Chuẩn 3 (thirth- normal- form: 3NF) (phụ thuộc trực tiếp vào khoá)
Một quan hệ đạt chuẩn 3 nếu:
- Đạt chuẩn 2
- Không tồn tại thuộc tính ngoài khoá mà phụ thuộc bắc cầu vào khoá (qua một thuộc tính gọi là thuộc tính cầu (cũng là thuộc tính ngoài khoá)).
Ví dụ:
DON3(Số,Ngày,Mã khách,Tên khách,Địa chỉ) không đạt 3NF vì
Mã khách->Tên khách,Địa chỉ)
4.2.3. Mô hình phân tích dữ liệu
Quá trình xây dựng mô hình khái niệm dữ liệu gồm các bước sau:
1. Xác định danh sách thuộc tính
2. Xác định các thực thể
3. Xác định các mối quan hệ giữa các thực thể
4. Vẽ mô hình khái niệm dữ liệu
Phân tích và thiết kế hệ thống thông tin - Bài 4 Trang 14
Bước 1-Xác định danh sách thuộc tính
Bước 1 thực hiện các công việc giống bước 1 trong phân tích một thực thể trừu tượng thành lược đồ quan hệ. Ví dụ DONDATHANG ta cũng có:
DONDATHANG
Số:
Ngày:
Mã khách (thêm) Tên khách
Địa chỉ
Mã hàng* (thêm) Tên hàng*
Mô tả hàng*
ĐV tính*
Số lượng * (thuộc tính “lặp” có dấu *)
Bước 2-Xác định các thực thể
Việc xác định mỗi thực thể được tiến hành thông qua việc xác định lần lượt:
- Tên thực thể
- Danh sách thuộc tính
- Thuộc tính định danh Khi xác định thực thể, cần chú ý đến Nguyên tắc xác định thực thể: 1 thuộc tính chỉ tồn tại trong 1 thực thể xác định.
Phân tích và thiết kế hệ thống thông tin - Bài 4 Trang 15
Ví dụ (slide 39):
Bước 3-Xác định các mối quan hệ giữa các thực thể
Sau khi xác định các thực thể, chúng ta xác định mối quan hệ giữa từng cặp thực thể nhờ các quy tắc quản lý hay quy tắc toàn vẹn dữ liệu [slide 40]
Bước 4: Vẽ Mô hình khái niệm dữ liệu
Mô hình khái niệm dữ liệu được xác định bằng cách tích hợp các mối quan hệ riêng lẻ giữa các cặp thực thể.
Phân tích và thiết kế hệ thống thông tin - Bài 4 Trang 16
Phân tích và thiết kế hệ thống thông tin - Bài 4 Trang 17
TÓM LƯỢC BÀI HỌC
Phân tích dữ liệu là một trong những nhiệm vụ trọng tâm trong quá trình phát triển hệ thống thông tin. Kết quả chủ chốt của giai đoạn này là mô hình khái niệm dữ liệu nhằm đặc tả các dữ liệu cần quản lý, việc gom nhóm chúng thành các thực thể và xác định mối quan hệ giữa các thực thể đó.
Đặc tả dữ liệu được xem như việc xác định tên, dạng dữ liệu và tính chất của dữ liệu; nó không phụ thuộc vào người sử dụng đồng thời không phụ thuộc vào yêu cầu tìm kiếm và thay đổi thông tin.
Các công cụ đặc tả dữ liệu chủ yếu bao gồm:
- Mã hoá dữ liệu
- Từ diển dữ liệu
- Mô hình thực thể liên kết E-R (Entity_Relationship)
- Mô hình quan hệ Chú ý rằng, mốc của kết quả phân tích dữ liệu chính là mô hình khái niệm dữ liệu.
Chúc Anh/Chị học tập tốt!
TÀI LIỆU HỌC VÀ THAM KHẢO:
[1]. Lê Văn Phùng (chủ biên), Trương Tiến Tùng, Phạm Công Hòa. Giáo trình Phân tích và thiết kế hệ thống thông tin. Viện Đại học Mở Hà Nội. 2012.
[3]. Lê Văn Phùng. Kỹ thuật Phân tích và thiết kế hệ thống thông tin hướng cấu trúc. NXB Thông tin và Truyền thông, 2009. Tái bản lần 3, 2014.
Phân tích và thiết kế hệ thống thông tin - Bài 5 Trang 1