CÁC YÊU CẦU NGHIỆP VỤ
Bài 4 PHÂN TÍCH DỮ LIỆU
4.1. CÁC PHƯƠNG TIỆN ĐẶC TẢ DỮ LIỆU
4.1.1. Khái niệm đặc tả dữ liệu
Đặc tả dữ liệu được xem như việc xác định tên, dạng dữ liệu và tính chất của dữ liệu; nó không phụ thuộc vào người sử dụng đồng thời không phụ thuộc vào yêu cầu tìm kiếm và thay đổi thông tin.
4.1.2. Các công cụ đặc tả
Các công cụ đặc tả dữ liệu chủ yếu bao gồm:
- Mã hoá dữ liệu (coding)
- Từ diển dữ liệu (Data Dictionary)
- Mô hình thực thể liên kết E-R (Entity_Relationship)
Phân tích và thiết kế hệ thống thông tin - Bài 4 Trang 2
- Mô hình quan hệ (Relational Data Base Modeling
4.1.2.1. Mã hoá dữ liệu (coding):
Mã là tên viết tắt gắn cho một đối tượng nào đó hay nói cách khác mỗi đối tượng cần có tên và vấn đề đặt ra ta sẽ đặt tên cho đối tượng như thế nào.
Trong mỗi đối tượng gồm nhiều thuộc tính khác nhau thì yêu cầu mã hoá cho các thuộc tính cũng là yêu cầu cần thiết.
Mã hoá còn là hình thức chuẩn hoá dữ liệu đặc biệt trong các hệ thống thông tin
xử lý bằng máy tính.
Một số thí dụ về mã hoá:
Ví dụ:
- Khi ta cần xác định một công dân thì số chứng minh thư hoặc số hộ chiếu là mã của công dân đó.
- Khi cần xác định xe ô tô hay xe máy thì biển số xe là mã của xe đó.
Có nhiều kiểu mã hoá:
1. Mã hoá kiểu liệt kê
Mã hóa kiểu liệt kê dùng các số nguyên liên tiếp 000,001,002... để mã hoá.
Ưu điểm:
+ Không nhập nhằng + Đơn giản
+ Thêm phía sau
Hạn chế:
+ Không xen được
Phân tích và thiết kế hệ thống thông tin - Bài 4 Trang 3
+ Thiếu tính gợi ý, cần phải có bảng tương ứng + Không phân theo nhóm.
2. Mã hóa theo lát
Mã hóa theo lát dùng các số nguyên nhưng phân ra từng lát (lớp) cho từng loại đối tượng, trong mỗi lát dùng mã liên tiếp.
Ví dụ:
Mã hoá Ngũ kim
Vùng 1 0001- 0999 ngũ kim bé
Vùng 2 0010- 0099 vít
Vùng 3 0100- 0299 ê cu
0300- 0499 bulong
0500- 0599 đinh Vùng 4 1000- 1999 chi tiết kim loại
1000- 1099 sắt U
Ưu điểm:
+ Không nhập nhằng + Đơn giản
+ Mở rộng xen thêm được Hạn chế: + Thiếu gợi ý
3. Mã phân đoạn
Bản thân mã phân thành nhiều đoạn, mỗi đoạn mang một ý nghĩa riêng.
Ví dụ:
Phân tích và thiết kế hệ thống thông tin - Bài 4 Trang 4
Số đăng ký xe máy
Mã sinh viên: /H/N/NN/123/
(Ký tự đầu tiên là chữ biểu diễn chính quy/tại chức/văn bằng 2/từ xa), số thứ hai biểu diễn ngành (không lớn hơn 9 ngành), hai số tiếp theo biểu diễn năm nhập học, ba số cuối cùng biểu diễn số thứ tự.
Ưu điểm:
+ Không nhập nhằng
+ Mở rộng xen thêm được
+ Được dùng khá phổ biến
+ Cho phép thiết lập các phương thức kiểm tra gián tiếp đối với mã của các đối tượng. Hạn chế:
+ Quá dàithao tác nặng nề
+ Không cố định
+ Có thể bị bão hoà
4. Mã phân cấp
Ưu điểm:
Giống như phân đoạn Tìm kiếm dễ dàng Hạn chế:
Giống phân đoạn [slide 14]
Phân tích và thiết kế hệ thống thông tin - Bài 4 Trang 5
5. Mã diễn nghĩa
Mã diễn nghĩa gắn một tên ngắn gọn nhưng hiểu được cho một đối tượng.
Ví dụ:
Đội bóng các nước tham gia SEA GAMES được mã bằng cách lấy 3 ký tự đầu như sau: VIE: Vietnam, THA: Thailand, SIN: Singapore, IND: Indonesia, MAL: Malaysia...
Ưu diểm:
Mã diễn nghĩa tiện dụng cho người sử dụng trong xử lý công việc hàng ngày. Hạn chế:
Mã diễn nghĩa càng dài nếu số lượng thành phần tham gia mã hoá càng dài.
6. Mã vạch-mã số hàng hoá (bar code)
- Mã số hàng hóa là một dãy các con số được ghi ở dưới mã vạch dùng để phân
định sản phẩm hàng hóa.
Mỗi dãy số như vậy sẽ đặc trưng cho một loại hàng hóa của cơ sở sản xuất và của quốc gia sản xuất loại hàng hóa đó.
- Mã vạch là một dãy các vạch đen trắng dùng để thể hiện mã số dưới dạng ký hiệu mà máy quét có thể đọc được, để lưu vào bộ nhớ của hệ thống máy tính hay máy tính tiền một cách nhanh chóng và chính xác.
Phân tích và thiết kế hệ thống thông tin - Bài 4 Trang 6
Dãy các vạch đen trắng này có độ chính xác tới 1/100 mm và được in bằng chất liệu đặc biệt để chống làm giả.
Hiện nay, mã số quốc gia của Việt Nam được cấp (3 số đầu) là 893, nhóm số tiếp sau chỉ mã của nhà sản xuất và nhóm số tiếp nữa là mã của sản phẩm, số cuối cùng là số kiểm tra. [slide 16]
4.1.2.2. Từ điển dữ liệu (Data Dictionary)
Từ điển dữ liệu (còn gọi từ điển yêu cầu) là bộ phận của tư liệu trong PT_TK, nó
là văn phạm giả hình thức mô tả nội dung của các sự vật, đối tượng theo định nghĩa có cấu trúc.
Trong biểu đồ luồng dữ liệu các chức năng xử lý, kho dữ liệu, luồng dữ liệu chỉ
mô tả ở mức khái quát thường là tập hợp các khoản mục riêng lẻ. Các khái quát này cần được mô tả chi tiết hoá hơn qua công cụ từ điển dữ liệu.
Người ta dùng Ký pháp để mô tả nội dung cho từ điển dữ liệu.
Phân tích và thiết kế hệ thống thông tin - Bài 4 Trang 7
Các dạng biểu thị từ điển:
1. Dạng thuộc tính:
Từ điển bao gồm các thuộc tính: STT, Tên gọi, Kiểu, Cỡ, Lĩnh vực, Quy tắc, ràng buộc và khuôn dạng.
Từ điển dạng thuộc tính trông gần giống như bảng cấu trúc của dữ liệu
2. Dạng thực thể
Dạng thực thể diễn tả một thực thể trừu tượng.
Ví dụ:
3. Dạng đặc tả
Từ điển xác định thuê bao di động gọi dịch vụ cố định được đặc tả như sau:
Phân tích và thiết kế hệ thống thông tin - Bài 4 Trang 8
Số điện thoại = 0 + mã vùng + mã dịch vụ
Mã vùng= [76/64/28/75/56/62/26/71/50/…]
*76-angiang, 64-bàriavũngtàu, 28-bắc thái,…*
Mã dịch vụ = 1 + số hiệu dịch vụ
Số hiệu dịch vụ = [01/02/03/04/05/…/20]
*01-đăng ký điện thoại đường dài trong nước, 113-gọi cảnh sát, 114-gọi cứu hoả, 115-gọi cấp cứu y tế….*
4. Dạng đồ thị
Từ điển biểu diễn dạng này trông giống như biểu diễn thực thể.
5. Dạng tệp: Dạng tệp bao gồm:
-tên tệp, -mô tả, -từ đồng nghĩa, -từ hợp thành, -cách tổ chức (tuần tự, nhị phân, hàm băm) và -các xử lý.
6. Dạng chức năng xử lý: bao gồm tên chức năng cùng với tập dòng dữ liệu có hướng từ các nguồn dữ liệu liên quan, ví dụ như chức năng kiểm tra đơn hàng, nhận dữ
Phân tích và thiết kế hệ thống thông tin - Bài 4 Trang 9 liệu từ đơn hàng, tài khoản khách, xuất dữ liệu ra thành đơn hàng hợp thức hay không hợp thức.
4.1.2.3. Mô hình thực thể liên kết E-R (Entity_Relationship)
Đặc tả thực thể được thể hiện với 3 thành phần: tên, danh sách thuộc tính và thuộc tính định danh.
Đặc tả mối quan hệ thể hiện mối quan hệ giữa các thực thể. Mối quan hệ có thể có thuộc tính (trong khi các thực thể đều có ít nhất 1 thuộc tính).
Phân tích và thiết kế hệ thống thông tin - Bài 4 Trang 10
4.1.2.4. Mô hình quan hệ (Relational Data Base Modeling)
Một quan hệ được hiểu theo nghĩa “đơn giản nhất” là một bảng dữ liệu hai chiều. Mỗi quan hệ (hay bảng) gồm một tập hữu hạn các cột được đặt tên và một số tuỳ ý các dòng không có tên.