1.SƠ ĐỒ HÌNH SAOXÁC ĐỊNH VÀ PHÂN LOẠI DỮ LIỆU Các sự kiện được tổ chức thành bảng Fact.. 1.SƠ ĐỒ HÌNH SAOFact chứa các thông tin cơ sở ở mức giao tác ở trong nghiệp vụ mà các ứng dụng
Trang 1MÔ HÌNH KHO DỮ LIỆU
Trang 3Nội dung báo cáo
SƠ ĐỒ HÌNH TUYẾT RƠI ( SNOWFLAKE)
Trang 51.SƠ ĐỒ HÌNH SAO
Dữ liệu không chuẩn hóa
Một bảng dữ kiện và các chiều bao quanh
Các truy vấn nhằm vào bảng dữ kiện và được cấu trúc bởi các bảng chiều
Cho phép một hệ thống các đối tượng có thể kết nối với nhiều đối tượng khác
ĐẶC ĐIỂM:
Trang 6TenThuong TenKhoaHoc TacNhan
Trang 71.SƠ ĐỒ HÌNH SAO
XÁC ĐỊNH VÀ PHÂN LOẠI DỮ LIỆU
Các sự kiện được tổ chức thành bảng Fact.
Phạm vi hay chiều của dữ liệu được tổ chức
thành các bảng Dimension.
Trang 81.SƠ ĐỒ HÌNH SAO
Fact chứa các thông tin cơ sở ở mức giao tác ở trong
nghiệp vụ mà các ứng dụng cần thiết
Ví dụ: Khi phân tích kết quả học tập của sinh viên
trường DHTN thì cần những dữ liệu : Mã sinh viên, họ tên, ngày sinh, giới tính, điểm thi… Trước khi đưa vào kho dữ liệu thì cần phải chọn Mã sinh viên làm khóa
ngoại trong các quan hệ liên kết và khóa ngoại này được
lưu trong bảng Fact.
Trang 91.SƠ ĐỒ HÌNH SAO
Dimension chứa các thông tin mô tả, các dữ liệu cần thiết
cho việc thực hiện các giao tác nghiệp vụ theo một chiều hay một phạm vi nào đó
Ví dụ: Trong ứng dụng phân tích kết quả học tập của
sinh viên trường DHTN, các thông tin như: họ tên, ngày sinh, giới tính, điểm thi,… được lưu trữ trên các bảng
Dimension
Trang 101.SƠ ĐỒ HÌNH SAO
Phân loại Dimension:
Chiều phẳng (flat dimension)
Chiều phân cấp (hierarchical dimension)
Trang 111.SƠ ĐỒ HÌNH SAO
Chiều phẳng (flat dimension): Các giá trị của
chiều có cùng mức, không giá trị nào đó là cha hay con của giá trị khác
Dimension sinhvien
Holot Ten Phai Ngaysinh
Trang 121.SƠ ĐỒ HÌNH SAO
Chiều phân cấp ( hierarchiacal dimension):
Các giá trị của chiều có quan hệ một – nhiều
Dimension thời gian
Qúy Tuần
Trang 13MỐI QUAN HỆ GIỮA BẢN FACT VÀ DIMENSION
Fact chứa khóa của các Dimension
Dimension thường có định danh duy nhất và chứa
những thông tin về chiều của bảng Fact
Một sơ đồ hình sao đơn giản chỉ gồm 1 bảng Fact và
ít nhất 3 bảng Dimension.
Một sơ đồ hình sao phức tạp gồm hàng trăm bảng
Fact và bảng Dimension.
Trang 14MaCK Nam Quy Thang
Trang 151 SƠ ĐỒ HÌNH SAO
Hỗ trợ rất đa dạng các thao tác, xử lý khá hiệu
quả những câu truy vấn
Phù hợp với cách mà NSD nhận và sử dụng dữ
liệu
Nguyên lý cơ bản của sơ đồ hình sao là một dạng
dư thừa dữ liệu cải thiện sự thực hiện các truy vấn
Trực quan, dễ sử dụng, thể hiện khung nhìn đa
5.ƯU ĐIỂM:
Trang 172 SƠ ĐỒ HÌNH TUYẾT RƠI
Trang 182 SƠ ĐỒ HÌNH TUYẾT RƠI
ĐẶC ĐIỂM:
Là sự mở rộng của sơ đồ hình sao tại đó mỗi
cánh sao không phải là 1 bảng Deminsion mà là
nhiều bảng
Các chiều được chuẩn hóa (chuẩn 3)
Trang 192 SƠ ĐỒ HÌNH TUYẾT RƠI
Bang_FACT
NgayThangID
NSXID SOLUONG DONGIA cuahangID
CUAHANG
PK cuahangID
tencuahang diachiID
DIACHI
PK diachiID
thanhphoID quocgiaID
THUONGHIEU
PK thuonghieuID
tenthuonghieu
Trang 202 SƠ ĐỒ HÌNH TUYẾT RƠI
Cải thiện năng suất truy vấn
Tối thiểu không gian đĩa cần thiết để lưu trữ dữ liệu
Tăng tính linh hoạt của các ứng dụng bởi sự chuẩn hóa
ít mang bản chất theo chiều hơn
ƯU ĐIỂM:
Ví dụ
Trang 212 SƠ ĐỒ HÌNH TUYẾT RƠI
PHÂN BIỆT SƠ ĐỒ HÌNH SAO VỚI SƠ ĐỒ TUYẾT RƠI
SƠ ĐỒ HÌNH SAO SƠ ĐỒ TUYẾT RƠI
- Chưa tối thiểu không gian
đĩa cần thiết để lưu trữ data
- Việc truy cập đến các
bảng đơn giản hơn
- Chưa chuẩn hóa
- Tốc độ truy vấn chậm
- Tối thiểu không gian đĩa cần thiết để lưu trữ data
- Việc truy cập đến các bảng phức tạp hơn
- Đã chuẩn hóa
- Tốc độ truy vấn nhanh
Trang 223 SƠ ĐỒ KẾT HỢP
1 ĐẶC ĐIỂM
2 SƠ ĐỒ KẾT HỢP
3 ƯU ĐIỂM
Trang 233 SƠ ĐỒ KẾT HỢP
ĐẶC ĐIỂM:
Là sự kết hợp giữa sơ đồ hình sao dựa trên bảng fact
và những bảng dimension không chuẩn hóa và sơ đồ
hình tuyết rơi trong đó tất cả các bảng Dimension đều
được chuẩn hóa
Trang 24TuanID BenhID MaXa_Phuong ThoiTietID GiaiDoan DTNhiemNang DTNhiemTB DTNhiemNhe DTPhongTri
ThoiGian
PK TuanID
Tuan Thang Mua Nam NgayBD NgayKT
ThoiTiet
PK ThoiTietID
NhietDoTB NhietDo_CN NhietDo_TN DoAm LuongMua
GiaiDoanSinhTruong
PK GiaiDoan
Trang 253 SƠ ĐỒ KẾT HỢP
ƯU ĐIỂM:
Cải thiện năng suất truy vấn
Hỗ trợ rất đa dạng các thao tác, xử lý khá hiệu quả
những câu truy vấn
Tạo ra một khung nhìn đa chiều về dữ liệu trong CSDL