MÔ HÌNH DỮ LIỆU DATA WAREHOUSE :

Một phần của tài liệu những khái niệm về data warehouse (Trang 55 - 58)

9) Tiến trình 6: sau khi dữ liệu đã được tải vào data warehouse thì ta cần cập nhật các dữ liệu từ stage1.2 vào stage 1.1.

6.1.2. MÔ HÌNH DỮ LIỆU DATA WAREHOUSE :

Mô hình dữ liệu :

Ở sơ đồ trên ta có thể thấy bảng Fact (bảng sự kiện) là bảng DW_HOPDONG, bảng này lưu trữ 3 đại lượng quan trọng, đó là số lượng hợp đồng (SO_LUONG), tổng số phí khai thác được trong tháng (TONG_PHI) và tổng số tiền bảo hiểm (TONG_STBH).

Ngoài ra cũn cú 8 bảng chiều, đó là các bảng :

• DW_NDBH : cho biết các thuộc tính của người được bảo hiểm mà ta quan tâm đến như tuổi, giới tính, nghề nghiệp, các thông số về tình trạng sức khỏe.

• DW_NTG : cho biết các thuộc tính của người tham gia bảo hiểm (người đóng phí) mà ta quan tâm đến như tuổi, giới tính, tình trạng hôn nhân, nghề nghiệp, nằm trong khoảng thu nhập nào, các thông số về tỡnh trạng sức khỏe.

• DW_KVHC : chứa các khu vực hành chính, chiều này cho biết khu vực hành chính của người tham gia.

• DW_LOAI_HD : hiện tại ta chỉ quan tâm tới các hợp đồng khai thác được, tuy nhiên trong tương lai chủ đề này còn có thể mở rộng ra để theo dõi cả tình hình biến động của hợp đồng.

• DW_CTY : chứa các thuộc tính về công ty con, cho biết hợp đồng khai thác được thuộc về công ty nào trong các công ty con.

• DW_THOIGIAN : lưu các thuộc tính về thời gian chi tiết đến từng ngày, cho biết ngày đầu tiên hợp đồng được thu phí.

• DW_SANPHAM : lưu các thuộc tính về sản phẩm bảo hiểm, cho biết khách hàng đã mua sản phẩm nào.

• DW_TIEN : lưu các thuộc tính liên quan đến tiền trong hợp đồng bảo hiểm mà ta quan tâm, đó là số tiền bảo hiểm, phớ đúng hàng tháng, định kì nép của người mua bảo hiểm (1 tháng, 3 tháng, 6 tháng, 12 tháng hay đúng luụn 1 lần) và thời hạn nộp phớ.

Nhìn vào mô hình ở trên, ta thấy rằng có thể dễ dàng trả lời ngay một số câu hỏi như :

- Tính tỉ lệ hợp đồng bảo hiểm khai thác được theo từng sản phẩm ở từng vùng cho từng độ tuổi và giới tính của người tham gia bảo hiểm.

- So sánh số phí khai thác được theo từng vùng của quớ I năm nay với quớ I của năm ngoái.

- Tính tổng số tiền bảo hiểm theo độ tuổi và nhóm nghề của người được bảo hiểm.

Trên đây chỉ là một vài ví dụ nhưng chúng ta cũng nhận thức được rằng những câu trả lời cho các câu hỏi trên là rất hữu Ých cho công ty, nó giúp công ty thấy được tình trạng kinh doanh của mình và giúp cho công ty có thể vạch ra được những chiến lược tiếp thị hữu hiệu nhằm đẩy mạnh khả năng cạnh tranh trên thị trường.

Lợi Ých của mô hình dữ liệu trên không chỉ bị bó hẹp ở đây, nó còn là nền tảng cho những ứng dụng khai phá dữ liệu (data mining) có thể đem lại cho công ty những thông tin mới có giá trị.

Trong mô hình dữ liệu ở trên có 4 bảng chiều có dữ liệu ổn định và tương đối Ýt, đó là DW_THOIGIAN, DW_SANPHAM, DW_LOAI_HD, DW_KVHC, vì vậy 4 bảng này có thể dựng sẵn khung dữ liệu và thêm dữ liệu vào.

Bảng chiều DW_CTY có dữ liệu không ổn định vì theo thời gian, cỏc cụng ty con có thể mở thêm hoặc bỏ đi các văn phòng đại diện, do đó dữ liệu trong bảng này có thể thay đổi theo thời gian, vì vậy dữ liệu của bảng này sẽ được cập nhật khi thấy trong data source xuất hiện văn phòng đại diện mới.

3 bảng chiều còn lại là DW_NDBH, DW_NTG, DW_TIEN nếu ta dựng sẵn thỡ vỡ có rất nhiều trường hợp xảy ra nên dung lượng các bảng này sẽ rất lớn. Vì vậy ta chọn giải pháp là khi có trường hợp mới thì sẽ chèn thêm vào bảng.

Một phần của tài liệu những khái niệm về data warehouse (Trang 55 - 58)

Tải bản đầy đủ (DOC)

(68 trang)
w