Các thành phần chính của mơ hình dữ liệu trong kho dữ liệu

Một phần của tài liệu Xây dựng kho dữ liệu cải thiện chất lượng báo cáo quá trình xử lý phiếu yêu cầu tại trung tâm chăm sóc khách hàng tổng công ty điện lực miền bắc,khoá luận tốt nghiệp (Trang 45 - 49)

CHƯƠNG 1 : TỔNG QUAN VỀ BÀI TOÁN NGHIÊN CỨU

2.3 Các thành phần chính của mơ hình dữ liệu trong kho dữ liệu

Mơ hình dữ liệu trong kho dữ liệu gồm có 2 thành phần chính: Bảng Dimesion và Bảng Fact.

2.3.1 Bảng Dimesion

2.3.1.1 Khái niệm

Các bảng Demision cung cấp thông tin trả lời cho câu hỏi “ai, cái gì, ở đâu, khi nào, tại sao và như thế nào”, liên quan đến các sự kiện xảy ra trong doanh nghiệp. Các bảng demesion chứa các thuộc tính mơ tả các thực thể trong tổ chức và được tham chiếu tới bảng Fact. Dữ liệu trong bảng Dimesion là dữ liệu tĩnh và được sử dụng để giải thích cho các khóa chính tương ứng trong bảng Fact.

Dữ liệu trong các bảng Dimesion thông thường được thu thập ở cấp độ chi tiết nhất sau đó được tổng hợp lên cấp độ cao hơn để thuận tiện cho việc phân tích.

Các bảng Demision có thể được liên kết theo cấp bậc cha con hoặc dựa trên mối quan hệ thực tế giữa các bảng Dimesion. Ví dụ:

- Với chiều về thời gian, dữ liệu về thời gian có thể được tổng hợp từ cấp độ thấp

nhất là tháng đến quý và cấp cao nhất là đến năm.

Key ID Name Region

123 VA-13 ACME Products_____________ Northeast__________

234 PA-07_________ Ace Products & Sendees Northeast__________

Key ID Name Region

123 VA-13 ACME Products Mid-Atlantic________

234_______ PA-O7_________ Ace Products & Sendees Northeast__________

Khóa lu n t t nghi pậ ố ệ

Hình 2.3: Thiết kế chiều thời gian trongDWH

2.3.1.2 Các phương pháp đưa dữ liệu vào bảng Dimesion (Slowly Changing Dimensions)

- Phương pháp 1:

Người dùng chỉ cần ghi đè lên các giá trị dữ liệu hiện có bằng các giá trị dữ liệu mới. Điều này làm cho việc cập nhật bảng Dimesion dễ dàng. Hạn chế của điều này là mất dữ liệu cũ vì bảng Dimensions sẽ ln chứa các giá trị hiện tại cho mỗi thuộc tính. Chẳng hạn, bạn có bảng Dimension cửa hàng có thuộc tính khu vực địa lý. Một số cửa hàng có thể chuyển từ vùng này sang vùng khác. Theo phương pháp, bảng Dimesion về khu vực địa lý sẽ xóa dữ liệu về khu vực của cửa hàng cũ và cập nhập khu vực mới. Thay đổi này sẽ làm lệch các báo cáo lịch sử và các kết quả trước khi cập nhật sẽ khơng cịn phù hợp với kết quả sau khi cập nhật cho cùng một khung thời gian.

Lê Th Thu Trangị 27

Khóa lu n t t nghi pậ ố ệ

Original Record

Key ID

Name Region ACT

V RCR

ACTV

START ACTVEND

123 VA-13 ACME Products Northeast 1 2014032 9999999

234 PA-07 Ace Products Northeast 1 2014050

8 99999999

Key ID Name__________ Region_____ ACTVRCRD ACTVSTART ACTVEND

123 VA-13 ACME Products Nortlieast O______ 2014032

8 20160728

234 PA-07 Ace Products Northeast 1 2014050

8 99999999

784 VA-13 ACME Products Mid-Atlantic 1_______ 2016072

9 99999999

Key ID Name Region Previous Region

123 VA-13 Ace

Hardware Northeast_____________

234 PA-07 Ace Products Northeast_____________

Key ID Name Region Previous Region

123 VA-13 Ace Mid-AtIantic___________ Northeast____________

234 PA-07 Ace Products Northeast_____________

Hình 2.4: Kiến trúc đơn giản nhất của kho dữ liệu

- Phương pháp 2:

Đây là loại được sử dụng phổ biến nhất. Đối với loại này, sẽ thêm một bản ghi mới bao gồm thay đổi và đánh dấu bản ghi cũ là không hoạt động. Điều này cho phép bảng Fact tiếp tục sử dụng và phiên bản cũ của dữ liệu sẽ dùng cho mục đích báo cáo lịch sử. Dữ liệu đã thay đổi được lưu trữ trong bản ghi mới và chỉ tác động đến dữ liệu của bảng Fact từ thời điểm đó trở đi. Một số cột phải được thêm vào bảng Dimension (ngày bắt đầu / ngày kết thúc bản ghi hoạt động) để quản lý thay đổi và đảm bảo sử dụng tối ưu bản ghi đang hoạt động. Sử dụng cùng ví dụ từ Loại 1 ở trên. Bản ghi mới sẽ được sử dụng cho bảng Fact và khơng làm mất bản ghi cũ. Qua đó sẽ đảm bảo tính tồn vẹn cho dữ liệu.

Lê Th Thu Trangị 28

Khóa lu n t t nghi pậ ố ệ

Original Record

Inserted / Updated Records

Hình 2.5: Minh họa về phương pháp đưa dữ liệu vào bảng Dimesion

- Phương pháp 3:

Đây là loại ít được sử dụng. Trong loại này, sẽ thêm một cột để lưu trữ giá trị quá khứ của bản ghi được thay đổi. Khi dữ liệu được cập nhật, bản ghi mới sẽ được lưu trữ tại vị trí của bản ghi cũ và thêm một cột lưu trữ giá trị cũ. Điều này cho phép người dụng xem lại giá trị của dữ liệu trước đó. Đây có thể là một khó khăn khi cập nhật dữ liệu.

Original Record

Hình 2.6: Minh họa về phương pháp đưa dữ liệu vào bảng Dimesion

2.3.2 Bảng Fact

Bảng Fact là bảng chứa lượng dữ lớn trong kho dữ liệu và có hai loại cột chính: Khóa chính của các bảng Dimesion liên quan đến bảng Fact và dữ liệu số

facusupply_order product-ld Int PK FK ti me Jd Int PK FK Supplleuld Int PK FK em PI OyeeJd Int PK FK price dedmal{8,2 quantity dedmal(8,2 ) dim_time ti∣mejd Int PK —F

act IO Udate date

actlouweek Int

actloumonth Int

act Iouyear Int

act I Ouweekday Varchar(IC)

dỉm.product

Khóa lu n t t nghi pậ ố ệ

(measurement). Bảng Fact có thể chứa dữ liệu ở cấp chi tiếp nhất của một hoạt động xảy ra trong một tổ chức hoặc ở cấp tổng hợp dữ liệu.

Mỗi bản ghi trong bảng Fact thể hiện một sự kiện xảy ra trong một khoảng thời gian xác định.

Một phần của tài liệu Xây dựng kho dữ liệu cải thiện chất lượng báo cáo quá trình xử lý phiếu yêu cầu tại trung tâm chăm sóc khách hàng tổng công ty điện lực miền bắc,khoá luận tốt nghiệp (Trang 45 - 49)

Tải bản đầy đủ (DOCX)

(115 trang)
w