Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 27 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
27
Dung lượng
571,5 KB
Nội dung
BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC CÔNG NGHỆ ĐỀ TÀI ! !" #$% ! && !'() $* Cao học khóa : K18. Giảng viên hướng dẫn : !+, -* Nhóm : ./ Sinh viên thực hiện : !+, 01$ * Sinh viên thực hiện : 2 !3-45 !* 6 LỜI GIỚI THIỆU 078)97:+$;1 ! !") ! !% 4< != > &*; !? $19($@ >$'"+A !=B 8>$C% !+ $D05 3= % & !EF G H 7I$$=$ !$; $H7I:9) !F *% ! J>$'"+A !=B8>9$;94$$I$KL JF 8M 94$$$N 84L$ F GO$$4: =3<$=$ ! 4 !<! !:PO>$" #$B8> !>A$N$Q C% !+ $$; 71$R*? ; !? $1=% ! = =B8> !S * ;S !T8<$F5 9N H+!!+, -9(R 4E ! U *V ! R 94L$A% !$F7>$=% ! >$'"+A ! =B8>A$N* Hà nội, ngày 06/04/2012 ;./ . MỤC LỤC Sinh viên thực hiện : Nguyễn Đức Bình 1 1 1.1 Lịch sử phát triển của Data warehouse 4 1.2 Data warehouse là gì? 4 1.3 Lợi ích data ware house đêm lại cho một tổ chức 8 1.4 Mô hình đa chiều (Dimensional modeling) 8 2 Phương pháp xây dựng kho dữ liệu 12 2.1 Kho dữ liệu doanh nghiệp (Enterprise data warehouse architecture) 14 2.2 Kho dữ liệu chiều (Dimensional data warehouse architecture): 16 2.3 So sánh kiến trúc Kimball và Inmon 17 2.4 Kho dữ liệu liên đoàn (Federated data warehouse architecture) 19 2.5 Data mart 21 3 Xây dựng kho dữ liệu 23 3.1 Hiện trạng dữ liệu và nhu cầu xây dựng kho dữ liệu 23 3.2 Xây dựng kho dữ liệu 24 W 1. Giới thiệu về Data warehouse 1.1 Lịch sử phát triển của Data warehouse XB8>9(94L$ $S B ! Y6Z[/991 ! $H !+$ !Y !7" #$B8>JF 8M% ! 4 !=% ! 9&94L$I\>S !9 !94L$T !*\$$>S !9 !&9) ! 94L$N=N9S4;$!3$OS84L !B8>!3$9(94L$ )$$ $; !!B$$] !I !)^$1$ ? >$ A$> #$LB8>=;=Y 5 *07 +&=;=Y $>$I $_#$L`" #$B8>a* XNJF8O)>S !? !94L$!@894L$N=N9 !FJ+N B !: 97*$;94B8>b$$>S ! !c =$ 4>S !JF 8MB8>J >O$$R d !OIF ! # OB8> !+$Fb'$$ !c I? !^$1$*B8> +9; 94L$^$1$ !)$$S4;$$9#$I$*" > E !4<T !% !J$% !$I$94L$$ !$:I\ $e !4<2 ! !> $; !, ! R 94L$$$ % ! B#$* 1.2 Data warehouse là gì? f C; 793 !g=B8> B !$P !97$;)S9$ ! !S ! *88 h !4<94L$IN9N 48$9i$Q=B 8>O=B8>94L$J+93 4 jData warehoue là một tập hợp dữ liệu tương đối ổn định (nonvolatile) , liên kết với thời gian (time-variant), được tích hợp (integrated) theo một chủ đề (subject-oriented) nhằm hỗ trợ quá trình tạo quyết định về mặt quản lý (Support management’s decision making process)j C$R !B !93 !g=B8>? 94L$!F#$ 4 Tính bền vững (Nonvolatile)B8>84 !8=% ! +9^* Biến thời gian (time-variant):k?$HJ !$=B8>8&7 <! 5 E$$>S !$ !>*C5\B8>$ !>B 8>$;!3> <*C] B8>$Q=B8>$ !$:% ! 83$T _# 4Olh6/ Y4E$a*m+NS<! 94L$84B !Cn* l Hướng chủ đề (subject-oriented): B8>94L$^$1$ !$$9S4L ! $# o$$$J = *m#^IN $Q$$B8>93 4E !9S4L !8=$ !OF GO $ !$:!3$I *R !>$% ;" #$B8>$$$ 94J+N93 O =% !R !$$&9) !+$$'T8M!3$ ! !+ p Tích hợp (integrated) B8>b 7 !c =$ $Q$$] !I !^$1$*!c B8>=$ $;$; B !$$=$ 9'$ 93 )9S4L !$*+ ? O !)=B8>$q$;)93 !g$QF G*07 +9&94L$Ir !$$T !!FJ+N' !9) ? !=B8>*m=$P !9&94L$97 +O$P ! ;r !B 8>94L$#$L* Hỗ trợ quá trình tạo quyết định (Support management’s decision making process) >JF$Q)=B8>!P94J+N93 A? B8> 83$To$A=> *n9;O$$J+N93 = OJ+ = $;94L$S4;9 " !$>JF* s 1.3 Lợi ích data ware house đêm lại cho một tổ chức. C;: 78L#$=B8> !8&$$$^$1$ tBB8>83$T9" #$R$# N>S ! !c =% !+ B8>83$T* Ce9 !"+$R$$B8>? !>* CF> $:84L !B8>Ir !$$8&$$+ 9^B8>=F =B8>* C !$:$I)R = o$ !4<J+N93 )? IF + :$Q$" 8Mo$$$% ! 94L$ I+S ! :* C !$:% ! +B8>I)R = o$ !4<J+N 93 * C !$:>:+: S4;=% !F 4\ !9N >S ! &9) !* C !$:% ! 9$F> J+ = * 1.4 Mô hình đa chiều (Dimensional modeling). V% 9$78)N=N$5\B8>=uR9KL !4< 2 ! !>9+: B8> !=B8>*C$% 9$7 94L$ 94E !E$F> >:+: ,T !*07 J @ !8$H 84Mr !$$% $78=% !$H N)$ $5\B8>J >*C$45 !N$R % 9$7O\1$L 8MO$;94L$ !$I:=v 1$R8MO$d !& 4$5\B8> J >9$7* !% 9$7O$;= >J @ !A=> _w$a=#$ 4E$_ a* Sự kiện (fact):$] 94L$!@84E$984< ! & != *nA => 8!3S$;94L$^ !L*m#S84L ! !I * [ Kích thước (dimensions)94L$!@8IS$F !P'$93 x$$A=> O #? F GO45 !>O<! ***8 B ! H $Q=#$ 4E$* Hình : Mô hình đa chiều của một doanh nghiệp có chiều Time, Product, Market. Mô hình đa chiều được thiết kế theo 03 kiểu như sau: Lược đồ sao (Star schema): 8)N=N$7$)$5\B8>J >4< !94L$T ! !*C;)IF !A=> _w$a & ! " $Q 84L$ 9c I J I\ ) S IF ! =#$ 4E$ _ a !84L$9cO=#$4E$8? J 9N ;8&E 48$$$) !IF !=#$4E$94L$T !984BB8>$Q A=> 94L$84B !A=> _w$a* Hình : Minh họa lược đồ ngôi sao. Z Lược đồ bông tuyết (Snowflake schema): I!c)IF !A=> _w$a IJ I\ 7IF !=#$4E$_ a$;94L$=N SE IF !=#$4E$_ a=$% !JSJ > 7h)*4L$ 9cI% !+N8)8&84L$9cO+ ? ;81$&5 E )84L$9c*4L$9cI% !+N94L$N=Nb$$84L$9cIr ! $$N$$G ;$$IF !=#$4E$98&IyB8>4b* 9; !84L$9cI% !+NO+$;)IF !=#$4E$8E =N SE )IF !A$Nz$;) ;$$IF !=#$4E$ 7*tF 9c + ${ !!PN=>=% !! + ? ;8Y !S84L !$QIF ! =#$4E$* Hình: Minh họa lược đồ bông tuyết. So sánh lược đồ sao & lược đồ bông tuyết: Lược đồ sao Lược đồ bông tuyết Dễ hiểu , !5 $ !4<2 ! !>$$ " #$+: B8>* C;8=;=Y 5 $ !4<2 ! !> $$ " #$S 84L !I O@F9S; 6/ [...]... hợp dữ liệu nguyên tử Dữ liệu trong kho dữ liệu doanh nghiệp bị bắt ở một mức độ thấp nhất của chi tiết Dữ liệu trong kho dữ liệu doanh nghiệp được lưu trữ trong cơ sở dữ liệu quan hệ và sử dụng thiết kế cơ sở dữ liệu theo dạng 3NF Data mart: là góc nhìn thông tin theo dữ liệu hướng chủ đềc ủa một bộ phận Data mart nhận dữ liệu từ kho dữ liệu doanh nghiệp Sự tổng hợp dữ liệu có thể xảy ra khi dữ liệu. .. của dữ liệu cư trú 19 trong mỗi cấp độ hệ thống Trong khu vực liên dữ liệu hình ảnh kiến trúc nhà kho dưới đây, có hai luồng dữ liệu giữa các kho dữ liệu khu vực và toàn cầu: Đẩy lên (Upward Federation): dữ liệu thực tế chỉ được chuyển từ kho dữ liệu khu vực lên kho dữ liệu toàn cầu Tập hợp dữ liệu có thể xảy ra tại kho dữ liệu toàn cầu sau khi dữ liệu tích hợp hoặc trong quá trình chuyển dữ liệu. .. kho dữ liệu doanh nghiệp Ứng dụng kho dữ liệu như các công cụ báo cáo, dữ liệu được truy vấn từ data mart thay truy vấn trực tiếp vào kho dữ liệu Kho dữ liệu chiều (Dimensional data warehouse architecture): Trong kiến trúc của Ralph Kimball về kho dữ liệu, dữ liệu được mang từ khắp các doanh nghiệp vào một địa điểm trung tâm được gọi là chiều kho dữ liệu Giống như kiến trúc của Inmon về kho dữ liệu, ... để xác minh các mô hình dữ liệu 2 Phương pháp xây dựng kho dữ liệu Chọn lựa kiến trúc kho dữ liệu phù hợp để xây dựng data warehouse là một công việc cực kỳ quan trọng nhằm đảm bảo data warehouse sẽ đáp ứng được các yêu cầu kinh doanh Một số kiến trúc kho dữ liệu thông dụng: Kho dữ liệu doanh nghiệp (Enterprise data warehouse architecture): Theo Inmon Bill về kiến trúc kho dữ liệu doanh nghiệp thì... là kho dữ liệu doanh nghiệp hoặc EDW Tiến trình ETL có thể chạy như một 14 quá trình thực thi định kỳ hoặc một giao dịch dựa trên dữ liệu thời gian thực gần Tiến trình ETL được gọi là tích hợp dữ liệu hoặc các dịch vụ dữ liệu Kho dữ liệu doanh nghiệp (Enterprise data warehouse) : là một yếu tố trung tâm trong kiến trúc kho dữ liệu của Inmon Theo định nghĩa của Inmon về kho dữ liệu, kho dữ liệu doanh... Federation): Dữ liệu được đẩy từ kho dữ liệu toàn cầu xuống kho dữ liệu khu vực Để đảm bảo sự thống nhất và toàn vẹn của dữ liệu trong tổ chức Dữ liệu giao dịch từ hệ thống hoạt động doanh nghiệp như ERP, CRM có nguồn gốc ở cấp độ toàn cầu và sau đó trích xuất, chuyển đổi và nạp vào kho dữ liệu khu vực tương ứng Hình: Khu vực - kho dữ liệu liên đoàn Chức năng có thể có ở kho dữ liệu liên đoàn Kho dữ liệu. .. được thực hiện bên ngoài các kho dữ liệu An ninh: bằng cách đặt các dữ liệu bên ngoài kho dữ liệu trong các data mart, từng bộ phận sở hữu dữ liệu của họ và hoàn toàn kiểm soát dữ liệu của họ 22 KPI theo dõi data mart là nơi lý tưởng để xây dựng và theo dõi KPIs qua thời gian dài của thời gian 3 Xây dựng kho dữ liệu 3.1 Hiện trạng dữ liệu và nhu cầu xây dựng kho dữ liệu Hiện tại Công ty Punica đang... thiết để tách các data mart từ kho dữ liệu chiều 17 Trong kho dữ liệu chiều của Kimball, phân tích hệ thống có thể truy cập dữ liệu trực tiếp Trong khi trong kiến trúc của Inmon, hệ thống phân tích chỉ có thể truy cập dữ liệu trong kho dữ liệu doanh nghiệp thông qua các data mart So sánh Kimball và Inmon trong cách tiếp cận xây dựng kho dữ liệu Bill Inmon đề nghị xây dựng kho dữ liệu theo phương... chuyển từ kho dữ liệu doanh nghiệp đến data mart Data mart sử dụng thiết kế chiều do đó các dữ liệu trong các Data mart đã sẵn sàng để phân tích Điều quan trọng là cần lưu ý rằng tất cả các ứng dụng bên ngoài hoặc các công cụ báo cáo, quản trị doanh nghiệp thông minh truy vấn dữ liệu từ data mart thay vì truy cập trực tiếp kho dữ liệu doanh nghiệp 15 2.2 Kho dữ liệu chiều (Dimensional data warehouse architecture):... dữ liệu khác nhau được xây dựng riêng cho các ứng dụng cụ thể như ERP, CRM hoặc chủ đề cụ thể Các thành phần chức năng của kiến trúc kho dữ liệu liên đoàn bao gồm các data mart, kho dữ liệu tùy chỉnh, công cụ ETL, chức năng báo cáo qua hệ thống, lưu trữ dữ liệu thời gian thực và báo cáo như hình dưới đây: 20 Hình: Chức năng - kho dữ liệu liên đoàn 2.5 Data mart Một data mart là một tập hợp các dữ liệu . (Federated data warehouse architecture) 19 2.5 Data mart 21 3 Xây dựng kho dữ liệu 23 3.1 Hiện trạng dữ liệu và nhu cầu xây dựng kho dữ liệu 23 3.2 Xây dựng kho dữ liệu 24 W 1. Giới thiệu về Data warehouse 1.1. Kho dữ liệu doanh nghiệp (Enterprise data warehouse architecture) 14 2.2 Kho dữ liệu chiều (Dimensional data warehouse architecture): 16 2.3 So sánh kiến trúc Kimball và Inmon 17 2.4 Kho dữ liệu. triển của Data warehouse 4 1.2 Data warehouse là gì? 4 1.3 Lợi ích data ware house đêm lại cho một tổ chức 8 1.4 Mô hình đa chiều (Dimensional modeling) 8 2 Phương pháp xây dựng kho dữ liệu 12 2.1