MỎ HÌNH Dữ LIỆU CHO KHO DỮ LIỆU

Một phần của tài liệu Một số vấn đề cơ bản về thiết kế và xây dựng mô hình Datawarehouse (Trang 33)

CẤU TRÚC KHO DỮ LIỆU VẦ MƠ HỈNH DỮ LIỆU.

2.3. MỎ HÌNH Dữ LIỆU CHO KHO DỮ LIỆU

Phần này cun® cấp những thơng tin cơ bán vé mơ hình dữ liệu, (lặc biệt dành ch o m ụ c đích thực hiện một kho dữ liệu.

Kho dữ liệu nĩi chu nu đã dần dược ehiíp nhận n hư cách liếp cận lot nhâì lạo nguồn dữ liệu tích hợp nhất quán tĩế sử dụm» phàn tích d ữ liệu và dưa ra các quyế t định kinh doanh. Tuy nhiên, kho dữ liệu cỏ thế dưa ra những ván dể phức tạp, địi hỏi thời gian và nguồn lực dáng kế dế thực hiện. Điều này thực s ự đ ún g khi thực hiện trèn cơ sở tập đồn lớn. Đế đạt các lợi ích nhanh hơn giải pháp thực hiện là lựa chọn bước tiếp cận lhực hiện là lừ dưới lên với Data Mart . Viộc tiến hành những gia tăng nhỏ trong phạm vi nhỏ sẽ tạo một khoản hồn vốn đầu tư lớn hơn trong một thời gian ngán. Điều này khơng loại trừ việc tiến hành xây dựng kho dữ iiộu tống thế.. Nĩ cũng cho Ihấy rang Data Mart cĩ thể được m ở rộng hoặc dược tích hợp đe cu n g cấp một giải phấp kho dữ liệu tổng thể cho một tổ chức. Cho dù tiếp cận kho dữ liệu từ viền cảnh tổng thể hay bằng việc thực hiện Data Marl thi những tiện ích từ một kho d ữ liệu luơn nối bật.

Càu hỏi sau đĩ là, làm thế nào đế cơ sở dữ liệu cùa kho dữ liệu dược thiết k ế tốt nhất hỗ trợ các nhu cáu của người sứ dụng kho dữ liệu? Tra lời câu hỏi uày ià nh iệm vụ của người xây dựng mơ hình d ữ liệu. Khi trình bầy vấn dề

này, trừ phi kho d ữ ỉiệu dược xác định khúc di, thuật n s ữ dĩ cũng bao hàm ý

Data Mart

Trong phán này ch ún g ta xéi lới hai kỹ thuột xfly LỈựng mổ hình dữ liêu cư bán: xây dựng mơ hình ER(Thực thể-Quan hệ Entity Relationship) và xây dựng mơ hình theo chiếu. Trong mơi trường OLTP, kỹ thuật xây đựniỉ mơ hình ER là sự lựa chọn dã qua thử thách. Với sự ra dời của kho dữ liệu, xuất hiện yêu cáu cần cĩ một loại kỹ ihuật dế hỗ trợ c h o mơi trường phán lích dữ liệu. Mặc dù các mơ hình ER cĩ thế sứ đ ụ n " đè hỗ trợ mơi trường kho dữ liệu, hiện nay sự quan tâm về cách xây dựnu mỏ hình theo chicu nhằm đáp ứng nhiệm vụ này cũ n g đã gia táníi.

Chúng ta sẽ xem xét tại sao việc xày dựng mỏ hình dữ liệu lại quan trọng đối với kho d ữ liệu và sau đĩ mỏ lá các khái niệm và Ihuộc tính cơ bán cùa cách xây dựng mơ hình HR và cách xây d ự n s mị hình theo chiều.

2.3. L. T ạ i s a o việc xây d ự n g IT1Ỏ h ì n h d ữ liệu là (ỊUiìn t r ọ n g

S ự h ỉn h d u n g cứa g ỉĩ i k in h d o a n h: nĩi c h u n a m ỏ hình là sự Irừu tượng hố và phán ánh thế giới thực. Việc xày dựng mị hình cho ta kha năng để hình d u n g cái mà cluing la cịn chưa hiện thực hố dược. Xày dựng mơ hình dữ liệu cííĩìií tương tự như vậy.

T h e o cách truyền thống, người la xây dựng mổ hình dữ liệu phái sử dụng sơ đồ ER, được phát triển như một phíìn của qui trình xây dựng mơ hình dữ liệu, n h ư một phương tiện thõng tin lièn lạc với nhà kinh doanh - người sử dụng . Đ ồ thị ER là một cồng cụ cĩ thể giúp phủrt tích các yêu cầu kinh doanh và thiết k ế cấu trúc dừ liệu sau này. Xúy dựng mơ hình chiều cho chúng ta một khả nũng tốt hơn để hình dung những cAu hỏi rất trìru tượng được yêu cầu trá lời cho nhà kinh doanh - người sử dụng. Sử dụ ng mơ hình chiều, người sử đụng cĩ thể dễ dàng hiểu, dược tiếp cận tới cấu trúc dừ liệu và khai thác triệt để nh ữn g d ữ liệu này.

Thực tế, dừ liệu đơn thuíỉn là bản ghi mọi hoạt động kinh doanh, tài nguyên n g uồn ỉực và kết quả cùa một cơ quan tổ chức. Mơ hình dữ liệu là sự trừu tượng cĩ tổ chức c ao các d ữ liệu này. Do vậy, điểu hồn tồn tự nhiên khi mị hình d ữ liệu trở thành phương pháp tốt nhất dế hiếu và quan lý việc kinh doanh của cơ tố chức. Thiếu một mơ hình dữ liệu sẽ riú khĩ tổ chức cấu trúc và các nội du ng của dữ liệu Irong kho dữ liệu.

T h ự c ch ấ t củ a k iế n trú c k h o d ữ liệ u : Ngồi ích lợi của việc hình dung, mủ hình dữ liệu đổng vai trị hướng dẫn, hoăc lạp k ế hoạch, nhàm thực hiện kho dữ liệu. Th eo các h truyền thống, việc xây dựng mị hình ER chú yếu tập trung vào loại bĩ sự d ư thừa dữ liêu và duy trì sự nhất quán siữa các nguồn và các ứng dụ ng cỉữ liệu khác nhau. Sự thống nhất các m ơ hình dữ liệu của từng lĩnh vực kinh doanh trước khi tiến hành thực sự cĩ thế giúp đàm bào rằng kết quá sẽ là một kho dữ liệu hiệu quá và cĩ thể giúp giám chi phí thực hiện.

C á c b ư ớ c tiếp cặn k h á c n h a u củ a mỏ h ỉn h d ừ liệ u : việc xây dựng mơ hình ER và mơ hình chiều, mặc dù cĩ liên quan nhưng lại khác nhau. Cĩ rất nhiều sự tranh ỉuận xem phương pháp nào là tốt nhất và các điểu kiện trong dĩ phái lựa ch ọ n một kỹ thuậi đặc ihù. Sẽ kh ơn s thể cĩ câu trá lời rõ rùng cái nào là lốt nhất, nhưng cũng cĩ nlìữns hướng dần xem sự lựa chọn nào tối hơn trong lừng bối cánh hay mơi trường riêng hiệt. Tại niuìna phđn dưới đùy, chúng ta sẽ x em xét và xác định các kỹ thiũit xây tlựniĩ mị hình và dira ra một sơ' hướniĩ dẫn lựa chọn.

2.3.2, C á c kỷ t h u ậ t xây d ự n g mơ hìn h d ừ liệu

Cĩ hai loại kỹ thuật xây dưng mơ hình dữ liệu thích hợp Irong mồi trường kho d ừ liệu là xây tlựng mỏ hình ER và xây dựng mỏ hình chiều.

Việc xây (íựn<4 mĩ hình ER lạo ra một m ỏ hình dữ liệu về một lĩnh vực

quan (âm nhất định sử đụnsỉ hai khái niệm c ơ bán: các thực tliê và các mối

(Ị lum hệ siữa các thực th ể dĩ. Các mơ h ìn h ER c h i tiết CŨIVÌ b a o gổm các

thuộc tính, thuộc tính này cĩ thể hoặc ỉà dặc tính của thực thè hoặc là đặc tính

của mối quan hệ. Mơ hình ER là một cơng cụ trừu tượng vì nĩ cĩ thể được sứ dụng để hiểu và làm đơn gian hố các mối quan hệ dữ liệu m ơ hồ trong giới kinh cỉoanh và trong các mơi trường hệ thống phức tạp.

Việc xây dụng mơ hình [heo chiều sừ d ụ n g 3 khái niệm cơ bán: phép do,

Ị hực tế v ầ chiều. Việc xây dựng mơ hình theo cliiều rấi cĩ ích khi thê hiện các

yẻu cầu c ủa người sử dụng-nhà kinh doanh trong ph ạm vi các báng biểu cơ sở d ữ liệu.

Cá hai loại xây dựng mĩ hình ER và chiều tiểu cĩ thể đirực sử đụng để lạo một m ơ hình trừu tượng của một chủ để riêng. Tuy nhiên, mỏi loại tiều cĩ những hạn c h ế của mình về các khái niệm xây dựng m ơ hình và các qui ước ký hiệu. Kết quá là, cúc cơng niỉhệ và kỹ thuật cĩ vé khác nhau, và chúng thực sự khác nhau về mật ngừ nghĩa. Những phần dưới đây mơ tá các khái niệm xày dựn g mõ hình và qui ước ký hiệu cho cà hai loại xi\y dựng mơ hình ER và chiểu sẽ dược sử d ụ ng trong tồn bộ phíin này.

2.3.3. Xâ y d ự n g m ồ h ì n h ER

T ro ng phần này ta khơnu tập I r u n í vào nhữniĩ hiếu biết cơ bản về xây dựng mơ hình ER và chỉ đơn gián xác định các thuật n g ữ cơ bán đc tạo sự nhất quán và đưa ru những qui ƯỚC đtrựe sử đụn<z ớ phần cịn hú.

C á c k h á i niệm c ơ bản

M ơ hình ER dược thế hiện bằng sơ đổ ER sử d u n a 3 biếu lượng dồ hoạ cơ bán để hình thành khái niệm clữ liệu: thực thế, mối quan hệ và thuộc tính.

T fufe th ế

Một thực thơ được định nghĩa [à một con người, một địa điếm, vật hỗe sự kiện quan tâm (lối với việc kinh doanh hay cơ quan, tổ chúc. Một ihực thế

(tại diện cho mộl lớp (lối tirợniĩ là nlũrrm ihứ IIOI12 thế lỉiới thài cĩ [hể được

C|ium sát và phàn loại hỡi các (lộc lính và (lặc điếm cúii cluìiiũ. TYonụ mộl số

tài liệu, thuật ng ữ loại thực thê dược sử dụng dế dại diện cho các lớp dối tượng và thực th ể v í dụ cho mội loại thực thế-.

M ặc dù vạy, 2 thuật ngữ này cĩ thế khác qua các pha xây dựng mị hì nh.Thường mỗi thực the tiều cĩ định nghía kinh do anh của riêng nĩ và một

định nghĩa rõ ràng về ranh giới dược yêu cáu dể mị tá cái 21 cấu thành nên

ihực thể. Tr on g một dự án xây dựng mơ hình thực tế, các thành viên dự án cù ng chia sé một khuơn m ầu định nghĩa dê tích hựp và một định nghĩa thực t M nhấí quán trong một mơ hình. Trong xây dựng m ỏ hình kinh doanh ớ mức cao một thực thể cĩ thể rất chung chung, nhưng trong xây dựng mơ hình logic chi tiết thì một thực thế phải rất cụ thể.

T h ự c th e rv <■«* r ị#’ị *■1 r n o o o c r 0 tị ítrM Vĩl-M í +7 4 rV r V P*ỂV% **.f* V- 1 i.ivir ‘JkrjCị.+ 1 •»*» -J mẹ 9 > 9... . T h u ộ c tín h ____ _________ — #• 'O y -n crnrmpnnN ( •» r.r.r.r U9J Ị Q u a n hệ 1 ^ U — J - U r - 0 ‘9 uỹíi r* * l l ỉ r» » r ^ 1 * » H ì n h 7: M ỏ h ìn h E R c h ứ a t h ự c thế, q u a n hệ và t h u ộ c tí nh

Hình 7 cho thấy một ví dụ về cúc thực thế trong một sơ đổ ER. Mỗi hình chữ nhại đại diện cho một thực thế và trong phán này tên của thực thể được ký hiệu bằng các ch ữ in hoa. Ở đây cĩ 4 thực thể: P R O D U C T , P R O D U C T C O M P O N E N T , P R O D U C T M O D E L , VÀ C O M P O N E N T . Bốn đường chéo ớ các gĩc cúa thực thể P R O D U C T C O M P O N E N T thế hiện ký hiệu cho một

ihực thế kết hợp. Một thực thể kết hựp thường để giải quyêì mối quan hệ nhiều

bẽn giữa hai lỉụre thể. P R O D U C T M O D E L vù C O M P O N E N T là hai thực thế độc lập với nhau tuy nhiên lại cĩ mỏi quan hệ kinh doanh giữa hai phần này. Mội m ơ hình sán pháin bao gồm nhiều thành phần và một thành phán cĩ liên quan tới nhiều mơ hình sán phám. Với quy tác kinh doanh như th ế này, chúng la khơng ihc nĩi n h ữ n s thành phần nào tạo thành m ỏ hình sán phẩm. Để ỉàm

P R O D U C T C O M P O N E N T cĩ I he Cling càp ihịim Ún dế xem Ihànlì phàn nào c ỏ liên quan lới mồ hình sán phiím nào.

T r o n lĩ xây dựnu mơ hình BR, dặt lơn cho các thực ihc là râì quan trọng clẽ hiếu và thơng tin liơn lạc dề dàng và rõ. Thường, tên thực thế thể hiện về m ặt n g ữ pháp dưới dạng danh từ hơn là động từ. Tiêu chí lựa chọn tồn thực ihể

là tên đ ĩ the hiện các dặc điểm và phạm vi Ihực thể 101 lới mức nào.

T r o n g m ơ hình ER chi tiết, nhiệm vụ quan trọng nhất là xác định từ định

d a n h d u y nhất của thực thể. Những từ định danh duy nhất này được gọi là fừ

khố ứng cứ. Từ những từ này ch úng ta cĩ thế lựa chọn từ khố được sử đụng

c h u n g nhất để nhận biết thực thể. Từ này dược gọi lù từkỉìOĨ gốc,

M ố i quan hê

Mối qu an hệ được thể hiện bủng các đường vẽ giữa các thực thể. Nĩ miêu tủ sự tương tác về mật cấu trúc và sự kết hợp giữa các thực thể trong mộ t mơ

hình. M ối quan hệ được xác định vể mặt ngữ pháp bằng dộng từ, như s ở hữu,

th uộc về',cĩ . Mối quan hệ giữa hai thực thế cĩ thể được xác định bàng số các yếu tị trong một tập hợp. Số các yếu tố trong mộ t tạp hợp cĩ khả năng [à : m ột -m ộ t ( 1: l),một-nhiẻu ( i: N ) , và nhiểu-nhiều (N:N). Trong mơ hình ER (đanh định) chi tiết, khơng chi ra bất kỳ mối quan hộ M :M nào do nĩ dược xử lý đến một ihực thể kết hợp.

Hình 7 cho thấy các ví dụ vé mối quan hệ. Sơ đổ ER mức cao cố các

tơn mối quan hệ, nhưng trong sơ đổ ER chi tiết, các ch uy ên viên thiết kế tin học thường khơng xác định tên mối quan hệ. Ở Hình 7, đường nối giữa C O M P O N E N T va P R O D U C T C O M P O N E N T lù một mối quan hẹ. Ký hiệu (dường gạch chéo và dường ngán) tren mối quan hệ này the hiện số các yếu tố trong một tập hợp.

Khi mộ t mối quan hệ của mội thực ihc cĩ liên quan tới tự thân nĩ, chúng

ta cĩ thế nĩi lằng mối quan hệ này là ílệ quy. Các mối quan hệ đệ quy Ihường

dược phát triển hoặc ứ các [hực thể kếi hợp hoậc mội thuộc tính cĩ tham chiếu đến ihể hiện khác của cùng Llụrc ihổ.

Khi số các yếu tỏ trong một tập hựp của một thực thế là mội-nhiểu, thường thì mối quan hệ này thế hiện mối quan hệ phụ thuộc của niột thực the này với mội thực thế khác. Trong lrường hợp dĩ. từ khố gốc cùa thực thể cha mẹ được thừa k ế lại ở thực thể phụ thuộc như một phán của lừ khố sốc.

Tlitiơc lính

Các thuộc tính mị tá dặc điếm các dặc lính của các thực thể.Tại Hìnli 7,

ID sán phẩm, Mơ lá, và Hình ánh là các l l ì L i ộ c tính của Ihực ihế PRODUCT.

Đê làm rõ, các qui ước về lên thuộc tính là rất quan ư ọn g . Tơn một thuộc tính phái nhất qu án Irong thực thể và phai cĩ khá năng tự eiãi thích. Ví dụ, nĩi đơn gián là Ngày 1 hoặc Ngày 2 là khơng dược phép, chúng ta phải định nghĩa rõ ràng từng ngày. Ví dụ như chúng cĩ thể dược định nghĩa là ngày dặt hàng và ngày giao hàng.

C á c khái niêm khác

M ộ t khái niệm được sử dụng nhiều là m iên (domain). Một miền chứa

tồn bộ các giá trị và phạm trù cĩ khả năng chấp nhận được cho phép đối với một thuộc tính. Một cách đơn giản thì miền là tồn bộ các biến thể cĩ khả Iiflng thực. Khuơn thức, dạng mẫu hay loại dữ liệu như số nguyên, ngày tháng, và ký tự đưa ra một định nghĩa rõ ràng về miền. Đối với loại miền cĩ tính liệt kè, các Inrờng hợp cĩ thể phải được xác định. Lợi ích thực tế của miền là nĩ là bát buộc dối với việc xày dựng từ điến dữ liệu hoặc kho dữ liệu và kết quá là thực hiện một cơ sở d ữ liệu. Ví dụ, giả sử chủng ta cĩ một thuộc lính mới gọi là lo ạ i sân phẩm trong thực thế P R O D U C T và số lượng các loại san phẩm là cố định với giá trị là Celíphone(diện thoại tế bào) và Pager (nhán tin). 'Thuộc tính loại san phẩm hình thành nên một miền liệt kê với các trường hợp vể Cellphone và Pager, và nhừrìíi Ihồng tin này phải nằm Irong ỉừ điển dữ liệu.

Th uộ c tính lìiỊỊv mua dầu của thực thế PRODUCT' M O D E L cĩ thể là bất kỳ

ngày nào trong các ciiều kiện nhất định. Đối với loại miền hạn c h ế này, các trường hơp khơng thế cố định và phạm vi hoặc các điểu kiện phai dược bao hàm í rong lừ điển dữ liệu.

Mội khái niệm quan trọng khác Dong việc xây đựng mơ hình ER chính là sự chuẩn hố. Chu an hố là mội quá trình biến đổi các thuộc tính cho các thực thè’ theo cách lùm giám việc dự phịng dữ liệu, tránh những bất [hường dữ liệu, tạo mộ t kiến trúc vững chác đế cập nhật dữ liệu, và lãng cường khá năng kết hợp lâu dài cùa mơ hình (lữ liệu. Hình ihứe bình ihườníi thứ ba này thường ià đủ. Q ú a trình xử ỉý các mối quan hệ nhiều-nhiểu là một ví dụ vể chuẩn hố.

Bổ sung cho các khái niệm xày đựng mõ hình ER c ơ bàn, cĩ 2 khái niệm khác cũ n g rất quan ưọnu:

• Loại cha và con (supertypc & subiỵpe) • Thơn« háo ràng buộc (Contrainl sialemeni)

L o a i C h a Vi! lo a i co n (su p e rtv p e ifc s u b ty p e )

Các thực thể cĩ the cĩ loại cha và loại con (supertype & subtype). Mối quan hệ giữa một thực the loại superiype và một thực thể loại subtype của nĩ là mối quan hệ ”Ls a". Mối quan hệ "Is a" dược sử dụng khi một thực thè là sự

Một phần của tài liệu Một số vấn đề cơ bản về thiết kế và xây dựng mô hình Datawarehouse (Trang 33)

Tải bản đầy đủ (PDF)

(110 trang)