Pha 4: Xây dụng mơ hình vật [ý

Một phần của tài liệu Một số vấn đề cơ bản về thiết kế và xây dựng mô hình Datawarehouse (Trang 70)

- Cĩ kha nàng lạo rac ác ihiết kế hãng mổ lcá ch nhanh chĩng.

3.1.3.Pha 4: Xây dụng mơ hình vật [ý

Những ưu diem căn bán cùa IĨ1Ơ hình sao là:

3.1.3.Pha 4: Xây dụng mơ hình vật [ý

Can chú ý lợi dụng các tên cúa các Ihuộe lính và báng. Trong tiến trình này nên sử dụng tối da mỏ lìình hình sao. Giữ tên bảng dưới dạng số nhiều và các tên thuộc tính dưới dạng sổ ít.

Sử dụng dường gạch chân lốt hơn dùng khống trống để mơ lả các Lừ riêng biệt Irong tên của đối tượng.

- Sử dụng hậu lố _PK đe cho biết các mã gốc. Ví dụ như, sứ dụng

PRODUCT _PK để cho biếl mã gốc (vật thay thế) dối với kích thước

của PRODUCT.

- Sử đung hậu tố _ID đế cho biết mã sản phẩm. Ví dụ như, kích thước

của PRODUCÍPRODUCT J D là một thuộc tính. Đây là một mã

gần như chắc chán được sử dụng trong các hệ thơng sán phẩm.

- Tim sự C íìn bằng thích hợp giữa cái quá rõ ràng chảng hạn như

COMPANYjCUSTOMER ID_UST, và cái quá khơng rõ ràng như

C J D .

Các bước trong việc dặt tèn các đối tưong trong cơ sở dừ liệu - Đưa ra một ban liệt kê hợp lý của các bản tĩm tắi.

- Liệt kê ra tất cá lên của các đối tượng và làm việc với người dùng dế định nghĩa chúng.

- Phàn giải các tên tranh chấp.

- Cung cấp các tư liệu về các chuán dặt tơn cùa bạn trong tài liệu metadata.

~ Lập kế hoạch dối với các chuẩn dật tơn trở (hành một lài liệu sống.

Trình bùv các chuẩn về tên cùa các dơi tifựiiì>.

- Liệt kê ra tất cả tên của các đối tượng và làm việc với người dùng dể định nghĩa chúng.

- Phân giải các tẽn tranh chấp,xác định người quán iý dữ liệu

- Cung cấp các tư liệu về các chuấn đặt lèn của bạn trong tài liệu metadata, để thống nhất việc đặt lèn cần cĩ sự tranh luận trong nhĩm.

- Lập kế hoạch dối với các ch 11 án dại l ê n và tổ chức việc sứ dụng chúng. Tuân theo các chuẩn nhưng sẽ thay dối chúng dế phù hợp với các yêu cầu thích dáng. Đưa ra một bủn liệt kê hợp lý của cae han tĩm tát sẽ râì hữu ích dối với những người mới khi tiếp cận cịng việc troniĩ này làm việc dầu tien.

Chuyên đổi mo hình chiêu thành mơ hình vặt lý

Các cơng đoạn troniỊ quả trình chuyển địi mì) ỈÙÌÌỈ1 chiên (lùì/ih mơ hình

vật

- Đưa thêm vào các chuẩn đặt tên tới các bủng và thuộc tính á m mơ hình chiều.

- Một ví dụ về qui ước đặt tên cĩ ihể dặt đối tượng sử dụng định dạng dã được chấp nhận p rimeWord_Quaìifier_ c lassWorcl, trong đĩ:

- PrimeWorci là đối tượng giống như Customer hoặc Product.

- Qualifier là một loại tùy chọn xa han nữa giống như Average hoặc

Tolal.

- ClassWoni một phân loại chính dối với thành phẩn ổiống như Start

hoặc End. (adsbygoogle = window.adsbygoogle || []).push({});

- Liệt kê các cột bên trong hộp các mã gốc được liệt kê trước. - Đánh nhãn các mã gốc với một _PK và (*#).

- Nhận dạng định dạng và độ dài của các cột: n là cho số, c là cho kí tự, V là cho kí tự cĩ thể thay dổi dược, và đ là cho ngày tháng.

- Gán nhãn các mã duy nhất với một dấu #.

- Gán nhãn khơng bái buộc với NULL (o) hoặc NOT NULL (*). - Gán n h ã n các mã ngồi với _FK và (*#) nêu lù phán của PK.

Lưu ý: Đây chí là một cái nhìn tổng quan; khơng phái tất cá các qui ƯỚC đều đã được đề cập đến.

Sail phẩm mơ hỉnh vạt lý

Phát triển mỏ hình (lữ liệtt vật lý

Điểm bắt đáu của mơ hình dữ liệu vật lý là mỏ hình chiều. Mặc dù giống nhau, nhưng điểm khác nhau cơ ban giữa hai mơ hình này là mơ hình vật ỉý thì sự nêu rõ một cách chi tiết và cấn thận của các (tặc lính cơ sở dữ liệu vật lý, chẳng hạn như kiểu dữ liệu, độ dài, chiểu dữ liệu, chiến lược ciií số hĩa, chiến lược phân chia.

Lưu ý: Trong quá trinh xử lý đế chuyển đối mơ hình chiều thành mơ hình vật lý, phái xác định các cột sẽ cĩ kiểu dữ liệu khác với sự hiện diện của chúng trong hệ thống nguổn (nếu các hệ thổng nguồn cĩ thể dùng). Ví dụ như, mã số vùng điện thoại cĩ thể đưực lun như một số nguyên trong hệ thống nguồn và như kí tự bên trong warehouse.

Định nghĩa phấn cứng

Sự biến đổi mơ hình dữ liệu chiều cơ cở thành mơ hình vật ]ý bao gồm mội số bước sau:

- Đ ị n h nghĩa các chuẩn cơ .sớ dữ liệu và đặt tên. - Thực hiện sắp xếp iại theo chiều ban đáu. - Thiết kế các báng trống.

- Định nghĩa mội chiến lược chí số hĩa ban dđu.

- Sứ dụng việc chia cát để chia nhỏ bàng cung như chí số dữ liệu thành nhỏ hơn và cĩ ihế quản lý tốl hơn.

- Xác định nơi đạt các đối tượng cúa cơ sớ dữ liệu trên đĩa. - Sử dụng xử lý song song.

Định nghĩa phần cứ/iiỊ

Các nguyên lý cưa data warehouse được trình bày tại chương một và chương hai, kiến trúc phái cĩ khã năng phát triển, khủ năng quản lý, tính san sồng, khả năng m ở rộng, tình mềm dẻo và được tích hợp, được lình hội trở ihành các nguyên lý cơ sớ của mịi irường data warehouse. Một mỏ hình nguyên lý cĩ thể dược mớ rộng bao gồm lính cĩ thể diều hướng dược, tin cậy dược, mạnh, hồ trợ được và khơi phục dược.

Sự thỏa hiệp cĩ thế ánh hướng đến nhiệm vụ cân băng các yêu cáu vé thương mại và những diều cấn ihiếl dối với người dùng nếu niĩân quỹ bị giới hạn sẽ can trở các lựa chọn của bạn hoặc nhỡn Lì khĩ khăn vé mật kỹ thuật khơng được thố mãn. Định nghĩa các yêu cầu về kiến trúc phủi được xem xét tại mục đích ban dấu song song với những yèu cầu cúa người (lùng. Chí khi dĩ mới cĩ thể dưa ra lựa chọn đúng dán.

Một mồ hình vệt lý tốt thường là sự khác biệt giữa sự thành cơng và thất bại. Thiêì kế mỏ hình vật lý dược xây đựng irên mơ hình logic, bố xung các thơng số, tham kháo tồn vẹn và các đặc tính lưu irữ vật lý.

Các yẻu cầu về kiến trúc

Tầm quan trọng của việc định nghĩa kiến trúc: Mậc dù đã được để cập ở

chương hai nhưng người thiết kế phủi cĩ một chiến lược sử dụng cịng nghệ đã được ihứ thách cũng như nhận biết, Sừ dụng DW M như một nển tảng , xem xét một số nhiệm vụ mà ta phái thực hiện đầu tiên khi lập kế hoạch nẻn kiến trúc phần cứng và mơi trường bao quanh.Các cịng việc cụ thể cán thực hiện là

- Xâycỉựng dề cương và kế hoạch thiết lập kiến irúc kỹ thuật của warehouse.

- Kháo sát kha nàng của các mơi inrờng hiện tại.

- Cung cấp tư liệu về các giao diện data warehouse và cung cap lư liệu về các yêu cầu cho giao diện inteiprice datavvarchou.se (DWH mức xí nghiệp).

- Chuán bị kế hoạch cho enterprise dala warehouse hiệu quá. - Chuẩn bị kiến trúc kỹ Ihuậl cho enterprise dala warehouse.

- Cung cấp tư liệu về những yêu cầu vận hành hệ ihống enterprise data warehouse.

- Đưa ra chiến lược khơi phục và dự trữ. - Đưit ra chiến lược điểu khiến và bao mật. - Tạo ra kiến trúc enterprise data warehouse. - Tạo ra kỹ Ihuật đánh giá rủi ro.

Các dặc tỉnh kiến trúc cún phái dạt dược khi thiết kê

Đây là một phần của kc hoạch và cĩ liên quan đến các thành viên nhĩm thiếl kế data warehouse. Nĩ bao gồm các nhà quán trị cơ sớ dữ liệu hiện tại cùa các hệ thống vận hành, họ cĩ kinh nghiệm và sự thành thạo đối với việc vận hành các hệ thống hiện tại. Họ cĩ thế cung cấp những giải pháp hữu ích đối với các giao diện và kiến trúc hiện nay. Cần phải chắc chắn rằng nhĩm networking cũng tham dự vào quá trình thiết kế nhằm giải quyết vấn đề tới hạn đối với các quá trình giao dịch trên mạng.Việc lựa chọn kiến trúc phần cứng là rất khĩ .Để đạt được sự thành cơng,Data warehouse phải cĩ kiến trúc khỏe, cĩ tính khâ thi, độ tin cậy, tính mềm dẻo, tính co dãn, tính mớ rộng và cĩ thể hỗ trợ, cĩ khá nãng khơi phục và song song. (adsbygoogle = window.adsbygoogle || []).push({});

Hơn nữa, kiến irúc sẽ phái: - Cĩ bộ nhớ lớn.

- Cĩ tính liên kết và làm cho phù hợp với các chuẩn hệ thống mở. Điểu chú ý ở đây là: Khơng nhẩm lần thuật ngữ máy chủ cơ sở dữ liệu với máy chủ file trên mạng cục bộ hoặc bất kỳ máy chù nào khác.Thuật lìgĩr máy chủ cơ sở dữ liệu diễn ta hệ ihống quản iý cơ sớ dữ liệu kiểu quan hệ hoặc hệ thống quản lý cơ sớ dữ liệu.

Các yêu cẩu vế phần cứng

Các kiến trúc phán cứng hỗ trợ một số tượng các cấu hình khác nhau.Nĩ rất hữu dụng đối với dal a warehouse và cĩ thể cĩ những đặc điểm kỹ thuật tiên tiè'n n h ư :

- Đa xử lý dối xứng (SMP) - Các kiến trúc đa xử lý dối xứng là những cơng nghệ cũ nhâì nhưng dã dược thử nghiệm.

- Nhĩm - Nhĩm và các kiến trúc xử lý song song khối lớn là kiến trúc urơng đối mới nhưng cĩ khá năng inớ rộng lớn cũng như cung cáp nhiểu tính năng.

- Xử íý song song khối lớn (MPP) và truy nhập bộ nhớ khơng đều (NƯMA) - (NUMA) là một kiếu truy cập bộ .nhớ mới, nĩ cung cấp khá năng mớ rộng đối với mỏi trường MPP và khá nũng quán lý đối với mơi trường SMP.

- Một số kiêu kiến trúc là sử dune lai íỉhép của cá SMP và MPP.

Các dặc tính kiến trúc

Các kiến trúc phẩn cứng bao gom các bộ xử lý song song [hường dược phản loại theo các tài nguyên mà nĩ chia sẽ.

- Bộ nhớ - Các máy SMP 1 hường dược clicn lá như một ghép nối chậl chõ,

- Ổ đĩa - Các kiến irúc (heo nhĩm thường được diễn ni như một ghép nối ỉỏng lẻo.

- Khơng chia sẻ - Các máy MPP dược diễn tà như một ghép nối [ỏng lẻo hoặc chặi chẽ tùy theo cách thơng tin được thực hiện giữa các nút.

- NƯMA là một kiến trúc SMP với bộ nhớ được ghép nối lỏng lẻo sử dụng truy cập bộ nhớ đều và khơng đều.

Một máy đa xử lý dối xứng bao gồm một bộ các CPU chia sẻ bộ nhớ. Nĩ cĩ kiến trúc chia sẽ mọi thứ bao gồm như sau:

- Mỗi CPU cĩ dầy đủ quyền truy nhập tới bộ nhớ được chia sẻ qua một bus chung.

- Sừ dụng bộ nhớ được chia sẻ để thịng tin giữa các CPU. - Các bộ điểu khiến ổ đĩa cĩ khả náng truy cập đến tất cả CPU.

Đay là cống nghệ đã tlược thừ nghiệm, dạc biệt trong mơi trường data warehouse.

S n i p

Những lợi diêm:

- Sự tương tranh cao.

- Cân bàng phấn cơng việc.

- Khá nãng mở rộns vừa phái (khơng cỏ khá naniỉ mớ rộng như MMP hoặc NƯMA).

- Quan trị dễ dàng hơn mơi trường nhĩm với các cịng cụ dã dược thừ nghiệm.

x ử lý song song

- Bộ nhớ kha tUi thi cĩ hạn - việc này cĩ thẻ’ dược thực hiên bàng việc clustering.

- Băng thơng dối với ihõng tin CPU lới CPU và thơng tin bus và I/O.

Lưn v: Các máy SMP thương là các nút trong nhĩm. Các nút đa SMPcĩ ihế dược sử (lụng với các kiến trúc của một nhà sán xuất nào đĩ - DEC, Pyramid, Sequent, Sun, SparcServer - nơi ổ đĩa được chia sẻ giữa nhiều nút. Một vài nơi xây dựng warehouse dang khám phá khái niệm tiên tiến là kha năng cho vay phần xử lý hoẠc bộ nhớ quá mức qui định giữa các ứng dụng hoặc phần cứng. Một số nhà san xuất SMP cho phép định tỷ lệ tới MPP mà khỏng làm ánh hưởng tới SMP .Ta cĩ thể bố xung phần mềm liêm kết và cơng nghệ được kết hợp một cách dơn giản .

Nu ma

Những lợi điểm khi sử dụng numa: (adsbygoogle = window.adsbygoogle || []).push({});

- Kiến trúc cĩ khả nủng đáy đủ cĩ thể khắc phục một số vấn để mở rộng của SMP.

- Kiến trúc song song cĩ khá năng mớ rộng rất lốt và vì vậy nĩ cĩ thể bổ xung tới ố đĩa, CPU và bủng thơng đế cĩ thè tăng tới bất kì mức nào.

- Một hệ thống hoạt động tốt hơn hệ thơng MPP nơi cĩ các phần việc hỗn hợp hoặc (tặc hiệt.

- Tâng tốc độ.

- Sử dụng lai ghép SMP với MPP.

Oracle chạy một ứng dựng trên các hệ điểu hành. Parallel server và parallel instance đang truy cập vào các cơ sớ dữ liệu khác nhau. Bus mang những yêu cầu mà khơng cần mỗi cơ sớ dữ liệu biết rằng đa xử lý đang yêu cầu dữ liệu.

Những giới hạn:

C l u s t e r s

- o đĩa dưực chia sé, dược kết nơi lỏng léo - Bộ nhớ được chỉ định riêng.

- Bus lốc độ cao.

- Các tài nguycn được chia sẻ. - NÚI SMP.

Những lợi điểm khi sử dụng Cluster:

- Tính -Sần sàng cao; lift cá dữ liệu đều cỏ thế truy nhập sự kiện nếu một nút hỏng.

- Khái niệm dữ liệu dơn lẻ; khái niệm của một cơ sớ dừ liệu, nĩ là một ƯU điểm trên các hệ thống khơng chia sẻ cái gì chẳng hạn như MPP. - Tăng tốc độ phát triển.

- Những hạn chế:

- Khá năng mở rộng; băng thõng của bus tốc độ cao giới hạn khả năng mở rộng của hệ thống.

- Sự cán thiết của việc đổng bộ nút liên kết; Đổng bộ nút liên kết được yêu CÀU. Mỗi nút cĩ một cache dữ liệu, cache phái đàm bảo duy trì chính xác cơ cấu định thời đế làm việc cĩ hiệu quà.

- Thời gian tốn thêm cho hệ điểu hành Xử lý song song khối lớn

Kiến irúc xử lý song song khối lớn (MPP) cĩ liên quan tới việc truy cập ố đĩa, xa hơn nữa là truy cập bộ nhớ, và làm việc tốt với các hệ diều hành, nĩ cung cấp Iruy nhập cĩĩa một cách trong suốt. Ta cĩ ihể định lý lệ tăng cấu hình bàng cách tăng nhiều CPU.

Nếu một bảng hoặc cơ sờ dữ liệu được (.lịnh vị [rèn ổ đĩa, việc truy cập sẽ phụ ihuộc hồn lồn vào CPU của chính nĩ. Nếu CPU hỏng dữ liệu sẽ khơng thể truy nháp dược mà khơng cẩn biết cĩ bao nhiêu CPU dang chạy trừ khi các điểm logic được thiết lạp dể thay thế các CPU.

Thơng Ihường, các kiến trúc MPP cĩ các (lặc lính sau:

- Rất nhanh neu được so sánh với các kiến trúc cụm và SMP. * Hỗ irợ khống vài nghìn nút.

- Cung cấp khá nàng truy cập nhanh đến các núi.

- Cĩ bộ nhớ khơng chia sé dược liên kết kết hợp với từng nút. - Cĩ chi phí thấp đối với lừng nút.

MPP ià một cơng nghệ tương đối mới và chưa dược kiểm nghiệm đè’ mở rộng như cơng nghệ SMP và cụm.

C á c s á p xếp n h ìn h lập ph ươ n g tr on g M P P

Các nút cĩ thể được tạo thành trên sự sấp xếp dạng lưới nếu sử dụng n hình lộp phương. Các thiết kế đa xử lý cung cấp một kiến trúc cĩ khả năng mở rộng, nĩ giúp tăng tính dễ dàng trong vận hành. Yếu tố cân bán của một hệ thống đa xử lý là tính liên kết mạng - cơ cấu này cho phép các bộ xử !ý cĩ thế thơng tin và cùng nhau hoạt động Trong một hệ thống n hình lập phương, các bộ xử lý được kết nối trong mộl hình lập phương đa kích thước được gọi là Sỉêu lập phương, tạo ra một mạng thống tin nhanh hơn và chặt hơn. Mạng siêu lập phương dược tạo thành để cho các kết nối giữa các bộ xử íý dạng các hình lập phương. Nếu các bộ xử lý được bổ xung nhiều hơn nữa thì hình lập phương sẽ tiến tới chiểu iớn hơn. Hệ thống n hình lập phưong cĩ thể mở rộng tới hàng trăm bộ xử lý.

Một phần của tài liệu Một số vấn đề cơ bản về thiết kế và xây dựng mô hình Datawarehouse (Trang 70)