❖ Khơng phải là một lựa chọn lý tưởng cho dữ liệu phi cấu trúc.
❖ Việc tạo ra và triển khai Kho dữ liệu cần nhiều thời gian để thực hiện
❖ Kho dữ liệu cĩ thể bị lỗi thời tương đối nhanh chĩng
❖ Khĩ thực hiện các thay đổi về kiểu và phạm vi dữ liệu, lược đồ nguồn dữ liệu, chỉ mục và truy vấn.
❖ Kho dữ liệu cĩ vẻ dễ dàng, nhưng thực ra, nĩ quá phức tạp đối với người dùng bình thường.
❖ Đơi khi, những người sử dụng sẽ phát triển các quy tắc kinh doanh khác nhau.
❖ Các tổ chức cần dành nhiều nguồn lực của mình cho mục đích đào tạo và triển khai. [4]
2.6. Cơng cụ thực hiện triển khai kho dữ liệu
Với thực trạng của cơng ty Hyundai Thành Cơng đang đối mặt những khĩ khăn về việc phải tích hợp nhiều nguồn dữ liệu khác nhau, đồng thời tốc độ truy xuất dữ liệu mất thời gian và khơng đầy đủ, theo đĩ ảnh hưởng nhiều đến hiệu năng khi thực hiện các báo cáo, thì việc xây dựng kho dữ liệu là một lựa chọn tối ưu và hợp lý. Cĩ nhiều loại cơng cụ giúp thực hiện xây dựng một kho dữ liệu, điển hình như về nơi lưu trữ dữ liệu cĩ các cơng cụ như: Microsoft SQL Server, MongoDB,
đến như: SQL Server Integration, Azure Data Factory, Talend Open Studio, IBM InfoSphere DataStage,.. .Cuoi cùng là những cơng cụ giúp tạo những báo cáo sau khi đã xây dựng kho dữ liệu bao gồm: Tableau Desktop, Microsoft Power BI, SAP BusinessObjects BI Suite, TIBCO Spotfire,.. .Tuy nhiên trong bài báo cáo này lựa chọn những cơng cụ và những lợi thế khi chọn như sau:
2.6.1. Oracle Database
Oracle Database là một hệ quản trị cơ sở dữ liệu đa mơ hình phổ biến trên thị trường hiện nay. Nĩ là một sản phẩm được tạo ra bởi Tập đồn Oracle. Nĩ cung cấp cho người dùng các chức năng của DBMS quan hệ. RDBMS của Oracle cung cấp cho bạn hỗ trợ cho tất cả các loại mơ hình dữ liệu. Tất cả các sản phẩm của Oracle và an tồn và cĩ thể mở rộng, vì vậy bất kỳ ai cũng cĩ thể sử dụng nĩ. Khả năng hoạt động của Oracle cao hơn các hệ thống cơ sở dữ liệu khác hiện nay. Cơng cụ đứng đầu trong bảng xếp hạng những hệ thống quản lý cơ sở dữ liệu theo mức độ phổ biến theo trang web db-engines.com cung cấp với các đặc điểm nổi bật bao gồm:
❖ Hiệu suất cao và cĩ khả năng mở rộng: Oracle cung cấp các nguyên tắc và phương pháp, điều này giúp cho việc truy xuất dữ liệu trở nên nhanh chĩng
hơn và
việc sửa đổi dữ liệu cũng khơng quá phức tạp nữa.
❖ Chứa nhiều cơ sở dữ liệu: Hệ thống Oracle Database cĩ thể quản lý nhiều cơ sở dữ liệu trên cùng một máy chủ
❖ Phục hồi sau lỗi hệ thống: Oracle cĩ một trình quản lý RMAN giúp khơi phục lại các tệp dữ liệu trong thời gian ngừng hoạt động hoặc mất điện đột
ngột. Hệ
thống cơ sở dữ liệu cĩ thể được phục hồi sau sự cố và người dùng cĩ thể nhận được
dữ liệu sẵn cĩ mọi lúc.
❖ Bảo mật: Oracle Database cung cấp các cơ chế để điều chỉnh việc sử dụng và truy cập dữ liệu. Đây là lý do tại sao phần mềm triển khai các cơ chế kiểm sốt
2.6.2. Talend Open Studio For Data Integrator
Cơng cụ phần mềm tích hợp dữ liệu Talend Open Studio For Data Integrator là mã nguồn mở, cĩ thể mở rộng và sửa đổi. Nĩ cho phép đáp ứng nhanh các yêu cầu kinh doanh của từng cơng ty. Cơng cụ này cung cấp để phát triển và triển khai các cơng việc tích hợp dữ liệu nhanh hon so với việc lập trình tay thơng thường.
Cơng cụ cho phép người dùng dễ dàng tích hợp tất cả dữ liệu của mình với các kho dữ liệu khác hoặc đồng bộ hĩa dữ liệu giữa các hệ thống. Phần mềm bao gồm việc kết hợp dữ liệu được lưu trữ từ các nguồn khác nhau và cung cấp cho người dùng một cái nhìn thống nhất về những dữ liệu này. Nĩ cũng giúp người dùng quản lý các cơng việc ETL khác nhau và trao quyền cho người dùng với việc
chuẩn bị dữ liệu tự phục vụ, đon giản.
Hình 2.8: Cơng cụ Talend Open Studio for Data Integrator
Những ưu điểm nổi bật của cơng cụ Talend Open Studio for Data Integrator bao gồm:
❖ Tích hợp nhanh: Đáp ứng nhanh các yêu cầu kinh doanh mà khơng cần viết mã bằng cách sử dụng hon 1000 trình kết nối cĩ sẵn, các cơng cụ đồ họa dựa trên Eclipse và trình tạo mã được tối ưu hĩa cho hiệu suất.
❖ Năng suất nhĩm: Hiệu quả cộng tác tăng bằng cách sử dụng phiên bản mạnh mẽ, phân tích tác động, thử nghiệm và gỡ lỗi cũng như quản lý siêu dữ liệu.
❖ Quản lý dễ dàng: Cơng cụ cung cấp các tính năng lập lịch và giám sát nâng cao. Nĩ cung cấp tích hợp dữ liệu thời gian thực với trang tổng quan và kiểm
sốt tập trung để triển khai nhanh chĩng trên nhiều nút.
❖ Cập nhật các phiên bản mới: Cơng cụ tự động cập nhật đợi các tính năng tích hợp dữ liệu mới nhất và thú vị nhất. [10]
2.6.3. Microsoft Power BI
Power BI là một cơng cụ dựa trên điện tốn đám mây khơng yêu cầu chi phí vốn hoặc hỗ trợ cơ sở hạ tầng bất kể quy mơ của doanh nghiệp. Ứng dụng được thiết kế để tạo ra hình ảnh trực quan thơng minh dựa trên dữ liệu kinh doanh, hỗ trợ người dùng trong quá trình ra quyết định. Power BI cung cấp khả năng tạo dữ liệu đồ họa, trong cả mơi trường độc lập hoặc cộng tác, sau đĩ cĩ thể chia sẻ giữa các người dùng với nhau.
Theo trang web Gartner, 3 sản phẩm đứng đầu thị trường (Leaders) trong đĩ top 1 là Power BI, sau đĩ đứng thứ 2 là Tableau và Qlik giữ vị trí số 3. Chính vì vậy trong bài khĩa luận này sử dụng Power BI để thực hiện vì những lý do sau:
❖ Tích hợp hồn tồn với các ứng dụng hiện cĩ: Power BI tích hợp dễ dàng với mơi trường kinh doanh, cho phép người dùng áp dụng khả năng phân tích và
báo cáo
❖ Trang tổng quan được cá nhân hĩa phong phú: Tính năng ưu việt của Power BI là bảng điều khiển thơng tin, cĩ thể được tùy chỉnh để đáp ứng nhu cầu
chính xác của bất kỳ doanh nghiệp nào. Người dùng cĩ thể dễ dàng nhúng
các bảng
điều khiển và báo cáo vào các ứng dụng để cung cấp trải nghiệm người dùng tốt
❖ Khơng cần hỗ trợ kỹ thuật chuyên biệt: Power BI cung cấp khả năng điều tra và phân tích nhanh mà khơng cần hỗ trợ kỹ thuật chuyên biệt. Nĩ hỗ trợ giao
diện ngơn ngữ tự nhiên và sử dụng các cơng cụ thiết kế đồ họa trực quan.
❖ Trích xuất thơng tin kinh doanh nhanh chĩng và chính xác: Cơng cụ giúp chuyển đổi dữ liệu thành hình ảnh phong phú, do đĩ trích xuất thơng tin kinh doanh
để nâng cao khả năng ra quyết định.
❖ Hỗ trợ các dịch vụ Dữ liệu nâng cao: Các nhĩm phát triển Microsoft Power BI cĩ thể giúp tích hợp mơi trường một cách liền mạch với các dịch vụ đám
KẾT LUẬN CHƯƠNG 2
Ở chương 2 này, bắt đầu từ việc trình bày khái niệm và những đặc điểm của kho dữ liệu, người đọc cĩ thể hiểu sơ qua kho dữ liệu là gì và nĩ cĩ các đặc trưng nổi bật như thế nào. Tiếp theo đĩ các mục kiến trúc hệ thống data warehouse, các lược đồ dữ liệu và đánh giá kho dữ liệu sẽ cung cấp những kiến thức cần thiết về kho dữ liệu, đồng thời mang đến cái nhìn khái quát khi thực hiện xây dựng và triển khai đề tài. Cuối cùng là trình bày những cơng cụ thực hiện và đưa ra những thế mạnh khi lựa chọn xây dựng kho dữ liệu bằng những cơng cụ này.
Tĩm lại, chương 2 là phần cơ sở lý thuyết được tìm hiểu và tham khảo ở nhiều nguồn khác nhau, mỗi phần đưa ra cho người đọc cĩ thêm kiến thức cũng như những thơng tin hữu ích về kho dữ liệu. Từ những kiến thức nền tảng về data warehouse này, chương 3 sẽ tiến hành xây dựng và cài đặt kho dữ liệu cho phân hệ kho phụ tùng của Cơng ty Cổ phần Hyundai Thành Cơng.
STI Mà hảng Tên hảng TDV sỗ lượng Tổng sổ tiền
I 0110000100 Dầu phanh DOT3 (1 Ucan) lít 20.00 4.909.300
2 043OOKXIBA Dầu hộp số DCT Lit 2.00 1,654.4
00
3 0450000115 Dầu hộp số tự động (SP-IV) LÍT 53.40 16.447.200
4 05I00004IOV Dầu máy Xtag Hyundai (15W40 APVSN) (4Lcan) lít 364.50 34.882.650 5 0510000441 Dầu máy xăng Hyundai (ACEA A5 5W∕3O) (4L∕can) Lit 834.90 154,235,318
6 0520000611 Dầu máy dầu Hyundai (5W∕3O) (6L,can) IiI 483.30 81.339.390
7 052000061IV Dầu máy dầu Hyundai (IOW130 A3 B4) (6Ucan) lít 81.60 13.733.280
S 05725 Phớt mút cái 2.05 554,730
9 05996 Xi đánh bỏng bước 2 ( 1 lơn 946ιnl) ml 1.734.00 97 720.9 1
0' 1420608250B Kep nhựa Cái 53.00 408.100
1
1 186422I007N Bủng đèn hậu ngồi' đèn pha qua 1.00 00 56,1
CHƯƠNG 3: TRIỂN KHAI XÂY DỰNG KHO DỮ LIỆU
Chương 3 của cuốn khĩa luận này sẽ tập trung vào việc tìm hiểu các nguồn dữ liệu sẵn cĩ để xây dựng được kho dữ liệu. Đồng thời với nguồn dữ liệu đã thu thập được sẽ thực hiện thiết kế và xây dựng kho dữ liệu nhằm lưu trữ thơng tin một cách tồn vẹn.