Cách sử dụng thông tinThông tin tự phục vụTruy vấn quảng cáo của ngưi dngTạo báo cáo bởi ngưi dngCác truy vấn được xác định trướcBáo cáo cũng được định dạng sẵnThông tin qua các ứng
Thông tin từ kho dữ liệu
Kho dữ liệu so với hệ thống tác nghiệp
Các cơ sở dữ liệu tồn tại trong các hệ thống tác nghiệp cho việc truy vấn và báo cáo Nếu vậy, cơ sở dữ liệu trong các hệ thống tác nghiệp khác với các cơ sở dữ liệu trong kho dữ liệu như thế nào?
Kho dữ liệu Hệ thống tác nghiệp
Giá trị của thông tin
Mô hình tăng trưởng doanh thu
Phân tích lợi nhuận Định hướng tăng trưởng thị trưng
Tiềm năng tăng trưởng khách hàng
Chiến lược mua hàng của công ty
Phân tích sử dụng tài sản
Phát triển sản phẩm mới
Chiến lược phân phối sản phẩm
Tính toán Chi phí/Doanh thu Tính toán ký quỹ
Lợi tức đầu tư Tính toán thị phần
Giá trị trọn đi của khách hàng
Nợ phải trảQuản lý tài sảnChi phí sản phẩmChi phí kênh phân phối
Cách sử dụng thông tin
Thông tin tự phục vụ
Truy vấn quảng cáo của ngưi dng
Tạo báo cáo bởi ngưi dng
Các truy vấn được xác định trước
Báo cáo cũng được định dạng sẵn
Thông tin qua các ứng dụng Màn hình GUI trực tuyến Báo cáo tiêu chuẩn Truy vấn rất hạn chế
Báo cáo Ad hoc thông qua CNTT
Bảng 1: Cho thấy kho d liệu khác vi hệ thống tác nghiệp như thế nào về cách sử dụng và giá trị
Ngưi dng vào KDL để :
• Tự tìm kiếm thông tin trong KDL
• Điều hướng thông qua các nội dung và xác định những gì họ muốn tìm
• Xây dựng các truy vấn của riêng họ và chạy các truy vấn đó
• Định dạng các báo cáo của riêng mình → chạy các báo cáo đó → nhận kết quả
• Một số sử dụng các truy vấn được xác định trước và các báo cáo được định dạng sẵn
• Lướt qua các nội dung và thực hiện phân tích của riêng mình, quan sát dữ liệu theo nhiều cách khác nhau
• Ngưi dng có thể chạy các truy vấn và các báo cáo khác nhau, không lặp lại các truy vấn hoặc báo cáo trước đó
⇒ KDL là nơi mà ngưi dng có thể tự do tạo các truy vấn và báo cáo riêng của họ Việc phân phối thông tin của KDL nhằm mục đích tương tác
So sánh kiểu sử dụng kho dữ liệu này với cách một hệ thống tác nghiệp được sử dụng để cung cấp thông tin Bao lâu thì ngưi dng được phép chạy các truy vấn của riêng họ và định dạng các báo cáo của riêng họ từ một hệ thống tác nghiệp? Ngưi dng hầu như ko bao gi được phép chạy các truy vấn của riêng họ và định dạng các báo cáo của riêng họ từ một hệ thống tác nghiệp Tương tự như từ một ứng dụng kiểm soát hàng tồn kho (trong hệ thống tác nghiệp), ngưi dng hầu như không bao gi chạy các truy vấn của riêng họ và tạo các báo cáo của riêng họ Trước hết, vì những cân nhắc về tính hiệu quả, các hệ thống tác nghiệp không được thiết kế để ngưi dng nới lỏng hệ thống, làm mất tính liên kết chặt chẽ của hệ thống Ngưi dng có thể tác động bất lợi đến hiệu suất của hệ thống với các truy vấn mất rất nhiều thi gian để hoàn thành runaway queries Một điểm quan trọng khác là ngưi - dng hệ thống tác nghiệp không biết chính xác nội dung của cơ sở dữ liệu; siêu dữ liệu (metadata) hay mục từ điển dữ liệu/danh mục dữ liệu thưng không có sẵn cho họ Phân tích tương tác, tạo thành nền tảng của việc phân phối thông tin trong KDL, hầu như không bao gi có mặt trong một hệ thống tác nghiệp.
Tóm lại, trong hệ thống tác nghiệp:
• Ngưi dng không thể chạy các truy vấn và báo cáo của riêng mình
• Ngưi dng hệ thống tác nghiệp không biết chính xác nội dung của cơ sở dữ liệu; metadata thưng không có sẵn cho họ
• Ngưi dng không thể phân tích tương tác
Giá trị của thông tin từ kho dữ liệu đến ngưi dng thì sao? Làm thế nào để so sánh giá trị của thông tin từ một hệ thống tác nghiệp với giá trị từ kho dữ liệu?
Lấy ví dụ lấy thông tin để phân tích hoạt động kinh doanh Thông tin từ một hệ thống tác nghiệp cho ngưi dng thấy doanh nghiệp đang điều hành công việc kinh doanh hàng ngày tốt như thế nào Giá trị của thông tin từ một hệ thống tác nghiệp cho phép ngưi dng giám sát và kiểm soát các hoạt động hiện tại Mặt khác, giá trị thông tin từ kho dữ liệu cung cấp cho ngưi dng khả năng phân tích các mô hình tăng trưởng về doanh thu, lợi nhuận, mức độ thâm nhập thị trưng và cơ sở khách hàng Dựa trên những phân tích như vậy, ngưi dng có thể đưa ra các quyết định chiến lược để giữ cho doanh nghiệp có tính cạnh tranh và lành mạnh Nhìn vào một lĩnh vực khác của doanh nghiệp, cụ thể là marketing Đối với marketing, giá trị của thông tin từ kho dữ liệu được định hướng cho các vấn đề chiến lược như thị phần, chiến lược phân phối, khả năng dự đoán các kiểu mua của khách hàng và thâm nhập thị trưng Còn giá trị của thông tin từ các hệ thống tác nghiệp Chủ yếu là để theo dõi doanh số bán hàng so với hạn ngạch mục tiêu và để cố gắng thu hút khách hàng quay lại.
Có thể thấy rằng cách sử dụng thông tin và giá trị của thông tin từ kho dữ liệu khác với thông tin từ các hệ thống tác nghiệp Ý nghĩa của sự khác biệt là gì? Trước hết, vì có sự khác biệt nên khi là một chuyên gia IT, bạn không nên cố gắng áp dụng các nguyên tắc cung cấp thông tin từ các hệ thống tác nghiệp vào kho dữ liệu Việc cung cấp thông tin từ kho dữ liệu có sự khác biệt rõ rệt Cần rất nhiều các phương pháp khác nhau Nên lưu ý nghiêm túc về bản chất tương tác của việc cung cấp thông tin từ kho dữ liệu Ngưi dng phải tự thu thập thông tin và thực hiện phân tích từ dữ liệu trong kho dữ liệu một cách có tương tác mà không cần sự hỗ trợ của IT Nhân viên IT mà hỗ trợ ngưi dng về kho dữ liệu, không thực hiện truy vấn, báo cáo cho ngưi dng; ngưi dng tự làm điều đó Vì vậy, hãy làm cho thông tin từ kho dữ liệu dễ dàng và sẵn sàng có sẵn cho ngưi dng theo cách riêng của họ
Operational Database Data Warehouse Được thiết kế để hỗ trợ xử lý giao dịch khối lượng lớn.
Thưng được thiết kế để hỗ trợ xử lý phân tích khối lượng lớn (tức là OLAP).
Dữ liệu hiện tại Dữ liệu lịch sử và hiện tại
Dữ liệu trong các hệ thống tác nghiệp chủ yếu được cập nhật thưng xuyên (thêm, xóa, sửa) theo nhu cầu.
Dữ liệu bất biến, dữ liệu mới có thể được thêm thưng xuyên Sau khi được thêm vào hiếm khi thay đổi.
Nó được thiết kế cho giao dịch và quy trình kinh doanh ở thi gian thực.
Nó được thiết kế để phân tích các biện pháp kinh doanh theo lĩnh vực chủ đề, danh mục và thuộc tính.
Nó được tối ưu hóa cho một tập hợp các giao dịch đơn giản, thưng thêm hoặc ruy xuất t một hàng duy nhất tại mỗi bảng.
Nó được tối ưu hóa cho các tải trọng và các truy vấn cao, phức tạp, không thể đoán trước mà truy cập nhiều hàng trên mỗi bảng.
Nó được tối ưu hóa để xác thực thông tin đến trong các giao dịch, sử dụng các bảng dữ liệu xác thực. Được tải với thông tin nhất quán, hợp lệ, không yêu cầu xác thực thi gian thực.
Nó hỗ trợ hàng ngàn khách hàng đồng thi Nó hỗ trợ một vài khách hàng đồng thi liên quan đến OLTP.
Hướng quy trình Hướng chủ đề Được tối ưu hóa để thực hiện chèn và cập nhật nhanh chóng các khối lượng dữ liệu nhỏ liên kết.
Thưng được tối ưu hóa để thực hiện truy xuất nhanh khối lượng dữ liệu tương đối cao.
Dữ liệu vào Dữ liệu ra
Số lượng dữ liệu được truy cập ít hơn Số lượng lớn dữ liệu được truy cập
Cơ sở dữ liệu quan hệ được tạo để xử lý giao dịch trực tuyến (OLTP)
Kho dữ liệu được thiết kế để xử lý phân tích trực tuyến (OLAP)
Bảng 2: So sánh H ệthống tác nghi p và KDL.ệ
Tiềm năng thông tin
Trước khi xem xét các loại ngưi dng khác nhau và nhu cầu thông tin của họ, chúng ta cần đánh giá cao tiềm năng to lớn của kho dữ liệu đối với hoạt động kinh doanh thông minh (BI) Bởi vì tiềm năng to lớn này nên ta cần quan tâm đúng mức đến việc phân phối thông tin từ kho dữ liệu Chúng ta không thể xem xét việc phân phối thông tin theo một cách đặc biệt trừ khi chúng ta nhận thức đầy đủ tầm quan trọng về việc kho dữ liệu đóng vai trò then chốt như thế nào trong quản lý tổng thể của một doanh nghiệp
2.1 Quản lý doanh nghiệp tổng thể: Ở mỗi doanh nghiệp, có 3 quy trình riêng biệt chi phối việc quản lý tổng thể Đầu tiên, doanh nghiệp tham gia vào việc lập kế hoạch Tiếp theo, thực hiện các kế hoạch diễn ra Và cuối cng đánh giá kết quả thực hiện
VD: Công ty bạn đang xem xét kế hoạch mở rộng sang một thị trưng địa lý cụ thể Giả sử công ty đó muốn tăng thị phần ở khu vực Tây Bc Bây gi kế hoạch này được tiến hành thực thi bằng các chiến dịch quảng cáo, dịch vụ được cải thiện và tiếp thị ty chỉnh Sau khi kế hoạch được thực hiện, công ty ca bạn muốn thấy kết quả ca các chiến dịch quảng cáo và các sáng kiến tiếp thị Đánh giá kết quả quyết định hiệu quả ca các chiến dịch Dựa trên việc đánh giá kết quả, nhiều kế hoạch có thể được thực hiện để thay đổi thành phần ca các chiến dịch hoặc triển khai thêm các chiến dịch khác Chu trnh lập kế hoạch, thực hiện và đánh giá vẫn tiếp tục.
Hình 1: Vòng lặp kế hoạch– thực hiện – đánh giá.
Kho dữ liệu, với tiềm năng thông tin chuyên biệt, rất ph hợp với vòng lặp kế hoạch – thực hiện – đánh giá này Kho dữ liệu với thành phần BI của nó, báo cáo về quá khứ và giúp lập kế hoạch cho tương lai Đầu tiên, kho dữ liệu hỗ trợ lập kế hoạch Sau khi các kế hoạch được thực hiện, kho dữ liệu được sử dụng để đánh giá hiệu quả của việc thực hiện.
Quay lại ví dụ về công ty của bạn muốn mở rộng ở khu vực phía tây bắc Ở đây, việc lập kế hoạch bao gồm việc xác định các phân khúc khách hàng thích hợp trong khu vực đó và cũng xác định các sản phẩm cần tập trung vào Kho dữ liệu của bạn có thể được sử dụng một cách hiệu quả để phân tách và xác định các phân khúc khách hàng tiềm năng và các nhóm sản phẩm cho mục đích lập kế hoạch Khi kế hoạch được thực hiện với các chiến dịch quảng cáo, kho dữ liệu của bạn sẽ giúp ngưi dng đánh giá và phân tích kết quả của các chiến dịch Ngưi dng của bạn có thể phân tích kết quả theo sản phẩm và theo các quận riêng lẻ ở khu vực tây bắc Họ có thể so sánh doanh số bán hàng với các mục tiêu đặt ra cho các chiến dịch quảng cáo hoặc so với doanh số bán hàng của năm trước hoặc so với mức trung bình của ngành Ngưi dng có thể ước tính mức tăng trưởng trong thu nhập nh vào các chiến dịch quảng cáo Việc đánh giá sau đó có thể dẫn đến việc lập kế hoạch và thực hiện tiếp theo Vòng lập kế hoạch –thực hiện–đánh giá này rất quan trọng cho sự thành công của một doanh nghiệp.
2.2 Tiềm năng thông tin cho các lĩnh vực kinh doanh (information potential for business areas):
Một số lĩnh vực chung của doanh nghiệp nơi kho dữ liệu có thể hỗ trợ trong các giai đoạn lập kế hoạch và đánh giá của vòng quản lý.
Tăng trưởng khả năng sinh lời Để tăng lợi nhuận, nhà quản lý phải hiểu làm thế nào để lợi nhuận gắn liền với dòng sản phẩm, thị trưng và dịch vụ Nhà quản lý phải hiểu rõ về những dòng sản phẩm và thị trưng nào tạo ra khả năng sinh li cao hơn Kinh doanh thông minh (BI) từ kho dữ liệu là lý tưởng để lập kế hoạch tăng trưởng lợi nhuận và đánh giá kết quả khi các kế hoạch được thực hiện.
Kho dữ liệu có tiềm năng thông tin tuyệt vi cho marketing chiến lược bằng cách cung cấp một kho lưu trữ tập trung của tất cả các dữ liệu thị trưng và khách hàng có liên quan
Dữ liệu này có thể được sử dụng để hiểu rõ hơn về hành vi, sở thích và xu hướng của khách hàng, sau đó có thể thông báo cho những chiến lược tiếp thị và ra quyết định
VD: D liệu từ các tương tác ca khách hàng trên các kênh khác nhau có thể được phân tích để xác định các mẫu và sở thích và thông tin này có thể được sử dụng để tạo các chiến dịch marketing được nhm mục tiêu và cá nhân hóa Ngoài ra, d liệu từ các giao dịch bán hàng và tài chính có thể được sử dụng để đánh giá hiệu quả ca các sáng kiến tiếp thị và đưa ra quyết định dựa trên d liệu về nơi phân bổ các nguồn lực tiếp thị Khả năng truy cập, phân tích và tận dụng sự giàu có ca thông tin này trong kho d liệu cung cấp tiềm năng thông tin tuyệt vi cho tiếp thị chiến lược, giúp các công ty đưa ra quyết định sáng suốt và đi trưc đối th.
Một số lợi ích của KDL trong marketing
• Tạo ra nguồn dữ liệu tập trung
DWH có tác dụng giảm bớt khó khăn trong quá trình lấy thông tin bằng cách tập hợp thành nguồn dữ liệu duy nhất Giúp nhà tiếp thị xử lý các đo lưng quan trọng như CAC, ROI, ROAS.
• Dễ sử dụng dữ liệu
Chỉ bằng vài cú nhấp chuột, bạn có thể có được thông tin cần thiết từ DWH.
Hệ thống DW có thể xử lý yêu cầu phức tạp chỉ trong vài giây rồi đưa ra dữ liệu cần thiết cho báo cáo của bạn theo thi gian thực mà không cần cấu hình thêm.
• Toàn quyền sở hữu lịch sử Data
Thay vì lệ thuộc vào các nền tảng khác, DW cho phép bảo mật thông tin từ các kênh ở một nơi duy nhất.
Khả năng toàn quyền truy cập và lịch sử kho dữ liệu marketing, giúp nhà tiếp thị lấy được chính xác những thông tin cần thiết phục vụ cho chiến dịch trong tương lai.
• Không mất nhiều chi phí bảo trì mà vẫn đảm bảo độ linh hoạt thông tin Với hệ thống kho lưu trữ dữ liệu đám mây, thì chi phí lưu trữ là khá rẻ, và hoàn toàn có đủ khả năng lưu trữ lớn.
Kho dữ liệu lưu trữ đám mây cũng không yêu cầu nhiều chi phí bảo trì, vì nhà cung cấp sẽ đảm nhận việc bảo trì đó, bạn chỉ cần trả cho tài nguyên sử dụng.
Giao diện thông tin ngưi dng
Để vượt qua được 6 giai đoạn và nhận ra tiềm năng thông tin của kho dữ liệu, bạn phải xây dựng một giao diện chắc chắn để cung cấp thông tin cho ngưi dng Giao diện phải có khả năng cho phép ngưi dng nhận ra tiềm năng thông tin đầy đủ của kho dữ liệu.
Giao diện hợp lý phải nằm ở giữa KDL và ngưi dng cuối, cho phép cung cấp thông tin cho ngưi dng Giao diện có thể là một bộ công cụ và quy trình cụ thể, ph hợp với môi trưng của bạn Sau đây là các đặc điểm chung của giao diện thông tin ngưi dng. 3.1 Chế độ sử dụng thông tin:
Khi xem xét tất cả các cách khác nhau mà kho dữ liệu có thể được sử dụng, ta thấy tất cả việc sử dụng đều có 2 chế độ hoặc cách cơ bản Cả 2 chế độ đều liên quan đến việc đạt được
Trong chế độ này, ngưi dng kinh doanh đưa ra một giả thuyết và đặt một loạt các câu hỏi trước khi vào KDL để xác nhận hoặc bác bỏ giả thuyết đó
VD: Giả sử rằng bộ phận tiếp thị của bạn đã lên kế hoạch và thực hiện một số chiến dịch quảng cáo trên hai dòng sản phẩm ở khu vực trung nam bộ Bây gi bộ phận tiếp thị muốn đánh giá kết quả của chiến dịch Bộ phận tiếp thị đi đến kho dữ liệu với giả thuyết rằng doanh số bán hàng ở khu vực nam trung bộ đã tăng lên Thông tin từ kho dữ liệu sẽ giúp khẳng định giả thuyết.
Khi sử dụng kho dữ liệu trong chế độ khám phá, nhà phân tích kinh doanh không sử dụng giả thuyết được xác định trước Ngưi dng thưng không có bất kỳ khái niệm hoặc giả
12 thuyết định sẵn nào về những gì bộ kết quả sẽ chỉ ra Các ứng dụng khai thác dữ liệu với nguồn cấp dữ liệu (data feed: Danh sách bài viết, các tin tức, Danh sách sản phẩm, dịch vụ, ) từ kho dữ liệu được sử dụng để ngưi dng khám phá kiến thức.
VD: Trong trưng hợp này, nhà phân tích kinh doanh mong muốn khám phá các kiểu hành vi mi ca khách hàng hoặc nhu cầu sản phẩm
Tóm lại, Ngưi dng tương tác với kho dữ liệu để lấy thông tin hoặc ở chế độ xác minh giả thuyết hoặc ở chế độ khám phá kiến thức Vậy các cách tiếp cận để tương tác là gì? Nói cách khác, ngưi dng có tương tác với kho dữ liệu theo cách tiếp cận thông tin, phương pháp phân tích hay bằng cách sử dụng các kỹ thuật khai thác dữ liệu không?
Ngưi dng có thể tương tác với kho dữ liệu theo nhiều cách khác nhau, bao gồm thông qua phương pháp thông tin, phương pháp phân tích hoặc bằng cách sử dụng các kỹ thuật khai thác dữ liệu.
• Phương pháp tiếp cận thông tin
Theo cách tiếp cận này, với các công cụ báo cáo và truy vấn, ngưi dng truy xuất dữ liệu lịch sử hoặc hiện tại và thực hiện một số phân tích thống kê tiêu chuẩn Dữ liệu có thể được tóm tắt một cách nhẹ nhàng hoặc nặng nề Các tập hợp kết quả có thể ở dạng báo cáo và biểu đồ.
Ngưi dng sử dụng kho dữ liệu để thực hiện phân tích Họ thực hiện phân tích theo các khía cạnh kinh doanh bằng cách sử dụng tóm tắt lịch sử hoặc dữ liệu chi tiết Ngưi dng doanh nghiệp tiến hành phân tích bằng các thuật ngữ kinh doanh của riêng họ Cách tiếp cận này thưng được sử dụng để phân tích sâu và giải quyết vấn đề Phân tích phức tạp hơn bao gồm drill down, roll up, or slice and dice.
• Phương pháp khai phá dữ liệu
Cả hai cách tiếp cận thông tin và phân tích đều có tác dụng trong chế độ xác minh Tuy nhiên, phương pháp khai thác dữ liệu hoạt động trong chế độ khám phá kiến thức.Trong thực tế, nhiều tổ chức sử dụng kết hợp các phương pháp này để tận dụng tối đa tiềm năng thông tin của kho dữ liệu của họ
Thông thưng, thông tin có sẵn thông qua giao diện thông tin ngưi dng có các đặc điểm sau:
• Thông tin được xử lý trước
Chúng bao gồm thông tin thưng xuyên được tạo tự động và sẵn sàng sử dụng Báo cáo phân tích bán hàng hàng tháng và hàng quý, báo cáo tóm tắt và biểu đồ thông thưng thuộc loại này Ngưi dng chỉ cần sao chép thông tin đã được xử lý trước đó.
• Truy vấn và báo cáo được xác định trước Đây là một tập hợp các mẫu truy vấn và định dạng báo cáo luôn sẵn sàng cho ngưi dng Ngưi dng áp dụng các tham số thích hợp và chạy các truy vấn và báo cáo khi cần Đôi khi, ngưi dng được phép thực hiện các sửa đổi nhỏ đối với các mẫu và định dạng.
Ngưi dng tạo các truy vấn và báo cáo của riêng họ bằng các công cụ thích hợp được cung cấp bởi DW Danh mục này thừa nhận thực tế là không phải mọi nhu cầu của ngưi dng đều có thể đoán trước được Nói chung, chỉ những ngưi dng có quyền và một số ngưi dng thông thưng tạo các truy vấn và báo cáo của riêng họ.
Các ứng dụng trong ngành của data warehouse
Hầu như mọi doanh nghiệp kinh doanh bất kể dịch vụ, sản phẩm nào cũng đều cần đến Data Warehouse do tính đa dụng, thiết thực cao của nền tảng này, các lĩnh vực cần ứng dụng kho dữ liệu cao như:
• Sản xuất: Quản lý dịch vụ và bảo hành, kiểm soát chất lượng sản phẩm, thực hiện đơn hàng và phân phối, tích hợp nhà cung cấp và hậu cần
• Bán lẻ: quản lý các mặt hàng nhập xuất, quản lý chuỗi cung ứng, nhà cung cấp sản phẩm Dựa trên thông tin thu thập để lên chiến lược bán hàng hiệu quả, lên các chiến dịch quảng cáo đánh trúng tâm lý khách hàng
• Tài chính ngân hàng: quản lý các nguồn quỹ đầu tư, quỹ dự trữ, vay vốn, lãi suất và thi hạn thanh toán của từng cá nhân, tổ chức
• Hàng không: tạo ra hệ thống quản lý tất cả công việc liên quan hàng không từ quản lý lịch trình bay, số hiệu máy bay trong thi gian vận hành đến phân công phi hành đoàn, quản lý các chương trình ưu đãi cho khách hàng
• Bảo hiểm: phân tích xu hướng khách hàng dựa trên khối dữ liệu thu thập, theo dõi biến động thị trưng một cách nhanh chóng để đề ra các biện pháp đối phó
• Y dược: quản lý thông tin bệnh nhân, bệnh án, phác đồ điều trị, thi gian trị bệnh dự kiến, thuốc kê theo đơn
• Giáo dục: quản lý thông tin của giáo viên , sinh viên, và nhân công tại trưng, quản lý quá trình học tập của học sinh, giáo án và bài giảng của giáo viên Từ đó đưa ra các chiến lược dạy học hiệu quả Ngoài ra Data Warehouse cũng là nền tảng của các phần mềm dạy học hiện nay
• Thương mại điện tử: lĩnh vực dễ nhận thấy sự ứng dụng nhất của kho dữ liệu doanh nghiệp Hệ thống giúp quản lý thông tin hàng hóa, ngưi bán, ngưi mua, tình trạng đơn hàng và các chương trình khuyến mãi đang và sắp diễn ra.
Ai nên cần sử dụng kho dữ liệu Data Warehouse ?
Ngưi sử dụng Data Warehouse thưng thuộc những nhóm sau:
• Ngưi dựa vào khối lượng dữ liệu phân tích để đưa ra quyết định, có thể là chủ doanh nghiệp
• Ngưi sử dụng các quy trình phức tạp, có thể ty biến cho ph hợp bản thân để lấy dữ liệu đa nguồn
• Những ngưi có mục đích sử dụng đơn giản như truy cập dữ liệu
• Những ngưi muốn đưa ra quyết định dựa trên cách tiếp cận có hệ thống
• Những ngưi cần một khối dữ liệu khổng lồ để thiết lập các báo cáo, bảng biểu với hiệu suất cao thì Data Warehouse là lựa chọn đúng đắn
• Tìm hiểu Data Warehouse là bước đầu tiên để tìm ra, khám phá các mẫu ẩn của nguồn dữ liệu nhóm, tổ chức
Ai sẽ là người sử dụng thông tin?
Những gì họ cần
Ở phần này, chúng ta sẽ đi phân tích rõ hơn nhu cầu của 5 nhóm lớn ở phía trên
Tưởng tượng bạn là một khách du lịch muốn đến thăm TP.HCM Trước hết, bạn đã nghiên cứu các đặc điểm của nơi bạn đang đến và nhận thức được sự phong phú, đa dạng của các địa điểm tại thành phố này Chính vì thi gian có hạn, mặc d có nhiều địa điểm thú vị như nhà th Đức Bà, Dinh độc lập, chợ Bến Thành, bưu điện thành phố, Lanmark 81, nhưng bạn phải lựa và chọn các địa điểm đáng giá nhất để ghé thăm Khi đã đến nơi bạn muốn đến, bạn sẽ lựa chọn các địa điểm để tham quan một cách dễ dàng nhất Tại một địa điểm cụ thể, nếu bạn thấy điều gì đó rất hấp dẫn, bạn sẽ có khả năng phân bổ thêm thi gian cho địa điểm đó
Bây gi chúng ta hãy áp dụng câu chuyện du lịch vào kho dữ liệu Một giám đốc điều hành cấp cao đến kho dữ liệu để biết thông tin giống như một khách du lịch đến thăm một nơi thú vị và hữu ích Giám đốc điều hành có một quan điểm kinh doanh rộng rãi và biết về nội dung thông tin tổng thể của kho dữ liệu Tuy nhiên, giám đốc điều hành không có thi gian để duyệt qua kho dữ liệu chi tiết mà chỉ quan tâm đến các chỉ số quan trọng cụ thể Đây giống như việc lựa chọn các địa điểm để ghé thăm Giám đốc điều hành muốn kiểm tra các chỉ số chính và nếu tìm thấy điều gì đó thú vị về bất kỳ chỉ số nào trong số đó, giám đốc điều hành muốn dành thêm thi gian để khám phá thêm Khách du lịch đã xác định trước
18 những kỳ vọng về mỗi địa điểm được ghé thăm Nếu một địa điểm khác với những kỳ vọng này, khách du lịch muốn xác định lý do tại sao Tương tự như vậy, nếu giám đốc điều hành thấy các chỉ số không ph hợp, thì cần phải điều tra thêm
Qua đó, chúng ta có thể tóm tắt về những gì mà nhóm ngưi dng được phân loại là Tourists cần từ kho dữ liệu, sẽ bao gồm:
• Trạng thái của các chỉ số trong các khoảng thi gian như vài tuần/ vài tháng tuỳ doanh nghiệp
• Khả năng xác định các mục quan tâm mà không gặp bất kỳ khó khăn nào
• Lựa chọn những gì cần thiết một cách dễ dàng nhất mà không lãng phí thi gian
• Khả năng chuyển nhanh chóng từ một chỉ số quan tâm này sang chỉ số khác
• Bất cứ khi nào cần, thông tin bổ sung sẽ dễ dàng có sẵn về các chỉ số chính đã chọn cho các khoảng thi gian khám phá định kỳ tiếp theo
Ngưi vận hành quan tâm đến dữ liệu hiện tại ở cấp độ chi tiết và họ thực sự là ngưi theo dõi hiệu suất hiện tại Các nhà quản lý bộ phận, quản lý tuyến và giám sát bộ phận đều có thể được phân loại là ngưi vận hành
Ngưi vận hành quan tâm đến hiệu suất và vấn đề của hiện tại, họ không quan tâm đến dữ liệu trong quá khứ Là ngưi dng của các hệ thống OLTP hệ thống tác nghiệp, họ - mong đợi thi gian phản hồi nhanh và truy cập nhanh vào các dữ liệu chi tiết Làm thế nào họ có thể giải quyết nút thắt hiện tại trong hệ thống phân phối sản phẩm? Các phương thức vận chuyển thay thế hiện có là gì và nhà kho nào sắp hết hàng? Họ quan tâm đến những câu hỏi liên quan đến các tình huống hiện tại giống như thế
Có thể tóm tắt về những gì nhóm Operators cần sau đây:
• Câu trả li ngay lập tức dựa trên dữ liệu hiện tại đáng tin cậy
• Trạng thái hiện tại của các chỉ số hiệu suất - KPI
• Dữ liệu hiện hành nhanh nhất có thể với các bản cập nhật hàng ngày hoặc thưng xuyên hơn từ các hệ thống nguồn
• Truy cập nhanh vào các thông tin rất chi tiết
• Phân tích nhanh các dữ liệu mới nhất.
• Giao diện thông tin đơn giản và dễ hiểu
Hãy xem xét một vài đặc điểm của nông dân Họ rất quen thuộc với địa hình Họ biết chính xác những gì họ muốn về cây trồng Họ biết cách sử dụng các công cụ, làm việc trên các cánh đồng và thu nhận kết quả Họ cũng biết giá trị cây trồng của họ Bây gi nối các đặc điểm này với danh mục ngưi dng kho dữ liệu được phân loại là nông dân - các nhà phân tích
Thông thưng, các loại nhà phân tích khác nhau trong một doanh nghiệp có thể được phân loại là nông dân Những ngưi này có thể là nhà phân tích kỹ thuật, nhà phân tích về tiếp thị, bán hàng hoặc tài chính, Các nhà phân tích này có các yêu cầu tiêu chuẩn Các yêu cầu có thể bao gồm ước tính lợi nhuận theo sản phẩm hoặc phân tích doanh số bán hàng hàng tháng Yêu cầu hiếm khi thay đổi Chúng có thể dự đoán được và thưng xuyên
Có thể tóm tắt về những gì nhóm Famers tức là các nhà phân tích cần sau đây:
• Dữ liệu chất lượng được tích hợp đúng cách từ các hệ thống nguồn
• Khả năng chạy các truy vấn dự đoán dễ dàng và nhanh chóng
• Khả năng chạy các báo cáo định kỳ
• Khả năng có được các loại thông tin tương tự trong khoảng thi gian có thể dự đoán được
• Bộ kết quả chính xác và quy mô nhỏ hơn so với dữ liệu ban đầu
• Chủ yếu là dữ liệu hiện tại với các so sánh đơn giản so với dữ liệu trong quá khứ
Các nhà thám hiểm không có cách thức để tìm kiếm thông tin Họ có xu hướng đi đến nơi rất ít ngưi khác mạo hiểm Họ thưng kết hợp thăm dò ngẫu nhiên với việc nghiên cứu không thể đoán trước Các nghiên cứu có thể nhiều lần không dẫn đến bất kỳ kết quả nào,
20 nhưng có một số ít khai thác được các mẫu hữu ích và kết quả bất thưng tạo ra các mẩu thông tin quý giá Vì vậy, các nhà thám hiểm tiếp tục cuộc tìm kiếm không ngừng nghỉ của mình, sử dụng các quy trình phi tiêu chuẩn và các phương pháp không chính thống Trong một doanh nghiệp, các nhà nghiên cứu và các nhà phân tích kỹ thuật có tay nghề cao có thể được phân loại là nhà thám hiểm Những ngưi dng này sử dụng kho dữ liệu một cách rất ngẫu nhiên Tần suất sử dụng của họ không cố định Các truy vấn được thực hiện bởi các nhà thám hiểm có xu hướng bao gồm các khối dữ liệu lớn Những ngưi dng này làm việc với rất nhiều dữ liệu chi tiết để phân biệt các mẫu mong muốn Những kết quả này là khó nắm bắt, nhưng các nhà thám hiểm tiếp tục cho đến khi họ tìm thấy các mô hình và mối quan hệ
Như trong các trưng hợp khác, chúng ta có thể tóm tắt về những gì nhóm Explorers là các nhà phân tích có tay nghề cao cần sau đây:
• Hoàn toàn không thể đoán trước – và có thể truy vấn ad hoc phức tạp.
• Khả năng truy xuất khối lượng lớn dữ liệu chi tiết để phân tích
• Khả năng thực hiện phân tích phức tạp
• Cung cấp cho các truy vấn và phân tích không có cấu trúc, hoàn toàn mới và sáng tạo
• Các phiên phân tích kéo dài và diễn ra theo đợt
Hãy liên tưởng đến những ngưi đào vàng để khám phá những mỏ vàng quý giá có giá trị lớn Ngưi dng được phân loại là ngưi khai thác - các nhà phân tích mục đích đặc biệt cũng hoạt động theo cách tương tự
Trong một doanh nghiệp, họ là những nhà phân tích mục đích đặc biệt với đào tạo và kỹ năng chuyên môn cao Nhiều doanh nghiệp không có ngưi khai thác dữ liệu có thể sử dụng các chuyên gia tư vấn bên ngoài cho các dự án khai thác dữ liệu cụ thể Nhà khai thác dữ liệu áp dụng các kỹ thuật khác nhau và thực hiện phân tích chuyên biệt để phát hiện ra các cụm bản ghi liên quan, ước tính giá trị cho một biến không xác định, nhóm các sản phẩm sẽ được mua cng nhau, v.v
Dưới đây là một bản tóm tắt về nhu cầu của ngưi dng được phân loại là Miners:
• Truy cập vào hàng núi dữ liệu để phân tích và khai thác
• Sự sẵn có của khối lượng lớn dữ liệu lịch sử trong nhiều năm trở lại đây
• Khả năng nhận thấy được các mối tương quan có ý nghĩa dựa trên khối lượng lớn dữ liệu
• Khả năng trích xuất dữ liệu từ kho dữ liệu thành các định dạng ph hợp với các kỹ thuật khai thác đặc biệt
• Khả năng làm việc với dữ liệu ở 2 chế độ: một để chứng minh hoặc bác bỏ một giả thuyết đã nêu, cái còn lại để khám phá các giả thuyết mà không có bất kỳ khái niệm định sẵn nào.
Làm thế nào để cung cấp thông tin ?
Mục tiêu: Cung cấp chính xác cho ngưi dng những gì mà họ muốn trong kho dữ liệu
Từ đó ta có giải pháp là cung cấp thông tin cho các lớp ngưi dng dưới ba khía cạnh:
• Yêu cầu kỹ thuật/kiến trúc liên quan đến siêu dữ liệu và giao diện ngưi dùng:
Tourists Operators Farmers Explorers Miners
Giao diện siêu dữ liệu có hỗ trợ tìm kiếm từ khóa (độ chi tiết cao, cho ra kết quả ph hợp giống như mình tra gg á)
Thi gian phản hồi nhanh (kiểu bấm vô nó hiển thị ra liền á, không có bị lag)
Thi gian phản hồi hợp lý
Thi gian phản hồi hợp lý
Kho lưu trữ dữ liệu đặc biệt mà nhận nguồn cấp dữ liệu từ kho
Giao diện ngưi dng hỗ trợ web
Phạm vi dữ liệu lớn (kiểu dữ liệu chi tiết,
Mô hình dữ liệu đa chiều với thuộc tính
Mô hình dữ liệu chuẩn hóa
Mô hình dữ liệu chuẩn
22 đầy đủ ) và số liệu kinh doanh hóa
Cung cấp cho các truy vấn lớn về khối lượng lớn dữ liệu chi tiết
Số liệu chi tiết, tổng hợp dữ liệu ít khi sử dụng
Tourists Operators Farmers Explorers Miners Được ty chỉnh cho các nhu cầu cá nhân
Giao diện ngưi dng đơn giản để ngưi dng dễ dàng có được thông tin
Giao diện ngưi dng tiêu chuẩn cho các truy vấn và báo cáo
Một loạt các công cụ để truy vấn và phân tích
Phạm vi của các công cụ khai thác dữ liệu đặc biệt, công cụ phân tích thống kê và công cụ trực quan hóa dữ liệu Điều hướng trực quan
Truy vấn và báo cáo đơn giản
Khả năng tạo báo cáo
Hỗ trợ cho các phiên phân tích dài
Khám phá các mô hình và mối quan hệ chưa biết
Khả năng cung cấp giao diện thông qua các biểu tượng đặc biệt
Khả năng tạo các ứng dụng
Giới hạn drill - down (xem chi tiết)
Khả năng giải thích kết quả
Giới hạn drill - down (xem chi tiết)
Tourists Operators Farmers Explorers Miners
Các ứng dụng đơn giản cho thông tin tiêu chuẩn
Cung cấp các chỉ số hiệu suất chính được công bố thưng xuyên
Thưng làm việc với dữ liệu tóm tắt
Thưng dng các bộ kết quả lớn để nghiên cứu và phân tích sâu hơn
III Cách truyền tải thông tin
Sau khi xác định được các lớp ngưi dng thì việc thông tin trong kho dữ liệu được truyền tải đến các lớp ngưi dng đó thông qua 4 phương pháp
Thứ nhất, việc truyền tải thông tin thông qua các báo cáo Các báo cáo ở đây là sự chuyển giao từ các hệ thống tác nghiệp Chính vì vậy, các định dạng và nội dung của nó có thể phức tạp Về đặc điểm của phương pháp này thì có một chút khác biệt so với các báo cáo thông thưng Mọi ngưi đều quen thuộc với các báo cáo và cách chúng được sử dụng Và không nhắc lại những gì chúng ta đã biết về báo cáo thì nhóm sẽ giới thiệu về các dịch vụ báo cáo bằng cách liên hệ chúng với kho dữ liệu
● Thông tin được chuyển đến ngưi dng chứ không phải do ngưi dng lấy như trong trưng hợp truy vấn
● So với truy vấn thì báo cáo không linh hoạt và được xác định trước
● Hầu hết các báo cáo được định dạng sẵn và do đó nó rất cứng nhắc
● Ngưi dng có ít quyền kiểm soát hơn đối với các báo cáo nhận được so với các truy vấn mà họ có thể xây dựng
Phương pháp này được sử dụng nhiều bởi nhóm ngưi dng Farmers, chẳng hạn như các nhà phân tích kỹ thuật, nhà phân tích về tiếp thị, bán hàng hoặc tài chính bởi họ có các yêu cầu tiêu chuẩn như ước tính lợi nhuận theo sản phẩm hoặc phân tích doanh số bán hàng hàng tháng
Thứ hai, cũng là một phương pháp từ sự duy trì của một kỹ thuật từ các hệ thống tác nghiệp Trong các hệ thống tác nghiệp, ngưi dng được phép chạy các truy vấn trong một thiết lập được kiểm soát chặt chẽ Tuy nhiên, trong kho dữ liệu, xử lý truy vấn là phương pháp phổ biến nhất để truyền tải thông tin
• Sự khác biệt chính giữa các truy vấn trong hệ thống tác nghiệp và trong kho dữ liệu là khả năng bổ sung và tính mở trong môi trưng kho
+ Tính năng của môi trưng truy vấn được quản lý:
+ Bắt đầu, xây dựng, và trình bày kết quả truy vấn được cung cấp trên máy ngưi dùng
+ Thông tin được lấy bởi ngưi dng chứ không tự truyền đến họ
• Môi trưng truy vấn phải linh hoạt để ph hợp với các lớp ngưi dng khác nhau với mục đích khác nhau
+ Quá trình xử lý truy vấn:
Hình 4 : Quá trnh xử lý truy vấn Đây là hình ảnh minh họa cho quá trình xử lý truy vấn của kho dữ liệu, trong đó có ba thành phần chính: kho dữ liệu, truy vấn và ngưi dng Kho dữ liệu được biết là một kho lưu trữ tập trung về dữ liệu lịch sử của một tổ chức, được thiết kế để truy vấn và phân tích Truy vấn lại là một yêu cầu thông tin từ kho dữ liệu, được gửi bởi ngưi dng Và ngưi dng thưng là một ngưi nào đó trong tổ chức cần truy cập dữ liệu được lưu trữ trong kho để báo cáo, phân tích hoặc mục đích ra quyết định Tóm lại, Phạm vi xử lý truy vấn (The query processing arena) chịu trách nhiệm thực hiện các truy vấn 1 cách hiệu quả và trả lại kết quả cho ngưi dng một cách kịp thi
So sánh kiểu sử dụng kho dữ liệu này với cách một hệ thống tác nghiệp được sử dụng để cung cấp thông tin Ngưi dng hầu như không bao gi được phép chạy các truy vấn của
26 riêng họ và định dạng các báo cáo của riêng họ từ một hệ thống tác nghiệp Chính vì vậy, phương pháp này được sử dụng nhiều bởi nhóm ngưi dng Explorers, Miners, đó là các nhà nghiên cứu và các nhà phân tích kỹ thuật có tay nghề, chuyên môn cao
Thứ ba là phương pháp phân tích tương tác Phân tích là một phần gồm một loạt các truy vấn có liên quan Chính vì vậy, mọi quy định về quản lý truy vấn đều áp dụng cho các truy vấn được thực hiện như một phần của phần phân tích Mỗi truy vấn trong phần phân tích được liên kết với truy vấn trước đó và tạo thành một chuỗi liên kết Trong phân tích, không có đưng dẫn được xác định trước và các truy vấn được xây dựng hay thực hiện với tốc độ của suy nghĩ
VD: Ngưi dng có thể bt đầu vi một truy vấn ban đầu: Tổng doanh số bán hàng quý đầu tiên trong năm nay theo các dòng sản phẩm riêng lẻ là bao nhiêu? Khi ngưi dng nhn vào các con số và tò mò về sự sụt giảm trong doanh số bán hàng ca hai trong số các dòng sản phẩm này Sau đó, ngưi dng tiến hành xem chi tiết từng sản phẩm trong hai dòng sản phẩm đó Truy vấn tiếp theo là phân tích theo khu vực và sau đó là theo quận Phân tích tiếp tục so sánh vi doanh số bán hàng quý đầu tiên ca hai năm trưc
Phương pháp phân tích tương tác là một điều đặc biệt trong môi trưng kho dữ liệu Hiếm có ngưi dng nào được cung cấp phương thức tương tác như vậy trong các hệ thống tác nghiệp
Kỹ thuật này được quan tâm bởi nhóm ngưi dng Operators Các nhà chiến lược kinh - doanh, nhà nghiên cứu thị trưng, nhà lập kế hoạch sản phẩm, nhà phân tích sản xuất cần theo dõi hiệu suất hiện tại và nhóm ngưi dng Tourists – xác định các mục quan tâm
Cuối cng, thông tin trong kho dữ liệu là nguồn cung cấp dữ liệu tích hợp cho các ứng dụng hỗ trợ ra quyết định Dữ liệu trong kho dữ liệu đã được hợp nhất, tích hợp, chuyển đổi và làm sạch Mọi ứng dụng hỗ trợ quyết định được xây dựng trực tiếp bằng cách sử dụng các hệ thống tác nghiệp riêng lẻ có thể không có chế độ xem dữ liệu của doanh nghiệp
- Hệ thống thông tin điều hành (EIS): EIS được xây dựng bằng d liệu từ kho d liệu chứng tỏ vượt trội hơn so vi EIS dựa trên d liệu trực tiếp từ các hệ thống tác nghiệp
Các công cụ truyền tải thông tin
Phân loại công cụ cung cấp thông tin
Về cơ bản thì các công cụ cung cấp thông tin được chia làm 3 nhóm chính
• Nhóm thứ nhất gồm các công cụ công cấp khả năng truy vấn và truy cập vào dữ , liệu Đây là nhóm công cụ căn bản và phổ biến nhất, được mọi cấp nhân sự sử dụng, có thể kể đến như là Manager, Analyst và C-class Ví dụ như trưởng phòng bán hàng muốn xem tình hình bán hàng của công ty trong tháng này như thế nào thì họ có thể sử dụng này để truy vấn thông tin đó
• Nhóm thứ hai, gồm các công cụ hỗ trợ việc viết báo cáo, cung cấp khả năng tạo các báo cáo, lên lịch chạy định kì các báo cáo này Những ngưi thưng sử dụng công cụ này là nhân viên và các quản lí
• Nhóm thứ ba là những công cụ cung cấp khả năng phân tích phức hợp, cho phép , ngưi dng phân tích chuyên sâu vào một vấn đề nào đó Những ngưi thưng dng công cụ này có thể kể đến là các chuyên gia phân tích, khai phá thông tin Sau khi nắm được những nhóm công cụ và chức năng đặc trưng của từng nhóm, gi chúng ta sẽ đi tìm hiểu xem trong các nhóm có những loại công cụ chuyên biệt nào và chức năng cũng như điểm khác nhau của chúng:
• Managed Query: Gồm các template cho truy vấn được xây dựng sẵn, ví dụ như truy vấn doanh thu theo tháng, Ngưi dng chỉ cần cung cấp các tham số cũng như đối tượng cần tìm Công cụ này thích hợp cho mọi cấp nhân sự vì nó dễ dng
• Ad hoc Query: Là một bản nâng cấp của Managed Query Ngưi dng có thể tự tạo các truy vấn ty thuộc vào mục đích riêng của mình, do vậy nó yêu cầu kiến thức cũng như kĩ năng về truy vấn đối với ngưi sử dụng Ưu điểm của nó so với Managed Query là có tính trọng tâm và nhanh chóng hơn VD: Trưởng phòng nhân sự đang nghi ng rằng gần đây nhân viên nghỉ nhiều bất thưng, anh ta có thể sử dụng công cụ này để xem duy nhất vấn đề ở khâu nhân sự thay v phải truy xuất toàn bộ Thích hợp cho quản lí cấp trung và các phân tích viên
• Preformatted Report và Enhanced Report: Đ y là hai công cụ thuộc nhóm các công â cụ hỗ trợ việc báo cáo Hai công cụ này cũng giống như hai công cụ trước, một cái thì nâng cấp hơn cái kia và khó xài hơn, ở đây là Enhanced Report Cả 2 đều cung cấp khả năng tạo báo cáo và formatting chúng, nhưng ở Preformatted Report, công cụ này cho phép ta đặt lịch báo cáo định kì, các báo cáo được format sẵn nên chỉ cần đưa các yêu cầu vào là sẽ nhận được báo cáo Còn ở Enhanced Report, công cụ này cho phép ta tự tạo báo cáo theo mục đích riêng của mình, thưng là chỉ khi có những sự kiện bất thưng, đặc biệt nên phải gần những báo cáo đặc biệt như này VD: Có một biến động trên thị trưng và ngưi quản lí cần viết một báo cáo bất thưng về tnh hnh bán hàng và tồn kho để họp vi các quản lí cấp cao, khi đó ngưi dng sẽ sử dụng công cụ này Công cụ này Cũng v vậy mà đối tượng sử dụng từng công cụ này cũng khác nhau, ở Preformatted Report, đối tượng sử dụng thưng là các nhân viên, còn ở Enhanced Report, thưng là các quản lí tầm trung và phân tích viên mi hay sử dụng để báo cáo về một sự kiện bất thưng g đó.
• Complex Analysis: Đây là loại công cụ mạnh về lĩnh vực phân tích phức tạp, nó cho phép ngưi dng xây dựng những câu truy vấn cực kì phức tạp và quá trình phân tích này thưng kéo dài nhiều kì và kết quả sẽ được lưu lại để sử dụng lại sau này Thưng được sử dụng bởi lớp ngưi dng có nhu cầu phân tích số liệu chi tiết và phức tạp nhằm tìm ra các mối quan hệ ẩn giữa các yếu tố trong dữ liệu VD:
Nhng chuyên gia phân tích d liệu thưng sử dụng công cụ này để tm ra các mối quan hệ gia các thông số trong d liệu, mối quan hệ gia giảm giá nhân công vi lượng khách hàng tiềm năng như thế nào
• DSS Applications: công cụ thưng được sử dụng bởi những quản lí cấp cao, những ngưi sẽ ra những quyết định sống còn của doanh nghiệp Công cụ này bao gồm - các ứng dụng hỗ trợ quyết định được thiết kế sẵn theo định dạng chuẩn và có thể được ty chỉnh DSS Applications được sử dụng để cung cấp thông tin và phân tích dữ liệu hữu ích cho các nhà quản lý, giúp họ đưa ra quyết định một cách nhanh chóng và hiệu quả Các chức năng cơ bản mà một DSS App cung cấp là tổng hợp, truy xuất và phân tích dữ liệu, dự báo, mô phỏng tương tác Dashboard và Scorecard chính là 2 ví dụ cụ thể cho 2 chức năng mô phỏng tương tác và dự báo của loại công cụ này
• Knowledge Discovery: Công cụ này thực hiện quá trình trích xuất tri thức hữu ích mà trước đó chưa được biết đến từ một lượng lớn dữ liệu Công cụ này sử dụng các kỹ thuật khai thác dữ liệu khác nhau để xác định các mô hình pattern, mối - quan hệ relationship và xu hướng trend trong dữ liệu có thể được sử dụng để - - đưa ra các quyết định tốt hơn Một ví dụ về công cụ Khám phá tri thức là IBM Watson Analytics Công cụ này cho phép ngưi dng tải lên dữ liệu từ các nguồn khác nhau và sử dụng các thuật toán học máy để xác định các mối tương quan và xu hướng trong dữ liệu Nó cung cấp cho ngưi dng các hình ảnh dễ hiểu có thể được sử dụng để đưa ra quyết định dựa trên dữ liệu VD: RapidMiner, đây là một công cụ khai thác d liệu mã nguồn mở cung cấp cho ngưi dng một loạt các khả năng phân tích và trực quan hóa d liệu RapidMiner sử dụng các thuật toán học máy để xác định các mô hnh và xu hưng trong d liệu, và có thể được sử dụng cho việc dự đoán, phân cụm và khai thác văn bản Thưng th công cụ này chỉ thích hợp vi các phòng ban chuyên môn như bộ phân chuyên phân tích và khai phá dự liệu
Hình 5: Phân loại các công cụ cung cấp thông tin.
Phương pháp chọn công cụ cung cấp thông tin thích hợp
Bởi vì tầm quan trọng to lớn của công cụ truyền tải thông tin trong môi trưng kho dữ liệu, nên việc lựa chọn những công cụ ph hợp nhất với môi trưng đó càng quan trọng không kém Cần có một phương pháp chuẩn cho việc lựa chọn này
Cơ bản thì việc lựa chọn công cụ phải đáp ứng được nhu cầu của những ngưi dng Cần xác định họ là ai, độ am hiểu về máy tính và công nghệ của họ, họ mong muốn tương tác với kho dữ liệu như thế nào ? , v.v Hãy để ngưi dng tham gia vào việc lựa chọn công cụ, đặt ra những tiêu chí lựa chọn
Phương pháp chuẩn thưng chia làm các giai đoạn Trong mỗi giai đoạn cần xác định những việc cần thực hiện và thi gian hoàn thành từng giai đoạn Dưới đây là các bước trong quy trình lựa chọn công cụ truyền tải thông tin ph hợp, có thể tinh chỉnh sao cho ph hợp với cách làm việc và quy mô của đội làm việc
• Thành lập một nhóm gọi là “Tool Selection Team”: ty thuộc vào mức độ quy mô của dự án và của doanh nghiệp mà số thành viên trong team này có thể thay đổi Nhưng phải đảm báo có đủ 4 nhóm ngưi dng sau Chủ doanh nghiệp, ngưi sẽ rót vốn và giám sát quá trình triển khai dự án này nên rất cần đạt được sự thỏa mãn cho nhân vật này Nhóm các ngưi dng của từng lĩnh vực, chúng ta cần ý kiến của họ để lựa chọn công cụ ph hợp với nhu cầu cũng như mục đích sử dụng của họ Cuối cng là nhóm các chuyên gia về công cụ cung cấp thông tin và quản lí kho dữ liệu, họ sẽ là ngưi gợi ý cũng như đề ra các phương án khả thi để đáp ứng được như cầu của 2 nhóm trên
• Đánh giá lại các yêu cầu của ngưi dng: Liệt kê các lớp ngưi dng và đặt từng ngưi dng vào lớp thích hợp Mô tả những kỳ vọng và nhu cầu của từng lớp ngưi dng và tài liệu hóa chúng để có thể so khớp chúng với các tính năng của các công cụ tiềm năng cung cấp
• Quy định tiêu chí lựa chọn: Tiêu chí ở đây là những yêu cầu non-fuction như là dễ sử dụng, có thể nâng cấp dễ dàng, Thì các tiêu chí này sẽ được trình bày ở phần Tiêu chí lựa chọn công cụ
• Nghiên cứu và tạo một danh sách các sản phẩm: Thu thập thông tin sản phẩm từ các nhà cung cấp Mặc d có vài trăm công cụ trên thị trưng nhưng hãy thu hẹp danh sách xuống khoảng 25 hoặc ít hơn để nghiên cứu sơ qua Ở bước này, hãy tập trung chủ yếu vào các chức năng và tính năng của các công cụ mà bạn nghiên cứu xem có khớp với yêu cầu của ngưi dng không
• Nhận thêm bổ sung và thu gọn danh sách: Trong giai đoạn này, bạn muốn thực hiện nghiên cứu bổ sung và chuyên sâu hơn về các công cụ trong danh sách sơ bộ của mình Liên hệ với nhà cung cấp để có thêm thông tin về sản phẩm Sau đó chọn ra ba công cụ thích hợp nhất trong số các công cụ từ danh sách tiềm năng Nếu không chắc lắm về kết quả cuối cng, hãy chọn nhiều hơn nhưng không quá năm, vì nếu có quá nhiều thì bạn sẽ mất nhiều thi gian hơn cho việc xem xét.
• Trải nghiệm thực tế sản phẩm: Liên hệ với các nhà cung cấp để yêu cầu được demo sản phẩm Trong quá trình demo, hãy liên tục cố gắng so khớp các chức năng của công cụ với yêu cầu của ngưi dng
• Hoàn thành Đánh giá bởi CNTT và KH: Bộ phận CNTT thực hiện một đánh giá riêng, chủ yếu để đánh giá khả năng tương thích kỹ thuật với môi trưng máy tính của bạn Ví dụ như kiểm tra các tính năng, kết nối với DBMS của bạn, xem xét khả năng mở rộng sau này Kế tiếp là lấy đánh giá của ngưi dng về sản phẩm đó Sự kiểm tra và chấp nhận của ngưi dng là rất quan trọng Giai đoạn
34 này bao gồm các buổi thực hành cho khách hàng Nếu có thể, hãy tạo prototype cho việc sử dụng thực tế, vì nếu hai sản phẩm ph hợp với các yêu cầu ở mức độ gần như nhau, thì việc được dng thử bản prototype có thể mang lại những khác biệt cơ bản
• Đưa ra lựa chọn cuối cng: Giai đoạn này cho chúng ta cơ hội để đánh giá lại các công cụ gần khớp với yêu cầu Ngoài ra, trong giai đoạn này hãy kiểm tra những vấn đề ngoại cảnh như tình trạng nhà cung cấp, độ minh bạch Các công cụ có thể rất khớp với yêu cầu ngưi dng của bạn, nhưng nhà cung cấp lại không ổn định và lâu dài Xác minh tất cả các vấn đề liên quan về nhà cung cấp Đưa ra lựa chọn cuối cng, luôn cập nhật thông tin cho ngưi dng
Một số lời khuyên trong quá trình chọn công cụ cung cấp thông tin:
• Đề cử một thành viên có kinh nghiệm trong nhóm hoặc data warehouse administrator để lãnh đạo nhóm và thúc đẩy quá trình
• Giữ cho ngưi dng của bạn hoàn toàn tham gia vào quá trình này
• Không nên bỏ qua việc thực hành Đừng hài lòng chỉ với các buổi demo của nhà cung cấp Hãy tự mình thử các công cụ
• Cân nhắc việc tạo prototype cho một số tương tác cung cấp thông tin điển hình để thử xem công cụ này có chịu được lượng truy cập của nhiều ngưi dng không?
• Không dễ để kết hợp các công cụ từ nhiều nhà cung cấp, nên nếu được hãy chọn các công cụ từ một nhà cung cấp
• Hãy nhớ rằng, một công cụ cung cấp thông tin phải tương thích với DBMS kho dữ liệu
• Tiếp tục đặt những cân nhắc về siêu dữ liệu lên hàng đầu.
Tiêu chí khi lựa chọn công cụ cung cấp thông tin
Như đã đề cập ở trên về nhu cầu của mỗi lớp ngưi dng, ở phần này chúng ta sẽ đề ra các tiêu chí lựa chọn công cụ cung cấp thông tin Ví dụ, nói đến các nhà khai phá dữ liệu với nhu cầu phân tích phức tạp của họ, các công cụ dành cho lớp ngưi dng này phải có các tính năng ph hợp để thực hiện phân tích phức tạp Đối với ngưi dng truy cập thông thưng, các công cụ phải dễ dàng sử dụng và trực quan
• Dễ sử dụng: Ngưi dng sẽ rất hài lòng nếu như họ có thể dễ dàng thực hiện các thao tác Tính dễ sử dụng được yêu cầu cụ thể trong các hoạt động như truy vấn, xây dựng báo cáo và tính linh hoạt của bản trình bày
• Hiệu suất: Mặc d hiệu suất hệ thống và thi gian phản hồi trong môi trưng kho dữ liệu so với trong hệ thống OLTP thì chậm hơn đáng kể, nhưng yêu cầu về hiệu suất chấp nhận được không chỉ riêng hệ thống cung cấp thông tin mà còn toàn bộ môi trưng
• Khả năng tương thích: Các tính năng của công cụ cung cấp thông tin phải ph hợp chính xác với lớp ngưi dng mà nó hướng đến Ví dụ như OLAP không thích hợp với lớp ngưi dng truy cập cơ bản, cũng như các báo cáo được định dạng sẵn không phải là nhu cầu chính yếu của các nhà khai phá dữ liệu
• Chức năng: Đây là một phần mở rộng của khả năng tương thích Mỗi lớp ngưi dng yêu cầu một số chức năng không thể thiếu trong công cụ Ví dụ như những ngưi khai thác cần có đầy đủ các chức năng từ thu thập dữ liệu cho đến khám phá các pattern chưa biết,
• Tích hợp: Thông thưng thì việc truy vấn, phân tích và tạo báo cáo có thể được thực hiện trong một phiên sử dụng của ngưi dng Ngưi dng có thể bắt đầu với một truy vấn mà kết quả của nó dẫn đến việc đi sâu vào các hình thức phân tích khác Vào cuối phiên sử dụng, ngưi dng nắm bắt được các tập kết quả cuối cng dưới dạng báo cáo Nếu kiểu sử dụng này phổ biến trong môi trưng của bạn, thì công cụ cung cấp thông tin của bạn phải có khả năng tích hợp các chức năng khác nhau
• Công cụ quản lí: Quản trị tập trung làm cho nhiệm vụ của quản trị viên cung cấp thông tin trở nên dễ dàng Công cụ này phải đi kèm với các chức năng tiện ích để cấu hình và kiểm soát môi trưng cung cấp thông tin
• Khả năng tương thích với Web: Internet đã trở thành cánh cửa đi ra thế giới Các kho dữ liệu ngày nay có lợi thế lớn so với những kho dữ liệu được xây dựng trước khi công nghệ Web trở nên phổ biến Điều quan trọng đối với công cụ cung
36 cấp thông tin là có thể xuất bản các trang Web qua Internet và mạng nội bộ của công ty bạn
• Bảo mật dữ liệu: Trong hầu hết các doanh nghiệp, việc bảo vệ dữ liệu trong data warehouse cũng quan trọng như cung cấp bảo mật cho dữ liệu trong các hệ thống vận hành
• Khả năng duyệt dữ liệu: Ngưi dng phải có khả năng duyệt qua siêu dữ liệu và xem xét các định nghĩa và ý nghĩa của dữ liệu Ngoài ra, công cụ phải trình bày các bộ dữ liệu dưới dạng các đối tượng GUI trên màn hình để ngưi dng lựa chọn bằng cách nhấp vào biểu tượng
• Khả năng chọn lọc dữ liệu: Công cụ phải cung cấp cho ngưi dng phương tiện để xây dựng các truy vấn mà không cần phải thực hiện các phép join phức tạp giữa các bảng bằng thuật ngữ và phương pháp kỹ thuật
• Kết nối cơ sở dữ liệu: Khả năng kết nối với bất kỳ sản phẩm cơ sở dữ liệu hàng đầu nào là một tính năng thiết yếu cần có trong công cụ cung cấp thông tin
• Tính năng trình bày, biểu diễn: Công cụ phải trình bày các tập kết quả ở nhiều định dạng khác nhau, bao gồm văn bản, định dạng bảng, biểu đồ, đồ thị, bản đồ, v.v
• Khả năng mở rộng: Nếu kho dữ liệu áp dụng thành công, số lượng ngưi dng sẽ có sự gia tăng đáng kể trong một thi gian ngắn, cũng như sự mở rộng đáng kể về mức độ phức tạp của các yêu cầu thông tin Công cụ cung cấp thông tin phải có khả năng mở rộng khi có nhu cầu để xử lý khối lượng lớn hơn và mức độ phức tạp hơn của các yêu cầu
• Độ tin cậy của nhà cung cấp: Khi thị trưng kho dữ liệu ngày càng phát triển, sẽ có nhiều vụ sáp nhập và mua lại, ngoài ra, một số công ty có thể sẽ phá sản Công cụ được chọn có thể ph hợp nhất với môi trưng của bạn, nhưng nếu nhà cung cấp không ổn định, bạn có thể cân nhắc lại lựa chọn của mình.
Chủ đề đặc biệt
Business Activity Monitoring (BAM)
Mô tả các quy trình và công nghệ giúp nâng cao nhận thức về tình huống và cho phép phân tích các chỉ số hiệu suất kinh doanh quan trọng dựa trên dữ liệu thi gian thực BAM được sử dụng để cải thiện tốc độ và hiệu quả của hoạt động kinh doanh bằng cách theo dõi những gì đang xảy ra và hiển thị các vấn đề một cách nhanh chóng Khái niệm BAM có thể được thực hiện thông qua nhiều loại công cụ phần mềm khác nhau; những sản phẩm chỉ nhắm vào BAM được gọi là "sản phẩm nền tảng BAM"
• Quy trình quản l khép kín ý
Thiết lập một quy trình kinh doanh khép kín ph hợp cho từng doanh nghiệp cụ thể Với quy trình này thì mọi thông tin về khách hàng, báo giá, hợp đồng, đơn hàng…đều được liên kết và có tính kế thừa nên quá trình cập nhật và khai thác thông tin không bị trng lặp và sai sót
• Ủy quyền giao việc và theo dõi
Với mô hình chia sẻ thông tin giữa các nhân viên trong cng hệ thống, ngưi dng có thể phân quyền cho từng đối tượng để truy xuất ty theo theo nội dung cụ thể Hệ thống cũng cho phép ngưi dng giao việc và theo dõi tình trạng thực hiện, tiến độ công việc được giao
• Theo dõi theo thi gian thực
Thông tin về khách hàng, hàng hoá, hợp đồng, đơn hàng…luôn được cập nhật trực tuyến thông qua mạng internet mọi lúc, mọi nơi nhằm hỗ trợ 24/24 cho bộ phận bán hàng cũng như các cấp quản lý đưa ra được quyết định kịp thi, đúng lúc
• Đánh giá KPI cụ thể
Xây dựng chỉ số KPI cụ thể chuyên biệt cho đội ngũ kinh doanh cũng như các cá nhân có năng lực đặc biệt Các chỉ tiêu đánh giá được cập nhật tự động trên hệ thống với các thông tin thực tế dựa vào ghi nhận tương tác của nhân viên kinh doanh với khách hàng
• Báo cáo chi tiết cho từng phân hệ
Hệ thống báo cáo cho từng phân hệ, cho phép lập báo cáo tổng quan theo dạng biểu đồ để tăng tính trực quan đồng thi có thể xuất các file báo cáo trên phần mềm nhằm hỗ trợ tối đa cho việc theo dõi tình trạng khách hàng, hiệu quả bán hàng và quản lý hàng trong kho
• Phân quyền bảo mật tối ưu
Hệ thống phân quyền được thiết kế thông minh, cho phép ngưi quản trị hệ thống phân quyền theo từng nhóm ngưi dng và chi tiết đến từng chức năng cho từng đối tượng sử dụng Hệ thống bảo mật tối ưu, quản lý ngưi dng truy cập theo tên đăng nhập và mật khẩu
1.3 C ch th c hoá ứ ạt động:
• ETL để thu thập dữ liệu từ nhiều nguồn
• Mô hình hóa quy trình để xác định phạm vi của các quy trình và hoạt động có liên quan
• Các phần mềm thực thi quy tắc để phát hiện và nhận ra các sự kiện thích hợp trong các hoạt động
• Các cơ chế phân phối chẳng hạn như dashboard, cảnh báo email, tin nhắn SMS, tài liệu Word, công cụ báo cáo (Crystal Reports, MS Word, SSRS, v.v.) fax, EDI, cập nhật ứng dụng cơ sở dữ liệu, làm mới kho dữ liệu để phân tích BI và nhiều nền tảng tiêu thụ thông tin khác, v.v
1.4 Ưu điểm của hệ thống BAM:
Các công cụ BAM cho phép những ngưi ra quyết định nhanh chóng mô hình hóa vấn đề, cộng tác để hành động, cân nhắc giải pháp thay thế và đưa ra quyết định nhanh hơn và có thể tốt hơn nữa Không những thế, các hệ thống BI thi gian thực như BAM có thể được thực hiện để tương tác trực tiếp với các ứng dụng kinh doanh
● Xác định thi gian thực và thông báo về rủi ro và thành công kinh doanh trên tất cả các bộ phận và hệ thống
● Ra quyết định mạnh mẽ hơn thông qua việc cung cấp thông tin từ nhiều ứng dụng kinh doanh nội bộ và bên ngoài
● Việc thực thi các thông lệ và thủ tục của công ty mà không tạo ra sự quản lý tốn kém cho các phòng ban và nhân viên
● Loại bỏ các lỗi do thiếu thông tin thi gian thực
Ngoài ra, khi kết hợp BAM với các phần mềm BPA, có thể giúp tiết kiệm chi phí và tăng năng suất đáng kể cho bất kỳ tổ chức quy mô nào.
Dashboard và Scorecard
Dashboard (bảng điều khiển) là một bảng chứa các loại dữ liệu khác nhau đã được xử lý và trực quan hóa thành biểu đồ để phục vụ cho việc ra quyết định trong doanh nghiệp Giống như bản điều khiển của ô tô, bảng điều khiển dữ liệu sắp xếp, lưu trữ và hiển thị thông tin quan trọng từ nhiều nguồn dữ liệu vào 1 nơi dễ truy cập
Với đặc tính linh hoạt, Dashboard cũng tự động thay đổi theo thi gian thực để doanh nghiệp có thể dễ dàng so sánh và đánh giá công việc một cách chuẩn xác
Ngoài ra, Dashboard không chỉ cung cấp các dữ liệu chuyên sâu trong quá trình sản xuất kinh doanh, đồng thi nó còn đưa ra một cái nhìn tổng quát về hiệu suất của từng bộ phận, các xu hướng, các hoạt động, các chỉ số KPI
Hình 6 : Bảng dashboard trên xe ô tô Đây là bảng dashboard trên xe ô tô Bảng dashboard này cho chúng ta biết tốc độ của xe, nhiệt độ dầu, lượng xăng còn lại, các biểu tượng cảnh báo, tín hiệu đèn, Các dữ liệu giúp ngưi lái đưa ra các quyết định quan trọng về tốc độ, tình trạng động cơ, có nên bơm xăng hay không, Tóm lại, dashboard này cung cấp cho bạn mọi thông tin cần thiết để lái xe an toàn
Tuy nhiên, nếu bảng dashboard chỉ thể hiện duy nhất một dữ liệu trực quan hóa như hình dưới đây là là bảng dashboard của xe ô tô:
Hình 7 : Bảng dashboard trên xe ô tô chỉ thể hiện 1 d liệu
Nhìn vào dashboard này, chúng ta có thể biết tốc độ đang đi, nhưng xe có thể hết xăng bất cứ lúc nào Từ đó có thể thấy, nếu chỉ nhìn vào một dữ liệu duy nhất để đưa ra quyết định là rất nguy hiểm Tuy nhiên, đây lại là cách mọi ngưi thưng làm khi tiếp cận với dữ liệu chỉ với 1 biểu đồ duy nhất Khi đó dữ liệu rất hạn hẹp, thiếu đi bối cảnh và các thông tin quan trọng khác
Một bảng dashboard được ứng dụng vào thực tế, dng để quản lý bán hàng sẽ cho chúng ta biết được doanh thu, lợi nhuận tổng và theo khu vực, tỉnh,
Hình 8 : Bảng Dashboard quản lý bán hàng
Scorecard (thẻ điểm): là một công cụ báo cáo quản lý hiệu suất được sử dụng để so sánh các hoạt động hiện tại trong công ty của bạn với các mục tiêu và kết quả đã hoạch định
Các công ty sử dụng scorecard để điều chỉnh chiến lược của họ với các mục tiêu bằng cách theo dõi các số liệu quan trọng liên quan đến thông tin khách hàng, mức tăng trưởng dự kiến, dữ liệu tài chính và hoạt động kinh doanh
Balanced Scorecard (BSC) là một hệ thống quản lý, nó giúp cho doanh nghiệp thiết lập, thực hiện, giám sát, đo lưng để đạt được các chiến lược & các mục tiêu của mình Sau khi
42 các doanh nghiệp thiết lập và phát triển các chiến lược, doanh nghiệp sẽ triển khai, thực hiện & giám sát chiến lược thông qua 4 khía cạnh: tài chính, khách hàng, quá trình hoạt động nội bộ, học tập & phát triển Bốn khía cạnh này sẽ tạo ra sự khác biệt giữa doanh nghiệp thành công và doanh nghiệp thất bại Bốn khía cạnh này có thể được diễn giải đơn giản như sau:
• Tài chính: doanh nghiệp đo lưng và giám sát các yêu cầu & các kết quả về tài chính
• Khách hàng: đo lưng và giám sát sự thỏa mãn khách hàng và các yêu cầu về các kết hoạt động đáp ứng các nhu cầu đòi hỏi của khách hàng
• Quá trình nội bộ: đo lưng & giám sát các chỉ số và các yêu cầu của các quá trình trọng yếu trong nội bộ doanh nghiệp hướng đến khách hàng
• Học tập & phát triển: tập trung vào cách thức doanh nghiệp giáo dục & đào tạo nhân viên, nâng cao kiến thức và cách thức doanh nghiệp đã sử dụng các kiến thức này để duy trì lợi thế cạnh tranh trong thị trưng
Hình 9 : Mô hnh BSC được mô tả bởi Hai Giáo Sư Kaplan & Norton
Từ mô hình trên, nếu xem xét tính thi gian từ dưới lên trên, chúng ta thấy rằng: ví dụ lợi nhuận đạt được tại thi điểm hiện nay của tổ chức, thực sự là kết quả của những điều đã được tổ chức thực hiện tại tháng trước, quý trước hoặc năm trước Nếu một số các kỹ năng mới, kiến thức mới, hiện nay doanh nghiệp đưa vào áp dụng thì có thể sẽ tạo ra các kết quả tài chính và sự hiệu quả vào năm tới
Hình 10 : Mối quan hệ gia 4 khía cạnh Để thành công khía cạnh tài chính : doanh nghiệp cần phải thỏa mãn khách hàng để họ sẽ mua sản phẩm/ dịch vụ của mình, đồng thi doanh nghiệp cũng phải nâng cao hiệu quả về tài chính bằng cách cải tiến vượt trội các quá trình nội bộ quan trọng trong doanh nghiệp Để thỏa mãn khách hàng: doanh nghiệp cần cải tiến vượt trội các quá trình tác nghiệp nội bộ để sản phẩm/ dịch vụ sẽ đáp ứng nhu cầu khách hàng Để cải tiến các quá trình nội bộ: doanh nghiệp cần phải học tập & phát triển những điều cần thiết để phục vụ cho các quá trình nội bộ & khách hàng