1. Trang chủ
  2. » Luận Văn - Báo Cáo

tiểu luận môn cơ sở dữ liệu nâng cao đề tài thông tin phù hợp với các lớp người dùng

50 0 0
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Nội dung

Cách sử dụng thông tinThông tin tự phục vụTruy vấn quảng cáo của ngưi dngTạo báo cáo bởi ngưi dngCác truy vấn được xác định trướcBáo cáo cũng được định dạng sẵnThông tin qua các ứng

Trang 1

ĐẠI HỌC UEH

TRƯỜNG CÔNG NGHỆ VÀ THIẾT KẾ KHOA CÔNG NGHỆ THÔNG TIN KINH DOANH

BÁO CÁO GIỮA KỲ

MÔN: CƠ SỞ DỮ LIỆU NÂNG CAO

ĐỀ TÀI: THÔNG TIN PHÙ HỢP VỚI CÁC LỚP NGƯỜI DÙNG

Giảng viên : Mã lớp học phần : Nhóm : Thành viên :

ThS Hồ Thị Thanh Tuyến 23D1INF50901801 - Chiều thứ 58

Nguyễn Thị Minh Diệu - 31211023214

Nguyễn Thuỳ Dung - 31211027099

Lê Ngọc Thiên Kim - 31211027255

Thành phố Hồ Chí Minh, ngày 28 tháng 2 năm 2023

Trang 2

MỤC LỤC NI DUNG

I Thông tin từ kho dữ liệu 1

1 Kho dữ liệu so với hệ thống tác nghiệp 1

2 Tiềm năng thông tin 5

3 Giao diện thông tin ngưi dng 11

4 Các ứng dụng trong ngành của data warehouse 14

5 Ai nên cần sử dụng kho dữ liệu Data Warehouse ? 15

II Ai sẽ là người sử dụng thông tin? 16

1 Các lớp ngưi dng 16

2 Những gì họ cần 17

3 Làm thế nào để cung cấp thông tin ? 21

III Cách thức truyền tải thông tin : 24

IV Các công cụ truyền tải thông tin : 29

1 Phân loại công cụ cung cấp thông tin 29

2 Phương pháp chọn công cụ cung cấp thông tin thích hợp 32

3 Tiêu chí khi lựa chọn công cụ cung cấp thông tin 34

Trang 3

PHỤ LỤC MỤC LỤC HÌNH

Hình 1: Vòng l p k hoặ ế ạch – thực hi n ệ – đánh giá 6

Hnh 2: Sự tương tác ca ngưi dng v i kho d  liệu 10

Hnh 3: Phân lp ngưi dng Data Warehouse 16

Hnh 4: Quá trnh xử lý truy vấn 25

Hnh 5: Phân loại các công cụ cung cấp thông tin 32

Hnh 6: Bảng dashboard trên xe ô tô 40

Hnh 7: Bảng dashboard trên xe ô tô chỉ thể hiện 1 d liệu 40

Hnh 8: Bảng Dashboard quản lý bán hàng 41

Hnh 9: Mô hnh BSC được mô tả bởi Hai Giáo Sư Kaplan & Norton 42

Hnh 10: Mối quan hệ gia 4 khía cạnh 43

MỤC LỤC BNG Bảng 1: Cho th y kho d  liệu khác vi hệ thống tác nghiệp như thế nào v cách s ề ửdụng và giá tr 1 Bảng 2: So sánh H ệ thống tác nghi p và KDL 4 Bảng 3: Sự khác biệt chính gia hệ thống tác nghiệp và trong kho d liệu trong việc truyền tải thông tin 27

Bảng 4: So sánh Dashboard và Scorecard 44

Trang 4

BNG PHÂN CÔNG CÔNG VIỆC

- Soạn câu hỏi trò chơi

Save to a Studylist

Trang 5

NI DUNG I Thông tin từ kho dữ liệu:

• Tại sao phải nghiên cứu việc phân phối thông tin từ kho dữ liệu trong khi hầu hết ngưi dng đều tận dụng thông tin được phân phối từ hệ thống tác nghiệp? • Mục đích nghiên cứu việc phân phối thông tin từ kho dữ liệu là gì?

• Sự khác biệt giữa việc phân phối thông tin từ hệ thống tác nghiệp (operational system) so với kho dữ liệu là gì?

1 Kho dữ liệu so với hệ thống tác nghiệp:

Các cơ sở dữ liệu tồn tại trong các hệ thống tác nghiệp cho việc truy vấn và báo cáo Nếu vậy, cơ sở dữ liệu trong các hệ thống tác nghiệp khác với các cơ sở dữ liệu trong kho dữ liệu như thế nào?

Giá trị của

Tính toán Chi phí/Doanh thuTính toán ký quỹ

Lợi tức đầu tưTính toán thị phần

Giá trị trọn đi của khách hàngNợ phải trả

Quản lý tài sảnChi phí sản phẩmChi phí kênh phân phối

Trang 6

Cách sử dụng

thông tin

Thông tin tự phục vụ

Truy vấn quảng cáo của ngưi dngTạo báo cáo bởi ngưi dngCác truy vấn được xác định trướcBáo cáo cũng được định dạng sẵn

Thông tin qua các ứng dụngMàn hình GUI trực tuyếnBáo cáo tiêu chuẩnTruy vấn rất hạn chế

Báo cáo Ad hoc thông qua CNTT

Bảng 1: Cho thấy kho d liệu khác vi hệ thống tác nghiệp như thế nào về cách sử dụng

và giá trị Ngưi dng vào KDL để :

• Tự tìm kiếm thông tin trong KDL

• Điều hướng thông qua các nội dung và xác định những gì họ muốn tìm • Xây dựng các truy vấn của riêng họ và chạy các truy vấn đó

• Định dạng các báo cáo của riêng mình → chạy các báo cáo đó → nhận kết quả• Một số sử dụng các truy vấn được xác định trước và các báo cáo được định dạng sẵn

• Lướt qua các nội dung và thực hiện phân tích của riêng mình, quan sát dữ liệu theo nhiều cách khác nhau

• Ngưi dng có thể chạy các truy vấn và các báo cáo khác nhau, không lặp lại các truy vấn hoặc báo cáo trước đó

⇒ KDL là nơi mà ngưi dng có thể tự do tạo các truy vấn và báo cáo riêng của họ Việc phân phối thông tin của KDL nhằm mục đích tương tác

So sánh kiểu sử dụng kho dữ liệu này với cách một hệ thống tác nghiệp được sử dụng để cung cấp thông tin Bao lâu thì ngưi dng được phép chạy các truy vấn của riêng họ và định dạng các báo cáo của riêng họ từ một hệ thống tác nghiệp? Ngưi dng hầu như ko bao gi được phép chạy các truy vấn của riêng họ và định dạng các báo cáo của riêng họ từ một hệ thống tác nghiệp Tương tự như từ một ứng dụng kiểm soát hàng tồn kho (trong hệ thống

Trang 7

tác nghiệp), ngưi dng hầu như không bao gi chạy các truy vấn của riêng họ và tạo các báo cáo của riêng họ Trước hết, vì những cân nhắc về tính hiệu quả, các hệ thống tác nghiệp không được thiết kế để ngưi dng nới lỏng hệ thống, làm mất tính liên kết chặt chẽ của hệ thống Ngưi dng có thể tác động bất lợi đến hiệu suất của hệ thống với các truy vấn mất rất nhiều thi gian để hoàn thành runaway queries Một điểm quan trọng khác là ngưi - dng hệ thống tác nghiệp không biết chính xác nội dung của cơ sở dữ liệu; siêu dữ liệu (metadata) hay mục từ điển dữ liệu/danh mục dữ liệu thưng không có sẵn cho họ Phân tích tương tác, tạo thành nền tảng của việc phân phối thông tin trong KDL, hầu như không bao gi có mặt trong một hệ thống tác nghiệp.

Tóm lại, trong hệ thống tác nghiệp:

• Ngưi dng không thể chạy các truy vấn và báo cáo của riêng mình • Ngưi dng hệ thống tác nghiệp không biết chính xác nội dung của cơ sở dữ liệu; metadata thưng không có sẵn cho họ

• Ngưi dng không thể phân tích tương tác

Giá trị của thông tin từ kho dữ liệu đến ngưi dng thì sao? Làm thế nào để so sánh giá trị của thông tin từ một hệ thống tác nghiệp với giá trị từ kho dữ liệu?

Lấy ví dụ lấy thông tin để phân tích hoạt động kinh doanh Thông tin từ một hệ thống tác nghiệp cho ngưi dng thấy doanh nghiệp đang điều hành công việc kinh doanh hàng ngày tốt như thế nào Giá trị của thông tin từ một hệ thống tác nghiệp cho phép ngưi dng giám sát và kiểm soát các hoạt động hiện tại Mặt khác, giá trị thông tin từ kho dữ liệu cung cấp cho ngưi dng khả năng phân tích các mô hình tăng trưởng về doanh thu, lợi nhuận, mức độ thâm nhập thị trưng và cơ sở khách hàng Dựa trên những phân tích như vậy, ngưi dng có thể đưa ra các quyết định chiến lược để giữ cho doanh nghiệp có tính cạnh tranh và lành mạnh Nhìn vào một lĩnh vực khác của doanh nghiệp, cụ thể là marketing Đối với marketing, giá trị của thông tin từ kho dữ liệu được định hướng cho các vấn đề chiến lược như thị phần, chiến lược phân phối, khả năng dự đoán các kiểu mua của khách hàng và thâm nhập thị trưng Còn giá trị của thông tin từ các hệ thống tác nghiệp Chủ yếu là để theo dõi doanh số bán hàng so với hạn ngạch mục tiêu và để cố gắng thu hút khách hàng quay lại.

Trang 8

Có thể thấy rằng cách sử dụng thông tin và giá trị của thông tin từ kho dữ liệu khác với thông tin từ các hệ thống tác nghiệp Ý nghĩa của sự khác biệt là gì? Trước hết, vì có sự khác biệt nên khi là một chuyên gia IT, bạn không nên cố gắng áp dụng các nguyên tắc cung cấp thông tin từ các hệ thống tác nghiệp vào kho dữ liệu Việc cung cấp thông tin từ kho dữ liệu có sự khác biệt rõ rệt Cần rất nhiều các phương pháp khác nhau Nên lưu ý nghiêm túc về bản chất tương tác của việc cung cấp thông tin từ kho dữ liệu Ngưi dng phải tự thu thập thông tin và thực hiện phân tích từ dữ liệu trong kho dữ liệu một cách có tương tác mà không cần sự hỗ trợ của IT Nhân viên IT mà hỗ trợ ngưi dng về kho dữ liệu, không thực hiện truy vấn, báo cáo cho ngưi dng; ngưi dng tự làm điều đó Vì vậy, hãy làm cho thông tin từ kho dữ liệu dễ dàng và sẵn sàng có sẵn cho ngưi dng theo cách riêng của họ

Được thiết kế để hỗ trợ xử lý giao dịch khối lượng lớn.

Thưng được thiết kế để hỗ trợ xử lý phân tích khối lượng lớn (tức là OLAP).

Dữ liệu trong các hệ thống tác nghiệp chủ yếu được cập nhật thưng xuyên (thêm, xóa, sửa) theo nhu cầu.

Dữ liệu bất biến, dữ liệu mới có thể được thêm thưng xuyên Sau khi được thêm vào hiếm khi thay đổi.

Nó được thiết kế cho giao dịch và quy trình kinh doanh ở thi gian thực.

Nó được thiết kế để phân tích các biện pháp kinh doanh theo lĩnh vực chủ đề, danh mục và thuộc tính.

Nó được tối ưu hóa cho một tập hợp các giao dịch đơn giản, thưng thêm hoặc ruy xuất tmột hàng duy nhất tại mỗi bảng.

Nó được tối ưu hóa cho các tải trọng và các truy vấn cao, phức tạp, không thể đoán trước mà truy cập nhiều hàng trên mỗi bảng.

Trang 9

Nó được tối ưu hóa để xác thực thông tin đến trong các giao dịch, sử dụng các bảng dữ liệu xác thực.

Được tải với thông tin nhất quán, hợp lệ, không yêu cầu xác thực thi gian thực.

Nó hỗ trợ hàng ngàn khách hàng đồng thi Nó hỗ trợ một vài khách hàng đồng thi liên quan đến OLTP.

Được tối ưu hóa để thực hiện chèn và cập nhật nhanh chóng các khối lượng dữ liệu nhỏ liên kết.

Thưng được tối ưu hóa để thực hiện truy xuất nhanh khối lượng dữ liệu tương đối cao.

Số lượng dữ liệu được truy cập ít hơn Số lượng lớn dữ liệu được truy cập

Cơ sở dữ liệu quan hệ được tạo để xử lý giao dịch trực tuyến (OLTP)

Kho dữ liệu được thiết kế để xử lý phân tích trực tuyến (OLAP)

Bảng 2: So sánh H ệ thống tác nghi p và KDL.

2 Tiềm năng thông tin:

Trước khi xem xét các loại ngưi dng khác nhau và nhu cầu thông tin của họ, chúng ta cần đánh giá cao tiềm năng to lớn của kho dữ liệu đối với hoạt động kinh doanh thông minh (BI) Bởi vì tiềm năng to lớn này nên ta cần quan tâm đúng mức đến việc phân phối thông tin từ kho dữ liệu Chúng ta không thể xem xét việc phân phối thông tin theo một cách đặc biệt trừ khi chúng ta nhận thức đầy đủ tầm quan trọng về việc kho dữ liệu đóng vai trò then chốt như thế nào trong quản lý tổng thể của một doanh nghiệp

Trang 10

2.1 Quản lý doanh nghiệp tổng thể:

Ở mỗi doanh nghiệp, có 3 quy trình riêng biệt chi phối việc quản lý tổng thể Đầu tiên, doanh nghiệp tham gia vào việc lập kế hoạch Tiếp theo, thực hiện các kế hoạch diễn ra Và cuối cng đánh giá kết quả thực hiện

VD: Công ty bạn đang xem xét kế hoạch mở rộng sang một thị trưng địa lý cụ thể Giả sử công ty đó muốn tăng thị phần ở khu vực Tây Bc Bây gi kế hoạch này được tiến hành thực thi bằng các chiến dịch quảng cáo, dịch vụ được cải thiện và tiếp thị ty chỉnh Sau khi kế hoạch được thực hiện, công ty ca bạn muốn thấy kết quả ca các chiến dịch quảng cáo

và các sáng kiến tiếp thị Đánh giá kết quả quyết định hiệu quả ca các chiến dịch Dựa trên

việc đánh giá kết quả, nhiều kế hoạch có thể được thực hiện để thay đổi thành phần ca các chiến dịch hoặc triển khai thêm các chiến dịch khác Chu trnh lập kế hoạch, thực hiện và đánh giá vẫn tiếp tục.

Hình 1: Vòng lặp kế hoạch– thực hiện – đánh giá.

Kho dữ liệu, với tiềm năng thông tin chuyên biệt, rất ph hợp với vòng lặp kế hoạch – thực hiện – đánh giá này Kho dữ liệu với thành phần BI của nó, báo cáo về quá khứ và giúp lập kế hoạch cho tương lai Đầu tiên, kho dữ liệu hỗ trợ lập kế hoạch Sau khi các kế hoạch được thực hiện, kho dữ liệu được sử dụng để đánh giá hiệu quả của việc thực hiện.

Trang 11

Quay lại ví dụ về công ty của bạn muốn mở rộng ở khu vực phía tây bắc Ở đây, việc lập kế hoạch bao gồm việc xác định các phân khúc khách hàng thích hợp trong khu vực đó và cũng xác định các sản phẩm cần tập trung vào Kho dữ liệu của bạn có thể được sử dụng một cách hiệu quả để phân tách và xác định các phân khúc khách hàng tiềm năng và các nhóm sản phẩm cho mục đích lập kế hoạch Khi kế hoạch được thực hiện với các chiến dịch quảng cáo, kho dữ liệu của bạn sẽ giúp ngưi dng đánh giá và phân tích kết quả của các chiến dịch Ngưi dng của bạn có thể phân tích kết quả theo sản phẩm và theo các quận riêng lẻ ở khu vực tây bắc Họ có thể so sánh doanh số bán hàng với các mục tiêu đặt ra cho các chiến dịch quảng cáo hoặc so với doanh số bán hàng của năm trước hoặc so với mức trung bình của ngành Ngưi dng có thể ước tính mức tăng trưởng trong thu nhập nh vào các chiến dịch quảng cáo Việc đánh giá sau đó có thể dẫn đến việc lập kế hoạch và thực hiện tiếp theo Vòng lập kế hoạch –thực hiện–đánh giá này rất quan trọng cho sự thành công của một doanh nghiệp.

2.2 Tiềm năng thông tin cho các lĩnh vực kinh doanh (information potential for business areas):

Một số lĩnh vực chung của doanh nghiệp nơi kho dữ liệu có thể hỗ trợ trong các giai đoạn lập kế hoạch và đánh giá của vòng quản lý.

Tăng trưởng khả năng sinh lời

Để tăng lợi nhuận, nhà quản lý phải hiểu làm thế nào để lợi nhuận gắn liền với dòng sản phẩm, thị trưng và dịch vụ Nhà quản lý phải hiểu rõ về những dòng sản phẩm và thị trưng nào tạo ra khả năng sinh li cao hơn Kinh doanh thông minh (BI) từ kho dữ liệu là lý tưởng để lập kế hoạch tăng trưởng lợi nhuận và đánh giá kết quả khi các kế hoạch được thực hiện.

Marketing chiến lược

Kho dữ liệu có tiềm năng thông tin tuyệt vi cho marketing chiến lược bằng cách cung cấp một kho lưu trữ tập trung của tất cả các dữ liệu thị trưng và khách hàng có liên quan Dữ liệu này có thể được sử dụng để hiểu rõ hơn về hành vi, sở thích và xu hướng của khách hàng, sau đó có thể thông báo cho những chiến lược tiếp thị và ra quyết định

Trang 12

VD: D liệu từ các tương tác ca khách hàng trên các kênh khác nhau có thể được phân tích để xác định các mẫu và sở thích và thông tin này có thể được sử dụng để tạo các chiến dịch marketing được nhm mục tiêu và cá nhân hóa Ngoài ra, d liệu từ các giao dịch bán hàng và tài chính có thể được sử dụng để đánh giá hiệu quả ca các sáng kiến tiếp thị và đưa ra quyết định dựa trên d liệu về nơi phân bổ các nguồn lực tiếp thị Khả năng truy cập, phân tích và tận dụng sự giàu có ca thông tin này trong kho d liệu cung cấp tiềm

năng thông tin tuyệt vi cho tiếp thị chiến lược, giúp các công ty đưa ra quyết định sáng

suốt và đi trưc đối th.

Một số lợi ích của KDL trong marketing• Tạo ra nguồn dữ liệu tập trung

DWH có tác dụng giảm bớt khó khăn trong quá trình lấy thông tin bằng cách tập hợp thành nguồn dữ liệu duy nhất Giúp nhà tiếp thị xử lý các đo lưng quan trọng như CAC, ROI, ROAS.

• Toàn quyền sở hữu lịch sử Data

Thay vì lệ thuộc vào các nền tảng khác, DW cho phép bảo mật thông tin từ các kênh ở một nơi duy nhất.

Khả năng toàn quyền truy cập và lịch sử kho dữ liệu marketing, giúp nhà tiếp thị lấy được chính xác những thông tin cần thiết phục vụ cho chiến dịch trong tương lai.

• Không mất nhiều chi phí bảo trì mà vẫn đảm bảo độ linh hoạt thông tin Với hệ thống kho lưu trữ dữ liệu đám mây, thì chi phí lưu trữ là khá rẻ, và hoàn toàn có đủ khả năng lưu trữ lớn.

Trang 13

Kho dữ liệu lưu trữ đám mây cũng không yêu cầu nhiều chi phí bảo trì, vì nhà cung cấp sẽ đảm nhận việc bảo trì đó, bạn chỉ cần trả cho tài nguyên sử dụng.

Quản trị mối quan hệ với khách hàng

Đề cập đến khả năng hỗ trợ việc quản lý hiệu quả và hiệu quả các mối quan hệ khách hàng bằng cách cung cấp một kho lưu trữ dữ liệu khách hàng tập trung Dữ liệu này có thể được sử dụng để thông báo các quyết định chính liên quan đến bán hàng, tiếp thị và dịch vụ khách hàng, dẫn đến cải thiện trải nghiệm của khách hàng và tăng lợi nhuận Kho dữ liệu có thể tổng hợp dữ liệu từ nhiều nguồn, bao gồm các hệ thống giao dịch, tương tác của khách hàng và các chiến dịch tiếp thị, để cung cấp một cái nhìn toàn diện về mỗi khách hàng

Bằng cách tận dụng tiềm năng thông tin của kho dữ liệu, các công ty có thể cải thiện tính chính xác và mức độ liên quan của dữ liệu khách hàng của họ, dẫn đến việc ra quyết định hiệu quả hơn và cải thiện kết quả của khách hàng Ngoài ra, kho dữ liệu có thể hỗ trợ phân tích và báo cáo dữ liệu, cho phép các tổ chức hiểu rõ hơn về hành vi và sở thích của khách

hàng để xác định xu hướng và cơ hội VD: Phân khúc KH, cá nhân hóa, Mô hình Marketing

Mix, cross selling và up- -selling, Sự mua hàng của doanh nghiệp

Ban quản lý có thể thấy bức tranh tổng thể về các mô hình mua hàng trong toàn công ty từ Kho dữ liệu Đây là nơi tất cả dữ liệu về các sản phẩm và nhà cung cấp được thu thập sau khi dữ liệu được tích hợp từ các hệ thống nguồn

Kho dữ liệu trao quyền cho ban quản lý doanh nghiệp lập kế hoạch sắp xếp hợp lý hóa các quy trình mua hàng.

Nhận ra sự tiềm năng của thông tin

Kho dữ liệu cho phép ngưi dng xem dữ liệu trong bối cảnh kinh doanh ph hợp (Các hệ thống tác nghiệp khác nhau thu thập số lượng lớn các dữ liệu về nhiều loại giao dịch kinh doanh Nhưng các hệ thống tác nghiệp này không trực tiếp hữu ích cho việc lập kế hoạch và đánh giá kết quả Ngưi dng cần đánh giá kết quả bằng cách xem dữ liệu trong bối cảnh kinh doanh ph hợp.)

Trang 14

Ví dụ: khi xem doanh số bán hàng ở khu vực Tây Bc, ngưi dng cần xem doanh số bán hàng trong bối cảnh kinh doanh về địa lý, sản phẩm, khuyến mãi và thi gian Kho d liệu được thiết kế để phân tích các chỉ số, chẳng hạn như doanh số bán hàng cng vi nhng đo lưng này(về địa lý, sản phẩm, khuyến mãi và thi gian) Ngưi dng có thể truy xuất d liệu, biến nó thành thông tin hu ích và tận dụng thông tin để lập kế hoạch và đánh giá kết quả.

Ngưi dng tương tác với kho dữ liệu để lấy dữ liệu, biến nó thành thông tin hữu ích và thấy rõ toàn bộ tiềm năng Sự tương tác này của ngưi dng thưng trải qua 6 giai đoạn được chỉ ra trong Hình và được tóm tắt dưới đây.2

Hnh 2: Sự tương tác ca ngưi dng v i kho d  liệu

1 Cân nhắc kỹ càng về nhu cầu kinh doanh và xác định nó theo các quy tắc kinh doanh áp dụng được cho dữ liệu trong kho dữ liệu

2 Thu thập hoặc chọn tập hợp con dữ liệu ph hợp theo các quy tắc kinh doanh đã quy định

3 Làm phong phú tập hợp con đã chọn bằng các phép tính như tính tổng hoặc tính trung bình Áp dụng phép chuyển đổi để dịch mã sang thuật ngữ kinh doanh

Trang 15

4 Sử dụng siêu dữ liệu (metadata) để liên kết dữ liệu đã chọn với ý nghĩa kinh doanh của nó

5 Kết cấu kết quả theo định dạng hữu ích cho ngưi dng

6 Trình bày thông tin có cấu trúc theo nhiều cách khác nhau, bao gồm bảng, văn bản, đồ thị và biểu đồ

3 Giao diện thông tin người dùng:

Để vượt qua được 6 giai đoạn và nhận ra tiềm năng thông tin của kho dữ liệu, bạn phải xây dựng một giao diện chắc chắn để cung cấp thông tin cho ngưi dng Giao diện phải có khả năng cho phép ngưi dng nhận ra tiềm năng thông tin đầy đủ của kho dữ liệu.

Giao diện hợp lý phải nằm ở giữa KDL và ngưi dng cuối, cho phép cung cấp thông tin cho ngưi dng Giao diện có thể là một bộ công cụ và quy trình cụ thể, ph hợp với môi trưng của bạn Sau đây là các đặc điểm chung của giao diện thông tin ngưi dng.

3.1 Chế độ sử dụng thông tin:

Khi xem xét tất cả các cách khác nhau mà kho dữ liệu có thể được sử dụng, ta thấy tất cả việc sử dụng đều có 2 chế độ hoặc cách cơ bản Cả 2 chế độ đều liên quan đến việc đạt được BI

• Chế độ Khám phá

Khi sử dụng kho dữ liệu trong chế độ khám phá, nhà phân tích kinh doanh không sử dụng giả thuyết được xác định trước Ngưi dng thưng không có bất kỳ khái niệm hoặc giả

Trang 16

thuyết định sẵn nào về những gì bộ kết quả sẽ chỉ ra Các ứng dụng khai thác dữ liệu với nguồn cấp dữ liệu (data feed: Danh sách bài viết, các tin tức, Danh sách sản phẩm, dịch vụ, ) từ kho dữ liệu được sử dụng để ngưi dng khám phá kiến thức.

VD: Trong trưng hợp này, nhà phân tích kinh doanh mong muốn khám phá các kiểu

hành vi mi ca khách hàng hoặc nhu cầu sản phẩm

Tóm lại, Ngưi dng tương tác với kho dữ liệu để lấy thông tin hoặc ở chế độ xác minh giả thuyết hoặc ở chế độ khám phá kiến thức Vậy các cách tiếp cận để tương tác là gì? Nói cách khác, ngưi dng có tương tác với kho dữ liệu theo cách tiếp cận thông tin, phương pháp phân tích hay bằng cách sử dụng các kỹ thuật khai thác dữ liệu không?

Ngưi dng có thể tương tác với kho dữ liệu theo nhiều cách khác nhau, bao gồm thông qua phương pháp thông tin, phương pháp phân tích hoặc bằng cách sử dụng các kỹ thuật khai thác dữ liệu.

• Phương pháp tiếp cận thông tin

Theo cách tiếp cận này, với các công cụ báo cáo và truy vấn, ngưi dng truy xuất dữ liệu lịch sử hoặc hiện tại và thực hiện một số phân tích thống kê tiêu chuẩn Dữ liệu có thể được tóm tắt một cách nhẹ nhàng hoặc nặng nề Các tập hợp kết quả có thể ở dạng báo cáo và biểu đồ.

• Phương pháp phân tích

Ngưi dng sử dụng kho dữ liệu để thực hiện phân tích Họ thực hiện phân tích theo các khía cạnh kinh doanh bằng cách sử dụng tóm tắt lịch sử hoặc dữ liệu chi tiết Ngưi dng doanh nghiệp tiến hành phân tích bằng các thuật ngữ kinh doanh của riêng họ Cách tiếp cận này thưng được sử dụng để phân tích sâu và giải quyết vấn đề Phân tích phức tạp hơn bao gồm drill down, roll up, or slice and dice.

• Phương pháp khai phá dữ liệu

Cả hai cách tiếp cận thông tin và phân tích đều có tác dụng trong chế độ xác minh Tuy nhiên, phương pháp khai thác dữ liệu hoạt động trong chế độ khám phá kiến thức.

Trong thực tế, nhiều tổ chức sử dụng kết hợp các phương pháp này để tận dụng tối đa tiềm năng thông tin của kho dữ liệu của họ

Trang 17

Thông thưng, thông tin có sẵn thông qua giao diện thông tin ngưi dng có các đặc điểm sau:

• Thông tin được xử lý trước

Chúng bao gồm thông tin thưng xuyên được tạo tự động và sẵn sàng sử dụng Báo cáo phân tích bán hàng hàng tháng và hàng quý, báo cáo tóm tắt và biểu đồ thông thưng thuộc loại này Ngưi dng chỉ cần sao chép thông tin đã được xử lý trước đó.

• Truy vấn và báo cáo được xác định trước

Đây là một tập hợp các mẫu truy vấn và định dạng báo cáo luôn sẵn sàng cho ngưi dng Ngưi dng áp dụng các tham số thích hợp và chạy các truy vấn và báo cáo khi cần Đôi khi, ngưi dng được phép thực hiện các sửa đổi nhỏ đối với các mẫu và định dạng.

• Xây dựng Ad hoc

Ngưi dng tạo các truy vấn và báo cáo của riêng họ bằng các công cụ thích hợp được cung cấp bởi DW Danh mục này thừa nhận thực tế là không phải mọi nhu cầu của ngưi dng đều có thể đoán trước được Nói chung, chỉ những ngưi dng có quyền và một số ngưi dng thông thưng tạo các truy vấn và báo cáo của riêng họ.

Cách tiếp cận này cho phép ngưi dng tạo báo cáo và truy vấn ph hợp với các yêu cầu duy nhất của họ và nó đặc biệt hữu ích cho ngưi dng thành thạo và ngưi dng thưng xuyên có hiểu biết sâu sắc về dữ liệu và nhu cầu kinh doanh của họ Điều này trái ngược với các báo cáo và truy vấn được xác định trước, có thể không đáp ứng nhu cầu cụ thể của tất cả ngưi dng.

Xây dựng Ad hoc cho phép tính linh hoạt và ty chỉnh cao hơn trong phân tích và báo cáo dữ liệu, điều này có thể dẫn đến sự hiểu biết tốt hơn về dữ liệu và ra quyết định sáng suốt hơn.

Cuối cng, chúng ta hãy liệt kê các tính năng thiết yếu cần thiết cho giao diện thông tin ngưi dng Giao diện phải:

• Dễ sử dụng, trực quan và lôi cuốn ngưi dng.

• Hỗ trợ khả năng thể hiện rõ ràng nhu cầu kinh doanh.

Trang 18

• Chuyển đổi nhu cầu được bày tỏ thành một bộ quy tắc kinh doanh chính thức.

• Có thể lưu trữ các quy tắc này để sử dụng trong tương lai.

• Cung cấp cho ngưi dng khả năng sửa đổi các quy tắc đã truy xuất.

• Chọn, thao tác và chuyển đổi dữ liệu theo quy tắc kinh doanh.

• Có một bộ công cụ thao tác và chuyển đổi dữ liệu.

• Liên kết chính xác với bộ lưu trữ dữ liệu để truy xuất dữ liệu đã chọn.

• Có thể liên kết với siêu dữ liệu.

• Có khả năng định dạng và cấu trúc đầu ra theo nhiều cách khác nhau, cả văn bản và đồ họa.

• Có phương tiện xây dựng quy trình thực hiện các bước cụ thể.• Có cơ sở quản lý thủ tục

4 Các ứng dụng trong ngành của data warehouse:

Hầu như mọi doanh nghiệp kinh doanh bất kể dịch vụ, sản phẩm nào cũng đều cần đến Data Warehouse do tính đa dụng, thiết thực cao của nền tảng này, các lĩnh vực cần ứng dụng kho dữ liệu cao như:

• Sản xuất: Quản lý dịch vụ và bảo hành, kiểm soát chất lượng sản phẩm, thực hiện đơn hàng và phân phối, tích hợp nhà cung cấp và hậu cần

• Bán lẻ: quản lý các mặt hàng nhập xuất, quản lý chuỗi cung ứng, nhà cung cấp sản phẩm Dựa trên thông tin thu thập để lên chiến lược bán hàng hiệu quả, lên các chiến dịch quảng cáo đánh trúng tâm lý khách hàng

• Tài chính ngân hàng: quản lý các nguồn quỹ đầu tư, quỹ dự trữ, vay vốn, lãi suất và thi hạn thanh toán của từng cá nhân, tổ chức

• Hàng không: tạo ra hệ thống quản lý tất cả công việc liên quan hàng không từ quản lý lịch trình bay, số hiệu máy bay trong thi gian vận hành đến phân công phi hành đoàn, quản lý các chương trình ưu đãi cho khách hàng

Trang 19

• Bảo hiểm: phân tích xu hướng khách hàng dựa trên khối dữ liệu thu thập, theo dõi biến động thị trưng một cách nhanh chóng để đề ra các biện pháp đối phó • Y dược: quản lý thông tin bệnh nhân, bệnh án, phác đồ điều trị, thi gian trị bệnh dự

kiến, thuốc kê theo đơn

• Giáo dục: quản lý thông tin của giáo viên , sinh viên, và nhân công tại trưng, quản lý quá trình học tập của học sinh, giáo án và bài giảng của giáo viên Từ đó đưa ra các chiến lược dạy học hiệu quả Ngoài ra Data Warehouse cũng là nền tảng của các phần mềm dạy học hiện nay

• Thương mại điện tử: lĩnh vực dễ nhận thấy sự ứng dụng nhất của kho dữ liệu doanh nghiệp Hệ thống giúp quản lý thông tin hàng hóa, ngưi bán, ngưi mua, tình trạng đơn hàng và các chương trình khuyến mãi đang và sắp diễn ra

5 Ai nên cần sử dụng kho dữ liệu Data Warehouse ?

Ngưi sử dụng Data Warehouse thưng thuộc những nhóm sau:

• Ngưi dựa vào khối lượng dữ liệu phân tích để đưa ra quyết định, có thể là chủ doanh nghiệp

• Ngưi sử dụng các quy trình phức tạp, có thể ty biến cho ph hợp bản thân để lấy dữ liệu đa nguồn

• Những ngưi có mục đích sử dụng đơn giản như truy cập dữ liệu • Những ngưi muốn đưa ra quyết định dựa trên cách tiếp cận có hệ thống • Những ngưi cần một khối dữ liệu khổng lồ để thiết lập các báo cáo, bảng biểu với

hiệu suất cao thì Data Warehouse là lựa chọn đúng đắn

• Tìm hiểu Data Warehouse là bước đầu tiên để tìm ra, khám phá các mẫu ẩn của

nguồn dữ liệu nhóm, tổ chức

Trang 20

II Ai sẽ là người sử dụng thông tin ? 1 Các lớp người dùng:

Mỗi ngưi dng trong kho dữ liệu đang thực hiện một chức năng kinh doanh cụ thể và cần thông tin để hỗ trợ trong chức năng của công việc đó Và để làm cho cơ chế phân phối thông tin ph hợp nhất với môi trưng công việc, chúng ta cần có sự hiểu biết thấu đáo về các lớp ngưi dng

Hình 3 cho thấy cách phân loại ngưi dng được thông qua bởi nhiều chuyên gia lưu trữ dữ liệu và những ngưi hành nghề Hình này cho thấy 5 lớp ngưi dng rộng Trong mỗi lớp, hình chỉ ra các đặc điểm cơ bản của ngưi dng trong lớp đó Hình này cũng chỉ định ngưi dng trong hệ thống phân cấp tổ chức cho các lớp cụ thể Khi bạn quan sát mức độ thành thạo tin học, cấp độ tổ chức, yêu cầu thông tin hoặc thậm chí tần suất sử dụng, bạn có thể dễ dàng xác định ngưi dng thuộc về một trong các nhóm này Điều đó sẽ giúp bạn đáp ứng nhu cầu của mỗi ngưi dng một cách dễ dàng hơn

Hình 3: Phân lp ngưi dng Data Warehouse

Trang 21

• Nhóm thứ nhất, Tourists: là các nhà điều hành, họ quan tâm đến các chỉ số trong kinh doanh

• Nhóm thứ hai, Operaters: là các nhân viên hỗ trợ, họ quan tâm đến dữ liệu hiện tại • Nhóm thứ ba, Farmers: là các nhà phân tích, họ quan tâm đến phân tích thưng xuyên • Nhóm thứ tư, Explorers: là các nhà phân tích có tay nghề cao, họ chủ yếu phân tích

Bây gi chúng ta hãy áp dụng câu chuyện du lịch vào kho dữ liệu Một giám đốc điều hành cấp cao đến kho dữ liệu để biết thông tin giống như một khách du lịch đến thăm một nơi thú vị và hữu ích Giám đốc điều hành có một quan điểm kinh doanh rộng rãi và biết về nội dung thông tin tổng thể của kho dữ liệu Tuy nhiên, giám đốc điều hành không có thi gian để duyệt qua kho dữ liệu chi tiết mà chỉ quan tâm đến các chỉ số quan trọng cụ thể Đây giống như việc lựa chọn các địa điểm để ghé thăm Giám đốc điều hành muốn kiểm tra các chỉ số chính và nếu tìm thấy điều gì đó thú vị về bất kỳ chỉ số nào trong số đó, giám đốc điều hành muốn dành thêm thi gian để khám phá thêm Khách du lịch đã xác định trước

Trang 22

những kỳ vọng về mỗi địa điểm được ghé thăm Nếu một địa điểm khác với những kỳ vọng này, khách du lịch muốn xác định lý do tại sao Tương tự như vậy, nếu giám đốc điều hành thấy các chỉ số không ph hợp, thì cần phải điều tra thêm

Qua đó, chúng ta có thể tóm tắt về những gì mà nhóm ngưi dng được phân loại là Tourists cần từ kho dữ liệu, sẽ bao gồm:

• Trạng thái của các chỉ số trong các khoảng thi gian như vài tuần/ vài tháng tuỳ doanh nghiệp

• Khả năng xác định các mục quan tâm mà không gặp bất kỳ khó khăn nào • Lựa chọn những gì cần thiết một cách dễ dàng nhất mà không lãng phí thi gian • Khả năng chuyển nhanh chóng từ một chỉ số quan tâm này sang chỉ số khác • Bất cứ khi nào cần, thông tin bổ sung sẽ dễ dàng có sẵn về các chỉ số chính đã chọn

cho các khoảng thi gian khám phá định kỳ tiếp theo

2.2 Nhóm Operators:

Ngưi vận hành quan tâm đến dữ liệu hiện tại ở cấp độ chi tiết và họ thực sự là ngưi theo dõi hiệu suất hiện tại Các nhà quản lý bộ phận, quản lý tuyến và giám sát bộ phận đều có thể được phân loại là ngưi vận hành

Ngưi vận hành quan tâm đến hiệu suất và vấn đề của hiện tại, họ không quan tâm đến dữ liệu trong quá khứ Là ngưi dng của các hệ thống OLTP hệ thống tác nghiệp, họ - mong đợi thi gian phản hồi nhanh và truy cập nhanh vào các dữ liệu chi tiết Làm thế nào họ có thể giải quyết nút thắt hiện tại trong hệ thống phân phối sản phẩm? Các phương thức vận chuyển thay thế hiện có là gì và nhà kho nào sắp hết hàng? Họ quan tâm đến những câu hỏi liên quan đến các tình huống hiện tại giống như thế

Có thể tóm tắt về những gì nhóm Operators cần sau đây: • Câu trả li ngay lập tức dựa trên dữ liệu hiện tại đáng tin cậy • Trạng thái hiện tại của các chỉ số hiệu suất - KPI

• Dữ liệu hiện hành nhanh nhất có thể với các bản cập nhật hàng ngày hoặc thưng xuyên hơn từ các hệ thống nguồn

Trang 23

• Truy cập nhanh vào các thông tin rất chi tiết • Phân tích nhanh các dữ liệu mới nhất.• Giao diện thông tin đơn giản và dễ hiểu

2.3 Nhóm Farmers:

Hãy xem xét một vài đặc điểm của nông dân Họ rất quen thuộc với địa hình Họ biết chính xác những gì họ muốn về cây trồng Họ biết cách sử dụng các công cụ, làm việc trên các cánh đồng và thu nhận kết quả Họ cũng biết giá trị cây trồng của họ Bây gi nối các đặc điểm này với danh mục ngưi dng kho dữ liệu được phân loại là nông dân - các nhà phân tích

Thông thưng, các loại nhà phân tích khác nhau trong một doanh nghiệp có thể được phân loại là nông dân Những ngưi này có thể là nhà phân tích kỹ thuật, nhà phân tích về tiếp thị, bán hàng hoặc tài chính, Các nhà phân tích này có các yêu cầu tiêu chuẩn Các yêu cầu có thể bao gồm ước tính lợi nhuận theo sản phẩm hoặc phân tích doanh số bán hàng hàng tháng Yêu cầu hiếm khi thay đổi Chúng có thể dự đoán được và thưng xuyên

Có thể tóm tắt về những gì nhóm Famers tức là các nhà phân tích cần sau đây: • Dữ liệu chất lượng được tích hợp đúng cách từ các hệ thống nguồn • Khả năng chạy các truy vấn dự đoán dễ dàng và nhanh chóng • Khả năng chạy các báo cáo định kỳ

• Khả năng có được các loại thông tin tương tự trong khoảng thi gian có thể dự đoán được

• Bộ kết quả chính xác và quy mô nhỏ hơn so với dữ liệu ban đầu

• Chủ yếu là dữ liệu hiện tại với các so sánh đơn giản so với dữ liệu trong quá khứ

2.4 Nhóm Explorers:

Các nhà thám hiểm không có cách thức để tìm kiếm thông tin Họ có xu hướng đi đến nơi rất ít ngưi khác mạo hiểm Họ thưng kết hợp thăm dò ngẫu nhiên với việc nghiên cứu không thể đoán trước Các nghiên cứu có thể nhiều lần không dẫn đến bất kỳ kết quả nào,

Trang 24

nhưng có một số ít khai thác được các mẫu hữu ích và kết quả bất thưng tạo ra các mẩu thông tin quý giá Vì vậy, các nhà thám hiểm tiếp tục cuộc tìm kiếm không ngừng nghỉ của mình, sử dụng các quy trình phi tiêu chuẩn và các phương pháp không chính thống

Trong một doanh nghiệp, các nhà nghiên cứu và các nhà phân tích kỹ thuật có tay nghề cao có thể được phân loại là nhà thám hiểm Những ngưi dng này sử dụng kho dữ liệu một cách rất ngẫu nhiên Tần suất sử dụng của họ không cố định Các truy vấn được thực hiện bởi các nhà thám hiểm có xu hướng bao gồm các khối dữ liệu lớn Những ngưi dng này làm việc với rất nhiều dữ liệu chi tiết để phân biệt các mẫu mong muốn Những kết quả này là khó nắm bắt, nhưng các nhà thám hiểm tiếp tục cho đến khi họ tìm thấy các mô hình và mối quan hệ

Như trong các trưng hợp khác, chúng ta có thể tóm tắt về những gì nhóm Explorers là các nhà phân tích có tay nghề cao cần sau đây:

• Hoàn toàn không thể đoán trước – và có thể truy vấn ad hoc phức tạp.• Khả năng truy xuất khối lượng lớn dữ liệu chi tiết để phân tích • Khả năng thực hiện phân tích phức tạp

• Cung cấp cho các truy vấn và phân tích không có cấu trúc, hoàn toàn mới và sáng tạo

• Các phiên phân tích kéo dài và diễn ra theo đợt

2.5 Nhóm Miners:

Hãy liên tưởng đến những ngưi đào vàng để khám phá những mỏ vàng quý giá có giá trị lớn Ngưi dng được phân loại là ngưi khai thác - các nhà phân tích mục đích đặc biệt cũng hoạt động theo cách tương tự

Trong một doanh nghiệp, họ là những nhà phân tích mục đích đặc biệt với đào tạo và kỹ năng chuyên môn cao Nhiều doanh nghiệp không có ngưi khai thác dữ liệu có thể sử dụng các chuyên gia tư vấn bên ngoài cho các dự án khai thác dữ liệu cụ thể Nhà khai thác dữ liệu áp dụng các kỹ thuật khác nhau và thực hiện phân tích chuyên biệt để phát hiện ra các cụm bản ghi liên quan, ước tính giá trị cho một biến không xác định, nhóm các sản phẩm sẽ được mua cng nhau, v.v

Trang 25

Dưới đây là một bản tóm tắt về nhu cầu của ngưi dng được phân loại là Miners:• Truy cập vào hàng núi dữ liệu để phân tích và khai thác

• Sự sẵn có của khối lượng lớn dữ liệu lịch sử trong nhiều năm trở lại đây

• Khả năng nhận thấy được các mối tương quan có ý nghĩa dựa trên khối lượng lớn dữ liệu

• Khả năng trích xuất dữ liệu từ kho dữ liệu thành các định dạng ph hợp với các kỹ thuật khai thác đặc biệt

• Khả năng làm việc với dữ liệu ở 2 chế độ: một để chứng minh hoặc bác bỏ một giả thuyết đã nêu, cái còn lại để khám phá các giả thuyết mà không có bất kỳ khái niệm định sẵn nào

3 Làm thế nào để cung cấp thông tin?

Mục tiêu: Cung cấp chính xác cho ngưi dng những gì mà họ muốn trong kho dữ liệu Từ đó ta có giải pháp là cung cấp thông tin cho các lớp ngưi dng dưới ba khía cạnh:

• Yêu cầu kỹ thuật/kiến trúc liên quan đến siêu dữ liệu và giao diện ngưi dùng:

Tourists Operators Farmers Explorers Miners

Giao diện siêu dữ liệu có hỗ trợ tìm kiếm từ khóa (độ chi tiết cao, cho ra kết quả ph hợp giống như mình tra gg á)

Thi gian phản hồi nhanh (kiểu bấm vô nó hiển thị ra liền á, không có bị lag)

Thi gian phản hồi hợp lý

Thi gian phản hồi hợp lý

Kho lưu trữ dữ liệu đặc biệt mà nhận nguồn cấp dữ liệu từ kho

Giao diện ngưi dng hỗ trợ web

Phạm vi dữ liệu lớn (kiểu dữ liệu chi tiết,

Mô hình dữ liệu đa chiều với thuộc tính

Mô hình dữ liệu chuẩn hóa

Mô hình dữ liệu chuẩn

Ngày đăng: 20/06/2024, 16:48

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w