Tổ chức sử dụng hệ thống kinh doanh thông minh BI bao gồm một loạt các công cụ, ứng đụng và phương thức cho phép các tô chức thu thập thông tin từ các hệ thông nội bộ và nguồn bên ngoài;
Khái niệm về kho dữ liệu - 2 5s 2222212111 11271222 rryee 4 3.1.2 Cấu trúc của khoa dữ liệu (Data warehouses)
Kho đữ liệu là một tập hợp các dữ liệu có những đặc điểm sau: tập trung vào một chủ đề, tông hợp từ nhiều nguồn đữ liệu khác nhau, từ nhiều thời gian và không sửa đổi Kho đữ liệu được dùng trong việc hỗ trợ ra quyết định trong công tác quản ly
Ví dụ: Kho đữ liệu có thê cho phép một công ty đễ dàng đánh giá đữ liệu của nhóm bán hàng và giúp đưa ra quyết định về cách cải thiện doanh số hoặc sắp xếp hợp lý hóa các bộ phận Doanh nghiệp có thể chọn tập trung vảo thói quen chỉ tiêu của khách hàng đề định vị tốt hơn sản phâm của mình và tăng doanh SỐ
3.1.2 Cấu trúc của khoa dữ liệu (Data warehouses) Kho dữ liệu có câu trúc gôm ba tâng:
Hình 3 Các thành phần của kho dữ liệu Tầng đáy (Data sourees): là nơi thu thập, tích hợp dữ liệu từ nhiều nguồn khác nhau, sau đó chuẩn hóa về cùng định dạng: làm sạch xử lý dữ liệu để tìm lỗi, sửa chữa và lưu trữ dữ liệu đã tông hợp:
FJ Tầng giữa (Warehouse): cung cấp dịch vụ xử lý phân tích trực tuyến (OLAP — Online Analytical Processing) đề thao tác với kho đữ liệu đã được tích hợp;
Tầng trên cùng (Users): là nơi thực hiện các thao tác truy vấn, báo cáo, phân tích dé tìm ra xu hướng, trung bình, tổng hợp
Các chức năng của kho dữ liệu - - c0 2221222122222 5 3.1.4 — Sự khác biệt giữa kho dữ liệu và cơ sở đữ liệu
hưởng đến doanh nghiệp Từ những nguồn đữ liệu thu thập được, doanh nghiệp có góc nhìn toàn điện cho thị phần nhóm ngành của chính mình, đề từ đó xây dựng chiến lược ngắn hạn, dài hạn
Cưng cấp đây đủ thông tin hiện tại, lịch sử của doanh nghiệp và sẵn sàng cho việc khai thác, sử dụng cho việc hỗ trợ đưa ra các quyết định chiến lược Ví đụ, Thông qua nguồn dữ liệu về nhân sự, doanh thu bán hàng đề đưa ra các kế hoạch cụ thé phát triển, gia tăng đoanh số
Có khả năng cung cấp đữ liệu chỉ tiết theo nhu câu mà không phải truy xuất các hệ thống tác nghiệp Ví dụ, thông qua lịch sử giao dịch đã lưu trữ san dé phan tích mức độ giao dịch Đảm báo thông tin trong kho đữ liệu có tính nhất quán Ví dụ, tên khách hàng có hệ thống tách họ và tên thành hai trường dữ liệu khác nhau, có hệ thống chỉ lưu một trường Khi tổng hợp về kho đữ liệu thì sẽ được chuyên về một dạng thống nhất
Là nguôn thông tin chiến lược mềm đẻo và có tính tương tác Ví dụ, tông hợp doanh số bán hàng của một nhân viên bán hàng theo ngày, theo tuần, thang, nam dé đánh giá chỉ tiêu, năng lực của nhân viên đó cũng như sự bao phủ của sản phẩm bên ngoài thị trường
3.1.4 Sự khác biệt giữa kho dữ liệu và cơ sở dữ liệu 1 Cơ sở dữ liệu: là một hệ thống giao dịch được thiết lập để giám sát và cập nhật đữ liệu thời gian thực đề chỉ có dữ liệu gần đây nhất dùng được
1 Kho dữ liệu: được lập trình đề tổng hợp dữ liệu có cấu trúc trong một khoảng thoi gian.
Đặc điểm của kho dữ liệu 5-55 2 1122111111117 12721 re 5 3.1.6 Lợi ích của Data warehouse .- 2.00 22H HH ng 6 3.1.7 Tiến trình xử lý trong Data warehouse -c co 222222 nà 7 3.2 Siêu thị dữ liệu (Data mart) - 5 QC 2 2221112111121 1111121111118 211tr 8 3.2.1 Khái niệm về Data mart s2 5S S2 221112111171 21221E 2 re 8 3.2.2 Phân loại Data mart . - Q22 122111 121111211 1221112111121 1 12 1k 8 3.2.3 Các bước thực hiện một Data mart - 5-5 22252222 22x22 9 3.2.4 Lợi ích của Dafa maFÍ Ặ Q0 221112221111 122 11122 11122 1tr ưưyn 9 3.3 Sự khác biệt giữa Data warehouses và Data marÉs
[Ì_ Hướng chủ đề (subject-oriented)
Mục đích của kho đữ liệu là phục vụ các yêu cầu phân tích, hoặc khai phá cụ thể được gọi là chủ đề Ví dụ với chủ đề phân tích nhân sự, có thể bao gồm các độ đo về doanh thu của từng người, số ngày nghỉ trong tháng, số dự án tham gia trong tháng, theo các chiều phân tích: thời gian, chi nhánh, sản phẩm cố
LÌ Được tích hợp (mtegrated) Vi du tại một bệnh viện, các phòng khác nhau sẽ thực hiện các xét nghiệm khác nhau Do đó để có được đầy đủ thông tin phục vụ việc chân đoán thì cần thu thập được kết quả từ nhiều nguồn
O C6 gan nhan thoi gian (time variant) Vi du, độ đo doanh thu của một mặt hàng của thang hiện tại, nếu đem so sánh với doanh thu của mặt hàng đó trong tháng trước, tháng này năm trước thì sẽ có nhiều thông tin hơn đề đánh giá doanh thu của mặt hàng đó là tốt hay không, trên cơ sở đó sẽ có các quyết định phù hợp Ngoài ra, đữ liệu lịch sử còn cho phép dự báo được tương lai khi ứng dụng khai phá dữ liệu
Bất biến (non-volatile) Dữ liệu trong kho dữ liệu có chức năng báo cáo lại các chỉ số về hoạt động kinh doanh thực tế đã xảy ra Do đó dữ liệu trong kho dữ liệu không thé cap nhat, thay đôi vì nó sẽ không phản ánh đúng thực tế Do đó với kho đữ liệu chỉ có hai thao tác chính là tải đữ liệu vào kho và truy cập (đọc) đữ liệu từ kho
Ví dụ, hệ thống quản lý các công việc hàng không như quản lý tuyến bay, lich bay, phân công phi hành đoàn, quản lý các chương trình ưu đãi dành cho khách hàng,
là những đữ liệu đã được cập nhật nên không thê thay đôi lịch sử hoạt động của nó
3.1.6 Lợi ích của Data warehouse L¡ Tích hợp đữ liệu vào một nguồn, ở cùng một định đạng, giải quyết sự phân mảnh và mắt cân bằng dữ liệu đề đáp ứng nhu cầu thông tin của tất cả người dùng;
O Tiết kiệm thời gian và hiệu quả trong việc tìm kiếm đữ liệu cần thiết:
LI Thông qua xử lý và phân tích đữ liệu, Data warehouse giúp cho dữ liệu của doanh nghiệp hiệu quả hơn;
E Giúp người dùng đưa ra các quyết định hợp lý, nhanh chóng và hiệu quả, đem lại nhiêu lợi nhuận hơn ;
LÌ Giúp tô chức, xác định, quản lý và thực hiện các dự án/hoạt động một cách hiệu quả và chính xác; ¡ Tăng đáng kế lượng dữ liệu cần được tông hợp, lưu trữ và xử lý
3.1.7 Tiến trình xử lý trong Data warehouse Bước L: Dữ liệu được tập hợp từ nhiều nguồn và đưa vào Data sources đề đồng bộ định dạng, biên soạn; sau đó sẽ là quá trình làm sạch dữ liệu; tìm kiếm đề sửa hay loại bỏ bất kỳ lỗi nào trong dữ liệu nhằm đảm bảo tính nhất quản của dữ liệu trước khi đưa vào warehouse
Bước 2: Dữ liệu sau khi trải qua nhiều thao tác ở tầng Data sources sẽ được chuyền từ định dạng cơ sở dữ liệu sang định dạng kho dữ liệu Sau đó tại tầng warehouse, đữ liệu sẽ được sắp xếp, hợp nhất và tông kết, nhằm đảm bảo quá trình phân phối và xử lý dữ liệu diễn ra trơn tru và mượt mà hơn
Bước 3: Dữ liệu được phân bổ đến người dùng cuối khi có thao tác tìm kiếm, truy van và xuất báo cáo Trong bước này có nhiều công cụ đề thực hiện nhăm giúp dữ liệu được xử lý gọn gàng và đễ nhìn hơn trước khi hiến thị đến người dùng cuối
Ví dụ: Nhờ có kho dữ liệu, bộ phận bán hàng có thê có những thông tin về nhụ cầu, đặc điểm của khách hàng và giúp đưa ra quyết định về cách cải thiện doanh số hoặc sắp xếp quy trình hay phân công nhiệm vụ rõ ràng trong bộ phận kinh doanh Đặc biệt với khả năng lưu trữ ưu việt của mình, kho đữ liệu có thê có tất cả các thông tin mà khách hàng đã mua sản phẩm hoặc sử dụng dịch vụ trong mười năm qua s Name, address,phone © Magazine subscriptions © Age * Hobbies
* Gender * Catalog orders © Ethnicity * Marital status, life stage
* Religion © Height, weight, hair and
* Education * Spouse name, birth date
* Voter registration * Children’s names and © Home ownership birth dates © Vehicles
Hình 4 Một số dữ liệu người tiêu dùng có thÊ mua được
Ngoài việc thu thập đữ liệu từ bên ngoài và nội bộ, một số công ty chọn mua đữ liệu cá nhân của người tiêu dùng (ví dụ: tỉnh trạng hôn nhân, thói quen tiêu dùng, món ăn yêu thích đề từ đó người sử dụng đữ liệu (doanh nghiệp) đưa ra những chương trình ưu đãi phù hợp với sở thích đề gia tăng đoanh số) từ các nhà cung cấp dữ liệu Ví dụ: Tổng Céng ty Acxiom © Dirty data © Wrong granularity © Missing values —Too fine
* Inconsistent data — Not fine enough © Datanotintegrated © Too much data
Hinh 5 Cac danh muc van dé chinh Trên thực tế, hầu hết dữ liệu hoạt động và đữ liệu đã mua đều có vấn đề ngăn cản tính hữu ích của nó đối với sự phát triển về thông tin kinh doanh Một số vấn đề phố biến mà các doanh nghiệp có thể gặp phải như: ¡1 Dữ liệu có vấn đề được gọi là đữ liệu ban Vi du, di liệu được mua thuong chứa các yếu tố thiếu hoặc không cập nhật lại dữ liệu dẫn đến sai lệch thông tin cần thiết cho người cần sử dụng đữ liệu (mua database cũ không được cập nhật, hoặc thay đối các thông tin cá nhân )
E¡_ Dữ liệu không nhất quán Ví dụ, thu thập hành vi mua hàng của các khách hàng trên các trang web đa quốc gia cần quy đổi sang múi giờ phù hợp với từng nước chứ không phải múi giờ của máy chủ
Dữ liệu không được tích hợp Ví dụ, bệnh nhân mắc bệnh tim đến khám và chữa trị tại nhiều bệnh việc khác nhau Thông tin về bệnh, các loại thuốc sử dụng, thời gian phát bệnh, huyết áp, nhịp tim, điện tâm đồ tại các bệnh viện khác nhau sẽ lưu trữ đữ liệu khác nhau dẫn đến thông tin đữ liệu không đồng nhất
3.2 Siêu thị dữ liệu (Data mart)
3.2.1 Khái niệm về Data mart