Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 62 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
62
Dung lượng
1,23 MB
Nội dung
TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN TP.HCM KHOA CÔNG NGHỆ THÔNG TIN Môn : Phát triển ứng dụng hệ thống thông tin hiện đại Giáo viên hướng dẫn: Nguyễn Trần Minh Thư Hồ Lê Thị Kim Nhung Phạm Minh Tú Thành viên nhóm 18: Mã Kiếm Long – 1042062 Trần Thị Phụng – 1042088 Nguyễn Minh Tâm – 1042101 Phạm Văn Trung -1041156 Nguyễn Văn Trãi - 1042121 Chủ đề : TìmhiểuvềBIvàcôngcụmãnguồnmởPentaho • Tìmhiểuvề Data Warehouse • OLAP • BI(Business Intelligene) • TìmhiểucôngcụmãnguồnmởPentaho Data Warehouse là gì? Đặc điểm của Data Warehouse. Cấu trúc của Data Warehouse. Lợi ích của Data Warehouse. Cơ sở dữ liệu và Data Warehouse. Data Warehouse hiện nay. TìmHiểuVề Data Warehouse Trần Thị Phụng - 1042088 Data Warehouse là gì? Data Warehouse là gì?() Là một CSDL hướng đối tượng được thiết kế với việc tiếp cận các ý kiến trong mọi lĩnh vực kinh doanh. Nó cung cấp các côngcụ để đáp ứng thông tin cần thiết cho các nhà quản trị kinh doanh tại mọi cấp độ tổ chức với những yêu cầu dữ liệu phức hợp và lấy thông tin nhanh, chính xác. Đặc điểm của Data Warehouse Đặc điểm của Data Warehouse() Tính tích hợp - Integrated Khả năng thu thập dữ liệu từ nhiều nguồnvà trộn ghếp với nhau tạo thành một thể thống nhất. Là một tập hợp thông tin chính xác, chất lượng và nhất quán. Đặc điểm của Data Warehouse() Hướng chủ đề - Subject Oriented : Chuyển từ hướng ứng dụng sang hướng hộ trợ quyết định. Được tổ chức xung quanh các chủ đề chính, như khách hàng(customer), sản phẩm(product), bán hàng( sales). Tập trung vào việc mô hình hóa và phân tích dữ liệu cho các nhà đưa ra quyết định, mà không tập trung vào các hoạt động hay các xử lý giao dịch hàng ngày. Cung cấp một khung nhìn đơn giản và súc tích xung quanh các sự kiện của các chủ đề. Biến thời gian – Time Variant : Các dữ liệu được định nghĩa một thời điểm xác định và được ghi chép lại để phục vụ cho việc so sánh dữ liệu theo thời gian. Yêu cầu quan trọng cho kho dữ liệu là phạm vi về thời gian dài hơn so với các hệ thống tác nghiệp. Cơ sở dữ liệu tác nghiệp : dữ liệu có giá trị hiện thời. Dữ liệu của kho dữ liệu: cung cấp thông tin lịch sử (ví dụ như, 5 – 10 năm trước). [...]... hỗ trợ them về quản lý dữ liệu lớn và truy vấn) Thực ra nét khác bi t của Data warehouse so với database là ở quan niệm, cách nhìn vấn đề: Data warehouse là database rất lớn Database hướng về xử lý thời gian thực, Data warehouse hướng về tính ổn định Phục vụ xử lý transaction, cập nhật Data warehouse thường chỉ đọc, phục vụ cho những nhu cầu báo cáo Ví dụ: Chúng ta sẽ yêu cầu hãy cho bi t trong... phần : Server Client BI (Business Inteligence) Nguyễn Văn Trãi-1042121 Khái niệm Business Inteligence – BI (giải pháp quản trị doanh nghiệp thông minh) là một hệ thống báo cáo cho phép tổ chức , doanh nghiệp (TC/DN) khai thác dữ liệu từ nhiều nguồn khác nhau về khách hàng (KH), thị trường, nhà cung cấp, đối tác, nhân sự và phân tích, sử dụng các dữ liệu đó thành các nguồn thông tin có ý nghĩa... Data warehouse, chỉ tập trung vào những đối tượng được chọn Lợi ích của Data Warehouse Tạo ra những quyết định có ảnh hưởng lớn Công việc kinh doanh trở nên thông minh hơn Dịch vụ khách hàng được nâng cao Tái sáng tạo những tiến trình kinh doanh CSDL và Data Warehouse Data warehouse về bản chất là một database bình thường, các hệ quản trị cơ sở dữ liệu quản lý và lưu trữ nó như các database... liệu đa chiều trực quan cho phép dễ lựa chọn , định hướng và khám phá dữ liệu Cung cấp một ngôn ngữ truy vấn phân tích , cung cấp sức mạnh để khám phá các mối quan hệ trong dữ liệu phức tạp Dữ liệu được tính toán trước đối với các truy vấn thường xuyên nhằm làm cho thời gian trả lời rất nhanh đối với các truy vấn đặc bi t Cung cấp côngcụ mạnh giúp người dùng thao tác các dựa trên các khung nhìn... mà cần thời gian hồi đáp nhanh Mô hình MOLAP cho phép thực thi và truy vấn dữ liệu tốt nhất Mô hình MOLAP Thông tin tổng hợp và dữ liệu cơ sở được lưu trữ trong cấu trúc đa chiều Những thao tác kết thì không cần thiết Sử dụng thuật toán nén dữ liệu Sử dụng chỉ mục bitmap Không sử dụng cơ chế khóa Có thể được nạp trước vào bộ nhớ cache Mô hình ROLAP Mô hình dữ liệu ROLAP Mô hình ROLAP... gồm : Một nguồn dữ liệu (Data source) Các chiều (Dimensions) Các độ đo (Measures) Các phần giành riêng (Partitions) Kiến trúc khối của OLAP Dữ liệu nguồn của một khối chỉ ra nơi chứa KDL cung cấp dữ liệu cho khối Các chiều (dimension)được ánh xạ từ các thông tin của các bảng chiều (dimension table) trong KDL vào các mức phân cấp Một chiều ảo (virtual dimemsion) là dạng đặc bi t của chiều... Không yêu cầu các cơ chế xử lý giao dịch, phục hồi và điều khiển tương tranh Chỉ yếu cầu hai thao tác trong truy cập dữ liệu : Nạp và truy cập dữ liệu Cấu trúc của Data Warehouse Cấu trúc của Data Warehouse (tt) Một Data warehouse được cấu tạo từ một hay nhiều cube Enterprise Data warehouse: tập hợp toàn bộ thông tin về các đối tượng của toàn tổ chức /công ty Ví dụ: sản phẩm, khách hàng, doanh thu…... yêu cầu hãy cho bi t trong 5 năm, bộ phần phần mềm đã làm được những dự án nào từ đó chúng ta sẽ có quyết định vềhiệu năng của nhóm này Data Warehouse hiện nay Ngày nay, hầu hết các data warehouse đang được dùng cho quản trị doanh nghiệp thông minh làm tăng mối quan hệ khách hàng(CRM) và khai thác dữ liệu Một số được sử dụng để báo cáo tổng hợp Một số được sử dụng để tích hợp dữ liệu Các... trên một tập hợp các hàm tính toán đặc bi t Phân tích lợi ích OLAP OLAP được đặt ra để xử lý các truy vấn liên quan đến lượng dữ liệu rất lớn Mà nếu cho thực thi các truy vấn này trong OLTP thì sẽ không thể cho kết quả hoặc sẽ mất rất nhiều thời gian Các mô hình lưu trữ hỗ trợ OLAP Dịch vụ OLAP hỗ trợ mô hình lưu trữ dữ liệu khác nhau , mỗi mô hình có ưu và khuyết điểm riêng , chúng được sử dụng... riêng , chúng được sử dụng tùy theo mục đích khai thác Bao gồm 3 mô hình : Mô hình Multidimensional OLAP (MOLAP) Mô hình Relational OLAP(ROLAP) Mô hình Hybird OLAP(HOLAP) Mô hình MOLAP Mô hình OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở và thông tin tổng hợp trong các cấu trúc đa chiều gọi là các khối (Cube) Cấu trúc này được lưu bên ngoài cơ sở dữ liệu data mark hoặc kho dữ liệu Mô hình MOLAP . Văn Trãi - 1042121 Chủ đề : Tìm hiểu về BI và công cụ mã nguồn mở Pentaho • Tìm hiểu về Data Warehouse • OLAP • BI( Business Intelligene) • Tìm hiểu công cụ mã nguồn mở Pentaho Data Warehouse là. Warehouse. Cấu trúc của Data Warehouse. Lợi ích của Data Warehouse. Cơ sở dữ liệu và Data Warehouse. Data Warehouse hiện nay. Tìm Hiểu Về Data Warehouse Trần Thị Phụng - 1042088 Data Warehouse là gì? Data. trung vào việc mô hình hóa và phân tích dữ liệu cho các nhà đưa ra quyết định, mà không tập trung vào các hoạt động hay các xử lý giao dịch hàng ngày. Cung cấp một khung nhìn đơn giản và súc