Tìm hiểu về công cụ SQL Server Business Intelligence (BI) Development Studio 2008 trên cơ sở dữ liệu mẫu Adventure Works
Trang 15 Tô Văn Thuận
6 Nguyễn Thị Thúy Trinh
7 Lê Như Thương
Trang 2MỤC LỤC
Trang
CHƯƠNG I: MỞ ĐẦU 4
CHƯƠNG II: TÌM HIỂU VỀ BUSINESS INTELLIGENCE (BI) 5
1.1.Business Intelligence (BI) là gì? 5
1.2.Lịch sử về BI 6
1.3.Các thành phần chính của hệ thống BI 6
1.4.Lợi ích của BI 10
1.5.Các công nghệ hỗ trợ BI (Technologies supporting for BI) 10
1.6.Các hoạt động chính của BI (BI Activities) 11
CHƯƠNG II: TÌM HIỂU BỘ CÔNG CỤ SQL BUSINESS INTELLIGENCE (BI) DEVELOPMENT STUDIO 2008 TRÊN CƠ SỞ DỮ LIỆU MẪU ADVENTURE WORKS 12
2.1 Cơ sở dữ liệu mẫu AdventureWorks 12
2.2 Giới thiệu về SQL Server Business Intelligence Development Studio 14
2.3 Giao diện làm việc với SQL BIDS 14
2.4 Lưu ý trước khi thực hành 16
2.5 Chế độ Offline và chế độ Immediate 17
2.6 Cách tạo các đối tượng trong SQL BIDS 22
2.6.1 Data Source 22
2.6.2 Data Source Views 28
2.6.3 Dimension 35
2.6.4 Cube 39
2.6.5 Dimension (tiếp theo) 44
2.6.6 Deploy Project 44
2.7 Hướng dẫn thực hiện OLAP 46
2.7.1 Giới thiệu OLAP 46
2.7.2 Thực hiện OLAP với BIDS và SSAS 46
Trang 32.8.Cách sử dụng data mining wizard 48
CHƯƠNG IV: KẾT LUẬN 59 DANH MỤC TÀI LIỆU THAM KHẢO 60
Trang 4CHƯƠNG I: MỞ ĐẦU
Trong một môi trường cạnh tranh ngày càng tăng, các doanh nghiệp đã nhận ra rằng
họ chỉ có thể thành công bằng tiên phong trong vấn đề nhận ra các xu hướng và cơ hội của thị trường, từ đó đáp ứng nhanh cho các nhu cầu của khách hàng mới Thêm vào đó, các nhân viên cần phải ưu tiên cho hoạt động của doanh nghiệp và phí tổn để bảo đảm có được hiệu quả sử dụng cao nhất của tài nguyên doanh nghiệp và tạo các quyết định trong công việc một cách hiệu quả nhất
Và muốn qiải quyết với những thách thức này, doanh nghiệp cần áp dụng công nghệ
số và trở nên thông minh hơn Ngoài ra, các nhân viên cần phải tăng được khả năng nhạy bén trong toàn bộ doanh nghiệp để họ có thể đưa ra các quyết định mang tính chất am hiểu
và thông minh, góp phần vào sự thành công của doanh nghiệp
Ngày nay, việc áp dụng các nền tảng công nghệ thông tin vào công việc kinh doanh ngày càng được các doanh nghiệp quan tâm và áp dụng Đó là các hệ thống ERP giúp quản
lý và điều hành toàn bộ doanh nghiệp Nhiều doanh nghiệp hiện nay đã hoạt động hoàn toàn dựa trên các hệ thống này hay nói cách khác họ đã “số hóa” hoạt động của toàn doanh nghiệp Ở các nước phát triển, thuật ngữ Business Intelligence (BI - tạm dịch là giải pháp kinh doanh thông minh) không còn mới mẻ, tuy nhiên, ở Việt Nam chúng ta, lĩnh vực này vẫn đang ở mức sơ khai
Vậy BI là gì? Các thành phần trong một hệ thống BI? Xu hướng, triển khai, ứng dụng vào thực tế ra sao? Có liên hệ như thế nào đến DSS(Decision support system), ERP (Enterprise resource planning)? Có những công cụ BI nào, cách sử dụng? Lợi ích mà BI mang lại cho doanh nghiệp/ tổ chức?
Với mong muốn cung cấp cho các bạn những kiến thức để hiểu rõ hơn về BI, đề tài “Tìm hiểu về công cụ SQL Server Business Intelligence (BI) Development Studio 2008 trên cơ
sở dữ liệu mẫu Adventure Works ” hi vọng sẽ giúp các bạn phần nào giải đáp các thắc mắc
trên và có thể tiếp cận một công cụ BI để ứng dụng trong học tập và làm việc
Trang 5CHƯƠNG II: TÌM HIỂU VỀ BUSINESS INTELLIGENCE (BI)
Hệ hỗ trợ ra quyết định (Decision Support Systems – DSS) là một hệ thống thuộc hệ thông tin quản lý (Management Information Systems – MIS) , có nhiệm vụ cung cấp các thông tin hỗ trợ cho việc đề ra quyết định ở cấp chiến lược và chiến thuật trở nên dễ dàng, thuận tiện hơn
1.1 Business Intelligence (BI) là gì?
Kinh doanh thông minh (Business Intelligence - BI) là một trong bốn dạng chính của DSS
Có rất nhiều định nghĩa về BI, mỗi định nghĩa nêu lên một đặc trưng nổi bật của BI nhưng chung qui lại tất cả đều đề cập đến khả năng trợ giúp ra quyết định hiệu quả trong kinh doanh của BI Dưới đây là một số định nghĩa về BI:
Business Inteligence – BI (tạm dịch là giải pháp quản trị doanh nghiệp thông minh)
là một hệ thống báo cáo cho phép tổ chức/doanh nghiệp (TC/DN) khai thác dữ liệu từ nhiều nguồn khác nhau về khách hàng (KH), thị trường, nhà cung cấp, đối tác, nhân sự và phân tích/sử dụng các dữ liệu đó thành các nguồn thông tin có ý nghĩa nhằm
hỗ trợ việc ra quyết định Thông thường cấu trúc một bộ giải pháp BI đầy đủ gồm một kho dữ liệu tổng hợp (datawarehouse) và các bộ báo cáo, bộ chỉ tiêu quản lý hiệu năng TC/DN (Key Perfomance Indicators – KPIs), các dự báo và phân tích giả lập (Balance Scorecards, Simulation and Forecasting )
Business Intelligence đề cập đến các kỹ năng, qui trình, công nghệ, ứng dụng được
sử dụng để hỗ trợ ra quyết định
BI là các ứng dụng và công nghệ để chuyển dữ liệu doanh nghiệp thành hành động
BI là công nghệ mới giúp doanh nghiệp hiểu biết về quá khứ và dự đoán tương lai
BI là một tập hợp các mô hình toán học và phương pháp phân tích khai thác dữ liệu
có sẵn để tạo ra thông tin và kiến thức hữu ích cho quá trình ra quyết định phức tạp (theo Carlo Vercellis)
Trang 6Tóm lại:
BI là qui trình và công nghệ mà các doanh nghiệp dùng để kiểm soát khối lượng dữ liệu khổng lồ, khai phá tri thức giúp cho các doanh nghiệp có thể đưa các các quyết định hiệu quả hơn trong hoạt động kinh doanh của mình Công nghệ BI (BI technology) cung cấp một cách nhìn toàn cảnh hoạt động của doanh nghiệp từ quá khứ đến hiện tại và các dự đoán tương lai Mục đích của BI là hỗ trợ cho doanh nghiệp ra quyết định tốt
Vì vậy một hệ thống BI (BI system) còn được gọi là hệ thống hỗ trợ quyết định (Decision Support System -DSS)
Trong khi Tôn Tử không phải là cha đẻ của BI, nhưng khái niệm của Tôn Tử về dự
báo/biết trước chính là nguồn gốc cho việc áp dụng thành công trực tiếp tới BI BI hiện đại
sử dụng máy tính để đạt được biết trước bằng xử lý và phân tích thông tin để hỗ trợ quyết định trong kinh doanh
BI đã được đặt ra bởi Gartner (Dresner, 1989) là một thuật ngữ mang tính khái quát để
mô tả tập hợp các khái niệm và phương pháp để cải thiện ra quyết định kinh doanh bằng cách sử dụng hệ thống hỗ trợ dựa trên thực tế
1.3 Các thành phần chính của hệ thống BI
Gồm có các thành phần chính sau:
Trang 7Hình 1 Các thành phần chính của một hệ thống BI
Data sources: (Nguồn dữ liệu) Thu thập và tích hợp các dữ liệu được lưu trữ trong
sơ cấp và thứ cấp của các nguồn khác nhau, chúng không đồng nhất về nguồn gốc và loại Các nguồn bao gồm hầu hết các phần dữ liệu thuộc hệ thống hoạt động, nhưng cũng có thể bao gồm các tài liệu phi cấu trúc, chẳng hạn như email và các dữ liệu nhận được từ các nhà cung cấp bên ngoài
Data warehouses and data marts: (kho dữ liệu và trung tâm dữ liệu) Sử dụng các
công cụ khai thác và chuyển đổi như: trích xuất, chuyển đổi, tải (ETL), các dữ liệu
có nguồn gốc từ các nguồn khác nhau được lưu trữ trong cơ sở dữ liệu nhằm hỗ trợ phân tích kinh doanh thông minh Các cơ sở dữ liệu thường được gọi là kho dữ liệu
và trung tâm dữ liệu
Business intelligence methodologies: (Phương pháp kinh doanh thông minh): Dữ
liệu cuối cùng đã lọc sạch và được sử dụng như nguồn cấp dữ liệu cùng các mô hình toán học và phương pháp phân tích, nhằm hỗ trợ người ra quyết định Trong một hệ thống kinh doanh thông minh, một số ứng dụng hỗ trợ quyết định có thể được thực hiện, hầu hết trong số đó sẽ được mô tả trong các giai đoạn:
Multidimensional cube analysis: Phân tích khối đa chiều;
Trang 8 Exploratory data analysis : Phân tích số liệu thăm dò;
Time series analysis: Phân tích theo chuỗi thời gian;
Inductive learning models for data mining: Mô hình học quy nạp cho khai phá dữ
liệu;
Optimization models: Mô hình tối ưu hoá;
Data exploration: (Thăm dò dữ liệu) Ở thành phần, chúng ta tìm những công cụ để
thực hiện phân tích “kinh doanh thông minh” một cách thụ động, bao gồm truy vấn
và hệ thống báo cáo, cũng như phương pháp thống kê Chúng được gọi là hệ phương pháp thụ động vì người ra quyết định được yêu cầu để tạo ra giả thuyết trước hoặc xác định các tiêu chí khai phá dữ liệu; Sau đó sẽ dùng công cụ phân tích để tìm trả lời và xác nhận lại hiểu biết ban đầu của họ
Ví dụ, xem xét giám đốc kinh doanh của một công ty thông báo rằng doanh thu trong một khu vực địa lý nhất định đã giảm đối với một nhóm khách hàng cụ thể Vì vậy, cô ấy có
lẽ cần xác minh giả thuyết này bằng cách sử dụng các công cụ khai thác và trực quan Và sau đó áp dụng một thử nghiệm thống kê để kiểm tra xem kết luận của mình có chính xác hay không với sự hỗ trợ của dữ liệu
Data mining (Khai phá dữ liệu): Bao gồm các phương pháp kinh doanh thông
minh, mục đích là khám phá các tri thức mới và các tri thức có ích ở dạng tiềm năng trong nguồn dữ liệu đã có Chúng bao gồm các mô hình toán học để nhận dạng mẫu
và các kỹ thuật khai phá dữ liệu Không giống như công cụ được mô tả ở cấp độ đã nêu, các mô hình của loại chủ động không yêu cầu người ra quyết định phải xây dựng bất kỳ giả thuyết nào trước, mà ngay sau đó sẽ được xác nhận
Optimization (Tối ưu hóa): Các mô hình tối ưu hóa cho phép chúng ta xác định giải
pháp tốt nhất của một tập hợp các hành động thay thế (alternative actions), mà thường khá rộng và đôi khi thậm chí vô hạn Ví dụ Hình 5 cho thấy một điển hình của ứng dụng các mô hình tối ưu hóa
Decisions (Quyết định): Sau khi áp dụng các phương pháp nhằm tìm ra những giải
pháp kinh doanh thông minh thì đã có được những thông tin quan trọng có lợi ích
Trang 9Khi đó, nhà hoạch định sẽ lựa chọn và áp dụng vào thực tế một quyết định cụ thể, và chịu trách nhiệm về quyết định mà mình đưa ra
Vấn đề cốt lõi trong hệ thống BI là kho dữ liệu (Data Warehouse) và khai phá dữ liệu (Data Mining) vì dữ liệu dùng trong BI là dữ liệu tổng hợp (nhiều nguồn, nhiều định dạng, phân tán và có tính lịch sử) Đồng thời việc phân tích dữ liệu trong BI không phải là những phân tích đơn giản (query, Filtering) mà là những kỹ thuật trong khai phá dữ liệu (Data Mining) dùng để phân loại (classification), phân cụm (clustering), hay dự đoán (Prediction)
Vì vậy BI có mối quan hệ rất chặt chẽ với Data Warehouse và Data mining
Hệ thống BI đơn giản có thể được xem là sự kết hợp của 3 thành phần chính như sau:
Hình 2
Diễn giải sơ lược:
Kho dữ liệu (Data Warehouse): Chứa dữ liệu tổng hợp của doanh nghiệp
Khai phá dữ liệu (Data mining): Các kỹ thuật dùng để khai phá dữ liệu và phát
hiện tri thức như phân loại (Classification), phân nhóm (clustering), phát hiện luật kết hợp (Association Rule), Dự đoán (Predcition),…
Phân tích kinh doanh (Business Analyst): Các nhà lãnh đạo Doanh nghiệp đưa
ra những quyết định chiến lược đối với hoạt động kinh doanh của doanh nghiệp
Trang 101.4 Lợi ích của BI
Làm tăng khả năng kiểm soát thông tin của doanh nghiệp một cách chính xác và hiệu quả Từ đó có thể phân tích, khai phá tri thức giúp doanh nghiệp dự đoán về xu hướng của giá cả dịch vụ, hành vi khách hàng, phát hiện khách hàng tiềm năng để
đề ra các chiến lược kinh doanh phù hợp, nhằm tăng khả năng cạnh tranh doanh nghiệp
Giúp cho các doanh nghiệp sử dụng thông tin một cách hiệu quả, chính xác để thích ứng với môi trường thay đổi liên tục và cạnh tranh khốc liệt trong kinh doanh
Ra các quyết định kinh doanh hiệu quả hơn
o Xác định được vị trí và sức cạnh tranh của DN
o Phân tích hành vi khách hàng
o Xác định mục đích và chiến lược Marketing
o Dự đoán tương lai của doanh nghiệp
o Xây dựng chiến lược kinh doanh
o Giữ được khách hàng có giá trị và dự đoán khách hành tiềm năng
Ngoài ra, BI còn giúp doanh nghiệp dễ dàng xác lập những báo cáo động (ad-hoc report) theo bất cứ chiều thông tin nào mà không cần kiến thức chuyên môn cao
về cơ sở dữ liệu BI giúp tích hợp các phương tiện phân tích, so sánh, và đánh giá
rõ ràng, tiện lợi như các khung quản lý chi tiêu (dashboard), hệ thống các biểu đồ động (graphical chart), bộ chỉ tiêu quản lý hiệu năng doanh nghiệp (key performance indicators – KPIs), hệ thống báo cáo phân tích giả lập (Simulation and Forecasting reports)…
1.5 Các công nghệ hỗ trợ BI (Technologies supporting for BI)
Kho dữ liệu (Data warehousing)
Hệ thống hoạch định nguồn lực doanh nghiệp (Enterprise resource planning (ERP) systems)
Công nghệ truy vấn và lập báo cáo (Query and report writing technologies)
Công cụ khai phá và phân tích dữ liệu (Data mining and analytics tools)
Hệ thống hỗ trợ ra quyết định (Decision support systems)
Trang 11 Quản lý quan hệ khách hàng (Customer relation management)
1.6 Các hoạt động chính của BI (BI Activities)
Hỗ trợ quyết định (decision support),
Truy vấn và báo cáo (query and reporting),
Phân tích xử lý trực tuyến (online analytical processing (OLAP)),
Phân tích thống kê (statistical analysis),
Dự đoán (forecasting),
Khai phá dữ liệu (data mining)
Trang 12CHƯƠNG III: TÌM HIỂU BỘ CÔNG CỤ SQL BUSINESS
INTELLIGENCE (BI) DEVELOPMENT STUDIO 2008 TRÊN CƠ
SỞ DỮ LIỆU MẪU ADVENTURE WORKS
Đây là bộ công cụ được tích hợp trong Visual Studio 2008 Enterprise, dùng để tạo ra các project tương tác với Database để thực hiện các thao tác Bussiness Intelligence SSAS thuộc Hệ quản trị cơ sở dữ liệu SQLServer 2008 (đã xuất hiện từ phiên bản 2000), được xem như là một Server riêng biệt
Hay nói cách khác, BI là một IDE của Microsoft được phát triển cho việc phân tích,
xử lý dữ liệu và giải pháp trí tuệ kinh doanh, được dùng trên nền SQL SERVER : Analysis Services, Reporting Services và Integration Services Nó dựa trên môi trường phát triển MS Visual Studio, nhưng làm theo yêu cầu với SQL Server mở rộng và các loại dự án, các công
cụ, điều khiển và các dự án cho các báo cáo, ETL, OLAP và các cấu trúc khai phá dữ liệu Bản thân SSAS là một services nên không có giao diện sử dụng
Trong chương này, hướng dẫn sử dụng được đặt trong ngữ cảnh người đọc lần đầu tiên hoặc rất ít tiếp xúc với bộ công cụ này
2.1 Cơ sở dữ liệu mẫu AdventureWorks
Cơ sở dữ liệu minh họa AdventureWorks lấy bối cảnh trên dữ liệu của 1 công ty hư cấu có tên Adventure Works Cycles Đây được cho là 1 công ty sản xuất đa quốc gia có qui
mô lớn Công ty sản xuất và kinh doanh xe đạp làm từ kim loại và các chất liệu tổng hợp Thị trường của công ty này bao gồm cả khu vực Bắc Mỹ, Châu Âu và Châu Á Trong khi trụ
sở chính của công ty lại được đặt ở Bothell, Washington gồm có 290 nhân viên, công ty cũng có 1 vài nhóm nhân viên kinh doanh khu vực ở các thị trường hoạt động của mình
Vào năm 2000, công ty Adventure Works Cycles có mua lại 1 nhà máy sản xuất nhỏ
là Importadores Neptuno ở Mexico Nhà máy này tham gia sản xuất 1 vài thành phần thiết yếu trong toàn bộ dây chuyền sản xuất ra thành phẩm của công ty Các thành phần được nhà máy này sản xuất sẽ được chuyển tới trụ sở chính ở Bothell để lắp ráp thành thành phẩm Năm 2001, Importadores Neptuno trở thành nhà máy duy nhất sản xuất phà phân phối dòng sản phẩm xe đạp du lịch
Trang 13Kết thúc 1 năm tài chánh thành công, công ty Adventure Works Cycles đang tìm cách mở rộng thị phần bằng cách tập trung vào các hoạt động bán hàng cho các khách hàng quan trọng nhất của họ, mở rộng thông tin sản phẩm thông qua hệ thống Website đồng thời tiết giảm chi phí bán hàng bằng cách giảm chi phí sản xuất
MÔ TẢ CÁC LƢỢC ĐỒ TRONG CƠ SỞ DỮ LIỆU ADVENTUREWORKS
Trong CSDL xử lý tác vụ (OLTP) AdventureWorks minh họa, các đối tượng như tables, views, và procedures được tổ chức vào các lược đồ (schemas) Với việc đưa vào sử dụng các schemas trong CSDL này thì cách truy xuất tới các đối tượng bên trong CSDL cũng sẽ thay đổi Cụ thể, từ phiên bản SQL Server 2005, khái niệm schemas đã được tách biệt với khái niệm users và hình thành 1 nguyên tắc là users sở hữu schemas, và schemas sẽ chứa các dababase objects
Bảng sau sẽ mô tả các schemas được sử dụng trong CSDL AdventureWorks và 1 vài bảng tiêu biểu cho mỗi schema:
HumanResources Nhân viên của công ty Adventure
Works Cycles
EmployeeTable Department Table
6
Person Tên và địa chỉ của các khách hàng là
cá nhân, các nhà cung cấp và các nhân viên
Contact Table Address Table StateProvince Table
13
Production Các sản phẩm được sản xuất và bán
bởi công ty Adventure Works Cycles
BillOfMaterials Table Product Table
PurchaseOrderHeader Table
Vendor Table
5
Sales Các khách hàng và dữ liệu liên quan
tới việc mua bán
Customer Table SalesOrderDetail
18
Trang 14 Bài hướng dẫn này sử dụng cơ sở dữ liệu AdventureWorks 2008R2 (file SQL)
để thực hiện OLAP và Datamining
Các bạn có thể tải về cơ sở dữ liệu AdventureWorks 2008R2, tại đây:
Thực hành với các bảng: ProductInvenory (bảng chứa thông tin sản phẩm
hàng tồn kho), Location (bảng tra cứu có chứa hàng tồn kho sản phẩm và địa điểm sản xuất), WorkOrderRouting (Thông tin chi tiết sản xuất để làm
việc Làm việc chi tiết để kiểm soát trật tự, trong đó các sản phẩm đi du lịch thông qua các trung tâm làm việc trong quá trình sản xuất)
2.2 Giới thiệu về SQL Server Business Intelligence Development Studio
Microsoft Business Intelligence (BI) được tích hợp với Microsoft Visual Studio (VS) và được thiết kế xây dựng dựa trên cơ sở dữ liệu có khả năng mở rộng cho việc sắp xếp, phân tích, báo cáo dữ liệu và cung cấp các công cụ trực giác và mạnh mẽ để người dùng có thể sử dụng truy cập và phân tích các thông tin doanh nghiệp Hạt nhân cuối cùng trong Microsoft
BI là Microsoft SQL Server 2008, một nền tảng dịch vụ dữ liệu hoàn tất cho phép bạn có thể:
• Hợp nhất việc lưu trữ và truy cập tất cả dữ liệu trong doanh nghiệp
• Xây dựng và quản lý các giải pháp BI phức tạp
• Tăng phạm vi của giải pháp thâu tóm doanh nghiệp của bạn đến tất cả các nhân viên
2.3 Giao diện làm việc với SQL BIDS
Trang 15Hình 1 Giao diện làm việc với BIDS
Ta thấy, giao diện làm việc của BIDS tương tự như bộ công cụ lập trình Visual Studio,
và thực chất, đối với các phiên bản Enterprise của Visual Studio, BIDS được tích hợp sẵn Bởi vậy, các thành phần giao diện khá quen thuộc với người dùng
Trong đó:
- Vùng số 1: Menu và Toolbar
- Vùng số 2: Thường chứa các công cụ để tinh chỉnh, thiết lập thuộc tính cho các đối
tượng được chọn ở vùng số 3
- Vùng số 3: Cửa sổ Solution Explorer quen thuộc Chứa tất cả các đối tượng thuộc
project Có các menu chuột phải để thao tác trên đối tượng khá nhanh chóng Tất cả các project được tạo ra và quản lý ở đây Để thêm đối tượng vào project, bạn right-click vào
Trang 16tên project và chọn Add New Item Hoặc bạn có thể right-click một folder cụ thể (tùy thuộc đối tượng bạn muốn tạo mới) và chọn New, khi đó một hộp thoại sẽ xuất hiện cho phép bạn tạo đối tượng mới
- Vùng số 4: Cửa sổ Properties Chứa toàn bộ các thuộc tính của đối tượng Cửa sổ này
được gọi nhanh bằng cách bấm F4 khi đã chọn đối tượng ở vùng số 5
- Vùng số 5: Hiển thị nội dung của đối tượng, hoặc 1 số thành phần do đối tượng được
chọn ở vùng số 2 tạo ra Đây là nơi bạn có thể hiệu chỉnh và phân tích đối tượng Khi tạo
ra một đối tượng mới hoặc double-click vào một đối tượng trong Solution Explorer thì trình thiết kế đặc biệt của đối tượng đó sẽ được mở ra cho phép bạn thay đổi và tương tác với đối tượng
- Vùng số 6: Các đối tượng sẽ có nhiều khía cạnh khác nhau để bạn có thể hiệu chỉnh và
tương tác Những khía cạnh này được biểu thị bởi các tab bên trong cửa sổ Designer
2.4 Lưu ý trước khi thực hành
Trước khi thực hành, bạn phải đảm bảo rằng các Services cần thiết của SQLServer đang ở tình trạng “Running” Cấu hình theo các bước dưới đây: Start → All Program → SQL Server 2008 → Configuration Tools → SQL Server Configuration Manager
Ở cửa sổ Configuration Manager, bấm chọn “SQL Server Services” ở khung bên trái Lúc này khung bên phải hiện ra các Services của SQLServer Chắc chắn rằng các Services này đang chạy như hình 2
Hình 2 Hộp thoại SQL Server Configuration Manager
Trang 17Nếu nó chưa được khởi động (Cột State là Stopped), bạn click chuột phải vào dòng
đó, chọn “Start” để khởi động Services cần thiết
Tiến hành Attach cơ sở dữ liệu AdventureWorks2008R2 vào SQL Server
2008
2.5 Chế độ Offline và chế độ Immediate
BI Dev Studio làm việc trong hai chế độ Chế độ bạn sử dụng đôi khi cũng phụ thuộc vào sở thích cá nhân và đôi khi lại phụ thuộc vào nhu cầu Mỗi chế độ đều có ưu điểm và nhược điểm, phần này sẽ giúp các bạn hiểu được sự khác biệt giữa hai chế độ làm việc này trong BI Dev Studio
Chế độ Immediate
Khi làm việc trong chế độ này, bạn được kết nối trực tiếp và liên tục đến server Analysis Service Khi bạn mở một đối tượng (ví dụ: một cấu trúc mining) nghĩa là bạn đang mở đối tượng từ server Khi bạn thay đổi và lưu lại nó thì đối tượng được thay đổi theo ngay lập tức trên server của bạn
Mặc dù chế độ này rất thân thiện và dễ hiểu, nhưng bạn nên xem xét kỹ các nhân tố trong suốt quá trình sử dụng Nếu bạn sử dụng chế độ này để làm trong sản xuất và bạn thay đổi, lưu project đó thì lập tức nó sẽ được thay đổi và trở thành chưa gia công, dẫn đến bất kỳ câu truy vấn đối với mô hình đó sẽ bị lỗi Hơn nữa, những người dùng khác có thể thay đổi khi họ được phép mở project đó Bạn sẽ thấy có cảnh báo khi cố gắng lưu một đối tượng nếu đối tượng đó đã bị thay đổi Khi lưu lại tức là viết chồng lên bất kỳ thay đổi nào những người dùng trước đã làm Các thay đổi đối tượng trên server sẽ được phản ánh lại trong project của bạn chỉ khi nào bạn tắt và mở lại đối tượng Các đối tượng mới và đã xóa trong
cơ sở dữ liệu chỉ được phản ánh lại khi bạn đóng và mở lại chính project đó
Một ưu điểm lớn mà chế độ Immediate hơn hẳn chế độ Offline phải làm việc một cách bảo mật Chế độ Immediate chỉ cho phép bạn thực hiện trong giới hạn một cơ sở dữ liệu đơn
và cho phép người dùng Admin tạo, thay đổi các đối tượng Việc sử dụng chế độ Offline đòi hỏi người dùng phải là Admin đối với toàn bộ các trường hợp server
Sử dụng chế độ Immediate
Mở BI Dev Studio
Trang 18o Cách 1: Start → All Program → Microsoft SQL Server 2008 → SQL Server Bussiness Intelligence Development Studio
Trang 19Khi bạn làm việc với chế độ Offline, project của bạn sẽ chứa các file được lưu trữ trên máy client Khi bạn thay đổi các đối tượng trong môi trường, những thay đổi đó được lưu theo định dạng XML trên ổ đĩa cứng Mô hình và các đối tượng khác không được tạo ra trên server cho đến khi bạn quyết định triển khai chúng đến server đích Điều này cho phép bạn thiết kế và kiểm tra mô hình của bạn trên một server kiểm tra trước khi triển khai chúng tới một server hoạt động Những file này cũng được đánh dấu vào một hệ thống điều khiển nguồn để theo dõi bất kỳ thay đổi nào của đối tượng metadata tại mọi thời điểm và để chia
sẻ giữa các thành viên trong một tổ thiết kế Bạn có thể xem và hiệu chỉnh source code của các file này bằng cách right-click vào một đối tượng trong Solution Explorer và chọn View Code
Khi bạn triển khai một project, BI Dev Studio sẽ xác nhận tính hợp lệ của các đối tượng trong project của bạn và tạo ra một tập lệnh triển khai, sau đó gửi tập lệnh đó tới server Đơn
vị của sự triển khai là toàn bộ project, đại diện cho toàn bộ bộ dữ liệu Analysis Service Các công cụ đủ để có thể triển khai các thay đổi tăng lên trong khi bạn làm việc trên một project Tuy nhiên, nếu bạn triển khai project tới một server có cùng bộ dữ liệu hoặc nếu project được triển khai từ một máy khác thì việc triển khai sẽ viết chồng lên toàn bộ bộ dữ liệu Nhưng điều này sẽ được cảnh báo trước khi bạn thực thi Đồng thời, cũng bởi một bộ dữ liệu được tạo ra trong lúc triển khai nên bạn phải là Admin của server để triển khai một project từ chế độ Offline tới Server
Cách sử dụng chế độ Offline:
Mở BI Dev Studio
Chọn File => New Project (hoặc bấm Ctrl + N) Hình 4
Trang 20
Hình 4 Tạo mới một project
Hộp thoại New Project xuất hiện như hình 5
Hình 5 Hộp thoại New Project
Trang 21 Chọn Business Intelligence Projects.(1)
Chọn Analysis Services Project từ ô Templates.(2)
Gõ vào tên Project (3)
Chọn thư mục lưu trữ Project ở ô “Location” và nút “Browse…”(4) và click OK
Chọn từ menu Build => Deploy để triển khai project tới server, tạo cơ sở dữ liệu Hình 6
Hình 6
Theo mặc định, project sẽ triển khai tới server local host Để thay đổi server đích, chọn từ menu Project => Properties Hộp thoại Configuration Property Management sẽ xuất hiện, lúc này bạn có thể tạo cấu hình triển khai khác và chỉ rõ server đích và tên cơ sở dữ liệu cho cấu hình như minh họa ở hình 7
Hình 7 Hộp thoại Project Properties
Chuyển đổi giữa hai chế độ làm việc:
Trang 22Bạn làm việc trong một chế độ và cần một chế độ làm việc khác nữa chẳng hạn khi bạn cập nhật nhanh tới một Project từ một máy khác hoặc khi bạn muốn lưu lại đối tượng metadata của một cơ sở dữ liệu đang hoạt động tới nguồn điều khiển Việc này khá dễ dàng Cách dễ dàng nhất để thực hiện điều này là chuyển đổi từ chế độ Offline sang chế độ Immediate Bạn vào Menu File, chọn Open => Analysis Services Database và chọn cơ sở dữ liệu bạn vừa triển khai Khi muốn chuyển từ chế độ Immediate sang chế độ Offline, bạn tạo một project mới và chọn Import Analysis Services 2008 Database trong hộp thoại New Project (như ở hình 5) Một wizard sẽ xuất hiện cho phép bạn chỉ ra server và tên cơ sở dữ liệu nguồn sau đó giải nén metadata vào một project mới
Chú ý rằng bạn vẫn phải thiết lập tùy chọn triển khai để cho biết server đích và tên cơ sở
dữ liệu cần thiết
2.6 Cách tạo các đối tượng trong SQL BIDS
Sau khi bạn mở dữ liệu hoặc Project, các toán tử/đối tượng hoạt động bên trong project Analysis Services đều giống nhau đối với bất kỳ chế độ hoạt động nào bạn chọn
Dưới đây là hướng dẫn tạo các đối tượng chính, phục vụ cho Datamining và OLAP
2.6.1 Data Source
Giới thiệu Data Source:
Để thực hiện nhiệm vụ data mining, bạn phải chỉ rõ và mô tả dữ liệu nguồn và sau đó tạo ra cấu trúc và mô hình mining Tìm hiểu các dữ liệu nguồn:
Vấn đề thứ nhất là vị trí dữ liệu Không giống như hầu hết các sản phẩm data mining, SQL Server Data mining là một giải pháp dựa vào Server Điều này nghĩa là khi bạn thiết lập dữ liệu nguồn, cả máy client và server đều được phép sử dụng được dữ liệu nguồn này
Vấn đề thứ hai là tính bảo mật, điều này rất quan trọng để biết chứng thực người dùng được phép truy cập dữ liệu từ Analysis Services Khi bạn thiết lập kết nối, bạn
có thể chọn integrated security (khi phần chứng thực tài khoản được yêu cầu để truy cập dữ liệu) hoặc có thể chọn simple security (khi một username và password được
yêu cầu để truy cập dữ liệu) Microsoft khuyến cáo người sử dụng nên dùng
integrated security nếu được hỗ trợ
Trang 23 Cách tạo Data Source:
Sau khi tạo Project, bên phải màn hình làm việc của BIDS xuất hiện khung “Solution Explorer” như sau (vùng số 3 ở hình 1):
Hình 8
Right-click vào thư mục Data sources ở Solution Explorer hoặc chọn Object Explorer
và chọn New Data Source Hình 9
Hình 9
Cửa sổ “Data Source Wizard” (Trình thuật sĩ tạo Data Source – tạm dịch) hiện ra, bấm Next để bỏ qua hộp thoại giới thiệu, sau đó sẽ hiện ra màn hình 10:
Trang 24Hình 10 Hộp thoại Data Source Wizard
Ở cửa sổ này, bấm chọn Radio “Create a data source based on an existing or new connection”, sau đó bấm “New” để tạo kết nối mới Hình 11 sẽ hiện ra:
Hình 11 Hộp thoại Connection Manager
Trang 25o Ở dòng “Provider” (1) để mặc định là “Native OLE DB\SQL Native Client”
để chọn Driver kết nối Database cho Project
o Ở thẻ “Connection” (2), dòng “Server name” (3) điền tên Server đăng nhập SQL Server (hoặc có thể thử tên máy, chữ “localhost”, dấu (chấm) vào textbox này
o Ở mục “Logon to the Server” (4), chọn kiểu đăng nhập vào SQL Server của bạn (với quyền của máy hay quyền của SQL Server cấp cho
o Mục “Connect to a database”, check vào radio “Selecr or enter a database name”, sau đó nhập “AdventureWorks2008R2” vào textbox hoặc bấm vào mũi tên xổ xuống, chọn Database “AdventureWorks2008R2” (5)
o Để chắc chắn, bấm “Test connection” (6) Nếu hiện lên thông báo như hình
11, là đã tạo kết nối thành công
Hình 11 Thông báo kết nối thành thông đến CSDL
Sau khi tạo kết nối, cửa sổ “Data source Wizard” xuất hiện trở lại Lúc này kết nối chúng ta mới tạo đã có ở khung “Data connection” bên trái
Trang 26Hình 13 Hộp thoại Impersonation Information
Trang 27 Sau đó, màn hình 14 sẽ hiện lên, bạn đặt tên cho Data Source (1), và click “Finish” (2) Hoàn tất định nghĩa Data Source
Hình 14
Cách sửa một Data Source đã được tạo
Ví dụ để thiết kế lại Data Source vừa tạo ở trên, thì trong thư mục Data sources ở Solution Explorer, Right-Click vào “AdventureWorks2008R2_DS.ds” chọn View
Designer hoặc DoubleClick vào “AdventureWorks2008R2_DS.ds” Hình 15
Khi ấy, hộp thoại Data Source Designer sẽ hiện lên, hình 16
Trang 28Hình 16 Hộp thoại Data Source Designer để bạn chỉnh sửa lại Data Source đã tạo
o Để sửa lại kết nối dữ liệu, bạn click vào “Edit” (1), hộp thoại như hình 11 sẽ hiện ra để bạn chỉnh sửa
o Bạn có thể đổi tên tại mục “Data Source name” (2)
o Tại thẻ “Impersonation Information” (3) thao tác như hình 13
2.6.2 Data Source Views
Giới thiệu Data Source Views:
Khái niệm Data Source Views (DSV) xuất phát từ yêu cầu thường xuyên truy xuất dữ liệu từ một tập nhỏ các bảng trong rất nhiều bảng của Datawarehouse Vậy DSV là một lớp (layer) trừu tượng, ánh xạ cụ thể và đầy đủ 1 phần nhỏ các bảng trong DW Trong DSV các mối quan hệ, khóa chính, khóa ngoại của các bảng đều được lưu trữ
Trang 29Ngoài ra DSV còn hỗ trợ tạo các mối liên hệ, các khóa khác Khái niệm này cũng khá gần với khái niệm về View trong các hệ quản trị cơ sở dữ liệu thông thường Cube sẽ truy xuất dữ liệu thông qua nó DSV là nơi bạn chọn, tổ chức, khám phá và điều khiển dữ liệu
Cách tạo Data Source Views
Trở lại cửa sổ Solution Explorer, Right-Click vào “Data Source Views”, chọn
“New Data Source View…” hoặc chọn menu Oject Explorer và chọn New Data Source View để bắt đầu Hình 17
Hình 17
Bỏ qua cửa sổ giới thiệu Ở cửa sổ kế tiếp, cửa sổ Data Source View Wizard, mặc định dữ liệu nguồn “AdventureWorks2008R2_DS” (1) sẽ được chọn Click Next (2) để tiếp tục
Trang 30Hình 18
Ở cửa sổ tiếp theo Name Matching sẽ hiện ra, nếu cơ sở dữ liệu nguồn không có khóa ngoại nào có mối liên kết với khóa chính, tuy nhiên việc chọn khóa ngoại, khóa chính này ta có thể thực hiện sau khi tạo DSV, ở đây mặc đinh chọn như trong hình 19, và chọn Next để tiếp tục
Hình 19