Deploy Project

Một phần của tài liệu Tìm hiểu về công cụ SQL Server Business Intelligence (BI) Development Studio 2008 trên cơ sở dữ liệu mẫu Adventure Works (Trang 44)

Từ đầu đến giờ, các đối tượng như Dimensions, Cube chúng ta tạo ra hiện thời đang ở tình trạng thô (Raw), cần phải thực hiện 1 bước nữa để sử dụng Dimensions, Cube này. Đó là Deploy project. Bạn thao tác như sau: Trong Solution explorer, bấm chuột phải vào tên project, chọn “Deploy”. Hình 37.

Nhóm 1 Trang 45

Hình 37

 Màn hình minh họa Deploy Project thành công. Lúc này ta có thể khai thác Cube. Hình 38.

Nhóm 1 Trang 46

2.7. Hướng dẫn thực hiện OLAP 2.7.1. Giới thiệu OLAP

OLAP – On Line Analytical Processing là một kĩ thuật phân tích dữ liệu trong cơ sở dữ liệu. Với OLAP, các nhà quản lý có thể đạt được cái nhìn sâu sắc vào dữ liệu một cách nhanh chóng, chính xác. Nói cách khác, OLAP là một công nghệ để thu thập, quản lý, xử lý và trình bày dữ liệu từ DW cho mục đích phân tích và quản lý.

Như vậy, cụ thể hơn, OLAP sẽ nhận trách nhiệm trả lời câu hỏi về mặt thống kê, về tính đúng đắn của giả thiết được nhà quản lý đưa ra.

2.7.2. Thực hiện OLAP với BIDS và SSAS

 Trên giao diện chính của BIDS, trong “Solution Explorer”, tại thư mục Cube, Right- Click vào cube có tên “Adventure Works2008R2_DV1.cube”, chọn “Browser”. Hình 39 hoặc bấm thẻ “Browser” trên cửa sổ thiết kế của Cube.

Hình 39

Nhóm 1 Trang 47

Hình 40

o Ở bên trái, biểu diễn các Measure của và các chiều của Dimensions (bảng chiều) có thể tính toán (đã được định nghĩa trong lúc tạo Cube).

o Ở bên phải là các vùng để kéo dữ liệu sang tính toán.

o Vùng số (1), (2), (3) là vùng chứa các điều kiện để lọc kết quả từ vùng số (4). Các vùng này chỉ chấp nhận các cột, bảng của các bảng chiều (Dimension).

o Vùng số (4) là vùng đưa ra các điều kiện lọc các bảng chiều. Khi vào thực hành các bạn sẽ hiểu rõ hơn công dụng của vùng này.

o Vùng số (5) là nơi hiển thị kết quả tính toán, thống kê, hay là các giá trị Measure tính được. Vùng này chỉ chấp nhận các cột là Measure.

 BIDS cung cấp cho người dùng phương pháp “Kéo-thả” rất dễ sử dụng. Cần tính toán đại lượng nào, ta chỉ cần kéo đại lượng đó từ bên trái qua vùng bên phải (đúng vị trí) và các giá trị của đại lượng đó sẽ được hiển thị rất nhanh chóng.

 Với thẻ Browser, người dùng có thể thống kê mọi danh danh mục theo yêu cầu từ nhà quản lý, với bất kì tiêu chí nào. Đồng thời, từ ưu điểm của việc lưu trữ dữ liệu hình sao trong DW, thời gian xử lý cho những thống kê này là không nhiều. Việc này

Nhóm 1 Trang 48

đòi hỏi Cube phải được xây dựng một cách đầy đủ, khoa học theo cách mục tiêu đặt ra từ ban đầu.

2.8.Cách sử dụng data mining wizard

Data Mining Wizard tạo ra cấu trúc mining mô tả các cột và huấn luyện dữ liệu mà bạn sẽ sử dụng cho việc khai khoáng, và một mô hình khai khoáng tùy chọn, trong đó có một số cột, áp dụng một thuật toán và định nghĩa cách sử dụng của từng cột cho thuật toán đó. Wizard tóm gọn hai đối tượng là mô hình và cấu trúc mining này thành một tập hợp đơn giản các bước sau:

 Chọn thuật toán của bạn hoặc chỉ chọn một cấu trúc.  Chọn các bảng nguồn và chỉ ra cách chúng được sử dụng.  Chọn các cột từ những bảng đó và chỉ ra cách sử dụng chúng.  Cuối cùng, chỉ ra dữ liệu và đặt tên cấu trúc và mô hình.

Lúc này, bạn có thể xử lý và phân tích kết quả của mô hình mà không mấy khó khăn nữa. Analysis service làm cho điều đó trở nên đơn giản hơn.

Sử dụng wizard thì khá đơn giản bởi vì một vài bước được thực hiện tự động dựa trên dữ liệu đầu vào mà bạn cung cấp. Là một người khai phá dữ liệu, việc hiểu các bước này là điều rất quan trọng, chẳng hạn như các quyết định khi nào và như thế nào sẽ tác động đến mô hình của bạn.

Hướng dẫn tạo cây quyết định:

 Bài toán: “Vẽ cây quyết định xem xét các thuộc tính ảnh hưởng tới ước lượng chi phí (PlannedCost).

 Hướng dẫn: Giai đoạn đầu tiên đối với mọi thuật toán đều phải tạo mô hình mining. Cách thực hiện như sau:

 Trong “Solution Explorer”, Right-Click vào thư mục “Mining Structures”, chọn “New Mining Structures”. (adsbygoogle = window.adsbygoogle || []).push({});

Nhóm 1 Trang 49

Hình 41

 Trong “Solution Explorer”, Right-Click vào thư mục “Mining Structures”, chọn “New Mining Structures”.

Hình 42

 Ở cửa sổ tiếp theo “Create the Data Mining Structure” cho phép chúng ta chọn thuật toán Mining. Bấm vào combobox “Which the datamining technique do you want to use?”. SSAS hỗ trợ tất cả các thuật toán thông dụng trong kĩ thuật Data

Nhóm 1 Trang 50

mining, Hình 61. Chọn “Microsoft Decision Trees” (cây quyết định) và click “Next”.

Hình 43

 Cửa sổ tiếp theo, Wizard yêu cầu chọn một Data Source Views để cung cấp dữ liệu cho thuật toán. Bạn chọn “Adventure Works2008R2_DV” và click “Next”.

Nhóm 1 Trang 51

Hình 44

 Cửa sổ tiếp theo chúng ta sẽ chọn lựa các thông tin cần thiết cho mô hình cây quyết định. Theo yêu cầu, chúng ta sẽ phân tích các yếu tố tác động đến PlannedCost. Vậy bảng “WorkOderRouting” sẽ là bảng Case.

Hình 45

 Cửa sổ tiếp theo cho phép chúng ta chọn các thuộc tính cần thiết cho mô hình Mining.

Nhóm 1 Trang 52

 Các thuộc tính liên quan đến “PlannedCost” sẽ hiện lên với mức “Score” là mức độ liên quan nhất. Theo tài liệu của Microsoft, nên lấy các thuộc tính có Score từ 0.05 trở lên để mô hình chính xác nhất.

Hình 47

o Bấm “OK” để trở lại màn hình 46. Lúc này, cột “Input đã được tự động điền các thông số như đã chọn.

o Chúng ta chọn thuộc tính “WorkOderID” ở cột “Key” để xác định khóa duy nhất của bảng (mặc định đã được chọn sẵn).

o Bấm “Next”.

 Cửa sổ tiếp theo, Data Mining Wizard cần xác định chính xác kiểu dữ liệu của các cột tham gia cây quyết định là “Continuous” (liên tục) hay “Discrete” (rời rạc). Đơn giản bạn chỉ cần bấm nút “Detect” để xác định đúng loại dữ liệu. Bấm “Next” để tiếp tục.

Nhóm 1 Trang 53

Hình 48

 Ở cửa sổ kế tiếp, cửa sổ “Create Testing Set” như ở hình 67, cho phép bạn xác định tỷ lệ phần trăm của dữ liệu kiểm tra (nhập vào 30) và số lượng cực đại các case trong việc kiểm tra tập dữ liệu (nhập vào 500). Và Click “Next”

Nhóm 1 Trang 54

Hình 49

 Màn hình cuối cùng của trình “Data Mining Wizard” hiện lên, hình 68, cho phép bạn xác định tên của cấu trúc và mô hình, cũng như đánh dấu check vào ô “Allow drill through” nếu nó được thuật toán hỗ trợ. Khi đã hoàn thành, Wizard sẽ tạo ra một cấu trúc mining chứa một mô hình mining và dẫn đến Cửa sổ thiết kế Data Mining. Bạn đặt tên là “Work Order Routing_cayquyetdinh”, và Click “Finish”, để hoàn tất.

Hình 50

Nhóm 1 Trang 55

Hình 51 (adsbygoogle = window.adsbygoogle || []).push({});

 Tại “Solution Explorer” đã xuất hiện mục “Work Order Routing _cayquyetdinh.dmm” vừa tạo trong thư mục “Mining Structures” (1).

 Khung hiển thị chứa 5 tab: o - Mining Structure o - Mining Models

o - Mining Model Viewer o - Mining Accuracy Chart o - Mining Model Prediction

 Tuy nhiên, để xem được cây quyết định này, chúng ta cần tiến hành Deploy lại Project để SSAS cập nhật những thay đổi trong cấu trúc project hiện tại.

 Chúng ta quan tâm tới thẻ “Mining Model Viewer”. Bấm chọn thẻ này trong vùng hiển thị cấu trúc của cây quyết định (2).

Bảng thông báo hiện ra yêu cầu mô hình mining vừa tạo cần được xử lý trước khi sử dụng thẻ “Mining Model Viewer”, chọn Yes.

Nhóm 1 Trang 56

Hình 52

 Màn hình “Process Mining Structure – Work Order Routing _cayquyetdinh” hiện ra, chọn “Run”. Hình 53.

Hình 53

 Màn hình “Process Progress” sau khi thực thi thành công, bạn chọn “close” để đóng lại. Hình 54. Sau đó, hộp thoại hình 53 sẽ quay trở lại, bạn chọn “Close”.

Nhóm 1 Trang 57

Hình 54

 Tại cửa sổ Mining Model Viewer cung cấp bộ điều khiển drop-down cho phép bạn chọn mô hình bạn muốn xem. Khi bạn chọn một mô hình, mô hình đó sẽ được biểu diễn. Tất cả các biểu diễn đều cho phép bạn xem từng phần của mô hình thông qua các tab ở trên viewer.

 Có hai loại view mô hình cơ bản: biểu đồ (diagram) và bảng (table). Kết quả mô hình mining cây quyết định hiện ra:

Nhóm 1 Trang 58

Vùng số (1) là các công cụ để tùy chỉnh cho cây quyết định này. Phóng to, thu nhỏ

cây, copy cây phân rã vào bộ nhớ, chuyển màu nền các giá trị phân rã, lùi hoặc tăng cấp trong cây… Các công cụ này khá đơn giản, bạn tự tìm hiểu thêm.

Vùng số (2) Mining Legend: Hiển thị các “phân rã” của thuộc tính cần dự đoán

Trong trường hợp này, đó là “Bronze”, “Golden”, “Silver”, “Missing”, “Normal”. Vùng này có các cột thống kê giữa các giá trị phân rã. Khi bấm vào mỗi Node trong vùng số (4), cột “Case”, “Probability” và “Histogram” sẽ hiển thị mối tương quan của mỗi giá trị. Chúng ta kết hợp mối tương quan này với vùng số (3) thì sẽ có được luật đối với mỗi giá trị phân rã.

Vùng số (3) hiển thị các “Luật” tìm được đối với mỗi Node (nút) trong cây quyết

định ở vùng số (4). Bạn bấm chọn vào 1 Node trong cây quyết định sẽ xem được các luật của Node này.

Vùng số (4) hiển thị cây quyết định. Cấu trúc cây quyết định này giống như các cây

quyết định hay gặp. Lưu ý, ở phía dưới mỗi Node của cây quyết định này đều có một thanh hiển thị độ tương quan giữa các giá trị phân rã trong vùng số (2). Muốn xem giá trị nào, chỉ cần check vào trước giá trị đó (vùng số (2)). Mặc định, các giá trị sẽ được check hết.

Ngoài ra, tại vùng (1) bên cạnh thẻ “Decision Tree”, là thẻ “Dependency Network” cho

chúng ta biết mức độ tác động mạnh – yếu đến PlannedCost.

Hình 56

Nhóm 1 Trang 59

CHƯƠNG IV: KẾT LUẬN

Trong quá trình tìm hiểu nghiên cứu đề tài, nhóm đã phần nào hoàn thành được đề tài với các nội dung: (adsbygoogle = window.adsbygoogle || []).push({});

- Tìm hiểu về Business Intelligence (BI), thành phần cấu trúc như thế nào,... - Tìm hiểu có những công cụ gì hỗ trợ BI cho doanh nghiệp. Lợi ích đem lại.

- Cách sử dụng công cụ Business Intelligence Development Studio (BIDS) và SQL Server 2008 Analysis Services (SSAS). Và việc sử dụng công cụ ấy trong OLAP, datamining như thế nào.

Qua đó, đề tài cũng cho chúng ta nhận thấy được việc ứng dụng triển khai BI trong thực tế tại Việt Nam nói riêng và quốc tế nói chung diễn ra hiện nay ngày càng tăng... Những lợi ích và tầm quan trọng mà BI đem lại cho doanh nghiệp ngày càng nhiều hơn., hứa hẹn cho một nền kinh tế đất nước tăng trưởng nhanh và chắc chắn

Rõ ràng, khi mà môi trường kinh doanh cạnh tranh ngày một khắc nghiệt, nhu cầu đòi hỏi cần phải có một giải pháp để hỗ trợ cho doanh nghiệp đưa ra những quyết định đúng đắn, kịp thời, chính xác hơn…nhằm giải quyết những vấn đề bức thiết trên, giúp tiết kiệm chi phí, tăng lợi nhuận cho công ty. Đó chính là áp dụng giải pháp kinh doanh thông minh cho doanh nghiệp của mình.

Đặc biệt là những sinh viên khoa công nghệ thông tin chúng ta, là những người được tiếp cận với khoa học tự động, được sự hướng dẫn tận tình của các thầy cô, các thế hệ trước phải có trách nhiệm trong tìm hiểu, ứng dụng khoa học công nghệ vào nhiều lĩnh vực, không ngừng đóng góp các ý tưởng, các sản phẩm cho xã hội.

Hi vọng thông qua bài báo cáo này của nhóm, các bạn có thêm đươc một kiến thức để áp dụng, hướng dẫn cho người khác, đồng thời phát triển nó, góp ích cho nền kinh tế nước nhà.

Nhóm 1 Trang 60

DANH MỤC TÀI LIỆU THAM KHẢO

1. http://bis.net.vn/forums/p/121/242.aspx

2. http://itstudent.net/

3. http://technet.microsoft.com/en-us/library/ms170208.aspx

4. http://technetvietnam.cloudapp.net

Một phần của tài liệu Tìm hiểu về công cụ SQL Server Business Intelligence (BI) Development Studio 2008 trên cơ sở dữ liệu mẫu Adventure Works (Trang 44)