Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 132 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
132
Dung lượng
4,36 MB
Nội dung
TíchhợpkhaiphádữliệutrongInfoSphereWarehousevớiviệctạobáocáoCognoscủa IBM, Phần 1: Tổng quan về kiến trúc tíchhợpInfoSphereWarehouse và Cognos Phổ biến kết quả khaiphádữliệucủa bạn một cách có hiệu quả Benjamin G. Leonhardi, Kỹ sư phần mềm, IBM Christoph Sieb, Kỹ sư phần mềm cao cấp, IBM Dr. Michael J. Wurst, Kỹ sư phần mềm cao cấp, IBM John Rollins, Ph.D., P.E., Chuyên viên kỹ thuật, IBM Tóm tắt: Khaiphádữliệu cung cấp các kỹ thuật phân tích nâng cao để trích xuất thông tin có ích từ dữliệu lớn. Về lịch sử, khaiphádữliệu là một nhiệm vụ mà chỉ các chuyên gia về thống kê và phân tíchdữliệu mới có thể thực hiện được. Mặt khác, các kết quả củaviệckhaiphádữliệu thường liên quan đến một loạt những người dùng khác nhau trên toàn công ty. Loạt bài viết này trình bày kiến trúc chung và các cơ hội nghiệp vụ để kết hợpkhaiphádữliệu IBM® InfoSphere™ Warehouse (Kho dữliệuInfoSpherecủaIBM ) vớiviệctạobáocáo Cognos® của IBM. Việctíchhợp này cho phép mọi người trên toàn công ty sử dụng các kết quả khaiphádữ liệu. Bài viết đầu tiên giới thiệu kiến trúc tíchhợp cơ bản và cũng bao gồm một nghiên cứu về trường hợp kỹ thuật, ngắn gọn để cung cấp cho bạn một sự hiểu biết cơ bản về cách đạt tới sự tíchhợp này. Mở đầu Khaiphádữliệu cho phép các chuyên gia, các nhà phân tích và những người sử dụng có được cái nhìn sâu sắc với các mẫu trong các bộ sưu tập dữliệu lớn và kết hợp chúng vào quy trình nghiệp vụ hàng ngày. Về lịch sử, khaiphádữliệu là một Simpo PDF Merge and Split Unregistered Version - http://www.simpopdf.com nhiệm vụ mà chỉ các chuyên gia về thống kê và phân tíchdữliệu mới có thể thực hiện được. Mặt khác, các kết quả củaviệckhaiphádữliệu thường liên quan đến những người dùng khác nhau trên toàn công ty. Hãy xem xét kịch bản sau đây. Bạn thu thập dữliệu về khách hàng của mình bao gồm các khía cạnh nhân khẩu học (như tuổi tác, nghề nghiệp và nơi cư trú) cũng như các giao dịch trong quá khứ (như các mặt hàng đã bán và các hợp đồng). Bộ phận tiếp thị của bạn muốn phát triển các đề xuất chào hàng mới được thiết kế riêng cho các nhóm khách hàng cụ thể với các đặc tính giống nhau. Làm thế nào để tìm ra các nhóm người dùng điển hình như vậy? Phân cụm dữliệu cung cấp một giải pháp cho vấn đề này. Nó tự động nhóm các tập dữliệu theo các đặc tính hoặc các tính năng của chúng. Sau đó, một nhà phân tích có thể rà soát lại các nhóm này và điều chỉnh chúng dần dần cho đến khi chúng đáp ứng các yêu cầu của mình. Ví dụ, một chuyên gia tiếp thị có thể thấy rằng có một nhóm khách hàng nhỏ nhưng là nhóm khách hàng quan trọng về kinh tế có độ tuổi trên trung bình và không sử dụng dịch vụ ngân hàng Internet. Dựa vào thông tin này, các đề xuất chào hàng riêng biệt có thể được thực hiện cho những khách hàng này. Một bước quan trọngtrong quá trình phân tích là cho phép những người dùng hiểu các kết quả của bước phân cụm dữliệu này. Các chuyên gia phân tích thường không phải là các chuyên gia về lập trình các cơ sở dữliệu mức thấp. Làm thế nào có thể phân phối các kết quả khaiphádữliệu đến các nhà phân tích và các nhân viên cần dùng nó? Làm thế nào có thể trình bày các kết quả sao cho phản ánh quy trình nghiệp vụ mà người dùng có dính líu đến? Làm thế nào có thể đáp ứng các yêu cầu an ninh, sao cho mỗi người dùng chỉ thấy những gì mà người ấy được xem theo quy định? Để đưa ra các câu trả lời thoả đáng cho những câu hỏi đó, cần di chuyển vị trí trong khung nhìn phối cảnh, rời xa các phân tích thống kê và tiến gần đến phía người dùng cuối thực tế và các quy trình nghiệp vụ mà người đó dính líu đến. InfoSphereWarehouse là nền móng vững mạnh cho việctạo kho Simpo PDF Merge and Split Unregistered Version - http://www.simpopdf.com dữliệu phạm vi toàn công ty. InfoSphereWarehouse cung cấp chức năng khaiphádữliệu trực tiếp trong cơ sở dữliệu DB2 ở bên dưới, nơi dữliệu thường trú. Có thể truy cập các chức năng đầy đủ bằng một nền tảng bộ công cụ dựa trên Eclipse, dễ sử dụng và các nhiệm vụ triển khai có thể được kích hoạt trực tiếp ngay trong bộ công cụ này. CognosIBM là một trong những người dẫn đầu thị trường về các giải pháp tạobáo cáo. Việctạobáocáo đóng một vai trò quan trọngtrong nhiều công ty vì nó giúp củng cố và trực quan hóa các thông tin liên quan theo nhiều cách khác nhau cho những khán giả đích khác nhau. Các kết quả được trình bày thường được rút ra bằng cách áp dụng các phép tính số học cơ bản đối với thông tin được lưu trữ trong kho dữliệu (ví dụ, doanh thu trung bình mỗi tháng). Các phân tích nâng cao, như trong ví dụ trên, không thuộc phạm vi và khả năng của một khung công tác tạobáo cáo. Điều này dẫn đến kết hợp cả hai, vừa sử dụng các khả năng phân tích nâng cao, quy mô linh hoạt củaInfoSphereWarehouse vừa sử dụng các khả năng tạobáocáo tinh vi đã được khẳng định củaCognos IBM. Các phần sau đây cho thấy cách có thể kết hợpkhaiphádữliệucủa Kho dữliệuInfoSphereIBM và CognosIBM theo một cách linh hoạt để đạt được mục tiêu này. Sự tíchhợp này không đòi hỏi bất kỳ việc lập trình hoặc thiết lập khác thường nào; tất cả có thể được thực hiện bằng cách chỉ sử dụng SQL thuần của DB2. Các phần sau đây trình bày ngắn gọn kiến trúc cơ bản củaInfoSphereWarehouse và IBM Cognos. Tiếp theo là các ý tưởng mức cao về cách có thể tíchhợp cả hai. Cuối cùng, sự tíchhợp này được trình diễn trong một ví dụ về lĩnh vực chăm sóc sức khỏe đơn giản, theo từng bước một. Các bài viết sắp tới của loạt bài này mô tả các khía cạnh về khái niệm và kỹ thuật tiên tiến hơn về sự tíchhợp này. Simpo PDF Merge and Split Unregistered Version - http://www.simpopdf.com Các thành phần sản phẩm IBMInfoSphereWarehouseInfoSphereWarehouse (Kho dữliệu InfoSphere) dựa vào DB2 để lưu trữ dữ liệu. Cơ sở dữliệu có sẵn một tính năng phân vùng (DPF) để lưu trữ với hiệu năng cao và an toàn, có khả năng mở rộng dữliệutrong kho dữ liệu, kết hợp các lợi thế của các cơ sở dữliệu xử lý giao dịch trực tuyến (OLTP) với các yêu cầu lưu trữ của các kho dữliệu lớn. InfoSphereWarehouse có sẵn với một loạt các công cụ để quản lý và phân tích kho dữ liệu. Các thành phần phân tích gồm Các dịch vụ tạo khối. Khaiphádữ liệu. Phân tích văn bản. InfoSphereWarehouse Design Studio (Xưởng thiết kế kho dữliệu InfoSphere) là nền tảng tạo công cụ dựa trên Eclipse được sử dụng để thiết kế các quy tắc về khối lượng công việc, các luồng biến đổi dữliệu và các luồng phân tích để khaiphádữliệu và phân tích văn bản. Sau đó, các luồng này có thể được triển khai tới bàn điều khiển quản trị InfoSphereWarehouse để được lập lịch biểu và chạy theo các yêu cầu. KhaiphádữliệuInfoSphereWarehouse được xây dựng với các thủ tục đã lưu của DB2 và các hàm do người dùng định nghĩa để thực hiện trong cơ sở dữliệuvới hiệu năng cao, lợi dụng DB2 làm một môi trường thực hiện. Có thể truy cập nó hoặc thông qua giao diện SQL của nó hoặc thông qua các luồng khaiphádữliệucủaInfoSphere Warehouse. Khaiphádữliệu là nhiệm vụ tìm kiếm thông tin có ích trong các tập dữliệu lớn. Một kịch bản điển hình sẽ được sử dụng khi chạy ví dụtrong bài viết này là chăm sóc sức khỏe. Hiện nay có thể thu thập một lượng lớn dữliệu chăm sóc sức khỏe, Simpo PDF Merge and Split Unregistered Version - http://www.simpopdf.com mô tả tình trạng của nhiều bệnh nhân khác nhau qua nhiều năm. Một công dụng quan trọngcủadữliệu này là để sớm tìm ra các chỉ báo cho các bệnh tiềm ẩn. Với mục đích này, bạn có thể thu thập dữliệucủa các bệnh nhân, ví dụ, mắc bệnh tim và phân tích các tham số nào, chẳng hạn như huyết áp và cân nặng, có liên quan với nó. Dữliệu này phải được thu gom và được chuyển đổi để có thể dùng nó cho việckhaiphádữ liệu. Cụ thể hơn, bạn cần phải có được một bảng chứa đúng một hàng cho một bệnh nhân và một số cột biểu diễn thông tin về bệnh nhân. Ngoài ra, cần có một cột riêng chỉ thị liệu bệnh nhân này có thực sự bị mắc bệnh không. Lược đồ có thể sẽ giống như Hình 1: Hình 1. Lược đồ của bảng cơ sở dữliệu bệnh tim (một phần của các ví dụInfoSphere Warehouse) Dựa trên dữliệu này, các thủ tục đã lưu trữ trongInfoSphereWarehouse có thể xây dựng một mô hình dự báo, cho bất kỳ bệnh nhân mới nào, cho biết liệu người đó có thể mắc bệnh tim tiềm ẩn hay không. Quá trình này được gọi là "mô hình hóa". Mô hình khaiphádữliệu XML được lưu trữ trong cơ sở dữliệu và có thể được truy cập thông qua SQL/XQuery. Nó có thể được sử dụng cho hai mục đích. Trước tiên, bạn có thể trích xuất thông tin từ mô hình này để có được các hiểu biết Simpo PDF Merge and Split Unregistered Version - http://www.simpopdf.com sâu sắc về những chỉ báo quan trọngcủa bệnh tim và thông tin thống kê khác. Thứ hai, mô hình này có thể được áp dụng tự động cho các bản ghi dữliệu mới. Như vậy, đối với bất kỳ các bản ghi nào còn chưa có giá trị nào trong cột bệnh tim, bạn có thể tự động điền thêm giá trị này, cùng với một giá trị biểu thị mức tin cậy rằng dựbáo này là chính xác. Quá trình này được gọi là "cho điểm". Hình 2 cho thấy điều này dưới dạng lược đồ: Hình 2. Dựa vào dữliệu lịch sử, một mô hình dựbáo được xây dựng để sau đó có thể được áp dụng cho dữliệu mới InfoSphereWarehouse chứa các cài đặt hiệu quả caocủa hầu hết các thuật toán khaiphádữliệu hiện tại. Khaiphádữliệu được gọi khi lần đầu tiên viết dữliệu vào một bảng. Sau đó, tạo ra một mô hình, sau này có thể áp dụng mô hình đó cho các bản ghi vẫn chưa biết được giá trị đích, cung cấp một dựbáo và một giá trị tin cậy cho dựbáo này. Tất cả các hàm khaiphádữliệu được gọi chỉ như các lệnh SQL bình thường, như bạn sẽ thấy dưới đây. Điều này cho phép tíchhợp dễ dàng trong hầu hết các thiết lập, chẳng hạn như các dịch vụ Web. IBMCognos 8 Business Intelligence IBMCognos 8 Business Intelligence (Tri thức nghiệp vụ Cognos 8 của IBM) cung cấp một tập đầy đủ về các khả năng tri thức nghiệp vụ (BI) và được dựa trên một kiến trúc hướng dịch vụ (SOA) linh hoạt. Các khả năng chính là tạobáo cáo, phân tích, các bảng đồng hồ và bảng điểm. Simpo PDF Merge and Split Unregistered Version - http://www.simpopdf.com Tạobáocáo được sử dụng để tổng hợpdữliệu liên quan về các quy trình nghiệp vụ và phân phối nó cho những người khaiphá tốt nhất từ thông tin cụ thể này. Trong môi trường khaiphádữ liệu, điều này có nghĩa là chuyển giao kết quả cho những người khaiphá tốt nhất từ những hiểu biết nghiệp vụ được tạo ra. Các thành phần củaCognos 8 cần thiết để tạo và xuất bản các bản ghi nghiệp vụ là: Cognos Connection (Kết nối Cognos): Cổng thông tin Web và điểm nhập vào chức năng củaCognos 8. Từ đây người dùng có thể quản lý, tổ chức và xem nội dung hiện tại như các bản ghi hay các bảng đồng hồ. Các studio (xưởng) thiết kế nội dung dựa trên web, như Report Studio, có thể được bắt đầu từ kết nối Cognos để tạo ra tài nguyên mới hoặc sửa đổi các tài nguyên hiện có. Nó cũng được sử dụng để quản lý máy chủ Cognos, ví dụ, để thay đổi các hạn chế truy cập, nhập khẩu nội dung, hoặc thay đổi danh sách những người cần gửi bản ghi đến. Cognos Framework Manager (Nhà quản lý khung công tác Cognos): Công cụ mô hình hóa cho các nguồn dữliệu được sử dụng trongCognos 8. Dữliệu từ hầu hết các cơ sở dữliệu và các nguồn khác, như các dịch vụ Web, ví dụ, có thể được truy cập vào các bản ghi củaCognos bằng cách mô tả một tầng siêu dữliệutrong Framework Manager (Nhà quản lý khung công tác). Các bảng, các khung nhìn cơ sở dữliệu và các thủ tục đã lưu trữ có thể được thêm vào một gói Cognos làm các chủ đề truy vấn. Framework Manager được sử dụng để nhập khẩu và hợp nhất thông tin có sẵn trong các nguồn dữliệu khác nhau trong công ty để cho thông tin có thể được sử dụng theo cách chặt chẽ trong các công cụ BI củaCognos 8 như Report Studio. Điều quan trọng cần lưu ý rằng chính dữliệu được lưu giữ trong nguồn dữliệu và được truy cập khi báocáo được tạo ra. Simpo PDF Merge and Split Unregistered Version - http://www.simpopdf.com Cognos Report Studio (Xưởng tạobáocáo Cognos): Một trong các xưởng thiết kế nội dung dựa trên Web củaCognos 8 BI. Nó được dùng để tạo và chỉnh sửa các bản ghi phức tạp về dữliệu đã được mô tả trong Framework Manager. Nó cung cấp chức năng mạnh mẽ như truy vấn ngược (drill- down), nhắc nhở và một thư viện tạo biểu đồ toàn diện. Để làm cho dữliệu có sẵn trong một báo cáo, cần thực hiện một vài bước: Trong Framework Manager, Trình mô hình hóa dữliệutạo ra siêu dữliệuCognos để mô tả dữliệutrong cơ sở dữliệu từ một khung nhìn phối cảnh nghiệp vụ (bao gồm cả quan hệ giữa các bảng, các tên nghiệp vụ của các giá trị và v.v). Sau khi siêu dữliệu đã được mô hình hóa, nó được triển khai như là một gói vào kho lưu trữ nội dung Cognos 8. Từ đó, nó có thể được truy cập thông qua kết nối Cognos và các xưởng thiết kế nội dung. Nhà thiết kế báocáo nhập Kết nối Cognos và tạo ra một báocáo mới về gói đã triển khai. Sau khi tạo ra báocáo này, có thể quản trị nhóm đích và dạng phân phối (như thư điện tử hoặc cổng thông tin Web). Khả năng tạo các báocáo từ các nguồn dữliệu quan hệ là chìa khóa cho sự tíchhợpkhaipháInfoSphereWarehouse và Cognoscủa IBM. Kiến trúc tíchhợp Nội dung của các báocáoCognosbao gồm một tập kết quả do một nguồn dữliệu quan hệ cung cấp, như mô tả ở trên. Nội dung của một báocáo cụ thể được xác Simpo PDF Merge and Split Unregistered Version - http://www.simpopdf.com định bởi một truy vấn SQL (động) cho một hoặc nhiều nguồn dữ liệu. Bạn có thể sử dụng mô hình giao tiếp cơ bản này để tíchhợpkhaiphádữliệu và tạobáocáoCognos theo các cách sau: Cognos có thể được sử dụng để hiển thị bảng cho điểm, có thể kèm theo thông tin về độ tin cậy. Cognos có thể được sử dụng để hiển thị thông tin mô hình. Thông tin này được trích xuất từ các mô hình XML thực tế bằng các hàm của trình trích xuất bảng hoặc bằng các truy vấn XQuery. Cognos có thể gọi khaiphádữliệu và cho điểm tự động bằng cách gọi các thủ tục SQL đã lưu trữ. Điều này cho phép thực hiện như sau: o Gọi khaiphádữliệuvới các giá trị cài đặt khác nhau do người dùng cung cấp trong giao diện tạobáo cáo. o Gọi khaiphádữliệu trên các tập con dữliệu khác nhau (ví dụ, để tạo ra các báocáo truy vấn ngược đệ quy). o Các bản ghi cho điểm động dựa trên các đầu vào của người dùng. Hình 3 tóm tắt lược đồ cuộc gọi được sử dụng trong tất cả các trường hợp này. Hình 3. Kiến trúc tíchhợp cơ bản củakhaiphádữliệuIBMInfoSphere và Simpo PDF Merge and Split Unregistered Version - http://www.simpopdf.com tạobáocáoIBMCognosKhaiphádữliệu được gọi bằng một cuộc gọi thủ tục đã lưu trữ và tạo ra một mô hình khaiphá XML trong cơ sở dữ liệu. Mô hình này có thể được ghi vào dữliệu mới hoặc thông tin mô hình có thể được trích xuất vào một bảng. Các bảng này có thể được Cognos tiêu dùng. Người dùng có thể gọi tương tác khaiphá bằng cách gọi một thủ tục đã lưu tương ứng trên cơ sở dữliệutrong một báocáo Cognos. Việctíchhợp này cung cấp nhiều lợi ích: Nó là rất đơn giản và chỉ cần kiến thức SQL và không cần lập trình bổ sung. Các mô hình khaiphá được lưu trữ trong cơ sở dữliệu và có thể được truy cập một cách an toàn, hiệu quả từ Cognos. Sử dụng các thủ tục đã lưu, toàn bộ quy trình khaiphá có thể được kích hoạt và được điều khiển từ Cognos. Phần tiếp theo là một ví dụ từng bước cho kiểu tíchhợp này, nó cũng là một ví dụ đơn giản nhất: cho điểm các bản ghi trong cơ sở dữliệu và hiển thị các kết quả trong một báocáo Cognos. Việc trích xuất thông tin mô hình và gọi khaiphádữ Simpo PDF Merge and Split Unregistered Version - http://www.simpopdf.com [...]... http://www.simpopdf.com Tích hợpkhaiphádữliệutrongInfoSphereWarehouse với việc tạobáocáoCognoscủa IBM, Phần 2: Phát hiện sai lệch vớiInfoSphereWarehouse và Cognos Phổ biến kết quả khaiphádữliệucủa bạn có hiệu quả Benjamin G Leonhardi, Kỹ sư phần mềm, IBM Christoph Sieb, Kỹ sư phần mềm cao cấp, IBM Dr Michael J Wurst, Kỹ sư phần mềm cao cấp, IBM Tóm tắt: Trong phần trước của loạt bài này, bạn đã... rằng dữliệucủa bạn có chứa dữliệu không đúng, thì bạn có thể áp dụng việc phát hiện sai lệch để làm sạch dữ liệu, vì thế hãy tìm kiếm các mục nhập không đúng trong cơ sở dữliệucủa bạn Trong trường hợp thứ hai, dữliệu đúng, nhưng cho biết rằng một số các quy trình được phản ánh trong các dữliệu cho thấy có hành vi bất thường Cùng vớiviệc làm sạch dữ liệu, ứng dụng phát hiện sai lệch Simpo PDF. .. (drill-through), việc sử dụng các số liệu thống kê trong nhà quản lý khung công tác và cuộc gọi động khaiphádữliệu từ các báocáoCognos Mục lục Mở đầu Các thành phần sản phẩm Kiến trúc tíchhợp Sử dụng các kết quả khai phádữliệutrong các báo cáo Cognos: Một ví dụ từ lĩnh vực chăm sóc sức khỏe Kết luận và triển vọng Simpo PDF Merge and Split Unregistered Version - http://www.simpopdf.com Tíchhợp khai. .. PDF Merge and Split Unregistered Version - http://www.simpopdf.com liệu động từ các báocáoCognos sẽ được trình bày trong các bài viết tiếp theo của loạt bài này Sử dụng các kết quả khai phádữliệutrong các báo cáo Cognos: Một ví dụ từ lĩnh vực chăm sóc sức khỏe Ví dụ này phân tíchdữliệu bệnh nhân trong bệnh viện Khoa tim mạch của bệnh viện có toàn bộ các hồ sơ chính về bệnh nhân của họ cùng với. .. report (Chạy báo cáo) để xem báocáo kết quả Hình 11 cho thấy báocáo cuối cùng Cột cuối cùng bên cho thấy sự phân loại nguy cơ Simpo PDF Merge and Split Unregistered Version - http://www.simpopdf.com Hình 11 Báocáo nguy cơ bệnh tim trong lĩnh vực Chăm sóc sức khỏe Kết luận và triển vọng Bài viết này mô tả kiến trúc cơ bản cho phép tíchhợp đơn giản việckhaiphádữliệuInfoSphere vào báocáoCognos Nó... các kết quả khaiphádữliệu đơn giản trongIBMCognosTrong bài viết này, hãy tìm hiểu một số kỹ thuật tiên tiến, như hoạt động truy vấn ngược (drill-down) và trích xuất thông tin có cấu trúc từ các mô hình khaiphádữliệuvớiCognos Khi sử dụng kịch bản nghiệp vụ và ví dụ hoạt động đi kèm, cần hiểu nhiệm vụ khaiphádữliệu về phát hiện sai lệch, đó là, nhiệm vụ nhận biết các bản ghi dữliệu khác... ngoại lệ bằng InfoSphereWarehouse và cách gán các mức độ lệch cho các bản ghi dữliệu riêng rẽ Một ví dụ thực tế Trong ví dụ sau đây, việc phát hiện sai lệch được áp dụng cho các mục nhập về các khách hàng của ngân hàng Dữliệu mẫu của bảng tương ứng được chỉ trong Hình 2 Bảng BANK.BANKCUSTOMERS đi kèm với các mẫu củaInfoSphereWarehouse Hình 2 Dữliệu mẫu trong bảng BANK.BANKCUSTOMERS Để phát hiện các... lệch trongInfoSphereWarehouseTrong những năm gần đây, người ta đã đề xuất nhiều phương pháp khác nhau để phát hiện sai lệch InfoSphereWarehouse sử dụng một phương pháp đặc biệt mạnh mẽ dùng để phát hiện sai lệch đó là dựa trên phân cụm dữliệu Phân cụm biểu thị một kỹ thuật khai phádữliệu để phân nhóm các bản ghi dữliệu thành các cụm (cluster) có cặp bản ghi giống nhau theo các đặc tính của chúng... lệch, đó là, nhiệm vụ nhận biết các bản ghi dữliệu khác thường Xem cách tìm các bản ghi như vậy vớikhaiphádữliệuIBMInfoSphereWarehouse (Kho dữliệuInfoSpherecủa IBM) và tạo các báocáo tương tác cho phép thăm dò tương tác Mở đầu Phát hiện hành vi đáng ngờ đúng lúc là một nhiệm vụ quan trọngtrong nhiều ứng dụng CNTT hiện nay Ví dụ, hãy tưởng tượng các giao dịch thẻ tín dụng Nếu một người... trình soạn thảo khai phá, thiết lập Percentage (Tỷ lệ phần trăm) của đặc tính dữliệu kiểm tra là 20 Điều này có nghĩa chúng ta sẽ sử dụng 20 phần trăm dữliệu để xác nhận hợp lệ mô hình của chúng ta sau đó Vì vậy, bạn phải phân chia dữliệu trước khi xây dựng mô hình dựbáo 7 Trong bảng các toán tử, trong phần Mining Operators (Các toán tử khai phá) , chọn một toán tử Predictor (Trình dự báo) và kéo nó . Tích hợp khai phá dữ liệu trong InfoSphere Warehouse với việc tạo báo cáo Cognos của IBM, Phần 1: Tổng quan về kiến trúc tích hợp InfoSphere Warehouse và Cognos Phổ biến kết quả khai phá dữ. và các cơ hội nghiệp vụ để kết hợp khai phá dữ liệu IBM InfoSphere Warehouse (Kho dữ liệu InfoSphere của IBM ) với việc tạo báo cáo Cognos của IBM. Việc tích hợp này cho phép mọi người trên. Khả năng tạo các báo cáo từ các nguồn dữ liệu quan hệ là chìa khóa cho sự tích hợp khai phá InfoSphere Warehouse và Cognos của IBM. Kiến trúc tích hợp Nội dung của các báo cáo Cognos bao