1. Trang chủ
  2. » Luận Văn - Báo Cáo

Báo cáo data mining trong sql server 2008

75 1,3K 9

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 75
Dung lượng 5,98 MB

Nội dung

Báo cáo data mining trong sql server 2008, báo cáo hay

Đại Học Khoa Học Tự Nhiên Khoa Toán – Tin Học oOo Bộ môn: Trí Tuệ Nhân Tạo DATA MINING TRONG SQL SERVER 2008 Giáo viên hướng dẫn: Th.S Phạm Thi Vương Sinh viên thực hiện: Bùi Ngô Dạ Thảo 0611203 Trần Quang Ánh 0611304 Trần Thượng Khanh 0611082 Thành phố Hồ Chí Minh, tháng 1 – 2010 Data Mining trong SQL SERVER 2008 BND Thảo, TQ Ánh, TT Khanh Mục lục 2 Data Mining trong SQL SERVER 2008 BND Thảo, TQ Ánh, TT Khanh Lời mở đầu Hiện nay trên thế giới, dữ liệu số ngày càng tăng trưởng với tốc độ chóng mặt. Các giao dịch tài chính, phân tích quảng cáo trực tuyến, thông tin về sở thích của người tiêu dùng, và các kết quả nghiên cứu khoa học có ý nghĩa to lớn đều hướng đến khối lượng dữ liệu khổng lồ đó. Song song với sự phát triển của công nghệ, nhu cầu tích hợp công nghệ vào tất cả các lĩnh vực của đời sống con người cũng ngày càng phát triển mạnh mẽ. Cùng với sự thay đổi xu hướng với tốc độ như hiện nay, chúng ta không thể có đủ thời gian cho việc xem xét dữ liệu lịch sử chỉ để xác định điều gì đã xảy ra để đưa ra chiến thuật điều khiển hiệu quả các yếu tố tác động. Vì vậy, một vấn đề bức thiết đặt ra là phải có một công cụ để khai khoáng dữ liệu một cách hiệu quả và nhanh chóng. Việc phân tích tự động hay các thuật toán phức tạp để xác định xu hướng và dự báo các vấn đề trong tương lai đang là một bài toán mở. SQL Server 2008 đã phát triển bộ công cụ Data Mining hiệu quả và phần nào giải quyết được một số vấn đề nan giải nói trên. Nhóm tác giả 3 Data Mining trong SQL SERVER 2008 BND Thảo, TQ Ánh, TT Khanh I. Giới thiệu Data Mining I.1. Lịch sử Khai khoáng dữ liệu • Khai khoáng dữ liệu ( Data Mining ) là một khái niệm bao hàm các kỹ thuật trong việc tìm ra các giá trị thông tin tiềm ẩn trong các dữ liệu lớn , nhiều bộ dữ liệu . Theo đó bản chất của khai khoáng dữ liệu là sử dụng toán học để tìm ra các bản chất , phân tích đánh giá các bộ dữ liệu , và sử dụng một số kỹ thuật để tìm ra các mẫu có tính chính quy . • Trong “Phát hiện tri thức trong cơ sở dữ liệu” của hai tác giả Fayyad, Piatestsky- Shapiro và Smyth ( 1988 ) đã chỉ ra quá trình tìm kiếm các tri thức có ích từ nhiều bộ dữ liệu hoặc các bộ dữ liệu lớn . Và khai khoáng dữ liệu nằm trong quá trình này. Hình : mô tả quá trình Tìm kiếm tri thức trong dữ liệu . • Và cho đến này khai khoáng dữ liệu vẫn là một vấn đề được nghiên cứu và sử dụng rất nhiều trong các lĩnh vực : tài chính , kinh tế , dự báo thị trường , khoa học . I.2. Tổng quan một số phương pháp trong khai khoáng dữ liệu I.2.1. Cây quyết định (Decision Tree) Cây quyết định là một mô hình , kỹ thuật máy học dung trong dự báo các thông tin dựa trên việc tính toán các xác suất có điều kiện . Việc kết hợp giữa các chứng minh toán học và tính toán nhằm hỗ trợ việc mô tả , tổng quát các dữ liệu cho trước . Trong lĩnh vực máy học , cây quyết định là một kiểu mô hình dự báo (predictive model), nghĩa là một ánh xạ từ các quan sát về một sự vật , hiện tượng tới các kết luận về giá trị mục tiêu của sự vật , hiện tượng. Mỗi một nút trong (internal node) tương ứng với một biến; đường nối giữa nó với nút con của nó thể hiện một giá trị cụ thể cho biến đó. Mỗi nút lá đại diện cho giá trị dự đoán của biến mục tiêu, cho trước các giá trị của các biến được biểu diễn bởi đường đi từ nút gốc tới nút lá đó. Kỹ thuật học máy dùng trong cây 4 Data Mining trong SQL SERVER 2008 BND Thảo, TQ Ánh, TT Khanh quyết định được gọi là học bằng cây quyết định, hay chỉ gọi với cái tên ngắn gọn là cây quyết định. Học bằng cây quyết định cũng là một phương pháp thông dụng trong khai phá dữ liệu. Khi đó, cây quyết định mô tả một cấu trúc cây, trong đó, các lá đại diện cho các phân loại còn cành đại diện cho các kết hợp của các thuộc tính dẫn tới phân loại đó. Một cây quyết định có thể được học bằng cách chia tập hợp nguồn thành các tập con dựa theo một kiểm tra giá trị thuộc tính . Quá trình này được lặp lại một cách đệ qui cho mỗi tập con dẫn xuất. Quá trình đệ qui hoàn thành khi không thể tiếp tục thực hiện việc chia tách được nữa, hay khi một phân loại đơn có thể áp dụng cho từng phần tử của tập con dẫn xuất. Một bộ phân loại rừng ngẫu nhiên (random forest) sử dụng một số cây quyết định để có thể cải thiện tỉ lệ phân loại. Cây quyết định cũng là một phương tiện có tính mô tả dành cho việc tính toán các xác suất có điều kiện. Cây quyết định có thể được mô tả như là sự kết hợp của các kỹ thuật toán học và tính toán nhằm hỗ trợ việc mô tả, phân loại và tổng quát hóa một tập dữ liệu cho trước. Dữ liệu được cho dưới dạng các bản ghi có dạng: (x, y) = (x 1 , x 2 , x 3 , x k , y) Biến phụ thuộc (dependant variable) y là biến mà chúng ta cần tìm hiểu, phân loại hay tổng quát hóa. x 1 , x 2 , x 3 là các biến sẽ giúp ta thực hiện công việc đó Các loại cây quyết định : • Cây phân loại : nếu y là một biến phân loại như : nắng mưa , nam hoặc nữ . • Cây quyết định : dùng để ước lượng các hàm giá trị thực thay vì sử dụng phương pháp phân loại . Ví dụ cụ thể : Khanh là quản lý của một câu lạc bộ đánh golf nổi tiếng. Anh ta đang có rắc rối chuyện các thành viên đến hay không đến. Có ngày ai cũng muốn chơi golf nhưng số nhân viên câu lạc bộ lại không đủ phục vụ. Có hôm, không hiểu vì lý do gì mà chẳng ai đến chơi, và câu lạc bộ lại thừa nhân viên. Mục tiêu của Khanh là tối ưu hóa số nhân viên phục vụ mỗi ngày bằng cách dựa theo thông tin dự báo thời tiết để đoán xem khi nào người ta sẽ đến chơi golf. Để thực hiện điều đó, anh cần hiểu được tại sao khách hàng quyết định chơi và tìm hiểu xem có cách giải thích nào cho việc đó hay không. 5 Data Mining trong SQL SERVER 2008 BND Thảo, TQ Ánh, TT Khanh Vậy là trong hai tuần, anh ta thu thập thông tin về: Trời (outlook) (nắng (sunny), nhiều mây (clouded) hoặc mưa (raining)). Nhiệt độ (temperature) bằng độ F. Độ ẩm (humidity). Có gió mạnh (windy) hay không. Và tất nhiên là số người đến chơi golf vào hôm đó. Khanh thu được một bộ dữ liệu gồm 14 dòng và 5 cột. Dữ liệu chơi Golf Sau đó để giải quyết bài toán , Khanh đã tạo mô hình cây quyết định như sau: 6 Data Mining trong SQL SERVER 2008 BND Thảo, TQ Ánh, TT Khanh Cây quyết định là một mô hình dữ liệu mã hóa phân bố của nhãn lớp (cũng là y) theo các thuộc tính dùng để dự đoán. Đây là một đồ thị có hướng phi chu trình dưới dạng một cây. Nút gốc (nút nằm trên đỉnh) đại diện cho toàn bộ dữ liệu. Thuật toán cây phân loại phát hiện ra rằng cách tốt nhất để giải thích biến phụ thuộc, play (chơi), là sử dụng biến Outlook. Phân loại theo các giá trị của biến Outlook, ta có ba nhóm khác nhau: Nhóm người chơi golf khi trời nắng, nhóm chơi khi trời nhiều mây, và nhóm chơi khi trời mưa. Kết luận thứ nhất: nếu trời nhiều mây, người ta luôn luôn chơi golf. Và có một số người ham mê đến mức chơi golf cả khi trời mưa. Tiếp theo, ta lại chia nhóm trời nắng thành hai nhóm con. Ta thấy rằng khách hàng không muốn chơi golf nếu độ ẩm lên quá 70%. Cuối cùng, ta chia nhóm trời mưa thành hai và thấy rằng khách hàng sẽ không chơi golf nếu trời nhiều gió. Và đây là lời giải ngắn gọn cho bài toán mô tả bởi cây phân loại. Khanh cho phần lớn nhân viên nghỉ vào những ngày trời nắng và ẩm, hoặc những ngày mưa gió. Vì hầu như sẽ chẳng có ai chơi golf trong những ngày đó. Vào những hôm khác, khi nhiều người sẽ đến chơi golf, anh ta có thể thuê thêm nhân viên thời vụ để phụ giúp công việc. Kết luận là cây quyết định giúp ta biến một biểu diễn dữ liệu phức tạp thành một cấu trúc đơn giản hơn rất nhiều. I.2.2. Các phương pháp phân lớp và hồi quy Mục đích của phương pháp phân lớp là nhằm dự đoán những nhãn lớp cho các bộ dữ liệu. Phân lớp (classification) là quá trình nhóm một tập các đối tượng vật lý hoặc trừu tượng thành các nhóm hay các đối tượng tương tự nhau. Một lớp (class) là một tập các đối tượng dữ liệu trong đó các đối tượng trong cùng một lớp có sự tương tự hoặc khác nhau so với các đối tượng thuộc lớp khác. Việc phân lớp không bao giờ sử dụng độc lập mà nó thường được sử dụng kèm với các phương pháp khác. Khi một cách phân lớp được đưa ra cũng phải có một phương pháp áp dụng để đưa ra ý nghĩa của lớp đó. Ngày nay, có nhiều vấn đề nghiên cứu về phân lớp trong các lĩnh vực khác nhau như khai phá dữ liệu, thống kê, học máy, công nghệ dữ liệu không gian, sinh học. Do kích thước của các CSDL tăng lên rất nhanh, phân lớp đang là vấn đề được quan tâm trong nghiên cứu về khai phá dữ liệu. 7 Data Mining trong SQL SERVER 2008 BND Thảo, TQ Ánh, TT Khanh Trong khai phá dữ liệu, các vấn đề nghiên cứu trong phân lớp chủ yếu tập trung vào tìm kiếm các phương pháp phân lớp hiệu quả và tin cậy trong CSDL lớn. Các yêu cầu đặt ra đối với các phương pháp phân lớp đó là độ hiệu quả (effectiveness) và độ tuyến tính (scalability) của thuật toán, khả năng làm việc với các kiểu dữ liệu và các lớp có hình dạng phức tạp, các kĩ thuật phân lớp nhiều chiều và các phương pháp phân lớp gồm dữ liệu số và dữ liệu xác thực trong CSDL lớn Có rất nhiều thuật toán phân lớp khác nhau, việc lựa chọn một thuật toán thích hợp phụ thuộc vào kiểu dữ liệu cần thực hiện cũng như là mục đích của ứng dụng. Nếu phân lớp được xem như là công cụ mô tả hoặc thăm dò, khi đó phải thực hiện nhiều thuật toán phân lớp khác nhau trên cùng một phương pháp phù hợp nhất. Nói chung các thuật toán phân lớp được chia thành các nhóm sau: phương pháp phân hoạch, phương pháp phân cấp, phương pháp dựa vào mật độ, phương pháp chia lưới, phương pháp dựa vào mô hình, (thường áp dụng cho CSDL không gian) I.3. Bài toán thực tế của khai khoáng dữ liệu Khi khoa học công nghệ phát triển thì việc xử lý dữ liệu ngày càng được con người chú ý . Và việc tìm kiếm tri thức từ trong dữ liệu đã được sử dụng rất rộng rãi . Khai khoáng dữ liệu là một quá trình trong tìm kiếm tri thức trong dữ liệu , vì thế nó cũng được ứng dụng rất nhiều trong nhiều bài toán , lĩnh vực cụ thể : • Thông tin thương mại : phân tích thị trường , phân tích đầu tư , bảo hiểm , chứng khoán ,… • Thông Tin sản xuất : điều khiển và lên kế hoạch sản xuất , quản trị mạng , hệ thống sản xuất , phân tích các kết quả thực nghiệm … • Thông tin khoa học : cơ sở dữ liệu sinh học , thiên văn học , cơ sở dữ liệu đất … • Và một số ngành khác : trong xử lý ảnh , phim … Một số bài toán thực tế: I.3.1. Công ty Etoys Etoys là một ví dụ về khai khoáng mỏ dữ liệu trực tuyến. www.etoys.com bán các đồ chơi trực tuyến. Trên web site này, khách tham quan có thể chọn ''toy search'' (tìm đồ chơi). Bằng cách sử dụng một pull down menu, khách tham quan có thể chọn các tiêu chí cơ bản như tuổi của đứa bé, mức giá, và loại đồ chơi. Site khảo hàng trực tuyến Etoys.com sau đó cung cấp cho khách hàng một danh sách các đồ chơi đáp ứng các tiêu chí này, tiết kiệm cho họ thời gian, và sự hối hả khi phải đến cửa hàng đồ chơi để mua quà cho con. 8 Data Mining trong SQL SERVER 2008 BND Thảo, TQ Ánh, TT Khanh Hình : site mô tả web bán hàng của Etoys I.3.2. Tập đoàn Unilever Tập đoàn Unilever chuyên cung cấp các mặt hang về thực phẩm tiêu dùng và nhiều sản phẩm dùng cho chăm sóc cá nhân và gia đình . Sản phẩm của công ty đã được nhiều khách hàng trên thế giới ưa chuộng và công nhận . Để làm được điều ấy , công ty đã thu nhập thông tin khách hàng , từ địa chỉ cá nhân , giới tính , độ tuổi , thói quen tiêu dùng , các sản phẩm hay dùng . Sau đó Unilever sẽ chuyển về cho 1 công ty thứ 3 để làm việc phân tích , khám phá dữ liệu Từ đó đưa ra các định hướng phân tích kinh doanh . I.3.3. Bài toán của công ty Wireless Công ty Verizon Wireless là một công ty chuyên về cung cấp các thiết bị dịch vụ không dây lớn ở Mỹ . Dựa vào số liệu từ website công ty : http://www.verizonwireless.com thì năm 2007 công ty đạt số lượng 65 triệu khách hang . Thu nhập hàng năm là 43.5 tỷ USD . Công ty khi so sánh dữ liệu thu nhập thì phát hiện ra tỷ lệ khách hang từ bỏ sản phẩm của công ty là 2% / tháng tức là hơn 1 300 000 khách hang / tháng . Vì vậy khi tính toán chi phí thay thế là hàng trăm triệu USD / năm . Để khắc phục tình trạng này , công ty có 1 hướng giải quyết bình thường nhất đó là : ưu đãi , chào mời khuyến mãi cho tất cã các loại khách hang . Nhưng chi phí cho việc này lại rất tốn kém và khả năng thành công chưa cao . Bằng việc điều tra , tìm hiểu các số liệu bán hang cũ . Công ty đã đưa ra một giải pháp khác : xây dựng mô hình dự đoán các khách hàng sắp rời bỏ công ty . Từ đó công ty 9 Data Mining trong SQL SERVER 2008 BND Thảo, TQ Ánh, TT Khanh sẽ tung ra các sản phẩm , mặt hang khuyến mãi để giữ khách hang lại . Tìm hiểu thong tin của khách hang loại này để tiếp tục tung ra các kế hoạch phát triển mới . Kết quả : công ty đã giảm được tỷ lệ khách hàng rời bỏ < 1.5% / tháng I.3.4. Phân tích dữ liệu mua hàng tiêu dùng của khách hàng Trong thời buổi kinh tế thị trường như hiện nay, mọi thứ đều trở nên rất đắt đỏ, mọi người đều phải tự điều chỉnh chi tiêu sao cho phù hợp với nhu cấu của mình. Có lẽ như thế mà người ta có xu hướng đi siêu thị nhiều hơn là đi chợ. Vào đó, người ta có thể mua nhiều thứ cùng lúc, không phải trả giá mà lại tiết kiệm được thời gian, chi phí vận chuyển, hay những chi phí tương tự thế… Vì nó tiện lợi, nó hữu ích nên người ta thích nó.Họ có thể mua mặt hàng này, mặt hàng khác hay nhiều mặt hàng khác nữa. Nhu cầu của mỗi người là khác nhau, vậy làm sao mà một nhà quản lý có thể nắm bắt được nhu cầu đó của mỗi khách hàng, để có thể biết được là mình cần nhập về loại hàng gì và nhập với số lượng bao nhiêu? Đó là vấn đề đặt ra buộc doanh nghiệp phải giải quyết??? Dựa vào các luật trong Data Mining chúng ta có thể phân tích được nhu cầu đó của khách hàng .Có thể nói là nếu như một khách hàng mua một hay nhiều mặt hàng thì kéo theo là họ sẽ mua những mặt hàng nào khác đi kèm .Từ đó ta có thể thống kê được nhu cầu mua hàng của khách và cũng chính là nhu cầu hàng mà ta nhập về. Điều này thật cần thiết cho mỗi doanh nghiệp, nếu muốn phát triển nhanh và thu hút được khách hàng .Họ phải nắm bắt được nhu cầu và thị hiếu của khách hàng và Data Mining là công cụ hỗ trợ trong vấn đề đó ,nó giúp tìm ra các luật và hỗ trợ xem là quyết định nhập hàng về của họ là có đúng không? Qua việc sử dụng các thuật giải trong Khai pha dữ liệu và bộ dữ liệu Walmart 1997 . Nhóm tác giải đã đưa ra nhận định sau : • Nếu một khách hàng mua trái cây tươi nhiều thì họ sẽ mua phô mai nhiều • Nếu một khách hàng mua Soup nhiều thì họ sẽ mua phô mai rất nhiều . II. Khai khoáng dữ liệu với SQL SERVER 2008 2.1. Sơ lược về SQL SERVER II.1.1. Lịch sử SQL SERVER SQL SERVER phiên bản đầu tiên được ra đời vào năm 1989 , với phiên bản SQL SERVER 1.0 do sự hợp tác giữa Microsoft , Sybase, Ashon-Tate . Sau đó được nâng cấp lên SQL SERVER 3.0 trên nền Unix . Sau đó MS SQL SERVER 4.2 được công bố từ năm 10 [...]... (WinNT) 11 - Data Mining trong SQL SERVER 2008 BND Thảo, TQ Ánh, TT Khanh SQL Server 7.0 - 1999 8.0 2000 8.0 2003 9.0 2005 SQL Server 2005 Yukon 10.0 2008 SQL Server 2008 Katmai OLAP Tools Plato SQL Server 2000 Shiloh SQL Server 2000 64-bit Edition Liberty Công dụng của SQL SERVER : SQL SERVER là một hệ quản trị cơ sở dữ liệu được phát triển bởi Microsoft Nó sử dụng ngôn ngữ truy vấn duy nhất là T -SQL và... phát triển của SQL SERVER 2008 SQL SERVER 2008 là phiên bản hiện tại của dòng sản phẩm SQL SERVER SQL Server 2008 cũng bao gồm hỗ trợ cho các kiểu cấu trúc và bán cấu trúc dữ liệu, bao gồm các phương tiện truyền thông kỹ thuật số định dạng cho hình ảnh, âm thanh, video đa phương tiện và các dữ liệu Trong các phiên bản hiện tại, dữ liệu đa phương tiện như vậy 12 Data Mining trong SQL SERVER 2008 BND Thảo,... vấn duy nhất là T -SQL và ANSI SQL SERVER còn hỗ trợ nhiều công nghệ trong việc phân tích và quản lý dữ liệu : • SQL SERVER ENGINE : bộ công cụ hõ trợ cơ chế quản lý dữ liệu của SQL SERVERSQL SERVER ANALYSIS SERVICE : bộ công cụ hỗ trợ việc phân tích các dữ liệu , số liệu • SQL SERVER REPORTING SERVICES : bộ công cụ hỗ trợ việc thiết lập các báo cáo cơ sở dữ liệu • SQL SERVER INTEGRATION : công cụ... phiên bản thứ ba của SQL Server có hỗ trợ các công cụ kỹ thuật khai khoáng dũ liệu Từ khi xuất hiện lần đầu trong phiên bản 2000 , MS đã xây dựng công cụ Analysis Service để hỗ trợ người dùng trong việc phân tích dữ liệu Phiên bản Năm phát hành Tên phát hành Tên mã 1.0 1989 SQL Server 1.0 1993 SQL Server 4.21 - 6.0 1995 SQL Server 6.0 SQL9 5 6.5 1996 SQL Server 6.5 Hydra 7.0 1998 SQL Server 7.0 Sphinx... cầu với SQL Server mở rộng và các loại dự án, các công cụ, điều khiển và các dự án cho các báo cáo, ETL , OLAP và các cấu trúc khai khoáng dữ liệu SQL SERVER 2008 với công cụ Khai khoáng dữ liệu có thể tích hợp với bộ OFFICE 2007 trong môi trường Excel và Visio Quy trình làm việc của Khai khoáng dữ liệu trong SQL SERVER 2008: II.2 Các quy trình làm việc của Data Mining Quá trình minh họa trong biểu... Services 2008 Database trong hộp thoại New Project (như ở hình 3) Một wizard sẽ xuất hiện cho phép bạn chỉ ra server và tên cơ sở dữ liệu nguồn,, sau đó giải nén metadata vào một project mới Chú ý rằng bạn vẫn phải thiết lập tùy chọn triển khai để cho biết server đích và tên cơ sở dữ liệu cần thiết 34 Data Mining trong SQL SERVER 2008 BND Thảo, TQ Ánh, TT Khanh IV.1.3 Tạo các đối tượng data mining Sau... bạn chọn, tổ chức, khám phá và điều khiển dữ liệu 35 Data Mining trong SQL SERVER 2008 BND Thảo, TQ Ánh, TT Khanh Cách tạo Data Source View MovieClick: • Right-click thư mục Data Source Views trong Solution Explorer hoặc Oject Explorer và chọn New Data Source View để đến Data Source View Wizard • Bỏ qua cửa sổ giới thiệu Ở cửa sổ kế tiếp, cửa sổ Data Source View Wizard, mặc định dữ liệu nguồn MovieClick... liệu mới trên server khi bạn có quyền Admin bằng cách chọn Create New Database, ghi rõ tên server và bộ dữ liệu 31 Data Mining trong SQL SERVER 2008 BND Thảo, TQ Ánh, TT Khanh Hình 2: Hộp thoại kết nối tới cơ sở dữ liệu trong chế độ Immediate Chế độ Offline Khi bạn làm việc với chế độ Offline, project của bạn sẽ chứa các file được lưu trữ trên máy client Khi bạn thay đổi các đối tượng trong môi trường,... sử dụng công cụ Training dataset để xây dựng các mô hình, và kiểm tra dataset để kiểm tra tính chính xác của các mô hình dự đoán bằng cách tạo ra các truy vấn Trong SQL Server 2008 và Analysis Services, phân vùng này có thể được thực hiện tự động, trong khi xây dựng các mô hình khai khoáng Để biết thêm thông tin, xem thêm Validating Data Mining Models (Analysis Services - Data Mining) Bạn có thể khám... hoạt động bên trong project Analysis Services đều giống nhau đối với bất kỳ chế độ hoạt động nào bạn chọn Để thực hiện nhiệm vụ data mining, bạn phải chỉ rõ và mô tả dữ liệu nguồn và sau đó tạo ra cấu trúc và mô hình mining Tìm hiểu các dữ liệu nguồn: • Vấn đề thứ nhất là vị trí dữ liệu Không giống như hầu hết các sản phẩm data mining, SQL Server Data mining là một giải pháp dựa vào Server Điều này . - 4.21 (WinNT) 1993 SQL Server 4.21 - 6.0 1995 SQL Server 6.0 SQL9 5 6.5 1996 SQL Server 6.5 Hydra 7.0 1998 SQL Server 7.0 Sphinx 11 Data Mining trong SQL SERVER 2008 BND Thảo, TQ Ánh, TT Khanh - 1999 SQL Server. Tools Plato 8.0 2000 SQL Server 2000 Shiloh 8.0 2003 SQL Server 2000 64-bit Edition Liberty 9.0 2005 SQL Server 2005 Yukon 10.0 2008 SQL Server 2008 Katmai Công dụng của SQL SERVER : SQL SERVER là một. 0611082 Thành phố Hồ Chí Minh, tháng 1 – 2010 Data Mining trong SQL SERVER 2008 BND Thảo, TQ Ánh, TT Khanh Mục lục 2 Data Mining trong SQL SERVER 2008 BND Thảo, TQ Ánh, TT Khanh Lời mở đầu Hiện

Ngày đăng: 25/05/2014, 13:59

HÌNH ẢNH LIÊN QUAN

Hình : mô tả quá trình Tìm kiếm tri thức trong dữ liệu . - Báo cáo data mining trong sql server 2008
nh mô tả quá trình Tìm kiếm tri thức trong dữ liệu (Trang 4)
Hình : site mô tả web bán hàng của Etoys - Báo cáo data mining trong sql server 2008
nh site mô tả web bán hàng của Etoys (Trang 9)
Hình 3-3 Chú ý: - Báo cáo data mining trong sql server 2008
Hình 3 3 Chú ý: (Trang 23)
Hình 1 : BI Dev Studio. - Báo cáo data mining trong sql server 2008
Hình 1 BI Dev Studio (Trang 29)
Hình 2: Hộp thoại kết nối tới cơ sở dữ liệu trong chế độ Immediate Chế độ Offline - Báo cáo data mining trong sql server 2008
Hình 2 Hộp thoại kết nối tới cơ sở dữ liệu trong chế độ Immediate Chế độ Offline (Trang 32)
Hình 3. Hộp thoại New Project. - Báo cáo data mining trong sql server 2008
Hình 3. Hộp thoại New Project (Trang 33)
Hình 4 : Hộp thoại Project Properties. - Báo cáo data mining trong sql server 2008
Hình 4 Hộp thoại Project Properties (Trang 34)
Hình 5 : DSV MovieClick hoàn thành. - Báo cáo data mining trong sql server 2008
Hình 5 DSV MovieClick hoàn thành (Trang 39)
Hình 6.  Khám phá dữ liệu với PivotTable. - Báo cáo data mining trong sql server 2008
Hình 6. Khám phá dữ liệu với PivotTable (Trang 40)
Bảng và biểu đồ có thể được điều chỉnh, hoặc bằng cách chọn các đối tượng theo giao diện,  hoặc bằng cách sử dụng các lựa chọn trên tab General của hộp thoại. - Báo cáo data mining trong sql server 2008
Bảng v à biểu đồ có thể được điều chỉnh, hoặc bằng cách chọn các đối tượng theo giao diện, hoặc bằng cách sử dụng các lựa chọn trên tab General của hộp thoại (Trang 41)
Hình 8. Lựa chọn phương pháp định nghĩa mô hình trong Data mining Wizard. - Báo cáo data mining trong sql server 2008
Hình 8. Lựa chọn phương pháp định nghĩa mô hình trong Data mining Wizard (Trang 43)
Hình 9: Tạo cấu trúc data mining trong Data Mining Wizard. - Báo cáo data mining trong sql server 2008
Hình 9 Tạo cấu trúc data mining trong Data Mining Wizard (Trang 44)
Hình 10 : Đưa ra các loại bảng cụ thể trong Data Mining Wizard. - Báo cáo data mining trong sql server 2008
Hình 10 Đưa ra các loại bảng cụ thể trong Data Mining Wizard (Trang 45)
Hỡnh 11: Chỉ rừ cỏch sử dụng từng cột và cỏc khúa nested cụ thể trong Data Mining   Wizard. - Báo cáo data mining trong sql server 2008
nh 11: Chỉ rừ cỏch sử dụng từng cột và cỏc khúa nested cụ thể trong Data Mining Wizard (Trang 46)
Hình 12 : Chỉ ra loại nội dung và loại dữ liệu ở trong Data Mining Wizard - Báo cáo data mining trong sql server 2008
Hình 12 Chỉ ra loại nội dung và loại dữ liệu ở trong Data Mining Wizard (Trang 47)
Hình 13 : Xác định một tập dữ liệu kiểm tra với số lượng case cực đại là 500. - Báo cáo data mining trong sql server 2008
Hình 13 Xác định một tập dữ liệu kiểm tra với số lượng case cực đại là 500 (Trang 48)
Hình 14 : Đặt tên các đối tượng trong Data mining Wizard. - Báo cáo data mining trong sql server 2008
Hình 14 Đặt tên các đối tượng trong Data mining Wizard (Trang 49)
Hình 16 : Mining Models Editor trong BI Dev Studio - Báo cáo data mining trong sql server 2008
Hình 16 Mining Models Editor trong BI Dev Studio (Trang 53)
Hình 17 : Hộp thoại Algorithm Parameters cho thuật toán cây quyết định. - Báo cáo data mining trong sql server 2008
Hình 17 Hộp thoại Algorithm Parameters cho thuật toán cây quyết định (Trang 54)
Hình 18 : cửa sổ mini-navigator trong Dependency Network view - Báo cáo data mining trong sql server 2008
Hình 18 cửa sổ mini-navigator trong Dependency Network view (Trang 57)
Hình 19 : Kết quả Cross-validation - Báo cáo data mining trong sql server 2008
Hình 19 Kết quả Cross-validation (Trang 60)
Hình 20 : Giao diện dịch vụ Report data mining query. - Báo cáo data mining trong sql server 2008
Hình 20 Giao diện dịch vụ Report data mining query (Trang 62)
Hình 21 : Báo cáo ma trận phân lớp Classification matrix . - Báo cáo data mining trong sql server 2008
Hình 21 Báo cáo ma trận phân lớp Classification matrix (Trang 63)
Hình   : chuỗi thời gian thể hiện giá cổ phiếu của Microsoft trong 12 năm - Báo cáo data mining trong sql server 2008
nh : chuỗi thời gian thể hiện giá cổ phiếu của Microsoft trong 12 năm (Trang 73)

TỪ KHÓA LIÊN QUAN

TRÍCH ĐOẠN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w