CHƯƠNG 3: CÀI ĐẶT VÀ CHẠY THỬ
I, Yêu Cầu Hệ Thống
1.1. Phiên Bản SQL Server:
- Xác định phiên bản cụ thể của SQL Server bạn đang sử dụng (ví dụ: SQL Server 2016, 2017, 2019).
Đảm bảo rằng phiên bản SQL Server này hỗ trợ các tính năng Data Mining và có thể tích hợp các công cụ Data Mining.
1.2. Công Cụ Data Mining:
- Sử dụng phiên bản mới nhất của SQL Server Data Tools để đảm bảo tính tương thích với SQL Server.
- Kiểm tra xem phiên bản của công cụ Data Mining có tương thích với phiên bản cụ thể của SQL Server không.
1.3. Tài Liệu và Hỗ Trợ:
- Kiểm tra tài liệu hướng dẫn và thông báo của Microsoft để biết sự tương thích giữa các phiên bản SQL Server và công cụ Data Mining.
- Tìm hiểu về các bản vá (patches) hoặc cập nhật được cung cấp để giải quyết vấn đề tương thích nếu có.
1.4. Cập Nhật và Nâng Cấp:
- Luôn giữ SQL Server và các công cụ Data Mining được cài đặt lên phiên bản mới nhất để hưởng các tính năng mới và bản vá bảo mật.
- Thực hiện kiểm tra định kỳ và nâng cấp phiên bản nếu có sự cập nhật.
1.5. Kiểm Tra Thông Tin Tương Thích:
- Trước khi cài đặt hoặc nâng cấp, kiểm tra trên trang web chính thức của Microsoft để xem thông tin về tương thích của các phiên bản SQL Server và các công cụ kèm theo.
1.6. Tương Thích Với Hệ Điều Hành:
- Đảm bảo rằng SQL Server và công cụ Data Mining được cài đặt trên hệ điều hành được hỗ trợ và tương thích.
1.7. Kiểm Tra Các Tính Năng Data Mining:
- Xác định rằng các tính năng Data Mining bạn muốn sử dụng được hỗ trợ trong phiên bản cụ thể của SQL Server và công cụ Data Mining.
II, Cài Đặt SQL Server:
2.1.Hướng dẫn chi tiết quá trình cài đặt SQL Server trên máy chủ Bước 1: Tải SQL server
Bạn hãy truy cập vào trang chủ để tải SQL Server. Tiếp theo, nhấn nút “Download now” ở phần “Developer” để tải phần mềm về máy.
Bước 2: Mở file đã download Bạn hãy mở tệp đã tải xuống để bắt đầu quá trình cài đặt.
Hướng dẫn mở file cài đặt sql server 2022 Bước 3: Lựa chọn chế độ cài đặt phù hợp Bạn có thể chọn 1 trong 3 chế độ dưới đây tùy vào mục đích sử dụng khác nhau, bao gồm:
Basic: Đây là lựa chọn đơn giản nhất cho người dùng, ứng dụng sẽ tự động cài đặt các chức
năng cơ bản, giúp người dùng tiết kiệm thời gian và công sức trong quá trình cài đặt.
Custom: Phần cài đặt dành riêng cho những người muốn có quyền kiểm soát cao hơn đối
với cài đặt. Bạn sẽ được tự cài đặt và điều chỉnh các cấu hình của phần mềm theo nhu cầu cụ thể của mình.
Download Media: Đây là file cài đặt offline tiện lợi nhất vì mang lại sự thuận tiện cho việc
cài đặt trên nhiều thiết bị mà không cần phải tải lại từ đầu. Khi ấn chọn, hệ thống sẽ tải về một file cài đặt offline và nhanh chóng triển khai ứng dụng.
Nếu bạn chỉ mới biết đến phần mềm này, tốt nhất nên lựa chọn chế độ Basic bằng cách ấn chọn basic -> Accept -> Install để tiến hành cài đặt.
Bước 4: Bắt đầu thiết lập cấu hình phần mềm
Tại đây bạn hãy ấn chọn “Customize” nằm ở phía dưới để cài đặt cấu hình trước khi sử dụng.
Bước 5: Cấu hình ở cửa sổ đầu tiên Khi nhìn thấy cấu hình hiện ra ở cửa sổ đầu tiên, bạn hãy ấn chọn nút “Next” nằm ở góc dưới cùng bên phải màn hình.
Bước 6: Hệ thống tiến hành kiểm tra
Khi bước 5 kết thúc, hệ thống sẽ tự động kiểm tra các yêu cầu cần thiết. Cụ thể, dấu tích màu xanh là chứng tỏ mọi yêu cầu đã được đáp ứng. Nếu mục “Firewall” màu vàng xuất hiện báo hiệu cảnh báo quá trình cài đặt đang gặp sự cố. Tại đây, bạn có thể bỏ qua và tiếp tục quy trình bằng cách nhấn “Next”.
Tại mục “Product key”, bạn chọn mục “Developer” để sử dụng miễn phí phần mềm rồi nhấn “Next” để tiếp tục.
Tiếp theo, ở mục “License Terms”, bạn chọn “I accept the license terms and Privacy
Statement” (Tôi chấp nhận các điều khoản cấp phép và Tuyên bố về quyền riêng tư) và
nhấn “Next”.
Đến đây, mục “Azure extensions for SQL Server” hiện ra, bạn hãy bỏ chọn “Azure
extensions for SQL Server” rồi nhấn “Next” để tiếp tục.
Tiếp theo, ở mục “Features Selection”, hãy chọn các tính năng mà bạn muốn cài đặt. Nếu chỉ sử dụng SQL Server cơ bản, hãy chọn
Database Engine Services và Data Quality Client, sau đó nhấn Next.
Bước 7: Đặt tên
Đến mục “Feature Configuration Rules”, bạn được phép đặt tên cho Instance. Lưu ý
rằng, bạn có thể đặt tên tùy ý nhưng không được chứa dấu và khoảng trắng. Tiếp theo nhấn “Next” để di chuyển đến phần “Database Engine Configuration”.
Bước 8: Cấu hình bảo mật Tại “Database Engine Configuration”, bạn chọn chức năng “Mixed Mode” để bảo mật cho cơ sở dữ liệu của bạn.
Nhập mật khẩu cho tài khoản super admin (sa) của bạn và nhấn nút “Add current User” để thêm tài khoản mới.
Nhấn Next để tiếp tục đến mục Ready to Install.
Bước 9: Hoàn tất cài đặt
Ở bước cuối cùng, bạn hãy nhấn “Install” và đợi cho đến khi quá trình cài đặt hoàn tất rồi bấm “Close” để kết thúc quá trình.
Cài đặt SQL Server Management Studio (SSMS)
Sau khi tải SQL Server thành công, tiếp theo cần cài SQL Server Management Studio theo các bước sau:
Bước 1: Khởi động
Bạn hãy khởi đầu bằng việc nhấp vào nút “Install SSMS” và chờ đợi vài giây để hệ thống tự động chuyển đến đường link tải xuống.
Bước 2: Download file
Tại đây, link download sẽ hiện ra, bạn hãy Click vào “ free Download for SQL Server
Management Studio (SSMS)” để tải xuống file SSMS.
Bư ớc 3: Cài đặt giao diện
Mở tệp vừa tải về rồi nhấn “Install” để bắt đầu quá trình cài đặt giao diện cho phần mềm SQL Server Management Studio. Bước cuối, chỉ cần chọn “Close” để hoàn tất quá trình cài đặt.
2.2.Chú ý đến các tùy chọn cài đặt liên quan đến Data Mining.
2.2.1. Chọn Cài Đặt Thành Phần Data Mining:
Trong giao diện cài đặt, chắc chắn bạn đã chọn "Database Engine Services" và "SQL Server Replication".
Nếu sử dụng SQL Server Management Studio để thực hiện Data Mining, hãy chọn
"Management Tools - Basic" hoặc "Management Tools - Complete" tùy theo nhu cầu của bạn.
2.2.2. Cài Đặt Data Mining Extensions:
SQL Server hỗ trợ Data Mining Extensions (DMX) là một ngôn ngữ truy vấn đặc biệt cho Data Mining. Chắc chắn rằng DMX được cài đặt và kích hoạt.
2.2.3. Chọn Dịch Vụ SQL Server Analysis Services (SSAS):
Data Mining thường được thực hiện thông qua SSAS. Chọn "Analysis Services" trong danh sách các dịch vụ để cài đặt và kích hoạt nếu bạn chưa có nó.
2.2.4. Cài Đặt Cơ Sở Dữ Liệu Mẫu:
Cài đặt cơ sở dữ liệu mẫu "AdventureWorksDW" hoặc các cơ sở dữ liệu khác mà bạn có thể sử dụng cho các mô hình Data Mining.
2.2.5. Kích Hoạt Dịch Vụ SQL Server Browser:
Để truy cập cổng dịch vụ của SQL Server, đặc biệt là khi sử dụng SSAS, kích hoạt dịch vụ SQL Server Browser.
2.2.6. Thiết Lập Tài Khoản Người Dùng:
Khi cài đặt SQL Server, hãy xác định tài khoản người dùng mà các dịch vụ SQL Server sẽ chạy dưới đó. Đảm bảo tài khoản này có đủ quyền để thực hiện các tác vụ Data Mining.
2.2.7. Kiểm Tra Cấu Hình Data Mining:
Sau khi cài đặt, kiểm tra cấu hình của SSAS để đảm bảo rằng tính năng Data Mining đã được kích hoạt.
2.2.8. Kiểm Tra Cài Đặt DMX:
Đảm bảo rằng DMX đã được cài đặt và kích hoạt trong SQL Server.
2.2.9. Cài Đặt SQL Server Data Tools (SSDT):
SQL Server Data Tools là một công cụ quan trọng cho việc phát triển và triển khai các dự án Data Mining. Hãy chắc chắn rằng bạn đã cài đặt SSDT.
10. Thiết Lập Kết Nối:
Đảm bảo rằng bạn có thể kết nối từ SQL Server Management Studio và SQL Server Data Tools đến dịch vụ SSAS và cơ sở dữ liệu mà bạn đang sử dụng cho Data Mining.
III, Kết Nối và Chuẩn Bị Dữ Liệu:
3.1.Mở SQL Server Management Studio và kết nối vào cơ sở dữ liệu.
3.1.1. Kết Nối vào Cơ Sở Dữ Liệu - Khi SSMS mở, bạn sẽ thấy cửa sổ "Connect to Server".
- Nhập thông tin kết nối:
+ Server Type: Chọn "Database Engine" nếu bạn muốn kết nối đến cơ sở dữ liệu SQL Server.
+ Server Name: Nhập tên máy chủ SQL Server hoặc IP address.
+ Authentication: Chọn loại xác thực. Nếu bạn đã cài đặt theo mặc định, bạn có thể chọn
"Windows Authentication" hoặc "SQL Server Authentication" và nhập tên người dùng và mật khẩu.
- Nhấn nút "Connect" để thiết lập kết nối.
3.1.2.Xác Nhận Kết Nối và Mở Cơ Sở Dữ Liệu
- Nếu kết nối thành công, bạn sẽ thấy thông báo "Connected to [Tên Máy Chủ]" ở phía dưới cửa sổ SSMS.
- Trong cửa sổ Object Explorer bên trái, bạn sẽ thấy danh sách các cơ sở dữ liệu trên máy chủ. Mở rộng mục "Databases" để xem danh sách cơ sở dữ liệu.
- Nhấn đúp vào tên cơ sở dữ liệu mà bạn muốn làm việc để mở nó và thực hiện các thao tác quản lý hoặc truy vấn dữ liệu.
3.2. Chuẩn bị dữ liệu cần thiết cho quá trình Data Mining.
- Hiểu Rõ Dữ Liệu: Xác định mục tiêu của dự án Data Mining và hiểu rõ về dữ liệu cần thiết để đạt được mục tiêu đó.
- Thu Thập Dữ Liệu: Thu thập dữ liệu từ các nguồn đáng tin cậy và đảm bảo chúng đủ đại diện cho vấn đề bạn đang giải quyết.
- Làm Sạch Dữ Liệu:
+ Xử lý dữ liệu thiếu hoặc lặp lại.
+ Kiểm tra và xử lý các giá trị ngoại lệ.
+ Chuẩn hóa dữ liệu, ví dụ: chuyển đổi các đơn vị đo lường, chuyển đổi chuỗi thành số.
- Chọn Biến Quan Trọng: Xác định và chọn ra các biến quan trọng có ảnh hưởng đáng kể đến mục tiêu của mô hình.
- Xác Định Mục Tiêu: Xác định biến mục tiêu (target variable) mà bạn muốn dự đoán hoặc phân loại.
- Phân Chia Dữ Liệu: Phân chia dữ liệu thành bộ huấn luyện (training set) và bộ kiểm tra (test set) để đánh giá hiệu suất của mô hình.
- Xử Lý Dữ Liệu Categorical: Chuyển đổi biến phân loại thành dạng số (nếu cần thiết) để phù hợp với các thuật toán Data Mining.
- Tạo Biến Tổng Hợp (Derived Variables): Tạo các biến mới dựa trên thông tin có sẵn để làm phong phú thêm dữ liệu.
- Thực Hiện Tích Hợp Dữ Liệu (Data Integration): Kết hợp dữ liệu từ nhiều nguồn nếu cần thiết để có cái nhìn toàn diện hơn.
- Kiểm Tra Đồng Nhất Dữ Liệu: Đảm bảo rằng dữ liệu của bạn đồng nhất với định dạng và cấu trúc mà thuật toán Data Mining đang yêu cầu.
- Xác Định Đặc Trưng (Feature Engineering): Xác định và tạo các đặc trưng mới có thể cải thiện hiệu suất của mô hình.
- Kiểm Tra Độ Tương Quan: Kiểm tra độ tương quan giữa các biến để đảm bảo không có vấn đề về đa cộng tuyến.
- Làm Rõ Mục Tiêu: Nếu có thể, làm rõ mục tiêu bằng cách sử dụng phân tích thêm như tạo đồ thị và biểu đồ.
- Lưu Trữ Dữ Liệu: Lưu trữ dữ liệu ở định dạng và cấu trúc đảm bảo dễ quản lý và sử dụng.
IV, Tạo Dự Án Data Mining:
4.1.Sử dụng SQL Server Data Tools để tạo dự án mới.
4.1.1. Mở SQL Server Data Tools: Mở SQL Server Data Tools (SSDT). Bạn có thể tìm thấy nó trong Start Menu hoặc trên màn hình Desktop.
4.1.2. Tạo Dự Án Data Mining - Chọn "File" > "New" > "Project..." từ thanh menu.
- Trong hộp thoại "New Project", chọn "Analysis Services" từ danh sách dự án và sau đó chọn "Data Mining Project".
- Đặt tên cho dự án và chọn nơi bạn muốn lưu trữ nó. Nhấn "OK" để tiếp tục.
4.1.3. Thiết Lập Dự Án Data Mining
- Trong Solution Explorer, mở thư mục "Data Sources" và thêm nguồn dữ liệu cho dự án Data Mining.
- Tiếp theo, thêm các biểu đồ Data Mining, nhóm, và mô hình vào dự án bằng cách sử dụng Toolbox.
- Thiết lập các thuộc tính và cấu hình của mô hình Data Mining theo yêu cầu của bạn sử dụng Document Outline.
- Khi hoàn thành, lưu dự án bằng cách chọn "File" > "Save All".
4.1.4. Triển Khai Dự Án
- Chọn "Build" > "Deploy Solution" từ thanh menu để triển khai dự án lên SQL Server Analysis Services (SSAS).
- Kiểm tra Output window để xem quá trình triển khai và đảm bảo rằng không có lỗi nào xảy ra.
- Kiểm tra kết quả triển khai trong SQL Server Management Studio bằng cách xem trong mục "Data Mining".
4.2. Kết nối vào cơ sở dữ liệu.
- Sau khi tạo dự án, trong Solution Explorer, mở thư mục "Data Connections".
- Nhấn chuột phải và chọn "New Connection..."
- Trong hộp thoại "Connection Manager", nhập thông tin kết nối của bạn:
+ Server name: Tên máy chủ SQL Server hoặc IP address.
+ Authentication: Chọn loại xác thực, có thể là "Windows Authentication" hoặc "SQL Server Authentication". Nếu chọn SQL Server Authentication, nhập tên người dùng và mật khẩu.
+ Database: Chọn cơ sở dữ liệu mà bạn muốn sử dụng cho dự án Data Mining.
- Nhấn "OK" để xác nhận kết nối.
- Bạn sẽ thấy kết nối mới được thêm vào thư mục "Data Connections" trong Solution Explorer.