trước khi xử lý. Nguồn thông thường chỉ đến một kết nối của gói SSIS. Sau đây là một số nguồn phổ biến được sử dụng trong SSIS:
OLE DB: kết nối đến một nguồn dữ liệu OLE DB như SQL Server,
Access, Oracle, hoặc DB 2.
Excel: chỉ đến một bảng tính Excel. Với nguồn này thì có thể thực hiện câu lênh truy vấn SQL để lấy một số dữ liệu cần thiết trong bảng tính.
Flat File: kết nối đến tập tin mà các các cột dữ liệu được phân cách bởi các dấu phân cách hoặc chiều dài các cột là cố định.
XML: lấy dữ liệu từ một tập tin XML.
ADO.NET: cho phép kết nối đến nguồn dữ liệu thông qua ODBC.
5. Đích: trong một luồng dữ liệu thì đích có thể từ một nguồn hoặc một phép biến đổi. Một số loại đích hỗ trợ trong SSIS như sau:
Excel: ghi dữ liệu ra một tập tin Excel đã có trước.
Flat file: ghi dữ liệu ra tập tin phẳng, tức có phân cách hoặc chiều dài cố định.
OLE: ghi dữ liệu dữ liệu ra SQL Server, Access, Oracle, hoặc DB2.
SQL Server: Ghi dữ liệu ra một SQL Server, cách này sẽ nhanh và hiệu quả.
6. Các phép biến đổi: các phép biến đổi là thành phần chính của luồng dữ liệu dùng để thay đổi dữ liệu theo ý của bạn. Ví dụ: bạn muốn dữ liệu được tổng hợp và sắp xếp thì sẽ cần hai phép biến đổi. Các phép biến đổi của SSIS thường được thực hiện trong bộ nhớ nên thường nhanh hơn việc đọc đĩa. Sau đây là một số phép biến đổi cơ bản cung cấp sẵn trong SSIS:
Aggregate: tổng hợp dữu liệu từ phép biến đổi trước hoặc từ nguồn. Thực chất tương tự như câu lệnh GROUP BY trong T-SQL. Conditional Split: chia dữ liệu dựa trên điều kiện. Phép biến đổi
này tương đương câu lệnh CASE trong T-SQL.
Data Conversion: chuyển đổi kiểu cho các cột dữ liệu, tượng tự như câu lệnh CAST trong T-SQL.
Derived Column: thực hiện cập nhật dữ liệu hoặc tạo cột mới bằng công thức. Ví dụ: có thể tính cột lợi nhuận dựa trên cột chi phí và giá bán ra.
Fuzzy Grouping: thực hiện làm sạch hoặc tìm kiếm các hàng mà
gần như trùng nhau.
Fuzzy Lookup: tra cứu và chuẩn hóa dữ liệu dựa trên logic mờ. Ví dụ: chuyển tên “xuan” thành “xuân” hoặc “thanhf” sang “thành”. Lookup: thực hiện việc tra cứu dữ liệu bởi một cột khóa và lấy ra
một cột khác tương ứng với dữ liệu khớp. Ví dụ: có thể dùng mã hàng hóa để tra cứu và lấy ra tên hàng hóa.
Row Count: lưu số hàng của luồng dữ liệu bằng một biến để sử dụng cho một số bước khác và công việc giám sát.
Slowly Changing Dimension: đây là phép biến đổi gộp các thao tác thêm mới và cập nhật dữ liệu cho các bảng chiều trong kho dữ liệu. Sort: sắp xếp dữ liệu theo các cột chỉ ra.
Union All: gộp nhiều tập dữ liệu vào một tập duy nhất.
2.7.2. Dịch vụ Báo cáo
Dịch vụ báo cáo cho phép tạo báo cáo lấy từ nhiều nguồn dữ liệu khác nhau, hiển thị các dữ liệu một cách đa dạng như bảng biểu, ma trận, danh sách, đồng hồ đo, và biểu đồ, và cũng như xuất ra một số định dạng thông dụng chẳng hạn như Word, Excel, PDF, XML, và HTML mà không cần viết mã lệnh. Dịch vụ báo cáo cung cấp nhiều chức năng để tự động hoá việc phân phối các báo cáo dựa trên lịch, và tích hợp với Office SharePoint Server của Microsoft. Hơn nữa, dịch vụ báo cáo có một tập các thư viện lập trình mà có thể gọi từ các các dịch vụ web, giúp người ta có thể tự động hóa hầu hết các phần của báo cáo của bạn thông qua qua ngôn ngữ kịch bản hoặc ngôn ngữ lập trình.
Dịch vụ SSRS trong SQL Server 2008 có những cải tiến sau:
Công cụ cấu hình dịch vụ báo cáo được gói gọn lại, chỉ cần một công cụ duy nhất có thể thiết lập cấu hình cho môi trường báo cáo.
Kiến trúc mới hỗ trợ tốt hơn cho dịch vụ thông tin Internet, và cải thiện đáng kể khả năng phân trang và bộ nhớ đệm cho các báo cáo.
Cải tiến đáng kể nhất là các tính năng Tablix, đây là một tính năng mạnh cho phép kết hợp bảng và ma trận trong một vùng của báo cáo. Trong quá
khứ, để đưa ra báo cáo loại này phải tạo ra nhiều báo cáo và viết mã để ẩn và hiện các phần hiển thị và các cột.
Dịch vụ báo cáo cải tiến việc xuất các báo cáo ra dạng Excel và Word. Tích hợp công cụ thiết kế báo cáo vào bộ phát triển trí tuệ doanh nghiệp,
cung cấp đầy đủ các tính năng để tạo các báo báo phức tạp. Kiến trúc của dịch vụ cáo thể hiện như Hình 2.4 bên dưới.