Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 47 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
47
Dung lượng
1,71 MB
Nội dung
Loạt bài các kỹ năng của Kiến trúc sư dữ liệu Rational, Phần 3: Phát hiện các mối quan hệ của lược đồ bằng Kiến trúc sư dữ liệu Rational Tạo các ánh xạ lược đồ bán tự động Torsten Bittner, Kỹ sư phần mềm, IBM Tóm tắt: Bạn có thể sử dụng Kiến trúc sư Dữ liệu Rational® của IBM® để định nghĩa các ánh xạ dữ liệu. Khi làm việ c với các lược đồ lớn, có thể rất cồng kềnh nếu tạo các ánh xạ bằng tay. Kiến trúc sư Dữ liệu Rational cung cấp một thành phần khám phá để nhận biết một cách bán tự động các ánh xạ có tiềm năng. Hướng dẫn này cung cấp một giới thiệu nhập môn về thành phần khám phá quan hệ của Kiến trúc sư Dữ liệu Rational. Trước khi bạn bắt đầu Trong h ướng dẫn này, hãy tìm hiểu làm thế nào để sử dụng thành phần khám phá của Kiến trúc sư Dữ liệu Rational (Rational Data Architect) để tạo ra bán tự động các ánh xạ giữa các nguồn dữ liệu quan hệ và các nguồn dữ liệu XML. Hướng dẫn này là phần thứ ba trong một loạt bài viết về Kiến trúc sư Dữ liệu Rational. Về hướng dẫn này Hướng dẫn này chỉ dẫn cho bạn thấy từng b ước làm thế nào để: • Gọi thực hiện thuật toán phát hiện sự giống nhau về từ vựng của Kiến trúc sư Dữ liệu Rational (RDA) để phát hiện các ánh xạ lược đồ tiềm năng dựa vào sự giống nhau của các tên cột. • Định nghĩa một mô hình bảng chú giải thuật ngữ có chứa các từ, chữ viết tắt và từ đồng nghĩa bằng cách sử dụng trình soạn thảo Mô hình bảng chú giải thuật ngữ của RDA. • Sử dụng thông tin của mô hình bảng chú giải thuật ngữ với thuật toán dựa vào nghĩa của tên để phát hiện thêm các kết quả phù hợp. • Thiết lập việc khám phá quan hệ để sử dụng các mẫu dữ liệu. • Tìm các ánh xạ có tiềm năng với các thuật toán, sử dụng các mẫu dữ liệu. Về đầu trang Mục tiêu Sau khi hoàn thành hướng dẫn này, bạn sẽ có khả năng sử dụng thành phần khám phá của Kiến trúc sư Dữ liệu Rational để tìm ra các ánh xạ lược đồ. Về đầu trang Các điều kiện cần trước Thay đổi tên sản phẩm Ngày 16 tháng Mười Hai năm 2008 IBM đã thông báo rằng, kể từ phiên bản 7.5.1, Kiến trúc sư Dữ liệu Rational được đổi tên thành Kiến trúc sư Dữ liệu InfoSphere (InfoSphere Data Architect) để đề cao vai trò của nó trong các công cụ nền InfoSphere. Hướng dẫn này giả thiết bạn đã quen với các cơ sở dữ liệu quan hệ, tốt nhất là DB2®. Việc quen thuộc với trình soạn thảo ánh xạ của Kiến trúc sư Dữ liệu Rational rất có lợi, nhưng không bắt buộc. Để tham khảo, hãy tra cứu các bài viết sau của developerWorks: • Phần 1: Truy cập và tích hợp siêu dữ liệu doanh nghiệp với Kiến trúc sư Dữ liệu Rational. • Phần 2: Tạo các truy vấn SQL/XML với Kiến trúc sư Dữ liệu Rational. • Sử dụng Kiến trúc sư Dữ liệu Rational để tích hợp các nguồn dữ liệu Về đầu trang Các yêu cầu hệ thống Để thực hiện các bước đã mô tả trong hướng dẫn này, bạn cần phải có Kiến trúc sư Dữ liệu Rational phiên bản V7 và Enterprise 9 DB2® của IBM đã cài đặt. Bạn có thể tải về phiên bản dùng thử của Kiến trúc sư Dữ liệu Rational V7 và DB2 V9.1 của IBM (xem Tài nguyên). Các bước thiết lập 1. Cài đặt DB2 V9.1. 2. Cài đặt Kiến trúc sư Dữ liệu Rational V7. 3. Giải nén gói ar-rdamapcode.zip từ tệp tin vào trong một thư mục (ví dụ, C:\RDA_Tutorials). Bước này tạo ra thư mục RDA_Discovery. 4. Khởi động Kiến trúc sư Dữ liệu Rational và chỉ rõ thư mục ở đó bạn đã giải nén gói làm thư mục cho vùng làm việc của bạn (ví dụ, C:\RDA_Tutorials). 5. Thư mục RDA_Discovery trong gói phần mềm là thư mục dự án dữ liệu của Kiến trúc sư Dữ liệu Rational. Trong Kiến trúc sư Dữ liệu Rational bạn phải nhập khẩu nó vào trong vùng làm việc của bạn. Từ trình đơn File, chọn Import. 6. Chọn trình thủ thuật Existing Project into Workspace. Hình 1. Chọn trình thủ thuật Import 7. Nhấn vào Next. Duyệt đến vị trí ở đó bạn đã giải nén tệp tin ar- rdamapcode.zip (ví dụ, C:\RDA_Tutorials). Hình 2. Trình thủ thuật Import Project 8. Nhấn vào Finish. Kết quả là, bạn thấy dự án RDA_Discovery với một tập hợp các mô hình dữ liệu, một mô hình bảng chú giải thuật ngữ và các tệp tin mô hình ánh xạ trong vùng làm việc của bạn như được hiển thị trong Hình 3. (Nếu bạn không nhìn thấy Database Explorer, hãy kiểm tra chắc chắn rằng bạn ở trong phối cảnh Dữ liệu, như thấy trong Hình 4.) Hình 3. Data Project Explorer sau khi nhập khẩu dự án Hình 4. Phối cảnh Dữ liệu 9. Một số các thuật toán phát hiện mối quan hệ yêu cầu dữ liệu mẫu. Tệp tin kịch bản lệnh rda_discovery_db.sql tạo ra một THƯ VIỆN (LIBRARY) cơ sở dữ liệu DB2 và chèn vào một bộ các mẫu dữ liệu. Để triển khai một kịch bản lệnh trong cơ sở dữ liệu DB2 của bạn, khởi động cửa sổ lệnh DB2 (trình đơn của Windows Start > IBM DB2 > Command Line Tools > Command Window). 10. Đi đến thư mục RDA_Discovery mà bạn đã giải nén từ tệp tin vi- rdamapcode.zip. 11. Để tạo cơ sở dữ liệu LIBRARY, định nghĩa các khóa chính và khóa ngoài và chèn thêm các dữ liệu mẫu, hãy chạy lệnh này: db2 -tvf rda_discovery_db.sql 12. Hình 5. Tạo cơ sở dữ liệu LIBRARY 12. Để tạo cơ sở dữ liệu OLD_LIB, định nghĩa khóa chính và khóa ngoài và chèn thêm các mẫu dữ liệu, hãy chạy lệnh: db2 -tvf rda_discovery_db_old.sql 13. 13. Kết nối vào cơ sở dữ liệu LIBRARY trong Kiến trúc sư Dữ liệu Rational. Trong Database Explorer, nhấn chuột phải vào Connection và chọn New Connection. (Nếu bạn không nhìn thấy Database Explorer, hãy kiểm tra chắc chắn rằng bạn ở trong phối cảnh Dữ liệu, như hi ển thị trong Hình 4.) Hình 6. Tạo kết nối cơ sở dữ liệu mới 14. Chỉ rõ các thông tin kết nối theo môi trường của bạn tương tự như Hình 7. Hình 7. Các thông số cài đặt kết nối cơ sở dữ liệu 15. Nhấn vào Test Connection để kiểm tra xem tất cả các tham số đã được thiết lập đúng chưa. Nếu thử nghiệm thành công, hãy nhấn vào Finish. 16. Lặp lại các bước từ 13 đến 15 cho cơ sở dữ liệu OLD_LIB bằng cách sử dụng cùng giá trị thiết lập kết nối, trừ tên của cơ sở dữ liệu. 1 của 12 | Trang sau [...]... trường hợp, phần tử nguồn và đích của ánh xạ sẽ có cùng một tên Ngoài ra, tên của một phần tử nguồn có thể được viết tắt hoặc là một từ đồng nghĩa với phần tử đích Các thuật toán phát hiện trong Kiến trúc sư Dữ liệu Rational dựa trên sự giống nhau của siêu dữ liệu là: • Sự tương tự từ vựng • Ngữ nghĩa của tên Sự giống nhau của dữ liệu cá thể Thể loại này đề cập đến dữ liệu chứa trong cơ sở dữ liệu, ví... sở dữ liệu, ví dụ, trong các cột của một cơ sở dữ liệu vật lý mà người sử dụng muốn ánh xạ Thành phần khám phá sẽ thu thập một mẫu dữ liệu từ nguồn và đích dữ liệu vật lý Nó sau đó so sánh hai mẫu dữ liệu và cố gắng phát hiện ra một mối quan hệ Trong Kiến trúc sư Dữ liệu Rational các thuật toán sau đây là dựa trên sự giống nhau của cá thể dữ liệu: • Chữ ký • Các phân phối • Các biểu thức chính quy Hướng... rằng các phần tử nguồn và đích đưa vào trong một ánh xạ có sự giống nhau nhất định Các đặc điểm giống nhau này rơi vào hai thể loại Sự giống nhau của siêu dữ liệu Thể loại này đề cập đến thông tin có chứa trong mô hình dữ liệu, như là mô hình cơ sở dữ liệu vật lý, mô hình cơ sở dữ liệu logic hoặc mô hình lược đồ XML Phần tử được ánh xạ giữa các mô hình dữ liệu ấy là các cột, các thực thể và các phần. .. đồ mới hơn Các tên cột và các bảng trong ví dụ này được chọn để minh họa các khả năng của thành phần khám phá, hơn là mô phỏng một lược đồ thường được sử dụng trong một môi trường doanh nghiệp Đối với việc phát hiện dựa theo dữ liệu, mô hình cơ sở dữ liệu "old library system.dbm" được sử dụng như một nguồn Cơ sở dữ liệu vật lý có chứa các dữ liệu là OLD_LIB Mô hình cơ sở dữ liệu đích "new library system.dbm"... cách sử dụng chúng như thế nào Để đơn giản hơn, hướng dẫn này đi kèm với một bộ các mô hình dữ liệu được sử dụng để gọi ra các thuật toán khác nhau (xem Tải về) Việc phát hiện dựa theo siêu dữ liệu sử dụng các mô hình dữ liệu vật lý COMPANY_old.dbm và COMPANY_new.dbm Trong một kịch bản tích hợp dữ liệu điển hình, một mục tiêu là để di chuyển dữ liệu từ một lược đồ cũ vào trong một lược đồ mới hơn Các. .. đến kịch bản trong các hướng dẫn đã xuất bản trước đó Mục đích là để sử dụng trình soạn thảo ánh xạ của Kiến trúc sư Dữ liệu Rational để tích hợp dữ liệu (xem Phần 1) và tạo ra truy vấn (xem Phần 2) Trình soạn thảo ánh xạ làm giảm đáng kể lượng thời gian phải dùng để tự tay viết các truy vấn SQL hoặc SQL/XML Trình soạn thảo cũng cho phép người sử dụng nắm bắt các mối quan hệ dữ liệu và công bố thông... viết tắt của Worker Do đó, kết quả phát hiện bao gồm các chữ viết tắt và các từ đồng nghĩa cho Worker Kết quả là giống như với cột nguồn WORK.Employee, như được hiển thị trong Hình 31 Hình 31 Kết quả phù hợp đã tìm thấy bằng cách sử dụng chữ viết tắt và các từ đồng nghĩa kết hợp Phát hiện các ánh xạ giữa các từ phức hợp Trong các lược đồ dữ liệu bạn thường tìm thấy các từ phức hợp, ví dụ như các tên... Hình 16 Các kết quả khám phá Find Similar Tạo ra một mô hình bảng chú giải thuật ngữ Trong phần này, bạn sử dụng trình soạn thảo mô hình bảng chú giải thuật ngữ (glossary model) của Kiến trúc sư Dữ liệu Rational để tạo ra một mô hình bảng chú giải thuật ngữ Mô hình này định nghĩa các từ bằng các chữ viết tắt và các từ đồng nghĩa Thông tin được sử dụng để tìm các kết quả phù hợp bổ sung thêm trong phần. .. khi làm việc với các lược đồ lớn về phía nguồn và phía đích, sẽ thật khó tìm thấy các cột được ánh xạ tới Kiến trúc sư Dữ liệu Rational giải quyết vấn đề này bằng thành phần khám phá mối quan hệ Ý tưởng là để tạo ra các ánh xạ một cách bán tự động Công cụ này phát hiện các ánh xạ có tiềm năng cho người sử dụng, người chỉ phải chấp nhận hoặc từ chối kết quả so khớp được đề xuất Thành phần khám phá hoạt... lệ phù hợp Giá trị Mức lá (Leaf Level) đề cập đến sự giống nhau của các phần tử mức lá trong khung nhìn cây lược đồ, chẳng hạn như các tên cột khi làm việc với các mô hình cơ sở dữ liệu vật lý Giá trị Mức cha mẹ (Parent Level) đề cập đến phần tử cha mẹ trực tiếp của phần tử mức lá, chẳng hạn như tên bảng trong kịch bản mô hình cơ sở dữ liệu vật lý 8 Nhấn chuột phải vào đường ánh xạ mầu vàng trong trình . Loạt bài các kỹ năng của Kiến trúc sư dữ liệu Rational, Phần 3: Phát hiện các mối quan hệ của lược đồ bằng Kiến trúc sư dữ liệu Rational Tạo các ánh xạ lược đồ bán tự. viết sau của developerWorks: • Phần 1: Truy cập và tích hợp siêu dữ liệu doanh nghiệp với Kiến trúc sư Dữ liệu Rational. • Phần 2: Tạo các truy vấn SQL/XML với Kiến trúc sư Dữ liệu Rational Architect) để tạo ra bán tự động các ánh xạ giữa các nguồn dữ liệu quan hệ và các nguồn dữ liệu XML. Hướng dẫn này là phần thứ ba trong một loạt bài viết về Kiến trúc sư Dữ liệu Rational. Về hướng