Tìm hiểu vể đối sánh lược đồ và xây dựng ứng dụng VNMATCH

85 1.5K 0
Tìm hiểu vể đối sánh lược đồ và xây dựng ứng dụng VNMATCH

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Tìm hiểu vể đối sánh lược đồ và xây dựng ứng dụng VNMATCH

BỘ GIÁO DỤC ĐÀO TẠO TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI ------------------------------------------ LUẬN VĂN THẠC SĨ KHOA HỌC TÌM HIỂU VỀ ĐỐI SÁNH LƯỢC ĐỒ XÂY DỰNG ỨNG DỤNG VNMATCH NGÀNH: CÔNG NGHỆ THÔNG TIN NGÔ VĂN QUÂN HÀ NỘI 2006 i Luận văn Th.s: Tìm hiểu về đối sánh lược đồ xây dựng ứng dụng VNMatch Ngô Văn Quân, lớp cao học CNTT 2004 Lời cảm ơn Trong lời đầu tiên của báo cáo luận văn tốt nghiệp “Tìm hiểu về đối sánh lược đồ xây dựng ứng dụng VNMatch” này, tôi muốn gửi những lời cảm ơn biết ơn chân thành của mình tới tất cả những người đã hỗ trợ, giúp đỡ tôi về chuyên môn, vật chất tinh thần trong quá trình thực hiện Đồ án. Trước hết, tôi xin chân thành cảm ơn TS. Nguyễn Kim Anh, bộ môn Hệ thống thông tin, Khoa Công nghệ thông tin trường Đại học Bách khoa Hà Nội, người đã trực tiếp hướng dẫn, nhận xét, giúp đỡ tôi trong suốt quá trình thực hiện luận văn. Xin chân thành cảm ơn Khoa Công nghệ thông tin, Trung tâm Đào tạo Bồi dưỡng sau đại học Trường Đại học Bách Khoa Hà Nội đã giúp đỡ tôi trong suốt quá trình học tập nghiên cứu. Tôi cũng muốn gửi lời cảm ơn tới TS. Đỗ Hồng Hải1, tác giả của hệ thống COMA++; anh Lê Hồng Phương2 tác giả của vnTokenizer, vnLTag; Enrico May, sinh viên nghiên cứu về dự án Cupid. Tôi cũng xin bày tỏ lòng biết ơn đến gia đình những người bạn thân đã giúp đỡ, động viên tôi rất nhiều trong suốt quá trình học tập làm luân văn tốt nghiệp. Do thời gian thực hiện có hạn, kiến thức chuyên môn còn nhiều hạn chế nên đồ án tôi thực hiện chắc chắn không tránh khỏi những thiếu sót nhất định. Tôi rất mong nhận được ý kiến đóng góp của thầy, cô giáo các bạn. Xin chân thành cảm ơn ! Hà Nội, ngày 09 tháng 10 năm 2006 1 http://dbs.uni-leipzig.de/personen/hong_hai_do 2 Lê Hồng Phương, công tác tại trường Đại Học Quốc Gia Hà Nội, hiện đang làm nghiên cứu sinh tại Pháp ii Luận văn Th.s: Tìm hiểu về đối sánh lược đồ xây dựng ứng dụng VNMatch Ngô Văn Quân, lớp cao học CNTT 2004 Chương 1 Mở đầu .1 1 Đối sánh lược đồ 2 2 Sự hỗn tạp ngữ nghĩa .3 3 Định nghĩa bài toán 6 3.1 Schemas 6 3.2 Đầu vào bài toán (Input) 7 3.3 Đầu ra bài toán (Output) 7 3.4 Kiến trúc chung 8 4 Ứng dụng của bài toán đối sánh lược đồ 9 4.1 Các ứng dụng tích hợp dữ liệu data warehouse 9 4.2 E-Business . 11 4.3 Semantic Web 12 5 Các vấn đề mở 13 5.1 Khả năng biểu diễn của ngôn ngữ 13 5.2 Làm việc với các lược đồ có kích thước lớn 13 5.3 Sự kết hợp của các phương pháp đối sánh 14 Chương 2 Các phương pháp tiếp cận . 15 1 Các dự án liên quan . 15 1.1 COMA++ . 15 1.2 SEMINT . 16 1.3 LSD 16 1.4 SKAT . 16 1.5 TransScm 16 1.6 DIKE . 17 1.7 SIMILARITY FLOODING 17 1.8 Cupid 17 2 Các phương pháp đối sánh lược đồ . 20 2.1 Tiêu chuẩn phân loại . 20 2.2 Đối sánh dựa trên schema (schema-based) 21 2.2.1 Phương pháp tiếp cận dựa trên ngôn ngữ (linguistic) 22 2.2.2 Phương pháp tiếp cận dựa trên ràng buộc . 23 2.2.3 Phương pháp tiếp cận dựa trên cấu trúc . 23 2.3 Đối sánh dựa trên dữ liệu . 23 2.4 Đối sánh kết hợp . 24 2.5 Match Cardinality 24 2.6 Các hệ số mặc định trong bài toán đối sánh 25 3 Các phương pháp đánh giá hệ thống đối sánh 26 Chương 3 Thiết kế hệ thống đối sánh lược đồ. 30 1 Khảo sát . 30 2 Giới thiệu . 33 2.1 Giới thiệu bài toán đối sánh lược đồ. 33 2.2 Xử lý schema trong tiếng Việt . 33 3 Thiết kế 35 iii Luận văn Th.s: Tìm hiểu về đối sánh lược đồ xây dựng ứng dụng VNMatch Ngô Văn Quân, lớp cao học CNTT 2004 3.1 Kiến trúc hệ thống 35 3.2 Input 36 3.2.1 Schema Error! Bookmark not defined. 3.2.2 WordNet 39 3.2.3 Output 40 3.3 Mức ngôn ngữ (linguistic matching) . 41 3.3.1 Các thuật toán đối sánh cơ bản . 42 3.3.2 Thuật toán đối sánh kết hợp . 44 3.4 Mức cấu trúc 51 3.5 Chọn lựa ánh xạ . 55 4 Cài đặt kết quả . 56 4.1 Cài đặt 56 4.2 Kết quả thử ngiệm 60 5 Kết luận hướng phát triển . 71 5.1 Kết luận 71 5.2 Hướng phát triển 72 Tài liệu tham khảo . 75 Sách, bài báo, luận văn 75 Website . 75 iv Luận văn Th.s: Tìm hiểu về đối sánh lược đồ xây dựng ứng dụng VNMatch Ngô Văn Quân, lớp cao học CNTT 2004 Mục lục hình ảnh Hình 1-1: Đối sánh lược đồ 2 Hình 1-2: Xung đột ngôn ngữ 5 Hình 2-1: Schemas 7 Hình 2-2: Kiến trúc chung của bài toán đối sánh lược đồ 8 Hình 2-3: Minh họa hệ thống tích hợp dữ liệu giúp người dùng tìm văn bản 10 Hình 2-4: Data warehouse 11 Hình 2-5: Kiến trúc COMA++ 15 Hình 2-6: Kiến trúc SEMINT Error! Bookmark not defined. Hình 2-7: Các phương pháp đối sánh lược đồ 20 Hình 2-8: Xây dựng các hệ số ưu tiên 26 Hình 2-9: Đánh giá hệ thống đối sánh 27 Hình 2-10: So sánh F-Measure Overall 28 Hình 3-1: Sự hỗn tạp của các nguồn dữ liệu 31 Hình 3-2:Lược đồ văn bản 33 Hình 3-3: Kiến trúc hệ thống 36 Hình 3-4: Hợp nhất các lược đồ phân tán 38 Hình 3-5: Hợp nhất các kiểu thiết kế schema 38 Hình 3-6: Loại bỏ nút có kiểu đơn giản 38 Hình 3-7: Tái sử dụng các định nghĩa 39 Hình 3-8:Sơ đồ đối sánh mức ngôn ngữ (linguistic matching) 41 Hình 3-9: Sơ đồ thuật toán đối sánh kết hợp 45 Hình 3-10: Phân tích phần tử đầu vào 46 Hình 3-11: Thực hiện bước Direction Selection 48 Hình 3-12: Tổng hợp kết quả 49 Hình 3-13: SimCube theo phương pháp đối sánh kết hợp 50 Hình 3-14: Kết quả sau khi thực hiện Aggregation 50 Hình 3-15: Kết quả sau khi thực hiện Direction Selection 50 Hình 3-16:Kết quả sau khi tổng hợp 51 Hình 3-17: Hệ số tương tự của 2 node lá 52 Hình 3-18: Hệ số tương tự của 2 node trong 52 Hình 3-19: Sự phụ thuộc của hệ số tương tự vào ngữ cảnh 55 Hình 3-20:Cấu trúc VNMatch 57 Hình 3-21: MatchLib, phần core của VNMatch 57 Hình 3-22: Lớp HybridMatcher 58 Hình 3-23: VNMatch Framework (đề xuất) 73 v Luận văn Th.s: Tìm hiểu về đối sánh lược đồ xây dựng ứng dụng VNMatch Ngô Văn Quân, lớp cao học CNTT 2004 Mục lục các công thức Công thức 1: Cupid, hệ số tương tự của hai tập hợp 19 Công thức 3 19 Công thức 4 19 Công thức 2: Công thức EditDistance biến đổi 42 Công thức 3: Lấy Max . 47 Công thức 4: Lấy theo trọng số 47 Công thức 5: Lấy theo trung bình . 47 Công thức 6: AverageSim . 49 Công thức 7: DiceSim . 49 Công thức 8: Wsim cho các node lá 54 Công thức 9: Liên kết mạnh 54 Công thức 10: ssim trong trường hợp là các node trong . 54 vi Luận văn Th.s: Tìm hiểu về đối sánh lược đồ xây dựng ứng dụng VNMatch Ngô Văn Quân, lớp cao học CNTT 2004 Bảng các từ viết tắt thuật ngữ Tiếng Anh Ý nghĩa Ghi chú Data integration Tích hợp dữ liệu Data translation Chuyển đổi dữ liệu Data warehouse Nhà kho dữ liệu DTD Document Type Definition Global schema Lược đồ tổng thể Holonym Bao hàm phần tử “Cây” bao hàm phần tử “Thân cây” Hypernym Bao hàm khái niệm thuật ngữ “Thực vật” bao hàm khái niệm “Cây” Hyponym Ngược với Hypernym “Cây” nằm trong khái niệm “thực vật” Local schema Lược đồ địa phương Meronym Ngược với Holonym “Thân cây” là bộ phận của cây Ontology Đặc tả của khái niệm OWL Web Ontology Language Schema Lược đồ dữ liệu Schema integration Tích hợp lược đồ vii Luận văn Th.s: Tìm hiểu về đối sánh lược đồ xây dựng ứng dụng VNMatch Ngô Văn Quân, lớp cao học CNTT 2004 Semantic integration Tích hợp ngữ nghĩa Schema mapping Ánh xạ lược đồ, tương tự đối sánh lược đồ Schema matching Đối sánh lược đồ Synonym Từ đồng nghĩa Web Semantic Web ngữ nghĩa XSD XML Schema Definition viii Luận văn Th.s: Tìm hiểu về đối sánh lược đồ xây dựng ứng dụng VNMatch Ngô Văn Quân, lớp cao học CNTT 2004 Tóm tắt luận văn Luận văn cao học với đề tài “Tìm hiểu về đối sánh lược đồ xây dựng ứng dụng VNMatch” nghiên cứu tìm hiểu về bài toán đối sánh lược đồ (schema matching). Bài toán đối sánh lược đồ được áp dụng trong các ứng dụng tích hợp dữ liệu (data integration), chuyển đổi dữ liệu (data translation), nhà kho dữ liệu (data warehousing), các ứng dụng web ngữ nghĩa (Web Semantic). Bài toán đối sánh lược đồ có thể được định nghĩa như sau: “Cho hai lược đồ S1 S2 hãy tìm sự tương đồng giữa các phần tử của S1và S2 bằng cách khai thác tất cả các thông tin tồn tại trong hai lược đồ đó, trong dữ liệu các nguồn thông tin hỗ trợ khác”. Luận văn tập trung nghiên cứu các phương pháp đối sánh lược đồ dựa trên các dự án đã được phát triển của các viện nghiên cứu, trường đại học công ty trên thế giới, tìm hiểu đề xuất một số phương pháp xử lý cho lược đồ được thiết kế dùng tiếng Việt. Đồng thời thiết kế thi công một hệ thống đối sánh lược đồ, được gọi là VNMatch. VNMatch xử lý đầu vào là hai lược đồ được thiết kế dùng ngôn ngữ XML Schema, kết quả đầu ra là tập các ánh xạ có sự tương đồng về mặt ngữ nghĩa giữa các phần tử của hai lược đồ đó. Từ khóa: Schema matching, semantic integration, schema mapping, matcher; đối sánh lược đồ, ánh xạ lược đồ, tích hợp ngữ nghĩa, tích hợp dữ liệu. 1 Luận văn Th.s: Tìm hiểu về đối sánh lược đồ xây dựng ứng dụng VNMatch Ngô Văn Quân, lớp cao học CNTT 2004 Chương 1 Mở đầu Mục tiêu chính của luận văn tốt nghiệp này là nghiên cứu về bài toán đối sánh lược đồ (schema matching). Đối sánh lược đồ là quá trình xác định ngữ nghĩa tương ứng giữa các cấu trúc siêu dữ liệu (metadata) như lược đồ của cơ sở dữ liệu, XSD, Ontology. Đối sánh lược đồ đóng vai trò quan trọng trong các việc tương tác giữa các dịch vụ với nhau trong ứng dụng tích hợp dữ liệu, Data warehouse, E-Business. [...]... Văn Quân, lớp cao học CNTT 2004 24 Luận văn Th.s: Tìm hiểu về đối sánh lược đồ xây dựng ứng dụng VNMatch 2.4 Đối sánh kết hợp Đối sánh chỉ sử dụng một phương pháp tiếp cận sẽ không thích hợp để cho ra một kết quả tốt với sự đa dạng của lược đồ Vì vậy hầu hết các hệ thống đối sánh lược đồ hiện tại đều kết hợp sử dụng nhiều phương pháp đối sánh Đối sánh kết hợp có thể được thực hiện theo hai cách khác... phương pháp đối sánh lược đồ đã được nghiên cứu phát triển trong các ứng dụng cụ thể Hình 2-2: Các phương pháp đối sánh lược đồ Ngô Văn Quân, lớp cao học CNTT 2004 21 Luận văn Th.s: Tìm hiểu về đối sánh lược đồ xây dựng ứng dụng VNMatch Chúng ta phân biệt các phương pháp đối sánh dựa trên phương pháp tiếp cận mà chúng sử dụng • Schema-based ›‹ Instance-based: Schema-based chỉ sử dụng các thông... trị được áp dụng vào các node của đồ thị Quá trình đối sánh được thực hiện theo mô hình top-down đối sánh từng node một với nhau với quy luật là các node cha sẽ cần kết quả đối sánh của các node con • Tự động chuyển đổi dữ liệu giữa các lược đồ instance Ngô Văn Quân, lớp cao học CNTT 2004 17 Luận văn Th.s: Tìm hiểu về đối sánh lược đồ xây dựng ứng dụng VNMatch • 1.6 Các lược đồ đầu vào được biểu... Th.s: Tìm hiểu về đối sánh lược đồ xây dựng ứng dụng VNMatch Kiến trúc này tương thích với nhiều lĩnh vực ứng dụng khác nhauh cho nhiều loại lược đồ khác nhau Đầu vào của hệ thống là các lược đồ các thông tin hộ trợ việc đối sánh như: Từ điển, Ontology, Các hệ số tương tự giữa các kiểu dữ liệu … Phần xử lý bao gồm các thao tác chuyển đổi biểu diễn của lược đồ thành cấu trúc biểu diễn lược đồ bên... Ngô Văn Quân, lớp cao học CNTT 2004 6 Luận văn Th.s: Tìm hiểu về đối sánh lược đồ xây dựng ứng dụng VNMatch 3 Định nghĩa bài toán Bài toán đối sánh lược đồ có thể được định nghĩa như sau: “Cho hai lược đồ S 1và S2 hãy tìm sự tương đồng nhất giữa các phần tử của S 1và S2 bằng cách khai thác tất cả các thông tin tồn tại như trong lược đồ, trong dữ liệu các nguồn thông tin hỗ trợ ” Bài toán cần phải... … 4 Ứng dụng của bài toán đối sánh lược đồ Để nêu lên vai trò quan trọng của bài toán đối sánh lược đồ, chúng ta sẽ xem xét một vài ứng dụng về cở sở dữ liệu để minh họa 4.1 Các ứng dụng tích hợp dữ liệu nhà kho dữ liệu Tích hợp lược đồ là một trong những mục tiêu quan trọng nhất của bài toán đối sánh lược đồ Vấn đề này đã được nghiên cứu từ đầu những năm 80, nó xuất hiện khi người ta cần xây dựng. ..2 Luận văn Th.s: Tìm hiểu về đối sánh lược đồ xây dựng ứng dụng VNMatch 1 Đối sánh lược đồ Một lược đồ là một cấu trúc siêu dữ liệu để mô tả dữ liệu được lưu giữ, truy cập, diễn dịch bởi người dùng các ứng dụng như thế nào Ngoài các khía cạnh liên quan đến quản lý dữ liệu như định dạng dữ liệu, kiểu dữ liệu, lược đồ còn có sự mở rộng liên quan đến ngữ nghĩa của... học CNTT 2004 3 Luận văn Th.s: Tìm hiểu về đối sánh lược đồ xây dựng ứng dụng VNMatch Quá trình tự động này người ta gọi chung là đối sánh lược đồ (schema matching) Nó là chìa khóa trong các ứng dụng tích hợp dữ liệu chuyển đổi dữ liệu 2 Sự hỗn tạp ngữ nghĩa Việc xác định các thành phần tương đương nhau giữa hai lược đồ cần sự phân tích ngữ nghĩa trong các lược đồ đó hay nói cách khác chính là... thức cho ra kết quả cuối cùng của đối sánh dựa trên ngôn ngữ Ngô Văn Quân, lớp cao học CNTT 2004 20 Luận văn Th.s: Tìm hiểu về đối sánh lược đồ xây dựng ứng dụng VNMatch 2 Các phương pháp đối sánh lược đồ Đã có rất nhiều các nghiên cứu trong nhiều lĩnh vực khác nhau như chuyển đổi tích hợp lược đồ (schema translation, schema integration), biểu diễn tri thức, học máy các hệ thống thu thập thông... giải quyết bài toán đối sánh rất hỗn tạp 3.1 Lược đồ Trong các thao tác đối sánh, các lược đồ đầu vào chỉ ra các phần tử cần được đối sánh Vì vậy ta cần xem xét một số loại lược đồ điển hình các phần tử của nó Tùy thuộc vào lĩnh vực của ứng dụng lược đồ có thể tồn tại dưới nhiều định dạng ngôn ngữ khác nhau như SQL, UML, DTD, OWL • SQL (Structured Query Language): Định nghĩa lược đồ cho cơ sở dữ . hiểu về đối sánh lược đồ và xây dựng ứng dụng VNMatch nghiên cứu và tìm hiểu về bài toán đối sánh lược đồ (schema matching). Bài toán đối sánh lược đồ được. Luận văn Th.s: Tìm hiểu về đối sánh lược đồ và xây dựng ứng dụng VNMatch Ngô Văn Quân, lớp cao học CNTT 2004 1 Đối sánh lược đồ Một lược đồ là một cấu

Ngày đăng: 10/11/2012, 10:10

Hình ảnh liên quan

Hình 1-1: Đối sánh lược đồ - Tìm hiểu vể đối sánh lược đồ và xây dựng ứng dụng VNMATCH

Hình 1.

1: Đối sánh lược đồ Xem tại trang 11 của tài liệu.
Hình 1-3: Lược đồ - Tìm hiểu vể đối sánh lược đồ và xây dựng ứng dụng VNMATCH

Hình 1.

3: Lược đồ Xem tại trang 16 của tài liệu.
Kiến trúc chung của bài toán đối sánh lược đồ được mô tả trong hình dưới: - Tìm hiểu vể đối sánh lược đồ và xây dựng ứng dụng VNMATCH

i.

ến trúc chung của bài toán đối sánh lược đồ được mô tả trong hình dưới: Xem tại trang 17 của tài liệu.
Hình 1-5: Minh họa hệ thống tích hợp dữ liệu giúp người dùng tìm văn bản - Tìm hiểu vể đối sánh lược đồ và xây dựng ứng dụng VNMATCH

Hình 1.

5: Minh họa hệ thống tích hợp dữ liệu giúp người dùng tìm văn bản Xem tại trang 19 của tài liệu.
Hình 1-6: Datawarehouse - Tìm hiểu vể đối sánh lược đồ và xây dựng ứng dụng VNMATCH

Hình 1.

6: Datawarehouse Xem tại trang 20 của tài liệu.
Hình 2-1: Kiến trúc COMA++ - Tìm hiểu vể đối sánh lược đồ và xây dựng ứng dụng VNMATCH

Hình 2.

1: Kiến trúc COMA++ Xem tại trang 24 của tài liệu.
Hình 3 minh họa các phương pháp đối sánh lược đồ đã được nghiên cứu và phát triển trong các ứng dụng cụ thể - Tìm hiểu vể đối sánh lược đồ và xây dựng ứng dụng VNMATCH

Hình 3.

minh họa các phương pháp đối sánh lược đồ đã được nghiên cứu và phát triển trong các ứng dụng cụ thể Xem tại trang 29 của tài liệu.
Bảng 1: Đối sánh dựa trên số lượng phần tử - Tìm hiểu vể đối sánh lược đồ và xây dựng ứng dụng VNMATCH

Bảng 1.

Đối sánh dựa trên số lượng phần tử Xem tại trang 33 của tài liệu.
Hình 2-3: Xây dựng các hệ số ưu tiên - Tìm hiểu vể đối sánh lược đồ và xây dựng ứng dụng VNMATCH

Hình 2.

3: Xây dựng các hệ số ưu tiên Xem tại trang 35 của tài liệu.
Hình 2-4: Đánh giá hệ thống đối sánh - Tìm hiểu vể đối sánh lược đồ và xây dựng ứng dụng VNMATCH

Hình 2.

4: Đánh giá hệ thống đối sánh Xem tại trang 36 của tài liệu.
Hình 3-1: Sự hỗn tạp của các nguồn dữ liệu - Tìm hiểu vể đối sánh lược đồ và xây dựng ứng dụng VNMATCH

Hình 3.

1: Sự hỗn tạp của các nguồn dữ liệu Xem tại trang 40 của tài liệu.
Hình 3-3: Kiến trúc hệ thống - Tìm hiểu vể đối sánh lược đồ và xây dựng ứng dụng VNMATCH

Hình 3.

3: Kiến trúc hệ thống Xem tại trang 45 của tài liệu.
Hình 3-4: Hợp nhất các lược đồ phân tán - Tìm hiểu vể đối sánh lược đồ và xây dựng ứng dụng VNMATCH

Hình 3.

4: Hợp nhất các lược đồ phân tán Xem tại trang 47 của tài liệu.
Hình 3-7: Tái sử dụng các định nghĩa - Tìm hiểu vể đối sánh lược đồ và xây dựng ứng dụng VNMATCH

Hình 3.

7: Tái sử dụng các định nghĩa Xem tại trang 48 của tài liệu.
Bảng 2: - Tìm hiểu vể đối sánh lược đồ và xây dựng ứng dụng VNMATCH

Bảng 2.

Xem tại trang 49 của tài liệu.
Hình 3-8:Sơ đồ đối sánh mức ngôn ngữ (linguistic matching) - Tìm hiểu vể đối sánh lược đồ và xây dựng ứng dụng VNMATCH

Hình 3.

8:Sơ đồ đối sánh mức ngôn ngữ (linguistic matching) Xem tại trang 50 của tài liệu.
Hình 3-10: Phân tích phần tử đầu vào - Tìm hiểu vể đối sánh lược đồ và xây dựng ứng dụng VNMATCH

Hình 3.

10: Phân tích phần tử đầu vào Xem tại trang 55 của tài liệu.
Hình 3-11: Thực hiện bước Direction và Selection - Tìm hiểu vể đối sánh lược đồ và xây dựng ứng dụng VNMATCH

Hình 3.

11: Thực hiện bước Direction và Selection Xem tại trang 57 của tài liệu.
Hình 3-12: Tổng hợp kết quả - Tìm hiểu vể đối sánh lược đồ và xây dựng ứng dụng VNMATCH

Hình 3.

12: Tổng hợp kết quả Xem tại trang 58 của tài liệu.
Hình 3-13: SimCube theo phương pháp đối sánh kết hợp - Tìm hiểu vể đối sánh lược đồ và xây dựng ứng dụng VNMATCH

Hình 3.

13: SimCube theo phương pháp đối sánh kết hợp Xem tại trang 59 của tài liệu.
Hình 3-17: Hệ số tương tự củ a2 node lá - Tìm hiểu vể đối sánh lược đồ và xây dựng ứng dụng VNMATCH

Hình 3.

17: Hệ số tương tự củ a2 node lá Xem tại trang 61 của tài liệu.
Hình 3-18: Hệ số tương tự củ a2 node trong - Tìm hiểu vể đối sánh lược đồ và xây dựng ứng dụng VNMATCH

Hình 3.

18: Hệ số tương tự củ a2 node trong Xem tại trang 61 của tài liệu.
giảm ssim của các node lá đi một giá trị cdec. Ví dụ trong hình 8, Org_Send được ánh xạ với Sender có hệ số giống nhau cao nên các node con của hai  node đó được tăng thêm độ giống nhau hơn so với cặ p name, address  khác, tương tự như vậy nếu hệ số ssim  - Tìm hiểu vể đối sánh lược đồ và xây dựng ứng dụng VNMATCH

gi.

ảm ssim của các node lá đi một giá trị cdec. Ví dụ trong hình 8, Org_Send được ánh xạ với Sender có hệ số giống nhau cao nên các node con của hai node đó được tăng thêm độ giống nhau hơn so với cặ p name, address khác, tương tự như vậy nếu hệ số ssim Xem tại trang 64 của tài liệu.
Hình 3-20:Cấu trúc VNMatch - Tìm hiểu vể đối sánh lược đồ và xây dựng ứng dụng VNMATCH

Hình 3.

20:Cấu trúc VNMatch Xem tại trang 66 của tài liệu.
• Bảng Synonym (thesauri.xml): chứa danh mục các từ đồng nghĩa - Tìm hiểu vể đối sánh lược đồ và xây dựng ứng dụng VNMATCH

ng.

Synonym (thesauri.xml): chứa danh mục các từ đồng nghĩa Xem tại trang 67 của tài liệu.
Hình 3-22: Lớp HybridMatcher - Tìm hiểu vể đối sánh lược đồ và xây dựng ứng dụng VNMATCH

Hình 3.

22: Lớp HybridMatcher Xem tại trang 67 của tài liệu.
• Bảng DataType (datatype.xml): Chứa các ánh xạ giữa các kiểu dữ liệu - Tìm hiểu vể đối sánh lược đồ và xây dựng ứng dụng VNMATCH

ng.

DataType (datatype.xml): Chứa các ánh xạ giữa các kiểu dữ liệu Xem tại trang 68 của tài liệu.
Thử nghiệm trên 2 lược đồ đầu vào, hai lược đồ này biểu diễn mô hình các đối tượng trong một phiếu thanh toán đơn hàng - Tìm hiểu vể đối sánh lược đồ và xây dựng ứng dụng VNMATCH

h.

ử nghiệm trên 2 lược đồ đầu vào, hai lược đồ này biểu diễn mô hình các đối tượng trong một phiếu thanh toán đơn hàng Xem tại trang 69 của tài liệu.
Hình 3-23: VNMatch Framework (đề xuất) - Tìm hiểu vể đối sánh lược đồ và xây dựng ứng dụng VNMATCH

Hình 3.

23: VNMatch Framework (đề xuất) Xem tại trang 82 của tài liệu.

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan