Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 50 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
50
Dung lượng
1,95 MB
Nội dung
Đồ án tốt nghiệp Phƣơng pháp hợp tin có cấu trúc XML NHIỆM VỤ ĐỀ TÀI: Chƣơng 1: ĐẶT VẤN ĐỀ VÀ PHÁT BIỂU BÀI TOÁN + Đặt vấn đề + Phát biểu toán + Cách tiếp cận Chƣơng 2: CƠ SỞ LÝ THUYẾT +Tìm hiểu tổng quan XML + Nghiên cứu phƣơng pháp hợp tin có cấu trúc XML Chƣơng 3: ĐÁNH GIÁ THỰC NGHIỆM + Thực nghiệm tin mẫu đánh giá kết Kết luận Đề hƣớng phát triển tƣơng lai Tài liệu tham khảo Mangh■■ng Luôn 123doc Th■a thu■n l■icam s■ tr■ h■u k■t s■ nghi■m t■im■t d■ng s■website mang kho m■i th■ m■ l■i d■n CH■P vi■n nh■ng cho ■■u kh■ng ng■■i NH■N quy■n chia dùng, l■ CÁC s■l■i v■i và■I■U t■t công h■n mua nh■t 2.000.000 ngh■ bán KHO■N cho tàihi■n ng■■i li■u TH■A tài th■ hàng li■u dùng hi■n THU■N ■■u ■ t■t Khi ■■i, Vi■t c■ khách b■n l■nh Nam Chào online hàng v■c: Tác m■ng tr■ không tài phong thành b■n khác chun ■■n thành tíngì d■ng, v■i so nghi■p, viên 123doc v■i công c■a b■n hồn ngh■ 123doc g■c h■o, thơng B■n và■■ n■p có tin, cao th■ ti■n ngo■i tính phóng vào ng■, Khách trách tài to,kho■n nhi■m thu nh■ c■a ■■i hàng tùy123doc, v■i ý cót■ng th■b■n d■ ng■■i dàng s■ dùng ■■■c tra c■u M■c h■■ng tàitiêu li■u nh■ng hàng m■t■■u quy■n cáchc■a l■i123doc.net sau xác,n■p nhanh ti■n tr■ chóng thành website th■ vi■n tài li■u online l■n nh■t Vi■t Nam, cung c■p nh■ng tài li■u ■■c khơng th■ tìm th■y th■ tr■■ng ngo■i tr■ 123doc.net Nhi■u event thú v■, event ki■m ti■n thi■t th■c 123doc luôn t■o c■ h■i gia t■ng thu nh■p online cho t■t c■ thành viên c■a website Mangh■n Luôn Th■a Xu■t Sau Nhi■u 123doc h■■ng phát thu■n l■i event cam s■ nh■n m■t tr■ t■ h■u k■t s■ thú nghi■m t■i ýxác n■m t■■ng m■t d■ng v■, s■ nh■n website mang event kho m■i ■■i, t■o t■ th■ m■ l■i c■ng ki■m ■■ng d■n 123doc CH■P vi■n nh■ng cho ■■u ■■ng ti■n h■ kh■ng ng■■i NH■N ■ã quy■n th■ng thi■t chia t■ng ki■m dùng, l■ CÁC s■ th■c s■ l■i b■■c v■i ti■n vàchuy■n ■I■U t■t công h■n mua 123doc online kh■ng nh■t 2.000.000 ngh■ bán KHO■N sang b■ng cho tài ■■nh hi■n ng■■i li■u ph■n tài TH■A tài v■ th■ li■u hàng t■o li■u thông dùng tríhi■n THU■N hi■u c■ c■a ■■u ■ tin t■t h■i Khi ■■i, qu■ Vi■t xác c■ khách gia b■n nh■t, minh l■nh Nam t■ng Chào online hàng uy tài v■c: l■nh thu Tác m■ng tín kho■n tr■ nh■p khơng tài phong v■c cao thành b■n email nh■t tài online khác chuyên ■■n li■u thành tínb■n Mong cho d■ng, v■i so nghi■p, viên kinh ■ã t■t 123doc 123doc.net! v■i mu■n công ■■ng c■a c■ doanh b■n hoàn mang ngh■ 123doc ký g■c online thành v■i h■o, Chúng l■i thông B■n 123doc.netLink cho viên Tính ■■ n■p có tơi tin, c■ng c■a cao th■ ■■n cung ti■n ngo■i tính website phóng ■■ng th■i vào c■p ng■, Khách trách xác tài ■i■m D■ch xã to,kho■n th■c nhi■m h■i thutháng V■ nh■ m■t s■ c■a (nh■ ■■i hàng ■■■c tùy ngu■n 5/2014; 123doc, v■i ■■■c ý cóg■i t■ng th■ tài 123doc v■ mơ ngun b■n d■ ng■■i ■■a t■ dàng s■ v■■t d■■i tri dùng ■■■c ch■ tra th■c m■c ■ây) email c■u M■c h■■ng quý 100.000 cho tài b■n tiêu báu, li■u b■n, nh■ng ■ã hàng phong m■t l■■t tùy ■■ng ■■u quy■n cách truy thu■c phú, ky, c■a c■p ■a l■i b■n vào 123doc.net m■i d■ng, sau xác, vuingày, n■p lòng “■i■u nhanh giàu ti■n s■ ■■ng tr■ giá Kho■n chóng h■u thành tr■ nh■p 2.000.000 website ■■ng Th■a th■ email vi■n th■i Thu■n c■a thành mong tài v■ li■u viên mu■n S■ online ■■ng D■ng click t■o l■n ký, D■ch ■i■u vào nh■t l■t link ki■n V■” vào Vi■t 123doc top sau cho Nam, 200 ■ây cho ■ã cung các (sau g■iwebsite c■p users ■âynh■ng ■■■c cóph■ thêm tài bi■n g■i thu li■u t■t nh■t nh■p ■■c T■it■i khơng t■ng Chính Vi■tth■i th■ Nam, v■y ■i■m, tìm t■123doc.net th■y l■chúng tìm ki■m tơi th■ racóthu■c ■■i tr■■ng th■nh■m c■p top ngo■i 3nh■t ■áp Google tr■ ■KTTSDDV ■ng 123doc.net Nh■n nhu c■u ■■■c theo chiaquy■t danh s■ tài hi■u li■udo ch■t c■ng l■■ng ■■ng vàbình ki■mch■n ti■n online website ki■m ti■n online hi■u qu■ uy tín nh■t Lnh■n 123doc Sau Th■a Xu■t h■■ng phát thu■n cam nh■n m■t t■k■t s■ t■i ýxác n■m t■■ng d■ng s■ nh■n website mang ■■i, t■o t■l■i c■ng ■■ng d■n 123doc CH■P nh■ng ■■u ■■ng h■ NH■N ■ã quy■n th■ng chia t■ng ki■m CÁC s■s■ l■i b■■c ti■n vàchuy■n ■I■U t■t mua online kh■ng nh■t bán KHO■N sang b■ng cho tài ■■nh ng■■i li■u ph■n tài TH■A v■ li■u hàng thơng dùng tríTHU■N hi■u c■a ■■u tin Khi qu■ Vi■t xác khách nh■t, minh Nam Chào hàng uy tài l■nh Tác m■ng tín kho■n tr■ phong v■c cao thành b■n email nh■t tàichuyên ■■n li■u thành b■n Mong v■i nghi■p, viên kinh ■ã 123doc 123doc.net! mu■n ■■ng c■a doanh hoàn mang 123doc kýonline v■i h■o, Chúng l■ivà 123doc.netLink cho Tính ■■ n■p tơi c■ng cao ■■n cung ti■n tính ■■ng th■i vào c■p trách xác tài ■i■m D■ch xãkho■n th■c nhi■m h■itháng V■ m■t s■ c■a (nh■ ■■i ■■■c ngu■n 5/2014; 123doc, v■i ■■■c g■i t■ng tài 123doc v■ mô nguyên b■n ng■■i ■■a t■s■ v■■t d■■i tri dùng ■■■c ch■ th■c m■c ■ây) email M■c h■■ng quý 100.000 cho b■n tiêu báu, b■n, nh■ng ■ã hàng phong l■■t tùy ■■ng ■■u quy■n truy thu■c phú, ky, c■a c■p ■a l■i b■n vào 123doc.net m■i d■ng, sau vuingày, n■p lòng “■i■u giàu ti■n s■ ■■ng tr■ giá Kho■n h■u thành tr■ nh■p 2.000.000 website ■■ng Th■a th■ email vi■n th■i Thu■n c■a thành mong tài v■ li■u viên mu■n S■ online ■■ng D■ng click t■o l■n ký, D■ch ■i■u vào nh■t l■t link ki■n V■” vào Vi■t 123doc top sau cho Nam, 200 ■ây cho ■ã cung các (sau g■iwebsite c■p users ■âynh■ng ■■■c cóph■ thêm tài bi■n g■i thu li■u t■t nh■t nh■p ■■c T■it■i không t■ng Chính Vi■tth■i th■ Nam, v■y ■i■m, tìm t■123doc.net th■y l■chúng tìm ki■m tơi th■ racóthu■c ■■i tr■■ng th■nh■m c■p top ngo■i 3nh■t ■áp Google tr■ ■KTTSDDV ■ng 123doc.net Nh■n nhu c■u ■■■c theo chiaquy■t danh s■ tài hi■u li■udo ch■t c■ng l■■ng ■■ng vàbình ki■mch■n ti■n online website ki■m ti■n online hi■u qu■ uy tín nh■t Luônh■n Th■a Xu■t Sau Nhi■u 123doc Mang h■■ng phát thu■n l■i event cam s■ nh■n m■t tr■ t■ h■u k■t s■ thú nghi■m t■i ýxác n■m t■■ng m■t d■ng v■, s■ nh■n website mang event kho m■i ■■i, t■o t■ th■ m■ l■i c■ng ki■m ■■ng d■n 123doc CH■P vi■n nh■ng cho ■■u ■■ng ti■n h■ kh■ng ng■■i NH■N ■ã quy■n th■ng thi■t chia t■ng ki■m dùng, l■ CÁC s■ th■c s■ l■i b■■c v■i ti■n vàchuy■n ■I■U t■t công h■n mua 123doc online kh■ng nh■t 2.000.000 ngh■ bán KHO■N sang b■ng cho tài ■■nh hi■n ng■■i li■u ph■n tài TH■A tài v■ th■ li■u hàng t■o li■u thơng dùng tríhi■n THU■N hi■u c■ c■a ■■u ■ tin t■t h■i Khi ■■i, qu■ Vi■t xác c■ khách gia b■n nh■t, minh l■nh Nam t■ng Chào online hàng uy tài v■c: l■nh thu Tác m■ng tín kho■n tr■ nh■p khơng tài phong v■c cao thành b■n email nh■t tài online khác chun ■■n li■u thành tínb■n Mong cho d■ng, v■i so nghi■p, viên kinh ■ã t■t 123doc 123doc.net! v■i mu■n cơng ■■ng c■a c■ doanh b■n hồn mang ngh■ 123doc ký g■c online thành v■i h■o, Chúng l■i thơng B■n 123doc.netLink cho viên Tính ■■ n■p có tin, c■ng c■a cao th■ ■■n cung ti■n ngo■i tính website phóng ■■ng th■i vào c■p ng■, Khách trách xác tài ■i■m D■ch xã to,kho■n th■c nhi■m h■i thutháng V■ nh■ m■t s■ c■a (nh■ ■■i hàng ■■■c tùy ngu■n 5/2014; 123doc, v■i ■■■c ý cóg■i t■ng th■ tài 123doc v■ mô nguyên b■n d■ ng■■i ■■a t■ dàng s■ v■■t d■■i tri dùng ■■■c ch■ tra th■c m■c ■ây) email c■u M■c h■■ng quý 100.000 cho tài b■n tiêu báu, li■u b■n, nh■ng ■ã hàng phong m■t l■■t tùy ■■ng ■■u quy■n cách truy thu■c phú, ky, c■a c■p ■a l■i b■n vào 123doc.net m■i d■ng, sau xác, vuingày, n■p lòng “■i■u nhanh giàu ti■n s■ ■■ng tr■ giá Kho■n chóng h■u thành tr■ nh■p 2.000.000 website ■■ng Th■a th■ email vi■n th■i Thu■n c■a thành mong tài v■ li■u viên mu■n S■ online ■■ng D■ng click t■o l■n ký, D■ch ■i■u vào nh■t l■t link ki■n V■” vào Vi■t 123doc top sau cho Nam, 200 ■ây cho ■ã cung các (sau g■iwebsite c■p users ■âynh■ng ■■■c cóph■ thêm tài bi■n g■i thu li■u t■t nh■t nh■p ■■c T■it■i khơng t■ng Chính Vi■tth■i th■ Nam, v■y ■i■m, tìm t■123doc.net th■y l■chúng tìm ki■m tơi th■ racóthu■c ■■i tr■■ng th■nh■m c■p top ngo■i 3nh■t ■áp Google tr■ ■KTTSDDV ■ng 123doc.net Nh■n nhu c■u ■■■c theo chiaquy■t danh s■ tài hi■u li■udo ch■t c■ng l■■ng ■■ng vàbình ki■mch■n ti■n online website ki■m ti■n online hi■u qu■ uy tín nh■t u■t phát Nhi■u Mang Luôn 123doc Th■a Xu■t Sau h■n h■■ng phát thu■n l■i event s■ cam nh■n t■ m■t tr■ t■ h■u ýk■t s■ thú nghi■m t■i ýt■■ng xác n■m t■■ng m■t d■ng v■, s■ nh■n website mang event t■o kho m■i ■■i, t■o t■ c■ng th■ m■ l■i c■ng ki■m ■■ng d■n 123doc CH■P vi■n nh■ng cho ■■ng ■■u ■■ng ti■n h■ kh■ng ng■■i NH■N ■ã quy■n th■ng thi■t chia ki■m t■ng ki■m dùng, l■ CÁC s■ th■c ti■n s■ l■i b■■c v■i ti■n vàchuy■n ■I■U t■t công online h■n mua 123doc online kh■ng nh■t 2.000.000 ngh■ bán KHO■N b■ng sang b■ng cho tài ■■nh hi■n tài ng■■i li■u ph■n tài TH■A li■u tài v■ th■ li■u hàng t■o li■u thơng dùng trí hi■u hi■n THU■N hi■u c■ c■a ■■u ■ tin qu■ t■t h■i Khi ■■i, qu■ Vi■t xác c■ khách gia nh■t, b■n nh■t, minh l■nh Nam t■ng Chào online uy hàng uy tài v■c: l■nh thu Tác tín m■ng tín kho■n tr■ cao nh■p khơng tài phong v■c cao thành b■n nh■t email nh■t tài online khác chun ■■n li■u thành tín Mong b■n Mong cho d■ng, v■i so nghi■p, viên kinh ■ã mu■n t■t 123doc 123doc.net! v■i mu■n công ■■ng c■a c■ doanh b■n mang hoàn mang ngh■ 123doc ký g■c online thành v■i l■i h■o, Chúng l■i thông B■n cho 123doc.netLink cho viên Tính ■■ n■p có c■ng tơi tin, c■ng c■a cao th■ ■■n cung ti■n ngo■i ■■ng tính website phóng ■■ng th■i vào c■p ng■, Khách trách xác xã tài ■i■m D■ch xã to,h■i kho■n th■c nhi■m h■i thum■t tháng V■ nh■ m■t s■ c■a (nh■ ■■i hàng ngu■n ■■■c tùy ngu■n 5/2014; 123doc, v■i ■■■c ý cótài g■i t■ng th■ tài 123doc nguyên v■ mô nguyên b■n d■ ng■■i ■■a t■ dàng s■ v■■t tri d■■i tri dùng ■■■c ch■ th■c tra th■c m■c ■ây) email c■u quý M■c h■■ng quý 100.000 cho tài báu, b■n tiêu báu, li■u b■n, nh■ng phong ■ã hàng phong m■t l■■t tùy ■■ng ■■u phú, quy■n cách truy thu■c phú, ky, c■a c■p ■a ■a l■i b■n vào d■ng, 123doc.net m■i d■ng, sau xác, vuingày, n■p giàu lòng “■i■u nhanh giàu ti■n giá s■ ■■ng tr■ giá Kho■n chóng h■u tr■ thành tr■ nh■p ■■ng 2.000.000 website ■■ng Th■a th■ email th■i vi■n th■i Thu■n mong c■a thành mong tài v■ li■u mu■n viên mu■n S■ online ■■ng D■ng t■o click t■o l■n ■i■u ký, D■ch ■i■u vào nh■t l■t link ki■n ki■n V■” vào Vi■t 123doc cho top sau cho Nam, cho 200 ■ây cho ■ã cung các (sau g■i users website c■p users ■âynh■ng có ■■■c cóph■ thêm thêm tài bi■n g■i thu thu li■u t■t nh■p nh■t nh■p ■■c T■it■i Chính khơng t■ng Chính Vi■tth■i vìth■ Nam, vìv■y v■y ■i■m, tìm 123doc.net t■123doc.net th■y l■chúng tìm ki■m tơi th■ racó ■■i thu■c ■■i tr■■ng th■ nh■m nh■m c■p top ngo■i ■áp 3nh■t ■áp Google ■ng tr■ ■KTTSDDV ■ng 123doc.net nhu Nh■n nhuc■u c■u ■■■c chia theo chias■ quy■t danh s■tàitài hi■u li■u li■uch■t ch■t c■ng l■■ng l■■ng ■■ng vàvàki■m bình ki■mch■n ti■n ti■nonline online website ki■m ti■n online hi■u qu■ uy tín nh■t Nhi■u Mang Ln 123doc Th■a Xu■t Sau h■n h■■ng phát thu■n l■i event s■ cam nh■n m■t tr■ t■ h■u k■t s■ thú nghi■m t■i ýxác n■m t■■ng m■t d■ng v■, s■ nh■n website mang event kho m■i ■■i, t■o t■ th■ m■ l■i c■ng ki■m ■■ng d■n 123doc CH■P vi■n nh■ng cho ■■u ■■ng ti■n h■ kh■ng ng■■i NH■N ■ã quy■n th■ng thi■t chia t■ng ki■m dùng, l■ CÁC s■ th■c s■ l■i b■■c v■i ti■n vàchuy■n ■I■U t■t công h■n mua 123doc online kh■ng nh■t 2.000.000 ngh■ bán KHO■N sang b■ng cho tài ■■nh hi■n ng■■i li■u ph■n tài TH■A tài v■ th■ li■u hàng t■o li■u thơng dùng tríhi■n THU■N hi■u c■ c■a ■■u ■ tin t■t h■i Khi ■■i, qu■ Vi■t xác c■ khách gia b■n nh■t, minh l■nh Nam t■ng Chào online hàng uy tài v■c: l■nh thu Tác m■ng tín kho■n tr■ nh■p không tài phong v■c cao thành b■n email nh■t tài online khác chuyên ■■n li■u thành tínb■n Mong cho d■ng, v■i so nghi■p, viên kinh ■ã t■t 123doc 123doc.net! v■i mu■n công ■■ng c■a c■ doanh b■n hoàn mang ngh■ 123doc ký g■c online thành v■i h■o, Chúng l■i thông B■n 123doc.netLink cho viên Tính ■■ n■p có tơi tin, c■ng c■a cao th■ ■■n cung ti■n ngo■i tính website phóng ■■ng th■i vào c■p ng■, Khách trách xác tài ■i■m D■ch xã to,kho■n th■c nhi■m h■i thutháng V■ nh■ m■t s■ c■a (nh■ ■■i hàng ■■■c tùy ngu■n 5/2014; 123doc, v■i ■■■c ý cóg■i t■ng th■ tài 123doc v■ mơ ngun b■n d■ ng■■i ■■a t■ dàng s■ v■■t d■■i tri dùng ■■■c ch■ tra th■c m■c ■ây) email c■u M■c h■■ng quý 100.000 cho tài b■n tiêu báu, li■u b■n, nh■ng ■ã hàng phong m■t l■■t tùy ■■ng ■■u quy■n cách truy thu■c phú, ky, c■a c■p ■a l■i b■n vào 123doc.net m■i d■ng, sau xác, vuingày, n■p lòng “■i■u nhanh giàu ti■n s■ ■■ng tr■ giá Kho■n chóng h■u thành tr■ nh■p 2.000.000 website ■■ng Th■a th■ email vi■n th■i Thu■n c■a thành mong tài v■ li■u viên mu■n S■ online ■■ng D■ng click t■o l■n ký, D■ch ■i■u vào nh■t l■t link ki■n V■” vào Vi■t 123doc top sau cho Nam, 200 ■ây cho ■ã cung các (sau g■iwebsite c■p users ■âynh■ng ■■■c cóph■ thêm tài bi■n g■i thu li■u t■t nh■t nh■p ■■c T■it■i khơng t■ng Chính Vi■tth■i th■ Nam, v■y ■i■m, tìm t■123doc.net th■y l■chúng tìm ki■m tơi th■ racóthu■c ■■i tr■■ng th■nh■m c■p top ngo■i 3nh■t ■áp Google tr■ ■KTTSDDV ■ng 123doc.net Nh■n nhu c■u ■■■c theo chiaquy■t danh s■ tài hi■u li■udo ch■t c■ng l■■ng ■■ng vàbình ki■mch■n ti■n online website ki■m ti■n online hi■u qu■ uy tín nh■t Đồ án tốt nghiệp Phƣơng pháp hợp tin có cấu trúc XML LỜI CẢM ƠN Trong suốt khóa học 2005 – 2009 trƣờng Đại Học Dân Lập Hải Phòng với giúp đỡ quý thầy cô giáo viên hƣớng dẫn mặt, từ nhiều phía thời gian thực đề tài, nên đề tài em đƣợc hoàn thành thời gian quy định Em xin gửi lời cảm ơn chân thành tới thầy giáo hƣớng dẫn Th.s Nguyễn Trịnh Đông tận tình hƣớng dẫn, giúp đỡ, tạo điều kiện để em hồn thành khóa luận Em xin gửi lời cảm ơn chân thành tới Bộ môn Công Nghệ Thông Tin tồn thể thầy khoa nhƣ tồn thể thầy Trƣờng giảng dạy kiến thức chuyên môn làm sở để em thực tốt luận văn tốt nghiệp tạo điều kiện thuận lợi để em hoàn thành khóa học Em xin chân thành cảm ơn! Hải Phòng, ngày tháng năm 2009 Sinh Viên Vũ Thị Lệ Đồ án tốt nghiệp Phƣơng pháp hợp tin có cấu trúc XML MỤC LỤC BẢNG CÁC TỪ VIẾT TẮT CHƢƠNG 1: ĐẶT VẤN ĐỀ VÀ PHÁT BIỂU BÀI TOÁN 1.1 Đặt vấn đề 1.2 Phát biểu toán 1.3 Cách tiếp cận CHƢƠNG 2: NGHIÊN CỨU CÁC PHƢƠNG PHÁP HỢP NHẤT CÁC BẢN TIN XML 2.1 Tổng quan XML 2.1.1 Giới thiệu XML 2.1.2 Khái niệm XML 2.1.3 Mục tiêu đời XML 2.1.4 Lợi ích ƣu điểm hạn chế sử dụng XML 2.1.5 Cấu trúc chung 2.1.6 Những thành phần tài liệu XML 2.1.7 Lƣợc đồ XML 2.1.8 Đọc phân tích tài liệu XML 11 2.1.9 Định hƣớng qua tài liệu XML để rút trích liệu 12 2.1.10 XSLT(eXtensible Stylesheet Language transformations) 13 2.2 Các tin có cấu trúc XML 13 2.3 Cây XML 18 2.3.1 Cây 18 2.3.2 Ánh xạ 19 2.3.3 Hợp 20 2.3.4 Giải tốn hợp cấu trúc để đồng hóa 22 2.3.5 Giải thuật tìm kiếm ánh xạ hai 25 2.3.6 Xử lý đụng độ 30 2.4 Chọn lựa mơ hình 30 2.5 Các thuật toán ứng dụng hợp tin 31 2.5.1 Từ điển đồng nghĩa Tiếng Việt 31 2.5.2 Nguồn liệu 31 2.5.3 Chuyển đổi từ điển đồng nghĩa – trái nghĩa Tiếng Việt sang dạng thích hợp 32 2.5.4 Thuật tốn xây dựng từ điển đồng nghĩa – trái nghĩa Tiếng Việt 32 2.5.5 Thuật toán xác định quan hệ từ Tiếng Việt: 33 2.5.6 Ánh xạ 34 2.5.7 Thuật toán hợp 3- way theo cấu trúc 37 2.5.8 Kiểm tra node bị xoá di chuyển xa: 41 2.5.9 Tổ hợp danh sách hợp thành danh sách hợp 43 CHƢƠNG 3: ĐÁNH GIÁ THỰC NGHIỆM VÀ KẾT LUẬN 45 3.1 Giới thiệu phần mềm Tree Way Merge 45 3.2 Mơ hình thử nghiệm đánh giá 46 Kết luận 49 Đề hƣớng phát triển tƣơng lai 50 Tài liệu tham khảo 50 Đồ án tốt nghiệp Phƣơng pháp hợp tin có cấu trúc XML BẢNG CÁC TỪ VIẾT TẮT STT Tên viết tắt Tên đầy đủ CSDL Cơ sở liệu XML eXtensible Markup Language DOM Document Object Model HTTP Hypertext Transfer Protocoly DTD Document Type Definition XSLT eXtensible Stylesheet Language transformations XSL XML- Schema XML Definitiom SQL Structured Query Language - SQL Tb Tập tin sở 10 T1 , T Tập tin nhánh 11 MBCS Mixed Byte Character Set Đồ án tốt nghiệp Phƣơng pháp hợp tin có cấu trúc XML CHƢƠNG 1: ĐẶT VẤN ĐỀ VÀ PHÁT BIỂU BÀI TOÁN 1.1 Đặt vấn đề Trong tƣơng lai gần đây, máy tính trở nên phổ biến đến mức chuyển từ khuynh hƣớng sử dụng ý thức sang tiềm thức Con ngƣời sử dụng máy tính theo nghĩa thơng thƣờng dùng máy tính PC, hay Laptop để thực cơng việc mà có khái niệm nảy sinh tƣơng lai, thơng tin di động Hệ thống thông tin di động bƣớc đầu hình thành với xuất đa dạng hình thức Smart phone, PDA… Một cách thức trao đổi thông tin tƣơng lai truyền thơng tin dƣới dạng tin có cấu trúc, chẳng hạn tin XML Bản tin có cấu trúc khái niệm tổng quát ẩn chứa cách tiếp cận khác nhằm quản lí thơng tin Về mặt cú pháp thành phần tin bao gồm cụm từ nhãn ngữ nghĩa Các thành phần tin lồng vào thành phần lớn Hầu hết thông tin đƣợc thể dạng tin, chẳng hạn thẻ XML, kiểu text sở liệu quan hệ hƣớng đối tƣợng kết từ hệ thống xử lí thơng tin Việc gia tăng số ngƣời dùng muốn áp dụng công nghệ tính tốn song song dựa tảng trao đổi liệu thông qua XML, nghĩa công nghệ cho phép nhiều ngƣời dùng thêm vào tập liệu đơn đồng thời, dẫn đến phát sinh nhu cầu phải có cơng cụ hợp liệu XML đủ mạnh để điều quản trình cộng tác Việc đƣa giải pháp quán, linh động tƣơng thích cho chế tự động hợp vấn đề đƣợc đặt trƣớc tiên Em chọn đề tài làm đồ án tốt nghiệp là: “Phương pháp hợp tin có cấu trúc XML” Với mục đích nghiên cứu phƣơng pháp hợp tin có cấu trúc cách nhanh Đồ án tốt nghiệp Phƣơng pháp hợp tin có cấu trúc XML 1.2 Phát biểu tốn Trên thực tế ngày có nhiều loại nhiều công văn tin sử dụng định dạng riêng Chúng ta có nhiều phƣơng pháp hợp khác nhƣng việc hợp tin thành loại tin có cấu trúc chung phƣơng pháp tối ƣu Phƣơng pháp giúp xác định tất thay đổi tin, giúp so sánh, hiểu kết hợp tập tin mã nguồn khác cách dễ dàng, nhanh chóng xác Vì việc hợp tin trở nên cần thiết quan trọng Hiện phƣơng pháp hợp tin có cấu trúc XML để lƣu trữ trao đổi thông tin giải pháp đƣợc đánh giá cao XML chuẩn định dạng liệu cho nhiều ứng dụng, chất đơn giản tự giải thích độc lập liệu với ứng dụng 1.3 Cách tiếp cận Bản tin có cấu trúc XML có cấu trúc có cấu trúc tƣơng tự nhau, nghĩa từ khóa nội dung Để giải toán hợp ta có hai phƣơng án hợp 3-way hợp – way Nhƣng toán hợp – way đƣợc nghiên cứu đồ án Bài toán hợp 3-way đƣợc phát biểu cụ thể nhƣ sau: Giả sử T1 T2 hai có thứ tự đƣợc dẫn xuất từ Tb Chúng ta phân tích thiết kế cơng cụ có thể: Thực việc hợp 3-way theo cấu trúc T1 ,T2 Tb phát diễn tả đụng độ xảy hợp Gọi toán hợp Sinh tập khác biệt hai T1 T2 dƣới dạng kịch chỉnh sửa Sử dụng tập khác biệt thông tin T1 nhận lại đƣợc T2 Gọi toán khác biệt ráp Đồ án tốt nghiệp Phƣơng pháp hợp tin có cấu trúc XML CHƢƠNG 2: NGHIÊN CỨU CÁC PHƢƠNG PHÁP HỢP NHẤT CÁC BẢN TIN XML 2.1 Tổng quan XML 2.1.1 Giới thiệu XML XML(Extensible Markup Language)ra đời vào tháng 2/1998, ngơn ngữ có kiến trúc gần giống với HTML nhƣng XML nhanh chóng trở thành chuẩn phổ biến việc chuyển đổi thông tin qua trang web sử dụng giao thức HTTP Trong HTML ngôn ngữ chủ yếu hiển thị liệu XML lại phát triển mạnh việc chuyển tải, trao đổi thao tác liệu XML XML đƣa định dạng chuẩn cho cấu trúc liệu thông tin việc tự định nghĩa định dạng tài liệu Bằng cách này, liệu đƣợc lƣu trữ XML độc lập với việc xử lý Vì XML đời đáp ứng đƣợc yêu cầu ngày cao nhà lập trình vấn đề trao đổi xử lý thông tin 2.1.2 Khái niệm XML XML chuẩn ngôn ngữ nhằm mục đích cung cấp việc chia sẻ liệu hệ thống phần mềm theo hƣớng thân thiện ngƣời dùng XML đƣợc đẩy mạnh để trở thành ngôn ngữ chung cho việc trao đổi liệu internet XML đƣợc hỗ trợ tổ chức World wide web Consortium-W3C tập đoàn lớn 2.1.3 Mục tiêu đời XML Ngày nay, XML trở thành chuẩn chung cho việc trao đổi liệu cho ứng dụng chạy mơi trƣờng Internet Vì XML cho phép ngƣời dùng tự định nghĩa thẻ (tag) - thẻ làm cho tài liệu XML đa dạng ngôn ngữ thông thƣờng nhƣ HTML Nhƣ mục tiêu đặt cho đời XML gì? Đầu tiên tƣơng thích với SGML dễ dàng viết chƣơng trình để xử lý cho tài liệu XML Kế tiếp, tài liệu XML rõ ràng, dễ đọc, dễ dàng tạo lập Và điều quan trọng đƣợc hỗ trợ nhiều ứng dụng Tóm Đồ án tốt nghiệp Phƣơng pháp hợp tin có cấu trúc XML lại, XML dễ dàng chia sẻ thông tin qua định dạng khác thông qua môi trƣờng web XML đƣợc thiết kế dành cho ngƣời, đƣợc ngƣời sử dụng 2.1.4 Lợi ích ƣu điểm hạn chế sử dụng XML Một số lợi ích sử dụng XML XML tách rời liệu Sử dụng XML, liệu đƣợc chứa tập tin XML riêng biệt XML mơ tả thơng tin đối tƣợng phức tạp mà sở liệu quan hệ khơng thể giải đƣợc XML dùng để chuyển đổi liệu hệ thống khơng tƣơng thích XML dùng để chia sẻ liệu với tập tin tin đơn giản dễ hiểu XML đƣợc dùng để lƣu trữ liệu, làm cho liệu hữu ích Nhƣ vậy, biết đƣợc lợi ích vai trò XML vấn đề lƣu trữ trao đổi thông tin Tuy nhiên hạn chế XML có : + Chuẩn hố: Trong tồn định nghĩa tên thẻ ngành, bạn định nghĩa thẻ khơng phải tiêu chuẩn + Dung lƣợng lớn 2.1.5 Cấu trúc chung Chúng ta sử dụng trình soạn thảo để soạn thảo tài liệu XML, nhƣng phải tuân thủ theo nguyên tắc sau: …… ……… ……… Đồ án tốt nghiệp Phƣơng pháp hợp tin có cấu trúc XML Theo định dạng trên, thấy tài liệu XML đơn giản nhƣng quy định chặt chẽ, tức tài liệu XML xuất phát từ nút gốc (root), phần tử phải có thẻ mở thẻ đóng “ … ” 2.1.6 Những thành phần tài liệu XML Khai báo: Mỗi tài liệu XML có thị khai báo xml version="1.0"?> Định nghĩa tài liệu XML tuân theo chuẩn W3C phiên “1.0” Chú thích: đƣợc khai báo nhƣ sau: Phần tử (Elements): Một tài liệu XML đƣợc cấu thành từ phần tử Một phần tử có thẻ mở thẻ đóng Giữa thẻ mở thẻ đóng nội dung phần tử Phần tử chứa liệu lồng vào phần tử khác Phần tử gốc (root): Trong tài liệu XML, có phần tử gốc phần tử chứa tất phần tử tài liệu XML tạo Thuộc tính (Attributes): Nhƣ trình bày trên, phần tử chứa liệu chứa phần tử khác hai Bên cạnh đó, phần tử rỗng chứa thuộc tính Một thuộc tính lựa chọn để gắn liệu đến phần tử Một thuộc tính đặt thẻ mở phần tử giá trị cách sử dụng cặp name=value” 2.1.7 Lƣợc đồ XML DTD(Document Type Definition)và Schema hai cách khác để quy định luật nội dung tài liệu XML.Tuy nhiên DTD có hạn chế khơng sử dụng định dạng XML thân DTD khơng phải tài liệu XML kiểu liệu có sẵn dùng để định nghĩa nội dung thuộc tính phần tử giới hạn DTD mặt khác DTD khơng có khả mở rộng khơng hỗ trợ namespace Do tài liệu khơng viết theo định dạng XML nên DTD khó viết Đồ án tốt nghiệp Phƣơng pháp hợp tin có cấu trúc XML khó hiểu.Vì việc sử dụng DTD để kiểm tra hợp lệ tài liệu XML không khả thi Chúng ta cần lựa chọn khác khả thi để kiểm tra hợp lệ tài liệu XML Đó sử dụng lƣợc đồ XML-Schema XML Definition(XSD) Một lƣợc đồ đơn giản tập hợp luật đƣợc định nghĩa lại mô tả nội dung liệu tài liệu XML, tƣơng tự nhƣ định nghĩa cấu trúc bảng sở liệu quan hệ Trong lƣợc đồ XML, định nghĩa tài liệu XML, phần tử nó, kiểu liệu phần tử thuộc tính liên quan điều quan trọng mối quan hệ “cha con” phần tử Chúng ta tạo lƣợc đồ nhiều cách khác Cách đơn giản sử dụng Notepad Các kiểu liệu lƣợc đồ XML Có hai loại kiểu liệu lƣợc đồ XML kiểu liệu kiểu liệu mở rộng Kiểu liệu kiểu liệu không bắt nguồn từ kiểu liệu ví dụ nhƣ kiểu liệu float Kiểu liệu mở rộng dựa kiểu liệu khác nhƣ kiểu integer dựa kiểu decimal Kiểu liệu đƣợc định nghĩa cho mục đích lƣợc đồ XML khơng thiết phải giống với số sở liệu khác XPath Qua phần trình bày trên, biết đƣợc cấu trúc cú pháp XML tƣơng đối đơn giản Bƣớc tìm hiểu cách để xử lý tài liệu XML Nhƣ để xử lý tài liệu XML, chƣơng trình ứng dụng phải có cách di chuyển bên tài liệu để lấy giá trị phần tử hay thuộc tính Do ngơn ngữ XML Path đƣợc đời mà gọi tắt XPath XPath đóng vai trị quan trọng việc truy vấn liệu cho chƣơng trình ứng dụng cho phép ta lựa chọn hay sang lọc phần tử muốn để trao đổi hay hiển thị Xpath ngôn ngữ dùng để xử lý truy vấn tài liệu XML, giống nhƣ SQL chuẩn để làm việc với sở liệu Một biểu thức XPath vị trí mẫu để kết hợp Chúng ta áp dụng tốn tử Boolean, hàm string 10 Đồ án tốt nghiệp Phƣơng pháp hợp tin có cấu trúc XML Giá trị số ngƣỡng chép cthresold đƣợc xử dụng ngầm định 128 byte 36 Đồ án tốt nghiệp Phƣơng pháp hợp tin có cấu trúc XML 2.5.7 Thuật toán hợp 3- way theo cấu trúc * Hợp – way theo cấu trúc Chúng ta sử dụng ánh xạ MB1 MB2 đƣợc sinh giai đoạn ánh xạ cây, để sinh hợp nhất.Do không phát sinh kịch chỉnh sửa, không bị hạn chế thao tác kịch chỉnh sửa Hạn chế áp đặt ánh xạ tự nhiên không cho phép thao tác “uncopy” Ý thuật tốn duyệt T1 T2 đồng thời để node partner đƣợc thăm lúc Mỗi bƣớc duyệt xuất node đến TM Node đƣợc xuất hợp node T1 T2 đƣợc thăm Tiến trình hợp gồm giai đoạn: - Giai đoạn tạo danh sách hợp dựa vào TB Giai đoạn thay đổi đặc trƣng so với TB đƣợc đánh dấu thao tác treo node đƣợc thêm khóa node bị di chuyển - Giai đoạn tạo thành cặp hợp Input giai đoạn danh sách hợp mà ta có đƣợc từ giai đoạn T1 T2 Output danh sách cặp node đƣợc thực hợp giai đoạn sau Mọi thay đổi đặc trƣng mà ta xác định giai đoạn đƣợc bảo lƣu giai đoạn - Giai đoạn hợp cặp lấy từ danh sách có đƣợc giai đoạn 2, ta thực hợp cặp danh sách này, kết node hợp Để hỗ trợ việc trình bày thuật tốn giới thiệu khái niệm trỏ (tree cursos) Con trỏ vị trí theo cách tƣơng tự nhƣ trỏ trình xử lí tin thị vị trí tin Con trỏ đƣợc định vị vị trí đặc biệt NULL, trỏ khơng hoạt động Chúng ta kí hiệu trỏ Cn với n tên trỏ kí hiệu tham chiếu đến node mà trỏ trỏ đến node(Cn) Nút NULL đƣợc kí hiệu Quy ƣớc 37 Đồ án tốt nghiệp Phƣơng pháp hợp tin có cấu trúc XML việc trỏ trỏ node m Cn = m Cho C1 C2 CM lần lƣợt trỏ T1 T2, TM Procedure treemerge phát sinh danh sách cặp hợp node node(C1) node(C2) p:= node(CM) for với cặp := {ui,vj} danh sách cặp hợp hợp nội dung ui vj thành node w thêm w nhƣ node p định vị lại CM w định vị lại C1 đến u C2 đến v call treemerge end for End Procedure Thuật toán hợp Các node partner đƣợc thành cặp để hợp thuật toán đƣợc tham chiếu nhƣ cặp hợp Các cặp hợp đƣợc kí hiệu {n, m}, với n m node cặp Các cặp hợp chứa node, trƣờng hợp ta kí hiệu {n, } Danh sách cặp hợp danh sách cặp hợp đƣợc phát sinh cách tổ hợp danh sách node đƣợc trỏ tới C1 C2 Ví dụ hợp đơn giản 38 Đồ án tốt nghiệp Phƣơng pháp hợp tin có cấu trúc XML Chúng ta giả sử T1 T2,TB hình trên,chúng đƣợc ánh xạ theo hình vẽ, tất trỏ đƣợc định vị gốc Phát sinh danh sách cặp hợp Trong bƣớc cặp node (C1) node (C2) theo ánh xạ đó, sau xác định dãy cặp này, theo di chuyển đƣợc hình thành Các node bị xóa đƣợc loại bỏ khỏi danh sách Trong trƣờng hợp cặp danh sách b a c i d ( T1(R)) a b‟ c ( T2(R)) Danh sách cặp kết là: b a c i b‟ a c • Dòng chứa node từ T1 dòng dƣới chứa node từ T2 Chú ý thứ tự cặp tuân theo di chuyển đƣợc tạo thành T TB, d bị xóa T2 nên khơng xuất node i đƣợc chèn vào khơng có cặp Việc hợp nội dung Bây xác định việc hợp nội dung cặp {ui,vi}phải thực nhƣ Nói chung, ln lấy nội dung mà thể thay đổi TB Trong trƣờng hợp việc hợp nội dung b‟ a c i Thêm w Chúng ta hợp thành công node ui vj thành node w Node hợp đƣợc thêm vào hợp vị trí trỏ đƣợc cập nhật để nối node đến node cách thêm b‟ a c i hợp là: TM = (R; b‟ a c i) Định vị lại C1 C2 Các trỏ T1 T2 đƣợc cập nhật để trỏ đến node cặp hợp mà nội dung hợp chúng đƣợc thêm vào TM Thông thƣờng trỏ đƣợc trỏ trực tiếp đến ui vj partner cấu trúc Con trỏ cập nhật cặp hợp trƣờng hợp là: 39 Đồ án tốt nghiệp Phƣơng pháp hợp tin có cấu trúc XML {b,b‟} => C1 = T1(b) ^C2 = T2(b‟) {a ,a} => C1 = T1(a) ^ C2 = T2( a) {c ,c } => C1 = T1(c) ^ C2 = T2( c) {i , •} => C1 = T1(i) ^ C2 = Gọi thực treemerge Đây bƣớc đệ quy thuật toán Chú ý thêm node hợp node node đƣợc trỏ đến giá trị nguyên thủy C1 C2 đén TM Các trỏ C1, C2 đƣợc reset để trỏ đến tập partner Cm đƣợc cập nhật đến vị trí “chèn ” TM 40 Đồ án tốt nghiệp Phƣơng pháp hợp tin có cấu trúc XML 2.5.8 Kiểm tra node bị xoá di chuyển xa: Cho danh sách hợp đƣợc phát sinh từ node u v M M2 Node sở chung u v node b Chúng ta bắt đầu tổ hợp danh sách hợp cách kiểm tra node xuất b nhƣng M1 M2 ,tức node mà bị xóa di chuyển xa khỏi b hai nhánh Nói tóm lại, node bi b không xuất nhƣ node entry M1 mà node có entry ánh xạ đƣợc M2 có entry bị loại bỏ khỏi M2 ngƣợc lại Tuy nhiên, đơn giản loại bỏ entry từ hai danh sách hợp mà không cân nhắc Chúng ta cần kiểm tra khơng có chỉnh xửa node bị xóa có gốc entry bị xóa, trƣờng hợp chỉnh xửa đƣợc bỏ qua Thêm nữa, entry khơng bị xóa đƣợc cập nhật, di chuyển chép chép thứ cấp tồn vi phạm yêu cầu 1, 4, Nếu entry với node bị treo đƣợc loại bỏ, node bị treo phải đƣợc di chuyển đến entry trƣớc Việc delete TD node bị xóa n chứa n tất hậu duệ bị xóa n, mà khơng có node khơng bị xóa Chúng ta định nghĩa delete n Tn mà từ Tn1…Tnk bị loại bỏ, với node ni Tn đƣợc ánh xạ đầy đủ với node sở có partner, tức node mà đƣợc đảm bảo đƣợc viếng giai đoạn khác thuật toán 41 Đồ án tốt nghiệp Phƣơng pháp hợp tin có cấu trúc XML Bây TD tập node không xuất hợp nhất, việc loại bỏ node n khỏi danh sách hợp Chúng ta cần kiểm tra khơng có node node thể thao tác chỉnh xửa node thể thao tác chỉnh xửa, bỏ qua đƣa cảnh báo việc cập nhật có khả Việc kiểm tra node chỉnh xửa đƣợc thực theo định nghĩa thao tác chỉnh xửa hợp 42 Đồ án tốt nghiệp Phƣơng pháp hợp tin có cấu trúc XML Ví dụ kết việc thực thủ tục removeDeletedOrMoved danh sách nhƣ sau: Với M1D MD2 danh sách hợp M1 M2 sau thủ tục removeDeleteOrMoved đƣợc thực Nhƣ ta thấy node d bị loại bỏ khỏi M1, bị xóa T2 node a bị loại bỏ khỏi M2,do di chuyển xa T1 Chú ý kết có node entry hai danh sách : b ,c,e,h,f,và g 2.5.9 Tổ hợp danh sách hợp thành danh sách hợp Trong bƣớc phát sinh danh sách hợp cuối cùng, tổ hợp danh sách hợp M1D M1D thành danh sách cặp hợp tuân theo việc thành dãy node bị treo entry bị khóa Bây thấy lợi ích node bị treo giai đoạn xóa trƣớc: entry M1D M2D có tƣơng ứng 1-1 tức node entry M1D partner node entry M2D ngƣợc lại Sự tƣơng ứng 1-1 làm đơn giản hóa đáng kể việc hợp danh sách Chúng ta xử dụng việc duyệt đồng thời danh sách hợp nhất, tƣơng ứng việc duyệt node đồng thời đƣợc mô tả Cho p1 p2 vị trí M1D M2D, hai đƣợc khởi đầu vị trí danh sách Chúng ta xuất node p1 p2 trỏ đến node bị treo nhƣ cặp hợp Vị trí p1 p2 lúc đƣợc cập nhật để ln theo sau khóa phải tồn Điều đƣợc lập lại đạt đến cuối danh sách hợp 43 Đồ án tốt nghiệp Phƣơng pháp hợp tin có cấu trúc XML Trong ví dụ thực thủ tục makeMergePairList danh sách hợp M1D M2D đƣợc phát sinh giai đoạn trƣớc Kết danh sách cặp hợp là: Với node hàng từ T1 node hàng dƣới từ T2( vấn đề định dạng danh sách,thuật toán thêm cặp {n,m} cho n T2 n T2 m T1 m T1 Chúng ta ý thứ tự cặp danh sách hợp thỏa khóa M1D M2D,cũng nhƣ treo node khơng khóa thứ tự nguyên thủy Thêm nữa, node i đƣợc chèn T1 khơng có cặp hợp hai chép node b T1 đƣợc với phiên cập node T2 Mặc dù rõ ràng thứ tự cặp tuân theo thứ tự ngầm định entry bị khóa danh sách hợp nhất, số thuộc tính, chẳng hạn tính dừng vịng lặp khơng rõ ràng 44 Đồ án tốt nghiệp Phƣơng pháp hợp tin có cấu trúc XML CHƢƠNG 3: ĐÁNH GIÁ THỰC NGHIỆM VÀ KẾT LUẬN 3.1 Giới thiệu phần mềm Tree Way Merge Merge tập tin hình ảnh, kết hợp ứng dụng thƣ mục đồng hóa từ Araxis Xử dụng để so sánh hợp mã nguồn, trang web, XML tập tin dạng tin với ứng dụng hiệu Trực tiếp mở so sánh tin từ Microsoft Ofice, OpenDocument, PDF tập tin RTF Hierarchies làm việc với thƣ mục chứa hàng ngàn tập tin Merge tích hợp nhiều SCM hệ thống khác Ƣu điểm: - Đối với chuyên gia pháp lí xuất bản: Xác định tất thay đổi khác hợp đồng thảo Trực tiếp mở so sánh tin từ Microsoft Office, OpenDocument, PDF… Sao chép tin từ ứng dụng khác dán trực tiếp vào cửa sổ so sánh tin - Đối với kỹ sƣ phần mềm nhà phát triển web: So sánh hiểu kết hợp tập tin mã nguồn phiên khác Làm việc cách nhanh chóng xác, cho dù bạn so sánh tập tin cá nhân chi nhánh reconciling toàn mã nguồn - Những ngƣời dùng khác: Cần phải giữ nhiều thƣ mục đồng Hợp giúp tiết kiệm giảm lỗi cách giúp bạn làm việc cách nhanh chóng xác Merge cho phép bạn so sánh làm việc với phiên khác tập tin tin, chẳng hạn nhƣ chƣơng trình mã nguồn, html, xml tập tin Merge trích xuất so sánh tin từ Microsoft Office, OpenDocument, PDF tập tin rtf Tệp tin XML đƣợc hiển thị với định dạng đặc biệt, giúp bạn xem thay đổi cách rõ ràng Nó hỗ trợ tệp tin với mã ascii, mbcs (Mixed Byte Character Set) ký tự Unicode Encodings Liên kết dòng đƣợc trích tài liệu đƣợc hiển thị rõ ràng nhƣ có liên quan 45 Đồ án tốt nghiệp Phƣơng pháp hợp tin có cấu trúc XML Merge cho thấy chi tiết bật thay đổi dịng Nó đƣợc cấu hình để bỏ qua khác biệt dịng hậu tố, nhƣ thay đổi dòng phù hợp với quy định Nhƣợc điểm: Trong trình hợp tin có cấu trúc cịn số nhƣợc điểm chƣa khắc phục đƣợc chƣa thân thiện với ngƣời dùng, địi hỏi cần phải có chƣơng trình dễ để hợp tin Tiếng Việt 3.2 Mơ hình thử nghiệm đánh giá Cấu trúc tài liệu XML 46 Đồ án tốt nghiệp Phƣơng pháp hợp tin có cấu trúc XML Mơ hình phần mềm Tree Way Merge Demostration Một số mơ hình ví dụ hợp 3-way 47 Đồ án tốt nghiệp Phƣơng pháp hợp tin có cấu trúc XML Ví dụ hợp 2-way Tập liệu để đánh giá: STT Loại tài liệu Số lƣợng Nội dung Quyết định 20 Thông báo định trƣờng ĐHDLHP Bản kiểm điểm 30 Công tác nâng lƣơng Biên 30 Quản lý môn Kết đánh giá: Các kết qủa thử nghiệm tập tin XML thực tế cho thấy chƣơng trình chạy xác Đặc biệt trƣờng hợp có liên quan đến ngữ nghĩa Tag Name nhƣ đụng độ Text Node đƣợc giải theo hƣớng thân thiện ngƣời dùng tỏ có ý nghĩa thực - Chƣơng trình giúp tiết kiệm thời gian giảm lỗi làm việc cách nhanh chóng xác - Dễ dàng xử dụng ngƣời - Thích hợp mở với loại file 48 Đồ án tốt nghiệp Phƣơng pháp hợp tin có cấu trúc XML Kết luận Hợp thơng tin có cấu trúc tốn cần thiết, đặc biệt môi trƣờng cộng tác nhiều ngƣời chia sẻ số thông tin môi trƣờng ngƣời dùng chia sẻ thông tin nhiều thiết bị Nếu hệ thống hệ thống mạng mạnh, tốn đồng hóa đƣợc giải tốt, mục đích đề tài nghiên cứu phát triển công cụ hợp để đồng hóa mơi trƣờng mạng yếu với tập tin có cấu trúc, đƣợc hỗ trợ tối thiểu hệ thống Các điểm luận văn bao gồm: Về phƣơng pháp tiếp cận: Điểm khác biệt đồ án so với tiếp cận chọn lựa cách hợp 3-way nhƣng mã hóa tập khác biệt dƣới dạng kịch chỉnh xửa để đồng hóa liệu có dạng XML Cách tiếp cận cho phép hợp tin có cấu trúc khác sinh tập khác biệt có kích thƣớc cực tiểu Về kĩ thuật ánh xạ: Tận dụng tính gợi ý thẻ XML để tăng tính xác thuật tốn ánh xạ Về xử lí đụng độ: Đụng độ Tag Name đƣợc tinh tế hóa thơng qua chọn lựa tự động-Đụng độ Text Node đƣợc xử lí linh động thơng qua thuật tốn LCS, cho phép ngƣời dùng nhận biết thay đổi Text Node Hiện thực cơng cụ xử lí q trình hợp đồng hóa có tính ứng dụng cao, ngồi cịn chứng minh khả hỗ trợ đa ngơn ngữ, cho phép mở rộng ứng dụng hệ thống không tin XML mà liệu có cấu trúc cơng cụ Tuy nhiên nhiều vấn đề chƣa đƣợc đề cập giải vấn đề hợp thông tin, chẳng hạn việc xem xét DTD tập tin XML xử lí tự động việc hợp khơng cấu trúc XML mà hợp nội dung Text Node Tuy nhiên nỗ lực đồ án cho thấy xây dựng phần mềm thƣơng mại dựa vấn đề đƣợc phát triển đồ án 49 Đồ án tốt nghiệp Phƣơng pháp hợp tin có cấu trúc XML Đề hƣớng phát triển tƣơng lai Đồ án giải việc hợp để đồng hoá tin có cấu trúc dạng XML thử nghiệm cho thấy cơng cụ có khả đồng hố cách hiệu môi trƣờng mạng yếu Tuy nhiên ý tƣởng cải tiến bƣớc đầu phải hồn thiện nhiều trở thành sản phẩm thƣơng mại Các vấn đề cần đƣợc giải để hồn thiện cơng cụ bao gồm: ->Nghiên cứu cải tiến thuật toán hợp 3-way, trƣờng hợp đụng độ cấu trúc -> Nghiên cứu ứng dụng thuật toán tạo khác bịêt để có tập khác biệt nhỏ tốt -> Thể kịch chỉnh xửa nhƣ tin XML dƣới dạng thân thiện ngƣời dùng -> Xử lí DTD: hai tập tin có cấu trúc giồng nhƣng DTD khác cần phải đƣợc nhận biết Tài liệu tham khảo [1] Asklund U – Identifying Conflicts During Structural Merge – Proceeding of the Nordic Workshop on Programming Environment Research „ 94 Lund Universit y, 1994 [2] Cederqvist P Et al – Version Management with CVS – Signum Support AB, Linkoping, Swenden, 1993 http://www.loria.fr/~molli/cvs/doc/cvs.pdf [3] Eric Amstrong - Working with XML – http://java.sun.com/xml/jaxp- 1.1/docs/tutorial/index.html [4] IBM Alphaworks – XML diff and merge tôl home page http:// www.alphaworks.ibm.com/tech/xmldiffmerge [5] http:// www.W3c.org – World wide web consortium (W3C) 50 ... dụng 1.3 Cách tiếp cận Bản tin có cấu trúc XML có cấu trúc có cấu trúc tƣơng tự nhau, nghĩa từ khóa nội dung Để giải tốn hợp ta có hai phƣơng án hợp 3-way hợp – way Nhƣng toán hợp – way đƣợc nghiên... cho chế tự động hợp vấn đề đƣợc đặt trƣớc tiên Em chọn đề tài làm đồ án tốt nghiệp là: ? ?Phương pháp hợp tin có cấu trúc XML? ?? Với mục đích nghiên cứu phƣơng pháp hợp tin có cấu trúc cách nhanh Đồ... truyền thông tin dƣới dạng tin có cấu trúc, chẳng hạn tin XML Bản tin có cấu trúc khái niệm tổng quát ẩn chứa cách tiếp cận khác nhằm quản lí thơng tin Về mặt cú pháp thành phần tin bao gồm cụm