Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 73 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
73
Dung lượng
1,8 MB
Nội dung
LỜI CẢM ƠN Lời đầu tiên, em xin chân thành cảm ơn Trường Đại học công nghệ thông tin truyền thông, Đại học Thái Nguyên tạo điều kiện thuận lợi cho phép em thực hiện đề tài Đặc biệt em xin chân thành cảm ơn tới ThS.Hà Thị Thanh tận tình định hướng dẫn nhiệt tình thời gian vừa qua Em xin chân thành cảm ơn thầy cô môn tận tình giảng dạy, hướng dẫn cho chúng em kiến thức cần thiết năm học tập trường Mặc dù em cố gắng với kiến thức hạn chế, trình làm đề tài không tránh khỏi thiếu sót Em hy vọng nhận ý kiến nhận xét, góp ý thầy cô giáo bạn bè để em thực đề tài hoàn thiện Em xin chân thành cảm ơn! LỜI CAM ĐOAN Em xin cam đoan toàn đề tài: “Chuyển đổi liệu từ XML sang sở liệu quan hệ”, thân tìm hiểu, nghiên cứu Không có chép nội dung từ đồ án khác Tất nội dung hình ảnh minh họa có nguồn gốc xuất xứ rõ ràng từ tài liệu tham khảo nhiều nguồn khác mà xây dựng lên Ngoài có góp ý định hướng cô giáo Ths.Hà Thị Thanh Em xin cam đoan lời đúng, thông tin sai lệch em xin hoàn toàn chịu trách nhiệm trước hội đồng Thái Nguyên, tháng năm 2012 Sinh viên Luyện Huy Ánh MỤC LỤC DANH MỤC HÌNH ẢNH DANH MỤC CÁC BẢNG DANH MỤC CÁC THUẬT NGỮ VIẾT TẮT Tên viết tắt Ý nghĩa API Application Programming Interface CNTT Công nghệ thông tin CSDL Cơ sở liệu DBMS Hệ quản trị sở liệu_Database Management System RDBMS Hệ quản trị sở liệu quan hệ_Relational Database Manegement System DOM Document Object Model DTD Document Type Definition HTML HyperText Markup Language XML eXtensible Markup Language SQL Structured Query Language W3C World Wide Web Consortium UC Use Case SGML Standard Generalized Markup Language MỞ ĐẦU Ngày nay, Internet phát triển mạnh mẽ làm cho HTML (HyperText Markup Language - ngôn ngữ đánh dấu siêu văn bản) ngôn ngữ lý tưởng để hiển thị trang Web nhiều người biết đến Tuy vậy, HTML phát triển xa giới ảo, đánh giá tồi mô tả nội dung trang web dạng liệu để thao tác dễ dàng thời điểm hoàn cảnh Điều làm cho người ta suy nghĩ đến XML Vậy XML gì? XML ngôn ngữ lập trình tương đối mới, ngày trở nên phổ dụng nhiều ứng dụng đa dạng XML xuất cung cấp cho cách thức mô tả liệu có cấu trúc mà thân tên gọi nêu rõ eXtensible Markup Language (ngôn ngữ tăng cường) Do đó, đâu có liệu nhập/xuất, lưu trữ truyền từ nơi đến nơi khác trở thành mảnh đất đầy tiềm thích hợp với khả XML Có lẽ tiếng ứng dụng có liên quan đến web Nhưng có nhiều ứng dụng khác không thuộc web thích hợp với XML Ví dụ: Để thay cho liệu truyền thống để chuyển giao thông tin tài doanh nghiệp,…Có thể nói, XML ngôn ngữ chung thống cho toàn liệu web, giúp cho nhà phát triển sức mạnh để đem lại thông tin liệu có cấu trúc cần thiết từ chương trình tới tận hình người sử dụng Mặc dù XML hiệu trình trao đổi, truy suất Internet, có tính tuyệt vời sở liệu quan hệ như: lưu trữ hiệu với dung lượng cực lớn, chép dự phòng, phục hồi liệu, tối ưu hệ thống, Ngoài ra, số lượng ngày tăng tài liệu XML đòi hỏi cần thiết để lưu trữ truy vấn tài liệu XML cách hiệu Vì vậy, phạm vi đề tài này, em trình bày “quá trình chuyển đổi liệu XML sang liệu quan hệ”.Em chọn sở liệu Microsoft SQL Server 2005 để lưu trữ liệu trình thực chuyển đổi Trước vào nội dung đề tài, tìm hiểu số khái niệm XML XML DOM sở liệu quan hệ đặc điểm bật sở liệu quan hệ Lý chọn đề tài Ngôn ngữ XML (eXtensible Markup Language) phát triển thời gian gần phổ biến rộng rãi Không giới hạn định nghĩa sẵn HTML, XML cho phép người dùng tự định nghĩa thành phần riêng mở rộng tùy ý XML trở nên phổ biến có nhiều nguyên nhân Điểm quan trọng XML cho phép dễ dàng xử lý, chuyển tải trao đổi liệu nhiều ứng dụng tài liệu người dùng với định dạng khác Mặc dù XML hiệu trình trao đổi, truy xuất internet có tính tuyệt vời CSDL quan hệ lưu trữ hiệu với dung lượng cực lớn, chép dự phòng, phục hồi liệu, tối ưu hệ thống, nhu cầu chuyển đổi liệu từ XML sang CSDL quan hệ cần thiết lượng tài liệu XML ngày tăng , đồng thời gợi ý giáo viên hướng dẫn, em chọn đề tài “Chuyển đổi liệu từ XML sang sở liệu quan hệ ” làm đồ án tốt nghiệp Mục tiêu đề tài Đề tài tập chung nghiên cứu kiến thức tổng quan XML, số ứng dụng XML, nghiên cứu thuật toán chuyển đổi liệu từ XML sang CSDL quan hệ Nội dung đề tài bao gồm phần sau Chương 1: Giới thiệu tổng quan XML Chương 2: XML sở liệu quan hệ Chương 3: Phân tích thiết kế cài đặt chương trình CHƯƠNG 1: TỔNG QUAN VỀ XML 1.1 Tổng Quan Về XML 1.1.1 Lịch sử phát triển XML XML triển khai nhờ đóng góp nhiều người 10 năm qua Cách 10 năm SGML đời (Standard Generalised Markup Language), ngôn ngữ quốc tế vô phức tạp, dùng để mô tả tài liệu phức tạp có cấu trúc tinh vi SGML ngôn ngữ khó học công cụ để phát triển cũngkhá đắt tiền Năm 1990, Tim Berners-Lee CERN phát minh HTML, phần nhỏ SGML, dễ sử dụng hơn, viết tay mà không cần phải có chương trình giúp đỡ Sự thành công HTML vượt sức tưởng tượng tác giả, vào đầu năm 1995, nhà phát triển bắt đầu nhận giới hạn HTML, Microsoft, Netscape cố gắng thêm thắt nhiều thứ vào HTML không ngăn việc lộ rõ giới hạn HTML Hình 1.a: Tim Berners-Lee Cha đẻ WWW phát minh HTML năm 1990 Mùa hè năm 1996, Jon Bosak Sun Microsystem khởi đầu nhóm cộng tác W3C SGML, gọi nhóm XML Mục đích nhóm đơn giản hoá SGML để dễ sử dụng HTML, đồng thời lại mạnh mẽ linh động Tim Bray C.M Sperberg-McQueen viết hầu hết Specification (bản điều kiện kỹ thuật) nguyên thủy XML Trước Bray có kinh nghiệm nhiều năm quản 10 Hình 3.5 Biểu đồ cộng tác UC thao tác nhanh UC Tạo - Mục đích: Thao tác bước Bước 1: Tạo dtd - Tác nhân: Người dùng - Tiền điều kiện : Đã có liệu file DTD - Luồng kiện: Hành động người dùng Phản ứng hệ thống Chọn chức tạo Cây Thao tác thuật toán tạo Cập nhật liệu Hiển thị thông báo tạo thành công - Luồng phụ A1: - Hậu điều kiện : 59 Hình 3.6 Biểu đồ trình tự UC tạo Hình 3.7 Biểu đồ cộng tác UC tạo UC Inlining - Mục đích: Thao tác bước Bước 2: Inlining tạo rút gọn - Tác nhân: Người dùng - Tiền điều kiện thực tạo - Luồng kiện: 60 Hành động người dùng Phản ứng hệ thống Chọn chức Inlining Thao tác thuật toán Inlining Cập nhật liệu Hiển thị thông báo Inlining thành công - Luồng phụ A1: - Hậu điều kiện : Hình 3.8.Biểu đồ trình tự UC Inlining 61 Hình 3.9 Biểu đồ cộng tác UC Inlining UC Sinh lược đồ quan hệ - Mục đích: Thao tác bước Bước 3: Sinh lược đồ quan hệ - Tác nhân: Người dùng - Tiền điều kiện thực Inlining - Luồng kiện: Hành động người dùng Phản ứng hệ thống Chọn chức sinh lược đồ quan hệ Thao tác thuật toán sinh lược đồ quan hệ Tạo sở liệu Hiển thị bảng quan hệ - Luồng phụ A1: - Hậu điều kiện : 62 Hình 3.10 Biểu đồ trình tự UC Sinh lược đồ quan hệ Hình 3.11 Biểu đồ cộng tác UC Sinh lược đồ quan hệ 63 UC Thêm liệu - Mục đích: Thêm liệu từ file XML vào bảng liệu quan hệ - Tác nhân: Người dùng - Tiền điều kiện: sinh lược đồ quan hệ có liệu từ file XML - Luồng kiện: Hành động người dùng Phản ứng hệ thống Chọn chức thêm liệu Thao tác thêm liệu Cập nhật CSDL Hỏi người dùng có muốn hiển thị liệu không Nếu đồng ý: Chuyển luồng A1 Trả lời - Luồng phụ A1: Hiển thị bảng liệu - Hậu điều kiện : Không có Hình 3.12 Biểu đồ trình tự UC thêm liệu 64 Hình 3.13 Biểu đồ cộng tác UC thêm liệu UC hiển thị liệu - Mục đích: hiển thị liệu chuyển đổi thành công - Tác nhân: Người dùng - Tiền điều kiện: chuyển đổi liệu thành công từ XML - Luồng kiện: Hành động người dùng Phản ứng hệ thống Chọn chức hiển thị liệu Truy xuất CSDL Hiển thị bảng liệu - Luồng phụ A1: - Hậu điều kiện : 65 Hình 3.14 Biểu đồ trình tự UC hiển thị liệu Hình 3.15 Biểu đồ cộng tác UC hiển thị liệu 66 3.2 Chương trình Dưới số giao diện chương trình Khi chạy chương trình có một form lên để kết nối tới CSDL Hình 3.16 Giao diện kết nối sở liệu Sau Giao diện chương trình ra.Dưới giao diện sau mở hai file *.dtd *.xml Hình 3.17 Giao diện chương trình Thực thuật toán NewInlining ta kết đầu bảng quan hệ Hình hiển thị bảng univ 67 Hình 3.18 Giao diện thực thuật toán NewIniling Tiếp theo ta thực thuật toán Xinsert Tiến hành thêm liệu từ XML vào bảng quan hệ sinh từ thuật toán NewIniling.Hình hiển thị bảng dep làm ví dụ Hình 3.19 Giao diện sau thực thuật toán XInsert 68 KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN Quá trình chuyển đổi liệu XML sang liệu quan hệ đề cập đề tài đáp ứng phần lớn yêu cầu trình chuyển đổi mặt liệu Nó không làm giảm chất lượng lưu trữ liệu XML thành hệ thống sở liệu quan hệ dựa phương pháp tiếp cận nội tuyến Quá trình chuyển đổi bao gồm giai đoạn chuyển đổi lược đồ giai đoạn chuyển đổi liệu thông qua việc xác định hai thuật toán New Inlining Xinsert Hai thuật toán số thuật toán hỗ trợ trình chuyển đổi liệu XML sở liệu quan hệ ví dụ phương pháp băm nhỏ (shred) tài liệu XML kết hợp với phương pháp XMLTable,… Mục đích luận văn giới hạn trình chuyển đổi liệu XML sang liệu quan hệ phương pháp tham khảo, tìm hiểu Để nắm vấn đề trình chuyển đổi, em bắt đầu tìm hiểu khái niệm XML, cấu trúc XML lợi ích Bên cạnh đó, em tìm hiểu thêm DOM cách thức làm việc DOM tài liệu XML Ngoài em tổng hợp lại kiến thức học sở liệu quan hệ: thiết kế sở liệu hợp lý nào?, khoá lược đồ quan hệ chuẩn chúng Cuối em trình bày việc chuyển đổi liệu XML sang liệu quan hệ Trong tương lai, cần phải nâng cao thuật toán chuyển đổi liệu XML sang liệu quan hệ thông qua đánh giá hiệu suất thuật toán Để mở rộng quy mô, thực việc chuyển đổi liệu với cách tiếp cận dựa mô hình SAX, từ so sánh kết đạt với hiệu suất Cuối cùng, toàn vẹn ngữ nghĩa trình chuyển đổi liệu cần nghiên cứu kỹ công việc tương lai Mở rộng kiểu liệu lược đồ XML kiểu liệu String cần xem xét cân nhắc dùng tương lai 69 TÀI LIỆU THAM KHẢO [1].Hồ Thuần, Hồ Cẩm Hà (2004), Các sở lý thuyết thực hành (tập 1), NXB Giáo Dục [2].Lê Tiến Vương (2000), Nhập môn sở liệu quan hệ, NXB Thống Kê [3].Nguyễn Phương Lan (2001), XML tảng ứng dụng, NXB Giáo Dục [4].Nguyễn tiến, Đặng Xuân Hường, Nguyễn Văn Hoài, Nguyễn Tuấn Ngọc (2001), Nhập môn XML thực hành ứng dụng, NXB Thống Kê [5].Mustafa Atay, Yezhou Sun, Dapeng Liu, Shiyong Lu, Farshad Fotouhi, “Mapping XML Data to Relational Data: A DOM-BASED APPROACH”, Department of Computer Science Wayne State Unversity, Detroit, MI 48202 [6].ShiYoung Lu, Yezhou Sun, Mustafa Atay, Farshad Fotouhi:”A New Inlining Algorithm for Mapping XML DTDs to Relational Schemas” Department Of Computer Science Wayne State University, Detroit, MI 48202 [7].John Wiley & Sons Ltd, Object-OrientedAnalysis and DesignUnderstanding System Developmentwith UML 2.0, The Atrium, Southern Gate, Chichester,West Sussex PO19 8SQ, England [8].PGS.TS.Đặng Văn Đức, Phân tích thiết kế hướng đối tượng, NXB Thống kê [9].Terr Quatrani, Visual Modeling with Rational Rose 2002 and UML, Publisher: Addison Wesley, pub date: October 09,2002 70 NHẬN XÉT CỦA GIÁO VIÊN HƯỚNG DẪN 71 NHẬN XÉT CỦA GIÁO VIÊN PHẢN BIỆN 72 73 ... ưu hệ thống, nhu cầu chuyển đổi liệu từ XML sang CSDL quan hệ cần thiết lượng tài liệu XML ngày tăng , đồng thời gợi ý giáo viên hướng dẫn, em chọn đề tài Chuyển đổi liệu từ XML sang sở liệu quan. .. trình nhập liệu thông tin sinh viên 26 Hình 1.2.2.Kết chương trình nhập liệu thông tin sinh viên 27 CHƯƠNG 2 .XML VÀ CƠ SỞ DỮ LIỆU QUAN HỆ 2.1 Cơ sở liệu quan hệ 2.1.1 Sơ lược sở liệu Cơ sở liệu ?... tài liệu XML cách hiệu Vì vậy, phạm vi đề tài này, em trình bày “quá trình chuyển đổi liệu XML sang liệu quan hệ .Em chọn sở liệu Microsoft SQL Server 2005 để lưu trữ liệu trình thực chuyển đổi