Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 73 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
73
Dung lượng
1,06 MB
Nội dung
ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ TRẦN THỊ XUÂN TÍCH HỢP CÁC HỆ THỐNG CƠ SỞ DỮ LIỆU QUAN HỆ VÀ XML Ngành: CÔNG NGHỆ THÔNG TIN Mã số: 1.01.10 LUẬN VĂN THẠC SĨ Người hướng dẫn khoa học: PGS.TS ĐOÀN VĂN BAN HÀ NỘI, 2007 MỤC LỤC MỞ ĐẦU Chương 1: TỔNG QUAN VỀ XML VÀ CƠ SỞ DỮ LIỆU QUAN HỆ 1.1 Tổng quan XML 1.1.1 Giới thiệu công nghệ XML 1.1.2 Cấu trúc tài liệu XML 1.1.2.1 Tài liệu XML 1.1.2.2 Cấu trúc tài liệu XML 1.1.3 Các thành phần tài liệu XML 1.1.4 Cấu trúc tài liệu hợp khuôn dạng 10 1.1.5 Định nghĩa kiểu tư liệu DTD 11 1.1.6 Lược đồ XML 13 1.1.7 Bảng định kiểu CSS 18 1.1.8 Mô hình DOM 20 1.1.9 Phân tích tài liệu XML theo mô hình DOM 22 1.1.10 XPATH 25 1.1.11 XLINK XPOINTER 27 1.1.11.1 XLINK 27 1.1.11.2 XPOINTER 28 1.2 Cơ sở liệu quan hệ 29 1.2.1 Cấu trúc sở liệu quan hệ 29 1.2.2 Ràng buộc toàn vẹn CSDL quan hệ 31 1.2.2.1 Định nghĩa 31 1.2.2.2 Các yếu tố ràng buộc toàn vẹn 32 1.2.3 Chuẩn hoá CSDL quan hệ 33 1.3 Kết luận 34 Chương 2: TÍCH HỢP CÁC HỆ THỐNG CSDL QUAN HỆ VÀ XML 35 2.1 Phương pháp luận 36 2.1.1 Đối sánh nội dung CSDL quan hệ tài liệu XML 36 2.1.2 Cấu trúc kiểu chế tài liệu XML lược đồ CSDL quan hệ 38 2.1.3 Tên 41 2.1.4 Các giá trị rỗng giá trị mặc định 41 2.1.5 Quan hệ 43 2.1.6 Thứ tự 44 2.2 Chuyển tài liệu XML sang CSDL quan hệ 46 2.3 Chuyển CSDL quan hệ sang tài liệu XML 48 2.3.1 Phi chuẩn lược đồ quan hệ 48 2.3.2 Kết nối CSDL phi chuẩn 52 2.3.3 Ánh xạ CSDL quan hệ kết nối thành DOM để chuyển thành tài liệu XML 54 2.4 Kết luận 57 Chương 3: CÀI ĐẶT THUẬT TOÁN TÍCH HỢP CÁC HỆ THỐNG CSDL QUAN HỆ VÀ XML 58 3.1 Thuật toán 58 3.1.1 Đọc tài liệu XML dạng sơ đồ hình 58 3.1.2 Hiển thị tài liệu XML dạng bảng 59 3.1.3 Chuyển CSDL quan hệ sang tài liệu XML 60 3.2 Cài đặt thuật toán 61 3.3 Kết - đánh giá 68 KẾT LUẬN 69 TÀI LIỆU THAM KHẢO 70 MỞ ĐẦU Ngày với việc bùng nổ thông tin, thông tin Internet ngày nhiều (số lượng trang Web Internet khoảng gần tỷ), mà biết Cơ sở liệu quan hệ ngày chiếm nhiều ưu việc lưu trữ nội dung web site Cùng lúc đó, ngôn ngữ định dạng mở rộng (Extensible Markup Language –XML) nhanh chóng chiếm ưu web site sử dụng văn siêu liên kết Vì vậy, tích hợp hệ thống Cơ sở liệu quan hệ XML chủ đề luận văn với mục đích mong muốn tất liệu với chương trình tương lai tích hợp hiểu thông qua XML Trong giai đoạn đầu, hầu hết trang Web viết ngôn ngữ định dạng liệu thông qua cặp thẻ đặc biệt tệp tin văn HTML Do tính đơn giản, dễ hiểu dễ sử dụng HTML mà trở thành ngôn ngữ ưa chuộng để xây dựng trang Web thời gian Tuy vậy, với lượng thông tin khổng lồ không ngừng tăng Web, với thị hiếu nhu cầu sử dụng người dùng ngày cao HTML không đủ để đáp ứng yêu cầu – tạo trang Web chuẩn Chính mà ngôn ngữ XML đời, với tính trội mình, XML giúp cho việc quản lý, trình bày tổ chức thông tin Web thông qua hệ sở liệu dễ dàng đặc biệt đáp ứng mong mỏi từ phía người dùng Trên thực tế, công nghệ XML người sử dụng ưa thích tích hợp dễ dàng với sở liệu quan hệ – Chúng ta phát triển tài liệu XML sử dụng Cơ sở liệu quan hệ tồn mà trích rút liệu từ tài liệu XML Để giải vấn đề này, cần tìm hiểu rõ XML mô hình DOM phương pháp sử dụng mô hình DOM để chuyển Cơ sở liệu quan hệ sang tài liệu XML ngược lại Và nội dung đưa luận văn thông qua nghiên cứu số báo, báo cáo chuyên ngành hội nghị quốc tế phổ biến mạng với giáo trình XML giáo trình liên quan khác Luận văn trình bày gồm ba chương: Chương 1: “Tổng quan XML Cơ sở liệu quan hệ”- Trình bày tổng quan cấu trúc tài liệu XML, định nghĩa kiểu tư liệu DTD, lược đồ, mô hình đối tượng tài liệu DOM, phân tích tài liệu XML theo mô hình DOM khái niệm sở sở liệu (CSDL) quan hệ Chương 2: “Tích hợp hệ thống sở liệu XML” - Giới thiệu phương pháp luận chuyển tài liệu XML sang CSDL quan hệ ngược lại Chương 3: “Thuật toán tích hợp hệ thống sở liệu quan hệ XML” – Đưa thuật toán tích hợp hệ thống CSDL quan hệ XML cài đặt thuật toán ngôn ngữ lập trình Java phần Kết luận Hà Nội, tháng 05 năm 2007 Chương TỔNG QUAN VỀ XML VÀ CƠ SỞ DỮ LIỆU QUAN HỆ 1.1 Tổng quan XML 1.1.1 Giới thiệu công nghệ XML Ngôn ngữ định dạng (markup language) tất dùng để mô tả nội dung tài liệu – Đó cách nội dung tài liệu diễn dịch Ngôn ngữ định dạng mà người quen thuộc ngôn ngữ HTML (Hyper Text Markup Language) HTML cho phép ta tạo nội dung trang Web đẹp Theo thời gian, với phiên khác HTML, số cặp thẻ định nghĩa ngày tăng Ví dụ, với phiên HTML 4.01 gần định nghĩa số cặp thẻ 120 (kể cặp thẻ mở rộng) Tuy nhiên để xử lý ứng dụng Web với phát triển ứng dụng mạng rõ ràng số cặp thẻ chưa đủ (thực ta có đủ cặp thẻ để sử dụng cho mục đích riêng mình) Vậy câu hỏi đặt làm để giải vấn đề đó? Sự đời ngôn ngữ XML (Extensible Markup Language) giải pháp cho vấn đề XML ngôn ngữ định nghĩa tổ chức mạng toàn cầu (World Wide Web Consortium- W3C) HTML XML có quan hệ gần gũi với - XML HTML dựa chuẩn ngôn ngữ định dạng tổng quát SGML (Standard Generalized Markup Language) hai ngôn ngữ sử dụng cặp thẻ Tuy ngôn ngữ XML, cặp thẻ sử dụng để định nghĩa khai báo cấu trúc liệu định nghĩa người dùng thông qua số quy tắc cặp thẻ HTML sử dụng để định dạng định nghĩa, quy định trước Nhờ khả tự định nghĩa thẻ khả cho phép định nghĩa khai báo cấu trúc liệu mà ngôn ngữ XML trở thành ngôn ngữ cần cho công nghệ Internet ứng dụng mạng ngày Nhưng có lẽ lý quan trọng để XML trở lên phổ biến XML cho phép dễ dàng xử lý, chuyển tải trao đổi liệu nhiều ứng dụng tài liệu người dùng với định dạng khác Trong XML liệu định dạng lưu dạng text, ta dễ dàng cấu thay đổi chúng trình soạn thảo thông thường trình soạn thảo chuyên nghiệp XML (XML Notepad, XML Writer, XML Spy hay eNotepad) Sự kết hợp XML với định dạng CSS (Cascade Style Sheet) hay XSL (Extensible Style Language) giúp cho việc định dạng liệu hiệu nhiều so với định dạng nhị phân (định dạng coi hiệu chứa liệu dạng nén)[1] Ngoài ra, khả coi mạnh XML khả tạo ngôn ngữ định dạng tuỳ biến – cho phép ta tuỳ biến vào trình duyệt ứng dụng để xử lý theo ngôn ngữ định dạng phù hợp theo tập thẻ quy ước Một mạnh khác XML không cho phép ta lưu liệu vào file XML mà tổ chức liệu theo cấu trúc XML cho phép phần tử thẻ tích hợp với tạo nên cấu trúc liệu phân cấp hoàn chỉnh Điều thật quan trọng cần đến khả định nghĩa liệu có cấu trúc XML ngôn ngữ đòi hỏi tính xác cú pháp ngôn ngữ cao Trình duyệt không chấp nhận tài liệu XML viết sai cú pháp không phân tích tiếp tài liệu XML tài liệu XML hoàn toàn khuôn dạng cú pháp 1.1.2 Cấu trúc tài liệu XML 1.1.2.1 Tài liệu XML Các thẻ XML tự định nghĩa xác định mục đích sử dụng thẻ Do vấn đề đặt cần xác định cho cú pháp để thẻ tuân theo Có hai cách để xác định cú pháp mà tài liệu XML tuân theo, là: Mô hình định nghĩa kiểu tư liệu XML (DTD – Definition Type Document) Mô hình lược đồ XML (schema) Nội dung tài liệu XML bị ràng buộc hai tính chất: Tính hợp khuôn dạng (well – formed document) Tính hợp lệ (validity) Tài liệu XML viết trình soạn thảo thông thường trình soạn thảo chuyên dụng XML 1.1.2.2 Cấu trúc tài liệu XML Một tài liệu XML chia thành phần chính, phần có thành phần theo quy định khác a, Phần khởi đầu (PROLOG) chứa khai báo tài liệu XML như: khai báo phiên sử dụng XML, cách thức mã hoá liệu, thị xử lý, định nghĩa kiểu tư liệu cho tài liệu DTD, thích, khoảng trắng Chuẩn XML không bắt buộc phải khai báo phần mở đầu XML Tuy nhiên W3C khuyến khích ta nên sử dụng phần khai báo này, phần khai báo phiên sử dụng XML b, Phần thân (BODY) tài liệu chứa nội dung liệu bao gồm hay nhiều thành phần (phần bắt buộc phải có thành phần), thành phần bao gồm phần tử (element) Mỗi phần tử thường bao gồm cặp thẻ (thẻ bắt đầu thẻ kết thúc) Phần tử tài liệu gọi phần tử gốc (root element) Tất tài liệu XML gọi hợp khuôn dạng chứa đựng phần tử gốc Phần tử gốc chứa đựng tất phần tử cặp thẻ khác tài liệu PROLOG Khai báo DTD- Định nghĩa kiểu tư liệu Phần thân tài liệu Hình 1.1: Cấu trúc tài liệu XML 1.1.3 Các thành phần tài liệu XML Định dạng liệu ký tự: Tài liệu XML tạo thành từ thành phần định dạng thành phần liệu ký tự Trong tài liệu XML, định dạng giúp phân biệt thành phần khác tài liệu XML hay loại nút XML Định dạng bao gồm cặp thẻ (thẻ bắt đầu thẻ kết thúc), phần tử thẻ rỗng, tham chiếu thực thể, tham chiếu ký tự, thích, phân đoạn CDATA, khai báo kiểu tài liệu thị xử lý Tất tài liệu lại XML định dạng xem ký tự Các ký tự chuẩn hoá theo chuẩn ISO/ IEC 10646 XML hỗ trợ nhiều kiểu mã hoá liệu như: UTF–8, UTF-16, ISO–8859-5, ISO-10646-UCS-4 Tất trình xử lý XML hỗ trợ mã hoá liệu theo chuẩn Unicode UTF-8, UTF-16 Có ký tự mà chúng vừa sử dụng để tạo định dạng, vừa liệu ký tự nên dễ nhầm lẫn việc sử dụng Ví dụ dấu &, >, Nội dung thích > diễn dịch nội dung tài liệu trình phân tích bỏ qua dòng thích o Một số quy tắc viết thích tài liệu XML: Không đặt thích trước khai báo Không đặt thích bên định dạng Không dùng chuỗi bên thích Chỉ thị xử lý: o Chỉ thị xử lý sử dụng để dẫn cho phân tích cách xử lý tài liệu trình phân tích Chỉ thị xử lý bắt đầu thường đặt đầu tài liệu o Ví dụ thị xử lý: thị xử lý yêu cầu phân tích kết hợp liệu XML với bảng định kiểu CSS (Cascade Style Sheet) Thẻ, phần tử (element), thực thể (entity) thuộc tính (attribute): o Thẻ phần tử: Cấu trúc tài liệu XML tạo dựa thành phần định dạng (markup) Những thành phần bao gồm phần tử (element) phần tử tài liệu XML bao gồm cặp thẻ - thẻ bắt đầu thẻ kết thúc (trong cặp thẻ chứa cặp thẻ khác chứa liệu) Một phần tử XML tuân theo cú pháp tổng quát sau: Content Trong đó, TagName tên thẻ (được đặt theo nguyên tắc: tên thẻ bắt đầu ký tự, gạch chân (_), 56 Sau thực kết nối liệu bảng CSDL quan hệ Bảng CSDL liên kết hình thành ánh xạ thành DOM theo nguyên tắc ánh xạ sau chuyển thành tài liệu XML tương ứng Relational Schema Relational Database Step1 Demormalization Joined Table1 Joined Table2 Joined Tablen Step2 Intergrated Tables DOM tree integration Step3 DOM tree integration XML Document Hình 2.22: Các bước ánh xạ CSDL quan hệ thành tài liệu XML 57 2.4 Kết luận Trong chương trình bày mối liên hệ nội dung CSDL quan hệ với nội dung tài liệu XML, đồng thời đưa phương pháp luận để chuyển CSDL quan hệ thành tài liệu XML ngược lại Bằng việc sử dụng câu lệnh truy vấn SQL dựa quy tắc ánh xạ đơn giản, dễ hiểu xác trình bày chương này, có sở để đưa cài đặt cụ thể cho thuật toán tích hợp trình bày chương 58 Chương CÀI ĐẶT THUẬT TOÁN TÍCH HỢP CÁC HỆ THỐNG CƠ SỞ DỮ LIỆU QUAN HỆ VÀ XML 3.1 Thuật toán Căn vào phương pháp luận tích hợp hệ thống sở liệu quan hệ XML, thuật toán tích hợp hệ thống sở liệu quan hệ xây dựng tổng quát sau: 3.1.1 Đọc tài liệu XML dạng sơ đồ hình Với mô hình DOM, tài liệu XML tổ chức dạng sơ đồ hình có cấu trúc tương tự thư mục Windows Vì mục đích phần biểu diễn tài liệu XML theo mô hình DOM, hình minh hoạ sau 59 Thuật toán: Tài liệu XML đọc vào thông qua hình thức đọc file liệu xây dựng theo dạng mô hình DOM thông qua việc: - Truy cập lấy phần tử gốc tài liệu - Lấy danh sách tất phần tử phần tử gốc - Mỗi phần tử tìm gắn số đặc trưng - Quá trình tìm phần tử thực theo phương pháp đệ quy - Nếu phần tử xét số phần tử - Xây dựng lưu trữ đường dẫn tương ứng tới phần tử tài liệu - Lấy tên, phần tử giá trị thuộc tính - Chuyển đổi thông tin đường dẫn, nội dung phần tử sang dạng chuỗi để in hình dạng tài liệu giống Windows Trong chương trình, lớp DOMTreeTest xây dựng để thể thuật toán với phương thức xử lý tương ứng: getRoot(), getChildCount(Object parent), getChild(Object parent, int index), getIndexOfChild(Object parent, Object child), isLeaf(Object node), elementString(Element e), characterString(CharacterData node) 3.1.2 Hiển thị tài liệu XML dạng bảng Như nói, tài liệu XML (theo mô hình DOM) bao gồm nút (node) Những nút nội dung chứa phần tử (element), liệu (text), thuộc tính (attributed) nút khác Để chuyển tài liệu XML sang dạng bảng ta sử dụng thuật toán sau: 60 Thuật toán: - Duyệt tất nút theo mô hình DOM nút gốc theo kỹ thuật đệ quy - Xây dựng hàm để kiểm tra xử lý nút tài liệu DOM Đối với nút hành mà có nút hàm ta xây dựng đệ quy tìm sâu xuống nút bên hình thành DOM tương ứng cho nút - Với mô hình DOM thu được, thực ánh xạ phần tử, thuộc tính với giá trị tương ứng thành quan hệ, thuộc tính giá trị tương ứng bảng CSDL quan hệ Trong chương trình, lớp ConvertToTable xây dựng để thể thuật toán với phương thức xử lý tương ứng: ConvertToTable(JFrame f, String str, boolean modal), buildContent(), buildTable(NodeList list) 3.1.3 Chuyển CSDL quan hệ sang tài liệu XML Để chuyển CSDL quan hệ thành tài liệu XML, ta thực tạo nguồn liệu ODBC từ CSDL quan hệ phi chuẩn (sử dụng công cụ Administrative Tools Windows) Sau thực thuật toán sau: Thuật toán: - Xây dựng lớp kết nối với JDBC – ODBC để kết nối liệu xây dựng môi trường Access SQLServer - Tạo kết nối CSDL quan hệ cần chuyển đổi thành tài liệu XML thông qua truy vấn SQL - Chuyển đổi liệu kết nối sang tài liệu XML thông qua nguyên tắc ánh xạ trình bày 61 Lớp Gennerate xây dựng để tạo kết nối CSDL quan hệ thông qua câu lệnh truy vấn SQL, phương thức tương ứng xây dựng lớp này: Gennerate(JFrame f,String str, boolean modal), actionPerformed(ActionEvent ae) Lớp DisplayData xây dựng để chuyển đổi liệu kết nối sang tài liệu XML với phương thức xử lý tương ứng: DisplayData(JFrame f, String str, boolean modal), buildContent(), actionPerformed(ActionEvent ae) 3.2 Cài đặt thuật toán Thuật toán cài đặt ngôn ngữ lập trình Java chạy phiên SDK 1.5.0 trở lên Các CSDL quan hệ sử dụng chương trình tạo lập từ môi trường CSDL MS Access SQLServer Các tài liệu XML tạo lập môi trường soạn thảo WordPad, NotePad, XML Editor, Chi tiết giao diện cài đặt cụ thể thuật toán tích hợp hệ thống CSDL quan hệ XML mô sau: Đọc tài liệu XML dạng sơ đồ hình Một tài liệu XML đọc vào chương trình hiển thị dạng cấu trúc hình thể qua giao diện sau: 62 Trong phần này, lớp DOMTreeTest xây dựng để hiển thị tài liệu XML việc sử dụng mô hình DOM, với việc đưa vào số thư viện xử lý DOM kiện: import java.awt.*; import java.awt.event.*; import java.io.*; import javax.swing.*; import javax.swing.event.*; import javax.swing.tree.*; import javax.xml.parsers.*; import org.w3c.dom.*; import org.xml.sax.*; public class DOMTreeTest extends JInternalFrame { public static Document doc = null; public static File f; public DOMTreeTest(File f) { super("DOM Tree Test", true, true, true, true); this.f = f; try { if (builder == null) { // Create new instance from Factory Pattern Class DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance(); builder = factory.newDocumentBuilder(); } doc = builder.parse(f); JTree tree = new JTree(new DOMTreeModel(doc)); tree.setCellRenderer(new DOMTreeCellRenderer()); setContentPane(new JScrollPane(tree)); validate(); } catch (IOException exception) 63 { JOptionPane.showMessageDialog(this, exception); } catch (ParserConfigurationException exception) { JOptionPane.showMessageDialog(this, exception); } catch (SAXException exception) { JOptionPane.showMessageDialog(this, exception); } setTitle("DOMTreeTest"); } private DocumentBuilder builder; } Lớp DOMTreeModel xây dựng để mô tả cấu trúc java, với phương thức xây dựng: getRoot(): lấy phần tử gốc tài liệu getChildCount(Object parent): Lấy danh sách node getChild(Object parent, int index): Lấy note tương ứng với số index danh sách tìm getIndexOfChild(Object parent, Object child): Lấy số tương ứng phần tử danh sách isLeaf(Object node): Kiểm tra xem node có không Lớp DOMTreeCellRenderer với phương thức: Component getTreeCellRendererComponent(JTree tree, Object value, boolean selected, boolean expanded, boolean leaf, int row, boolean hasFocus), elementString(Element e) characterString(CharacterData node) xây dựng để chuyển cấu trúc thành định dạng String để hiển thị tài liệu dạng cấu trúc 64 Chuyển đổi tài liệu XMl thành CSDL quan hệ Một tài liệu XML tạo lập theo cấu trúc yêu cầu chuyển đổi hiển thị dạng bảng CSDL quan hệ Ví dụ: Có tệp Test.xml với nội dung sau CFH28514M Carlos F Hernadez 5 211 9999 1989-04-21 00:00:00.000 JYL26161F Janine Y Labrune 5 172 9901 1991-05-26 00:00:00.000 HAN90777M Helvetius A Nagy 7 65 120 9999 1993-03-19 00:00:00.000 Sau chọn chức chuyển đổi tài liệu XML thành CSDL quan hệ, bảng CSDL quan hệ hiển thị sau: Lớp ConvertToTable xây dựng để thể thuật toán Trong lớp này, phương thức xây dựng: buildContent(): Xây dựng nội dung bảng liệu, phương thức buildTable(NodeList list) gọi để xây dựng nội dung cho bảng CSDL quan hệ tương ứng với cấu trúc DOM thu từ tài liệu XML Phương thức buildTable(NodeList list) xây dựng để ánh xạ tài liệu XML thành bảng CSDL quan hệ theo nguyên tắc ánh xạ Chuyển CSDL quan hệ thành tài liệu XML Để chuyển CSDL quan hệ tạo lập từ môi trường MS Access hay SQLServer, ta thực bước sau: 66 Bước 1: Tạo kết nối ODBC - Vào hình ODBC Data Source Administrator Windows - Chọn trang User DNS bấm chọn nút lệnh “Add” để tạo nguồn liệu - Chọn Driver CSDL cần chuyển đổi sang tài liệu XML - Chọn CSDL nguồn khai báo tên cho nguồn liệu ODBC tạo - Bấm nút lệnh “Finish” để kết thúc việc tạo kết nối liệu ODBC Bước 2: Tạo kết nối với JDBC-ODBC ngôn ngữ Java - Trong chương trình dùng lớp ConnectData() để thực chức - Chuyển đổi từ liệu ODBC sang tài liệu XML Trong chương trình sử dụng lớp Gennerate() lớp DisplayData() để thực chức Lớp Gennerate() cho phép tạo kết nối xử lý câu lệnh SQL để kết xuất nội dung tài liệu chuyển đổi Lớp DisplayData() đọc CSDL tạo từ câu lệnh SQL nói tổ chức lưu trữ liệu dạng tài liệu XML Giao diện thực hiện: 67 Giao diện yêu cầu nhập vào tên liệu ODBC cần chuyển đổi, nhập đúng, chọn OK giao diện xuất yêu cầu người dùng gõ vào câu lệnh SQL chọn Create để kết xuất liệu mong muốn sang tài liệu XML Khi hình hiển thị liệu XML có dạng: 68 3.3 Kết - Đánh giá Kết đạt Kết mà thuật toán đạt có tính thực tiễn cao, với khả tích hợp hệ thông CSDL quan hệ vào tài liệu XML ngược lại, chuyển tài liệu XML thành CSDL quan hệ xây dựng dựa việc kết nối CSDL với số quy tắc ánh xạ xem phương pháp mạch lạc, dễ hiểu mà đảm bảo tính toàn vẹn liệu Với ngôn ngữ lập trình Java, thuật toán cài đặt với ưu điểm trội sau: - Không phụ thuộc cấu hình máy đích - Có khả tích hợp cao - Dễ dàng cấu hình - Khả truy xuất liệu tốt - Có danh sách thư viện phong phú - Thuật toán tích hợp thực tốt CSDL quan hệ Đánh giá chung: Thuật toán tích hợp hệ thống CSDL quan hệ XML trình bày luận văn thực CSDL quan hệ tạo lập môi trường MS Access SQLServer thực tốt 69 KẾT LUẬN Việc chuyển đổi CSDL quan hệ sang tài liệu XML ngược lại mà không cần quan tâm đến việc bảo toàn ràng buộc liệu, hay việc nghiên cứu chuyển đổi có bảo toàn ràng buộc việc xét ràng buộc liệu thông qua ràng buộc khoá nghiên cứu Tuy nhiên, với phương pháp thứ rõ ràng tính ứng dụng thực tiễn không cao, CSDL tồn giới thực có ràng buộc lẫn Với phương pháp thứ hai thật khó khăn, phức tạp để xét hết tất ràng buộc phụ thuộc liệu CSDL quan hệ Trong luận văn đề cập đến việc tích hợp hệ thống CSDL quan hệ XML dựa phân tích mô hình DOM thông qua quy tắc ánh xạ đơn giản CSDL quan hệ kết nối theo nhu cầu người dùng nhờ câu lệnh truy vấn SQL Toàn luận văn trình bày ba chương Nội dung chương trình bày ngắn gọn, xúc tích thể đầy đủ, xác nội dung vấn đề đưa Với toàn nội dung trình bày luận văn, luận văn đạt kết tốt cho việc hỗ trợ tích hợp CSDL quan hệ với tài liệu XML, giúp người dùng tra cứu, truy cập, kết xuất, chuyển đổi liệu cách linh hoạt trình trao đổi liệu xa lộ thông tin Trong tương lai, luận văn phát triển để hỗ trợ cho việc phục hồi CSDL quan hệ gốc từ tài liệu XML chuyển trình trao đổi liệu tích hợp CSDL quan hệ vào tài liệu XML theo nhu cầu sử dụng liệu người dùng mà đảm bảo đầy đủ phụ thuộc liệu thông qua việc kết hợp sử dụng truy vấn từ SQL SQLServer trình tích hợp 70 TÀI LIỆU THAM KHẢO Tiếng Việt [1] Nguyễn Phương Lan, Hoàng Đức Hải (2003), XML- Nền tảng & ứng dụng, NXB Lao động – Xã hội [2] Nguyễn Tiến, Đặng Xuân Hường, Nguyễn Văn Hoài, Nguyễn Tuấn Ngọc (2001), Nhập môn XML thực hành ứng dụng, NXB Thống kê [3] Ban Điều hành đề án 112 (2004), Giáo trình phân tích thiết kế xây dựng quản trị hệ thống CSDL, Viện Công nghệ thông tin - Viện Khoa học Công nghệ Việt Nam [4] Nguyễn Phương Lan, Hoàng Đức Hải (2004), Java tập 1+2, NXB Lao động – Xã hội Tiếng Anh [5] Dino Esposito (2003), Applied XML Programming for microsoft NET, Printed and bound in the United States of America [6] Kevin Reiss (2003), Data Transfer Stategies: Transferring Between XML Document and Relational Databases, Web page: www.rpbourret.com/xml/datatransfer.htm [7] Angela Bonifati, Stefano Ceri (1999), Comparative Analysis of Five XML Query languages [8] Benoit Marchal (2000), XML by Example, Printed in the United States of America [9] Hiroshi Maruyama, Kent Tamura, Naohiko Uramoto (2002), XML and Java Second Edition developing Web Applications [10] Lauren Wood, Programming XMl: using the DOM, SoftQuad Software Inc., Surrey, Canada [11] J Fong, H K Wong, Z Cheng (2003), Converting relational database into XML documents with DOM, Infor and Soft Technology 45 (2003) 335-355 [12]www.topxml.com; [...]... )” Trong đó, start_expression và end_expression là biểu thức viết bằng cú pháp XPATH cho biết đầu khoảng cách và cuối khoảng cách 1.2 Cơ sở dữ liệu quan hệ 1.2.1 Cấu trúc cơ sở dữ liệu quan hệ Một cơ sở dữ liệu quan hệ là một tập của một hoặc nhiều quan hệ, trong đó mỗi quan hệ là một bảng hai chiều bao gồm các cột và các hàng (gọi là bảng dữ liệu hay quan hệ) Bảng dữ liệu chính là hình thức thể hiện... trị (bằng cách thêm vào các quan hệ phụ) Quan hệ có thể được hiểu là tập con của tích đề các của một hoặc nhiều miền Như vậy, mỗi quan hệ có thể là vô hạn Với giả thiết rằng, quan hệ là một tập hữu hạn Người ta dùng thuật ngữ quan hệ cơ sở để chỉ mức độ thấp nhất của thể hiện dữ liệu đối với người dùng Tất cả các dữ liệu trong CSDL quan hệ sẽ được lưu trữ theo tập các quan hệ cơ sở Dữ liệu có thể... dựng cơ sở dữ liệu, bảng dữ liệu được sử dụng để lưu dữ liệu về các thực thể trong lớp thực thể đó Như vậy, bảng dữ liệu là một tập các bộ dữ liệu, hay bản ghi dữ liệu, mỗi bộ có cùng một số lượng thuộc tính như nhau nhưng có thể khác nhau về giá trị Bảng dữ liệu trong cách tiếp cận CSDL quan hệ được hiểu chính xác hơn bằng cụm từ quan hệ Một quan hệ bao gồm một lược đồ quan hệ và một thể hiện quan hệ. .. Chuẩn hoá một cơ sở dữ liệu quan hệ [3] Chuẩn hoá các cơ sở dữ liệu quan hệ là rất cần thiết trong thực tế vì nhờ bước chuẩn hoá này mà chúng ta có thể loại bỏ tối đa sự dư thừa dữ liệu - một trong những nguyên nhân dẫn đến sự không toàn vẹn dữ liệu Chuẩn hoá một cơ sở dữ liệu nghĩa là chúng ta sẽ đưa các lược đồ quan hệ về một trong các dạng chuẩn: 1NF, 2NF, 3NF Chuẩn 1NF: Một quan hệ ở dạng chuẩn... các bảng cơ sở trong CSDL quan hệ và dùng chúng trong các phép xử lý 1.2.2 Ràng buộc toàn vẹn trên một cơ sở dữ liệu quan hệ Ràng buộc toàn vẹn và kiểm tra sự vi phạm ràng buộc toàn vẹn là một trong những vấn đề quan trọng trong quá trình phân tích, thiết kế và khai thác các hệ thống cơ sở dữ liệu 1.2.2.1 Định nghĩa [3]: Ràng buộc toàn vẹn là một điều kiện bất biến không được vi phạm trong một cơ sở. .. thuộc hàm một phần vào khoá chính) Nếu một quan hệ chưa ở dạng 2NF thì tách quan hệ ban đầu thành các quan hệ mới gồm: quan hệ chứa các thuộc tính không khoá không phụ thuộc bộ phận vào khoá chính và các quan hệ trong đó mỗi quan hệ chứa các thuộc tính là thuộc tính bộ phận của khoá chính và các thuộc tính phụ thuộc bộ phận vào thuộc tính bộ phận của khoá chính đó Chuẩn 3NF: Một quan hệ ở dạng chuẩn... sở dữ liệu 32 Trong thực tế, một CSDL luôn luôn tồn tại các mối liên hệ qua lại lẫn nhau giữa các thuộc tính, giữa các bộ giá trị trong cùng một quan hệ hoặc trong các quan hệ với nhau Các mối quan hệ phụ thuộc lẫn nhau này chính là những điều kiện bất biến mà tất cả các bộ của các quan hệ có liên quan trong CSDL đều phải thoả mãn tại bất kỳ thời điểm nào Ràng buộc toàn vẹn còn có thể được hiểu là các. .. truy cập và xử lý theo cách nhìn nhận riêng, đặc biệt được gọi là “khung nhìn” Khung nhìn là quan hệ logic, tương ứng trực tiếp hay gián tiếp với quan hệ cơ sở Định nghĩa khung nhìn (View): Khung nhìn là quan hệ liên kết logic cho phép liên kết hai hay nhiều quan hệ một cách trực tiếp hoặc gián tiếp 31 Một khung nhìn có thể là một tập con đơn giản của một quan hệ cơ sở Ví dụ: cho bảng quan hệ BANHANG... hiện quan hệ chính là một bảng, còn lược đồ quan hệ miêu tả tiêu đề các cột của bảng đó Trong một quan hệ không thể tồn tại hai bộ dữ liệu giống nhau ở tất cả các thuộc tính Một bảng dữ liệu được đặc trưng bởi một tên cụ thể, gọi là tên quan hệ Mỗi cột trong bảng tương ứng với một thuộc tính trong quan hệ, được đặt tên duy nhất (gọi là tên trường) Mỗi dòng trong bảng tương ứng với một bộ của quan hệ, ... vào tài liệu XML đích (tài liệu hiện hành) Không gian tên (namespace): o Việc kết hợp các tài liệu XML lại với nhau là một vấn đề cần phải xem xét vì khả năng cho phép tự do định nghĩa và đặt tên các thẻ trong XML Do vậy việc định ra phạm vi hay không gian tên cho các thẻ trong tài liệu XML là cần thiết o Để định nghĩa một không gian tên cho các thẻ, ta đưa vào thuộc tính xmlns:prefix vào phần tử gốc ... khoảng cách cuối khoảng cách 1.2 Cơ sở liệu quan hệ 1.2.1 Cấu trúc sở liệu quan hệ Một sở liệu quan hệ tập nhiều quan hệ, quan hệ bảng hai chiều bao gồm cột hàng (gọi bảng liệu hay quan hệ) Bảng liệu. .. việc tích hợp hệ thống sở liệu XML 2.1 Phương pháp luận Tích hợp hệ thống CSDL quan hệ XML nghiên cứu cách chuyển đổi CSDL quan hệ thành tài liệu XML ngược lại, chuyển tài liệu XML CSDL quan hệ. .. sở sở liệu (CSDL) quan hệ Chương 2: Tích hợp hệ thống sở liệu XML - Giới thiệu phương pháp luận chuyển tài liệu XML sang CSDL quan hệ ngược lại Chương 3: “Thuật toán tích hợp hệ thống sở