1. Trang chủ
  2. » Công Nghệ Thông Tin

Tích hợp cơ sở dữ liệu quan hệ và XML

75 362 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 75
Dung lượng 3,08 MB

Nội dung

i MỤC LỤC Trang Trang phụ bìa Lời cam đoan Lời cảm ơn MỤC LỤC .i Trang .i DANH MỤC CÁC THUẬT NGỮ, CHỮ VIẾT TẮT .iii MỞ ĐẦU 1 Lý chọn đề tài Mục đích nghiên cứu Đối tượng nghiên cứu Giả thiết khoa học Nhiệm vụ nghiên cứu Phạm vi nghiên cứu Phương pháp nghiên cứu CHƯƠNG 1: TỔNG QUAN VỀ XML VÀ CƠ SỞ DỮ LIỆU QUAN HỆ 1.1 Tổng quan XML 1.1.2 Cấu trúc tài liệu XML 1.1.2.1 Tài liệu XML 1.1.2.2 Cấu trúc tài liệu XML .5 1.1.3 Các thành phần tài liệu XML .6 1.1.4 Cấu trúc tài liệu XML hợp khuôn dạng 11 1.1.5 Định nghĩa kiểu tài liệu DTD (Document Type Definition) 13 1.1.6 Lược đồ XML (XML schema) 15 1.1.7 Bảng định kiểu CSS (Cascading Style Sheet) .16 1.1.8 Mô hình DOM (Document Object Model) 18 1.1.9 Phân tích tài liệu XML theo mô hình DOM 20 1.2 Cơ sở liệu quan hệ .21 1.2.1 Cấu trúc sở liệu quan hệ 21 1.2.2 Ràng buộc toàn vẹn sở liệu quan hệ .23 1.2.2.1 Định nghĩa .24 1.2.2.2 Các yếu tố ràng buộc toàn vẹn 24 1.2.3 Chuẩn hóa sở liệu quan hệ 25 1.3 Kết luận .27 CHƯƠNG 2: TÍCH HỢP CÁC HỆ THỐNG CƠ SỞ DỮ LIỆU QUAN HỆ VÀ XML 28 2.1 Phương pháp luận 28 2.1.1 Đối sánh nội dung CSDL quan hệ tài liệu XML 29 ii 2.1.2 Cấu trúc kiểu chế tài liệu XML lược đồ CSDL quan hệ 31 2.1.3 Tên 34 2.1.4 Các giá trị rỗng giá trị mặc định 35 2.1.5 Quan hệ 36 2.1.6 Thứ tự 38 2.2 Chuyển tài liệu XML sang sở liệu quan hệ 39 2.3 Chuyển CSDL quan hệ thành tài liệu XML .41 2.3.1 Phi chuẩn lược đồ quan hệ 43 2.3.2 Kết nối CSDL phi chuẩn 47 2.3.3 Ánh xạ CSDL quan hệ kết nối thành DOM chuyển thành tài liệu XML 49 2.4 Kết luận 54 CHƯƠNG 3: THUẬT TOÁN TÍCH HỢP CÁC HỆ THỐNG CƠ SỞ DỮ LIỆU QUAN HỆ VÀ XML 55 3.1 Thuật toán 55 3.1.1 Đọc tài liệu XML dạng sơ đồ hình 55 3.1.2 Hiển thị tài liệu XML dạng bảng 57 3.1.3 Chuyển CSDL quan hệ sang tài liệu XML .58 3.2 Cài đặt thuật toán 58 3.3 Đánh giá kết .62 3.4 Kết luận 62 CHƯƠNG IV: CÀI ĐẶT THỬ NGHIỆM .63 4.1 Yêu cầu cài đặt: 63 - Phần mềm: .63 4.2 Giao diện chương trình sau: .63 KẾT LUẬN 70 TÀI LIỆU THAM KHẢO 72 iii DANH MỤC CÁC THUẬT NGỮ, CHỮ VIẾT TẮT CSDL CSS DOM DTD HTML ODBC SGML SQL URL URI W3C XML XSL XSLT Cơ sở liệu quan hệ Cascading Style Sheets Document Object Model Document Type Definition Hyperlink Text Markup Language Open Database Connectivity Standard Generalized Markup Language Structured Query Language Uniform Resource Locator Uniform Resource Identifier World Wide Web Consortium eXtensible Markup Language eXtensible Stylesheet Language eXtensible Stylesheet Language Transformations MỞ ĐẦU Lý chọn đề tài Hiện có nhiều giao dịch, tương tác thông qua Internet phát triển rầm rộ, hàng loạt ngôn ngữ giao thức giao tiếp, thiết kế trang web đời để phục vụ cho mục đích định Có thể kể đến nhiều ngôn ngữ phổ biến HTML, DHTML, Java, PHP, ASP,… loại có ưu nhược điểm riêng Ngôn ngữ XML (eXtensible Markup Language) phát triển thời gian gần phổ biến rộng rãi (ở ngôn ngữ NET) Không giới hạn định nghĩa sẵn HTML, XML cho phép người dùng tự định nghĩa thành phần riêng mở rộng tuỳ ý XML trở nên phổ biến có nhiều nguyên nhân Điểm quan trọng XML cho phép dễ dàng xử lý, chuyển tải trao đổi liệu nhiều ứng dụng tài liệu người dùng với định dạng khác Nhận thấy tính thiết thực vấn đề gợi ý giáo viên hướng dẫn, em chọn đề tài “Tích hợp sở liệu quan hệ XML” làm đề tài cho luận văn tốt nghiệp Mục đích nghiên cứu Luận văn tập trung tìm hiểu XML mô hình DOM, phương pháp sử dụng mô hình DOM để chuyển sở liệu quan hệ sang tài liệu XML ngược lại Đối tượng nghiên cứu • Tìm hiểu công nghệ XML • Tìm hiểu sở liệu quan hệ • Cách chuyển đổi tài liệu XML sang sở liệu • Cách chuyển sở liệu quan hệ sang tài liệu XML Giả thiết khoa học Nếu sử dụng công nghệ XML phát triển tài liệu XML sử dụng sở liệu tồn mà trích rút liệu từ tài liệu XML Nhiệm vụ nghiên cứu • Nghiên cứu XML • Nghiên cứu giải pháp thực chuyển đổi XML sở liệu quan hệ • Xây dựng ứng dụng cụ thể dựa kết nghiên cứu • Đồng thời luận văn mong muốn nêu số hướng nghiên cứu vào kết đạt Phạm vi nghiên cứu Luận văn tập trung nghiên cứu kiến thức có liên quan, sở lý thuyết: tài liệu XML, mô hình DOM, lý thuyết sở liệu, thuật toán chuyển đổi sở liệu quan hệ XML Phương pháp nghiên cứu • Đọc tài liệu: sách, báo tài liệu liên quan • Phân tích - tổng hợp lý thuyết xây dựng thuật toán chuyển đổi sở liệu quan hệ sang dạng tài liệu XML ngược lại • Khai thác ngôn ngữ lập trình C# để viết chương trình Demo Luận văn trình bày gồm bốn chương:  Chương 1: “Tổng quan XML sở liệu quan hệ” – Trình bày tổng quan cấu trúc tài liệu XML, định nghĩa kiểu tài liệu DTD, lược đồ, mô hình đối tượng tài liệu DOM, phân tích tài liệu XML theo mô hình DOM khái niệm sở sở liệu (CSDL) quan hệ  Chương 2: “Tích hợp hệ thống sở liệu XML” – Giới thiệu phương pháp luận chuyển tài liệu XML sang CSDL quan hệ ngược lại  Chương 3: “Thuật toán tích hợp hệ thống sở liệu quan hệ XML” – Đưa thuật toán tích hợp hệ thống sở liệu quan hệ XML  Chương 4: “Cài đặt thử nghiệm” – Trình bày việc cài đặt thuật toán ngôn ngữ lập trình C# môi trường ASP.NET, sở xây dựng ứng dụng trang web “Đăng ký học tín chỉ” trường Đại học Hàng Hải Việt Nam Và phần cuối Kết luận – Tóm tắt nội dung chính, kết đạt hướng nghiên cứu luận văn CHƯƠNG 1: TỔNG QUAN VỀ XML VÀ CƠ SỞ DỮ LIỆU QUAN HỆ 1.1 Tổng quan XML 1.1.1 Giới thiệu công nghệ XML XML (viết tắt từ tiếng Anh eXtensible Markup Language, “Ngôn ngữ Đánh dấu Mở rộng”) [2], [11] ngôn ngữ đánh dấu với mục đích chung W3C đề nghị, để tạo ngôn ngữ đánh dấu khác Đây tập đơn giản SGML, có khả mô tả nhiều loại liệu khác Mục đích XML đơn giản hóa việc chia sẻ liệu hệ thống khác nhau, đặc biệt hệ thống kết nối với Internet Các ngôn ngữ dựa XML (thí dụ: RDF, RSS, MathML, XHTML, SVG, GML Cxml) định nghĩa theo cách thông thường, cho phép chương trình sửa đổi kiểm tra hợp lệ ngôn ngữ mà không cần có hiểu biết trước hình thức chúng 1.1.2 Cấu trúc tài liệu XML 1.1.2.1 Tài liệu XML Một tài liệu HTML tồn số thẻ không quy định (trình biên dịch bỏ qua thẻ này) Tuy nhiên với tài liệu XML điều xảy Khi xây dựng tài liệu XML, phải tuân thủ theo số quy luật Những tài liệu XML tuân thủ quy luật gọi well-formed (tạm dịch định dạng đúng) Với tài liệu well–formed, Internet Explorer thông báo lỗi nạp tài liệu Một tài liệu XML well–formed chưa tài liệu hợp lệ Một tài liệu XML xem hợp lệ đảm bảo quy tắc đặc tả tài liệu Document Type Definition (DTD) hay giản đồ (schema) Một DTD hay schema định nghĩa thứ từ cấu trúc liệu tới kiểu liệu, thuộc tính yêu cầu, ràng buộc thành phần thuộc tính kết hợp tài liệu Phương thức kiểm tra tài liệu thường sử dụng giao tiếp ứng dụng – ứng dụng, đảm bảo liệu trao đổi hợp lệ tránh dẫn tới ảnh hưởng liệu không hợp lệ toàn hệ thống Tài liệu XML viết trình soạn thảo thông thường (Notepad), hay trình soạn thảo chuyên dụng XML: XML Notepad, XMLWriter, XML Spy, 1.1.2.2 Cấu trúc tài liệu XML Tài liệu XML chứa đựng liệu cách lưu trữ liệu mà không đề cập tới cách thức trình bày liệu Một tài liệu XML chứa đặc tả cấu trúc liệu Mỗi cấu trúc gồm nhiều phần tử (element), phần tử bắt đầu với thẻ bắt đầu (Start–tag) kết thúc với thẻ kết thúc (End–tag) Giữa Start–tag End–tag nội dung phần tử Nội dung bao gồm liệu văn phần tử khác Một tài liệu XML chia thành thành phần chính, thành phần có thành phần theo quy định khác Phần mở đầu Khai báo Mô tả cấu trúc tài liệu Phần nội dung Hình 1.1 Cấu trúc tài liệu XML Phần mở đầu (PROLOG) chứa khai báo tài liệu XML như: khai báo phiên sử dụng XML, cách thức mã hóa liệu, thị xử lý, định nghĩa kiểu tài liệu cho tài liệu DTD, thích, khoảng trắng Chuẩn XML không bắt buộc phải khai báo phần mở đầu XML Tuy nhiên W3C khuyến khích nên sử dụng phần khai báo này, phần khai báo phiên sử dụng XML Phần thân (BODY) tài liệu chứa nội dung liệu bao gồm hay nhiều thành phần (bắt buộc phải có thành phần), thành phần bao gồm phần tử (element) Mỗi phần tử bao gồm cặp thẻ (thẻ bắt đầu thẻ kết thúc) Phần tử tài liệu coi phần tử gốc (root element) Tất tài liệu XML gọi hợp khuôn dạng chứa đựng phần tử gốc Phần tử gốc chứa đựng tất phần tử cặp thẻ khác tài liệu 1.1.3 Các thành phần tài liệu XML  Định dạng liệu kí tự: Tài liệu XML tạo thành từ thành phần định dạng thành phần liệu kí tự Trong tài liệu XML, định dạng giúp phân biệt thành phần khác tài liệu XML hay nút khác XML Định dạng bao gồm thẻ bắt đầu, thẻ kết thúc, phần tử thẻ rỗng, tham chiếu thực thể, tham chiếu kí tự, lời thích, phân đoạn CDATA, khai báo kiểu tài liệu thị xử lý Tất liệu lại tài liệu XML định dạng xem liệu kí tự  Các khai báo XML: Một tài liệu XML bắt đầu khai báo cho biết tài liệu viết theo định dạng đặc tả XML Nếu sử dụng khai báo XML, khai báo phải đặt dòng tài liệu Không khai báo XML sau dòng khác Khai báo XML tài liệu viết theo cấu trúc: < ?xml [các kiểu khai báo] ?> Các khai báo XML gồm: Khai báo phiên (version): Khai báo cho biết phiên đặc tả XML mà tài liệu sử dụng (khai báo tùy chọn W3C khuyến cáo nên sử dụng khai báo này) Khai báo mã hóa (encoding): mã sử dụng tài liệu XML mặc định UTF-8 Ngoài sử dụng mã khác Unicode, UCS-2, USC-4, (khai báo tùy chọn) Khai báo thực thể độc lập (standalone): đặt thuộc tính ‘yes’ tài liệu không tham chiếu đến thực thể khác bên ngoài, ngược lại đặt ‘no’ (khai báo tùy chọn)  Phần thích: Chú thích XML tương tự với thích HTML Khi diễn dịch nội dung tài liệu, phân tích thường bỏ qua dòng thích Chú thích XML đặt cặp kí tự < ! Nội dung thích !> Cần tuân theo số quy tắc thêm dòng thích vào tài liệu XML : • Chú thích không đặt trước khai báo • Không đặt trước thích vào bên phần định dạng • Không dùng chuỗi bên thích  Chỉ thị xử lý Các thị xử lý dùng để dẫn cho phân tích cách xử lý tài liệu XML trình phân tích Những thị thường bắt đầu dấu tương tự phần khai báo Ví dụ: thị yêu cầu phân tích kết hợp liệu XML với bảng định kiểu CSS: 58 Hình 3.3 Hiển thị tài liệu XML dạng bảng 3.1.3 Chuyển CSDL quan hệ sang tài liệu XML Để chuyển CSDL quan hệ thành tài liệu XML, ta thực tạo nguồn liệu ODBC từ CSDL quan hệ phi chuẩn (sử dụng công cụ Administrative Tools Windows) Sau thực thuật toán sau: Thuật toán: o Xây dựng lớp kết nối với JDBC - ODBC để kết nối liệu xây dựng môi trường MS Access hay SQL Server o Tạo kết nối CSDL quan hệ cần chuyển đổi thành tài liệu XML thông qua truy vấn SQL o Chuyển đổi liệu kết nối sang tài liệu XML thông qua nguyên tắc ánh xạ trình bày 3.2 Cài đặt thuật toán Thuật toán cài đặt ngôn ngữ lập trình C# [3] Các CSDL quan hệ sử dụng chương trình tạo lập từ môi trường CSDL MS Access hay SQL Server Các tài liệu XML tạo lập môi 59 trường WordPad, NotePad, XML Editor, … Chi tiết giao diện cài đặt cụ thể thuật toán tích hợp hệ thống CSDL quan hệ XML mô sau:  Đọc tài liệu XML dạng sơ đồ hình cây: Một tài liệu XML đọc vào chương trình hiển thị dạng cấu trúc hình // Tao mot tai lieu XML theo mo hinh DOM da co san du lieu XmlDocument xmlDoc = new XmlDocument(); xmlDoc.Load(Server.MapPath("SinhVien.xml")); // Khoi tao dieu khien TreeView TreeView1.Nodes.Clear(); TreeView1.Nodes.Add(new TreeNode(xmlDoc.DocumentElement.Name)); TreeNode tNode = new TreeNode(); tNode = TreeView1.Nodes[0]; // Hien thi len TreeView theo mo hinh DOM AddNode(xmlDoc.DocumentElement, tNode); TreeView1.ExpandAll(); // AddNode: XmlNode xNode; TreeNode tNode; XmlNodeList xNodeList; int i; // Kiem tra file XML // Them cac Node vao TreeView qua trinh lap if (xmlNode.HasChildNodes) { xNodeList = xmlNode.ChildNodes; //Lay danh sach cac phan tu cua Node for (i = 0; i Tin học bản Dành cho SV năm thứ nhất Chèn: người sử dụng nhập thông tin xác mã môn học, tên môn học, ghi (nếu có) Các thông tin ghi tiếp vào file xml tạo 66 Tin học bản Dành cho SV năm thứ nhất Tin học văn phòng Dành cho SV năm thứ nhất Triết học Dành cho SV năm thứ nhất Vật lý SV Ngành Vật lý Cấu trúc DL GT SV CNTT Sửa: cho phép sửa lại thông tin chưa chuẩn file xml, sau lưu lại vào file Hình 4.5 Form chỉnh sửa thông tin môn học 67 Trên hình minh họa sửa môn học Vật lý thành Vật lý đại cương Kết cho hình phía dưới: Hình 4.6 Kết chỉnh sửa thông tin môn học Xóa: xóa thông tin không cần thiết, thông tin lấy từ file xml sau xóa lưu lại vào file xml Tìm kiếm: tìm kiếm thông tin liên quan theo mã môn học file xml (TT_Monhoc.xml) Nếu thành công cho kết hình Ngoài ra, hệ thống có số chức khác như: download thời khóa biểu, download quy chế đào tạo tín chỉ, … Có file xml tên SinhVien.xml sau: 1 Ten test 2 HY 9573490574 true 68 4 Nguyễn Thị Hồng Cẩm hongcam 1 Hà Nội 0924783743 true 3 Trần Thị Hoa hoa 2 Hà Nội 0435668339 true 4 Nguyen Xuan Hai hong 1 Hà Nội 0599898982 true 5 Nguyễn Linh Đa linhda 1 Hà Nội 09237428 true Hiển thị file SinhVien.xml dạng bảng: 69 Hình 4.7 Hiển thị file XML dạng bảng Hiển thị file SinhVien.xml dạng hình cây: Hình 4.8 Hiển thị file XML dạng hình 70 KẾT LUẬN Việc chuyển đổi CSDL quan hệ sang tài liệu XML ngược lại mà không cần quan tâm đến việc bảo toàn ràng buộc liệu, hay việc chuyển đổi có bảo toàn ràng buộc việc xét ràng buộc liệu thông qua ràng buộc khóa nghiên cứu Tuy nhiên, với phương pháp thứ rõ ràng tính ứng dụng thực tiễn không cao, CSDL tồn giới thực luôn có ràng buộc lẫn Với phương pháp thứ hai thực khó khăn, phức tạp để xét hầu hết tất ràng buộc phụ thuộc liệu CSDL quan hệ Các kết đạt luận văn: • Trình bày tổng quan cấu trúc tài liệu XML, định nghĩa kiểu tài liệu DTD, lược đồ, mô hình đối tượng tài liệu DOM, phân tích tài liệu XML theo mô hình DOM khái niệm CSDL quan hệ • Giới thiệu phương pháp luận chuyển tài liệu XML sang CSDL quan hệ ngược lại • Đưa thuật toán tích hợp hệ thống sở liệu quan hệ XML • Cài đặt thuật toán ngôn ngữ lập trình C# môi trường ASP.NET, sở xây dựng ứng dụng trang web “Đăng ký học tín chỉ” trường Đại học Hàng Hải Việt Nam có tính thiết thực cao Một số hạn chế luận văn: • Hệ thống tích hợp sở liệu SQL Server XML • Cơ sở liệu sử dụng chương trình chưa đầy đủ Hướng nghiên cứu tiếp theo: • Luận văn phát triển để hỗ trợ cho việc phục hồi CSDL quan hệ gốc từ tài liệu XML chuyển đổi trình trao đổi liệu tích hợp CSDL quan hệ vào tài 71 liệu XML theo nhu cầu sử dụng liệu người dùng mà đảm bảo đầy đủ phụ thuộc liệu thông qua việc kết hợp sử dụng truy vấn từ SQL Server trình tích hợp • Hoàn thiện hệ thống “Đăng ký học tín ” trường Đại học Hàng Hải Việt Nam” nhằm đáp ứng cao yêu cầu sử dụng riêng trường Do thời gian khả có hạn, luận văn nhiều thiếu sót, em mong nhận góp ý, dẫn thêm Thầy Cô, bạn bè để em xây dựng ứng dụng hoàn thiện Một lần em xin chân thành cảm ơn Thầy hướng dẫn PGS.TS Đoàn Văn Ban, Thầy Cô khoa tạo điều kiện thuận lợi để luận văn hoàn thành thời hạn 72 TÀI LIỆU THAM KHẢO Tiếng Việt [1] Nguyễn Kim Anh (2004), Nguyên lý hệ sở liệu, NXB Thống kê [2] Nguyễn Phương Lan, Hoàng Đức Hải (2006), XML – Nền tảng ứng dụng, NXB Lao động – Xã hội [3] Phương Lan, Hoàng Đức Hải (2002), Lập trình Windows với C# Net, NXB Lao động – Xã hội [4] Phương Lan, Hoàng Đức Hải (2005), Giáo trình nhập môn XML, NXB Lao động – Xã hội [5] Phạm Hữu Khang (2005), Lập trình ASP.Net 2.0, NXB Lao động – Xã hội [6] Nguyễn Tiến, Đặng Xuân Hường, Nguyễn Văn Hoài, Nguyễn Tuấn Ngọc (2001), Nhập môn XML thực hành ứng dụng, NXB Thống kê [7] PGS.TS Lê Tiến Vương (2005), Nhập môn sở liệu quan hệ, NXB Thống kê Tiếng Anh [8] Benoit Marchal (2000), XML by Example, Printed in the United States of America [9] Dino Esposito (2003), Applied XML Programming of microsoft.NET, Printed and bound in the United States of America [10] www.xml.com [11] http://www.w3schools.com/ ... tích hợp hệ thống sở liệu XML [6] 2.1 Phương pháp luận Tích hợp sở liệu quan hệ XML nghiên cứu cách chuyển đổi sở liệu quan hệ thành tài liệu XML ngược lại, chuyển tài liệu XML sở liệu quan hệ. .. mô hình DOM 1.2 Cơ sở liệu quan hệ 1.2.1 Cấu trúc sở liệu quan hệ Một sở liệu quan hệ tập nhiều quan hệ, quan hệ bảng hai chiều bao gồm cột hàng (gọi bảng liệu hay quan hệ) Bảng liệu hình thức... kiến thức XML, chương trình bày kiến thức sở liệu quan hệ, khái niệm, cấu trúc, ràng buộc toàn vẹn CSDL quan hệ 28 CHƯƠNG 2: TÍCH HỢP CÁC HỆ THỐNG CƠ SỞ DỮ LIỆU QUAN HỆ VÀ XML Các sở liệu ngày

Ngày đăng: 16/04/2017, 17:28

TỪ KHÓA LIÊN QUAN

w