4. Tổng quan luận văn
2.4.1. Biểu diễn tài liệu XML theo mô hình DOM
Một cây được tạo bởi từ nhiều nút, mỗi nút lại là một cây chứa những nút khác. Nút lá thì không có con, vì thế nút này được dùng để hiển thị văn bản.
Lớp XmlDataDocument kế thừa lớp XmlDocument vì thế nó cũng có một số phương thức giống lớp XmlDocument.
Với mô hình DOM, một tài liệu XML được tổ chức dưới dạng một sơ đồ hình cây có cấu trúc tương tự như một cây thư mục trong Windows. Vì vậy mục đích chính của phần này là biểu diễn tài liệu XML theo mô hình DOM như minh họa sau (Hình 2.15):
Hình 2.15: Biểu diễn tài liệu XML theo mô hình DOM
* Thuật toán 2.1
+ Dữ liệu vào: Tập tài liệu XML
+ Dữ liệu ra: Tài liệu XML theo mô hình DOM
Tài liệu XML được đọc thông qua hình thức đọc một tập tin dữ liệu và được xây dựng theo dạng mô hình DOM [15] qua các bước sau:
Bƣớc 1: Truy cập và lấy phần tử gốc của tài liệu.
Bƣớc 2: Lấy danh sách tất cả các phần tử con của phần tử gốc.
Bƣớc 3: Mỗi phần tử con tìm được sẽ được gán một nhãn đặc trưng.
Bƣớc 4: Tìm các phần tử con được thực hiện theo phương pháp đệ quy.
Bƣớc 6: Xây dựng và lưu trữ đường dẫn tương ứng tới mỗi phần tử con trong tài liệu XML.
Bƣớc 7: Lấy tên các phần tử con và các giá trị thuộc tính của nó.
Bƣớc 8: Chuyển đổi thông tin về đường dẫn, nội dung của các phần tử sang dạng chuỗi để in ra màn hình dưới dạng một cây tài liệu. [12] [13]
+ Độ phức tạp thuật toán: Sử dụng phương pháp đệ quy để gán nhãn, sau đó chuyển thông tin về đường dẫn để in ra dưới dạng cây tài liệu. Độ phức tạp của thuật toán là O(n2)