Siêu dữ liệu (Metadata)

Một phần của tài liệu Phân loại tài liệu theo mô hình thuyết vạn vật hấp dẫn (Trang 29 - 31)

“Siêu dữ liệu (metadata hoặc meta data) là dữ liệu của dữ liệu”. [6] Trong xử lý dữ liệu thì metadata của một dữ liệu nào đó được định nghĩa là một dữ liệu cung cấp các thông tin, thuộc tính, cấu trúc hoặc những dữ liệu khác về dữ liệu đó – hay còn gọi là “siêu dữ liệu”.

Mục đích đầu tiên và yêu cầu của metadata là góp phần mô tả một cách có hiệu quả các đối tượng. Sự phát triển mạnh mẽ của Internet đã tạo ra sự bùng nổ của các loại dữ liệu số (văn bản, âm thanh, hình ảnh, tài liệu đa phương tiện). Những tài

liệu hay các đối tượng này có thể truy cập được trên mạng Internet, song việc tổ chức lưu trữ hay tìm kiếm chúng một cách hiệu quả và khoa học là hết sức khó khăn. Để giải quyết vấn đề này người ta đã đưa ra giải pháp sử dụng metadata.

Với chuẩn cấu trúc mô tả đơn giản (RDF - Resource Description Format; DC – Dublin Core, MARC21/UNIMARC, ISO-2709, …)[6],[12] nên metadata được sử dụng rộng rãi cho nhiều hệ thống cũng như ngôn ngữ. Tuy nhiên trong các ứng dụng tin học, người ta không xây dựng metadata theo chuẩn quy định nào đó (như chuẩn hay dùng trong lĩnh vực thư viện là Dublin Core có 15 thành phần) mà cấu trúc lại những thành phần phục vụ cho các xử lý nghiệp vụ của ứng dụng.

Theo như các định nghĩa 3.3, các nút của taxonomy tương ứng là các khái niệm độc lập, có định nghĩa đầy đủ, có những thông tin đi kèm rõ ràng. Để đảm bảo được điều đó ta xây dựng các metadata cho các nút của taxonomy. Ví dụ hình 3.6 là một dạng metadata gồm chỉ có các thành phần đơn giản.

Hình 3.6: Một metadata cho khái niệm của taxonomy

Trong đó thuật ngữ (term) tương ứng với khái niệm trong taxonomy, có một mã (code) duy nhất trong cấu trúc, được định nghĩa (definition) và một số thông tin tham chiếu khác. Bên cạnh đó metadata này cũng chứa dữ liệu liên quan đến hình thành cấu trúc cây như mã code của nút cha ….

Một phần của tài liệu Phân loại tài liệu theo mô hình thuyết vạn vật hấp dẫn (Trang 29 - 31)