Mục đích của Metadata

Một phần của tài liệu Tài liệu Nghiên cứu áp dụng các chuẩn lưu trữ trao đổi thông tin trong hệ thống thông tin khoa học và công nghệ quốc gia pptx (Trang 97 - 99)

- Đảm bảo thuận lợi tối đa cho ng−ời dùng tin, giúp họ dễ nhận biết, đọc và hiểu đ−ợc tên CQTC, không gây những lầm lẫn đáng tiếc.

B. Tr−ờng hợp viết tắt tên CQTC Việt Nam

1.2. Mục đích của Metadata

Metadata có nhiều mục đích

Mục đích đầu tiên và cốt yếu nhất của Metadata là góp phần mô tả và tìm lại các tài liệu điện tử.

Theo G. Hodge trong hoạt động thông tin th− viện, đ−ợc sử dụng cho bất cứ sơ đồ hình thức để mô tả nguồn tin, áp dụng cho mọi dạng đối t−ợng, là số hay không phải đối t−ợng số. Thí dụ, trong hoạt động th− viện truyền thống, biên mục là một dạng Metadata; MARC21 và quy tắc AACR2 là tiêu chuẩn Metadata cho tài liệu truyền thống.

Sự phát triển mạnh mẽ của Internet nhờ CNTT&TT đã tạo ra một sự phát triển bùng nổ của các loại dữ liệu đa dạng ở dạng số, từ văn bản, hình ảnh, âm thanh, hình ảnh động, tài liệu đa ph−ơng tiện. Những tài liệu số này có thể truy cập đ−ợc trên Internet song việc tìm kiếm chúng một cách hiệu quả và khoa học nh− với các hệ thống thông tin trực tuyến là hết sức khó khăn. Những hệ thống máy tìm tin ban đầu chỉ thực hiện việc định chỉ số theo toàn văn. Tuy nhiên việc này là cho hiệu quả tìm kiếm không cao, không thể thực hiện tìm kiếm theo các yếu tố đặc thù (nh− tìm theo chủ đề, theo tác giả, ...). Để góp phần tăng c−ờng chất l−ợng tìm kiếm các tài liệu số nói trên trên mạng Internet, ng−ời ta đã đ−a ra giải pháp sử dụng Metadata. Metadata có mục đích đầu tiên là mô tả nguồn tin điện tử, giúp cho việc xử lý tự động đ−ợc dễ dàng hơn, hỗ trợ cho việc phát

hiện nguồn tin sau này. Nh− vậy có thể thấy Metadata có những mục đích giống nh− việc mô tả th− mục truyền thống.

Trong hoạt động thông tin - th− viện truyền thống, công tác mô tả tài liệu đã đ−ợc phát triển từ lâu. Đó chính là mô tả th− mục, biên mục. Công tác biên mục, mô tả th− mục, xử lý thông tin đã tạo ra những phiếu mục lục th− viện hoặc mô tả th− mục chứa các dữ liệu mô tả đối t−ợng (nh− mô tả th− mục cho sách, cho tạp chí). Do đó các phiếu th− viện có thể đ−ợc xem nh− một dạng "Metadata". Với việc tự động hoá công tác biên mục bằng ứng dụng máy tính điện tử để xây dựng cơ sở dữ liệu th− mục, những phiếu th− mục đã xử lý lại để nhập vào cơ sở dữ liệu, trở thành dạng máy tính đọc đ−ợc. Phiếu th− mục đ−ợc thay thế bằng biểu ghi th− mục. Nh− vậy thành phần "Metadata" còn có thể đ−ợc trình bày trong trong biểu ghi. Những biểu ghi này có thể đ−ợc coi là biểu ghi Metadata (metadata record) của các đối t−ợng đ−ợc cơ sở dữ liệu quản lý. Với tài liệu truyền thống trên giấy, thông tin mô tả đ−ợc tạo ra bởi ng−ời xử lý thông tin và đ−ợc bố trí nằm ngoài đối t−ợng mà nó mô tả (thí dụ, trên phiếu th−

mục của mục lục th− viện, trong biểu ghi của CSDL). Chẳng hạn, các yếu tố dữ liệu của một biểu ghi theo khổ mẫu MARC có thể đ−ợc xem nh− là Metadata của một đối t−ợng mô tả. Nhờ những yếu tố mô tả nh− vậy, ng−ời ta có thể xác định và tìm kiếm lại đ−ợc tài liệu một các chính xác theo một vài yếu tố.

Với sự phát triển của công nghệ thông tin, xuất bản điện tử và Internet, ngày càng có nhiều tài liệu điện tử xuất bản và đ−ợc đ−a lên trên mạng Internet. Nguồn tài liệu điện tử này phân tán trên mạng và nhiều đến mức không một cá nhân hoặc tổ chức nào có thể xử lý hết đ−ợc chúng bằng cách thủ công nh− đã và đang áp dụng với tài liệu xuất bản theo ph−ơng thức truyền thống (trên giấy). Để xử lý đ−ợc hết tài liệu điện tử phân tán, ng−ời ta phải áp dụng các ph−ơng pháp tự động - sử dụng các ch−ơng trình đặc biệt (đ−ợc gọi theo nhiều cách khác nhau nh− robots, crawlers, spiders,...). Một vấn đề nảy sinh là tài liệu số (điện tử) đ−ợc rất nhiều ng−ời tạo ra, thông th−ờng không tuân thủ những quy

định xuất bản truyền thống, không có những quy tắc nhất định giúp cho phép nhận dạng tự động các yếu tố mô tả thông th−ờng (nh− tác giả, địa chỉ xuất bản, thông tin về khối l−ợng,v.v..). Cần thiết phải có những quy định thống nhất để các ch−ơng trình tự động nhận dạng và xử lý chúng đúng theo các yêu cầu nghiệp vụ. Vì vậy ng−ời ta đề xuất ý t−ởng sử dụng những quy định đ−ợc gọi là các quy định về Metadata. Những phần tử này sẽ đảm bảo xác định rõ các phần tử của dữ liệu, giúp hệ thống nhận dạng đúng đoạn dữ liệu nào là nhan đề, đoạn dữ liệu nào là tác giả. Hiện nay, nhiều ch−ơng trình của máy tìm tin chỉ định chỉ số dựa vào một số thành phần hạn chế nh− nhan đề hoặc toàn văn nên không hỗ trợ những tìm kiếm đặc thù (thí dụ theo tác giả, theo chủ đề, theo lĩnh vực,....). Vì thế những yếu tố Metadata sẽ tạo điều kiện cho các ch−ơng trình có thể định chỉ số tự động theo một số yếu tố xác định. Để là nh− vậy ng−ời ta phải đ−a thêm vào tài liệu điện tử phần tử bổ sung để tăng c−ờng việc mô tả tài nguồn tin. Các công cụ định chỉ số tự động sẽ đ−ợc lập trình để nhận dạng các phần tử này, xác định thuộc tính của chúng và định chỉ số chúng căn cứ thuộc tính đ−ợc quy định, từ đó hỗ trợ tìm kiếm theo những thuộc tính đặc thù.

Mục đích khác của Metadata là hỗ trợ cho việc sử dụng hiệu quả nguồn tin điện tử. Một khi nguồn tin đ−ợc tìm đ−ợc trong môi tr−ờng điện tử, Metadata cung cấp cho ng−ời sử dụng những thông tin về kỹ thuật, về khuôn khổ kinh doanh (bản quyền, quyền truy cập,...).

Một mục đích nữa của Metadata là đảm bảo sự liên tác (interoperability) giữa các hệ thống. Những sơ đồ siêu dữ đ−ợc thống nhất sẽ giúp cho các hệ thống có thể nhận dạng đúng các yếu tố, có thể chuyển đổi dữ liệu dễ dàng, đảm bảo hoạt động trên mạng hiệu quả hơn.

Một phần của tài liệu Tài liệu Nghiên cứu áp dụng các chuẩn lưu trữ trao đổi thông tin trong hệ thống thông tin khoa học và công nghệ quốc gia pptx (Trang 97 - 99)

Tải bản đầy đủ (PDF)

(189 trang)