Cấu trúc của file RSS

Một phần của tài liệu Xây dựng ứng dụng tổng hợp tin tức từ các trang tin và chương trình đọc tin trên thiết bị di động Android (Trang 43)

Cấu trúc của một file RSS chuẩn 2.0: <?xml version="1.0"?>

<rss version="2.0">

<!== Tất cả nội dung nằm trong thẻ channel ==> <channel>

<!== Bắt đầu là các thẻ mô tả channel như title, link,

description,... ==>

<title>Tiêu đề channel</title> <link>Link của channel</link>

<description>Mô tả về channel</description> <pubDate>Ngày đăng</pubDate>

<docs>Tài liệu mô tả</docs>

<generator>Chương trình sinh RSS</generator>

<!== Ngoài ra còn có một số thông tin khác về channel ==> <!== Danh sách các tin được đặt trong các thẻ item ==>

<!== Một item gồm một số thẻ chính như item, link, description,

pubDate ==>

<item>

<title>Tiêu đề tin tức</title>

<link>Link dẫn tới trang chứa tin chi tiết</link>

<description>Nội dung tin đơn giản</description>

<pubDate>Ngày tin được xuất bản</pubDate>

<!== Ngoài ra còn có một số thẻ khác như guiID, image,...

==>

</item>

<!== Một item khác ==> <item>

<title>Tiêu đề tin tức</title>

<link>Link dẫn tới trang chứa tin chi tiết</link>

<description>Nội dung tin đơn giản</description>

</item> </channel> </rss>

34

Một ví dụ về file RSS từ trang báo eva.vn:

<?xml version="1.0" encoding="UTF-8"?>

<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom">

<channel>

<title>EVA.vn - Thế giới phụ nữ Việt Nam</title> (adsbygoogle = window.adsbygoogle || []).push({});

<link>http://eva.vn/</link>

<description>Bao phu nu : Thế giới phụ nữ</description>

<image>

<url>http://eva.vn/upload/footer/2011-08- 31/20110831164241_logoeva.jpg</url>

<title>EVA.vn - Thế giới phụ nữ Việt Nam</title> <link>http://eva.vn/</link>

</image>

<copyright>(c)24h.com.vn</copyright>

<generator>Pham Trung DZUNG-dungpt@24h.com.vn</generator>

<item>

<title>Vợ sắp cưới bỗng chạy theo tình cũ</title>

<description>Em nói xin lỗi tôi vì thật lòng em không yêu tôi. Em

muốn ở bên người đàn ông em đã chờ đợi suốt mấy năm.</description>

<link>http://eva.vn/eva-tam/vo-sap-cuoi-bong-chay-theo-tinh-cu-

c66a142299.html</link>

<pubDate>Sun, 23 Jun 13 15:18:09 +0700</pubDate>

</item> <item>

<title>Ai trong đời chả vài lần rung động</title>

<descriptionGiờ thì em đã hiểu, ai trong đời cũng có vài lần rung

động. Dù em đã toàn tâm toàn ý yêu thương một người nhưng không có nghĩa là trái tim em không xốn xang trước người khác.</description>

<link>http://eva.vn/eva-tam/ai-trong-doi-cha-vai-lan-rung-dong-

c66a142216.html</link>

<pubDate>Sun, 23 Jun 13 07:17:00 +0700</pubDate>

</item> <item> </channel> </rss>

Hình 5.1 là một ví dụ về chương trình đọc tin RSS Snaffer đọc nội dung RSS trong ví dụ trên.

35

Hình 5.1. Ví dụ đọc file RSS bằng chương trình Snarfer

Atom 5.2.

5.2.1. Giới thi u

Tên Atom áp dụng cho một cặp tiêu chuẩn web liên quan: Atom Syndication

Format là một ngôn ngữ XML được sử dụng cho các nguồn cấp web và Atom Publishing Protocol (AtomPub hoặc APP) là một giao thức dựa trên HTTP đơn (adsbygoogle = window.adsbygoogle || []).push({});

giản để tạo và cập nhật tài nguyên web.

Web feeds (cung cấp nội dung trang web) cho phép các chương trình phần mềm kiểm tra các bản cập nhật được trên trang web. Để là một nguồn cấp nội dung web, chủ sở hữu trang web có thể sử dụng phần mềm chuyên dụng (chẳng hạn như một hệ thống quản lý nội dung) công bố một danh sách (feeds) của các bài viết gần đây hoặc nội dung trong một tiêu chuẩn, theo định dạng máy có thể đọc được (machine-readable). Nguồn cấp có thể được tải về bằng các chương trình sử dụng

36

nó, như các trang web có nội dung tổng hợp từ các nguồn cấp, hoặc bằng các chương trình đọc nguồn cấp nội dung cho phép người dùng Internet đăng ký nhận nguồn cấp dữ liệu và xem nội dung của họ.

Một nguồn cấp dữ liệu có chứa các mục, có thể là các tiêu đề, bài báo toàn văn, trích dẫn, tóm tắt, và/hoặc các liên kết đến nội dung trên một trang web, cùng với siêu dữ liệu khác nhau.

Định dạng Atom đã được phát triển như là một thay thế cho RSS. Ben Trott, một người ủng hộ định dạng Atom, tin rằng RSS có những hạn chế và sai sót, chẳng hạn như thiếu tính đổi mới và tương thích ngược, và đó là những lợi thế để một thiết kế mới ra đời.

Những người đề xuất định dạng mới đã thành lập IETF Atom Publishing Format and Protocol Workgroup. Định dạng cung cấp thông tin Atom đã được công bố như là một tiêu chuẩn dự kiến của IETF trong RFC 4287 (tháng 12 năm 2005), và Atom Publishing Protocol đã được công bố trong RFC 5023 (tháng 10 năm 2007).

Một phần của tài liệu Xây dựng ứng dụng tổng hợp tin tức từ các trang tin và chương trình đọc tin trên thiết bị di động Android (Trang 43)