Na tuto wiki již prosím nepřispívejte a přesuňte svou aktivitu na WikiKnihovnu.
Vše, co bylo zde, najdete tam, jen je bohužel potřeba znovu si vytvořit účet.

Podrobnosti!

RSS

Z Kisk

Přejít na: navigace, hledání

Ikonku RSS nelze přehlednout, ať už na webových stránkách nebo v prohlížečích. Jednoduše řečeno, RSS je formát umožňující distribuci novinek informujících o změnách na jednotlivých stránkách, které RSS podporují.

Ikonka RSS ve Firefoxu

Obsah

Co je RSS

RSS je zkratkou výrazu Really Simple Syndication, ale můžeme se setkat i s jiným označením jako např. RDF Site Summary (verze 0.90 a 1.0) nebo Rich Site Summary (verze 0.91). Jde o standardizovaný formát založený na XML, který slouží k prezentaci informací především z často aktualizovaných webových stránek, zpravodajských serverů a blogů. Uživatelům tato technologie pomáhá sledovat obsah stránek, aniž by je museli otevřít v prohlížeči. Stačí si pouze přidat RSS kanál do své RSS čtečky. V ní se pak zobrazují titulky aktuálních článků z daného serveru s odkazem na plný text, případně s dalšími údaji jako popisek, datum vydání nebo datum poslední aktualizace apod. Správci webů mají zase jednoduchý nástroj pro přilákání uživatelů na své stránky a tím k jejich propagaci.

Princip fungování RSS

Celé workflow si vysvětlíme na příkladu zpravodajské služby. Proces začíná u autora, který napíše článek a prostřednictvím publikačního systému jej vloží na stránky. Ve chvíli, kdy je článek zpřístupněn veřejnosti, se vytvoří XML dokument dle specifikace RSS se všemi aktuálními články, tzn. ze souboru se vymažou staré články, přidají se nové, připojí se datum publikování, případně datum poslední aktualizace a soubor se zaktualizuje na internetu. Samozřejmostí je, aby byl soubor dostupný stále na stejné adrese a pod stejným názvem, jinak by si uživatelé museli neustále měnit URL adresu ve své čtečce. Tím končí role vydavatele a všechny aktuální články jsou dostupné online. Nyní do procesu vstupuje samotný uživatel. Pokud se mu zdroj líbí a rozhodne se odebírat nové články, uloží si jeho URL do své RSS čtečky. Ta se pak v pravidelných intervalech připojuje ke zdroji a pokud zjistí jakoukoliv změnu, stáhne nové články do čtečky uživatele. Ten tak nemusí pravidelně procházet všechny své oblíbené webové stránky, ale stačí mu sledovat pouze svou RSS čtečku. Pokud objeví článek, který ho zajímá, klikne na něj a článek se automaticky otevře. U zpravodajských serverů, blogů a webových stránek poskytující obsah zdarma se automaticky zobrazí plný text. U vydavatelů časopisů jsou k dispozici alespoň informace o článku (název, autor, rok, ročník, číslo), případně krátká anotace. Má-li uživatel zaplacen přístup k plným textům, zobrazí se mu samozřejmě přímo fulltext.

Historie RSS kanálů

Již před RSS existovaly pokusy a projekty v podobném směru. Není překvapivé, že i zde sehráli důležitou roli 2 největší hráči na poli informačního průmyslu, Apple a Microsoft. Zatímco Apple vyvíjel v letech 1995 - 1997 Meta Content Framework (MCF), Microsoft v roce 1997 uvolnila Channel Definition Format (CDF). Ani jeden z projektů se však nedočkal širšího přijetí.

Pojmenování RSS přišlo až v roce 1999 s RDF Site Summary ve verzi známé pod označením 0.9, která byla nabídnuta společností Netscape a byla určena pro její portál My Netscape. V roce 2001 přestal být tento formát po redesignu portálu funkční.

Jeho dalšího vývoje se poté ujala pracovní skupina/mailing list RSS-DEV - tato skupina vývojařů již v prosinci roku 2000 uvolňuje verzi RSS 1.0, která byla ještě stejně jako verze 0.9 založena na specifikaci RDF. Tato verze již byla ale více modulární a přebírala některé prvky takových standardů jako např. Dublin Core.

Jiným směrem se od verze 0.9 vydal Dave Winer, který si již v roce 1997 sám vytvořil novinkový informančí kanál pro svůj blog Scripting News za použití XML. V roce 1999 přichází Dan Libby s RSS (znamenající v tomto případě Rich Site Summary) ve verzi 0.91, která je zjednodušením verze 0.9 a zároveň obsahuje prvky převzaté z Winerova formátu. Winer sám pak devatenáct dní po vydání verze 1.0 skupinou RSS-DEV pak přichází z upravenou verzi 0.92, následují verze 0.93 a 0.94. V září roku 2002 však Winer uvolňuje verzi RSS 2.0 (tentokrát zkratka znamená Really Simple Syndication), která finálním nástupcem verze 0.92. Hlavní změnou je povolení volitelných rozšíření RSS kanálů pomocí XML namespaces.

Od roku 2002 poskytuje svým čtenářům RSS kanál The New York Times, podle samotného Winera se tak zasloužil o uznání RSS jako standardu a jeho masového rozšíření, které vedlo až k dnešnímu dni, kdy jsou RSS považovány za nepostradatelnou součást jakékoliv webové stránky. Potvrdilo se, že tento nástroj velice užitečný jak pro jejich poskytovatele, tak i pro jejich konzumenty/čtenáře - podrobněji viz kapitola Proč vytvářet RSS kanály? a Čtení RSS kanálů.

V roce 2003 předává Winer vlastnictví RSS 2.0 specifikace Berkmanovu centru pro internet a společnost na Harvardu.

Otevřenější alternativou je pak formát ATOM, který vznikl v roce 2003 především z potřeby zabudovat do novinkových kanálů tyto vlastnosti:

  • neutrálnost/nezávislost na prodejcích
  • snadnost implementace
  • možnost volného vyvíjení verzí ATOMu
  • má mít jasnou a do podrobna promyšlenou specifikaci

Formát ATOM si získal mnoho významných příznivců. V roce 2005 se ATOM ve verzi 1.0 stává standardem podporováným/navrženým společností Internet Engineering Task Force (IETF), což tomuto formátu dodalo velkou váhu a dnes je již také široce podporován.

Obecně lze říci, že za masivní zpopularizování RSS/ATOM kanálů je zodpovědné rozšíření systému podporující snadné blogování a automatickou tvorbu těchto kanálů. Dalším impulsem byl poté fenomén podcastingu, který je na principu novinkových kanálů přímo založen.

Formáty

Při popisu jednotlivých formátů nevynechám ani již výše zmíněný ATOM, zejméno kvůli jeho oficiální podpoře. Formát RSS 2.0 se prosazuje nejvíce (díky tomu, že jej podporují takové společnosti jako sjou Apple a Microsoft). Často bývá ale zdůrazňována nutnost všeobecné podpory RSS kanálů a z toho důvodu bývá doporučován formát RSS 1.0, protože s ním většina čteček/agregátů nemá žádné problémy.

Podstatné je, aby byl kanál validní (k tomu slouží validátory, jako např. feedvalidator.org). Jakmile je jednou vše na záčátku správně nastavene, lze proces genoravání RSS kanálu svěřit automatizovaným procesům uvnitř systému pro tvorbu webových stránek/blogů, tak aby se sám autor mohl více věnovat samotnému obsahu jeho stránek než technickým specifikacím.

  • RSS 2.0 (Really Simple Syndication):
    • nejrozšířenější formát, velice stabílní xml formát, rozšíření možná jen skrze namespaces, což předpokládá vlastnictví názvu specifických polí
    • formát udržován Harvardem - blogs.law.harvard.edu/tech/rss
    • Creative Commons licence, umožňujucí vyvíjet nové nástroje
  • RSS 1.0 (RDF Site Summary):
    • RDF/XML formát - slovní zásoba založená na formalizovaném modelu, který opakován XML
    • formát je udržován skupinou nadšenců soustředících se zejména kolem mailové konforence Yahoo Group
  • ATOM:
    • vytvořeno při používání wiki stránek, kdy vznikla potřeba uživatelů být informován o změnách na stránkách
    • na vývoj dohlíží Internet Engineering Task Force (IETF), mezinárodní organizací pro standardizaci

Verze RSS

Z čeho se informační kanál (RSS Feed) skládá?

  • každý kanál je složen z určitého počtu samostatných položek - název, obsah, kategorie, autor a datum
  • komplexní kanál pak obsahuje navíc informace o zdroji, datu poslední aktualizace, četností aktualizací, majiteli atd.
  • jen některé elementy mají všechny 3 výše uvedené typy společné:
    • Obalové elementy (Container Elemnets) - obsahují informace, které se v konkrétním kanále (Feed) objevují jen jednou. Tyto jsou ty nejčastěji se vyskutující a často požadované:
      • link - odkaz na sídlo webové stránky/blogu
      • title - název stránky
      • description - popis stránky, obvykle její podnázev (v ATOMu se toto pole nazývá subtitle)
      • author - liší se dle verzí: v ATOMu toto pole obsahuje autorovo jméno a email, v RSS 1.0 je obvykle nahrazováno polem dc:creator, v RSS 2.0 je nahrazeno polem webMaster a managingEditor (emailové adresy)
      • date - v RSS 1.0 (pole dc:date) má význam data poslední aktualizace kanálu, v ATOMu se pole nazývá updated, v RSS 2.0 lastBuildDate
      • generator - nástroj na generování kanálu, v RSS 1.0 se používá název generatorAgent
      • copyright - informace o vyhrazených autorských právech
      • language - specifakace jazyka dokumentu
      • id - specifické pole ATOMu, unikátní identifikátor stránky/blogu
      • image - ikona pro konkrétní informační kanál
    • Elementy jednotlivých příspěvků/položek (Entry Elemnets) - každý nový příspěvěk na webové stránce/blogu má svůj obraz v RSS kanálu (v RSS 1.0 i 2.0 jsou uvnitř pole item, v ATOMu se pole jmenuje entry:
      • title - název nového příspěvku/článku
      • link - odkaz na konkrétní příspěvek
      • guid - jedinečný identifikátor, v ATOMu je to id
      • description - popis nebo resumé příspěvku, v ATOMu summary
      • content - plný obsah dokumentu v HTML nebo XHMTL
      • autor - autor příspěvku v ATOMu, v RSS 1.0 i 2.0 je to pole dc:creator
      • pubDate - issued v ATOMu, dc:date v RSS 1.0
      • category - kategorie příspěvku

Jak jednotlivé formáty vypadají a jak se vytváří?

RSS kanály jsou obvykle automaticky generované softwarem, ve kterém je tvořen zbývající obsah webové prezentace. Zde uvedené příklady slouží pouze jako názorná úkazka struktury jejich zápisu:

  • RSS 1.0:
<?xml version="1.0"?>
<rdf:RDFxmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns="http://purl.org/rss/1.0/">
<channel rdf:about="http://www.xml.com/xml/news.rss">
<title>XML.com</title>
<link>http://xml.com/pub</link>
<description>
XML.com features a rich mix of information and services
for the XML community.
</description>
<image rdf:resource="http://xml.com/universal/images/xml_tiny.gif" />

<items>
<rdf:Seq>
<rdf:li resource="http://xml.com/pub/2000/08/09/xslt/xslt.html" />
<rdf:li resource="http://xml.com/pub/2000/08/09/rdfdb/index.html" />
</rdf:Seq>
</items>

</channel>

<image rdf:about="http://xml.com/universal/images/xml_tiny.gif">
<title>XML.com</title>
<link>http://www.xml.com</link>
<url>http://xml.com/universal/images/xml_tiny.gif</url>
</image>

<item rdf:about="http://xml.com/pub/2000/08/09/xslt/xslt.html">
<title>Processing Inclusions with XSLT</title>
<link>http://xml.com/pub/2000/08/09/xslt/xslt.html</link>
<description>
Processing document inclusions with general XML tools can be
problematic. This article proposes a way of preserving inclusion
information through SAX-based processing.
</description>
</item>

</rdf:RDF>

- převzato z http://web.resource.org/rss/1.0/spec

  • RSS 2.0:
<?xml version="1.0"?>
<rss version="2.0">
  <channel>
    <title>Lift Off News</title>
    <link>http://liftoff.msfc.nasa.gov/</link>
    <description>Liftoff to Space Exploration.</description>
    <language>en-us</language>
    <pubDate>Tue, 10 Jun 2003 04:00:00 GMT</pubDate>
    <lastBuildDate>Tue, 10 Jun 2003 09:41:01 GMT</lastBuildDate>
    <docs>http://blogs.law.harvard.edu/tech/rss</docs>
    <generator>Weblog Editor 2.0</generator>
    <managingEditor>editor@example.com</managingEditor>
    <webMaster>webmaster@example.com</webMaster>
    <ttl>5</ttl>
 
    <item>
      <title>Star City</title>
      <link>http://liftoff.msfc.nasa.gov/news/2003/news-starcity.asp</link>
      <description>How do Americans get ready to work with Russians aboard the
        International Space Station? They take a crash course in culture, language
        and protocol at Russia's Star City.</description>
      <pubDate>Tue, 03 Jun 2003 09:39:21 GMT</pubDate>
      <guid>http://liftoff.msfc.nasa.gov/2003/06/03.html#item573</guid>
    </item>
 
    <item>
      <title>Space Exploration</title>
      <link>http://liftoff.msfc.nasa.gov/</link>
      <description>Sky watchers in Europe, Asia, and parts of Alaska and Canada
        will experience a partial eclipse of the Sun on Saturday, May 31st.</description>
      <pubDate>Fri, 30 May 2003 11:06:42 GMT</pubDate>
      <guid>http://liftoff.msfc.nasa.gov/2003/05/30.html#item572</guid>
    </item>
 
    <item>
      <title>The Engine That Does More</title>
      <link>http://liftoff.msfc.nasa.gov/news/2003/news-VASIMR.asp</link>
      <description>Before man travels to Mars, NASA hopes to design new engines
        that will let us fly through the Solar System more quickly.  The proposed
        VASIMR engine would do that.</description>
      <pubDate>Tue, 27 May 2003 08:37:32 GMT</pubDate>
      <guid>http://liftoff.msfc.nasa.gov/2003/05/27.html#item571</guid>
    </item>
 
    <item>
      <title>Astronauts' Dirty Laundry</title>
      <link>http://liftoff.msfc.nasa.gov/news/2003/news-laundry.asp</link>
      <description>Compared to earlier spacecraft, the International Space
        Station has many luxuries, but laundry facilities are not one of them.
        Instead, astronauts have other options.</description>
      <pubDate>Tue, 20 May 2003 08:56:02 GMT</pubDate>
      <guid>http://liftoff.msfc.nasa.gov/2003/05/20.html#item570</guid>
    </item>
  </channel>
</rss>

- převzato z http://en.wikipedia.org/wiki/RSS

  • ATOM:
<?xml version="1.0" encoding="utf-8"?>
<feed xmlns="http://www.w3.org/2005/Atom">
<title>Example Feed</title>
<link href="http://example.org/"/>
<updated>2003-12-13T18:30:02Z</updated>
<author>
<name>John Doe</name>
</author>
<id>urn:uuid:60a76c80-d399-11d9-b93C-0003939e0af6</id>

<entry>
<title>Atom-Powered Robots Run Amok</title>
<link href="http://example.org/2003/12/13/atom03"/>
<id>urn:uuid:1225c695-cfb8-4ebb-aaaa-80da344efa6a</id>
<updated>2003-12-13T18:30:02Z</updated>
<summary>Some text.</summary>
</entry>
</feed>

- převzato z http://www.mnot.net/rss/tutorial/

Přestože jsou RSS kanály generovány automaticky, na stánkách feedvalidator.org si můžete ověřit zda právě ten váš kanál je správně napsán a zda funguje optimálně.

Pokud systém pro tvorbu obsahu webových stránek neumožňuje automatické generování RSS kanálu, existují i jiné možnosti - např. je možné využít nástroje xpath2rss, který dokáže procházet webové stránky (HTML a XHTML dokumenty) a vybírat s nich relevatní data pro informační kanál, který pak vygeneruje.

Podpora informačních kanálů ze strany poskytovatelů internetových služeb

Opravdový rozmach RSS kanálu přišel až s rozšířením blogování, později podcastingem. Většina systému pro publikování na webu má dnes již funkci informačních kanálů implementovanou a tvoří jejich nedílnou součást - většinou také generují kanály hned ve všech třech výše zmíněných populárních formátech. Samozřejmostí již bývá také podpora zobrazování RSS kanálů na stránce/blogu.

Příklady:

  • Blogger - jeden z pionýrů webových serverů poskytujících platformu pro blogování, produkt firmy Google, podporuje ATOM a RSS 2.0
  • Drupal - plnohodnotný systém pro správu obsahu webových stránek (CMS - Content Mangagement System), více funkcí než nástroje pro blogování, podpora všech tří výše zmíněných formátů
  • Wordpress - CMS podobně jako Drupal, podpora všech populárních formátů
  • Blog.cz - jeden z nejpopulárních českých nástrojů pro snadnou tvorbu blogů, podporuje ATOM i RSS, dne 27.5.2008 získala firma Jyxo (do té doby majitel blog.cz) nového majitele - firmu CET 21, s.r.o., provozovatele televize Nova a člena nadnárodní skupiny CME, což jen potvrzuje současný trend skupování nadějných internetových projektů
  • Bloguje.cz - podporuje RSS i ATOM

Pokud systém podporuje standardy a jeho RSS kanály mají validní formát, uživatel/čtenář by neměl poznat rozdíl mezi jednotlivými formáty - o čtení RSS kanálu viz níže.

Proč vytvářet RSS kanály?

Jak již bylo řečeno výše, používání RSS kanálů je dnes rozšířeným standrardem. Svým uživatelům/čtenářům je třeba vycházet vstříc a nabídnout jim to, na co jsou zvyklí. Sledování a implementace trendů je také nepostradatelným lákadlem na nové zákazníky/čtenáře. RSS kanály jsou vynikající formou styku se zákazníkem, kdy mu daná společnost dává o sobě pravidelně vědět, ať to jsou nové produkty či myšlenky.

Jakým způsobem lze čtenářům poskytnout odběr RSS kanálu?

  • návštěvník webové stránky/blogu bývá obvykle upozorněn na možnost odběru kanálu: odkazy typu "atom" nebo "rss" nebo oranžovými ikonkami (viz obr. 1)
  • kliknutím na odkaz se v závislosti na nastavení uživatelova systému buď zobrazí kanál přímo v prohlížeči, prohlížeč mu nabídne, co s kanálem můžete dělat (např. přidat do Google Reader) nebo se otevře aplikaci určené k čtení RSS kanálů
  • nejsnažším a nejúčinějším nástrojem je umístění specifické řádky autodiscovery do HEAD sekce každé webové stránky, ta odkazuje na RSS kanál. Prohlížeč (např. Firefox) pak čtenáři zobrazí v panelu adresy ikonku indikující přítomnost RSS kanálu a možnost jeho odběru - stačí pak kliknout přímo na ni. Takto by vypadalo užití funkce autodiscovery pro RSS 1.0:
<link rel="alternate" type="aplication/rdf+xml" title="Příspěvky v RSS 1.0" href="http://mojestranka.com/index.rdf"/>
  • agregátory RSS kanálů, používané k jejich čtení, by měly umožňovat dohledání kanálů pouze na základě zadání webové adresy stránky/blogu, návštěvník stánky tedy např. zaregistruje, že blog na kterém se zrovna nachazí umožňuje odběr novinek, jednoduše si zkopíruje adresu a vloží ji do své čtečky/agregátoru (pomocí Add Subscrtiption)
  • RSS/ATOM kanály jsou dnes již také přítomné ve většině databází (např. plnočlánková databáze EBSCO, PROQUEST) - na základě vyhledávacího dotazu nebo pojmu z indexu či tezauru je uživateli nabídnut odkaz na RSS kanál, který mu umožní sledovat změny ve výsledcích, tedy nové položky ve výsledném seznamu. Obdobou je pak přítomnost RSS v knihovních katalozích. Dříve více užívanou variantou podobné služby bylo odesílání těchto novinek mailem.

Čtení RSS kanalů

  • základní formou čtení kanálů je přímo uvnitř prohlížeče (např. Firefox) tak, že si jej přidáme do záložek - najetím myší na tuto záložku zobrazíte seznam názvů nových příspěvků daného webu/blogu - integrace kvalitnější čteček přímo do prohlížeče je také směr, kterým reagují vývojáři prohlížečů (např. Firefox 3, Internet Explorer 7) na masivní rozšíření používání RSS kanálů
  • využití některého z agregátoru/čteček RSS kanálů, v pravidelných intervalech kontrolují, zda konkrétní RSS kanály neobsahují nové položky, pokud ano, užitele na to upozorní
    • agregátory mají mnoho užitečných funkcí:
      • kombinace výstupu několika kanálů na jednom místě
      • automatické skrytí/označení již přečtených položek
      • kategorizace a tagování kanálů i jejich jednotlivých poležek
      • RSS kanál je možné u různých poskytovatelů agregátorů (např. Yahoo, Google) registrovat v určité kategorii, čtenáři pak může být na základě automatického vyhodnocení jeho preferencí nabídnut váš kanál, v kategoriích pak mohou být zařeny dle populiraty (počtu odebíratelů kanálů), hodnocení (hvězdičky) nebo mohou být zobrazy jen ty, které vybral poskytovatel agregátoru (Editorial Picks)
    • dělí se na:
      • softwarové čtečky (dostupné je velké množství variant pro všechny typy operačních systémů)
      • webové (web based) čtečky - jejich hlavní výhodou je to, že se nemusí instalovat a že je tudíž můžete používat na kterémkoliv počítači i s tím, že se zachová všechno vaše osobní nastavení (předpokládá se vytvoření vlastního účtu), nevýhodou pak je jejich omezená dostupnost v offline režimu - i zde se situace rychle vyvýjí a již dnes je např. možné za využítí nástroje Google Gears využívat čtečku Google Reader i bez funkčního připojení k internetu.
  • tvůrce webu/blogu si může zvolit, zda bude chtít do RSS kanálu vložit celý obsah příspěvku nebo jen resumé či úryvek - to může ovlivnit i to, zda čtenáři budou i nadále navštěvovat stránku, jenž je původním zdrojem kanálu RSS, navíc existují nejrůznější doplňky pro prohlížeč Firefox, umožňující zobrazení kompletní webové stránky uvnitř čtečky (např. Better GReader k tomu využívá uživatelských skriptů Greasemonkey)

Shrnutí výhod, které s sebou přináší využívání agregátorů a RSS čteček:

  • umožňují automatický odběr novinek ze zdrojů, které vás zajímají
  • organizace kanálů/jednotlivých příspěvků do kategorií, vybírání (hvězdičkou v Google Readeru)
  • možnost sdílet příspěvek s ostatními uživateli nebo zaslání příspěvku mailem
  • vyhledávání v příspěvcích odebíraných kanálů nebo v jejich kategoriích

Množství informací, které jsou dostupné na WWW neústale narůstá a je stále těžší sledovat větší počet zdrojů. RSS kanály představuji v tomto smyslu podstatné ulehčení, urychlení a zefektivnění čtení a organizace www zdrojů. Nejdůležitějším prvkem je bezesporu to, že dokáže integrovat různorodé zdroje v jednom místě, navíc s automatickým upozorněním na nové příspěvky - uživatel již nemusí opakovaně navštívit webovou stránku/blog, aby zjistil, zda obsahuje nějaké nové příspěvky. Podmínkou je samozřejmě existence RSS kanálu dané webové stránky, dnes to již však patří k jejich standardnímu vybavení.

RSS čtečky

Softwarové čtečky

Rozšíření do programů

Webové čtečky a mashup služby

Další odkazy

Související odkazy

Použité zdroje

Osobní nástroje