4 minuten leestijd

Test RSS agregatoren / generatoren

Geplaatst op 3 juni 2009

Regelmatig kom ik op websites die interessant nieuws brengen, maar geen RSS feed hebben. Omdat ik niet zit te wachten op e-mailupdates, ben ik op zoek gegaan naar een programma dat deze RSS feeds voor mij kan maken.

Na het lezen van een artikel over RSS generatoren heb ik besloten om te kijken welke van de daar genoemde programma’s ik het prettigst vind in gebruik.

FEED43, part 1

FEED43 leek mij erg geschikt, dus ik besloot mij in te schrijven op de website. De bevestiging voor de inschrijving liet door onze spamfilter even op zich wachten. In mijn wachttijd, besloot ik ook de andere tools te testen.

feed43 part 1

Feedity.com

Voor feedity.com hoef je je niet in te schrijven, de feed die je krijgt is behoorlijk “schoon”. Hij filtert ‘de niet nieuws links’ zelf uit de feed. Je krijgt reclame te zien in de content van de RSS feed als je je niet inschrijft voor de website. De content van het artikel wordt niet geladen in de feed. Je ziet alleen de titel van het artikel. Wat mager voor de RSS feed.

feedity

Feedmarklet

Feedmarklet kwam niet met een goede feed terug, dus daar ga ik hier niet verder niet op in.

FeedYes

Vervolgens kwam ik bij FeedYes. Dit is een zeer geschikte tool als je snel en eenvoudig een feed wil maken. Met een Wizard schoon je de feed op en het eindresultaat is prima. Ook FeedYes vereist echter een login en je kunt de feed niet gebruiken, totdat je je hebt ingeschreven. Na registratie kun je direct inloggen. Het nadeel van registratie is de reclame mail die je eens per drie maanden krijgt. De feed is bij eerste gebruik iets schoner dan de feed van feedity.com, maar haalt tevens geen content op. Slechts de titel van het artikel is zichtbaar in de feed.

Ponyfish

Ponyfish is de enige generator waar geen registratie voor vereist is. De feed maak je door een aantal links te klikken die bijvoorbeeld forum entries zijn. Hiermee train je Ponyfish in het filteren van de juiste informatie. Zeer intu├»tief en gebruiksvriendelijk. Het nadeel is echter dat overtollige links niet te verwijderen zijn, dus hij is bij eerste gebruik niet geheel “schoon”. Daarnaast is er geen content zichtbaar, dus wederom vind je alleen de titel van het artikel terug in je RSS lezer.

Page2rss

Page2rss genereerde een wat vreemde feed waar ik niet lekker mee uit de voeten kon. Aangezien mijn FEED43 activatie mailtje inmiddels binnen was gekomen besloot ik page2rss te laten voor wat het was.

FEED43, part 2

FEED43 heeft de volgende insteek. Haal de HTML van de pagina op, definieer het stuk waar de nieuwe artikelen in staan en definieer daarna het herhaal patroon.

Haal hier vervolgens de onderdelen uit die je in je RSS feed wil laten (onderwerp, link en intro tekst, datum, tijd, gebruiker etc.) en je bent klaar. Nou klinkt dit op papier heel mooi, maar als je geen kennis hebt van HTML is het echt een opgave. Ik gebruik met regelmaat HTML, maar ook ik moest me even inlezen. Nadat ik dit echter had gedaan had ik een perfecte feed met titel en introductie tekst, zonder reclame!

“The proof is in the pudding”

Ik heb inmiddels alle generatoren twee weken in gebruik gehad. De resultaten van Page2rss vallen erg tegen. Page2rss vindt nieuwe artikelen die er niet zijn en vindt geen artikelen als deze er wel zijn. Ponyfish komt terug met goede resultaten maar wil nog wel eens een link “te veel” opleveren. Zowel Feedity als FeedYes levert alleen nieuwe artikelen aan. Feed43 levert als enige alleen nieuwe artikelen en de content van deze artikelen.

Conclusie

Al met al gaat mijn persoonlijke voorkeur uit naar FEED43. De reden is dat het eindresultaat simpelweg het beste is. Heb je echter minder tijd of minder HTML kennis dan zijn Feedity, Ponyfish en FeedYes hele waarschijnlijke kandidaten. FeedYes en Feedity leveren in de praktijk de beste resultaten en aangezien je van Feedity bij registratie geen reclame krijgt, zou ik daarvoor hebben gekozen indien ik minder HTML kennis zou hebben.

P.s.: een FEED43 voorbeeld

Voor degene die aan de slag wil met FEED43 is er onderstaand een voorbeeld van webhostingtalk.nl

feed43 extraction ruleEen pagina van webhostingtalk bevat actieve treads en in de broncode van deze pagina beginnen deze met id=”threadslist”. Vervolgens worden de artikelen ingeleid met de code “threadbits_forum_82” wat staat voor de onderdelen van forum id 82 wat in dit voorbeeld de onderdelen over VoIP zijn. Het blok van artikelen wordt afgesloten met . Bij Global Search Pattern: vullen we daarom threadbits_forum_82{*}{%}</table>. We krijgen nu een blok van alle “treads”.

Een herhalend item wordt ingeleid met td_threadtitle waarna een kort stuk volgt over het artikel. Vervolgens volgt de a href waar de link naar het artikel in staat en daarna volgt de title van het stuk welke start met thread_title.

De code om dit uit het blok te halen is daarmee td_threadtitle{*}title=”{%}”{*}<a href=”{%}”{*}id=”thread_title{*}”>{%}</a>. Waar eigenlijk het volgende staat:

  • Haal de intro tekst op: Alles wat begint met td_threadtitle en daarna wordt gevolgd door title=”
  • Haal de link op: alles na title=”{%}”{*} en wat begin met <a href=”
  • Haal de title op: alles na <a href=”{%}”{*} wat begint met id=”thread_title afgesloten met </a>.

feed43 output formatHiermee krijg je een schone RSS feed over alle actuele VoIP artikelen op webhostingtalk.

feed43 rss resultaten


Geschreven door Mark Vletter

Nieuwste: 18 vragen over het CIOT, onze boete en de rechtszaak daartegen beantwoord Van 22 april


Meer verhalen lezen?

In de afgelopen jaren hebben we veel geschreven over ondernemen, zelfsturend werken, de handigste tools en nog veel meer. Dus leef je uit!

Van 15 januari

Solliciteren bij Voys: De speeddate

Van 9 januari

Hoe Voys de beloning regelt in een zelfsturend bedrijf