Dies setzt voraus, dass kein direkter Zugriff auf eine API verfügbar ist. Da ich ALLE Beiträge anfordere, bin ich mir nicht sicher, ob RSS viel helfen würde.
Ich habe ein einfaches System in Betracht gezogen, das jedes Jahr und jeden Monat durchläuft und jede HTML-Datei herunterlädt, aber die folgende URL für jedes Jahr-Monat-Paar ändert. Dies funktioniert für WordPress- und Blogger-Blogs.
http://www.lostincheeseland.com/2011/05
Gibt es jedoch eine Möglichkeit, die folgende von Blogger bereitgestellte Suchfunktion zu verwenden, um alle Blogs zurückzugeben? Ich habe damit herumgespielt, aber die Dokumentation scheint spärlich zu sein.
http://www.lostincheeseland.com/search?updated-max=2012-08-17T09:44:00%2B02:00&max-results=6
Gibt es andere Methoden, die ich nicht in Betracht gezogen habe?
Was Sie suchen, ist ein Seitenverzeichnis.
Zuallererst schreiben Sie einen Bot, also gehört es zum guten Ton, die Blogs zu überprüfen robots.txt Datei. Und siehe da, dort wird oft eine Sitemap erwähnt. Hier ist ein Beispiel aus der Google-Blog:
User-agent: Mediapartners-Google
Disallow:
User-agent: *
Disallow: /search
Allow: /
Sitemap: http://googleblog.blogspot.com/feeds/posts/default?orderby=UPDATED
In diesem Fall können Sie die Sitemap-URL aufrufen, um eine XML-Sitemap abzurufen.
Für WordPress gilt dasselbe, aber es ist nicht standardmäßig integriert, sodass nicht alle Blogs es haben werden. Schau mal rein dieses Plugin Dies ist die beliebteste Methode zum Erstellen dieser Sitemaps in WordPress. Zum Beispiel verwendet mein Blog dies und Sie finden die Sitemap unter /sitemap.xml
(der Standardspeicherort)
Zusamenfassend:
- Überprüfen Sie die robots.txt-Datei
- Folgen Sie der Sitemap-URL, falls vorhanden
- Suchen Sie andernfalls nach /sitemap.xml
Ebenfalls: sei ein guter Internet-Bürger! Wenn Sie einen Bot schreiben, stellen Sie sicher, dass er der robots.txt-Datei gehorcht (wie dort, wo blogspot Ihnen dies ausdrücklich mitteilt nicht benutzen /search
!)
Ruby-on-Rails-Tag entfernt, da die Frage nicht Rails-spezifisch ist
– Ideenasyl
5. September 2012 um 22:00 Uhr