Alle Posts von einem Blog abrufen (WordPress oder Blogger)

Lesezeit: 2 Minuten

Benutzer-Avatar
Jackson Henley

Dies setzt voraus, dass kein direkter Zugriff auf eine API verfügbar ist. Da ich ALLE Beiträge anfordere, bin ich mir nicht sicher, ob RSS viel helfen würde.

Ich habe ein einfaches System in Betracht gezogen, das jedes Jahr und jeden Monat durchläuft und jede HTML-Datei herunterlädt, aber die folgende URL für jedes Jahr-Monat-Paar ändert. Dies funktioniert für WordPress- und Blogger-Blogs.

http://www.lostincheeseland.com/2011/05    

Gibt es jedoch eine Möglichkeit, die folgende von Blogger bereitgestellte Suchfunktion zu verwenden, um alle Blogs zurückzugeben? Ich habe damit herumgespielt, aber die Dokumentation scheint spärlich zu sein.

http://www.lostincheeseland.com/search?updated-max=2012-08-17T09:44:00%2B02:00&max-results=6

Gibt es andere Methoden, die ich nicht in Betracht gezogen habe?

  • Ruby-on-Rails-Tag entfernt, da die Frage nicht Rails-spezifisch ist

    – Ideenasyl

    5. September 2012 um 22:00 Uhr

Benutzer-Avatar
Ideenasyl

Was Sie suchen, ist ein Seitenverzeichnis.

Zuallererst schreiben Sie einen Bot, also gehört es zum guten Ton, die Blogs zu überprüfen robots.txt Datei. Und siehe da, dort wird oft eine Sitemap erwähnt. Hier ist ein Beispiel aus der Google-Blog:

User-agent: Mediapartners-Google
Disallow: 

User-agent: *
Disallow: /search
Allow: /

Sitemap: http://googleblog.blogspot.com/feeds/posts/default?orderby=UPDATED

In diesem Fall können Sie die Sitemap-URL aufrufen, um eine XML-Sitemap abzurufen.

Für WordPress gilt dasselbe, aber es ist nicht standardmäßig integriert, sodass nicht alle Blogs es haben werden. Schau mal rein dieses Plugin Dies ist die beliebteste Methode zum Erstellen dieser Sitemaps in WordPress. Zum Beispiel verwendet mein Blog dies und Sie finden die Sitemap unter /sitemap.xml
(der Standardspeicherort)

Zusamenfassend:

  • Überprüfen Sie die robots.txt-Datei
  • Folgen Sie der Sitemap-URL, falls vorhanden
  • Suchen Sie andernfalls nach /sitemap.xml

Ebenfalls: sei ein guter Internet-Bürger! Wenn Sie einen Bot schreiben, stellen Sie sicher, dass er der robots.txt-Datei gehorcht (wie dort, wo blogspot Ihnen dies ausdrücklich mitteilt nicht benutzen /search!)

  • darüber hinaus auch eine Überprüfung wert /sitemap_index.xmlmanchmal funktioniert die automatische Weiterleitung nicht, keine Ahnung warum zB kitchenstewardship dot com

    – Andrei-Niculae Petre

    9. Juni 2015 um 22:52 Uhr

1086240cookie-checkAlle Posts von einem Blog abrufen (WordPress oder Blogger)

This website is using cookies to improve the user-friendliness. You agree by using the website further.

Privacy policy