Gibt es eine Möglichkeit, Suchbots dazu zu bringen, bestimmten Text zu ignorieren? [closed]

Lesezeit: 9 Minuten

Benutzer-Avatar
Alex

Ich habe mein Blog (Sie können es sehen, wenn Sie möchten, von meinem Profil aus), und es ist frisch, ebenso wie die Ergebnisse von Google-Robotern.

Die Ergebnisse waren für mich alarmierend. Anscheinend sind die häufigsten 2 Wörter auf meiner Website „rss“ und „feed“, weil ich Text für Links wie „Comments RSS“, „Post Feed“ usw. verwende. Diese 2 Wörter werden in jedem Beitrag vorhanden sein, während andere Wörter wird seltener.

Gibt es eine Möglichkeit, diese Links aus dem Parsing von Google verschwinden zu lassen? Ich möchte nicht, dass technische Links indexiert werden. Ich möchte nur, dass Inhalte, Titel und Beschreibungen indiziert werden. Ich suche nach etwas anderem, als diesen Text durch Bilder zu ersetzen.

Ich habe einige alte Diskussionen bei Google aus dem Jahr 2007 gefunden (ich denke, in 3 Jahren hätten sich viele Dinge ändern können, hoffentlich auch dies)

Bei dieser Frage geht es nicht um robots.txt und darum, wie Google Seiten ignorieren kann. Es geht darum, kleine Teile der Seite zu ignorieren oder die Teile so umzuwandeln, dass sie von Menschen gesehen und für Roboter unsichtbar werden.

  • ähnliche Frage: webmasters.stackexchange.com/questions/16390/…

    – Sybille Peters

    1. Juni um 5:57

  • Ich habe dafür gestimmt, diese Frage zu schließen, da es sich nicht um eine Programmierfrage handelt und sie bei Stack Overflow nicht zum Thema gehört. Heutzutage können nicht-programmierende Fragen zu einer Website gestellt werden Webmaster. In diesem Fall wurde die Frage dort bereits gestellt und beantwortet: Verhindern, dass Robots einen bestimmten Teil einer Seite crawlen

    – Stephen Ostermiller

    1. Juni um 10:11 Uhr


  • Die beiden besten Antworten hier zur Verwendung googleoff und data-nosnippet sind GEFÄHRLICH FALSCH. Keine dieser beiden Methoden führt dazu, dass Suchbots den Text ignorieren.

    – Stephen Ostermiller

    1. Juni um 10:23

  • Im Geiste der vollständigen Offenlegung: Viele Kommentare, die über die Moderation dieser Frage streiten, wurden gelöscht. Obwohl wir verstehen, dass es sich etwas seltsam anfühlt, eine Benachrichtigung über das Schließen einer 12 Jahre alten Frage zu erhalten, ändert dies nichts an der Tatsache, dass diese Frage für Stack Overflow nicht relevant ist (sicherlich nach heutigen Maßstäben), und wir fahren fort um unsere Standards auch bei alten Fragen durchzusetzen. Eine geschlossene Frage ist keine Bestrafung. Außerdem war die Art und Weise, wie Stephens Kommentar ursprünglich formuliert war, unterdurchschnittlich, da, wie bereits erwähnt, Webmaster nicht wirklich existierten, als diese Frage gestellt wurde.

    – Cody Grey

    Vor 2 Tagen


Benutzer-Avatar
Ormoz

Es gibt eine einfache Möglichkeit, Google anzuweisen, Teile Ihrer Dokumente nicht zu indizieren, nämlich die Verwendung von googleon und googleoff:

<p>This is normal (X)HTML content that will be indexed by Google.</p>

<!--googleoff: index-->

<p>This (X)HTML content will NOT be indexed by Google.</p>

<!--googleon: index-->

In diesem Beispiel wird der zweite Absatz nicht von Google indexiert. Beachten Sie das „index”-Parameter, der auf einen der folgenden Werte eingestellt werden kann:

  • index — Inhalt umgeben von „googleoff: index“ wird von Google nicht indexiert

    anchor — Ankertext für alle Links innerhalb eines „googleoff: anchor”-Bereich wird nicht mit der Zielseite verknüpft

    snippet — Inhalt umgeben von „googleoff: snippet“ wird nicht zum Erstellen von Snippets für Suchergebnisse verwendet

    all — Inhalt umgeben von „googleoff: all” werden mit allen behandelt

Quelle

  • Dies ist für GSA, nicht für GoogleBot. aus Wikipedia: de.wikipedia.org/wiki/Noindex Es ist nicht bekannt, dass Googles Hauptindizierungs-Spider, der Googlebot, keine dieser Techniken erkennt.

    – Mysterium

    5. Februar 2015 um 2:57 Uhr

  • googleon, googleoffTags werden nur von der Google Search Appliance unterstützt (wenn Sie Ihre eigenen Suchergebnisse hosten). Dadurch wird der Google-Bot also nicht daran gehindert, diesen Text zu crawlen.

    – Gayan Weerakutti

    21. Juli 2015 um 16:04 Uhr

  • Linkrot-Korrektur für den ersten Link in diesen Kommentaren von @AlexanderMP web.archive.org/web/20121024043825/http://google.utk.edu/…

    – Albert

    26. Juli 2019 um 14:00 Uhr

Benutzer-Avatar
Zulu-

Google ignoriert HTML-Tags, die haben data-nosnippet:

<p>
   This text can be included in a snippet
   <span data-nosnippet>and this part would not be shown</span>.
</p>

Quelle: Spezielle Tags, die Google versteht – Inline-Anweisungen

  • Sind Sie sicher, dass es von der Indexierung ausgeschlossen wird oder nur von der Anzeige als Snippets ausgeschlossen wird? Die Quelle sagt: “Sie können Teile einer HTML-Seite von Snippets ausschließen”

    – Sybille Peters

    1. Juni um 5:44

  • data-nosnippet verhindert nicht die Indexierung, sondern verhindert nur, dass der Text als Teil des Snippets in den Suchergebnissen angezeigt wird.

    – Stephen Ostermiller

    1. Juni um 10:13

Ich arbeite auf einer Website mit Top-3-Google-Ranking für Tausende von Schulnamen in den USA, und wir leisten viel Arbeit, um unsere SEO zu schützen. Es gibt 3 wichtige Dinge, die Sie tun könnten (die alle wahrscheinlich Zeitverschwendung sind, lesen Sie weiter):

  • Verschieben Sie die Dinge, die Sie herunterspielen möchten, an das Ende Ihres HTML-Codes und verwenden Sie CSS und/oder, um sie dort zu platzieren, wo die Leser sie sehen sollen. Dies wird es nicht vor Crawlern verbergen, aber sie werden es niedriger bewerten.
  • Ersetzen Sie diese Links durch Bilder (Sie sagen, dass Sie das nicht tun möchten, aber erklären Sie nicht, warum nicht)
  • Stellen Sie Crawlern eine andere Seite bereit, wobei diese Links entfernt werden. Daran ist nichts Schwarzer Hut, solange der Inhalt im Grunde derselbe ist, den ein Browser sieht. Suchmaschinen werden Sie anpingen, wenn Sie eine Seite bereitstellen, die sich erheblich von dem unterscheidet, was Benutzer sehen, aber wenn Sie RSS-Links aus der Version des Seiten-Crawler-Index entfernen würden, hätten Sie kein Problem.

Allerdings sind Crawler schlau und Sie sind nicht die einzige Website, die mit Permalinks und RSS-Links gefüllt ist. Sie kümmern sich um den Kontext und suchen nach Begriffen und Sätzen in Ihren Überschriften und Ihrem Fließtext. Sie wissen, wie man feststellt, dass es in Ihrem Blog um Technologie und nicht um RSS geht. Ich bezweifle stark, dass diese Links negative Auswirkungen auf Ihre SEO haben. Welches Problem versuchst du eigentlich zu lösen?

Wenn Sie SEO aufbauen möchten, finden Sie heraus, welchen Wert Sie den Lesern bieten, und schreiben Sie darüber. Sagen Sie interessante Dinge, die andere dazu bringen, auf Ihr Blog zu verlinken, und Crawler werden verstehen, dass Sie eine Informationsquelle sind, die die Leute schätzen. Denken Sie mehr darüber nach, was Ihre Leser sehen und verstehen, und weniger darüber, was Sie selbst tun denken ein Crawler sieht.

  • Vielen Dank. Es ist nur so, dass ich mein Blog in den Top-Ergebnissen erscheinen lassen könnte, wenn ich eine seltsame Kombination aus Kategorienamen, 2 Post-Themen schreibe und die Schlüsselwörter „rss“ und „feed“ hinzufüge. Ohne “rss” und “feed” geht es zu Ende. Ich werde die Regeln noch einmal lesen und auf Klauseln achten, die mit der Bereitstellung leicht unterschiedlicher Inhalte für Bots verbunden sind.

    – Alex

    9. Juli 2010 um 6:49 Uhr

Denken Sie zuerst über das Problem nach. Wenn Google der Meinung ist, dass „RSS“ das Hauptschlüsselwort ist, kann dies darauf hindeuten, dass der Rest Ihres Inhalts etwas oberflächlich ist und erweitert werden muss. Vielleicht sollte dies der Schwerpunkt Ihrer Aufmerksamkeit sein. Wenn der Rest Ihres Inhalts reichhaltig ist, würde ich mir darüber keine Gedanken machen, da eine Suchmaschine anhand von Titel und Überschriften wissen sollte, worum es auf der Seite geht. Stellen Sie einfach sicher, dass RSS usw. nicht in einer Überschrift oder einem fetten oder starken Tag enthalten ist.

Zweitens möchten Sie, wie Sie zu Recht erwähnen, wahrscheinlich keine Bilder verwenden, da sie für Screenreader ohne Alt-Text nicht auswertbar sind, und wenn sie Alt-Text oder unterstützenden Text enthalten, fügen Sie das Schlüsselwort wieder ein. Aria Live kann Ihnen jedoch dabei helfen, sich fortzubewegen dieses Problem, aber ich bin kein Experte für Barrierefreiheit.

Optionen:

  • Verwenden Sie JavaScript, um diesen Teil des Inhalts zu schreiben (vielleicht ajaxen Sie ihn nach dem Laden). Suchmaschinen wie Google können JavaScript ausführen, aber ich würde vermuten, dass es keinen in JS geschriebenen Inhalt sehr hoch bewertet.
  • Formulieren Sie den Inhalt neu oder entfernen Sie Duplikate davon, ein auffälliger RSS-Feed-Link kann besser sein als mehrere kleinere, die auf der Seite verstreut sind.
  • Verwenden Sie das CSS-Inhaltsattribut mit Pseudo :before oder :after, um Ihren Inhalt hinzuzufügen. Ich bin mir nicht sicher, ob Bots Wörter in Inhaltsattributen in CSS indizieren und wissen, dass Inhalte in Bezug auf jede Seite wertvoll sind, aber es scheint unwahrscheinlich. Wörter wie RSS in das CSS einzufügen bedeutet im Grunde, dass es sich um eine Stilsache handelt, nicht um eine HTML-Sache, daher werden sie, selbst wenn Suchmaschinen es indizieren, nicht viel/keinen Wert hinzufügen. Beispielsweise könnten HTML und CSS wie folgt aussehen:

    <a href="https://stackoverflow.com/my-feed.rss" class="add-text"></a>
    
    .add-text:after { content:'View my RSS feed'; }
    

Beachten Sie, dass das Obige in älteren Versionen von IE nicht funktioniert, daher benötigen Sie möglicherweise einige Kommentare zur IE-Version, wenn Sie sich darum kümmern.

Benutzer-Avatar
VishalQuery

„googleon“ und „googleoff“ werden nur von der Google Search Appliance unterstützt (wenn Sie Ihre eigenen Suchergebnisse hosten, normalerweise für Ihre eigene interne Website).

Sie werden von der Google-Websuche überhaupt nicht unterstützt. Unterlassen Sie dies also bitte, und ich denke, das sollte nicht als richtige Antwort gekennzeichnet werden, da dies zu Mehrdeutigkeiten führen könnte.

Damit Google nun einen Teil einer Seite ausschließt, müssen Sie diesen Inhalt in einer separaten Datei platzieren, z. B. Excluded.html, und einen Iframe verwenden, um diesen Inhalt auf der Hostseite anzuzeigen.

Das Iframe-Tag greift Inhalte aus einer anderen Datei und fügt sie in die Hostseite ein. Ich denke, es gibt bisher keine andere verfügbare Methode.

Benutzer-Avatar
JYelton

Die einzige Kontrolle, die Sie über die Indizierungsroboter haben, ist die robots.txt-Datei. Sehen diese Dokumentationverlinkt von Google auf ihre Seite, die die Verwendung der Datei erklärt.

Sie können grundsätzlich bestimmte Links und URLs verbieten, aber nicht unbedingt Schlüsselwörter.

Benutzer-Avatar
Aaron Harun

Außer serverseitigen Black-Hat-Methoden können Sie nichts tun. Vielleicht möchten Sie sich ansehen, warum Sie diese Wörter so oft verwenden, und einige davon von der Website entfernen.

Früher konnte man JS verwenden, um Dinge vor dem Googlebot zu “verstecken”, aber das ist jetzt nicht mehr möglich, da es JS analysiert. ( http://www.webmasterworld.com/google/4159807.htm )

  • Das ist sehr interessant. Wenn ich also Text mit Tools wie cufon ersetze, analysiert der Google-Bot dieses JS, transformiert den Text und ignoriert ihn, weil es dann nur eine Leinwand ist?

    – Alex

    9. Juli 2010 um 6:51 Uhr

  • Keine Garantien, Google ist sehr verschwiegen darüber, was der Bot kann und was nicht, also wird es wahrscheinlich nicht funktionieren. Sie können jedoch mit der Leinwand beginnen, anstatt Cufon eine Ersetzung vornehmen zu lassen.

    – Aaron Harun

    9. Juli 2010 um 17:22 Uhr

1017380cookie-checkGibt es eine Möglichkeit, Suchbots dazu zu bringen, bestimmten Text zu ignorieren? [closed]

This website is using cookies to improve the user-friendliness. You agree by using the website further.

Privacy policy