FAQ- / Wissensdatenbank

Warum sind in den Logs meiner Website viele Zugriffe auf die robots.txt ersichtlich?

 

Ein Großteil der Suchmaschinen arbeitet nach dem Robots-Exclusion-Standard-Protokoll. Dies hat zur Folge, dass der Webcrawler/Robot zuerst versucht die Datei robots.txt im Hauptverzeichnis der Domain zu lesen. Dieser Datei kann der Robot dann entnehmen, ob und wie die Website von Webcrawlern besucht werden darf.

Generell ist hier jedoch zu beachten, dass sich nicht alle Suchmaschinen an die robots.txt halten und somit auch Bereiche indexieren, welche gem. der robots.txt nicht von Webcrawlern besucht werden sollen.

Weitere Informationen zu diesem Thema finden Sie z.B. unter Wikipedia:
Robots Exclusion Standard

 

1.67 (6)
Bewertung (6 Stimmen)
Bewerten Sie diesen Aritkel
    Anhänge
    Es gibt keine Anhänge zu diesem Artikel.
    Verwandte Artikel RSS Feed
    Ich benötige einen SSH-Zugang (Shell)
    Hinzugefügt am Fri, Apr 20, 2012
    Meine bei Google angemeldete Seite wird dort nicht gefunden, woran liegt das?
    Hinzugefügt am Tue, Dec 16, 2008
    Ich habe beim FTP Upload Verbindungsabbrüche
    Hinzugefügt am Thu, Oct 16, 2008
    Ich möchte einen sehr grossen Datenbank-Dump importieren
    Hinzugefügt am Mon, Oct 20, 2008
    Wie kann ich eine eMail-Adresse anlegen?
    Hinzugefügt am Wed, Nov 24, 2010