Warum sind in den Logs meiner Website viele Zugriffe auf die robots.txt ersichtlich?

Artikel-Nr: 336 | Letzte Aktualisierung: Wed, Nov 16, 2016 2:10 PM

Ein Großteil der Suchmaschinen arbeitet nach dem Robots-Exclusion-Standard-Protokoll. Dies hat zur Folge, dass der Webcrawler/Robot zuerst versucht die Datei robots.txt im Hauptverzeichnis der Domain zu lesen. Dieser Datei kann der Robot dann entnehmen, ob und wie die Website von Webcrawlern besucht werden darf.

Generell ist hier jedoch zu beachten, dass sich nicht alle Suchmaschinen an die robots.txt halten und somit auch Bereiche indexieren, welche gem. der robots.txt nicht von Webcrawlern besucht werden sollen.

Weitere Informationen zu diesem Thema finden Sie z.B. unter Wikipedia:
Robots Exclusion Standard

Anhänge

Es gibt keine Anhänge zu diesem Artikel.

Verwandte Artikel

Über mein Web wird Spam versendet. Was kann ich dagegen tun?

Hinzugefügt am Fri, Jun 5, 2009

Wie lautet der Handler für PHP?

Hinzugefügt am Wed, Apr 25, 2012

Wie kann ich das Administrator-Passwort für den Joomla Login neu vergeben?

Hinzugefügt am Wed, Apr 28, 2010

Wie kann ich erreichen, dass beim Navigieren auf meiner Seite nur die Domain in der Adressezeile des Browsers steht?

Hinzugefügt am Tue, Aug 19, 2008

Ich möchte gerne einen anderen/eigenen Mailserver für meine Domain verwenden. Ist dies möglich?

Hinzugefügt am Thu, Dec 18, 2008