Menu Close

archiveorg_bot

Der Robot archiveorg_bot indexiert Webseiten für die Nutzung in einer Suchmaschine. archiveorg_bot analysiert Inhalte von Webseite und übernimmt diese in den Index einer Datenbank. Über eine Suchfunktion wird Internetnutzer bei Übereinstimmung von Suchbegriffen entsprechende Webseiten angezeigt.

Der Betreiber beschreibt die Funktionalität und Verhaltensweise des Robots archiveorg_bot selbst wie folgt:

The Internet Archive is a nonprofit digital library that preserves web data and makes it available for research purposes through the Wayback Machine. We began archiving the web in 1996, and currently have preserved over 150 billion web documents. The Internet Archive partners with universities,…

Zugriffe vom Robot archiveorg_bot werden mit einem Anteil von 66.7 % am häufigsten von der IP-Adresse 207.241.231.143 und dem Server crawl428.us.archive.org registriert. Zugriffe vom Robot archiveorg_bot werden mit einem Anteil von 100 % am häufigsten mit dem User-Agent Mozilla/5.0 (compatible; archive.org_bot +http://archive.org/details/archive.org_bot) registriert. Zugriffe vom Robot archiveorg_bot werden mit einem Anteil von 100 % am häufigsten mit der HTTP-Version 1.0 registriert. Der Robot archiveorg_bot ruft am häufigsten die Dateitypen TXT ab.

Merkmale

In der folgenden Tabelle sind Merkmale des Robots archiveorg_bot aufgelistet. Die Merkmale werden automatisch analysiert und erkannt. So wird z. B. erfasst ob der Robot archiveorg_bot die Robots (TXT) oder die Sitemap (XML) einer Webseite ausliest. Ebenfalls wird erfasst, wie viele Webserver-Zugriffe der Robot archiveorg_bot pro Minute und Domain im Schnitt ausführt. Ein freundlicher Robot sollte nicht mehr als 30 Webserver-Zugriffe pro Minute auf eine Domain ausführen. Der Durchschnitt wird über alle erfassten Webserver-Zugriffe des Robot archiveorg_bot auf eine Domain von maximal den letzten 30 Tagen gemittelt. Ein Webserver-Zugriffe meint einen einzelnen HTTP-Zugriff, z. B. GET oder HEAD und alle weiteren.

Anzahl analysierter Zugriffe 9
Wird die sitemap.xml ausgelesen? Nein
Wird die robots.txt ausgelesen? Ja
∅ Anzahl Zugriffe pro Minute -
Anteil ungültiger Zugriffe * -

* Der Anteil ungültiger Zugriffe berechnet sich aus dem Verhältnis von Zugriffen des Robots welche einen erfolgreichen HTTP-Status-Code (2xx) sowie einen nicht erfolgreichen HTTP-Status-Code (4xx) zur Folge haben. Ab einem Anteil von 30% ungültigen HTTP-Status-Codes wird der Wert in roter Farbe markiert. Ein hoher Anteil ungültiger HTTP-Status-Codes kann auf einen nicht korrekt funktionierenden Robot oder eine defekte Webseite zurückzuführen sein. Ebenfalls ist es möglich das der Robot versucht auf geschützte Bereiche einer Webseite zuzugreifen. Respektiert der Robot die robots.txt Datei kann der Webseitenbetreiber hierüber den Robot den Ausschluss dieser URLs signalisieren.

IP-Adressen

In folgender Tabelle sind IP-Adressen aufgelistet, von welcher der Robot archiveorg_bot arbeitet. Ist das Land der IP-Adresse bekannt, wird dieses mit einer entsprechende Landesflagge symbolisiert. Zu jeder IP-Adresse wird außerdem die Name der Organisation angezeigt welche den Server betreibt, sowie Kontaktinformationen für die Meldung von Abuse-Fällen. Zugriffe vom Robot archiveorg_bot werden mit einem Anteil von 66.7 % am häufigsten von der IP-Adresse 207.241.231.143 und dem Server crawl428.us.archive.org registriert.

IP-Adresse Server Organisation Abuse-Kontakt
207.241.231.143 (66.7 %) crawl428.us.archive.org - -
207.241.229.227 (11.1 %) crawl890.us.archive.org - -
207.241.232.41 (11.1 %) crawl106.us.archive.org - -
207.241.232.42 (11.1 %) crawl105.us.archive.org - -

User-Agents

In folgender Tabelle sind User-Agents aufgelistet, mit welcher der Robot archiveorg_bot HTTP-Anfrage an Server stellt. Zugriffe vom Robot archiveorg_bot werden mit einem Anteil von 100 % am häufigsten mit dem User-Agent Mozilla/5.0 (compatible; archive.org_bot +http://archive.org/details/archive.org_bot) registriert.

User-Agent Anteil
Mozilla/5.0 (compatible; archive.org_bot +http://archive.org/details/archive.org_bot) 100 %

HTTP-Protokoll Version

In folgender Tabelle sind HTTP-Protokoll Versionen aufgelistet, mit welcher der Robot archiveorg_bot HTTP-Anfrage an Server stellt. Zugriffe vom Robot archiveorg_bot werden mit einem Anteil von 100 % am häufigsten mit der HTTP-Version 1.0 registriert.

Version Anteil
1.0 100 %

Dateitypen

In folgender Tabelle sind Dateitypen aufgelistet, welcher der Robot archiveorg_bot von Servern abruft. Der Robot archiveorg_bot ruft am häufigsten die Dateitypen TXT ab.

Dateityp Anteil
TXT 100 %

Kontakt

Webseite Link

Verweise

Es sind keine weiterführende Verweise zu dem Robot archiveorg_bot bekannt. Du hast weitere wichtige Informationen zu archiveorg_bot? Dann freuen wir uns jetzt über Deinen Kommentar!

Bewertung

Klicke auf die Sterne um deine Erfahrungen mit diesem Robot zu bewerten!

Durchschnittliche Bewertung 0 / 5. Anzahl Bewertungen: 0

Bisher keine Bewertungen! Sei der Erste, der diesen Robot bewertet.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.