Der Robot special_archiver indexiert Webseiten für die Nutzung in einer Suchmaschine. special_archiver analysiert Inhalte von Webseite und übernimmt diese in den Index einer Datenbank. Über eine Suchfunktion wird Internetnutzer bei Übereinstimmung von Suchbegriffen entsprechende Webseiten angezeigt.
Der Betreiber beschreibt die Funktionalität und Verhaltensweise des Robots special_archiver selbst wie folgt:
The Internet Archive is a nonprofit digital library that preserves web data and makes it available for research purposes through the Wayback Machine. We began archiving the web in 1996, and currently have preserved over 150 billion web documents. The Internet Archive partners with universities,…
Zugriffe vom Robot special_archiver werden mit einem Anteil von 19.7 % am häufigsten von der IP-Adresse 207.241.235.183 und dem Server crawl861.us.archive.org registriert. Zugriffe vom Robot special_archiver werden mit einem Anteil von 100 % am häufigsten mit dem User-Agent Mozilla/5.0 (compatible; special_archiver/3.1.1 +http://www.archive.org/details/archive.org_bot) registriert. Zugriffe vom Robot special_archiver werden mit einem Anteil von 100 % am häufigsten mit der HTTP-Version 1.0 registriert. Der Robot special_archiver ruft am häufigsten die Dateitypen TXT, JS, PHP ab.
Merkmale
In der folgenden Tabelle sind Merkmale des Robots special_archiver aufgelistet. Die Merkmale werden automatisch analysiert und erkannt. So wird z. B. erfasst ob der Robot special_archiver die Robots (TXT) oder die Sitemap (XML) einer Webseite ausliest. Ebenfalls wird erfasst, wie viele Webserver-Zugriffe der Robot special_archiver pro Minute und Domain im Schnitt ausführt. Ein freundlicher Robot sollte nicht mehr als 30 Webserver-Zugriffe pro Minute auf eine Domain ausführen. Der Durchschnitt wird über alle erfassten Webserver-Zugriffe des Robot special_archiver auf eine Domain von maximal den letzten 30 Tagen gemittelt. Ein Webserver-Zugriffe meint einen einzelnen HTTP-Zugriff, z. B. GET oder HEAD und alle weiteren.
Anzahl analysierter Zugriffe | 300 |
Wird die sitemap.xml ausgelesen? | Nein |
Wird die robots.txt ausgelesen? | Ja |
∅ Anzahl Zugriffe pro Minute | - |
Anteil ungültiger Zugriffe * | - |
* Der Anteil ungültiger Zugriffe berechnet sich aus dem Verhältnis von Zugriffen des Robots welche einen erfolgreichen HTTP-Status-Code (2xx) sowie einen nicht erfolgreichen HTTP-Status-Code (4xx) zur Folge haben. Ab einem Anteil von 30% ungültigen HTTP-Status-Codes wird der Wert in roter Farbe markiert. Ein hoher Anteil ungültiger HTTP-Status-Codes kann auf einen nicht korrekt funktionierenden Robot oder eine defekte Webseite zurückzuführen sein. Ebenfalls ist es möglich das der Robot versucht auf geschützte Bereiche einer Webseite zuzugreifen. Respektiert der Robot die robots.txt Datei kann der Webseitenbetreiber hierüber den Robot den Ausschluss dieser URLs signalisieren.
IP-Adressen
In folgender Tabelle sind IP-Adressen aufgelistet, von welcher der Robot special_archiver arbeitet. Ist das Land der IP-Adresse bekannt, wird dieses mit einer entsprechende Landesflagge symbolisiert. Zu jeder IP-Adresse wird außerdem die Name der Organisation angezeigt welche den Server betreibt, sowie Kontaktinformationen für die Meldung von Abuse-Fällen. Zugriffe vom Robot special_archiver werden mit einem Anteil von 19.7 % am häufigsten von der IP-Adresse 207.241.235.183 und dem Server crawl861.us.archive.org registriert.
IP-Adresse | Server | Organisation | Abuse-Kontakt |
---|---|---|---|
207.241.235.183 (19.7 %) | crawl861.us.archive.org | - | - |
207.241.231.151 (14.1 %) | crawl420.us.archive.org | - | - |
207.241.234.64 (10.2 %) | crawl505.us.archive.org | - | - |
207.241.231.44 (8.9 %) | crawl854.us.archive.org | - | - |
207.241.231.164 (7.9 %) | crawl344.us.archive.org | - | - |
207.241.231.148 (5.3 %) | crawl423.us.archive.org | - | - |
207.241.231.150 (4.9 %) | crawl421.us.archive.org | - | - |
207.241.232.241 (4.3 %) | crawl856.us.archive.org | - | - |
207.241.231.143 (3.9 %) | crawl428.us.archive.org | - | - |
207.241.231.147 (3.9 %) | crawl424.us.archive.org | - | - |
207.241.234.62 (3 %) | crawl503.us.archive.org | - | - |
207.241.231.149 (3 %) | crawl422.us.archive.org | - | - |
207.241.231.43 (2.6 %) | crawl855.us.archive.org | - | - |
207.241.231.163 (2 %) | crawl345.us.archive.org | - | - |
207.241.232.42 (1.6 %) | crawl105.us.archive.org | - | - |
207.241.234.63 (1.3 %) | crawl504.us.archive.org | - | - |
207.241.229.51 (1.3 %) | crawl811.us.archive.org | - | - |
207.241.234.61 (1 %) | crawl502.us.archive.org | - | - |
207.241.229.227 (0.7 %) | crawl890.us.archive.org | - | - |
207.241.232.41 (0.3 %) | crawl106.us.archive.org | - | - |
User-Agents
In folgender Tabelle sind User-Agents aufgelistet, mit welcher der Robot special_archiver HTTP-Anfrage an Server stellt. Zugriffe vom Robot special_archiver werden mit einem Anteil von 100 % am häufigsten mit dem User-Agent Mozilla/5.0 (compatible; special_archiver/3.1.1 +http://www.archive.org/details/archive.org_bot) registriert.
User-Agent | Anteil |
---|---|
Mozilla/5.0 (compatible; special_archiver/3.1.1 +http://www.archive.org/details/archive.org_bot) | 100 % |
HTTP-Protokoll Version
In folgender Tabelle sind HTTP-Protokoll Versionen aufgelistet, mit welcher der Robot special_archiver HTTP-Anfrage an Server stellt. Zugriffe vom Robot special_archiver werden mit einem Anteil von 100 % am häufigsten mit der HTTP-Version 1.0 registriert.
Version | Anteil |
---|---|
1.0 | 100 % |
Dateitypen
In folgender Tabelle sind Dateitypen aufgelistet, welcher der Robot special_archiver von Servern abruft. Der Robot special_archiver ruft am häufigsten die Dateitypen TXT, JS, PHP ab.
Dateityp | Anteil |
---|---|
TXT | 30.47 % |
JS | 25.45 % |
PHP | 14.7 % |
JPG | 6.09 % |
CSS | 6.09 % |
PNG | 5.02 % |
SVG | 5.02 % |
ICO | 2.15 % |
WOFF | 1.08 % |
XML | 1.08 % |
EOT | 1.08 % |
TTF | 1.08 % |
GIF | 0.36 % |
HTML | 0.36 % |
Kontakt
Webseite | Link |
Verweise
Es sind keine weiterführende Verweise zu dem Robot special_archiver bekannt. Du hast weitere wichtige Informationen zu special_archiver? Dann freuen wir uns jetzt über Deinen Kommentar!