Der Robot archiveorg_bot indexiert Webseiten für die Nutzung in einer Suchmaschine. archiveorg_bot analysiert Inhalte von Webseite und übernimmt diese in den Index einer Datenbank. Über eine Suchfunktion wird Internetnutzer bei Übereinstimmung von Suchbegriffen entsprechende Webseiten angezeigt.
Der Betreiber beschreibt die Funktionalität und Verhaltensweise des Robots archiveorg_bot selbst wie folgt:
The Internet Archive is a nonprofit digital library that preserves web data and makes it available for research purposes through the Wayback Machine. We began archiving the web in 1996, and currently have preserved over 150 billion web documents. The Internet Archive partners with universities,…
Zugriffe vom Robot archiveorg_bot werden mit einem Anteil von 14 % am häufigsten von der IP-Adresse 207.241.236.85 und dem Server crawl910.us.archive.org registriert. Zugriffe vom Robot archiveorg_bot werden mit einem Anteil von 51.7 % am häufigsten mit dem User-Agent Mozilla/5.0 (compatible; archive.org_bot +http://archive.org/details/archive.org_bot) registriert. Zugriffe vom Robot archiveorg_bot werden mit einem Anteil von 52.8 % am häufigsten mit der HTTP-Version 1.0 registriert. Der Robot archiveorg_bot ruft am häufigsten die Dateitypen TXT, JS, ICO ab.
Merkmale
In der folgenden Tabelle sind Merkmale des Robots archiveorg_bot aufgelistet. Die Merkmale werden automatisch analysiert und erkannt. So wird z. B. erfasst ob der Robot archiveorg_bot die Robots (TXT) oder die Sitemap (XML) einer Webseite ausliest. Ebenfalls wird erfasst, wie viele Webserver-Zugriffe der Robot archiveorg_bot pro Minute und Domain im Schnitt ausführt. Ein freundlicher Robot sollte nicht mehr als 30 Webserver-Zugriffe pro Minute auf eine Domain ausführen. Der Durchschnitt wird über alle erfassten Webserver-Zugriffe des Robot archiveorg_bot auf eine Domain von maximal den letzten 30 Tagen gemittelt. Ein Webserver-Zugriffe meint einen einzelnen HTTP-Zugriff, z. B. GET oder HEAD und alle weiteren.
Anzahl analysierter Zugriffe | 578 |
Wird die sitemap.xml ausgelesen? | Nein |
Wird die robots.txt ausgelesen? | Ja |
∅ Anzahl Zugriffe pro Minute | - |
Anteil ungültiger Zugriffe * | 100 % |
* Der Anteil ungültiger Zugriffe berechnet sich aus dem Verhältnis von Zugriffen des Robots welche einen erfolgreichen HTTP-Status-Code (2xx) sowie einen nicht erfolgreichen HTTP-Status-Code (4xx) zur Folge haben. Ab einem Anteil von 30% ungültigen HTTP-Status-Codes wird der Wert in roter Farbe markiert. Ein hoher Anteil ungültiger HTTP-Status-Codes kann auf einen nicht korrekt funktionierenden Robot oder eine defekte Webseite zurückzuführen sein. Ebenfalls ist es möglich das der Robot versucht auf geschützte Bereiche einer Webseite zuzugreifen. Respektiert der Robot die robots.txt Datei kann der Webseitenbetreiber hierüber den Robot den Ausschluss dieser URLs signalisieren.
IP-Adressen
In folgender Tabelle sind IP-Adressen aufgelistet, von welcher der Robot archiveorg_bot arbeitet. Ist das Land der IP-Adresse bekannt, wird dieses mit einer entsprechende Landesflagge symbolisiert. Zu jeder IP-Adresse wird außerdem die Name der Organisation angezeigt welche den Server betreibt, sowie Kontaktinformationen für die Meldung von Abuse-Fällen. Zugriffe vom Robot archiveorg_bot werden mit einem Anteil von 14 % am häufigsten von der IP-Adresse 207.241.236.85 und dem Server crawl910.us.archive.org registriert.
IP-Adresse | Server | Organisation | Abuse-Kontakt |
---|---|---|---|
207.241.236.85 (14 %) | crawl910.us.archive.org | - | - |
207.241.235.133 (6.7 %) | crawl900.us.archive.org | - | - |
207.241.235.164 (5.5 %) | crawl901.us.archive.org | - | - |
207.241.236.83 (5.2 %) | crawl346.us.archive.org | - | - |
207.241.231.45 (4.3 %) | crawl896.us.archive.org | - | - |
207.241.231.149 (4 %) | crawl422.us.archive.org | - | - |
207.241.234.64 (3.3 %) | crawl505.us.archive.org | - | - |
207.241.231.164 (3.1 %) | crawl344.us.archive.org | - | - |
207.241.231.143 (2.9 %) | crawl428.us.archive.org | - | - |
207.241.231.150 (2.9 %) | crawl421.us.archive.org | - | - |
207.241.233.138 (2.8 %) | crawl866.us.archive.org | - | - |
207.241.236.84 (2.8 %) | crawl909.us.archive.org | - | - |
207.241.229.50 (2.6 %) | crawl812.us.archive.org | - | - |
207.241.234.62 (2.4 %) | crawl503.us.archive.org | - | - |
207.241.234.63 (2.1 %) | crawl504.us.archive.org | - | - |
207.241.231.147 (2.1 %) | crawl424.us.archive.org | - | - |
207.241.231.163 (1.9 %) | crawl345.us.archive.org | - | - |
207.241.229.49 (1.9 %) | crawl813.us.archive.org | - | - |
207.241.229.51 (1.6 %) | crawl811.us.archive.org | - | - |
207.241.235.230 (1.6 %) | crawl906.us.archive.org | - | - |
207.241.229.227 (1.4 %) | crawl890.us.archive.org | - | - |
207.241.233.139 (1.4 %) | crawl865.us.archive.org | - | - |
207.241.229.48 (1.2 %) | crawl814.us.archive.org | - | - |
207.241.233.247 (1.2 %) | crawl800.us.archive.org | - | - |
207.241.231.148 (1.2 %) | crawl423.us.archive.org | - | - |
207.241.235.147 (1 %) | wbgrp-crawl049.us.archive.org | - | - |
207.241.234.61 (1 %) | crawl502.us.archive.org | - | - |
207.241.225.181 (0.9 %) | crawl858.us.archive.org | - | - |
207.241.225.182 (0.9 %) | crawl857.us.archive.org | - | - |
207.241.229.150 (0.7 %) | crawl809.us.archive.org | - | - |
207.241.234.15 (0.7 %) | crawl807.us.archive.org | - | - |
207.241.231.151 (0.7 %) | crawl420.us.archive.org | - | - |
207.241.233.150 (0.5 %) | crawl864.us.archive.org | - | - |
207.241.235.183 (0.5 %) | crawl861.us.archive.org | - | - |
13.57.39.16 (0.5 %) | ec2-13-57-39-16.us-west-1.compute.amazonaws.com | - | - |
3.109.150.184 (0.3 %) | ec2-3-109-150-184.ap-south-1.compute.amazonaws.com | - | - |
54.160.206.72 (0.3 %) | ec2-54-160-206-72.compute-1.amazonaws.com | - | - |
44.213.126.161 (0.3 %) | ec2-44-213-126-161.compute-1.amazonaws.com | - | - |
193.143.1.119 (0.3 %) | - | - | - |
207.241.232.41 (0.2 %) | crawl106.us.archive.org | - | - |
207.241.232.42 (0.2 %) | crawl105.us.archive.org | - | - |
179.43.176.91 (0.2 %) | - | - | - |
179.43.154.200 (0.2 %) | - | - | - |
54.160.69.133 (0.2 %) | ec2-54-160-69-133.compute-1.amazonaws.com | - | - |
207.241.232.38 (0.2 %) | crawl109.us.archive.org | - | - |
207.241.231.165 (0.2 %) | crawl339.us.archive.org | - | - |
194.55.186.126 (0.2 %) | - | - | - |
185.237.252.77 (0.2 %) | m18077.contaboserver.net | - | - |
3.26.12.211 (0.2 %) | ec2-3-26-12-211.ap-southeast-2.compute.amazonaws.com | - | - |
13.233.219.127 (0.2 %) | ec2-13-233-219-127.ap-south-1.compute.amazonaws.com | - | - |
3.23.113.224 (0.2 %) | ec2-3-23-113-224.us-east-2.compute.amazonaws.com | - | - |
3.70.14.61 (0.2 %) | ec2-3-70-14-61.eu-central-1.compute.amazonaws.com | - | - |
46.8.202.111 (0.2 %) | - | - | - |
3.231.219.126 (0.2 %) | ec2-3-231-219-126.compute-1.amazonaws.com | - | - |
123.249.22.21 (0.2 %) | ecs-123-249-22-21.compute.hwclouds-dns.com | - | - |
3.133.59.141 (0.2 %) | ec2-3-133-59-141.us-east-2.compute.amazonaws.com | - | - |
207.241.235.249 (0.2 %) | crawl842.us.archive.org | - | - |
18.191.241.22 (0.2 %) | ec2-18-191-241-22.us-east-2.compute.amazonaws.com | - | - |
18.234.247.73 (0.2 %) | ec2-18-234-247-73.compute-1.amazonaws.com | - | - |
3.228.4.97 (0.2 %) | ec2-3-228-4-97.compute-1.amazonaws.com | - | - |
34.223.54.151 (0.2 %) | ec2-34-223-54-151.us-west-2.compute.amazonaws.com | - | - |
35.170.80.183 (0.2 %) | ec2-35-170-80-183.compute-1.amazonaws.com | - | - |
35.80.30.196 (0.2 %) | ec2-35-80-30-196.us-west-2.compute.amazonaws.com | - | - |
13.126.80.172 (0.2 %) | ec2-13-126-80-172.ap-south-1.compute.amazonaws.com | - | - |
52.14.140.19 (0.2 %) | ec2-52-14-140-19.us-east-2.compute.amazonaws.com | - | - |
34.222.0.172 (0.2 %) | ec2-34-222-0-172.us-west-2.compute.amazonaws.com | - | - |
54.226.104.201 (0.2 %) | ec2-54-226-104-201.compute-1.amazonaws.com | - | - |
54.198.57.155 (0.2 %) | ec2-54-198-57-155.compute-1.amazonaws.com | - | - |
52.91.216.160 (0.2 %) | ec2-52-91-216-160.compute-1.amazonaws.com | - | - |
54.91.86.122 (0.2 %) | ec2-54-91-86-122.compute-1.amazonaws.com | - | - |
3.235.130.221 (0.2 %) | ec2-3-235-130-221.compute-1.amazonaws.com | - | - |
35.175.187.255 (0.2 %) | ec2-35-175-187-255.compute-1.amazonaws.com | - | - |
54.193.165.186 (0.2 %) | ec2-54-193-165-186.us-west-1.compute.amazonaws.com | - | - |
104.234.204.32 (0.2 %) | - | - | - |
207.241.236.164 (0.2 %) | crawl914.us.archive.org | - | - |
207.241.236.193 (0.2 %) | crawl917.us.archive.org | - | - |
3.215.142.166 (0.2 %) | ec2-3-215-142-166.compute-1.amazonaws.com | - | - |
44.224.32.76 (0.2 %) | ec2-44-224-32-76.us-west-2.compute.amazonaws.com | - | - |
207.241.234.182 (0.2 %) | crawl804.us.archive.org | - | - |
44.213.80.198 (0.2 %) | ec2-44-213-80-198.compute-1.amazonaws.com | - | - |
159.223.53.120 (0.2 %) | - | - | - |
3.235.10.33 (0.2 %) | ec2-3-235-10-33.compute-1.amazonaws.com | - | - |
35.83.250.11 (0.2 %) | ec2-35-83-250-11.us-west-2.compute.amazonaws.com | - | - |
34.223.53.133 (0.2 %) | ec2-34-223-53-133.us-west-2.compute.amazonaws.com | - | - |
18.246.231.7 (0.2 %) | ec2-18-246-231-7.us-west-2.compute.amazonaws.com | - | - |
35.87.53.159 (0.2 %) | ec2-35-87-53-159.us-west-2.compute.amazonaws.com | - | - |
3.83.79.22 (0.2 %) | ec2-3-83-79-22.compute-1.amazonaws.com | - | - |
3.81.158.125 (0.2 %) | ec2-3-81-158-125.compute-1.amazonaws.com | - | - |
54.208.44.132 (0.2 %) | ec2-54-208-44-132.compute-1.amazonaws.com | - | - |
3.235.155.161 (0.2 %) | ec2-3-235-155-161.compute-1.amazonaws.com | - | - |
94.156.64.15 (0.2 %) | - | - | - |
46.19.138.210 (0.2 %) | hostedby.privatelayer.com | - | - |
3.128.90.45 (0.2 %) | ec2-3-128-90-45.us-east-2.compute.amazonaws.com | - | - |
13.48.190.46 (0.2 %) | ec2-13-48-190-46.eu-north-1.compute.amazonaws.com | - | - |
3.111.53.63 (0.2 %) | ec2-3-111-53-63.ap-south-1.compute.amazonaws.com | - | - |
91.215.85.29 (0.2 %) | - | - | - |
91.215.85.43 (0.2 %) | - | - | - |
3.99.220.126 (0.2 %) | ec2-3-99-220-126.ca-central-1.compute.amazonaws.com | - | - |
13.58.238.210 (0.2 %) | ec2-13-58-238-210.us-east-2.compute.amazonaws.com | - | - |
23.20.65.59 (0.2 %) | ec2-23-20-65-59.compute-1.amazonaws.com | - | - |
3.112.22.81 (0.2 %) | ec2-3-112-22-81.ap-northeast-1.compute.amazonaws.com | - | - |
3.0.96.28 (0.2 %) | ec2-3-0-96-28.ap-southeast-1.compute.amazonaws.com | - | - |
3.38.109.148 (0.2 %) | ec2-3-38-109-148.ap-northeast-2.compute.amazonaws.com | - | - |
User-Agents
In folgender Tabelle sind User-Agents aufgelistet, mit welcher der Robot archiveorg_bot HTTP-Anfrage an Server stellt. Zugriffe vom Robot archiveorg_bot werden mit einem Anteil von 51.7 % am häufigsten mit dem User-Agent Mozilla/5.0 (compatible; archive.org_bot +http://archive.org/details/archive.org_bot) registriert.
User-Agent | Anteil |
---|---|
Mozilla/5.0 (compatible; archive.org_bot +http://archive.org/details/archive.org_bot) | 51.73 % |
Mozilla/5.0 (compatible; archive.org_bot +http://archive.org/details/archive.org_bot) Zeno/0569f25 warc/v0.8.33 | 15.57 % |
Mozilla/5.0 (compatible; archive.org_bot +http://www.archive.org/details/archive.org_bot) | 11.59 % |
Mozilla/5.0 (compatible; archive.org_bot +http://archive.org/details/archive.org_bot) Zeno/a310b8b warc/v0.8.28 | 6.57 % |
Mozilla/5.0 (compatible; archive.org_bot +http://archive.org/details/archive.org_bot) Zeno/78c9471 warc/v0.8.33 | 3.98 % |
Mozilla/5.0 (compatible; archive.org_bot +http://archive.org/details/archive.org_bot) Zeno/52b2551 warc/v0.8.38 | 3.63 % |
Mozilla/5.0 (compatible; archive.org_bot +http://archive.org/details/archive.org_bot) Zeno/e8ed999 warc/v0.8.40 | 2.94 % |
Mozilla/5.0 (compatible; archive.org_bot/3.3.0 +http://pandora.nla.gov.au/crawl.html) | 1.04 % |
Mozilla/5.0 (compatible; archive.org_bot +http://archive.org/details/archive.org_bot) Zeno/02b94f2 warc/v0.8.33 | 1.04 % |
Mozilla/5.0 (compatible; archive.org_bot +http://archive.org/details/archive.org_bot) Zeno/987b8a5 warc/v0.8.32 | 0.87 % |
Mozilla/5.0 (compatible; archive.org_bot +http://archive.org/details/archive.org_bot) Zeno/ae4878c warc/v0.8.39 | 0.69 % |
Mozilla/5.0 (compatible; archive.org_bot +http://archive.org/details/archive.org_bot) Zeno/f14ac37 warc/v0.8.33 | 0.17 % |
Mozilla/5.0 (compatible; archive.org_bot +http://archive.org/details/archive.org_bot) Zeno/41faad0 warc/v0.8.32 | 0.17 % |
HTTP-Protokoll Version
In folgender Tabelle sind HTTP-Protokoll Versionen aufgelistet, mit welcher der Robot archiveorg_bot HTTP-Anfrage an Server stellt. Zugriffe vom Robot archiveorg_bot werden mit einem Anteil von 52.8 % am häufigsten mit der HTTP-Version 1.0 registriert.
Version | Anteil |
---|---|
1.0 | 52.77 % |
1.1 | 47.23 % |
Dateitypen
In folgender Tabelle sind Dateitypen aufgelistet, welcher der Robot archiveorg_bot von Servern abruft. Der Robot archiveorg_bot ruft am häufigsten die Dateitypen TXT, JS, ICO ab.
Dateityp | Anteil |
---|---|
TXT | 50.31 % |
JS | 14.81 % |
ICO | 12.96 % |
HTML | 12.96 % |
PNG | 2.78 % |
JPG | 2.16 % |
PHP | 1.85 % |
CSS | 1.85 % |
JSON | 0.31 % |
PHP- | 0 % |
Kontakt
Webseite | Link |
Verweise
Es sind keine weiterführende Verweise zu dem Robot archiveorg_bot bekannt. Du hast weitere wichtige Informationen zu archiveorg_bot? Dann freuen wir uns jetzt über Deinen Kommentar!