archiveorg_bot

Inhaltsverzeichnis Verbergen

Der Robot archiveorg_bot indexiert Webseiten für die Nutzung in einer Suchmaschine. archiveorg_bot analysiert Inhalte von Webseite und übernimmt diese in den Index einer Datenbank. Über eine Suchfunktion wird Internetnutzer bei Übereinstimmung von Suchbegriffen entsprechende Webseiten angezeigt.

Der Betreiber beschreibt die Funktionalität und Verhaltensweise des Robots archiveorg_bot selbst wie folgt:

The Internet Archive is a nonprofit digital library that preserves web data and makes it available for research purposes through the Wayback Machine. We began archiving the web in 1996, and currently have preserved over 150 billion web documents. The Internet Archive partners with universities,…

Zugriffe vom Robot archiveorg_bot werden mit einem Anteil von 14.5 % am häufigsten von der IP-Adresse 207.241.236.85 und dem Server crawl910.us.archive.org registriert. Zugriffe vom Robot archiveorg_bot werden mit einem Anteil von 53.6 % am häufigsten mit dem User-Agent Mozilla/5.0 (compatible; archive.org_bot +http://archive.org/details/archive.org_bot) registriert. Zugriffe vom Robot archiveorg_bot werden mit einem Anteil von 54.7 % am häufigsten mit der HTTP-Version 1.0 registriert. Der Robot archiveorg_bot ruft am häufigsten die Dateitypen TXT, JS, ICO ab.

Merkmale

In der folgenden Tabelle sind Merkmale des Robots archiveorg_bot aufgelistet. Die Merkmale werden automatisch analysiert und erkannt. So wird z. B. erfasst ob der Robot archiveorg_bot die Robots (TXT) oder die Sitemap (XML) einer Webseite ausliest. Ebenfalls wird erfasst, wie viele Webserver-Zugriffe der Robot archiveorg_bot pro Minute und Domain im Schnitt ausführt. Ein freundlicher Robot sollte nicht mehr als 30 Webserver-Zugriffe pro Minute auf eine Domain ausführen. Der Durchschnitt wird über alle erfassten Webserver-Zugriffe des Robot archiveorg_bot auf eine Domain von maximal den letzten 30 Tagen gemittelt. Ein Webserver-Zugriffe meint einen einzelnen HTTP-Zugriff, z. B. GET oder HEAD und alle weiteren.

Anzahl analysierter Zugriffe	558
Wird die sitemap.xml ausgelesen?	Nein
Wird die robots.txt ausgelesen?	Ja
∅ Anzahl Zugriffe pro Minute	-
Anteil ungültiger Zugriffe *	-

* Der Anteil ungültiger Zugriffe berechnet sich aus dem Verhältnis von Zugriffen des Robots welche einen erfolgreichen HTTP-Status-Code (2xx) sowie einen nicht erfolgreichen HTTP-Status-Code (4xx) zur Folge haben. Ab einem Anteil von 30% ungültigen HTTP-Status-Codes wird der Wert in roter Farbe markiert. Ein hoher Anteil ungültiger HTTP-Status-Codes kann auf einen nicht korrekt funktionierenden Robot oder eine defekte Webseite zurückzuführen sein. Ebenfalls ist es möglich das der Robot versucht auf geschützte Bereiche einer Webseite zuzugreifen. Respektiert der Robot die robots.txt Datei kann der Webseitenbetreiber hierüber den Robot den Ausschluss dieser URLs signalisieren.

IP-Adressen

In folgender Tabelle sind IP-Adressen aufgelistet, von welcher der Robot archiveorg_bot arbeitet. Ist das Land der IP-Adresse bekannt, wird dieses mit einer entsprechende Landesflagge symbolisiert. Zu jeder IP-Adresse wird außerdem die Name der Organisation angezeigt welche den Server betreibt, sowie Kontaktinformationen für die Meldung von Abuse-Fällen. Zugriffe vom Robot archiveorg_bot werden mit einem Anteil von 14.5 % am häufigsten von der IP-Adresse 207.241.236.85 und dem Server crawl910.us.archive.org registriert.

IP-Adresse	Server	Organisation	Abuse-Kontakt
207.241.236.85 (14.5 %)	crawl910.us.archive.org	-	-
207.241.235.133 (7 %)	crawl900.us.archive.org	-	-
207.241.235.164 (5.7 %)	crawl901.us.archive.org	-	-
207.241.231.45 (4.5 %)	crawl896.us.archive.org	-	-
207.241.231.149 (4.1 %)	crawl422.us.archive.org	-	-
207.241.234.64 (3.4 %)	crawl505.us.archive.org	-	-
207.241.231.164 (3.2 %)	crawl344.us.archive.org	-	-
207.241.231.143 (3 %)	crawl428.us.archive.org	-	-
207.241.231.150 (3 %)	crawl421.us.archive.org	-	-
207.241.233.138 (2.9 %)	crawl866.us.archive.org	-	-
207.241.236.84 (2.9 %)	crawl909.us.archive.org	-	-
207.241.229.50 (2.7 %)	crawl812.us.archive.org	-	-
207.241.234.62 (2.5 %)	crawl503.us.archive.org	-	-
207.241.234.63 (2.2 %)	crawl504.us.archive.org	-	-
207.241.231.147 (2.2 %)	crawl424.us.archive.org	-	-
207.241.231.163 (2 %)	crawl345.us.archive.org	-	-
207.241.229.49 (2 %)	crawl813.us.archive.org	-	-
207.241.236.83 (2 %)	crawl346.us.archive.org	-	-
207.241.229.51 (1.6 %)	crawl811.us.archive.org	-	-
207.241.235.230 (1.6 %)	crawl906.us.archive.org	-	-
207.241.229.227 (1.4 %)	crawl890.us.archive.org	-	-
207.241.233.139 (1.4 %)	crawl865.us.archive.org	-	-
207.241.229.48 (1.3 %)	crawl814.us.archive.org	-	-
207.241.233.247 (1.3 %)	crawl800.us.archive.org	-	-
207.241.231.148 (1.3 %)	crawl423.us.archive.org	-	-
207.241.235.147 (1.1 %)	wbgrp-crawl049.us.archive.org	-	-
207.241.234.61 (1.1 %)	crawl502.us.archive.org	-	-
207.241.225.181 (0.9 %)	crawl858.us.archive.org	-	-
207.241.225.182 (0.9 %)	crawl857.us.archive.org	-	-
207.241.229.150 (0.7 %)	crawl809.us.archive.org	-	-
207.241.234.15 (0.7 %)	crawl807.us.archive.org	-	-
207.241.231.151 (0.7 %)	crawl420.us.archive.org	-	-
207.241.233.150 (0.5 %)	crawl864.us.archive.org	-	-
207.241.235.183 (0.5 %)	crawl861.us.archive.org	-	-
13.57.39.16 (0.5 %)	ec2-13-57-39-16.us-west-1.compute.amazonaws.com	-	-
3.109.150.184 (0.4 %)	ec2-3-109-150-184.ap-south-1.compute.amazonaws.com	-	-
54.160.206.72 (0.4 %)	ec2-54-160-206-72.compute-1.amazonaws.com	-	-
44.213.126.161 (0.4 %)	ec2-44-213-126-161.compute-1.amazonaws.com	-	-
193.143.1.119 (0.4 %)	-	-	-
207.241.232.41 (0.2 %)	crawl106.us.archive.org	-	-
207.241.232.42 (0.2 %)	crawl105.us.archive.org	-	-
179.43.176.91 (0.2 %)	-	-	-
179.43.154.200 (0.2 %)	-	-	-
54.160.69.133 (0.2 %)	ec2-54-160-69-133.compute-1.amazonaws.com	-	-
207.241.232.38 (0.2 %)	crawl109.us.archive.org	-	-
207.241.231.165 (0.2 %)	crawl339.us.archive.org	-	-
194.55.186.126 (0.2 %)	-	-	-
185.237.252.77 (0.2 %)	m18077.contaboserver.net	-	-
3.26.12.211 (0.2 %)	ec2-3-26-12-211.ap-southeast-2.compute.amazonaws.com	-	-
13.233.219.127 (0.2 %)	ec2-13-233-219-127.ap-south-1.compute.amazonaws.com	-	-
3.23.113.224 (0.2 %)	ec2-3-23-113-224.us-east-2.compute.amazonaws.com	-	-
3.70.14.61 (0.2 %)	ec2-3-70-14-61.eu-central-1.compute.amazonaws.com	-	-
46.8.202.111 (0.2 %)	-	-	-
3.231.219.126 (0.2 %)	ec2-3-231-219-126.compute-1.amazonaws.com	-	-
123.249.22.21 (0.2 %)	ecs-123-249-22-21.compute.hwclouds-dns.com	-	-
3.133.59.141 (0.2 %)	ec2-3-133-59-141.us-east-2.compute.amazonaws.com	-	-
207.241.235.249 (0.2 %)	crawl842.us.archive.org	-	-
18.191.241.22 (0.2 %)	ec2-18-191-241-22.us-east-2.compute.amazonaws.com	-	-
18.234.247.73 (0.2 %)	ec2-18-234-247-73.compute-1.amazonaws.com	-	-
3.228.4.97 (0.2 %)	ec2-3-228-4-97.compute-1.amazonaws.com	-	-
34.223.54.151 (0.2 %)	ec2-34-223-54-151.us-west-2.compute.amazonaws.com	-	-
35.170.80.183 (0.2 %)	ec2-35-170-80-183.compute-1.amazonaws.com	-	-
35.80.30.196 (0.2 %)	ec2-35-80-30-196.us-west-2.compute.amazonaws.com	-	-
13.126.80.172 (0.2 %)	ec2-13-126-80-172.ap-south-1.compute.amazonaws.com	-	-
52.14.140.19 (0.2 %)	ec2-52-14-140-19.us-east-2.compute.amazonaws.com	-	-
34.222.0.172 (0.2 %)	ec2-34-222-0-172.us-west-2.compute.amazonaws.com	-	-
54.226.104.201 (0.2 %)	ec2-54-226-104-201.compute-1.amazonaws.com	-	-
54.198.57.155 (0.2 %)	ec2-54-198-57-155.compute-1.amazonaws.com	-	-
52.91.216.160 (0.2 %)	ec2-52-91-216-160.compute-1.amazonaws.com	-	-
54.91.86.122 (0.2 %)	ec2-54-91-86-122.compute-1.amazonaws.com	-	-
3.235.130.221 (0.2 %)	ec2-3-235-130-221.compute-1.amazonaws.com	-	-
35.175.187.255 (0.2 %)	ec2-35-175-187-255.compute-1.amazonaws.com	-	-
54.193.165.186 (0.2 %)	ec2-54-193-165-186.us-west-1.compute.amazonaws.com	-	-
104.234.204.32 (0.2 %)	-	-	-
207.241.236.164 (0.2 %)	crawl914.us.archive.org	-	-
207.241.236.193 (0.2 %)	crawl917.us.archive.org	-	-
3.215.142.166 (0.2 %)	ec2-3-215-142-166.compute-1.amazonaws.com	-	-
44.224.32.76 (0.2 %)	ec2-44-224-32-76.us-west-2.compute.amazonaws.com	-	-
207.241.234.182 (0.2 %)	crawl804.us.archive.org	-	-
44.213.80.198 (0.2 %)	ec2-44-213-80-198.compute-1.amazonaws.com	-	-
159.223.53.120 (0.2 %)	-	-	-
3.235.10.33 (0.2 %)	ec2-3-235-10-33.compute-1.amazonaws.com	-	-
35.83.250.11 (0.2 %)	ec2-35-83-250-11.us-west-2.compute.amazonaws.com	-	-
34.223.53.133 (0.2 %)	ec2-34-223-53-133.us-west-2.compute.amazonaws.com	-	-
18.246.231.7 (0.2 %)	ec2-18-246-231-7.us-west-2.compute.amazonaws.com	-	-
35.87.53.159 (0.2 %)	ec2-35-87-53-159.us-west-2.compute.amazonaws.com	-	-
3.83.79.22 (0.2 %)	ec2-3-83-79-22.compute-1.amazonaws.com	-	-
3.81.158.125 (0.2 %)	ec2-3-81-158-125.compute-1.amazonaws.com	-	-
54.208.44.132 (0.2 %)	ec2-54-208-44-132.compute-1.amazonaws.com	-	-
3.235.155.161 (0.2 %)	ec2-3-235-155-161.compute-1.amazonaws.com	-	-
94.156.64.15 (0.2 %)	-	-	-
46.19.138.210 (0.2 %)	hostedby.privatelayer.com	-	-
3.128.90.45 (0.2 %)	ec2-3-128-90-45.us-east-2.compute.amazonaws.com	-	-
13.48.190.46 (0.2 %)	ec2-13-48-190-46.eu-north-1.compute.amazonaws.com	-	-
3.111.53.63 (0.2 %)	ec2-3-111-53-63.ap-south-1.compute.amazonaws.com	-	-
91.215.85.29 (0.2 %)	-	-	-
91.215.85.43 (0.2 %)	-	-	-
3.99.220.126 (0.2 %)	ec2-3-99-220-126.ca-central-1.compute.amazonaws.com	-	-
13.58.238.210 (0.2 %)	ec2-13-58-238-210.us-east-2.compute.amazonaws.com	-	-
23.20.65.59 (0.2 %)	ec2-23-20-65-59.compute-1.amazonaws.com	-	-
3.112.22.81 (0.2 %)	ec2-3-112-22-81.ap-northeast-1.compute.amazonaws.com	-	-
3.0.96.28 (0.2 %)	ec2-3-0-96-28.ap-southeast-1.compute.amazonaws.com	-	-

User-Agents

In folgender Tabelle sind User-Agents aufgelistet, mit welcher der Robot archiveorg_bot HTTP-Anfrage an Server stellt. Zugriffe vom Robot archiveorg_bot werden mit einem Anteil von 53.6 % am häufigsten mit dem User-Agent Mozilla/5.0 (compatible; archive.org_bot +http://archive.org/details/archive.org_bot) registriert.

User-Agent	Anteil
Mozilla/5.0 (compatible; archive.org_bot +http://archive.org/details/archive.org_bot)	53.58 %
Mozilla/5.0 (compatible; archive.org_bot +http://archive.org/details/archive.org_bot) Zeno/0569f25 warc/v0.8.33	16.13 %
Mozilla/5.0 (compatible; archive.org_bot +http://www.archive.org/details/archive.org_bot)	11.83 %
Mozilla/5.0 (compatible; archive.org_bot +http://archive.org/details/archive.org_bot) Zeno/a310b8b warc/v0.8.28	6.81 %
Mozilla/5.0 (compatible; archive.org_bot +http://archive.org/details/archive.org_bot) Zeno/78c9471 warc/v0.8.33	4.12 %
Mozilla/5.0 (compatible; archive.org_bot +http://archive.org/details/archive.org_bot) Zeno/52b2551 warc/v0.8.38	3.76 %
Mozilla/5.0 (compatible; archive.org_bot/3.3.0 +http://pandora.nla.gov.au/crawl.html)	1.08 %
Mozilla/5.0 (compatible; archive.org_bot +http://archive.org/details/archive.org_bot) Zeno/02b94f2 warc/v0.8.33	1.08 %
Mozilla/5.0 (compatible; archive.org_bot +http://archive.org/details/archive.org_bot) Zeno/987b8a5 warc/v0.8.32	0.9 %
Mozilla/5.0 (compatible; archive.org_bot +http://archive.org/details/archive.org_bot) Zeno/ae4878c warc/v0.8.39	0.36 %
Mozilla/5.0 (compatible; archive.org_bot +http://archive.org/details/archive.org_bot) Zeno/f14ac37 warc/v0.8.33	0.18 %
Mozilla/5.0 (compatible; archive.org_bot +http://archive.org/details/archive.org_bot) Zeno/41faad0 warc/v0.8.32	0.18 %

HTTP-Protokoll Version

In folgender Tabelle sind HTTP-Protokoll Versionen aufgelistet, mit welcher der Robot archiveorg_bot HTTP-Anfrage an Server stellt. Zugriffe vom Robot archiveorg_bot werden mit einem Anteil von 54.7 % am häufigsten mit der HTTP-Version 1.0 registriert.

Version	Anteil
1.0	54.66 %
1.1	45.34 %

Dateitypen

In folgender Tabelle sind Dateitypen aufgelistet, welcher der Robot archiveorg_bot von Servern abruft. Der Robot archiveorg_bot ruft am häufigsten die Dateitypen TXT, JS, ICO ab.

Dateityp	Anteil
TXT	50.46 %
JS	14.55 %
ICO	13 %
HTML	13 %
PNG	2.79 %
JPG	2.17 %
PHP	1.86 %
CSS	1.86 %
JSON	0.31 %
PHP-	0 %

Kontakt

Webseite

Link

Verweise

Es sind keine weiterführende Verweise zu dem Robot archiveorg_bot bekannt. Du hast weitere wichtige Informationen zu archiveorg_bot? Dann freuen wir uns jetzt über Deinen Kommentar!

Bewertung

Klicke auf die Sterne um deine Erfahrungen mit diesem Robot zu bewerten!

Durchschnittliche Bewertung 1 / 5. Anzahl Bewertungen: 1

Bisher keine Bewertungen! Sei der Erste, der diesen Robot bewertet.

Merkmale

IP-Adressen

User-Agents

HTTP-Protokoll Version

Dateitypen

Kontakt

Verweise

Schreibe einen Kommentar Antworten abbrechen

Meisten aufgerufene Robots

Am besten bewertete Robots

Am meisten gesuchte Robots

Mehr

Nach einem Robot suchen