Überblick:
Um die Dimensionen einer Suchmaschine ein wenig zu begreifen, hier
beispielhaft einige technische Daten.
Die meisten Anbieter halten sich aus Angst vor Vergleichen mit den technischen
Angaben über die Hardware und die Anbindung sehr zurück.
Der Klassenprimus Alta Vista hat damit keine Probleme:
- Die Alta Vista Indizierungssoftware bewältigt pro Stunde ein Gigabyte Text. Der Gesamtindex beträgt 40 Gigabyte. 3 Millionen Seiten werden täglich gescannt. Die 16 Maschinen, auf denen die Indizierung und Suchabfrage stattfindet, arbeiten mit je 8 Gigabyte Arbeitsspeicher, 10 parallelen Alpha - Prozessoren, und 260 GB Festplattenkapazität. Die Vorkommunikation ins Netz erledigen ein paar andere Rechner: Mehrere Alpha - Rechner mit 256 MB Arbeitsspeicher und 4 Gigabyte Festplatten bedienen die Anfragen.
- Swiss Search, eine Suchmaschine für die gesamte Schweiz und somit ein vergleichsweise kleiner Anbieter schafft es mit folgender Hardware, einen flotten und umfassenden Service anzubieten. Aus der Selbstbeschreibung: "Swiss Search läuft auf einer Sun Sparcstation 5 und ist mit 128 MB Arbeitsspeicher ausgerüstet. Die Datenbank wird auf einem 40 Giga Raid gelagert. Die Vernetzung mit Eunet und Global One garantiert eine schnelle Performance. Der Spider und die Datenbank sind programmiert von der Firma Relog AG in Zürich. Es werden laufend neue Features entwickelt, damit Sie möglichst gezielt und direkt die gewünschten Informationen finden."
- Die Kongreßbibliothek in Washington besitzt 16 Millionen Bücher und 100 Millionen andere Dokumente wie Magazine, Landkarten, Filme, und andere Sammlungen. Jeden Tag kommen 7000 Dokumente dazu. Obwohl nur ein kleiner Bruchteil davon in digitaler Form verfügbar ist werden täglich durchschnittlich 1,27 Gigabyte Daten von der Website übertragen.
Ein Ausschnitt der Abrufe pro Jahr und Land:
Bytes |
Clients |
Domain |
Country |
1.449.497.748 |
192166 |
fr |
France |
10.732.011 |
1494 |
gb |
Great Britain (UK) |
1.883.688.455 |
296050 |
de |
Germany |
256.366.693 |
37126 |
ru |
Russian Federation |
5.787 |
3 |
sa |
Saudi Arabia |
114.949 |
13 |
uz |
Uzbekistan |
104.600.529.660 |
14181050 |
com |
US Commercial |
- MetaGer,
die deutsche Metasuchmaschine, macht zur Hardware folgende Angaben:
"Eine Siemens-Nixdorf RM600 (Betriebssystem: ReliantUNIX Version 5.43),
ausgestattet mit 2 CPUs R4400, 512 MB RAM und 100 GB Festplatten an einem
dedizierten 34-Mbps-BWiN-Anschluß."
- Fireball bearbeitet die ca. 20 Mio.
Seitenabrufe im Monat mit folgender Hardware:
Das Robotersystem und die Indexierung laufen auf einem Digital AlphaServer 4000
(2 CPUs/400 MHZ, 1 GB RAM, 80 GB Festplattenspeicher als RAID-Array, hostname:
heavymetal), die Suchanfragen werden auf einem Digital AlphaServer 4100
(4 CPUs/400 MHZ, 4 GB RAM, 80 GB Festplattenspeicher als RAID-Array, hostname:
hardrock) bearbeitet.
Beide Rechner sind durch ein FDDI-Interface (Glasfaser) miteinander verbunden
und können im Störungsfall als Backup für den ausgefallenen Rechner
fungieren. Über diese Strecke wird täglich der neue aktuelle Index vom
Roboter/Indexer-Server (heavymetal) zum Suchserver (hardrock) kopiert
(Indexgröße z.Z. ca 15 GB, Kopierzeit ca. 30 Minuten).
Das Roboter-System kontaktiert momentan bei mittlerer Auslastung ca.
500.000 Urls in 24 Stunden.