Logo Araneae-online

Statistiken

Wie viele Personen sehen sich die Inhalte der Internetseite überhaupt an? Was interessiert sie an? Wer sind sie? Was hat sie hierher gebracht? Wie, mit welchen Geräten und Browser (>> Browseraufteilung) steuern sie die Seiten an? Um Trends schätzen zu können: wann kommen wie viele?
Jeder Aufruf einer Internetseite hinterlässt eine Datenspur in den "Logfiles", die der Internet Service Provider (ISP; zum Beispiel Strato, 1&1, Urospace oder United Internet) der Webadministration zur Verfügung stellt.

Beispiele

65.55.106.135 - - [21/Oct/2009:00:23:40 +0200]
"GET /rss/2008-iv/2008-12-29.html HTTP/1.1" 200 7532
www.pflegestufe.info "-" "msnbot/2.0b (+http://search.msn.com/msnbot.htm)" "-"..9.1.3)
Gecko/20090824 Firefox/3.5.3" "-"

Die IP-Adresse (Zeile 1) informiert darüber, von welchem Internetserver der Seitenaufruf kam. Sekundengenau wird gespeichert, wann zugegriffen wurde und welcher Datei das Interesse galt, in diesem Fall Sie verlassen die Homepage "www.pflegestufe.info/rss/2008-iv/2008-12-29.html". Der Antwortcode 200 (Zeile 2) steht für eine ordnungsgemäße Bearbeitung der Anfrage, daneben stehen die übermittelten Bytes (7532). Am Schluss wird noch informiert, dass "msnbot", also der Crawler der Microsoft Suchmaschine, die Anfrage startete. Wer hinter der IP-Adresse steckt, kann in Online-Datenbanken nachgeschlagen werden. Zum Beispiel unter Sie verlassen die Homepage http://whatismyipaddress.com/ip-lookup. In diesem Beispiel kam die Anfrage von einem Server, der auf die Microsoft Cooperation registriert ist. 2009 war der Server zu dieser IP in Wichita (Kansas, USA) registriert. 2012 soll der Server in Redmont (State Washington, USA) stehen. Angegeben wird auch, welche Seite aufgerufen wurde (die Datei /rss/2008-iv/2008-12-29.html auf www.pflegestufe.info) und mit welcher Software der Aufruf gestartet wurde (im Beispiel wird "Firefox" obwohl die Anfrage von einem Microsoft Bot/Crawler kommt).

BesucherstatistikEs scheint, als ließe sich hieraus leicht darauf schließen, welche Seite auf das größte Interesse bei der Menschheit stößt: Einfach nachsehen, welche am häufigsten in den Log Files erscheint. Auf den zweiten Blick fällt auf: Nicht jeder Dateiaufruf kommt von einem Menschen. Nicht nur Suchmaschinen lassen Webcrawler, Software-Agenten, auf das WWW los, um ihre Datenbanken aktuell zu halten. Auch Werbetreibende nutzen Bots, um E-Mail-Adressen oder Telefonnummern zu finden, mit denen Datenbanken gefüllt werden. Es gibt auch Seitenaufrufe, die aus technischen Gründen nicht erfolgreich beendet werden können und dann wiederholt werden und Ähnliches, was diese Statistik verfälschen kann. Dazu kommt: Auf diese Weise lässt sich nicht sagen, welche Information ein Mensch auf der Seite wahrgenommen hat. Ein Indiz kann sein, wie lang bei den Inhalten verweilt wurde. Es muss also eine Zeitspanne pro Besucher ermittelt werden. Dazu werden mehrere Seitenaufrufe, die von einer IP-Adresse kamen zu einem "Besuch" oder "Session" zusammengefasst und die Zeitangaben summiert. Wenn auf einer Webseite eine Zeit von durchschnittlich 1:9 Minuten pro Besuch angegeben werden, kann das bedeuten, dass viele Webcrawler gezählt wurden oder dass die Erwartungen der Besuchenden nicht erfüllt wurden.
Eine weitere Tücke liegt im System. Während größere Firmen feste IP-Adressen haben, zu denen Informationen nachgelesen werden können, werden normalen Menschen von ihren Internet Service Providern dynamische IP-Adresse zugewiesen. Wenn die Verbindung aus technischen Gründen abbricht oder der Computer abgeschaltet wird, gibt es beim Wiederaufbau oft eine neue IP-Adresse. Dynamische IP-Adressen werden selbstverständlich nicht dauerhaft vergeben. Hat sich ein Kunde ausgeloggt, wird nach einer vom ISP zu bestimmenden Pause, dieselbe IP-Adresse an den Nächsten vergeben. Es ist wenig wahrscheinlich, dass die zweite Person zufällig auf dieselben Internetseiten zugreift, trotzdem: Zur Auswertung muss eine Dauer für einen Besuch festgelegt werden. Die beiden größten deutschen Internet Service Provider weichen hier deutlich voneinander ab: Bei Strato werden alle Seitenaufrufe zusammengefasst, die innerhalb von 24 Stunden von einer IP-Adresse kommen, bei 1&1 sind es 30 min. Diese Zeitangaben sind nicht verbindlich. Der ISP kann das nach Belieben ändern.
Daraus folgt: Die statistischen Angaben sind immer mit Vorsicht zu genießen. Statistiken, die aus verschiedenen Quellen kommen, sind in der Regel nach unterschiedlichen, oft wenig transparenten Regeln erstellt und kaum vergleichbar. Sinnvolle Aussagen lassen sich machen, wenn die Verhältnisse zwischen den Einzelergebnissen eines Auswertungswerkzeugs betrachtet werden.

Quellen

Strato Erklärung

Sessions (Sitzungen) gibt an, wie viele unterschiedliche Domains auf Ihre Internet-Präsenz zugegriffen haben. Dabei wird der Zugriff einer Domain pro Tag jeweils nur einmal gewertet.

Erläuterungen von 1&1:

Alle Seitenaufrufe von einem Computer werden zu einem Besuch zusammengefasst. Die Besuche werden anhand der IP-Adresse und der Browserkennung eindeutig identifiziert. Da es sein kann, dass sich mehrere Menschen einen Computer teilen (z. B. im Internet-Café), ist die Anzahl der Besuche nicht identisch mit der Anzahl der Besucher. Ein Besuch beginnt mit der ersten aufgerufenen Seite Ihrer Homepage und endet mit dem Verlassen Ihrer Homepage. Er wird nur dann als Besuch gezählt, wenn die aufgerufenen Seiten vollständig geladen wurden. Ein Besuch kann maximal 30 Minuten dauern. Dabei wird nicht berücksichtigt, ob der Besucher aktiv auf eine der Internetseiten surft oder ob er gerade nur die Seite geöffnet hat und gerade etwas ganz anderes macht. Es gilt immer: Wenn sich ein Besucher länger als 30 Minuten auf Ihrer Homepage aufhält, werden seine Besuche mehrfach gezählt.


Letzte Aktualisierung: Mittwoch, 14.11.2012