Wissenschaftliche Publikationen

Dem User über die Schulter schauen
Ein neues Verfahren zum Tracking des Online-Nutzungsverhaltens


Autor: Dr. rer. pol. Bernhard Engel, Frank Maruccia, Christian Loeb
Erschienenin Planung & Analyse, 4/2001


Die Erforschung des Online-Nutzungsverhaltens verfolgt grundsätzlich eine den übrigen Medien vergleichbare Zielsetzung: Ausgehend von einer Beobachtung des Nutzungsverhaltens einzelner Personen werden durch spätere Aggregation dieser Nutzungsdaten Medialeistungswerte ermittelt. Bei den klassischen elektronischen Medien Hörfunk und Fernsehen ist es wegen ihres Charakters als Broadcast-Medien nicht möglich, einen detailgetreuen Abgleich der Daten zwischen Sender und Rezipient vorzunehmen. Beim Medium Internet ist dies grundsätzlich möglich: jeder Nutzung durch den Rezipienten steht eine entsprechende Anforderung (Request) an einen Server gegenüber.

Für die Messung des Online-Nutzungsverhaltens gibt es zwei unterschiedliche Ansätze: zum einen serverseitig, beispielsweise bei einem Inhaltsanbieter oder Provider, zum anderen clientseitig, also auf dem Rechner des Users. Auf einer serverseitigen Vorgehensweise basieren zum Beispiel die IVW-Messung (Informationsgemeinschaft zur Feststellung der Verbreitung von Werbeträgern e.V.) oder die Logfile-Analyse. Beide Methoden sind zumindest theoretisch im statistischen Sinne "Vollerhebungen". Das Onlinemessverfahren der IVW nutzt dabei die Übertragung eines gesonderten, nicht sichtbaren Pixels auf allen gemeldeten Angeboten und misst damit die Anzahl der Seiten-Aufrufe, was jedoch mit dem ein oder anderen technischen Problem (Stichworte: Proxyserver, Browsercache) behaftet ist. Die Logfile-Analyse ist dagegen ein Messverfahren, welches nicht von einer übergeordneten, neutralen Stelle, sondern von jedem Anbieter einer Website unter Zuhilfenahme spezieller Software einfach selbst durchgeführt werden kann.

camtasia screencam

Für beide Methoden gilt: Bei der Analyse der gewonnenen Daten ist keine (oder nur eine sehr eingeschränkte) Differenzierung nach Zielgruppen möglich. Weiterhin kann die Logfile-Analyse nur Daten über das Nutzungsverhalten auf den eigenen Angeboten, nicht aber über die Nutzung auf Websites von Wettbewerbern, liefern. Hier setzt die userzentrierte Forschung an: Durch die Verknüpfung von Messdaten mit den soziodemographischen Daten der Besucher schafft sie die Möglichkeit zur Zielgruppendifferenzierung. Für dieses Verfahren muss zunächst Software auf dem Rechner des Internetnutzers installiert werden, welche die Nutzungsvorgänge misst und die Daten an eine Auswertungszentrale überträgt. In Deutschland sind gegenwärtig drei Panel dieser Art in Betrieb, nämlich von MMXI, Nielsen/NetRatings und NetValue. Diese Panel unterscheiden sich im Hinblick auf mehrere methodische Merkmale wie zum Beispiel der Abgrenzung der Grundgesamtheit, der Mess-Software, der Gewichtung. Typische Reports beschreiben die allgemeine Marktsituation zum Beispiel in der Form von Hitlisten, Nutzerstrukturvergleichen oder Ähnlichem (also beispielsweise Platz 1 Yahoo, 2 Lycos, 3 Amazon); oder sie beschreiben besonders erwähnenswerte Entwicklungen im Online-Markt, zum Beispiel Pressemitteilung MMXI Frauen surfen praktisch: 1. bluemountain.com, 2. arbeitsamt.de, 3. quelle.de, 4. aldi.de. Alle drei Anbieter erheben den Anspruch der Repräsentativität für die Internetnutzer in Deutschland, obwohl teilweise erhebliche Unterschiede in Ergebnissen und Panelstruktur festzustellen sind. Allein aus ökonomischen Gründen haben die Panel eine Größe, die nur eine Betrachtung stark frequentierter Angebote erlaubt. Eine gezielte Detailanalyse der Nutzung innerhalb der Angebote findet kaum statt. Weiterhin können bei Teilnehmern solcher Reichweitenpanel nicht gezielt bestimmte Aspekte der Nutzung forciert erhoben werden, da dies das Ziel der Reichweitenmessung beeinträchtigen würde und es damit nicht mehr als allgemeingültig angesehen werden könnte.

Die Generierung von Daten, die eine zielgruppenspezifische, tiefergehende Analyse einer spezifischen Website ermöglichen, wird von vielen Websiteanbietern für die Vermarktung und Optimierung ihrer Angebote als immer wichtiger betrachtet. Diese Situation war für MediaTransfer Netresearch & Consulting der Ausgangspunkt für die Entwicklung eines Trackingtools, das die Möglichkeit zur detaillierten, personalisierten Website-Nutzungsanalyse bietet. Mit dem Einsatz dieses Tools geht der Aufbau kundenspezifischer Panel einher. Entsprechend der Zielsetzung des Anbieters können Größe und Zielgruppe ganz gezielt gesteuert werden, was eine tiefergehende Datenanalyse erlaubt, als sie allgemeine Reichweitenpanel zu leisten in der Lage sind.

Die Datenqualität eines solchen Panels steht und fällt natürlich mit einer zuverlässigen Referenzdatei und der sorgfältigen Rekrutierung der Teilnehmer. Dieser Punkt soll an dieser Stelle jedoch nicht weiter vertieft werden. Vielmehr geht es den Autoren darum, die technischen Voraussetzungen zur validen Messung des Nutzungsverhaltens zu dokumentieren.

Bereits im Vorfeld der Entwicklung wurde ein umfangreicher Anforderungskatalog an Methodik und Technik entwickelt. Eine wesentliche Anforderung war dabei zunächst einmal die exakte Erfassung von Basisdaten der Internetnutzung (zum Beispiel vollständige URL, Betrachtungszeitraum, Betrachtungsdauer). Weiterhin müssen Informationen wie der eventuelle Abbruch des Ladevorgangs durch den Nutzer und die Ladezeit der jeweiligen Seite erfasst werden. Da viele Sites dynamische Inhalte aufweisen, reicht die Erfassung der aufgerufenen URL alleine nicht aus. Hier bestand die Herausforderung darin, Inhalte oder die gesamte Website flexibel und dem Erhebungsziel entsprechend zu erfassen, ohne Unmengen an überflüssigen Daten zu generieren, deren Übertragung die Internetnutzung beeinträchtigen. Die Erfassung von Seiteninhalten sollte sich darüber hinaus flexibel und auch noch während der Feldzeit anpassen lassen. Eine weitere wichtige Anforderung ist der Schutz der erhobenen Daten gegen Manipulation bei der Zwischenablage auf dem Probandenrechner und bei der Übertragung durch den Einsatz geeigneter Kryptografie. Das gesamte System muss zudem kompatibel zu allen gängigen Consumer-Betriebssystemen und Browsern (Internet Explorer, Netscape) sein und darf im Betrieb nicht zu einer spürbaren Beeinträchtigung der Rechengeschwindigkeit führen. Um eine personalisierte Erhebung zu gewährleisten, sollte die Teilnahme nur nach einer nutzerbasierten, individuellen Anmeldung möglich sein. Nur so lässt sich die Gefahr der Ergebnisbeeinflussung durch die Messung von Fremdnutzung weitestgehend minimieren. Darüber hinaus ist zur Datenanalyse eine entsprechend leistungsfähige Administrationsumgebung für die Teilnehmerselektion, das Panelmanagement und die Feldsteuerung notwendig. Hier konnte zu großen Teilen auf das bestehende OTAQ-System der Hamburger Forscher zurückgegriffen werden.

ansicht baumstruktur

Der gemeinsam von MediaTransfer Netresearch & Consulting und dem ZDF durchgeführte Test hatte einen experimentellen Charakter, das heißt, in einem kontrollierten Testumfeld wurden Nutzungsvorgänge durchgeführt und anhand dreier verschiedener Methoden aufgezeichnet. Als Basis zur Erfassung der‚ wirklichen' Nutzungsaktivitäten diente eine Aufzeichnungssoftware für den Desktop. Hier werden alle Aktivitäten framegenau in einem Videoformat aufgezeichnet und mit einem Timecode versehen. Im Hintergrund war das Trackingtool aktiv und hat nach dem oben beschriebenen Verfahren auf der Userseite (Client) die Aktivitäten protokolliert. Auf der Serverseite wurden die Requests im Rahmen des standardmäßigen Webserver-Logfiles aufgezeichnet. Der Vergleich zwischen Video und den beiden Logfiles ermöglicht es, die ‚wirkliche' Situation beim Rezipienten den Messungen gegenüberzustellen (siehe Abbildung 1).

Zum Ergebnis des Experiments
Insgesamt ist dieses Messverfahren sehr differenziert und erlaubt nicht nur eine Rekonstruktion des Ablaufs einer Internet-Session, sondern protokolliert auch wesentliche Contentcharakteristika, es erfasst in faktisch allen Bereichen je nach Konfiguration mehr als ein Standard-Logfile. Zwei Beispiele verdeutlichen dies: im ZDF-Serverlog wird das Abspielen eines Trailers nur mit zwei GET-Requests protokolliert (GET /download/ streaming/video.asp ... sowie ein IVW Pixel). Das Trackingtool protokolliert hier deutlich aussagekräftiger: So ist im HTML-Code erkennbar, dass es sich um den Trailer "Der Sommersonntag handelt, der mit dem RealPlayer in einem Fenster bestimmter Größe abgespielt wird. Auch die Parameter für das Abspielen werden aufgezeichnet. So ist es durchaus von Interesse zu wissen, ob ein Video live oder gepuffert gesehen wird. Der Test liefert natürlich auch Erkenntnisse darüber, welche Anforderungen gegebenenfalls noch zusätzlich wünschenswert sind, wie beispielsweise Daten zum Einsatz paralleler Software oder zusätzliche Angaben zu getätigten Downloads. Die in der Tabelle exemplarisch ausgewerteten Nutzungsvorgänge und Aufenthaltsdauern zeigen einen Ausschnitt der Möglichkeit der Analyse. Abweichungen zwischen Methode 2 (Serverlog) und Methode 3 (MediaTraxx) resultieren aus den unterschiedlichen Messzeitpunkten: Methode 1 protokolliert eine Anfrage erst bei deren Eintreffen, Methode 3 in dem Moment, in dem der User die Anfrage auslöst. Das erklärt auch die beinahe exakte Übereinstimmung der Messdaten zwischen Methode 3 und durch Methode 1 (Screencam) ermittelten Werten. Dennoch: Keine Messmethode ist perfekt, so werden Seitenwechsel aus dem Browsercache (zum Beispiel beim Zurückgehen mit dem Backbutton) oft nicht aufgezeichnet, weder im Logfile noch innerhalb von Methode 3. Auch SSL-Verbindungen werden aus Datenschutz- und allgemeinen technischen Gründen nicht protokolliert (siehe Abbildung2). Die Detailanalyse der Ergebnisse ist stets eine Herausforderung, insbesondere die Trennung von wichtigen und unwichtigen Informationen sowie die Zusammenfassung der Informationen zu verallgemeinerungsfähigen Aussagen. Die Analyseroutinen müssen für die meisten Erkenntnisziele entsprechend angepasst werden. Dieser Arbeitsschritt erfordert speziell bei der Nutzungsanalyse in der Website bereits im Vorfeld der Auswertung eine genaue Strukturanalyse der zu untersuchenden Sites nach dem Motto: "Ich kann nur messen, was ich verstehe." Die Auswertung der Nutzungsdaten in Verbindung mit demographischen und quantitativen Erhebungsdaten rechtfertigt jedoch den Aufwand, kann doch so erstmals eine Kopplung zwischen praktisch nonreaktiv erhobenen Verhaltensdaten und Einstellungsdaten innerhalb der Zielgruppe erfolgen. Aus dieser Kombination herleitbare Aussagen zum Nutzungsverhalten in spitzen Zielgruppen sind so erstmals möglich. Darüber hinaus kann dieses System verwendet werden, um die überall sichtbaren gravierenden Unterschiede zwischen user- und serverzentrierter Forschung bezüglich der Messung besser zu verstehen, die Ursachenforschung für die Unterschiede bei den Ergebnissen dieser Messverfahren präziser zu betreiben und die im Markt befindlichen unterschiedlichen Ansätze besser zu evaluieren.

tabelle auswertung

For further informations please contact:

press@mediatransfer.de

 

UNTERNEHMENLEISTUNGSSPEKTRUMVORGEHENSWEISEPRESSE

©2009 Harris Interactive AG