|
Wissenschaftliche Publikationen
Dem User über die Schulter schauen
Ein neues Verfahren zum Tracking des Online-Nutzungsverhaltens
Autor: Dr. rer. pol. Bernhard Engel, Frank Maruccia, Christian Loeb
Erschienenin Planung & Analyse, 4/2001
Die Erforschung des Online-Nutzungsverhaltens verfolgt grundsätzlich eine den
übrigen Medien vergleichbare Zielsetzung: Ausgehend von einer Beobachtung des
Nutzungsverhaltens einzelner Personen werden durch spätere Aggregation dieser
Nutzungsdaten Medialeistungswerte ermittelt. Bei den klassischen elektronischen
Medien Hörfunk und Fernsehen ist es wegen ihres Charakters als Broadcast-Medien
nicht möglich, einen detailgetreuen Abgleich der Daten zwischen Sender und
Rezipient vorzunehmen. Beim Medium Internet ist dies grundsätzlich möglich:
jeder Nutzung durch den Rezipienten steht eine entsprechende Anforderung
(Request) an einen Server gegenüber.
Für die Messung des Online-Nutzungsverhaltens gibt es zwei unterschiedliche Ansätze:
zum einen serverseitig, beispielsweise bei einem Inhaltsanbieter oder Provider,
zum anderen clientseitig, also auf dem Rechner des Users. Auf einer
serverseitigen Vorgehensweise basieren zum Beispiel die IVW-Messung (Informationsgemeinschaft
zur Feststellung der Verbreitung von Werbeträgern e.V.) oder die
Logfile-Analyse. Beide Methoden sind zumindest theoretisch im statistischen
Sinne "Vollerhebungen". Das Onlinemessverfahren der IVW nutzt dabei
die Übertragung eines gesonderten, nicht sichtbaren Pixels auf allen gemeldeten
Angeboten und misst damit die Anzahl der Seiten-Aufrufe, was jedoch mit dem ein
oder anderen technischen Problem (Stichworte: Proxyserver, Browsercache)
behaftet ist. Die Logfile-Analyse ist dagegen ein Messverfahren, welches nicht
von einer übergeordneten, neutralen Stelle, sondern von jedem Anbieter einer
Website unter Zuhilfenahme spezieller Software einfach selbst durchgeführt
werden kann.

Für beide Methoden gilt: Bei der Analyse der gewonnenen Daten ist keine (oder
nur eine sehr eingeschränkte) Differenzierung nach Zielgruppen möglich.
Weiterhin kann die Logfile-Analyse nur Daten über das Nutzungsverhalten auf den
eigenen Angeboten, nicht aber über die Nutzung auf Websites von Wettbewerbern,
liefern. Hier setzt die userzentrierte Forschung an: Durch die Verknüpfung von
Messdaten mit den soziodemographischen Daten der Besucher schafft sie die Möglichkeit
zur Zielgruppendifferenzierung. Für dieses Verfahren muss zunächst Software
auf dem Rechner des Internetnutzers installiert werden, welche die Nutzungsvorgänge
misst und die Daten an eine Auswertungszentrale überträgt. In Deutschland sind
gegenwärtig drei Panel dieser Art in Betrieb, nämlich von MMXI, Nielsen/NetRatings
und NetValue. Diese Panel unterscheiden sich im Hinblick auf mehrere methodische
Merkmale wie zum Beispiel der Abgrenzung der Grundgesamtheit, der Mess-Software,
der Gewichtung. Typische Reports beschreiben die allgemeine Marktsituation zum
Beispiel in der Form von Hitlisten, Nutzerstrukturvergleichen oder Ähnlichem
(also beispielsweise Platz 1 Yahoo, 2 Lycos, 3 Amazon); oder sie beschreiben
besonders erwähnenswerte Entwicklungen im Online-Markt, zum Beispiel
Pressemitteilung MMXI Frauen surfen praktisch: 1. bluemountain.com, 2.
arbeitsamt.de, 3. quelle.de, 4. aldi.de. Alle drei Anbieter erheben den Anspruch
der Repräsentativität für die Internetnutzer in Deutschland, obwohl teilweise
erhebliche Unterschiede in Ergebnissen und Panelstruktur festzustellen sind.
Allein aus ökonomischen Gründen haben die Panel eine Größe, die nur eine
Betrachtung stark frequentierter Angebote erlaubt. Eine gezielte Detailanalyse
der Nutzung innerhalb der Angebote findet kaum statt. Weiterhin können bei
Teilnehmern solcher Reichweitenpanel nicht gezielt bestimmte Aspekte der Nutzung
forciert erhoben werden, da dies das Ziel der Reichweitenmessung beeinträchtigen
würde und es damit nicht mehr als allgemeingültig angesehen werden könnte.
Die Generierung von Daten, die eine zielgruppenspezifische, tiefergehende
Analyse einer spezifischen Website ermöglichen, wird von vielen
Websiteanbietern für die Vermarktung und Optimierung ihrer Angebote als immer
wichtiger betrachtet. Diese Situation war für MediaTransfer Netresearch &
Consulting der Ausgangspunkt für die Entwicklung eines Trackingtools, das die Möglichkeit
zur detaillierten, personalisierten Website-Nutzungsanalyse bietet. Mit dem
Einsatz dieses Tools geht der Aufbau kundenspezifischer Panel einher.
Entsprechend der Zielsetzung des Anbieters können Größe und Zielgruppe ganz
gezielt gesteuert werden, was eine tiefergehende Datenanalyse erlaubt, als sie
allgemeine Reichweitenpanel zu leisten in der Lage sind.
Die Datenqualität eines solchen Panels steht und fällt natürlich mit einer
zuverlässigen Referenzdatei und der sorgfältigen Rekrutierung der Teilnehmer.
Dieser Punkt soll an dieser Stelle jedoch nicht weiter vertieft werden. Vielmehr
geht es den Autoren darum, die technischen Voraussetzungen zur validen Messung
des Nutzungsverhaltens zu dokumentieren.
Bereits im Vorfeld der Entwicklung wurde ein umfangreicher Anforderungskatalog
an Methodik und Technik entwickelt. Eine wesentliche Anforderung war dabei zunächst
einmal die exakte Erfassung von Basisdaten der Internetnutzung (zum Beispiel
vollständige URL, Betrachtungszeitraum, Betrachtungsdauer). Weiterhin müssen
Informationen wie der eventuelle Abbruch des Ladevorgangs durch den Nutzer und
die Ladezeit der jeweiligen Seite erfasst werden. Da viele Sites dynamische
Inhalte aufweisen, reicht die Erfassung der aufgerufenen URL alleine nicht aus.
Hier bestand die Herausforderung darin, Inhalte oder die gesamte Website
flexibel und dem Erhebungsziel entsprechend zu erfassen, ohne Unmengen an überflüssigen
Daten zu generieren, deren Übertragung die Internetnutzung beeinträchtigen.
Die Erfassung von Seiteninhalten sollte sich darüber hinaus flexibel und auch
noch während der Feldzeit anpassen lassen. Eine weitere wichtige Anforderung
ist der Schutz der erhobenen Daten gegen Manipulation bei der Zwischenablage auf
dem Probandenrechner und bei der Übertragung durch den Einsatz geeigneter
Kryptografie. Das gesamte System muss zudem kompatibel zu allen gängigen
Consumer-Betriebssystemen und Browsern (Internet Explorer, Netscape) sein und
darf im Betrieb nicht zu einer spürbaren Beeinträchtigung der
Rechengeschwindigkeit führen. Um eine personalisierte Erhebung zu gewährleisten,
sollte die Teilnahme nur nach einer nutzerbasierten, individuellen Anmeldung möglich
sein. Nur so lässt sich die Gefahr der Ergebnisbeeinflussung durch die Messung
von Fremdnutzung weitestgehend minimieren. Darüber hinaus ist zur Datenanalyse
eine entsprechend leistungsfähige Administrationsumgebung für die
Teilnehmerselektion, das Panelmanagement und die Feldsteuerung notwendig. Hier
konnte zu großen Teilen auf das bestehende OTAQ-System der Hamburger Forscher
zurückgegriffen werden.

Der gemeinsam von MediaTransfer Netresearch & Consulting und dem ZDF
durchgeführte Test hatte einen experimentellen Charakter, das heißt, in einem
kontrollierten Testumfeld wurden Nutzungsvorgänge durchgeführt und anhand
dreier verschiedener Methoden aufgezeichnet. Als Basis zur Erfassung der‚
wirklichen' Nutzungsaktivitäten diente eine Aufzeichnungssoftware für den
Desktop. Hier werden alle Aktivitäten framegenau in einem Videoformat
aufgezeichnet und mit einem Timecode versehen. Im Hintergrund war das
Trackingtool aktiv und hat nach dem oben beschriebenen Verfahren auf der
Userseite (Client) die Aktivitäten protokolliert. Auf der Serverseite wurden
die Requests im Rahmen des standardmäßigen Webserver-Logfiles aufgezeichnet.
Der Vergleich zwischen Video und den beiden Logfiles ermöglicht es, die ‚wirkliche'
Situation beim Rezipienten den Messungen gegenüberzustellen (siehe Abbildung
1).
Zum Ergebnis des Experiments
Insgesamt ist dieses Messverfahren sehr differenziert und erlaubt nicht nur eine
Rekonstruktion des Ablaufs einer Internet-Session, sondern protokolliert auch
wesentliche Contentcharakteristika, es erfasst in faktisch allen Bereichen je
nach Konfiguration mehr als ein Standard-Logfile. Zwei Beispiele verdeutlichen
dies: im ZDF-Serverlog wird das Abspielen eines Trailers nur mit zwei
GET-Requests protokolliert (GET /download/ streaming/video.asp ... sowie ein IVW
Pixel). Das Trackingtool protokolliert hier deutlich aussagekräftiger: So ist
im HTML-Code erkennbar, dass es sich um den Trailer "Der Sommersonntag
handelt, der mit dem RealPlayer in einem Fenster bestimmter Größe abgespielt
wird. Auch die Parameter für das Abspielen werden aufgezeichnet. So ist es
durchaus von Interesse zu wissen, ob ein Video live oder gepuffert gesehen wird.
Der Test liefert natürlich auch Erkenntnisse darüber, welche Anforderungen
gegebenenfalls noch zusätzlich wünschenswert sind, wie beispielsweise Daten
zum Einsatz paralleler Software oder zusätzliche Angaben zu getätigten
Downloads. Die in der Tabelle exemplarisch ausgewerteten Nutzungsvorgänge und
Aufenthaltsdauern zeigen einen Ausschnitt der Möglichkeit der Analyse.
Abweichungen zwischen Methode 2 (Serverlog) und Methode 3 (MediaTraxx)
resultieren aus den unterschiedlichen Messzeitpunkten: Methode 1 protokolliert
eine Anfrage erst bei deren Eintreffen, Methode 3 in dem Moment, in dem der User
die Anfrage auslöst. Das erklärt auch die beinahe exakte Übereinstimmung der
Messdaten zwischen Methode 3 und durch Methode 1 (Screencam) ermittelten Werten.
Dennoch: Keine Messmethode ist perfekt, so werden Seitenwechsel aus dem
Browsercache (zum Beispiel beim Zurückgehen mit dem Backbutton) oft nicht
aufgezeichnet, weder im Logfile noch innerhalb von Methode 3. Auch
SSL-Verbindungen werden aus Datenschutz- und allgemeinen technischen Gründen
nicht protokolliert (siehe Abbildung2). Die Detailanalyse der Ergebnisse ist
stets eine Herausforderung, insbesondere die Trennung von wichtigen und
unwichtigen Informationen sowie die Zusammenfassung der Informationen zu
verallgemeinerungsfähigen Aussagen. Die Analyseroutinen müssen für die
meisten Erkenntnisziele entsprechend angepasst werden. Dieser Arbeitsschritt
erfordert speziell bei der Nutzungsanalyse in der Website bereits im Vorfeld der
Auswertung eine genaue Strukturanalyse der zu untersuchenden Sites nach dem
Motto: "Ich kann nur messen, was ich verstehe." Die Auswertung der
Nutzungsdaten in Verbindung mit demographischen und quantitativen Erhebungsdaten
rechtfertigt jedoch den Aufwand, kann doch so erstmals eine Kopplung zwischen
praktisch nonreaktiv erhobenen Verhaltensdaten und Einstellungsdaten innerhalb
der Zielgruppe erfolgen. Aus dieser Kombination herleitbare Aussagen zum
Nutzungsverhalten in spitzen Zielgruppen sind so erstmals möglich. Darüber
hinaus kann dieses System verwendet werden, um die überall sichtbaren
gravierenden Unterschiede zwischen user- und serverzentrierter Forschung bezüglich
der Messung besser zu verstehen, die Ursachenforschung für die Unterschiede bei
den Ergebnissen dieser Messverfahren präziser zu betreiben und die im Markt
befindlichen unterschiedlichen Ansätze besser zu evaluieren.

For further informations please contact:
press@mediatransfer.de
|