Datensammler: Traffic-Analyse mit Piwik
Piwik möchte als Konkurrent zu Google Analytics antreten. Lesen Sie in diesem Artikel, wie Sie das quelloffene Analyse-Tool einsetzen.

- Datensammler: Traffic-Analyse mit Piwik
- AnonymizeIP
Als bisherige marktführende Webanalyse-Lösung gilt weltweit Google Analytics. Doch die größte Stärke von Google, nämlich die enormen Datenmengen, die dem US-Megakonzern zur Verfügung stehen, ist auch gleichzeitig seine größte Schwäche: Google Analytics hält sich bisher nicht wirklich an d...
Als bisherige marktführende Webanalyse-Lösung gilt weltweit Google Analytics. Doch die größte Stärke von Google, nämlich die enormen Datenmengen, die dem US-Megakonzern zur Verfügung stehen, ist auch gleichzeitig seine größte Schwäche: Google Analytics hält sich bisher nicht wirklich an deutsche Gesetze. Piwik zeigt, dass es durchaus auch anders geht: konform mit deutschem Recht und quelloffen. Piwik ist für den deutschen Markt geradezu maßgeschneidert.
Vielen Webhostern und Webmastern wird zunehmend bewusst, dass Google Analytics gegen deutsches Recht verstößt. Da Google Ihnen die Opt-out-Option bisher verweigert, dürfen Sie Analytics nicht benutzen, um die Zugriffsdaten auszuwerten.
In Deutschland hat die informelle Gemeinde der obersten Datenschützer, der Düsseldorfer Kreis, eine Reihe von Auflagen zusammengestellt, denen solche Analysetools entsprechen müssen, um sich im Rahmen des rechtlich Zulässigen zu bewegen.
Die wichtigste Grundidee besteht darin, dass Websitebesucher der Erfassung von personenbezogenen Daten auf deutschen Webseiten widersprechen können und daher im Rahmen der Datenschutzerklärung explizit darauf hingewiesen werden müssen. Der zweite Kernpunkt besteht darin, dass anonyme Nutzerdaten nicht mit IP-basierten Nutzerprofilen zusammengeführt werden dürfen.
Mittels Piwik können Sie detaillierte anonymisierte Berichte Ihrer PiwikWebseite und der jeweiligen Besucher ermitteln und dabei gleichzeitig konform mit deutschem Recht gehen. Technisch benötigt Piwik lediglich PHP und MySQL samt einiger kleiner Erweiterungen.
Technische Vorzüge
Auch jenseits von rein rechtlichen Aspekten gibt es auch eine Fülle von technischen Vorzügen, die für den Einsatz von Piwik sprechen. Anders als bei Google werden hier Echtzeit-Analysen Ihres Webservers erstellt.Bei allen seinen Vorzügen kann sich dieses Verhalten auf Webservern mit einem hohen Datenvolumen als weniger geschickt erweisen, weil es eine hohe Last verursachen kann. Während Sie bei Google Analytics die vorgegebenen Auswertungsintervalle akzeptieren müssen, können Sie bei Piwik dieses Verhalten beliebig einstellen. Im Falle der Echtzeitauswertung (Option today) schaut Piwik in die Datenbank hinein und wertet die Log-Datei beim Zugriff auf den Webserver jedes Mal neu aus. Die Konfigurationsdatei config/global.ini.php sollte hierzu diese Zeile beinhalten:
enable_browser_archiving_
triggering = 1
Falls Sie einen Crontab nutzen, setzen Sie den obigen Eintrag auf Null. Standardmäßig wird die Logdatei der Zugriffe jeweils für 10 Sekunden als aktuell betrachtet. Wenn Ihr Webserver unter hoher Last steht und Sie sich eine zusätzliche Auslastung durch Piwik ersparen wollen, können Sie die Logdateien auch im Stundentakt aufzeichnen:
time_before_today_archive_considered_
outdated = 3600
Aussagekräftige Auswertungen in diesem Zeitintervall sollten zumeist ausreichen.
Unique Visitors
Potenzielle Anzeigenkunden interessieren sich besonders dafür, wie viele Besucher die Werbung zu sehen bekommen. Ein einzelner Besucher (Unique Visitor) wird in Piwik anhand von Cookies identifiziert. Falls keine Cookies akzeptiert wurden, kann Piwik unter anderem auch die IP-Adresse, die Auflösung, die Browserversion und etwa die genutzten Plugins heranziehen, um einen einzelnen Website-Besucher zu erkennen. Da die Erfassung und Speicherung personenbezogener Daten gegen deutsches Recht verstößt, dürfen Sie aus dieser Möglichkeit keinen Gebrauch machen.Zum Glück können Sie dem quell-offenen Piwik die Speicherung von IP-Adressen abgewöhnen. Hierzu öffnen Sie die Datei /core/Tracker/Visit.php in einem Texteditor und suchen nach der Textzeichenkette:
'location_ip' => $userInfo
['location_ip'],
Ersetzen Sie den obigen Eintrag durch den folgenden Code:
UPDATE piwik_log_visit SET location_
ip=0;
Diese Prozedur müssen Sie bei jedem Update eventuell wiederholen. IP-Adressen, die gegebenenfalls vor dieser Anpassung gesammelt wurden und in der Datenbank gespeichert sind, können Sie entfernen. Hierzu können Sie diesen Code benutzen:
UPDATE piwik_log_visit SET location_
ip=0;
wobei piwik dem Präfix der Datenbanktabelle entspricht, die Sie in Ihrer Installation eingetragen haben. Alternativ können Sie mittels:
UPDATE piwik_log_visit SET location_
ip = location_ip & 0xFFFFFF00;
(0xFFFFFF00 nullt das letzte Oktett. 0xFFFF0000 die beiden letzten usw.) das letzte Oktett beziehungsweise mittels:
UPDATE piwik_log_visit SET location_
ip = location_ip & 0xFFFF0000;
die beiden letzten Oktetts auf Null setzen.
AnonymizeIP

Seit Piwik 0.55 können Sie auch einfach das Plugin AnonymizeIP einsetzen, welches sich nun im Core des Pakets befindet (zuvor wurde das Plugin unter dem Namen NoIp Plugin zum Download angeboten). Da dieses Plugin standardmäßig abgeschaltet ist, müssen Sie es in den Einstellungen aktivieren und dann konfigurieren.Die Anzahl der Besucher bestimmt nämlich den Grad der erforderlichen Anonymisierung: Je mehr Hits eine Website erreicht, umso geringer ist die Zahl der zu überschreibenden Oktetts der jeweiligen IP-Adresse, die die eindeutige Identifizierung eines Besuchers verhindern kann. Um AnonymizeIP Ihren Bedürfnissen anzupassen, müssen Sie die Datei config/global.ini.php anpassen. Mittels
ip_address_mask_length = X
können Sie die Anzahl der zu verfremdenden Oktette einstellen, indem Sie anstelle von X eine Zahl zwischen 0 und 4 einsetzen. Der Wert 0 deaktiviert die Anonymisierung. Mit einem Wert von 1 bis 4 können Sie entsprechend ein bis alle vier Oktette ausnullen. Gegen den Wert 4 (wie dies etwa im zuvor besprochenen Piwik-Hack geschehen ist) sprechen übrigens mögliche Probleme mit dem Zählen von Besuchern.