AnonymizeIP
- Datensammler: Traffic-Analyse mit Piwik
- AnonymizeIP
Der Wert 1 könnte im Einzelfall zu wenig von einer IP-Adresse anonymisieren. Ein idealer Kompromiss ist der Wert 2: Die IPs werden so hinreichend anonymisiert, um keine konkreten Rückschlüsse mehr auf die Person hinter der IP machen zu können, und sind immer noch konkret genug, um eine sinnvolle...

Der Wert 1 könnte im Einzelfall zu wenig von einer IP-Adresse anonymisieren. Ein idealer Kompromiss ist der Wert 2: Die IPs werden so hinreichend anonymisiert, um keine konkreten Rückschlüsse mehr auf die Person hinter der IP machen zu können, und sind immer noch konkret genug, um eine sinnvolle Zählung der Besucher zu gewährleisten.
Der einzige Benutzer, der (in einer Piwik-Instanz) Benutzeraccounts und Websites einrichten und Plugins installieren darf, ist der sogenannte Super User. Alle weiteren Benutzer und Websites werden durch den Super User erstellt und sind in der Piwik-Datenbank verzeichnet (statt in config/global.ini.php). Der Super User hat alle verfügbaren Zugriffsrechte und somit die totale Kontrolle über Piwik.
Fehlerfrei erfassen
Vergleiche sind immer nur dann sinnvoll wenn jeweils identische Maßstäbe angesetzt werden. Liegt der letzte aufgezeichnete Websiteaufruf 30 Minuten oder länger zurück, dann wird eine neue Sitzung eröffnet und automatisch als ein neuer Besucher gezählt. Zu 100 Prozent zuverlässige Daten gibt es also aus technischen Gründen ohnehin nicht, denn man weiß nie genau, wer wirklich davor sitzt.Aus datenschutzrechtlichen Gründen ist dies nicht so relevant, es geht lediglich darum, vergleichbare Daten zu haben. Und da liegt es nahe, den Timeout der Session, der standardmäßig bei 30 Minuten liegt, auch den Wünschen der Kunden anpassen zu können, damit die so ermittelten Website-Statistiken auch vergleichbar sind. Hierzu passen Sie in der Datei config/global.ini.php den Wert von:
visit_standard_length value
entsprechend Ihren eigenen Wünschen an. Der Standardwert ist 1.800 (30 x 60 Sekunden) und entspricht 30 Minuten.
Piwik performant ohne Cronjobs
Mittels Cronjobs können Sie eine tägliche, wöchentliche oder monatliche Auswertung durch Piwik veranlassen, aber aus technischen Gründen geht dies oft leider nicht, denn nicht jeder Webhosting-Anbieter sieht diese Möglichkeit in dem Hosting-Paket vor.Dennoch brauchen Sie nicht auf eine performante Live-Auswertung, die Piwik effizient und leistungsfähig werden lässt, zu verzichten. Der Workaround erfordert, dass Sie in der Datei php.ini, die sich wahrscheinlich in diesem Pfad befindet:
/etc/php5/cli/php.ini
die Speicherzuteilung erhöhen, etwa
memory_limit = 128M
Auf diese Weise wird der PHP-Kommandozeileninterpreter von der höheren Speicherzuteilung profitieren; Ihr Webserver wird davon nicht betroffen sein.
Wie am Schnürchen
Wenn Sie statt eines Shared Hosting-Accounts einen Virtual Private Server (VPS) oder einen dedizierten Server einsetzen, stellt sich die zuvor erwähnte Einschränkung gar nicht, da Sie sich per SSH jederzeit Zugriff auf den Webserver verschaffen können. In diesen Fall richten Sie einen Cronjob ein, der ein zeitgesteuertes Scheduling der Piwik-Instanz zur Folge hat:
crontab -e
Jetzt fügen Sie der crontab-Konfigurationsdatei den folgenden Inhalt ein:
MAILTO="ihreemailadresse@beispiel server.de" 5 0 * * * www-data /pfad/zu/piwik/ misc/cron/archive.sh > /dev/null

Um den Cronjob auszuführen, wird ein Benutzer namens www-data verwendet. Allgemein gesehen ist es Ihr Webserver-User, zum Beispiel apache. Mögliche Fehlermeldungen werden im obigen Beispiel an die E-Mail-Adresse ihre-emailadresse@beispielserver.de gesendet. Das Crontab-Utility unterstützt aus Sicherheitsgründen übrigens zwei verschiedene Betriebsmodi, nämlich System- und Benutzer-Crontabs. Im Falle des System-Crontabs besteht in der sechsten Option die sicherheitsrelevante Möglichkeit, einen beliebigen Benutzer zur Ausführung des Crontab-Utilities zu nutzen.Im Falle eines Benutzer-Crontabs stellt sich diese Option natürlich nicht, stattdessen wird der sechste Parameter dafür genutzt, um den Befehl zu übergeben, der das Crontab-Utility ausführt und entsprechend laufen alle Prozesse mit der jeweiligen Benutzerkennung. Ein Benutzer-Crontab könnte wie folgt aussehen:
5 0 * * * /pfad/zu/piwik/misc/cron/ archive.sh > /dev/null
Mittels dieses Benutzer-Crontabs können Sie eine tägliche, wöchentliche oder monatliche Auswertung auslösen.Wenn Sie Crontabs einsetzen, sollten Sie sich nicht blind darauf verlassen, dass die Automatisierung gelingen wird. Probieren Sie das betreffende Kommando in der Shell einfach aus:
sh /pfad/zu/piwik/misc/cron/ archive.sh
Im Erfolgsfalle sehen Sie die Ausgabe der XML-Datei mit den jeweiligen Zugriffen, die Piwik für Sie aufgezeichnet hat.Auf einem Shared-Hosting-Account haben Sie auf den System-Crontab keinen Zugriff, wohl aber unter Umständen auf einen Benutzer-Crontab. Sollte aber weder der System- noch der Benutzer-Crontab auf Ihrem Webspace zugelassen sein, können Sie ja immer noch versuchen, den Speicherlimit des PHP-Kommandozeileninterpreters (wie zuvor beschrieben) zu erhöhen. Es führen also drei Wege ans Ziel: ein System-Crontab, ein Benutzer-Crontab oder eine erhöhte Speicherzuteilung für den PHP-Kommandozeileninterpreter.
Legal und korrekt
Google Analytics ist zwar bisher der Marktführer gewesen, aber angesichts der nun eindeutigen Rechtslage empfiehlt sich stattdessen der Einsatz des quelloffenen Piwiks mit dem AnonymizerIP-Plugin. Vor allem wenn Sie nicht-anonymisierte IP-Altlasten in Ihrer Datenbank überschreiben und sich bei neu angelegten Daten mittels AnonymizerIP für das sinnvolle Ausnullen zweier Oktette der IP-Adresse entscheiden, können Sie der aktuellen deutschen Rechtsprechung genügen und gleichzeitig korrekte und nachvollziehbare Webstatistiken erhalten.
Stellungnahme der Aufsichtsbehörden
Die Aufsicht über die Einhaltung des Datenschutzes im nicht-öffentlichen Bereich obliegt den Datenschutz-Aufsichtsbehörden der Länder. Um in relevanten Rechtsfragen eine bundesweit einheitliche Praxis sicherzustellen, haben sich diese Aufsichtsbehörden informell zum sogenannten Düsseldorfer Kreis zusammengeschlossen.Der Düsseldorfer Kreis formuliert seither gemeinsame Standpunkte. In einem aktuellen Beschluss vom 26. November 2009 wurde Folgendes verfasst:"Im Einzelnen sind folgende Vorgaben aus dem TMG zu beachten: Personenbezogene Daten eines Nutzers dürfen ohne Einwilligung nur erhoben und verwendet werden, soweit dies erforderlich ist, um die Inanspruchnahme von Telemedien zu ermöglichen und abzurechnen. Jede darüber hinausgehende Nutzung bedarf der Einwilligung der Betroffenen.Die Analyse des Nutzungsverhaltens unter Verwendung vollständiger IP-Adressen (einschließlich einer Geolokalisierung) ist aufgrund der Personenbeziehbarkeit dieser Daten daher nur mit bewusster, eindeutiger Einwilligung zulässig. Liegt eine solche Einwilligung nicht vor, ist die IP-Adresse vor jeglicher Auswertung so zu kürzen, dass eine Personenbeziehbarkeit ausgeschlossen ist. (...)"