Business Intelligence im Umfeld der EU-DSGVO
Was kommt mit der neuen EU-DSGVO in Bezug auf Business Intelligence auf uns zu, fragen sich viele Verantwortliche in den Unternehmen. Am 25. Mai 2018 tritt die neue EU-Datenschutzgrundverordnung in Kraft. Betroffen sind hier Anwendungen die stark auf Kundendaten angewiesen sind. Eine der Grundforderungen der DSGVO ist die Möglichkeit datenschutzfreundliche Voreinstellungen vornehmen zu können und eine datenschutzfreundliche technische Gestaltung zu Grunde zu legen (engl. Privacy by Design und Privacy by Default). Beide Prinzipien ergänzen sich.
Eine datenschutzfreundliche technische Gestaltung zeichnet sich durch die Berücksichtigung entsprechender Voreinstellungen hinsichtlich des Datenschutzes aus. Bei datenschutzfreundlichen Voreinstellungen gilt die Devise, nur die für die Erfüllung notwendigen Informationen zu erfassen. Personenbezogene Daten sind idealer Weise auszuschließen oder zumindest zu pseudonymisieren, zu maskieren oder zu anonymisieren. Ebenso ist auf eine Minimierung des Umfangs der Verarbeitung sowie kürzest mögliche Dauer der Speicherung zu achten. Auch der Personenkreis, der Zugriff auf diese Art der Daten hat, ist möglichst klein zu halten. Wie bisher auch, sind technische und organisatorische Maßnahmen zu treffen, die unberechtigten Zugriff und die Veröffentlichung von zu schützenden Daten verhindern.
Für die Zukunft ist noch an die Möglichkeit gedacht, datenschutzfreundliche Software zu zertifizieren zu können. Allerdings müssen die Aufsichtsbehörden noch entscheiden, wie diese Zertifizierungsverfahren auszusehen haben.
Welche Daten sind bezüglich der DSGVO relevant?
Sobald Rückschlüsse auf konkrete Personen möglich sind, müssen diese entsprechen geschützt oder behandelt werden. Abhängig von der vorhandenen Kundensituation, ist eine Pseudonymisierung oder Anonymisierung erforderlich. Bei einer Pseudonymisierung ist die DSGVO noch anzuwenden, diese entfällt bei der Anonymisierung. Eine Pseudonymisierung kann wieder aufgehoben werden, somit können einzelne natürliche Personen identifiziert werden. Anders verhält sich eine Anonymisierung, diese kann nicht rückgängig gemacht werden. Die DSGVO wird hier nicht mehr angewendet.
Reduzierung des Detailierungsgrades im BI
Dient ein Business-Intelligence-System dazu das Kundenverhalten mittels detaillierter Kundendaten zu analysieren, zum Beispiele für gezielte Marketingaktionen, werden Kunden oft kategorisiert um sie besser ansprechen zu können. Um die Anforderungen der DSGVO zu erfüllen, sind hierbei verschiedene Punkte zu beachten.
In den meisten Fällen sind BI Analysen auf Basis detaillierte Informationen einzelner Personen nicht erforderlich. In der Regel genügt es, Personen in bestimmte Gruppen einordnen zu können. Viele detaillierte Daten, wie Berufsgruppe, Geschlecht, Abteilung usw. stammen oft aus CRM Systemen. Bei der Übertragung in ein BI System wird hier ein niedriger Detaillierungsgrad verwendet. Die Reduktion der Daten hängt immer vom vorliegenden Datenbestand ab. Somit wird sichergestellt, dass sich möglichst wenig Daten im BI System befinden, die Rückschlüsse auf eine konkrete Person erlauben. Hier spricht man von Anonymisierung von Kundendaten.
Dieser Schritt darf nur durch Mitarbeiter durchgeführt werden, die über eine entsprechende Berechtigung verfügen und im Umgang mit sensiblen Daten geschult sind. Wenn es nicht mehr möglich ist, ohne Umweg konkrete Personen für Marketingaktionen direkt aus dem BI-System zu ermitteln, ist eine weitere Anforderung des Datenschutzgesetzes erfüllt.
Personenbezogene Daten im DataWarehouse
Sind personenbezogene Daten in einem sehr hohen Detaillierungsgrad im DataWarehouse vorhanden, empfiehlt es sich, dieses zu überarbeiten und die beschriebene Methode der Kategorisierung durchzuführen. Ansonsten ist hier Risikoanalyse mit Dokumentation erforderlich. Wenn das Ergebnis der Analyse ein hohes Risiko z.B. für einen Datenverlust ergibt, ist eine Datenschutzfolgenabschätzung erforderlich. Hieraus resultieren dann technische und organisatorische Maßnahmen. Um so höher eine Wahrscheinlichkeit für einen Datenverlust und je erheblicher der Schaden einzuschätzen ist, desto weitreichender sind die Maßnahmen die getroffen werden müssen, damit der Schutz der Daten sichergestellt bleibt. Selbstverständlich sind diese Analysen und die daraus sich ergebenden Maßnahmen regelmäßig durchzuführen und bei Bedarf anzupassen.
Bei einer Betrachtung der Daten im dimensionalen Modell sind klassische Kunden-Dimensionen ausgeprägt. Diese enthalten sehr oft personenbezogene und somit schützenswerte Informationen. Unter der Beachtung der Privacy-Grundlagen sind hier die schützenswerten Daten zu prüfen. Sind Daten die eine eindeutige Identifikation einer Person zulassen vorhanden, wie Name, Vorname, Adresse, Straße, Hausnummer, Geburtstag müssen Entscheidungen getroffen werden wie zu verfahren ist. Unter Umständen reicht es aus, diese Informationen nur einer definierten Benutzergruppe zur Verfügung zu stellen. Dies könnten zum Beispiel speziell geschulte Analysten sein. Reicht dies nicht aus, weil die Daten nicht dringend notwendig oder zu sensibel sind, dann müssen die Daten gelöscht werden. Hier ist eine genaue Einzelfallprüfung erforderlich.
Keine Historisierung personenbezogener Daten
In diesem Zusammenhang sind auch historische Daten zu betrachten, denn personenbezogene Daten dürfen auch nicht historisiert werden. Attribute dieser Art sind daher aus alten Datensätzen, Backups und natürlich auch aus bestehenden Auswertungen zu entfernen.
Generell nach Artikel 9, Absatz 1 der DSGVO untersagt sind Informationen über das Herkunftsland einer Person oder die sexuelle Orientierung. Sind derartige Informationen gespeichert, müssen diese mit Inkrafttreten der DSGVO gelöscht sein. Eine Zustimmung zur Speicherung von personenbezogenen Daten kann zudem jederzeit widerrufen werden. Eine Ausnahme stellt die Tatsache dar, wenn diese Daten zum Erhalt der Geschäftsbeziehungen notwendig sind. Das bedeutet, diese Daten sind im Falle eines Widerrufs aus sämtlichen Systemen, somit auch aus dem BI-System, zu entfernen.
Datensätze dieser Art dürfen nicht mehr in Analysen einbezogen werden. Hier ist zu prüfen, ob Auswertungen, die diese Attribute verwenden noch korrekt arbeiten.
Nicht aussitzen, sondern proaktiv handeln
Um auf der sicheren Seite zu bleiben hilft es, proaktiv an die Sache heranzugehen. Frühzeitig die Daten entsprechend zu prüfen und die erforderlichen Maßnahmen einzuleiten.
Je nach Anwendungsgebiet kann die neue Datenschutzgrundverordnung (DSGVO) weitreichende Folgen für datenverarbeitende Systeme haben. Als positiver Nebeneffekt der Pflicht die Datenbestände zu analysieren und zu bewerten, ist die Möglichkeit zu sehen, hierbei die Anzahl der Daten zu reduzieren und eine Restrukturierung der Auswertungen durchzuführen.