Einleitung
Mit der rasanten Verbreitung von Künstlicher Intelligenz (KI) in verschiedensten Anwendungsbereichen wächst auch die Verantwortung, diese Technologien datenschutzkonform zu gestalten. KI-Systeme verarbeiten oftmals große Mengen personenbezogener Daten, deren Schutz den Anforderungen der Datenschutz-Grundverordnung (DSGVO) unterliegt. In ihrer Orientierungshilfe zu empfohlenen technischen und organisatorischen Maßnahmen bei der Entwicklung und beim Betrieb von KI-Systemen (Stand Juni 2025) (“Orientierungshilfe”) formuliert die Konferenz der unabhängigen Datenschutzaufsichtsbehörden des Bundes und der Länder (Datenschutzkonferenz – DSK) konkrete technische und organisatorische Maßnahmen (TOMs), die entlang des Lebenszyklus eines KI-Systems umzusetzen sind. Ziel ist es, sowohl die datenschutzrechtlichen Anforderungen als auch die Rechte und Freiheiten betroffener Personen systematisch zu wahren.
Die Datenschutzkonferenz besteht aus dem Bundesbeauftragten für den Datenschutz und die Informationsfreiheit (BfDI) sowie Datenschutzbeauftragten der 16 Bundesländer. Zweck der Datenschutzkonferenz ist es, den Datenschutzaufsichtsbehörden auf Bundes- und Landesebene eine einheitliche Anwendung der datenschutzrechtlichen Regelungen zu ermöglichen. In diesem Zusammenhang stellen die Orientierungshilfen der Datenschutzkonferenz zwar nicht rechtsverbindliche, jedoch fachlich fundierte Dokumente dar, die den Behörden eine einheitliche Anwendung und Auslegung datenschutzrechtlicher Vorschriften in der Praxis erleichtern. Die Orientierungshilfen dienen deshalb auch als Indikator für die Wirtschaft dahingehend, wie die deutschen Datenschutzbehörden das Datenschutzrecht bei bestimmten Sachverhalten höchstwahrscheinlich auslegen und anwenden werden.
Dieser Artikel beleuchtet zentrale Inhalte der Orientierungshilfe, strukturiert nach den Lebenszyklusphasen eines KI-Systems – Design, Entwicklung, Einführung sowie Betrieb und Monitoring – und stellt die Umsetzung der sieben Gewährleistungsziele des Datenschutzrechts in den Mittelpunkt: Transparenz, Datenminimierung, Verfügbarkeit, Vertraulichkeit, Integrität, Intervenierbarkeit und Nichtverkettung.
1. Datenschutzrechtlicher Rahmen
Im Fokus der DSGVO steht der Schutz natürlicher Personen bei der Verarbeitung personenbezogener Daten. KI-Systeme stellen eine besondere Herausforderung dar, da sie häufig adaptive, datenintensive Prozesse beinhalten, deren Entscheidungslogik nicht immer leicht nachvollziehbar ist.
1.1 KI-System und KI-Modell
Die Orientierungshilfe definiert als KI-System ein maschinengestütztes System, das für einen unterschiedlich stark autonomen Betrieb ausgelegt ist. Es kann nach seiner Inbetriebnahme anpassungsfähig sein und verarbeitet Eingaben (z. B. Daten), um daraus – in Bezug auf explizite oder implizite Ziele – Ausgaben wie Vorhersagen, Inhalte, Empfehlungen oder Entscheidungen zu erzeugen. Diese Ausgaben können physische oder virtuelle Umgebungen beeinflussen. Ein KI-System beruht auf einem oder mehreren KI-Modellen. Die Bandbreite reicht dabei von spezifisch ausgerichteten Systemen (z. B. medizinische Mustererkennung) bis hin zu solchen mit allgemeinem Verwendungszweck.
Nach der Orientierungshilfe bildet ein KI-Modell die technische Grundlage, auf der ein KI-System beruht. Ein KI-Modell wird durch ein Training mit großen Datenmengen erstellt und befähigt das KI-System dazu, Muster zu erkennen, Entscheidungen zu treffen oder andere Aufgaben zu erfüllen. Die datenschutzrechtlich relevante Besonderheit von KI-Modellen liegt im Umgang mit Trainingsdaten sowie deren Herkunft (z. B. durch Crawling oder Scraping). KI-Modelle können von Dritten stammen und in andere Systeme eingebunden oder für spezifische Anwendungen spezialisiert werden.
Ein KI-System nutzt ein oder mehrere KI-Modelle, um aus Daten Informationen zu gewinnen und darauf basierend Entscheidungen oder Empfehlungen zu erzeugen. Das Modell ist somit ein zentraler funktionaler Bestandteil des Systems. Von der Orientierungshilfe nicht betrachtet werden solche KI-Systeme, die keinen Personenbezug haben. Ferner klammert die Orientierungshilfe die datenschutzrechtlichen Fragen aus, die sich aus der Sammlung von Datensätzen (z. B. durch Crawling, Scraping) sowie im Zusammenhang mit der Einbindung von bestehenden KI-Modellen oder -Systemen in neue KI-Systeme – sei es durch Nutzung und Spezialisierung von KI-Modellen von Dritten oder die Einbindung über eine Schnittstelle – ergeben.
1.2 Data Protection by Design und Standard-Datenschutzmodell
Das Prinzip „Data Protection by Design“ verpflichtet Entwickler:innen, Datenschutzaspekte bereits bei der Systemgestaltung von KI-Systemen zu berücksichtigen. Der Einsatz personenbezogener Daten in KI-Systemen bedarf einer klaren Zweckbindung, einer geeigneten Rechtsgrundlage sowie einer Risikobewertung. In bestimmten Fällen ist eine Datenschutz-Folgenabschätzung (DSFA) nach Art. 35 DSGVO durchzuführen.
Zur systematischen Umsetzung der DSGVO wendet die DSK das Standard-Datenschutzmodell (SDM) als praxisnahes Gerüst an. Das SDM übersetzt rechtliche Anforderungen in die in der Einleitung genannten sieben Gewährleistungsziele, die mit spezifischen technischen und organisatorischen Maßnahmen erfüllt werden sollen.
2. Lebenszyklusphasen und Gewährleistungsziele
Die Orientierungshilfe geht davon aus, das ein KI-System während der Entwicklung und des anschließenden Betriebs verschiedene Phasen durchläuft, die dessen Lebenszyklus darstellen können. Sie unterscheidet dabei vier Phasen: (1) Design, (2) Entwicklung, (3) Einführung, und (4) Betrieb und Monitoring und geht davon aus, dass diese Phasen für unterschiedliche KI-Systeme unterschiedliche Relevanz haben können.
2.1 Designphase: Fundament für Datenschutz legen
Die Designphase umfasst die Festlegung der Zielsetzung, Systemarchitektur und Datenstrategie eines KI-Systems. Bereits hier ist zu prüfen, ob die Verwendung von personenbezogenen Daten notwendig ist oder ob anonymisierte bzw. synthetische Alternativen genutzt werden können. Es gelten unter anderem die folgenden Grundsätze:
Transparenz: Dokumentation spielt nach Auffassung der DSK eine Schlüsselrolle. Dies umfasst unter anderem den Zweck der Verarbeitung, die Rechtsgrundlage, die Methodik der Datensammlung, den Aufbau und die Herkunft des Datensatzes (z. B. mithilfe von „Datasheets for Datasets“), Systemkomponenten und Auswahlkriterien für KI-Algorithmen.
Datenminimierung: Es sind nur solche personenbezogene Daten zu erheben, die für die Zweckverwirklichung des KI-Systems erforderlich sind. Der Umfang, die Kategorien und die Herkunft der Daten müssen durchdacht ausgewählt und begründet werden.
Nichtverkettung: Eine unerlaubte Kombination von personenbezogenen Daten, die Rückschlüsse auf sensible Merkmale erlaubt, ist zu vermeiden. Auch indirekte Rückschlüsse über sogenannte „Proxy-Attribute“ (z. B. Postleitzahl als Indikator für Herkunft) sind kritisch zu prüfen.
Intervenierbarkeit: Prozesse zur Umsetzung von Betroffenenrechten (z. B. Auskunft, Löschung) müssen nach Auffassung der DSK bereits in der Designphase definiert werden. Rohdaten müssen auffindbar und änderbar bleiben, z. B. durch Metadatenmanagement.
Verfügbarkeit: KI-Systeme müssen so ausgelegt sein, dass sie eine zügige und dauerhafte Verarbeitung ermöglichen. Dies betrifft auch die Auswahl geeigneter Datenbanksysteme.
Integrität: Maßnahmen zur Sicherstellung der Datenqualität, z. B. Plausibilitätsprüfungen, Erkennung von Datenverfälschung oder Bias, sind zu implementieren.
Vertraulichkeit: Techniken wie Differential Privacy, Verschlüsselung oder datenschutzfreundliches Lernen (z. B. Federated Learning) sollten in Betracht gezogen werden, um Risiken der Re-Identifizierung oder ungewollten Datenoffenlegung zu minimieren.
2.2 Entwicklungsphase: Aufbereitung, Training und Validierung
Die DSK geht davon aus, dass in der Entwicklungsphase eines KI-Systems Rohdaten aufbereitet und KI-Modelle trainiert und getestet werden. Diese Schritte sind nach Auffassung der DSK besonders datenintensiv und damit auch datenschutzrelevant. Es gelten unter anderem die folgenden Grundsätze:
Transparenz: Die Auswahl und Verwendung von Algorithmen sowie die Trainings-, Validierungs- und Testdaten sind nachvollziehbar zu dokumentieren. Der Ort der Datenverarbeitung, Zugriffsrechte und Speicherdauer müssen definiert sein.
Datenminimierung: Nur relevante Daten sollen verarbeitet werden. Bei modularen KI-Systemen ist sicherzustellen, dass einzelne Komponenten ausschließlich die für sie bestimmten Daten erhalten.
Nichtverkettung: Das Training muss sich strikt an den Zweck halten. Es ist zu vermeiden, dass das Modell Zusammenhänge lernt, die nicht intendiert sind (z. B. ethnische Herkunft aus Bildern ableitet).
Intervenierbarkeit: Betroffenenrechte müssen auch während der Trainingsphase berücksichtigt werden. Modelle sollten so konzipiert sein, dass sie sich bei Löschanfragen effizient anpassen lassen (z. B. durch Machine Unlearning).
Verfügbarkeit: Die Trainingsinfrastruktur muss gegen Störungen (z. B. Ausfälle) abgesichert werden. Backup-Strategien und Redundanz helfen, Ausfälle zu vermeiden.
Integrität: Schutzmaßnahmen gegen Data Poisoning und Backdoor-Angriffe sind zwingend. Die Trainingsdaten müssen korrekt, vollständig und repräsentativ sein.
Vertraulichkeit: Die Gefahr, dass ein KI-Modell personenbezogene Trainingsdaten „memorisiert“ und unbeabsichtigt ausgibt, ist real. Regelmäßige Tests und der Einsatz technischer Gegenmaßnahmen (z. B. Regularisierung, Privacy Audits) sind notwendig.
2.3 Einführungsphase: Bereitstellung und Konfiguration
Die Phase der Einführung betrifft nach Auffassung der DSK die Softwareverteilung, das Deployment und initiale Konfigurationen betreffend KI-Systemen. Auch hier können personenbezogene Daten betroffen sein – etwa bei nicht-parametrischen Modellen, die ihre Trainingsdaten benötigen. Die DSK stellt unter anderem die folgenden Vorgaben auf:
Transparenz: Nutzer:innen von KI-Systemen müssen über die Funktionsweise, Entscheidungskriterien und Betroffenenrechte (z. B. Widerspruchsrecht bei Art. 22 DSGVO) informiert werden. Dokumentationen sollten auch für Laien verständlich sein.
Datenminimierung: Nur erforderliche Daten und Modellbestandteile dürfen bereitgestellt werden. Beispielsweise sind bei parametrischen Modellen die Trainingsdaten in der Regel nicht notwendig und sollten nicht ausgeliefert werden.
Vertraulichkeit: Bei Offline-Betrieb ist zu beachten, dass alle personenbezogenen Daten auf die Endgeräte gelangen – das birgt höhere Risiken. Hier sind kryptografische Verfahren und Zugriffsbeschränkungen anzuwenden.
2.4 Betrieb und Monitoring: Kontinuierlicher Datenschutz
In dieser Phase wird das KI-System produktiv genutzt. Monitoring, Anpassungen und ggf. lernende Komponenten stehen im Vordergrund. Die Orientierungshilfe formuliert unter anderem die folgenden Anforderungen für diese Phase:
Transparenz: Entscheidungen, insbesondere mit rechtlicher Wirkung, müssen nachvollziehbar und dokumentierbar sein. Modellparameter, Systemverhalten und Updates sind revisionssicher festzuhalten.
Datenminimierung: Wenn ein KI-System unnötige Daten in seinen Ausgaben enthält, ist das Modell anzupassen. Rückkopplungen (z. B. Nutzerfeedback) dürfen nur nach Datenschutzprüfung zur weiteren Modellverbesserung verwendet werden.
Nichtverkettung: Im Betrieb dürfen keine neuen, unzulässigen Verknüpfungen entstehen. Neue Datenquellen müssen sorgfältig geprüft werden.
Intervenierbarkeit: Technische Maßnahmen wie manuelle Freigabeprozesse, Hinweisfunktionen zur Unsicherheit der Ergebnisse oder Filtersysteme unterstützen die menschliche Kontrolle. Die Umsetzung der Rechte auf Berichtigung, Löschung und Einschränkung der Verarbeitung erfordert ggf. ein erneutes Training oder „Machine Unlearning“.
Integrität: Der Betrieb muss auf Veränderungen im Anwendungsfeld (z. B. neue rechtliche Rahmenbedingungen) reagieren können. Regelmäßige Tests (z. B. Red Teaming) prüfen die Robustheit und Zuverlässigkeit des Systems.
Vertraulichkeit: APIs und Schnittstellen dürfen nicht zur Extraktion sensibler Daten missbraucht werden. Zugriffskontrollen, Protokollierung und differenzierte Rechtevergabe sind essenziell.
Fazit
Nach Auffassung der DSK erfordert die datenschutzgerechte Entwicklung von KI-Systemen kein Entweder-Oder zwischen Innovation und Regulierung – vielmehr soll ein Qualitätsanspruch dargestellt werden, der langfristig Vertrauen, Sicherheit und Akzeptanz schafft. Die Orientierungshilfe der DSK bietet Behörden eine Anleitung zur Umsetzung datenschutzkonformer KI-Entwicklung und -Nutzung und in dieser Hinsicht auch der Wirtschaft eine Orientierung zu den behördlichen datenschutzrechtlichen Anforderungen bei der Entwicklung von KI-Systemen. Entscheidend ist, dass technische und organisatorische Maßnahmen von der DSK nicht als einmalige Hürde, sondern als kontinuierlicher Prozess im gesamten Lebenszyklus eines KI-Systems verstanden werden, damit die Chancen der KI nachhaltig genutzt und gleichzeitig die Rechte und Freiheiten der Menschen geschützt werden können.
Dieser Artikel enthält lediglich allgemeine Erwägungen zum beschriebenen Thema und stellt weder Rechtsberatung noch ein Angebot auf Erbringung von rechtlicher oder anderer Beratung dar. Durch das Besuchen dieser Webseite wird kein Mandatsverhältnis begründet. Die Bezeichnung “MAYRFELD” bezieht sich stets auf die MAYRFELD Rechtsanwälte PartG mbB. Die Bezeichnung “Partner” bezieht sich stets auf die Gesellschafter der MAYRFELD Rechtsanwälte PartG mbB. Die Haftung für diesen Artikel oder dessen Inhalts sämtlicher für MAYRFELD handelnden Personen, ganz gleich ob als Gesellschafter, Angestellter oder Berater ist ausgeschlossen. Dieser Artikel dient lediglich der Information über bestimmte Rechtsentwicklungen. Er enthält keine vollständige Analyse der jeweiligen Rechtslage und stellt keine rechtlich verbindliche Stellungnahme von MAYRFELD zur Rechtslage dar. Die Beantwortung von Fragen zur Rechtslage kann nur im Rahmen eines konkreten Mandatsverhältnisses erfolgen.
Weitere Informationen über MAYRFELD erhalten Sie unter www.mayrfeld.com.

English