Rechtskonformer Einsatz Von KI Im Unternehmen durch Open-Source-Sprachmodelle
von RA Clemens Handl
Der Einsatz von KI in Unternehmen ist ein vieldiskutiertes Thema. Häufig werden datenschutzrechtliche Bedenken aufgrund der Übermittlung personenbezogener Daten an Anbieter in den USA oder sonstige Drittländer geäußert. Bei der Nutzung von KI-Systemen, die typischerweise in der Cloud des Anbieters gehostet und betrieben werden, besteht zudem das Risiko, dass Geschäfts- und Betriebsgeheimnisse des Unternehmens offengelegt werden.
Es besteht daher für Unternehmen ein großer Bedarf am sicheren und rechtskonformen Betrieb von KI-Systemen in eigener IT-Infrastruktur oder zumindest in dedizierten Servern von Drittanbietern. Häufig wird dafür Microsoft Azure OpenAI eingesetzt. Microsoft wirbt damit, dass aufgrund der sogenannten „EU-Datengrenze“ Unternehmensdaten vom Zugriff von US-Geheimdiensten geschützt seien. Eine Zusicherung, die wohl nicht haltbar ist.[1]
Die neuen gpt-oss-Modelle
OpenAI hat am 05.08.2025 zwei neue Modelle veröffentlicht: gpt-oss-120b und gpt-oss-20b [2]. Es handelt sich um die ersten „freien“ Modelle, die OpenAI seit Jahren veröffentlicht. Die Modelle können kostenfrei unter https://gpt-oss.com/ oder GitHub [3] heruntergeladen werden und können vollständig offline und ohne Anbindung an die API von OpenAI betrieben werden.
Die Modelle verfügen über 120 Milliarden respektive 20 Milliarden Parameter und sollen nach den Benchmarks von OpenAI über vergleichbare Fähigkeiten wie aktuelle reasoning-Modelle o3-mini und o4-mini verfügen. Die Modelle sollen mit 80 GB GPU RAM (zB mit einer Nvidia H100 Grafikarte) bzw. 16 GB RAM betrieben werden können, was einen lokalen Einsatz der Sprachmodelle (LLM) in Unternehmen möglich macht.
Damit können rechtliche Bedenken ausgeräumt werden: Ohne Internetanbindung können keine personenbezogene Daten an Dritte übermittelt werden. Geschäfts- und Betriebsgeheimnisse werden niemandem offengelegt, sondern das Unternehmen behält die volle Kontrolle über die Konfiguration, die Nutzung und die Funktionsweise des KI-Systems. Dazu kommt, dass die Modelle ohne laufende Lizenzkosten genutzt werden können, was einen wesentlichen Aspekt in der Kontrolle der Kosten für den Betrieb des KI-Systems bietet.
In diesem Artikel soll kurz beleuchtet werden, wie die Modelle gpt-oss-120b und gpt-oss-20b im Unternehmen genutzt werden können und welche Pflichten Unternehmen treffen, die diese Modelle modifizieren und kommerziell ihren Kunden zur Verfügung stellen.
Dürfen die Modelle kommerziell genutzt werden?
Die Modelle gpt-oss-120b und gpt-oss-20b werden häufig als „open-source“ bezeichnet, sind jedoch genau betrachtet nur „open-weight“-Modelle. Ein „open‑weight“‑Modell ist ein Sprachmodell, dessen trainierte Parameter – die Gewichte – öffentlich zugänglich sind. Wenn ein Modell als “open‑weight” veröffentlicht wird, können Entwickler das Modell herunterladen, lokal ausführen und die Gewichte ändern oder finetunen, um es auf die eigenen Bedürfnisse anzupassen, ohne auf eine proprietäre API des Herstellers angewiesen zu sein.
Bei open‑weight‑Modellen werden in der Regel nur die finalen Gewichte herausgegeben. Der Quellcode der Architektur, das Training-Skript und die verwendeten Datensätze bleiben in der Regel proprietä Open‑weight‑Modelle fördern dennoch die Nutzung und Erforschung von LLMs, weil sie eine schnelle Anpassung durch Fine‑Tuning ermöglichen und Entwicklern Zugang zu leistungsfähigen Modellen geben, ohne selbst aufwändig trainieren zu müssen.
Es handelt sich daher nicht um echte „open source“-Modelle, da nicht der komplette Quellcode einsehbar ist. Für Unternehmen ist diese Unterscheidung in der Regel nicht relevant, da lediglich eine fine-tuning an die eigenen Bedürfnisse auf Basis der modifizierbaren Gewichte erfolgt.
Die beiden Modelle stehen unter der Lizenz Apache 2.0.[4] Die Apache-2.0-Lizenz ist eine Open-Source-Lizenz, die Entwicklern größtmögliche Freiheit einräumt, gleichzeitig aber einige Schutz- und Transparenzpflichten vorsieht. Kernelemente sind, dass die Vervielfältigung, Verteilung, Modifikation und die private, wie die kommerzielle Nutzung erlaubt Der Code darf in andere Projekte (auch mit restriktiveren Lizenzen!) integriert werden und eignet sich damit sehr gut für die Modifikation und kommerzielle Verwertung.
Anbieter von KI-Modellen mit allgemeinem Verwendungszweck
Erst am 08.2025 sind die Bestimmungen der KI-Verordnung („AI Act“) zu KI-Modellen mit allgemeinem Verwendungszweck in Kraft getreten, die sich in Kapitel V des AI Acts finden und natürlich auch OpenAI treffen.
Nach Art 53 Abs 1 lit a und b AI Act haben Anbieter von KI-Modellen mit allgemeinem Verwendungszweck (General Purpose AI Models; „GPAI“) u.a. eine technische Dokumentation des Modells zu erstellen. Diese Dokumentation muss Trainings- und Testverfahren, die Ergebnisse der Bewertung sowie bestimmte Mindestinformationen umfassen und Anbietern von KI-Systemen zur Verfügung gestellt werden, damit diese das KI-Modell in ihre KI-Systeme integrieren können.
Diese Pflichten gelten nicht für Anbieter von GPAI-Modellen, die im Rahmen einer freien und quelloffenen Lizenz bereitgestellt werden und deren Parameter, einschließlich Gewichte, Informationen über die Modellarchitektur und Informationen über die Modellnutzung, öffentlich zugänglich gemacht werden.
Auf Basis des bisherigen Kenntnisstands ist davon auszugehen, dass die gpt-oss-Modelle die Voraussetzungen für die sogenannte „open-source“-Ausnahme des AI Acts nach Art 53 Abs 2 erfüllen, da die Modelle unter der Apache 2.0 Lizenz zur Verfügung gestellt werden, die Parameter (Gewichte) geändert werden können und die Informationen über die Modellarchitektur in der Model Card[5] bereitgestellt werden. Darüber hinaus ist nach den Leitlinien der Europäischen Kommission erforderlich, dass die Modelle nicht monetarisiert werden, was ebenfalls der Fall sein dürfte.[6]
Wird man durch Modifikation des Modells zum Anbieter von (modifizierten) GPAI-Modellen?
Anbieter eines KI-Systems ist jede natürliche oder juristische Person, die ein KI‑System oder ein GPAI‑Modell entwickelt oder entwickeln lässt und dieses unter eigenem Namen oder eigener Marke auf dem Markt bereitstellt. Jedes Unternehmen, das ein GPAI-Modell in sein eigenes KI-System integriert und dieses unter eigenem Namen auf dem Markt bereitstellt, wird daher als Anbieter im Sinne des AI Acts zu qualifizieren sein.
Nach Erwägungsgrund 97 des AI Act können GPAI-Modelle modifiziert oder finetuned werden, was die Qualifikation als ein neues modifiziertes GPAI-Modell zur Folge haben kann und mit erheblichen Compliance-Aufwänden und Pflichten nach dem AI Act verbunden wäre. Es stellt sich daher die Frage, ab wann man vom Anbieter eines KI-Systems zum Anbieter eines KI-Modells mit allgemeinem Verwendungszweck wird. Für kleinere Projekte im Unternehmen würde diese Qualifikation eine Realisierung des Projekts wahrscheinlich verhindern.
Führt eine Änderung der Gewichte der Modelle also dazu, dass das Unternehmen als Anbieter eines GPAI-Modells zu qualifizieren ist? Der AI Act lässt diese Frage offen, weshalb die EU-Kommission eine Klarstellung in den Leitlinien getroffen hat:
Nach den Leitlinien der Europäischen Kommission gilt nicht jede Feinabstimmung durch einen „Downstream Modifier“[7] als neues GPAI-Modell. Akteure, die ein bestehendes GPAI‑Modell modifizieren, werden nur in Ausnahmefällen als Anbieter eines neuen GPAI-Modells Dies ist laut Leitlinien erst dann der Fall, wenn eine signifikante Änderung des Modells oder dem damit verbundenen systemischen Risiko vorliegt.
Ein Indikator für eine signifikante Änderung des GPAI-Modells ist es, wenn die Modifikation bzw. das Fine‑Tuning mehr als ein Drittel der ursprünglichen Trainings‑Rechenleistung des Basismodells erfordert, was in der Praxis nur selten der Fall sein wird. Wird dieser Schwellenwert nicht erreicht und liegt keine signifikante Änderung vor, gelten die Änderungen des Downstream-Modifiers als „geringfügig“.
Fine-tuning, das keine wesentliche Veränderung bewirkt, führt daher in der Regel nicht dazu, dass das Unternehmen zum Anbieter eines GPAI-Modells wird, sondern nur als Anbieter eines KI-Systems zu qualifizieren ist.
Wenn die Schwelle nicht erreicht wird, gibt es soweit ersichtlich keine spezielle Verpflichtung im AI‑Act, die Fine‑Tuning‑Daten eigens zu dokumentieren. Allerdings können sich Dokumentationspflichten aus anderen Teilen des AI Act ergeben, etwa wenn eine Integration in ein Hochrisiko-KI-System erfolgt.
Welche Pflichten bestehen, wenn man eine signifikante Änderung des Modells durchführt? Nach Erwägungsgrund 109 des AI Act sind die Pflichten der Anbieter von KI-Modellen mit allgemeinem Verwendungszweck auf die Änderung oder Feinabstimmung beschränkt. Anbieter sollen auf bereits vorhandener technischer Dokumentation aufbauen und diese um Informationen über die Änderungen, einschließlich neuer Trainingsdatenquellen, ergänzen, um die Verpflichtungen nach Art 53 zu erfüllen.
Ergebnis
Unternehmen, die die Modelle gpt-oss-120b oder gpt-oss-20b in ihre KI-Systeme integrieren, können rechtliche Risiken reduzieren und können die Vorteile eines angepassten KI-Modells nutzen, ohne grundsätzlich zum Anbieter eines modifizierten KI-Modells mit allgemeinem Verwendungszweck zu werden. Aus unserer Sicht bieten diese Modelle daher eine gute Basis für einen sinnvollen und rechtssicheren Einsatz von KI im Unternehmen und auch für kommerzielle Angebote in bestimmten Branchen.
[1] https://www.forbes.com/sites/emmawoollacott/2025/07/22/microsoft-cant-keep-eu-data-safe-from-us-authorities/.
[2] https://openai.com/index/introducing-gpt-oss/.
[3] https://github.com/openai/gpt-oss.
[4] https://github.com/openai/gpt-oss/blob/main/LICENSE. https://www.apache.org/licenses/LICENSE-2.0.
[5] https://cdn.openai.com/pdf/419b6906-9da6-406c-a19d-1bb078ac7637/oai_gpt-oss_model_card.pdf
[6] https://digital-strategy.ec.europa.eu/en/library/guidelines-scope-obligations-providers-general-purpose-ai-models-under-ai-act
[7] Der AI‑Act unterscheidet nicht zwischen einem „Downstream‑Akteur“ und einem „Anbieter“. Die Leitlinien der Europäischen Kommission verwenden den Begriff „downstream actor“, um Unternehmen zu beschreiben, die ein fremdes Modell nutzen oder anpassen, ohne notwendigerweise ein neuer Anbieter zu werden.
Kontakt:
RA Mag. Clemens Handl, LL.M.: handl@chg.at
Rechtsanwalt und Leiter der Praxisgruppe data & technology
CHG Czernich Haidlen Gast & Partner Rechtsanwälte
Bozner Platz 4 – 6020 Innsbruck
Tel.: 0512-567373 Fax: 0512-567373 -15
office@chg.at www.chg.at