Sprachmodelle für die Wirtschaft: Wie deutsche Unternehmen profitieren
Mit ChatGPT, Bart und Llama ist eine neue KI-Generation in der
Öffentlichkeit bekannt geworden. Die großen Sprachmodelle versprechen
mächtige Werkzeuge für Wirtschaft und Gesellschaft. Doch vor der
Einführung der Sprachassistenten in den Betrieben sind noch einige Hürden
zu nehmen. Wie die deutsche Wirtschaft von Sprachmodellen profitiert und
was dabei ein deutschsprachiges Open Source-Modell leisten kann, erläutert
Alexander Löser im Interview. Er ist Professor für Data Science und
Textbasierte Informationssysteme an der Berliner Hochschule für Technik
und Mitglied der Arbeitsgruppe Technologische Wegbereiter und Data Science
der Plattform Lernende Systeme.
Herr Löser, welche Einsatzmöglichkeiten eröffnen große Sprachmodelle für
Unternehmen?
Da gibt es zunächst das Marketing und vielleicht auch die PR-Arbeit. Dann
haben wir Anwendungsgebiete im Bereich der persönlichen Kundenansprache.
Dabei muss das Unternehmen allerdings überlegen, ob es Kundendaten an
einen Sprachmodell-Anbieter senden möchte, der nicht unter deutschem Recht
agiert. Das halte ich für einen sehr wichtigen Punkt. Auch für den
Kundenservice eignen sich die großen Sprachenmodelle von Open AI oder
Anthropic nur bedingt, weil diese kein unternehmensspezifisches inhouse-
Wissen haben. Für diesen Bereich werden wir vermutlich in Zukunft lokale
Sprachmodelle zumindest anpassen und lokal vorrätig halten.
Ein weiteres Einsatzgebiet mit hohem Potenzial ist der ganze Bereich der
Softwareentwicklung – Scripting, DevOps usw. Hierfür existieren bereits
spezielle Sprachmodelle, die 80 Programmiersprachen unterstützen und Open-
Source-basiert sind. Programmiererinnen und Programmierer können sie zur
Unterstützung nutzen, um genaueren oder mehr Code in der gleichen Zeit zu
schreiben.
Darüber hinaus gibt es spezielle Anwendungsgebiete, die mir persönlich
sehr am Herzen liegen: die Vereinfachung von Prozessen der Medizin, das
Erkennen von Krankheitssymptomen, vielleicht auch künftig Unterstützung
bei medizinischen Diagnosen. Dazu muss allerdings zuerst das Problem des
Halluzinierens großer Sprachmodelle gelöst und rechtliche Fragen geklärt
werden.
Vor welchen Hürden stehen deutsche Unternehmen beim Einsatz von
Sprachmodellen?
Zunächst stehen Unternehmen vor der Frage: Möchte man ein Vendor Lock-in
mit einem Anbieter riskieren? Oft sogar einem Anbieter, der nicht nach
europäischem Recht agiert. Die zweite Hürde ist, dass die aktuellen
Modelle multilingual sind. Das ist einerseits gut, weil ein Modell dann
möglicherweise Konzepte aus einer anderen Sprache ergänzen kann.
Andererseits ist die Anzahl der Modelle, die wirklich Deutsch sprechen,
derzeit noch auf äußerst wenige Anbieter beschränkt. Wir brauchen also ein
deutschsprachiges Modell. Ich halte es für notwendig, dass deutsche
Unternehmen auf ein Open-Source-gehostetes, kommerziell nutzbares Modell
zugreifen können, damit sie dieses dann anpassen, für ihre eigenen
Bedürfnisse explorieren und nutzen können.
Und die dritte Hürde sehe ich dann im Moderator-Layer. Wir haben auf der
untersten Schicht das Sprachmodell, das nur das nächste Wort vorhersagt.
Dann haben wir den Prompting Layer, der an die spezielle Domäne mit
geringem Aufwand angepasst wird. Und dann haben wir die obere Ebene, das
ist der Moderator-Layer. Und der Moderator Layer muss zum Beispiel im
Kundenkontakt vermeiden, dass rassistische Sprache entsteht, dass
gefährliche Informationen aus dem Modell herausdringen können und dass es
entsprechend geltenden Gesetzen agiert – die schon in Deutschland deutlich
anders sind als in anderen europäischen Ländern oder sogar in den USA. Und
auch diese Trainingsdaten für den Moderator Layer sind bisher kaum
vorhanden.
Was kann ein deutschsprachiges Open Source-Modell leisten?
Zunächst müssen Unternehmen in verschiedenen Industrien und in vielen
verschiedenen Segmenten schnell in die Lage versetzt werden zu eruieren,
ob sich mithilfe eines Sprachmodells Produktivitätsgewinne erzielen
lassen, ob sein Einsatz eine höhere Kundenbindung ermöglicht oder
möglicherweise dem Unternehmen sogar hilft, neue Märkte zu erobern.
Ich plädiere für ein Investment des Staates und auch von Unternehmen in
ein kommerziell nutzbares Open Source-Modell. Ich glaube, dass dieses
Investment deutlich geringer ausfällt als noch vor einem Jahr. Ich würde
hier mit einer Summe zwischen 8 und 15 Millionen rechnen.
Der große Teil des Investments fließt in die Kuratierung und Beschaffung
der Daten, ein kleinerer in die Berechnung. Es wäre erstrebenswert, wenn
die Politik hier ein oder vielleicht sogar mehrere Projekte förderte mit
dem Ziel, ein kommerziell nutzbares deutsches Open Source-Sprachemodell zu
schaffen. Die Trainingsdaten müssten ebenfalls kommerziell nutzbar und
Open Source zur Verfügung stehen. So könnte eine Innovations-Community
aufgebaut werden, die dieses Sprachmodell an zahlreiche Gegebenheiten von
Unternehmen anpasst und den Moderatoren-Layer entsprechend der deutschen
Rechtsprechung sowie europäischen Werten anpasst.
