YouTube Instagram Vimeo RSS VIDEOAKTIV

Teuken-7B von OpenGPT-X: KI-Sprachmodell „Made in Germany“

Mit dem geförderten EU-Projekt OpenGPT-X will man in Deutschland und Europa die Entwicklung offener und vertrauenswürdiger KI-Sprachmodelle vorantreiben und die digitale Souveränität stärken.

Das Teuken-7B-Modell wurde von Grund auf multilingual trainiert und soll dank eines speziell entwickelten Tokenizers eine hohe Energie- und Kosteneffizienz bei Anwendungen in allen 24 europäischen Amtssprachen bieten. Er wird mit einer Open-Source-Lizenzierung (Apache 2.0) angeboten. Mit dem Angebot von Teuken-7B will man nun also Unternehmen davon überzeugen, dass es auch vertrauenswürdige und quelloffene Alternative zu den großen gängigen Modellen gibt. Denn es wurden bei der Erstellung und dem KI-Training die Bedürfnisse europäischer Unternehmen als auch die der Forschung berücksichtigt. Das ermöglicht auch für die Zukunft neue datenbasierte Geschäftslösungen. Die Modelle sollen sich durch Mehrsprachigkeit, Offenheit (Open Source) und Vertrauenswürdigkeit auszeichnen. Gerade in der Kreativwirtschaft ist die Einbindung von Sprachmodellen besonders verbreitet – sei dies zur Sprachauswertung in Text oder die Sprachausgabe von geschriebenem Wort.

KI Sprachmodell in Europa

Mit Teuken-7B gibt es nun ein Open-Source-Sprachmodell auf das Unternehmen mit eigenen Entwicklungen aufsetzen können.

Mit dem vom Bundesministerium für Wirtschaft und Klimaschutz (BMWK) mit immerhin 14 Millionen Euro geförderte Projekt sollen deutschen Behörden und Institutionen den Zugang zu generativer künstlicher Intelligenz (GenAI) -Technologie bekommen. Ein Konsortium unter Leitung der Fraunhofer-Institute IAIS und IIS entwickelte mit weiteren Partnern wie zum Beispiel der TU Dresden, dem Deutschen Forschungszentrum für Künstliche Intelligenz GmbH (DFKI) und dem Forschungszentrum Jülich das Sprachmodell Teuken-7B. Das auf dem Jülicher Supercomputer JUWELS trainierte Sprachmodell ist seit dem 26. November unter einer Open-Source-Lizenz verfügbar. "Die Bereitstellung von Teuken als Open-Source-Modell hat mehrere Vorteile: Unternehmen können das Modell auf ihre Bedarfe anpassen – also spezialisierte Anwendungen damit entwickeln. Zudem können sie bestimmen, ob sie das Modell lokal auf der eigenen Infrastruktur oder bei einem vertrauenswürdigen Cloudanbieter ihrer Wahl betreiben wollen. Wenn gewünscht, können sensible Daten also im Unternehmen verbleiben.“– Dr. Nicolas Flores-Herr, Projektleiter am Fraunhofer IAIS.

Telekom dl cloud rechenzentrum 03

Die Telekom bietet das Teuken-7B-Sprachmodell Unternehmen an und verspricht den Betrieb auf Servern in Deutschland und Europa nach hießigen Regeln.

Die Deutsche Telekom hat nun die Entwicklung des europäischen Sprachmodells von der Forschung in die Wirtschaft transferiert und ist damit der erste Anbieter, der den Zugang zu Teuken-7B kommerziell zur Verfügung stellt. Mit den AI Foundation Services stellt die Telekom-Tochter T-Systems dafür flexible Betriebsmodelle bereit. Unternehmen können wählen, ob sie die Modelle in hochsicheren, zertifizierten Telekom-Rechenzentren in Deutschland, DSGVO-konform in Europa oder sogar dediziert auf eigener Infrastruktur nutzen möchten. Insbesondere für regulierte Branchen und besonders schützenswerte Daten bietet die Telekom Lösungen, die höchsten Ansprüchen an Sicherheit und Compliance gerecht werden.