OpenAI, DeepSeek, Codestral – KI entwickelt sich in Riesenschritten

Ein chinesisches Sprachmodell sorgt für einen Börsen-Crash. KI ist ein Feld der Überraschungen; das sind weltweit die neuesten Entwicklungen.

30. Januar 2025

5 Min. Lesezeit

KI-generiertes Bild eines Mannes im Rennanzug, im Hintergrund ein futuristisches Auto

Bei dem Riesentempo wird einem schwindlig: Die großen KI-Anbieter bringen in schneller Folge erweiterte Modelle heraus und ein chinesisches Startup versetzt die Bay Area rund um San Francisco in Aufruhr, inklusive Börsenabsturz des KI-Weltmeisters Nvidia. Eigentlich hätte das nicht geschehen dürfen, denn chinesische KI sollte durch Ausfuhrzölle und Exportverbote klein gehalten werden.

Passiert aber ist das Gegenteil. Chinesische KI-Experten sind einfallsreich und haben sich Workarounds für das Training und den Einsatz der knappen Hardware ausgedacht. Beschränkung macht China kreativ, aber die Konkurrenz in den USA schläft auch nicht. So hat OpenAI einen praxistauglichen KI-Agenten entwickelt und die europäische KI-Hoffnung Mistral AI spezialisiert sich auf Code-Generierung.

OpenAI Operator: Booster für KI-Agenten

Der Operator von OpenAI ist eine Schwester-Applikation von ChatGPT zur Automatisierung des Internets. Operator kann auf Webseiten eigenständig Schaltflächen anklicken, Menüs öffnen, Befehle auswählen und Textfelder ausfüllen. Damit lassen sich Workflows automatisieren, die bisher viele Klicks erforderten.

Ein möglicher Use Case: Auf den Befehl „Bitte buche mir für nächsten Freitagabend einen möglichst günstigen Flug nach Madrid“ legt das Tool los und sucht nach einer preisgünstigen Flugverbindung, die es auch direkt bucht und bezahlt. Diese eigenständigen Aktionen sind ein wichtiger Schritt bei der Weiterentwicklung von Künstlicher Intelligenz hin zu autonom agierenden Agenten.

Eine Person in Anzug und Sonnenbrille steht selbstbewusst vor leuchtenden runden Neonlichtern, ihre Präsenz ist so auffällig wie eine Kreation der generativen KI, mit einem leuchtend rosa und violetten Hintergrund.

Bisher ist Operator nur in den USA verfügbar. Nach ersten Erfahrungen von Nutzern handelt es sich tatsächlich um eine Testversion: Sie ist noch langsam, unzuverlässig und leicht zu verwirren. Doch vieles funktioniert bereits. Damit es nicht zu Datenverlusten kommt, besitzt Operator Schutzmechanismen. Dazu gehören Bestätigungsschritte für kritische Aktionen wie das Abschließen von Käufen oder das Versenden sensibler Informationen.

Im Moment gibt es nur eine „Research Preview“ für ChatGPT Pro-Nutzer an, die sich die 200 US-Dollar im Monat leisten können oder wollen. OpenAI plant jedoch, den Zugang schrittweise auf weitere Nutzergruppen und andere Länder auszuweiten. Zudem sind Partnerschaften mit Unternehmen wie Instacart, Uber, eBay und anderen geplant. Erst durch solche Kooperationen wird Operator sein eigentliches Potenzial verwirklichen. Mit dem Direktzugriff auf APIs kann die KI flüssiger arbeiten und sich wirklich nützlich machen.

DeepSeek: der effiziente chinesische Angreifer

Das neue KI-Modell R1 des chinesischen Startups DeepSeek hat für großes Aufsehen gesorgt und sogar ein Börsenbeben ausgelöst. Es hat einen Funktions- und Leistungsumfang, der sich mit dem OpenAI-Modell GPT o1 oder Claude 3.5 Sonnet von Anthropic vergleichen lässt. R1 ist als Open Source entwickelt worden, ohne spezifische kommerzielle Interessen und existiert auch als Version für die lokale Installation, sogar auf einem PC.

Allerdings sind offensichtlich einige Themen der Zensur zum Opfer gefallen, denn R1 verweigert Infos über das Tianamen-Massaker und andere, aus chinesischer Sicht heikle Themen. Trotz der engen Verknüpfung mit Staat und Partei ist R1 zu beeindruckenden Leistungen fähig. Es zeigt, dass die KI-Experten des Landes auf die Augenhöhe mit den scheinbar überlegenen US-Wissenschaftlern operieren.

Das Besondere: Das Unternehmen hat eine Methode ersonnen, sein Modell deutlich schneller und mit weitaus weniger Rechenaufwand zu trainieren. So hat DeepSeek sein R1 laut eigener Aussage innerhalb von nur zwei Monaten und zu Kosten von lediglich knapp sechs Millionen Dollar entwickelt. Das hat für Aufsehen gesorgt, denn sonst fällt der Aufwand deutlich höher aus. Zudem sind die eigentlich notwendigen Nvidia-GPUs exportbeschränkt, sodass China nur wenige und vorwiegend ältere im Einsatz hat.

Offensichtlich ist es dem Startup gelungen, eine effizientere Form des KI-Trainings zu verwirklichen, die diverse Beschränkungen umgeht. DeepSeek selbst sagt, dass lediglich ein Zehntel der üblicherweise genutzten Ressourcen eingesetzt wurden. Das ist mit Sicherheit die erste Stufe einer weiteren Skalierung: Mit den vorhandenen Ressourcen lässt sich demnach zehnmal so viel anstellen als bisher.

Mistral AI: der Code-Spezialist aus Europa

Das französische Unternehmen Mistral legt bei seinen Sprachmodellen den Schwerpunkt auf möglichst effiziente KI, die sowohl beim Training als auch bei der Ausführung mit optimaler Geschwindigkeit arbeitet. Mistral Large 2 beherrscht Sprachen wie Englisch, Französisch, Spanisch, Deutsch und Italienisch und besitzt darüber hinaus auch Programmierfähigkeiten – wie seine Konkurrenten auch.

Darauf baut die aktuelle Version von Codestral auf. Sie bringt weitere Fortschritte in der automatischen Code-Erzeugung. Das Modell beherrscht mehrere Programmiersprachen wie Python oder Java und sogar C++. Dadurch kann es zusammen mit den meisten modernen Entwicklungsumgebungen eingesetzt werden. Die Genauigkeit gegenüber geprüftem Code liegt deutlich über 85 Prozent. In Einzelfällen, etwa bei Java, erreicht Codestral sogar 97 Prozent.

Durch seine Spezialisierung kann Codestral im Software-Engineering eingesetzt werden, zum Beispiel für automatische Tests, Code-Vervollständigung und Übersetzungen zwischen Programmiersprachen. Diese Möglichkeiten sind zwar weniger aufregend als bei den großen Sprachmodellen, doch sie versprechen Unternehmen einen klar erkennbaren Nutzen. Mistral zeigt, dass auch Europa „Foundation Models“ beherrscht. Doch zugleich richtet es den Blick auf die Herausforderungen: Es gibt in Europa immer noch nicht genug Investoren, die Milliarden für die benötigten Rechenzentren aufbringen können.

Darüber hinaus herrscht in der EU bittere Datenarmut. Die USA und China handeln hier nach dem Motto: erst schießen, dann fragen. Europa steht sich häufig selbst im Weg und denkt immer als erstes an Regulation. Erst dann wird die Frage gestellt, wie man das zu Regulierende überhaupt erst aufbaut und Chancen nutzt. Immerhin gibt es Milliardäre wie Bernard Arnault, der laut aktueller Meldungen möglicherweise Mistral übernehmen wird, um das in finanzielle Probleme geratene Unternehmen zu halten und weiterzuentwickeln.