xAI, die Firma von Elon Musk, releast ihr Flagschiff-Model Grok 3


(C) unter Verwendung eines Motivs von Andrei Suslov / 123RF.com
Die KI-Firma von Elon Musk, xAI, hat ihr neues Sprachmodell Grok 3 veröffentlicht und kündigt neue Features für die Web- und iOS-Apps von Grok an.
Grok, der direkte Konkurrent von Sprachmodellen wie OpenAI’s GPT-4o oder Googles Gemini, war ursprünglich schon für Ende 2024 angekündigt worden, verpasste aber die Deadline und wurde jetzt vorgestellt. xAI nutze für das Training ein riesiges Rechenzentrum in Memphis mit rund 200 000 GPUs, was ungefähr dem Zehnfachen der Rechenkraft entsprechen soll, die für den Vorgänger Grok 2 aufgewendet wurde.
Grok 3 ist, genau betrachtet, eine ganze Familie von Modellen. Eine kleinere Version von Grok 3, Grok 3 mini, antwortet schneller auf Fragen, allerdings auf Kosten der Genauigkeit. Noch befinden sich einige Modelle und die zugehörigen Funktionen der Grok-3-Familie in der Beta-Phase. xAI behauptet aber bereits jetzt, dass Grok 3 GPT-4o bei Benchmarks wie AIME (der die Leistung eines Modells mit einer Auswahl von Mathematikfragen bewertet) und GPQA (der Modelle anhand von Physik-, Biologie- und Chemieproblemen auf PhD-Niveau bewertet) übertrifft.
Zwei Modelle der neuen Grok 3-Familie, Grok 3 Reasoning und Grok 3 mini Reasoning, können Probleme sorgfältiger „durchdenken“, ähnlich wie andere „schlussfolgernde“ Modelle, etwa das o3-mini von OpenAI und das R1 von DeepSeek. Reasoning-Modelle versuchen, sich selbst zu überprüfen, bevor sie Ergebnisse ausgeben, was ihnen hilft, einige der Fallstricke zu vermeiden, über die Modelle normalerweise stolpern. xAI behauptet, dass Grok 3 Reasoning die beste Version von OpenAI’s o3-mini – o3-mini-high – bei mehreren beliebten Benchmarks übertrifft, einschließlich eines neueren Mathematik-Benchmarks namens AIME 2025.
Wie von Musk zu hören war, sollen einige der „Gedanken“ der Reasoning-Modelle in der Grok-App unkenntlich gemacht werden, um eine Destillation zu verhindern. Das ist eine Methode, die von KI-Modellentwicklern verwendet wird, um Wissen aus anderen Modellen zu extrahieren. Kürzlich wurde DeepSeek beschuldigt, die Modelle von OpenAI zu destillieren, um seine eigenen zu erstellen.
Grok 3 wird zuerst zahlenden Abonnenten des Premium Levels (50 Dollar/Monat) zugänglich sein. Danach soll Gerüchten zufolge eine neues Subskriptionsmodell namens SuperGrok für 30 Dollar/Monat diese Features vermarkten.