Llama 4: Metas neue KI-Modelle werden noch komplexer

Thread Starter
Mitglied seit
06.03.2017
Beiträge
121.735
Meta hat mit der Llama 4-Serie eine neue Generation multimodaler Sprachmodelle vorgestellt, die sich durch technische Innovationen und hohe Effizienz auszeichnen wollen. Das Einstiegsmodell Llama 4 Scout nutzt dabei 17 Milliarden aktive Parameter, die auf 16 Experten verteilt sind, und kann dank seiner Architektur vollständig auf einer einzigen NVIDIA H100 GPU betrieben werden. Es unterstützt eine kontextuelle Eingabelänge von bis zu 10 Millionen Tokens, was bisherige Grenzen deutlich übertrifft. Das Modell setzt auf eine Kombination aus dichter und Mixture-of-Experts-Architektur und soll hohe Leistungswerte in Benchmarks gegenüber Gemma 3, Gemini 2.0 Flash-Lite und Mistral 3.1 zeigen.
... weiterlesen
 
Hardwareluxx setzt keine externen Werbe- und Tracking-Cookies ein. Auf unserer Webseite finden Sie nur noch Cookies nach berechtigtem Interesse (Art. 6 Abs. 1 Satz 1 lit. f DSGVO) oder eigene funktionelle Cookies. Durch die Nutzung unserer Webseite erklären Sie sich damit einverstanden, dass wir diese Cookies setzen. Mehr Informationen und Möglichkeiten zur Einstellung unserer Cookies finden Sie in unserer Datenschutzerklärung.


Zurück
Oben Unten refresh