OpenAI: GPT-4.5 und GPT-5 für die kommenden Wochen und Monate angekündigt

Thread Starter
Mitglied seit
06.03.2017
Beiträge
114.871
OpenAI bereitet die Einführung neuer Sprachmodelle vor. In den kommenden Wochen soll zunächst GPT-4.5 veröffentlicht werden, bevor später im Jahr GPT-5 folgen wird. GPT-4.5, intern als "Orion" bezeichnet, wird das letzte Modell sein, das ohne explizite Chain-of-Thought-Prozesse arbeitet – eine Technik, die bei komplexen Aufgaben den Denkprozess des Modells besser nachvollziehbar macht. Mit diesem Update möchte OpenAI die bestehende Produktlinie optimieren und eine Basis für kommende Entwicklungen schaffen.
... weiterlesen
 
Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.
wer hat denn diesen text geschrieben "und seine Position gegen die Konkurrenz ausbauen."

dSikL5Y.png


tf3cJ12.png


bevor ausgebaut wird , muss man doch erstmal die position erreichen , lol ?

der einzige der hier von ausbau sprechen kann ist google ...

Ez3DcPA.png


ganz zu schweigen von der google api ... mit bildschirmübertragung und analyse und co ...
 
Zuletzt bearbeitet:
wer hat denn diesen text geschrieben "und seine Position gegen die Konkurrenz ausbauen."





bevor ausgebaut wird , muss man doch erstmal die position erreichen , lol ?

der einzige der hier von ausbau sprechen kann ist google ...



ganz zu schweigen von der google api ... mit bildschirmübertragung und analyse und co ...
Es hängt schon stark davon ab was man misst, wer da misst und wie man misst. Aber wenn du schon LM Arena zitierst:

We controlled for the effect of length and markdown, and indeed, the ranking changed. This is just a first step towards our larger goal of disentangling substance and style in Chatbot Arena leaderboard.

Style controlled overall

1739471894579.png


Style controlled Math
1739471957976.png


Style controlled Coding
1739472012902.png


Creative writing
1739472077410.png



Meine eigenen Test neigen dazu, dass Google häufig reinscheißt und GPT verlässlich gute Leistung mit gelegentlichen Schwächen liefert.
Es ist wie mit dem Context Window. Google sagt über eine Million Token, aber wenn man des testet, gehen die meisten Details halt einfach verloren. Es mögen 1kk Token sein, die aber qualitativ scheiße sind. GPT liefert je nach Modell nur 120k aber die nutzt es in der Regel auch aus.
 
Zuletzt bearbeitet:
bei mir isses genau andersherum , google ist deutlich besser als gpt ...

und ich habe nach dem score sortiert (macht ja auch sinn)




allein das man bei gpt nicht unendlich anfragen stellen kann ist lächerlich ...
 
bei mir isses genau andersherum , google ist deutlich besser als gpt ...

und ich habe nach dem score sortiert (macht ja auch sinn)




allein das man bei gpt nicht unendlich anfragen stellen kann ist lächerlich ...
Ja ich auch, siehst du ja. Es ist aber Style controlled.

Und als Anmerkung. LMArena arbeitet mit 95% CI. Das Delta #1 und #2 beträgt 17. -7 +4 also 11.
Ja gut was soll man da noch sagen... also entweder sind die Model alle quasi identisch oder die Nutzer sind einfach mal scheiße im Assessment und können einen Monet nicht von einem Manet unterscheiden.
Ich stimme für Option 2.
 
Zuletzt bearbeitet:
Hardwareluxx setzt keine externen Werbe- und Tracking-Cookies ein. Auf unserer Webseite finden Sie nur noch Cookies nach berechtigtem Interesse (Art. 6 Abs. 1 Satz 1 lit. f DSGVO) oder eigene funktionelle Cookies. Durch die Nutzung unserer Webseite erklären Sie sich damit einverstanden, dass wir diese Cookies setzen. Mehr Informationen und Möglichkeiten zur Einstellung unserer Cookies finden Sie in unserer Datenschutzerklärung.


Zurück
Oben Unten refresh