CLAUDE 3.7 SONNET Thinking est désormais l'IA la plus PUISSANTE du MONDE !

OP
NN

NiveauNouveau

il y a 2 mois

https://livebench.ai/#/

Anthropic qui régale

Meilleur modèle classique https://image.noelshack.com/fichiers/2022/37/1/1663014384-ahi-pince-mais.png
Meilleur modèle de raisonnement https://image.noelshack.com/fichiers/2022/37/1/1663014384-ahi-pince-mais.png

JL

jean_ledruide

il y a 2 mois

J'avais foi en MC Solaar https://image.noelshack.com/fichiers/2023/44/7/1699147784-rire-ayaa-risitas-deforme-ayaaa-aya-deratiseur-zoom.png

A8

Astolfo885

il y a 2 mois

Fake, O3 d'OpenAI est au-dessus mais coûte trop cher, donc pour l'instant on n'a accès qu'à O3-mini. https://image.noelshack.com/fichiers/2022/37/1/1663014384-ahi-pince-mais.png

OP
NN

NiveauNouveau

il y a 2 mois

Astolfo885 a écrit :
Fake, O3 d'OpenAI est au-dessus mais coûte trop cher, donc pour l'instant on n'a accès qu'à O3-mini. https://image.noelshack.com/fichiers/2022/37/1/1663014384-ahi-pince-mais.png

  • Modèle commercialisé
B1

binks112

il y a 2 mois


Fake, O3 d'OpenAI est au-dessus mais coûte trop cher, donc pour l'instant on n'a accès qu'à O3-mini. https://image.noelshack.com/fichiers/2022/37/1/1663014384-ahi-pince-mais.png

Tiens, ça m'intéresse.

Meilleur dans quel domaine?

Actuellement il y a énormément de modèles sur GPT (du moins la version payante), je ne sais jamais laquelle utiliser (globalement j'utilise 4-o et o-1), mais j'ai des amis dev qui m'ont dit que ça dépendait entièrement de l'utilisation.

B1

binks112

il y a 2 mois

Ah bah la réponse est dans le lien de l'auteur.

Ok, donc o3 meilleur pour coder, et dans la data analyse, mais moins bon en raisonnement et langues que o1.

K3

kheyduhelm3

il y a 2 mois

O3 mini high pour coder, o1 pour le raisonnement.
En tout cas j'utilise sonnet 3.7 sur l'ide vu que cursor est pas foutu de proposer o3 mini high https://image.noelshack.com/fichiers/2022/37/1/1663014384-ahi-pince-mais.png

C'est trop cool bordel, toutes les 2 semaines y'a un des géants qui va sortir un model meilleur que les autres, mais en tout cas c'est une des premières fois de mémoire qu'un LLM dépasse gpt sur le general de live bench. https://image.noelshack.com/fichiers/2022/37/1/1663014384-ahi-pince-mais.png

J'attend les prochaines version de qwen, deep seek , grok 4 pour voir si ces 3 là pendront la tête. https://image.noelshack.com/fichiers/2022/37/1/1663014384-ahi-pince-mais.png

Bon après gpt 4.5 doit sortir soon, et gpt 5 sera en milieu/fin d'année et va tout éclater. https://image.noelshack.com/fichiers/2022/37/1/1663014384-ahi-pince-mais.png

Gpt 5 sera la dernier model gpt qui n'utilisera pas nativement le raisonnement, à partir du 6 y'aura pas besoin de cliquer sur un bouton "raisonner" https://image.noelshack.com/fichiers/2022/37/1/1663014384-ahi-pince-mais.png

C'est passionnant cette course à l'AGI et ASI, ça rappel le projet lune des années 60. https://image.noelshack.com/fichiers/2022/37/1/1663014384-ahi-pince-mais.png

E[

Evengeli[us]

il y a 2 mois

o3-mini high reste supérieur dans le code.

Donc o3-mini high > all.

Osef du reste.

M1

Mousline10

il y a 2 mois


O3 mini high pour coder, o1 pour le raisonnement.
En tout cas j'utilise sonnet 3.7 sur l'ide vu que cursor est pas foutu de proposer o3 mini high https://image.noelshack.com/fichiers/2022/37/1/1663014384-ahi-pince-mais.png

C'est trop cool bordel, toutes les 2 semaines y'a un des géants qui va sortir un model meilleur que les autres, mais en tout cas c'est une des premières fois de mémoire qu'un LLM dépasse gpt sur le general de live bench. https://image.noelshack.com/fichiers/2022/37/1/1663014384-ahi-pince-mais.png

J'attend les prochaines version de qwen, deep seek , grok 4 pour voir si ces 3 là pendront la tête. https://image.noelshack.com/fichiers/2022/37/1/1663014384-ahi-pince-mais.png

Bon après gpt 4.5 doit sortir soon, et gpt 5 sera en milieu/fin d'année et va tout éclater. https://image.noelshack.com/fichiers/2022/37/1/1663014384-ahi-pince-mais.png

Gpt 5 sera la dernier model gpt qui n'utilisera pas nativement le raisonnement, à partir du 6 y'aura pas besoin de cliquer sur un bouton "raisonner" https://image.noelshack.com/fichiers/2022/37/1/1663014384-ahi-pince-mais.png

C'est passionnant cette course à l'AGI et ASI, ça rappel le projet lune des années 60. https://image.noelshack.com/fichiers/2022/37/1/1663014384-ahi-pince-mais.png

ayaaa c'est pas le high sur cursor ? Je croyais que si
quelle bande de chiens

T1

tablepour1svp

il y a 2 mois

vivement la singularité j'en ai ras le cul de taffer
K3

kheyduhelm3

il y a 2 mois

ayaaa c'est pas le high sur cursor ? Je croyais que si
quelle bande de chiens

Non y'a que 4-o sur cursor coté gpt, si tu veux o3 ou o1 faut payer et ça coute vraiment cher je crois. https://image.noelshack.com/fichiers/2022/37/1/1663014384-ahi-pince-mais.png

Mais sonnet 3.5 était très bien pour coder, 3.7 c'est encore mieux, et pas très loin de o3 mini high https://image.noelshack.com/fichiers/2022/37/1/1663014384-ahi-pince-mais.png

edit: ah oui j'avais pas vu y'a o-3 mini proposé maintenant mais c'est pas le mini high c'est un model différent

P3

pocahontas34

il y a 2 mois

Ouep sonnet incroyable pour coder
pas teste o3 mais chatgpt4… voilà quoi