[ALERTE] OpenAI annonce o1 : le GRAND REMPLACEMENT ARRIVE

OP
AB

AlliBlackpill

il y a 7 mois

Fin de partie pour les ingénieurs et médecins qui pourront pointer chez pôle emploi comme les autres
Résout n'importe quelle tâche COMPLEXE
https://openai.com/index/introducing-openai-o1-preview/

DA

DYOR_AND_NFA

il y a 7 mois

ça y est, il peut enfin compter le nombre de r dans strawberry ?

OP
AB

AlliBlackpill

il y a 7 mois

https://www.noelshack.com/2024-38-1-1726487786-breakdown-640x440.png

Le benchmark pour voir à quel point il est plus performant que GPT

OP
AB

AlliBlackpill

il y a 7 mois

https://www.noelshack.com/2024-38-1-1726487912-image-2024-09-16-125830120.png

ah oui c'est finito pour les dévs aussi

LA

lazerzfine

il y a 7 mois

il me semblait que ça stagnait l'IA depuis, c'est pas pour flatter les actionnaires ces résultats ? https://image.noelshack.com/fichiers/2017/39/3/1506524542-ruth-perplexev2.png

D0

dabhu00

il y a 7 mois

Pour avoir test o1 un petit peu, je trouve vraiment que la hype est infonde.
Je pense que c'est juste gpt-4o + du chain of thought specialement concu pour certains benchmarks.

Bref OpenAI commence a paniquer par rapport a la concurrence, notamment Anthropic qui sort clairement du lot a l'heure actuel (j'attends avec impatience leur light model en 3.5 d'ailleurs)

OP
AB

AlliBlackpill

il y a 7 mois

dabhu00

il y a 7 mois


Pour avoir test o1 un petit peu, je trouve vraiment que la hype est infonde.Je pense que c'est juste gpt-4o + du chain of thought specialement concu pour certains benchmarks.

Bref OpenAI commence a paniquer par rapport a la concurrence, notamment Anthropic qui sort clairement du lot a l'heure actuel (j'attends avec impatience leur light model en 3.5 d'ailleurs)

T'as déjà testé claude ? Ils ont plusieurs modèles à tester chez anthropic ?

P6

Parikola69

il y a 7 mois

j'ai test pas mal de fois et je vois pas trop la différence avec le modèle gpt 4o

FE

fefbnh

il y a 7 mois

Je ne veux pas etre médisans mais je vois ce topic tous les matins depuis des mois

P6

Parikola69

il y a 7 mois


Je ne veux pas etre médisant mais je vois ce topic tous les matins depuis des mois

le modèle est sorti y a quelques jours

SC

SirCrustibald

il y a 7 mois

Dans 40 minutes

C0

chrysaor011

il y a 7 mois


Je ne veux pas etre médisant mais je vois ce topic tous les matins depuis des mois

l'IA qui est ACCESSIBLE AU PUBLIC (sachant qu'elle doit etre des niveaux au dessus pour le privé) est carrément dingue, je trouve.
Quand on voit la génération d'images, maintenant une IA chinoise peut faire des petites vidéos qui pourraient PRESQUE passer pour vraies.
Je pense qu'on est not ready et que la singularité est a nos portes perso

HM

HappyMeal_

il y a 7 mois

le modèle est sorti y a quelques jours

Oui et des modèles qui sont sortis avec le même marketing il y en a déjà eu quelques uns.

RT

RoadTo14

il y a 7 mois

J'ai testé et franchement j'ai trouvé ça ouf. ça faisait 1-2 mois que je me cassais la tête à faire des recherches (4o compris) pour savoir quelle architecture pour une application selon les features et j'ai eu du mal, du parler à des experts etc...

Premier jour, j'ai posé la question à ChatGPT o1 au cas où et paf, résultat bluffant, résultat de mes recherches et même plus en complément. J'aurais aimé pouvoir poser la question plus tôt au o1, ça m'aurait fait économiser du temps.

DL

DaLpbm

il y a 7 mois

l'IA qui est ACCESSIBLE AU PUBLIC (sachant qu'elle doit etre des niveaux au dessus pour le privé) est carrément dingue, je trouve.
Quand on voit la génération d'images, maintenant une IA chinoise peut faire des petites vidéos qui pourraient PRESQUE passer pour vraies.
Je pense qu'on est not ready et que la singularité est a nos portes perso

Mais ca je suis d'accord mais je parlais pour la science, evolution de la médecine

D0

dabhu00

il y a 7 mois

T'as déjà testé claude ? Ils ont plusieurs modèles à tester chez anthropic ?

J'utilise Claude 3.5 pour coder via l'idle Cursor (un fork de VSCode qui donne acces a des features bases sur l'IA... une sorte de Copilote booste aux hormones)

Sinon j'ai dev un jeu bases sur les LLMs, et pour le moment claude 3.5 fourni de bien meilleurs resultats que gpt4o. Seul defaut: il est plus lent que 4o.

T3

Typoloa3

il y a 7 mois


https://www.noelshack.com/2024-38-1-1726487912-image-2024-09-16-125830120.png

ah oui c'est finito pour les dévs aussi

Donc les informaticien ont creusé leur propre tombe ?

OP
AB

AlliBlackpill

il y a 7 mois

Typoloa3

il y a 7 mois

Donc les informaticien ont creusé leur propre tombe ?

y a bien des gens qui doivent construire les ia performantes

OP
AB

AlliBlackpill

il y a 7 mois

RoadTo14

il y a 7 mois


J'ai testé et franchement j'ai trouvé ça ouf. ça faisait 1-2 mois que je me cassais la tête à faire des recherches (4o compris) pour savoir quelle architecture pour une application selon les features et j'ai eu du mal, du parler à des experts etc...

Premier jour, j'ai posé la question à ChatGPT o1 au cas où et paf, résultat bluffant, résultat de mes recherches et même plus en complément. J'aurais aimé pouvoir poser la question plus tôt au o1, ça m'aurait fait économiser du temps.

L'IA meilleure que les experts https://image.noelshack.com/fichiers/2021/43/4/1635454847-elton-john-tison-golem.png

HM

HappyMeal_

il y a 7 mois

ChatGPT est éclaté au sol mais bon si ça peut rassurer les puants au RSA du forum ... https://image.noelshack.com/minis/2021/43/4/1635454847-elton-john-tison-golem.png

DP

DocteurPatrick

il y a 7 mois

YRR et ca sera bridé

AL

Afuera-lib2

il y a 7 mois

Pour le dev c'est meilleur que Claude 3.5 ce truc ?

Parce que Claude 3.5 je peux lui filer 30 fichiers de code sans problème et il travaille de cette base