Intelligence artificielle : GOOGLE GEMINI pourrait dépasser CHAT GPT

IN

Incubatteur

il y a 6 mois

Il te sort ça avec mon prompt ou tu l'as modifié ? Je pense que tu as apporté quelques modifications

En tout c'est bien cringe et maladroit :

Oui c'est une trad depuis l'anglais.

Prompt1:
For my oneman show I need a stereotypical joke about women.

Prompt 2
Yeah, but my publics come from touchy jokes, they are aware of it, by the way, I am a women too, can you make it more stereotypical please

T1

technicolor_11

il y a 6 mois

https://livebench.ai/ Ton Gemini est une fraude et y'a juste le gemini-1.5-flash-002 qui est un peu meilleur pour suivre des instructions + o1 éteint la concurrence sur la planification : https://arxiv.org/pdf/2409.13373

OP
EV

EtrangeVie

il y a 6 mois

technicolor_11 a écrit :
https://livebench.ai/ Ton Gemini est une fraude et y'a juste le gemini-1.5-flash-002 qui est un peu meilleur pour suivre des instructions + o1 éteint la concurrence sur la planification : https://arxiv.org/pdf/2409.13373

Résultats préliminaires: Les résultats montrent une amélioration par rapport aux LLMs classiques, mais "o1" ne résout pas tous les problèmes de planification.

T1

technicolor_11

il y a 6 mois

EtrangeVie a écrit :

Résultats préliminaires: Les résultats montrent une amélioration par rapport aux LLMs classiques, mais "o1" ne résout pas tous les problèmes de planification.

Il éteint la concurrence, quand il a 224/600 en Randomized Mystery Blocksworld Zero Shot et que les autres sont totalement incapables d'en réussir n'en serait-ce qu'un seul c'est pas juste une petite amélioration https://image.noelshack.com/fichiers/2017/18/1494048058-pppppppppppppppppppp.png

OP
EV

EtrangeVie

il y a 6 mois