[ALERTE] MACRON dans la vidéo de MICODE sur l'IA
10 messages
Mise à jour: il y a 2 mois
GOMEDOV_55
il y a 2 mois
GOMEDOV_55
il y a 2 mois
CiscoBannis2
il y a 2 mois
GOMEDOV_55
il y a 2 mois
Tu es beaucoup trop sévère avec Mistral AI.
j'ai testé le modèle, il est à chier.
je fais des travaux de traduction vers des langues où il existe peu de ressources, et je peux te garantir que ChatGPT et Deepseek s'en sortent très bien, Qwen est plutôt moyen++ mais Le Chat est à chier, c'est full erreur.
RoseFantastique
il y a 2 mois
Mistral dans le top 20 quand même, il rivalise avec Dracarys2-Llama-3.1-70B-Instruct qui est un projet sans aucun budget, géré par deux personnes
https://huggingface.co/abacusai/Dracarys2-Llama-3.1-70B-Instruct le repo est sur huggingface pour tout dire
Derrière Claude 3 Opus, sorti y a un an
RoseFantastique
il y a 2 mois
GOMEDOV_55
il y a 2 mois
Mistral dans le top 20 quand même, il rivalise avec Dracarys2-Llama-3.1-70B-Instruct qui est un projet sans aucun budget, géré par deux personnes
https://huggingface.co/abacusai/Dracarys2-Llama-3.1-70B-Instruct le repo est sur huggingface pour tout direDerrière Claude 3 Opus, sorti y a un an
LiveBench est un bon outil pour comparer les IA, mais il a ses limites. La sélection des questions peut favoriser certains modèles, et l'absence d'évaluation subjective empêche de juger la qualité réelle des réponses. Son système de notation rigide ne prend pas toujours en compte les nuances, et même avec un renouvellement des questions, il y a un risque de contamination des données. De plus, il mesure des performances sur des tâches précises, mais pas forcément l'intelligence globale ou l'utilité en situation réelle. En gros, c'est un indicateur intéressant, mais pas une vérité absolue.
Et top 20, c'est pas ouf
GOMEDOV_55
il y a 2 mois