je suis expert en IA/Deep Learning/Modèle génratif et je réponds aux questions

OP
SD

SuceurDeBonbon

il y a 4 mois

titre + let's go je réponds aux questionnent

CH

chandipura

il y a 4 mois

"Bonbon" c'est un code ? Tu suces quoi en réalité ? https://image.noelshack.com/fichiers/2019/29/7/1563726766-fusion-jesus-jaune.png

OP
SD

SuceurDeBonbon

il y a 4 mois


"Bonbon" c'est un code ? Tu suces quoi en réalité ? https://image.noelshack.com/fichiers/2019/29/7/1563726766-fusion-jesus-jaune.png

c'est un pseudoent comme un autrent

M0

M0nsieurG

il y a 4 mois

Est ce que les bonbons en question puent la bite ?

OP
SD

SuceurDeBonbon

il y a 4 mois


Est ce que les bonbons en question puent la bite ?

non ce sont des bonbons 100% comestiblent + svp on ne dévie pas du sujet initial

D2

deuxdossiers22

il y a 4 mois

Quelles études as tu fait clé

OP
SD

SuceurDeBonbon

il y a 4 mois


Quelles études as tu fait clé

mva + phd

D2

deuxdossiers22

il y a 4 mois

mva + phd

Wow lourd, c'est quoi l'avenir des modèles antagonistes ?

GE

GoogleEsclave2

il y a 4 mois

Pas de question sauf que tu as un beau parcours GG
Mon entreprise recherche des profils comme le tien mais bon je me fait pas de soucis pour toi

OP
SD

SuceurDeBonbon

il y a 4 mois

Wow lourd

merci, maintenant il s'agirait de créer une discussion intéressante autour de cette thématique, je suis sur que des kheys curieux ici ont des questions ou des choses à partager

C0

Chrysaor010

il y a 4 mois

a ton avis, combien de temps avant la singularité ?
Penses tu que l'IA nous permettra d'établir un paradis sur terre, ou un enfer ?
Est il vrai qu'on ne sait que très peu de chose de comment les IA les plus perfectionnées arrivent a leur résultat, et que beaucoup de choses nous échappent dans leur fonctionnement ?

P1

Prourix19

il y a 4 mois

Claude payant ou chat gpt payant ? Et pourquoi ?

D2

deuxdossiers22

il y a 4 mois

Wow lourd, c'est quoi l'avenir des modèles antagonistes ?

+ Quelles applications tu verrais des nouvelles technos dans le service public qui n'ont pas été exploitées ?

WA

waeko

il y a 4 mois

comment c'est passe ton phd ? j'hesite a en faire un en reinforcement learning

OP
SD

SuceurDeBonbon

il y a 4 mois

Wow lourd, c'est quoi l'avenir des modèles antagonistes ?

les GAN ont un bel avenir, il ne faut pas les opposer bêtement aux modèles génératifs plus récents genre diffusion/flow matching.
le "mode collapse" est autant une force qu'une faiblesse

OP
SD

SuceurDeBonbon

il y a 4 mois

+ Quelles applications tu verrais des nouvelles technos dans le service public qui n'ont pas été exploitées ?

j'ai pas de réponse particulièrement originale sur ce point
ils contribueront à automatiser des taches fastidieuses d'administration à mon avis, pas toutes mais une bonne partie d'entre elles

OP
SD

SuceurDeBonbon

il y a 4 mois


comment c'est passe ton phd ? j'hesite a en faire un en reinforcement learning

éprouvant mentalement mais riche d'apprentissage. je pense qu'il faut y aller à fond et ne pas passer à côté de ces 3/4 années intenses, surtout dans un domaine aussi mouvant que celui la

OP
SD

SuceurDeBonbon

il y a 4 mois


Claude payant ou chat gpt payant ? Et pourquoi ?

ni l'un ni l'autre, je pense que le gap (s'il en existe un) entre Llama et n'importe quel LLM commercial ne justifie pas de payer + les benchmarks ne veulent plus dire grand chose aujourd'hui, trop de eval hack

JB

JorgeBenENT

il y a 4 mois

Peut ont se lancer dans ce domaine sans connaissance poussée en informatique au préalable ? Sur quels métiers ça pourrait déboucher ? https://image.noelshack.com/fichiers/2024/20/3/1715773000-new-project-9.jpg

PD

PrixDeMarche

il y a 4 mois

Je bosse sur un projet perso où j'essaie quelques idées pour faire du SOTA sur le benchmark medQA. Des conseils ?

WA

waeko

il y a 4 mois

éprouvant mentalement mais riche d'apprentissage. je pense qu'il faut y aller à fond et ne pas passer à côté de ces 3/4 années intenses, surtout dans un domaine aussi mouvant que celui la

est ce qu'en france le phd t'ouvre plus de porte? ou c'est surtout pour l'étranger, j'aimerai faire de RetD en entreprise (mieux paye)

tu faisais cb d'heure par semaine?

OP
SD

SuceurDeBonbon

il y a 4 mois


Peut ont se lancer dans ce domaine sans connaissance poussée en informatique au préalable ? Sur quels métiers ça pourrait déboucher ? https://image.noelshack.com/fichiers/2024/20/3/1715773000-new-project-9.jpg

je dis pas que c'est impossible, mais à choisir entre un gros bagage info et un gros bagage matheux, je dirais que le bagage info est à ce jour de loin le plus pertinent
les plus grosses avancées à ce jour peuvent se résumer à accélérer les débits d'entrainement, car la seule certitude que l'on a c'est que "données+sur paramétrisation >>> tout le reste"

OP
SD

SuceurDeBonbon

il y a 4 mois

est ce qu'en france le phd t'ouvre plus de porte? ou c'est surtout pour l'étranger, j'aimerai faire de RetD en entreprise (mieux paye)

tu faisais cb d'heure par semaine?

dans ce domaine oui c'est un gros point fort
après ca reste un domaine relativement moderne où chacun peut se faire une place s'il apporte une preuve de sa crédibilité
je dirais qu'un github bien fourni >>> un phd avec des publis moyennes

+ je travaillais tous les jours globalement

PD

PrixDeMarche

il y a 4 mois

t'as manqué ma question en bas de page

OP
SD

SuceurDeBonbon

il y a 4 mois


t'as manqué ma question en bas de page

benchmark medQA du coup
je regarderai si c'est possible de faire du CoT avec des gros Llama, mais je dis ça au pif

G2

Gracq2

il y a 4 mois

Est-ce que tu as utilisé un peu de matériel issu du transport optimal dans ta thèse ?

Qu'est-ce que tu pense de l'application du ML POUR les maths (génération de Théorèmes, résolution approximée d'EDPs, surrogate models)

IB

InBigDespite5

il y a 4 mois

j'ai un fichier CSV de 8 Go avec une colonne question et une colonne réponse

comment je fais pour finetuner un modèle avec toutes ces dataent ?

XI

Xiosrah

il y a 4 mois

Que manque t-il à l'advanced voice mode de chatgpt pour être encore plus réactif ? juste une amélioration du hardware ?

OP
SD

SuceurDeBonbon

il y a 4 mois


Est-ce que tu as utilisé un peu de matériel issu du transport optimal dans ta thèse ?

y a un an y a eu du buzz autour du flow matching + OT mais je suis globalement inculte sur la question
je ne saurais pas dire à quel point le parallèle est pertinent, si c'est juste de la com

"génération de théorèmes" du genre assistant de preuves. franchement pourquoi pas, coupler un LLM, du CoT et Coq, ça peut être intéressant ponctuellement

par contre tout ce qui est modèle hybride, PINN, j'émets de sérieux doutes, je trouve ça bidon dans 95% des cas

PD

PrixDeMarche

il y a 4 mois

benchmark medQA du coup
je regarderai si c'est possible de faire du CoT avec des gros Llama, mais je dis ça au pif

Je parlais plus en concret. Pour l'instant je fais mes eval manuellement par exemple. Est-ce que t'as des libs ou autre à conseiller pour faciliter le process et éventuellement bouger ça sur un serv dédié (je peux le faire sur un droplet digitalocean mais je me demande si c'est ce qui se fait dans le monde pro vu que c'est un projet perso).

WA

waeko

il y a 4 mois

tu as deja publie dans un bonne conf? neurips, cvpr ...
ton temps est split comment entre : rédaction article, recherche d'idée, code, lecture d'article...

a qu'elle point faire un article c'est 'juste' combine des idées d'autre articles ? des articles vraiment innovant qui propose une nouvelle architecture (par exemple alpha zero en RL, gan, transformer ...) il y en pas beaucoup

SI

Silvomilie

il y a 4 mois

C'est quoi le meilleur modèle de UVR5 pour extraire une instru?

D2

deuxdossiers22

il y a 4 mois

Si t'avais une base d'adresses en textuel tu t'y prendrais comment pour géolocaliser ?

C0

Chrysaor010

il y a 4 mois


a ton avis, combien de temps avant la singularité ?
Penses tu que l'IA nous permettra d'établir un paradis sur terre, ou un enfer ?
Est il vrai qu'on ne sait que très peu de chose de comment les IA les plus perfectionnées arrivent a leur résultat, et que beaucoup de choses nous échappent dans leur fonctionnement ?

OP
SD

SuceurDeBonbon

il y a 4 mois


j'ai un fichier CSV de 8 Go avec une colonne question et une colonne réponse

comment je fais pour finetuner un modèle avec toutes ces dataent ?

tu fais un LoRA du dernier Llama pour commencer, par exemple en utilisant PEFT de Huggingface

OP
SD

SuceurDeBonbon

il y a 4 mois


C'est quoi le meilleur modèle de UVR5 pour extraire une instru?

MDXNet pour séparer juste les vocals, HTDemucs pour les 4 stems

A2

alphabravo2000

il y a 4 mois

Est-ce qu'il y a de la recherche (prometteuse) qui cherche comment améliorer les perfs des modèles génératifs sans juste augmenter le nb de paramètres ou est-ce que c'est juste une course à qui à la meilleure puissance de calcul ?

OP
SD

SuceurDeBonbon

il y a 4 mois


tu as deja publie dans un bonne conf? neurips, cvpr ...
ton temps est split comment entre : rédaction article, recherche d'idée, code, lecture d'article...

oui mais pas en premier auteur
le temps est archi variable, mais les évaluations sont de loin la partie la plus difficile (quand on est quelqu'un de consciencieux)

faire de la recherche ça veut pas dire révolutionner à chaque publication

TR

TRIPLEGOX3

il y a 4 mois

Comment tu t'informes ? Est-ce qu'il y a certaines sources qui permettent de bien se tenir au courant de ce qui se fait au quotidien ?

PD

PrixDeMarche

il y a 4 mois

Je parlais plus en concret. Pour l'instant je fais mes eval manuellement par exemple. Est-ce que t'as des libs ou autre à conseiller pour faciliter le process et éventuellement bouger ça sur un serv dédié (je peux le faire sur un droplet digitalocean mais je me demande si c'est ce qui se fait dans le monde pro vu que c'est un projet perso).

OP
SD

SuceurDeBonbon

il y a 4 mois


Comment tu t'informes ? Est-ce qu'il y a certaines sources qui permettent de bien se tenir au courant de ce qui se fait au quotidien ?

twitter + reddit + discord + suivre les gens que je trouve pertinents

C0

Chrysaor010

il y a 4 mois

putain l'op qui ignore délibéremment mes questions.
C'est pas cool.

OP
SD

SuceurDeBonbon

il y a 4 mois


a ton avis, combien de temps avant la singularité ?

honnêtement ce genre de questions ne m'intéresse pas car mal définie + sujet à pleins de fantasmses

ni l'un ni l'autre

C'est globalement vrai. On comprend mal le régime de surparamétrisation qui est le régime où les modèles génératifs brillent

WA

waeko

il y a 4 mois

t'as une liste des chercheurs a suivre ?

pourquoi tu as fais un phd? par passion ?

OP
SD

SuceurDeBonbon

il y a 4 mois


t'as une liste des chercheurs a suivre ?

plus ou moins oui

oui j'aime creuser les questions

P1

Pingouin116

il y a 4 mois

Que-ce que tu penses du concept de superintelligence, plus particulièrement de l'idée qu'une ia pourra comprendre/créer des idées impossibles à comprendre pour un humain ?

P1

Pingouin116

il y a 4 mois

Quels sont tes chercheurs/personnes préférés dans le domaine ?

OP
SD

SuceurDeBonbon

il y a 4 mois


Que-ce que tu penses du concept de superintelligence, plus particulièrement de l'idée qu'une ia pourra comprendre/créer des idées impossibles à comprendre pour un humain ?

à première vue pas grand chose
j'aime les idées concrètes et bien définies

[D

[DUCKTALES]

il y a 4 mois

Moi aussi j'ai Topaz Gigapixel sur mon PC https://image.noelshack.com/fichiers/2016/52/1482821067-salutrisitas.jpg

Je lui dis de générer un truc dans une image ou à part et il le fait https://image.noelshack.com/fichiers/2016/52/1482821067-salutrisitas.jpg

C'est magique https://image.noelshack.com/fichiers/2016/52/1482821067-salutrisitas.jpg

OP
SD

SuceurDeBonbon

il y a 4 mois


Quels sont tes chercheurs/personnes préférés dans le domaine ?

j'aime les mecs "no bullshit" genre Tri Dao