Topic que pour les VRAIS DATA SCIENTISTS

OP
A3

alcorcon3321

il y a 9 mois

Up

SO

soleilverttt

il y a 9 mois

Y a un chapitre qui est grave sous coté je sais pas si c'est le cas aux states aussi je parle de la "recherche opérationnelle" c'est graaaaaave interessant surtout dans le monde de l'industrie

La RO est très présente aux Etats-Unis, en Israel, dans les pays musulmans ainsi qu'en Russie. En France, c'est vrai que c'est très peu connu.
Il y a le congrès de la ROADEF en France qui est vraiment centré sur la RO. C'est super intéressant.
La discipline ne touche pas que l'industrie.

R7

Reynoooor7

il y a 9 mois

Majheureusement surtout pour le deep learning tu es obligé de te reposer sur des modèles fondations preentraine. Même si tu essaies de faire des trucs sophistiqués ça ce fera dépasse par un modèle plus gros entraîne plus longtemps sur plus de données...
En tout cas en audio, image et texte (mon expertise) c'est le cas. Après tu peux être plus fin pour spécialiser le modèle selon ta tâche mais tu ne réinventes pas la roue...

En revanche si t'es chercheur tu peux pas te contenter de ça

R7

Reynoooor7

il y a 9 mois

Y a un chapitre qui est grave sous coté je sais pas si c'est le cas aux states aussi je parle de la "recherche opérationnelle" c'est graaaaaave interessant surtout dans le monde de l'industrie

La RO c'est appeler les modèles genre cplex de IBM pour qu'ils résolvent tes problèmes avec des heuristique de fou
C'est super intéressant mais aucune boîte n'a envie d'embaucher une ou plusieurs personne pour ça j'ai l'impression (en France), alors que les applications en logistique par exemple sont assez immediates

OP
A3

alcorcon3321

il y a 9 mois

La RO est très présente aux Etats-Unis, en Israel, dans les pays musulmans ainsi qu'en Russie. En France, c'est vrai que c'est très peu connu.
Il y a le congrès de la ROADEF en France qui est vraiment centré sur la RO. C'est super intéressant.
La discipline ne touche pas que l'industrie.

Je savais pas que c'est assez répandu dans des pays que t'as cité
Exactement khey mais on voit vraiment sa magie dans l'industrie…

TL

TheLelouch4

il y a 9 mois

Ça dépend des formations, la plupart des écoles aujourd'hui avec leurs formations IA MACHINE LEARNING DEEP LEARNING …tous ces titres de merde ne focus pas sur la théorie ils forment des pisseurs notebook

Après en ml il y a beaucoup de trucs non math fondamentales qui vont au final utiliser la majeur partie de ton temps : comment installer ton environnement avec parfois des librairies un peu pénible car tout évolue très vite, comment planifier et gérer tes expériences (notamment avec hydra et optuna), comment accélérer les calculs (compilation quantization précision mixte etc), savoir faire du multi gpu voire multi node... Voire même des mini intégrations comme donner ton projet sous forme de docker avec une api. Et aussi énormément de veille technologique finalement :quels sont les backbone/blocs les plus utilisés pour ton problème, quel est l'état de l'open source...

OP
A3

alcorcon3321

il y a 9 mois


Majheureusement surtout pour le deep learning tu es obligé de te reposer sur des modèles fondations preentraine. Même si tu essaies de faire des trucs sophistiqués ça ce fera dépasse par un modèle plus gros entraîne plus longtemps sur plus de données...
En tout cas en audio, image et texte (mon expertise) c'est le cas. Après tu peux être plus fin pour spécialiser le modèle selon ta tâche mais tu ne réinventes pas la roue...

En revanche si t'es chercheur tu peux pas te contenter de ça

This ça résume tout

W]

wowfan]

il y a 9 mois

Je suis pas dans cette branche, mais j'ai un pote qui a fait une école de commerce et dont le premier job était "Ingénieur en Data Science". C'est une hérésie ou ça passe pour vous ?

OP
A3

alcorcon3321

il y a 9 mois

Après en ml il y a beaucoup de trucs non math fondamentales qui vont au final utiliser la majeur partie de ton temps : comment installer ton environnement avec parfois des librairies un peu pénible car tout évolue très vite, comment planifier et gérer tes expériences (notamment avec hydra et optuna), comment accélérer les calculs (compilation quantization précision mixte etc), savoir faire du multi gpu voire multi node... Voire même des mini intégrations comme donner ton projet sous forme de docker avec une api. Et aussi énormément de veille technologique finalement :quels sont les backbone/blocs les plus utilisés pour ton problème, quel est l'état de l'open source...

Il y a déjà tellement de recherche active et de modèles fondations de gafam que c'est rarement toi qui va créer quelque chose de nouveau, mais plus t'utiliser ta connaissance de l'état de l'art pour utiliser les meilleurs outils à disposition en fonction du problème qu'on te donne

La vraie base dans ce domine est censé être pure maths fonda , t'es dev ?

OP
A3

alcorcon3321

il y a 9 mois


Je suis pas dans cette branche, mais j'ai un pote qui a fait une école de commerce et dont le premier job était "Ingénieur en Data Science". C'est une hérésie ou ça passe pour vous ?

C'est aberrant mais y a plus rien qui me choque dans ce domaine

OP
A3

alcorcon3321

il y a 9 mois

Up

OP
A3

alcorcon3321

il y a 9 mois

Up

TL

TheLelouch4

il y a 9 mois

La vraie base dans ce domine est censé être pure maths fonda , t'es dev ?

Il y a plein de trucs qui fonctionnent avec 0 théorie derrière surtout en deep learning c'est un peu une crise du domaine.
Et data Scientist qui fait que des maths fonda crayon papier ça existe pas hein... Si on te recrute ce sera pour faire de la résolution appliquée de problèmes.
Ou alors t'es mathématicien/enseignant chercheur et la tu peux faire de la théorie mais ça ne s'appelle pas data Scientist dans ce cas

B7

boobadu74

il y a 9 mois

Ouais enfin les maths en IA à part la descente de gradient fondamentalement y'a quoi ?

OP
A3

alcorcon3321

il y a 9 mois


Ouais enfin les maths en IA à part la descente de gradient fondamentalement y'a quoi ?

Les régressions ? calcul matriciels…?

OP
A3

alcorcon3321

il y a 9 mois

Il y a plein de trucs qui fonctionnent avec 0 théorie derrière surtout en deep learning c'est un peu une crise du domaine.
Et data Scientist qui fait que des maths fonda crayon papier ça existe pas hein... Si on te recrute ce sera pour faire de la résolution appliquée de problèmes.
Ou alors t'es mathématicien/enseignant chercheur et la tu peux faire de la théorie mais ça ne s'appelle pas data Scientist dans ce cas

À la base ce métier était censé combiner les deux

OP
A3

alcorcon3321

il y a 9 mois

Up

OP
A3

alcorcon3321

il y a 9 mois

Up

OP
A3

alcorcon3321

il y a 9 mois

Up

TL

TheLelouch4

il y a 9 mois

Les régressions ? calcul matriciels…?

M'ouai c'est pas vraiment ce que j'appelle des maths fondamentales ça tout le monde voit ça en L1...

TL

TheLelouch4

il y a 9 mois

À la base ce métier était censé combiner les deux

C'est déjà un métier très multidisciplinaire
De toute façon il y a très peu de métiers dans l'industrie ou tu fais full math, au final ça finit par être semi automatisé dans des logiciels ou librairies

R4

Rapi42

il y a 9 mois

Ben au final les maths derrière c'est pas très compliqué, tu fous de l'algèbre linéaire et des stats ensemble et voilà. https://image.noelshack.com/fichiers/2022/37/1/1663014384-ahi-pince-mais.png
Tu peux essayer mais ça m'étonnerait que tu sois l'auteur du prochain "Attention is all you need"
Ce qui est intéressant c'est justement apprendre à appliquer les modèles correctement.

MA

Mariennnnn

il y a 9 mois

La très grande majorité des entreprises n'ont pas besoin dexpert de haut niveau dans ce domaine.

Désolé pour vous.