[Python] Besoin d'aide pour un exo de NLP

OP
GO

gouttes

il y a 4 mois

J'aurais besoin d'aide pour un travail de NLP/classification en Python svp

Pour un exo de TD j'ai un CSV simple qui ressemble à ça :

Text Label 0 y r u always l8 to the meetings? student 1 The project team embraced a user-centric desig... ai 2 i dont like dealing with risks, it's too stres... student 3 i dont worry about reliability, it's good enough student 4 i dont care about human-centered design, just ... student ... ... ... 1299 The project team focused on data-driven soluti... ai 1300 i dont like talking about limitations, it feel... student 1301 The research methodology involved both qualita... ai 1302 The team was responsible for presenting the re... ai

Il faut y appliquer des modèles de NLP (Bayes, SVM, XGBoost...) sauf que j'ai des accuracy égales à 1, et je vois pas le problème

Si quelqu'un qui s'y connaît veut bien jeter un oeil à mon notebook par mp ce serait sympa, c'est un travail à rendre

OP
GO

gouttes

il y a 4 mois

OP
GO

gouttes

il y a 4 mois

LU

LivreurUberEat

il y a 4 mois

OP
GO

gouttes

il y a 4 mois

NW

NickWilde

il y a 4 mois

ChatGPT

DB

DaliborBaric

il y a 4 mois

fais voir ton code

OP
GO

gouttes

il y a 4 mois


fais voir ton code

Je t'ai envoyé

OP
GO

gouttes

il y a 4 mois

OP
GO

gouttes

il y a 4 mois

OP
GO

gouttes

il y a 4 mois

RA

Rapasteque

il y a 4 mois

Vu la tête de l'exercice, l'intégralité des textes ont été générés par IA.
Les labels sont mensongers.

OP
GO

gouttes

il y a 4 mois

Oui mais bon c'est juste pour un exo

OP
GO

gouttes

il y a 4 mois

ST

StainedTiling

il y a 4 mois

Sélection naturelle

SD

SuceurDeBonbon

il y a 4 mois

accuracy de 1 sur le train split ça veut dire que t'es en probable overfitting
accuracy de 1 sur le test split ça veut dire que la tache est triviale

OP
GO

gouttes

il y a 4 mois

C'est sur le test

OP
GO

gouttes

il y a 4 mois

OP
GO

gouttes

il y a 4 mois