HELP : La meilleure IA pour traduire de l'AUDIO ?

OP
K1

Komodo174

il y a 7 mois

J'ai un fichier mp3 de 4h30 à traduire de l'anglais ---> français https://image.noelshack.com/fichiers/2017/18/1494048058-pppppppppppppppppppp.png

vous connaissez de bon outils , gratuit ou payant , pour obtenir une traduction de qualité? https://image.noelshack.com/fichiers/2017/18/1494048058-pppppppppppppppppppp.png

OP
K1

Komodo174

il y a 7 mois

https://image.noelshack.com/fichiers/2016/47/1480081450-ris42.png

HE

Heljo

il y a 7 mois

C'est Komodo, l'aidez pas (un des plus gros racistes du forum)

46

4654654ddffd

il y a 7 mois

d'abbord tu fait la transcription audio texte avec Whisper ASR

puis ensuite tu fait une transcription texte avec Mistral-NeMo mais va falloir decouper le texte pour eviter les halucination (pas plus de 4000-8000token à la fois je dirais) et vu que c'est de la traduction pas grave si il perd le contexte

OP
K1

Komodo174

il y a 7 mois

Heljo

il y a 7 mois


C'est Komodo, l'aidez pas (un des plus gros racistes du forum)

diffamateur https://image.noelshack.com/fichiers/2016/47/1480081450-ris42.png

OP
K1

Komodo174

il y a 7 mois

4654654ddffd

il y a 7 mois


d'abbord tu fait la transcription audio texte avec Whisper ASR

puis ensuite tu fait une transcription texte avec Mistral-NeMo mais va falloir decouper le texte pour eviter les halucination (pas plus de 4000-8000token à la fois je dirais) et vu que c'est de la traduction pas grave si il perd le contexte

merci clef, c'est + complexe que ce que je pensais mais je vais essayer https://image.noelshack.com/fichiers/2016/47/1480081450-ris42.png

46

4654654ddffd

il y a 7 mois


C'est Komodo, l'aidez pas (un des plus gros racistes du forum)

hesite pas si t'as besoin de plus d'aide l'op

FZ

FeZzko_6

il y a 7 mois

Si t'es bricoleur, t'as peut-être un truc à faire avec whisper cpp + https://github.com/facebookresearch/seamless_communication
(Même idée que le khey au dessus, tu fais une transcription et ensuite tu traduis)

OP
K1

Komodo174

il y a 7 mois

FeZzko_6

il y a 7 mois


Si t'es bricoleur, t'as peut-être un truc à faire avec whisper cpp + https://github.com/facebookresearch/seamless_communication
(Même idée que le khey au dessus, tu fais une transcription et ensuite tu traduis)

https://image.noelshack.com/fichiers/2021/44/1/1635805996-noname.png

46

4654654ddffd

il y a 7 mois

merci clef, c'est + complexe que ce que je pensais mais je vais essayer https://image.noelshack.com/fichiers/2016/47/1480081450-ris42.png

whisper t'as des solutions en ligne si tu galère sinon en installant pinokio ai tu dois trouver un truc qui te fais l'install en automatisé https://image.noelshack.com/fichiers/2022/37/1/1663014384-ahi-pince-mais.png

pour le modèle texte installe le avec LM Studio https://image.noelshack.com/fichiers/2022/37/1/1663014384-ahi-pince-mais.png