Objet : Transcription de fichiers son ou de videos de conférences (liste à inscription publique)
Archives de la liste
- From: Baptiste Lemoine - Cipher Bliss <contact AT cipherbliss.com>
- To: "transcriptions AT april.org" <transcriptions AT april.org>
- Subject: [Transcriptions] qui veut faire de la transcription audio avec Vosk?
- Date: Tue, 09 Mar 2021 11:23:01 +0000
- Authentication-results: vip.april.org; dkim=pass (1024-bit key; secure) header.d=cipherbliss.com header.i= AT cipherbliss.com header.b="UtbuViGm"; dkim-atps=neutral
l’April a récemment publié Libre à lire point org qui regroupe tous les textes de l’émission, je me disais qu’il devait
bien exister des outils libres pour faire de l’aide à la transcription,
depuis bien avant que Mozilla sorte CommonVoice. En effet il en existe
des tas, c’est juste qu’ils sont pas bien faciles à faire fonctionner.
Donc
j’en ai essayé quelques uns en faisant pousser ma barbe, jusqu’à
trouver un qui soit en mesure de faire fonctionner sa démo selon sa
propre documentation.
J’ai pioché un exemple avec une lib en
python nommée Vosk et soudain, miracle, ça fonctionnait! et il y avait
des modèles de données audio en Français disponibles. J’ai donc tenté le
coup sur un fichier audio de quelques secondes où les gens parlaient
très clairement et le résultat était vraiment pas mal, pour très peu de
code à faire.
J’ai donc entrepris de publier un
dépôt git que tout le monde pourrait installer un peu plus facilement
que ce que j’ai eu à faire. il suffit de suivre le guide du Readme, qui
s’affiche sur l’accueil du projet:
Le but du jeu étant de faire ceci:
- mettre les fichiers audio et vidéos dans un dossier en vue de les transcrire.
- lancer un script.
- et hop, c’est bon
on
obtient un fichier texte de la transcription pour chacun des fichiers
sons ou vidéos demandés, dans des formats texte simple, texte précédé
par une info minute et seconde, et vrai fichier sous titre .srt à ajouter dans une vidéo.
Je l’ai testé sur ma vidéo de démonstration des ebook et mis en ligne le résultat du sous titrage automatique,
l’idée générale est pas trop mal rendue dans les transcriptions, mais
beaucoup de mots que j’ai utilisé dans cette vidéo sont pas évident à
comprendre pour le bouzin. Rien que MarkDown ou Chapril ça donne des remplacement marrants
Le
script ne distingue pas encore les différentes personnes qui parlent
mais quelqu’un sur mastodon bosse sur le sujet et on se cause tous les
jours.
Breffe, ça pourrait vous être utile ce petit outil de transcription.
Bon essais!
Baptiste LEMOINE - Dirigeant de Cipher Bliss.com ,
-------
Tel 0185461173 / Signal 0627130837 , Telegram: Tykayn , Mastodon: @tykayn, Riot: @tykaynchu:matrix.org N° SIRET: 79942416300035 GPG: 64A8 9B18 65E6 6523 FD86 7CB5 8796 1FCA F978 54FF clé Duniter / Ğ1: 8c4mVVPAHd4yLYcxWM4U8Z3zUb4WpRX1iGtX5T7tbEFE - tykayn
Sent with ProtonMail Secure Email.
Attachment:
signature.asc
Description: OpenPGP digital signature
- [Transcriptions] qui veut faire de la transcription audio avec Vosk?, Baptiste Lemoine - Cipher Bliss, 09/03/2021
- Re: [Transcriptions] qui veut faire de la transcription audio avec Vosk?, Syméon, 09/03/2021
Archives gérées par MHonArc 2.6.19+.