Accéder au contenu.
Menu Sympa

transcriptions - [Transcriptions] qui veut faire de la transcription audio avec Vosk?

Objet : Transcription de fichiers son ou de videos de conférences (liste à inscription publique)

Archives de la liste

[Transcriptions] qui veut faire de la transcription audio avec Vosk?


Chronologique Discussions 
  • From: Baptiste Lemoine - Cipher Bliss <contact AT cipherbliss.com>
  • To: "transcriptions AT april.org" <transcriptions AT april.org>
  • Subject: [Transcriptions] qui veut faire de la transcription audio avec Vosk?
  • Date: Tue, 09 Mar 2021 11:23:01 +0000
  • Authentication-results: vip.april.org; dkim=pass (1024-bit key; secure) header.d=cipherbliss.com header.i= AT cipherbliss.com header.b="UtbuViGm"; dkim-atps=neutral

l’April a récemment publié Libre à lire point org qui regroupe tous les textes de l’émission, je me disais qu’il devait bien exister des outils libres pour faire de l’aide à la transcription, depuis bien avant que Mozilla sorte CommonVoice. En effet il en existe des tas, c’est juste qu’ils sont pas bien faciles à faire fonctionner.

Donc j’en ai essayé quelques uns en faisant pousser ma barbe, jusqu’à trouver un qui soit en mesure de faire fonctionner sa démo selon sa propre documentation.
J’ai pioché un exemple avec une lib en python nommée Vosk et soudain, miracle, ça fonctionnait! et il y avait des modèles de données audio en Français disponibles. J’ai donc tenté le coup sur un fichier audio de quelques secondes où les gens parlaient très clairement et le résultat était vraiment pas mal, pour très peu de code à faire.

J’ai donc entrepris de publier un dépôt git que tout le monde pourrait installer un peu plus facilement que ce que j’ai eu à faire. il suffit de suivre le guide du Readme, qui s’affiche sur l’accueil du projet:
https://forge.chapril.org/tykayn/transcription

Le but du jeu étant de faire ceci:
  • mettre les fichiers audio et vidéos dans un dossier en vue de les transcrire.
  • lancer un script.
  • et hop, c’est bon

on obtient un fichier texte de la transcription pour chacun des fichiers sons ou vidéos demandés, dans des formats texte simple, texte précédé par une info minute et seconde, et vrai fichier sous titre .srt à ajouter dans une vidéo.

Je l’ai testé sur ma vidéo de démonstration des ebook et mis en ligne le résultat du sous titrage automatique, l’idée générale est pas trop mal rendue dans les transcriptions, mais beaucoup de mots que j’ai utilisé dans cette vidéo sont pas évident à comprendre pour le bouzin. Rien que MarkDown ou Chapril ça donne des remplacement marrants

Le script ne distingue pas encore les différentes personnes qui parlent mais quelqu’un sur mastodon bosse sur le sujet et on se cause tous les jours.

Breffe, ça pourrait vous être utile ce petit outil de transcription.
Bon essais!


Baptiste LEMOINE - Dirigeant de Cipher Bliss.com ,
-------
image
Tel 0185461173 / Signal 0627130837 , Telegram: Tykayn , Mastodon: @tykayn, Riot: @tykaynchu:matrix.org N° SIRET: 79942416300035 GPG: 64A8 9B18 65E6 6523 FD86 7CB5 8796 1FCA F978 54FF clé Duniter / Ğ1: 8c4mVVPAHd4yLYcxWM4U8Z3zUb4WpRX1iGtX5T7tbEFE - tykayn



Sent with ProtonMail Secure Email.

Attachment: signature.asc
Description: OpenPGP digital signature




Archives gérées par MHonArc 2.6.19+.

Haut de le page