Accéder au contenu.
Menu Sympa

transcriptions - [Transcriptions] Conversion automatique audio → texte

Objet : Transcription de fichiers son ou de videos de conférences (liste à inscription publique)

Archives de la liste

[Transcriptions] Conversion automatique audio → texte


Chronologique Discussions 
  • From: jbrouquier AT april.org
  • To: transcriptions AT april.org
  • Subject: [Transcriptions] Conversion automatique audio → texte
  • Date: Thu, 02 Feb 2017 14:22:49 +0100

Bonjour,
Adhérent April depuis quelques années, ma contribution (au vu du temps
disponible) est essentiellement de renouveler ma cotisation pour donner un peu
de poids et de moyens à l'association...

Ce qui me fait sortir du silence aujourd'hui est que Google propose depuis peu
de transformer des fichiers audio en texte : https://cloud.google.com/speech/

Google contribue à certains projets open source, mais ici ce n'est pas le
cas : c'est une API, qui plus est payante : 1h gratuite par mois et par
compte, puis 1,44$ par heure transcrite. 300$ de crédit (valable 2 mois) à
l'ouverture du compte.
Est-ce que la méthode reste intéressante ? Une rapide recherche dans les
archives de cette liste ne m'a pas fait remonter de trace de telle méthode.

C'est probablement le même code qui est utilisé pour leur API et pour les
sous-titres automatiques sur Youtube. Ce qui permet de se faire une idée de
combien ça marche.
Conclusion : parfois c'est parfait, parfois il part dans le décor sur quelques
mots d'affilée. C'est sans doute une aide pour travailler plus vite, mais il
faut absolument repasser derrière en écoutant le son.
Exemple sur https://youtu.be/xlaMczB6ESM?t=90 pendant 30 secondes :

«
mais aussi une clé d'innovation

depuis combien de temps

en fait on utilise maintenant
les logiciels open source depuis
une bonne dizaine d'années
et nous avons pour son amant
acquis une maturité maintenant
je dirais que la la plus grande
majorité de nos ordinateurs de
nos serveurs tourne aujourd'hui
% au-dessous des logiciels
systèmes open source
on comprend cet intérêt le
meilleur piste que 26 mars
l'itraxx cox et de tous ces
phénomènes comme on voulait
personnes viennent au sein de la
banque de france cdc phénomène
qui font bouger videmment pour
les lignes de votre secteur
d'activité
»

Notez que j'ai choisi la video mentionnée dans un message d'il y a un mois et
demi : https://listes.april.org/wws//arc/transcriptions/2016-12/msg00019.html
Ce mail est donc aussi une réponse à la question « A noter que la video est
déjà sous-titrée automatiquement, mais qu'il n'est peut-être pas possible d'en
récupérer le texte ?»
C'est possible, avec des outils libres :

youtube-dl --write-auto-sub --sub-lang fr
"https://www.youtube.com/watch?v=xlaMczB6ESM";

cat *.fr.vtt | sed -e '/^[0-9]/ d' -re 's/<[^>]+>//g' -e '/^ *$/ d'
| uniq

Jean-Baptiste



PS: quelques commentaires (vous pouvez en demander plus) sur les deux rapides
lignes de code (la seconde ligne n'est d'ailleurs pas forcément souhaitée) :

youtube-dl : télécharger la video avec sous-titres
cat *.fr.vtt : lire le fichier de sous-titre
sed -e '/^[0-9]/ d' : supprimer les marqueurs de temps
-re 's/<[^>]+>//g' : supprimer les marqueurs de temps et de couleur à
l'intérieur d'une ligne
-e '/^ *$/ d' : supprimer les lignes vides
uniq : supprimer les lignes en double



  • [Transcriptions] Conversion automatique audio → texte, jbrouquier, 02/02/2017

Archives gérées par MHonArc 2.6.19+.

Haut de le page