Accéder au contenu.
Menu Sympa

transcriptions - Transcription en direct

Objet : Transcription de fichiers son ou de videos de conférences (liste à inscription publique)

Archives de la liste

Transcription en direct


Chronologique Discussions 
  • From: Pierre P <ppavlides AT april.org>
  • To: transcriptions AT april.org
  • Subject: Transcription en direct
  • Date: Fri, 4 Feb 2011 18:07:14 +0100

Bonjour à tous,

J'ai à peu près fini ma transcription de la conférence de Benjamin
Bayart à l'Ubuntu-Party de Paris en novembre 2010, mais là n'est pas le
propos.

J'ai remarqué que j'ai un ration de 4,5 pour 1, à savoir qu'il me faut
4,5 fois plus de temps que le temps de la vidéo pour la retranscrire
(le ratio est vrai sur des périodes de temps courtes aussi). Par
exemple, il me faut 9 minutes pour transcrire un extrait de 2 minutes.
Je ne parle pas du temps pour la relecture, juste du temps pour une
transcription correcte.

Tout d'abord, quel est votre ratio à vous ?


En partant de ce ratio, j'ai imaginé une méthode pour arriver à
produire une transcription de qualité à peu près 10/15 minutes après la
fin de l'évènement, et ce à 6 personnes.

Je ne sais pas du tout si c'est une bonne idée, si c'est envisageable,
si c'est intéressant d'avoir une transcription si vite, mais je
détaille quand même. On avait parlé lors de la réunion IRC du 28
janvier.


Il faut donc 6 personnes, chaque personne avec son ordinateur (et ses
écouteurs) et une connexion réseau (pas forcément Internet, juste un
moyen que les ordinateurs échangent entre eux).

Le top serait d'avoir l'équipe de transcription dans une salle séparée
de la salle où il y a l'évènement à transcrire, au calme.

Il faut un micro dans la salle où il y a l'évènement, qui capte ce
qu'il faut retranscrire.

Ensuite, un ordinateur traite à la volée le signal audio, et produit
des fichiers audio :
* un fichier toutes les minutes, de durée une minute ;
* un fichier global.

Sur les six personnes, il y a un(e) coordinateur(trice), les autres
faisant le travail suivant :
* prendre un fichier audio de une minute que personne n'a pris (donc
chacun prend à tour de rôle un fichier de une minute)
* transcrire ce fichier dans son coin, sur son ordi
* donner le fichier transcris au(à la) coordinateur(trice)
* attendre (si en avance) que son tour vienne pour prendre un nouveau
fichier audio d'une minute, et recommencer

Pendant ce temps, le (la) coordinateur(trice) :
* récupère les fichiers transcrits au fur et à mesure qu'ils arrivent
(normalement, au bout d'un certain temps, un toutes les minutes)
* les met les uns à la suite des autres
* écoute le fichier audio global pour faire le lien dans les parties
manquantes (si la coupure s'est faite au milieu d'un mot…)
* gère la présentation globale (titres…)

On a donc un départ différé des transcripteurs :
* la première minute, personne ne fait rien
* puis chaque minute, un transcripteur commence à transcrire

Et on a à la fin de l'évènement, des transcripteurs qui ont fini leur
travail de transcription les un après les autres, le(la)
coordinateur(trice) terminant son travail après les autres.

Quelques remarques :
* il manque à tout ça le travail de relecture, et le travail de la
personne qui se charge de la coordination est peut-être un peu
surchargé
* une septième personne pourrait se charger de remédier à ces deux
points, en relisant au fur et à mesure la transcription faite par la
personne chargée de la coordination
* il me semble important que chaque transcripteur ait son propre espace
où il transcrit, et non pas un etherpad commun par exemple (plus
efficace, pas de sources d'interruption)
* par contre, la personne chargée de la coordination et celle qui relit
peuvent avoir un espace commun style etherpad
* Avoir 6 ou 7 personnes sur place, c'est quand même beaucoup ! Par
contre, si une connexion Internet est disponible, il est
envisageable que des transcripteurs ne soient pas sur place, mais
participent à distance. Reste qu'il faut avoir 6/7 personnes
disponibles en même temps.
* le nombre de 5 transcripteurs est basé sur mon ration de 4,5…
* le système est tout à fait opérationnel à moins de 5 transcripteurs,
simplement la transcription a besoin de plus de temps pour se
terminer (et est donc disponible moins vite après la fin de
l'évènement), on revient à la question de la pertinence d'avoir une
transcription publiée très vite après l'évènement
* ce système devrait être efficace sur des évènements assez longs plus
que sur des évènements courts, mais je pense que c'est souvent le
cas (on peut considérer qu'une succession d'évènements courts qui
s'enchaînent est un évènement long)
* l'organisation matérielle n'est pas hyper légère (6/7 ordinateurs en
réseau, une salle séparée, un micro relié à un des ordinateurs), et
la configuration logicielle qui enregistre coupe à la volée la
piste audio est à faire
* les transcripteurs seront frustrés ne ne pas pouvoir suivre ce qui
s'est passé à l'évènement, puisqu'ils n'auront eu accès qu'à une
minute toute les cinq minutes (bien qu'ils aient transcrit sans
s'interrompre).


Bon, j'espère que c'est à peu près compréhensible…


Bien sûr, tout commentaire est bienvenu, et souhaité !



Bonne soirée,
Pierre





Archives gérées par MHonArc 2.6.16.

Haut de le page