Accéder au contenu.
Menu Sympa

accessibilite - [Accessibilite] produire des audiobook

Objet : Liste de diffusion du groupe de travail Accessibilité (liste à inscription publique)

Archives de la liste

[Accessibilite] produire des audiobook


Chronologique Discussions 
  • From: Stéphane Poinsart <stephane.poinsart AT utc.fr>
  • To: accessibilite AT april.org
  • Subject: [Accessibilite] produire des audiobook
  • Date: Fri, 04 Jan 2013 18:40:28 +0100

Bonjour,

Toujours dans l'objectif de faire progresser nos logiciels libres de productions de documents, je m'intéresse aux formats d'audiobook. Il y a un an et demi, ma veille avait ciblé le format Daisy.

J'ai cru comprendre que le secteur avait pas mal bougé depuis, le format commun de publication "daisy 2" et "daisy 3" serait remplacé par :
- un format d'édition "daisy 4", destiné à échanger un document modifiable entre auteurs ou éditeurs
- l'utilisation du format epub 3 (potentiellement avec l'extension "media overlays") pour livrer un format de consultation aux lecteurs

Du moins, c'est mon interprétation de l'annonce suivante, même si je n'ai pas trouvé beaucoup d'explications à ce sujet :
http://www.daisy.org/daisypedia/presentation-daisy-developments-update-october-2011

Par ce message, je m'intéresse tout d'abord à recueillir des témoignages : êtes vous, ou connaissez vous des utilisateurs d'audiobooks ? Si oui, quels formats ? avec quels outils (logiciels PC/tablettes ou matériels dédiés) ? Ces lecteurs disposent t'il un système de synthèse vocal intégré, ou reposent-il sur des fichiers audios inclus dans l'audio-book ?


Le but étant pour nous de choisir le (ou les) bon formats : qu'ils soient le plus durable possible mais en même temps s'ils sont encore peu utilisés, de pouvoir proposer des solutions techniques (libre de préférence), pour les consulter de manière accessible.

Une fois le format choisi, je cherche un lecteur de ce format, qui puisse nous servir de "lecteur de référence" pour tester ce que l'on va produire. Lors de ma veille à la recherche de programmes supportant l'epub 3 avec media overlay, j'ai pour l'instant trouvé "azardi", propriétaire mais multi-plateforme, avec un audiobook proposé en exemple. http://azardi.infogridpacific.com/
On trouve beaucoup de lecteur d'ebooks, mais ne supportant pas les media overlay ou se limitant aux anciennes versions des standards daisy ou epub. Je ne sais pas s'il en existe des libres et accessibles qui fonctionnent bien avec un media overlay ?

Ensuite, nous aurions à chercher le moyen technique pour le produire. La partie "contenu textuel" de l'audiobook ne devrait pas poser de problème, il reste donc à voir comment on peut générer les "media overlay", ces fichiers sons qui contiennent les phrases de l'audiobook. Il est irréaliste d'espérer que tous les utilisateurs de Scenari (beaucoup d'enseignant par exemple) s'enregistrent eux même et re-synchronisent leur enregistrement audio avec le texte, c'est pourquoi je regarde la synthése vocale comme l'option la plus simple du point de vu de l'auteur de document.

j'ai testé :
- festival : pas de voix FR ?
- espeak : voix très très très très robotique
- mbrola : voix très robotique (propriétaire)
- pico : voix pas horriblement robotique mais avec un petit peu de "résonance métallique" et lecture monotone tout de même (officiellement sous licence apache 2 mais apparemment les sources des binaires des voix ne sont pas distribuées)

Je sais bien que mon avis est très discutable, puisque j'ai testé arbitrairement sur des petits extraits, n'étant pas moi même utilisateur régulier.

Le mieux serait d'utiliser une couche d'abstraction pour pouvoir faire une implémentation générique et permettre à l'utilisateur de choisir lui même le synthétiseur à utiliser. Mais il me semble que :
- c'est pas multi-plateforme. Sous windows c'est SAPI, sous linux speech dispatcher.
- pour speech dispatcher, il semble plus destiné à être utilisé comme un "mixeur audio" en commun pour tous les programmes plutôt que comme une API "process-safe" si on peut dire (néologisme qui se prétend le pendant de thread-safe). Et il fait une sortie vers un canal audio et non vers un fichier. Mais je ne connaît pas trop donc je peux me tromper.

Si nous devons générer des fichiers audios par synthèse vocale, Pico semblerait donc une solution raisonnablement simple et acceptable pour une première version.

Stéphane

--
Université de Technologie de Compiègne
UI - Ingénierie des Contenus et Savoirs
Tel: 03.44.23.44.51



  • [Accessibilite] produire des audiobook, Stéphane Poinsart, 04/01/2013

Archives gérées par MHonArc 2.6.16.

Haut de le page