Accéder au contenu.
Menu Sympa

accessibilite - OCR libre

Objet : Liste de diffusion du groupe de travail Accessibilité (liste à inscription publique)

Archives de la liste

OCR libre


Chronologique Discussions 
  • From: François Poulain <fpoulain AT metrodore.fr>
  • To: accessibilite <accessibilite AT april.org>
  • Subject: OCR libre
  • Date: Mon, 9 May 2011 08:07:38 +0200

Bonjour,

Pour information, je transfert ici un sujet qui est passé sur
april AT april.org au sujet des OCR. Ça peut intéresser quelques personnes
parmi vous.

Cordialement.
François

--
François Poulain <fpoulain AT metrodore.fr>

Chacun appelle barbarie ce qui n'est pas de son usage.
-+- Montaigne, Les Essais -+-
--- Begin Message ---
  • From: Pierre LEJEUNE <pierre.lejeune AT free.fr>
  • To: april AT april.org
  • Subject: [April] OCR libre et performant
  • Date: Thu, 05 May 2011 22:27:32 +0200
  • List-archive: <http://www.april.org/wws/arc/april>
  • List-id: <april.april.org>
Bonjour,

j'ai une collègue dont la mère est mal-voyante et qui cherche une solution d'OCR performante afin que celle-ci puisse scanner n'importe quel texte pour se le faire lire par son ordinateur.
Quelqu'un connait-il un logiciel d'OCR libre et performant?

Merci

Pierre

--
Gérer votre abonnement à la liste april et vos informations personnelles :
http://www.april.org/my

Pour toute question sur cette liste: http://wiki.april.org/ListeAssociation

--- End Message ---
--- Begin Message ---
  • From: "François Boulogne" <boulogne.f AT gmail.com>
  • To: Pierre LEJEUNE <pierre.lejeune AT free.fr>, april AT april.org
  • Subject: Re: [April] OCR libre et performant
  • Date: Fri, 06 May 2011 07:40:24 +0200
  • Domainkey-signature: a=rsa-sha1; c=nofws; d=gmail.com; s=gamma; h=message-id:date:from:reply-to:user-agent:mime-version:to:subject :references:in-reply-to:x-enigmail-version:content-type :content-transfer-encoding; b=ZrGsE5TrGxhD5bWHtVvdi4KBK3XEij4EOLd02LurYGtuePKldlCuyvTeLhbpWEhSRN VdQbHc04oFF3istj+pxX9mXOB2w8jWLy6mkgRYMUG6fQz36laD3w+spFotMRBmll7JR4 ZeJQngrjzpk29q9j3i6PPd9zLjeeHbKYn+rCw=
  • List-archive: <http://www.april.org/wws/arc/april>
  • List-id: <april.april.org>
Bonjour,
> Quelqu'un connait-il un logiciel d'OCR libre et performant?
>

Il existe une page à ce sujet sur notre wiki :
http://wiki.april.org/w/OCR

Tout en bas, il y a ce lien que j'ai mis :
http://www.k1ka.be/desidia/?2009-11-20_Comment_je_pratique_l'OCR_sous_Linux

PS : je pense que tu pourrais aussi te rapprocher du groupe de travail
accessibilité ;)

A bientôt,
--
François Boulogne.
Membre de l'April - Promouvoir et défendre le Logiciel Libre -
http://www.april.org

Un jour, ils sauront qu'il existe un univers libre.
http://sciunto.wordpress.com/

--
Gérer votre abonnement à la liste april et vos informations personnelles :
http://www.april.org/my

Pour toute question sur cette liste: http://wiki.april.org/ListeAssociation

--- End Message ---
--- Begin Message ---
  • From: Sébastien Dinot <sdinot AT april.org>
  • To: Membres April <april AT april.org>
  • Subject: Re: [April] OCR libre et performant
  • Date: Thu, 5 May 2011 23:00:01 +0200
  • List-archive: <http://www.april.org/wws/arc/april>
  • List-id: <april.april.org>
Pierre LEJEUNE a écrit :
> j'ai une collègue dont la mère est mal-voyante et qui cherche une
> solution d'OCR performante afin que celle-ci puisse scanner n'importe
> quel texte pour se le faire lire par son ordinateur. Quelqu'un
> connait-il un logiciel d'OCR libre et performant?

Tesseract OCR (diffusé sous licence Apache 2.0) :

http://code.google.com/p/tesseract-ocr/

Je ne l'ai jamais essayé personnellement mais deux amis m'en ont dit le
plus grand bien, dont un récemment après avoir numérisé un texte en
français contenant moult lettres accentuées (les lettres accentuées
étant le point faible notoire des autres OCR).

Des paquets pour Debian et Ubuntu sont disponibles. Je n'ai pas regardé
si c'était aussi le cas pour les autres distributions majeures.

Sébastien

--
Sébastien Dinot, sdinot AT april.org
Vice-président de l'April (http://www.april.org)
April - Promouvoir et défendre le logiciel libre

--
Gérer votre abonnement à la liste april et vos informations personnelles :
http://www.april.org/my

Pour toute question sur cette liste: http://wiki.april.org/ListeAssociation

--- End Message ---
--- Begin Message ---
  • From: Sébastien Dinot <sdinot AT april.org>
  • To: Membres April <april AT april.org>
  • Subject: Re: [April] OCR libre et performant
  • Date: Thu, 5 May 2011 23:08:22 +0200
  • List-archive: <http://www.april.org/wws/arc/april>
  • List-id: <april.april.org>
Sébastien Dinot a écrit :
> Tesseract OCR (diffusé sous licence Apache 2.0) :
>
> http://code.google.com/p/tesseract-ocr/
>
> Je ne l'ai jamais essayé personnellement mais deux amis m'en ont dit le
> plus grand bien, dont un récemment après avoir numérisé un texte en
> français contenant moult lettres accentuées (les lettres accentuées
> étant le point faible notoire des autres OCR).

Un petit comparatif datant de 11 mois :

http://www.splitbrain.org/blog/2010-06/15-linux_ocr_software_comparison

Ce n'est pas le nirvana mais Tesseract-OCR semble bien être le meilleur
des outils libres disponibles à l'heure actuelle.

Notons qu'entre temps, Tesseract-OCR est passé de la version 2.04 à la
version 3.01 et qu'un travail assez important semble avoir été réalisé :

http://code.google.com/p/tesseract-ocr/source/browse/trunk/ReleaseNotes

Sébastien

--
Sébastien Dinot, sdinot AT april.org
Vice-président de l'April (http://www.april.org)
April - Promouvoir et défendre le logiciel libre

--
Gérer votre abonnement à la liste april et vos informations personnelles :
http://www.april.org/my

Pour toute question sur cette liste: http://wiki.april.org/ListeAssociation

--- End Message ---



Archives gérées par MHonArc 2.6.16.

Haut de le page