Accéder au contenu.
Menu Sympa

technique - Re: [TECH] transformer les caractères accentués via sed

Objet : Liste pour les discussions techniques (liste à inscription publique)

Archives de la liste

Re: [TECH] transformer les caractères accentués via sed


Chronologique Discussions 
  • From: Sébastien DINOT <sdinot AT april.org>
  • To: technique AT april.org
  • Subject: Re: [TECH] transformer les caractères accentués via sed
  • Date: Thu, 22 Nov 2007 18:05:42 +0100

Bonsoir Antoine,

Selon antoine AT starinux.org:
| Je souhaite transformer tous les caractères accentués tel à =
| &agrave; etc ... via la commande sed :
| sed -i 's/à/&agrave;/g' fichier.html

Mauvaise idée ! Utilise plutôt recode avec l'option "--diacritic" comme
je l'expliquais l'année dernière sur une liste de toulibre :

http://osdir.com/ml/org.user-groups.linux.toulouse/2006-11/msg00044.html

----------------------------------------------------------------------
[...]

Même texte vers HTML 4 avec préservation des caractères diacritiques
(supprimez « --diacritic » pour voir) :

echo -e "<p>Sébastien &\nses sœurs</p>" | recode --diacritic l9/..h4/

Idem vers XML (testez la commande pour observer les différences avec
la ligne précédente) :

echo -e "<p>Sébastien &\nses sœurs</p>" | recode --diacritic l9/..h0/
----------------------------------------------------------------------

Dans ton cas, la commande est probablement :
----------------------------------------------------------------------
recode --diacritic l9/..h4/ fichier.html
----------------------------------------------------------------------

ou, si tu utilises de l'UTF-8 :
----------------------------------------------------------------------
recode --diacritic u8/..h4/ fichier.html
----------------------------------------------------------------------

A++, Sébastien

--
Sébastien Dinot, sdinot AT april.org
Secrétaire de l'APRIL (http://www.april.org)
Association pour la Promotion et la Recherche en Informatique Libre




Archives gérées par MHonArc 2.6.16.

Haut de le page