Utilisateur:Cunegonde1/Script S longs
Présentation du script
[modifier]Pour modifier des mots dans un fichier, on peut utiliser le programme "sed". La syntaxe à utiliser dans un terminal est : sed 's/mot_initial/mot_changé/g; s/mot_initial2/mot_changé2/g;' mon_texte.txt > mon_texte_modifie.txt
. Explication : sed 's/
(s pour substitute)…/…/g (g pour global, qui change le mot dans tout le texte sélectionné).
Partant du code ci-dessus on peut intégrer le principe de ces expressions dans un petit programme Perl, qui enchaîne les commandes en utilisant un mini-dictionnaire d'environ 630 fragments de mots, mots complets, ou motifs (ceff eufe, defc, …). L’utilité des expressions régulières est de contrôler le changement sur un mot complet (fi, fa, fon…) et ne pas en opérer sur un motif comme dans famille, fontaine… On peut aussi mettre des "motifs" à condition de vérifier avant qu’ils ne produisent pas de faux positifs (ie ffeffe comme dans groſſeſſe car il n’existe qu'un faux positif utilisant ce motif : cheffesse) que l’on n'a peu de chance de rencontrer.
Pour utiliser le script il faut le copier dans un fichier texte et lui donner la permission d’exécution [chmod 755 mon_fichier)].
Si vous souhaitez modifier le script après avoir constaté qu’un mot est absent du dictionnaire, vérifiez qu’il ne corresponde pas à un motif dans la liste. Attention également à l’ordre dans lequel se trouve les mots ou les motifs, c’est important pour éviter de passer à côté de mots avec 2 s longs, par exemple si je teste d’abord le motif "laif" comme dans glaiſe, avant le motif "laiff" comme dans laiſſera j’obtiendrai "il laiſfera" au lieu de "il laiſſera".
Après avoir supprimé les césures de mots tronqués, le script teste dans l’ordre :
- 1. des mots complets ou des fragments de mots
- 2. des mots délimités.
- 3. des motifs.
- 4. des caractères de ponctuation.
- 5. des éléments de mise en page (ie espace avant virgule).
Script Perl pour Linux et MacOs (Windows ?)
[modifier]
Avant de commencer copier le fichier texte que vous souhaitez modifier et mettez le dans un dossier dédié en le nommant Texte.txt dans lequel vous aurez également copié le fichier du présent script que vous aurez rendu exécutable.
Le script exécute les commandes suivantes :
A -
1. ouvre le fichier Texte.txt en lecture
2. crée un fichier temporaire temp1.txt
3. exécute une expression régulière qui remplace les tirets de césure de fin de ligne par un motif : "AAAA"
4. écrit ces modification dans le fichier temp1.txt.
5. ferme les fichiers Texte.txt et temp1.txt
B -
1. ouvre le fichier temp1.txt en lecture
2. crée un fichier temporaire temp2.txt
1. exécute une expression régulière qui regroupe les mots césurés en supprimant le motif "AAAA" qui les sépare, puis crée un saut de ligne et un retour chariot à la fin du mot regroupé
2. supprime les espaces en fin de ligne
3. écrit ces modification dans le fichier temp2.txt
4. ferme les fichiers temp1.txt et temp2.txt
5. supprime le fichiers temp1.txt
C-I. mécanisme
1. ouvre le fichier temp2.txt en lecture
2. crée un fichier définitif Text-Modif.txt
1. exécute une série d'expressions qui remplace les mots avec un f fautif devant être remplacés par un ſ long
2. écrit ces modifications dans le fichier Text-Modif.txt
4. ferme les fichiers temp2.txt et Text-Modif.txt
5. supprime le fichiers temp2.txt
C-II. contenu de la regex :
1. Modification de mots ou fragments de mots.
2.Modification de mots strictement délimités (\bfe\b/ſe) pour matcher "se" et pas "fervent".
3. Des motifs (testés avec https://www.dcode.fr/mots-contenant).
4. Une rectification (partielle) de la ponctuation.
DEBUT DU SCRIPT CI-DESSOUS
#!/usr/bin/perl
use strict;
use warnings;
use Cwd;
my $dir = getcwd;
open (IN_Fic, '<', "/$dir/Texte.txt") or die "Erreur sur ouverture fichier Texte.txt \n";
open (OUT_Fic, '>', "/$dir/temp1.txt") or die "Erreur sur ouverture fichier temp1.txt \n";
while ( my $Lig = <IN_Fic> ){
$Lig =~ s/-\r\n$/AAAA/g;
print OUT_Fic $Lig;
}
close (IN_Fic);
close (OUT_Fic);
open (IN_Fic1, '<', "/$dir/temp1.txt") or die "Erreur sur ouverture fichier temp1.txt \n";
open (OUT_Fic1, '>', "/$dir/temp2.txt") or die "Erreur sur ouverture fichier temp2.txt \n";
while ( my $Lig = <IN_Fic1> ){
$Lig =~ s/([A-Za-zà-è]+)AAAA([A-Za-zà-è]+)(\W+)/$1$2$3\r\n/g;
$Lig =~ s/\s\r\n/\r\n/g;
$Lig =~ s/AAAA\s/¬\r\n/g;
print OUT_Fic1 $Lig;
}
close (IN_Fic1);
close (OUT_Fic1);
unlink "/$dir/temp1.txt";
open (IN_Fic2, '<', "/$dir/temp2.txt") or die "Erreur sur ouverture fichier temp2.txt \n";
open (OUT_Fic2, '>', "/$dir/Texte-Modif.txt") or die "Erreur sur ouverture fichier Texte-Modif.txt \n";
while ( my $Lig = <IN_Fic2> ){
#
#Mots ou fragments de mots
#
$Lig =~ s/abuf/abuſ/g;#abuse, abuser
$Lig =~ s/accuf/accuſ/g;#abuse, abuser
$Lig =~ s/adreff/adreſſ/g;
$Lig =~ s/adrefl/adreſſ/g;
$Lig =~ s/affaffin/aſſaſſin/g;
$Lig =~ s/affau/aſſau/g;
$Lig =~ s/affembl/aſſembl/g;
$Lig =~ s/affeoi/aſſeoi/g;
$Lig =~ s/affez/aſſez/g;
$Lig =~ s/affidu/aſſidu/g;
$Lig =~ s/affign/aſſign/g;
$Lig =~ s/affift/aſſiſt/g;
$Lig =~ s/affirent/aſſirent/g;
$Lig =~ s/affur/aſſur/g;
$Lig =~ s/aflez/aſſez/g;
$Lig =~ s/afloupi/aſſoupi/g;
$Lig =~ s/aflur/aſſur/g;
$Lig =~ s/afyle/aſyle/g;
$Lig =~ s/agaffe/agaſſe/g;#agasser, agasserie
$Lig =~ s/agiftrat/agiſtrat/g;
$Lig =~ s/aifance/aiſance/g;
$Lig =~ s/(A|a)infi/$1inſi/g;
$Lig =~ s/artifan/artiſan/g;
$Lig =~ s/artifte/artiſte/g;
$Lig =~ s/ainft/ainſi/g;
$Lig =~ s/Alais/Mais/g;
$Lig =~ s/appaif/appaiſ/g;
$Lig =~ s/(A|a)uffi/$1uſſi/g;
$Lig =~ s/aufii/auſſi/g;
$Lig =~ s/aufîi/auſſi/g;
$Lig =~ s/aufïi/auſſi/g;
$Lig =~ s/aufli/auſſi/g;
$Lig =~ s/auiïi/auſſi/g;
$Lig =~ s/aulfi/auſſi/g;
$Lig =~ s/avifé/aviſé/g;
$Lig =~ s/baraff/baraſſ/g;
$Lig =~ s/befogn/beſogn/g;
$Lig =~ s/befoign/beſoign/g;
$Lig =~ s/befoin/beſoin/g;
$Lig =~ s/blafé/blaſé/g;
$Lig =~ s/bleffe/bleſſe/g;
$Lig =~ s/bleffu/bleſſu/g;
$Lig =~ s/blelfe/bleſſe/g;
$Lig =~ s/boifé/boiſé/g;
$Lig =~ s/bougreffe/bougreſſe/g;
$Lig =~ s/bourfe/bourſe/g;
$Lig =~ s/bourgeoife/bourgeoiſe/g;
$Lig =~ s/boff/boſſ/g;
$Lig =~ s/cafle/caſſe/g;
$Lig =~ s/caflé/caſſé/g;
$Lig =~ s/careff/careſſ/g;
$Lig =~ s/caroffe/caroſſe/g;
$Lig =~ s/cefle/ceſſe/g;
$Lig =~ s/cefT/ceſſ/g;
$Lig =~ s/celfe/ceſſe/g;
$Lig =~ s/chaife/chaiſe/g;
$Lig =~ s/chanfon/chanſon/g;
$Lig =~ s/chériff/chériſſ/g;
$Lig =~ s/chiffemen/chiſſemen/g;
$Lig =~ s/chinoife/chinoiſe/g;
$Lig =~ s/chofe/choſe/g;
$Lig =~ s/choifi/choiſi/g;
$Lig =~ s/clioifi/choiſi/g;
$Lig =~ s/coeur/cœur/g;
$Lig =~ s/confeil/conſeil/g;
$Lig =~ s/confen/conſen/g;
$Lig =~ s/conf(e|é)qu/conſ$1qu/g;
$Lig =~ s/conferv/conſerv/g;
$Lig =~ s/confift/conſiſt/g;
$Lig =~ s/confol/conſol/g;
$Lig =~ s/confom/conſom/g;
$Lig =~ s/connoifl/connoiſſ/g;
$Lig =~ s/connoilf/connoiſſ/g;
$Lig =~ s/converf/converſ/g;
$Lig =~ s/corfet/corſet/g;
$Lig =~ s/coufine/couſine/g;
$Lig =~ s/coufu/couſu/g;
$Lig =~ s/courfe/courſe/g;
$Lig =~ s/courtif/courtiſ/g;
$Lig =~ s/cruffe/cruſſe/g;
$Lig =~ s/danf(e|é)/danſ$1/g;
$Lig =~ s/dcmo/demo/g;
$Lig =~ s/d(e|é)fabuf/d$1ſabuſ/g;
$Lig =~ s/défagré/déſagré/g;
$Lig =~ s/d(e|é)fenfe/d$1fenſe/g;
$Lig =~ s/deffert/deſſert/g;
$Lig =~ s/d(e|é)fir/d$1ſir/g;
$Lig =~ s/deflus/deſſus/g;
$Lig =~ s/d(e|é)folé/d$1ſolé/g;
$Lig =~ s/d(e|é)fordre/d$1ſordre/g;
$Lig =~ s/d(e|é)laff/d$1laſſ/g;
$Lig =~ s/demoifelle/demoiſelle/g;
$Lig =~ s/difait/diſait/g;
$Lig =~ s/difant/diſant/g;
$Lig =~ s/difette/diſette/g;
$Lig =~ s/diffip/diſſip/g;
$Lig =~ s/difpof/diſpoſ/g;
$Lig =~ s/diverf/diverſ/g;
$Lig =~ s/dreff/dreſſ/g;
$Lig =~ s/drefle/dreſſe/g;
$Lig =~ s/(e|é)blouiflant/$1blouiſſant/g;
$Lig =~ s/effuy/eſſuy/g;
$Lig =~ s/(e|é)glife/$1gliſe/g;
$Lig =~ s/elfieurs/eſſieurs/g;
$Lig =~ s/empliff/empliſſ/g;#emplisse, remplisse
$Lig =~ s/emprefle/empreſſe/g;
$Lig =~ s/enfei/enſei/g;
$Lig =~ s/enfemble/enſemble/g;
$Lig =~ s/enforte/enſorte/g;
$Lig =~ s/(e|é)poufe/$1pouſe/g;
$Lig =~ s/exceffi/exceſſi/g;
$Lig =~ s/excuf/excuſ/g;
$Lig =~ s/expulf/expulſ/g;
$Lig =~ s/faffe/faſſe/g;
$Lig =~ s/fafle/faſſe/g;
$Lig =~ s/faflfe/faſſe/g;
$Lig =~ s/fageffe/ſageſſe/g;
$Lig =~ s/faifant/faiſant/g;
$Lig =~ s/faifeu/faiſeu/g;
$Lig =~ s/faifi/ſaiſi/g;
$Lig =~ s/faifoi/faiſoi/g;
$Lig =~ s/faifon/ſaiſon/g;
$Lig =~ s/faint/ſaint/g;
$Lig =~ s/falaire/ſalaire/g;
$Lig =~ s/falon/ſalon/g;
$Lig =~ s/fallon/ſallon/g;
$Lig =~ s/falu/ſalu/g;
$Lig =~ s/famedi/ſamedi/g;
$Lig =~ s/fangl/ſangl/g;
$Lig =~ s/fangu/ſangu/g;
$Lig =~ s/fantaf/fantaſ/g;
$Lig =~ s/fantaifie/fantaiſie/g;
$Lig =~ s/fanté/ſanté/g;
$Lig =~ s/fatin/ſatin/g;
$Lig =~ s/fatis/ſatis/g;
$Lig =~ s/fauffe/fauſſe/g;
$Lig =~ s/faur/ſaur/g;
$Lig =~ s/fauva/ſauva/g;
$Lig =~ s/fauver/ſauver/g;
$Lig =~ s/favant/ſavant/g;
$Lig =~ s/favez/ſavez/g;
$Lig =~ s/favi/ſavi/g;
$Lig =~ s/favoi/ſavoi/g;
$Lig =~ s/favon/ſavon/g;
$Lig =~ s/fortie/ſortie/g;
$Lig =~ s/favour/ſavour/g;
$Lig =~ s/f(e|é)ance/ſ$1ance/g;
$Lig =~ s/fecs/ſecs/g;
$Lig =~ s/fecond/ſecond/g;
$Lig =~ s/fecouffe/ſecouſſe/g;
$Lig =~ s/fecour/ſecour/g;
$Lig =~ s/f(e|é)culier/ſ$1culier/g;
$Lig =~ s/f(e|é)curit/ſ$1curit/g;
$Lig =~ s/feftin/feſtin/g;
$Lig =~ s/feigneur/ſeigneur/g;
$Lig =~ s/feize/ſeize/g;
$Lig =~ s/fema/ſema/g;
$Lig =~ s/femé/ſemé/g;
$Lig =~ s/f(e|é)millant/ſ$1millant/g;
$Lig =~ s/f(e|é)minaire/ſ$1minaire/g;
$Lig =~ s/fenfation/ſenſation/g;
$Lig =~ s/fentois/ſentois/g;
$Lig =~ s/fentimen/ſentimen/g;
$Lig =~ s/fept/ſept/g;
$Lig =~ s/ferein/ſerein/g;
$Lig =~ s/f(e|é)r(e|é)nade/ſ$1r$2nade/g;
$Lig =~ s/f(e|é)rieux/ſ$1rieux/g;
$Lig =~ s/f(e|é)rieufe/ſ$1rieuſe/g;
$Lig =~ s/fermens/ſermens/g;
$Lig =~ s/fermon/ſermon/g;
$Lig =~ s/fervant/ſervant/g;
$Lig =~ s/fervi/ſervi/g;
$Lig =~ s/fervoit/ſervoit/g;
$Lig =~ s/feufe/ſeuſe/g;
$Lig =~ s/ſeufe/ſeuſe/g;
$Lig =~ s/fiecle/ſiecle/g;
$Lig =~ s/fiècle/ſiècle/g;
$Lig =~ s/fienne/ſienne/g;
$Lig =~ s/fignifi/ſignifi/g;
$Lig =~ s/filence/ſilence/g;
$Lig =~ s/fingul/ſingul/g;
$Lig =~ s/ffimul/ſſimul/g;
$Lig =~ s/fimul/ſimul/g;
$Lig =~ s/finifl/finiſſ/g;
$Lig =~ s/fitua/ſitua/g;
$Lig =~ s/fixi(e|é|è)me/ſixi$1me/g;
$Lig =~ s/fodom/ſodom/g;
$Lig =~ s/foeur/ſœur/g;
$Lig =~ s/fœur/ſœur/g;
$Lig =~ s/foient/ſoient/g;
$Lig =~ s/foirée/ſoirée/g;
$Lig =~ s/foixante/ſoixante/g;
$Lig =~ s/foleil/ſoleil/g;
$Lig =~ s/folenn/ſolenn/g;
$Lig =~ s/folide/ſolide/g;
$Lig =~ s/follicit/ſollicit/g;
$Lig =~ s/fomme/ſomme/g;
$Lig =~ s/fonge/ſonge/g;
$Lig =~ s/fopha/ſopha/g;
$Lig =~ s/fortie/ſortie/g;
$Lig =~ s/fortir/ſortir/g;
$Lig =~ s/fortit/ſortit/g;
$Lig =~ s/fots/ſots/g;
$Lig =~ s/fotte/ſotte/g;
$Lig =~ s/fottife/ſottiſe/g;
$Lig =~ s/fouci/ſouci/g;
$Lig =~ s/foudain/ſoudain/g;
$Lig =~ s/fouhait/ſouhait/g;
$Lig =~ s/foulage/ſoulage/g;
$Lig =~ s/foulier/ſoulier/g;
$Lig =~ s/fourbiff/fourbiſſ/g;
$Lig =~ s/fourcil/ſourcil/g;
$Lig =~ s/fourd/ſourd/g;
$Lig =~ s/fouris/ſouris/g;
$Lig =~ s/fournois/ſournois/g;
$Lig =~ s/fournoife/ſournoiſe/g;
$Lig =~ s/fout(c|e)nu/ſout$1nu/g;
$Lig =~ s/foutien/ſoutien/g;
$Lig =~ s/foyez/ſoyez/g;
$Lig =~ s/fuav/ſuav/g;
$Lig =~ s/fubfift/ſubſiſt/g;
$Lig =~ s/fubfti/ſubſti/g;
$Lig =~ s/fuffe/fuſſe/g;
$Lig =~ s/fuffrage/ſuffrage/g;
$Lig =~ s/fufi/fuſi/g;
$Lig =~ s/fufpend/ſuſpend/g;
$Lig =~ s/fuftige/fuſtige/g;
$Lig =~ s/fujet/ſujet/g;
$Lig =~ s/f(û|u)rement/ſ$1rement/g;
$Lig =~ s/furfaut/ſurſaut/g;
$Lig =~ s/furmont/ſurmont/g;
$Lig =~ s/furnom/ſurnom/g;
$Lig =~ s/furtout/ſurtout/g;
$Lig =~ s/fympatif/ſympatiſ/g;
$Lig =~ s/galantife/galantiſe/g;
$Lig =~ s/garnifon/garniſon/g;
$Lig =~ s/gefte/geſte/g;
$Lig =~ s/grifant/griſant/g;
$Lig =~ s/grife/griſe/g;
$Lig =~ s/grifé/griſé/g;
$Lig =~ s/grofl/groſſ/g;
$Lig =~ s/guif/guiſ/g;
$Lig =~ s/hafard/haſard/g;
$Lig =~ s/hardieffe/hardieſſe/g;
$Lig =~ s/huiffier/huiſſier/g;
$Lig =~ s/ivreffe/ivreſſe/g;
$Lig =~ s/jafe/jaſe/g;
$Lig =~ s/jafmin/jaſmin/g;
$Lig =~ s/jalouf/jalouſ/g;
$Lig =~ s/jeuneffe/jeuneſſe/g;
$Lig =~ s/Jofephine/Joſephine/g;
$Lig =~ s/jouilf/jouiſſ/g;
$Lig =~ s/laffé/laſſé/g;
$Lig =~ s/laifl/laiſſ/g;
$Lig =~ s/laijjerai/laiſſerai/g;
$Lig =~ s/lifez/liſez/g;
$Lig =~ s/lifant/liſant/g;
$Lig =~ s/loifir/loiſir/g;
$Lig =~ s/lyfée/lyſée/g;#élysée, Élysée
$Lig =~ s/mafculin/maſculin/g;
$Lig =~ s/maffac/maſſac/g;#massacre
$Lig =~ s/maifon/maiſon/g;
$Lig =~ s/maîtrefle/maîtreſſe/g;
$Lig =~ s/majeft/majeſt/g;
$Lig =~ s/mauffade/mauſſade/g;
$Lig =~ s/médif/médiſ/g;
$Lig =~ s/mefur/meſur/g;
$Lig =~ s/m(e|é)prif/m$1priſ/g;
$Lig =~ s/mîffe/mîſſe/g;
$Lig =~ s/moijelle/moiſelle/g;#demoiselle
$Lig =~ s/muf(e|i)/muſ$1/g;#muse, musique, musicien
$Lig =~ s/noblefle/nobleſſe/g;
$Lig =~ s/noblelfe/nobleſſe/g;
$Lig =~ s/nourriff/nourriſſ/g;
$Lig =~ s/ob(e|é)iff/ob$1iſſ/g;
$Lig =~ s/ob(e|é)ifl/ob$1iſſ/g;
$Lig =~ s/ob(e|é)ilf/ob$1iſſ/g;
$Lig =~ s/occafion/occaſion/g;
$Lig =~ s/ofalie/oſalie/g;
$Lig =~ s/ofimont/oſimont/g;
$Lig =~ s/omteffe/omteſſe/g;
$Lig =~ s/omtefie/omteſſe/g;
$Lig =~ s/omtefle/omteſſe/g;
$Lig =~ s/omtefTe/omteſſe/g;
$Lig =~ s/omtejje/omteſſe/g;
$Lig =~ s/onfeil/onſeil/g;
$Lig =~ s/onfieur/onſieur/g;
$Lig =~ s/oppof/oppoſ/g;
$Lig =~ s/organif/organiſ/g;
$Lig =~ s/pafier/paſſer/g;
$Lig =~ s/paflade/paſſade/g;
$Lig =~ s/pafle/paſſe/g;
$Lig =~ s/paflfer/paſſer/g;
$Lig =~ s/paiïade/paſſade/g;
$Lig =~ s/palfe/paſſe/g;
$Lig =~ s/palfé/paſſé/g;
$Lig =~ s/pareff/pareſſ/g;
$Lig =~ s/paroiff/paroiſſ/g;
$Lig =~ s/paroifſ/paroiſſ/g;
$Lig =~ s/payfa/payſa/g;
$Lig =~ s/pefan/peſan/g;
$Lig =~ s/p(e|é)foit/p$1ſoit/g;
$Lig =~ s/perfécut/perſécut/g;
$Lig =~ s/perfonn/perſonn/g;
$Lig =~ s/perfuad/perſuad/g;
$Lig =~ s/phrafe/phraſe/g;
$Lig =~ s/phyf/phyſ/g;
$Lig =~ s/piff/piſſ/g;
$Lig =~ s/plaîfir/plaîſir/g;
$Lig =~ s/pliff/pliſſ/g;
$Lig =~ s/pl(n|u)fieurs/pluſieurs/g;
$Lig =~ s/po(é|ë|e)fie/po$1ſie/g;
$Lig =~ s/poflib/poſſib/g;
$Lig =~ s/poiffon/poiſſon/g;
$Lig =~ s/poifon/poiſon/g;
$Lig =~ s/pojjible/poſſible/g;
$Lig =~ s/polfib/poſſib/g;
$Lig =~ s/politeffe/politeſſe/g;
$Lig =~ s/pouff/pouſſ/g;
$Lig =~ s/pouffoit/pouſſoit/g;
$Lig =~ s/pouflbit/pouſſoit/g;
$Lig =~ s/poufloit/pouſſoit/g;
$Lig =~ s/pourfuis/pourſuis/g;
$Lig =~ s/pourfuit/pourſuit/g;
$Lig =~ s/pr(e|é)cife/pr$1ciſe/g;
$Lig =~ s/pr(e|é)fenc/pr$1ſenc/g;
$Lig =~ s/pr(e|é)fent/pr$1ſent/g;
$Lig =~ s/préferv/préſerv/g;
$Lig =~ s/pr(e|i)ff/pr$1ſſ/g;
$Lig =~ s/pr(e|é)fident/pr$1ſident/g;
$Lig =~ s/prife/priſe/g;
$Lig =~ s/propof/propoſ/g;
$Lig =~ s/Pruffe/Pruſſe/g;
$Lig =~ s/puiffe/puiſſe/g;
$Lig =~ s/puiffiez/puiſſiez/g;
$Lig =~ s/puifie/puiſſe/g;
$Lig =~ s/puifle/puiſſe/g;
$Lig =~ s/puifliez/puiſſiez/g;
$Lig =~ s/puifte/puiſſe/g;
$Lig =~ s/quife/quiſe/g;
$Lig =~ s/raffé/raſſé/g;
$Lig =~ s/raifon/raiſon/g;
$Lig =~ s/r(e|é)alif/r$1aliſ/g;
$Lig =~ s/refſen/reſſen/g;
$Lig =~ s/refen/reſen/g;
$Lig =~ s/réferv/réſerv/g;
$Lig =~ s/reffent/reſſent/g;
$Lig =~ s/refferr/reſſerr/g;
$Lig =~ s/reffort/reſſort/g;
$Lig =~ s/reffource/reſſource/g;
$Lig =~ s/reffuſcit/reſſuſcit/g;
$Lig =~ s/r(e|é)fide/r$1ſide/g;
$Lig =~ s/r(e|é)fifte/r$1ſiſte/g;
$Lig =~ s/r(e|é)folu/r$1ſolu/g;
$Lig =~ s/r(e|é)foudre/r$1ſoudre/g;
$Lig =~ s/refuf/refuſ/g;
$Lig =~ s/r(e|é)fult/r$1ſult/g;
$Lig =~ s/renverf/renverſ/g;
$Lig =~ s/repof/repoſ/g;
$Lig =~ s/r(e|é)ponfe/r$1ponſe/g;
$Lig =~ s/r(e|é)uffiffe/r$1uſſiſſe/g;
$Lig =~ s/richeffe/richeſſe/g;
$Lig =~ s/ruft/ruſt/g;
$Lig =~ s/taifons/taiſons/g;
$Lig =~ s/teffe/teſſe/g;
$Lig =~ s/t(e|é)reff/t$1reſſ/g;
$Lig =~ s/teufe/teuſe/g;
$Lig =~ s/tiffe/tiſſe/g;
$Lig =~ s/tracaff/tracaſſ/g;
$Lig =~ s/trahifon/trahiſon/g;
$Lig =~ s/tranf/tranſ/g;
$Lig =~ s/traverf/traverſ/g;
$Lig =~ s/treffe/treſſe/g;
$Lig =~ s/troif/troiſ/g;
$Lig =~ s/ufag/uſag/g;
$Lig =~ s/ufé/uſé/g;
$Lig =~ s/uffitôt/uſſitôt/g;
$Lig =~ s/ufii/uſſi/g;
$Lig =~ s/uflitôt/uſſitôt/g;
$Lig =~ s/uniffe/uniſſe/g;
$Lig =~ s/vafte/vaſte/g;
$Lig =~ s/vaiffeau/vaiſſeau/g;
$Lig =~ s/vifag/viſag/g;
$Lig =~ s/viffe/viſſe/g;
$Lig =~ s/vife/viſe/g;
$Lig =~ s/voifin/voiſin/g;
#
#Mots entiers délimités
#
$Lig =~ s/\bclaffe/claſſe/g;
$Lig =~ s/\bdife\b/diſe/g;
$Lig =~ s/\bd(e|é)fir/d$1ſir/g;#désir, desir
$Lig =~ s/\beffa(i|y)/eſſa$1/g;#essai, essayer
$Lig =~ s/\bètre\b/être/g;
$Lig =~ s/\beuff/euſſ/g;#eusse,
$Lig =~ s/\biffu/iſſu/g;#issu, issues
$Lig =~ s/\bf(a|e|i|u)\b/ſ$1/g;#sa, se, si, su
$Lig =~ s/\bfage\b/ſage/g;
$Lig =~ s/\bfages\b/ſages/g;
$Lig =~ s/\bfang\b/ſang/g;
$Lig =~ s/\bfans\b/ſans/g;
$Lig =~ s/\bfauf\b/ſauf/g;
$Lig =~ s/\bfaufs\b/ſaufs/g;
$Lig =~ s/\bfauts\b/ſauts/g;
$Lig =~ s/\bfecte/ſecte/g;
$Lig =~ s/\bfe(c|s)\b/ſe$1/g;#sec, ses
$Lig =~ s/\bfein\b/ſein/g;
$Lig =~ s/\bfelon\b/ſelon/g;
$Lig =~ s/\bfen(s|t)\b/ſen$1/g;
$Lig =~ s/\bfert\b/ſert/g;
$Lig =~ s/\bferti\b/ſerti/g;
$Lig =~ s/\bferve\b/ſerve/g;
$Lig =~ s/\bfien\b/ſien/g;
$Lig =~ s/\bfiens\b/ſiens/g;
$Lig =~ s/\bfinon\b/ſinon/g;
$Lig =~ s/\bfiffe\b/fiſſe/g;
$Lig =~ s/\bfix\b/ſix/g;
$Lig =~ s/\bfoir\b/ſoir/g;
$Lig =~ s/\bfoirs\b/ſoirs/g;
$Lig =~ s/\bfoit/ſoit/g;
$Lig =~ s/\bfo(n|t)\b/ſo$1/g;#son, sot
$Lig =~ s/\bfonn/ſonn/g;#le délimiteur avant empêche de faire grissonne, mais pas sonna
$Lig =~ s/\bfortant\b/ſortant/g;
$Lig =~ s/\bfort(î|i)me/ſort$1me/g;#sortîmes
$Lig =~ s/\bfortis\b/ſortis/g;
$Lig =~ s/\bfort(a|o|)i/ſort$1i/g;#sortais, sortoit, sortois, sortoit
$Lig =~ s/\bf(u|û)rement\b/ſ$1rement/g;#surement, sûrement
$Lig =~ s/\bfue\b/ſue/g;#sue
$Lig =~ s/\bf(u|û)r\b/ſ$1r/g;#sûr
$Lig =~ s/\bf(u|û)re\b/ſ$1re/g;#sûre
$Lig =~ s/\bifle\b/iſle/g;
$Lig =~ s/\bifles\b/iſles/g;
$Lig =~ s/\blife\b/liſe/g;
$Lig =~ s/\blifoi\b/liſoi/g;
$Lig =~ s/\bmife\b/miſe/g;
$Lig =~ s/\bofe/oſe/g;
$Lig =~ s/\brofe\b/roſe/g;
$Lig =~ s/\bprofe\b/proſe/g;
$Lig =~ s/\brofes\b/roſes/g;
$Lig =~ s/\buf(a|e|é)/uſ$1/g;
#
#Motifs récurrents
#
$Lig =~ s/abf/abſ/g;#absent
$Lig =~ s/accuf/accuſ/g;#accuser
$Lig =~ s/aft/aſt/g;#astre,contraste
$Lig =~ s/ffeffe/ſſeſſe/g;#grossesse
$Lig =~ s/affaff/aſſaſſ/g;#assassin
$Lig =~ s/affi(s|t)/aſſi$1/g;#assis, assit
$Lig =~ s/affife/aſſiſe/g;#assise
$Lig =~ s/aif(e|é|o)/aiſ$1/g;#aise, aisé, baisse, raison
$Lig =~ s/aiff/aiſſ/g;#naissance
$Lig =~ s/aiſf/aiſſ/g;#naissance
$Lig =~ s/alf(ac|ez|ur)/alſ$1/g;#alsacien, assez, assure
$Lig =~ s/alfez/aſſez/g;#assez
$Lig =~ s/alfur/aſſur/g;#assurer
$Lig =~ s/all(e|é)greffe/all$1greſſe/g;#allégresse
$Lig =~ s/amuf/amuſ/g;#amuser
$Lig =~ s/auft/auſt/g;#austère
$Lig =~ s/baif/baiſ/g;#baiser
$Lig =~ s/(b|h)araff/$1araſſ/g;#embarassé, harassé
$Lig =~ s/barraff/barraſſ/g;#embarrassé, embarrassant
$Lig =~ s/braff/braſſ/g;#brasser
$Lig =~ s/br(a|â)f(a|i|é|è|e)/br$1ſ$2/g;#embraser, embrâser
$Lig =~ s/brif(a|é|è|e)/briſ$1/g;#brisé
$Lig =~ s/cauf/cauſ/g;#cause
$Lig =~ s/cèfe/cèſe/g;#acèse
$Lig =~ s/ceff/ceſſ/g;#cesser
$Lig =~ s/chaff/chaſſ/g;#chasse, chasser
$Lig =~ s/\bclaff/claſſ/g;#classe, classer
$Lig =~ s/çoife/çoiſe/g;#Françoise
$Lig =~ s/compof/compoſ/g;#composer
$Lig =~ s/confid(é|è|e)r/conſid$1r/g;#considéré, considère
$Lig =~ s/croiff/croiſſ/g;#croissance
$Lig =~ s/croif/croiſ/g;#croisement
$Lig =~ s/croiſf/croiſſ/g;#croissance
$Lig =~ s/cufe/cuſe/g;#excuse
$Lig =~ s/cuif(i|a)n/cuiſ$1n/g;#cuise, cuisine, cuisant
$Lig =~ s/danf/danſ/g;#danse
$Lig =~ s/(dangero|généro|genero|moro)f/$1ſ/g;#dangerosité, générosité, morosité
$Lig =~ s/d(é|è|e)effe/d$1eſſe/g;#déesse
$Lig =~ s/defc/deſc/g;#descente
$Lig =~ s/d(é|e)fefp/d$1ſeſp/g;#desespoir
$Lig =~ s/d(é|e)fench/d$1ſench/g;#désenchanté
$Lig =~ s/défert/déſert/g;#désert
$Lig =~ s/d(é|o)ff/d$1ſſ/g;#dessus, adossé
$Lig =~ s/dif(c|g|t)/diſ$1/g;#discerne, disgrâce, distant
$Lig =~ s/diff(a|e)n/diſſ$1n/g;#grandissant, grandisse
$Lig =~ s/diffoi/diſſoi/g;#applaudissoit
$Lig =~ s/difoi/diſoi/g;#disait
$Lig =~ s/dif(a|o)n/diſ$1n/g;#disait, disons
$Lig =~ s/\bdifiez/diſiez/g;#disiez
$Lig =~ s/divif/diviſ/g;#divise, division
$Lig =~ s/\bdof/doſ/g;#dose, dosa
$Lig =~ s/dr(e|i)ff/dr$1ſſ/g;#adresse, attendrisse, dresse
$Lig =~ s/duif/duiſ/g;#réduise
$Lig =~ s/ef(c|p|t)/eſ$1/g;#escroc, espoir, estime
$Lig =~ s/(é|e)for/$1ſor/g;#trésor
$Lig =~ s/effeufe/eſſeuſe/g;#connoisseuse
$Lig =~ s/effeur/eſſeur/g;#confesseur
$Lig =~ s/effieurs/eſſieurs/g;#Messieurs, messieurs
$Lig =~ s/effion/eſſion/g;#profession
$Lig =~ s/enife/eniſe/g;#Venise
$Lig =~ s/erfua/erſua/g;#persuader
$Lig =~ s/(e|é|è|ê)tife/$1tiſe/g;#bêtise
$Lig =~ s/eufe/euſe/g;#heureuse
$Lig =~ s/exif/exiſ/g;#exister
$Lig =~ s/facr/ſacr/g;#sacré
$Lig =~ s/fall(e|on)/ſall$1/g;#salle, sallon
$Lig =~ s/falpêtr/ſalpêtr/g;#salpêtre
$Lig =~ s/fanct/ſanct/g;#sanction, sanctifier
$Lig =~ s/fat(i|y)r/ſat$1r/g;#satyre, satirique
$Lig =~ s/fecou/ſecou/g;#secouer
$Lig =~ s/fecr/ſecr/g;#secret
$Lig =~ s/f(é|e)du/ſ$1du/g;#séduction
$Lig =~ s/feff(e|é|u)/feſſ$1/g;#fesse, fessée
$Lig =~ s/f(é|e)j/ſ$1j/g;#séjour
$Lig =~ s/ffemb/ſſemb/g;#assembler
$Lig =~ s/femb/ſemb/g;#sembler
$Lig =~ s/fenfib/ſenſib/g;#sensible, sensibilité
$Lig =~ s/fenti/ſenti/g;#sentiment
$Lig =~ s/fépar/ſépar/g;#séparer
$Lig =~ s/ferp/ſerp/g;#serpent
$Lig =~ s/fervoi/ſervoi/g;#servoit, servoient
$Lig =~ s/feul/ſeul/g;#seul
$Lig =~ s/feuſe/ſeuſe/g;#oiseuse
$Lig =~ s/fign/ſign/g;#signal, désigne
$Lig =~ s/f(é|e)v(e|é|è|i)/ſ$1v$2/g;#sève, sévère,sévi
$Lig =~ s/fex/ſex/g;#sexe
$Lig =~ s/ff(e|i)ff/ſſ$1ſſ/g;#grossesse, réussisse
$Lig =~ s/ffom/ſſom/g;#assomme
$Lig =~ s/ffoup/ſſoup/g;#assoupi
$Lig =~ s/fible/ſible/g;#paisible, risible
$Lig =~ s/fid(e|é|è)r/ſid$1r/g;#considère
$Lig =~ s/fift/ſiſt/g;#sistême
$Lig =~ s/fim(e|p)/ſim$1/g;#simarre, simple
$Lig =~ s/fin(c|g)/sin$1/g;#sincère, singe
$Lig =~ s/fin(e|i)ff/fin$1ſſ/g;#
$Lig =~ s/foci/ſoci/g;#société
$Lig =~ s/fold/ſold/g;#solde, soldat
$Lig =~ s/foli(d|t)/ſoli$1/g;#solide, solitude
$Lig =~ s/foph(e|i)/ſoph$1/g;#philosophe, philosophie
$Lig =~ s/fouff(l|r)/ſouff$1/g;#souffle, souffrir
$Lig =~ s/fouftr/ſouſtr/g;#soustraire
$Lig =~ s/ffouv/ſſouv/g;#assouvir, ressouvenir
$Lig =~ s/fou(m|p|v)/ſou$1/g;#soumis, souple, souvent
$Lig =~ s/fouri(a|e|o|r)/ſouri$1/g;#sourir, souriant, sourioit
$Lig =~ s/fouten(a|e|i|o|u)/ſouten$1/g;#soutenant, souteneur, soutenir, soutenois, soutenu
$Lig =~ s/f(c|p|q)/ſ$1/g;#science, espace, esquive
$Lig =~ s/fq/ſq/g;#presque
$Lig =~ s/fſeuſe/ſſeuſe/g;#connoisseuse
$Lig =~ s/frif/friſ/g;#frisé
$Lig =~ s/ftan/ſtan/g;#stance, distance, distant
$Lig =~ s/ftr/ſtr/g;#lustre
$Lig =~ s/\bfub(i|j|l|o|s|t|v)/ſub$1/g;#subit, subjugue, sublime, suborner, subside, subtil, subvient
$Lig =~ s/fucc/ſucc/g;#succès
$Lig =~ s/\bfuc(e|é|i)/ſuc$1/g;#sucer
$Lig =~ s/\bfuç(a|o)/ſuç$1/g;#suça, suçoit
$Lig =~ s/fucr/ſucr/g;#sucre
$Lig =~ s/fuffi(t|r)/ſuffi$1/g;#suffir, suffit
$Lig =~ s/fuffif/ſuffiſ/g;#suffisant, suffise
$Lig =~ s/fufp/ſuſp/g;#suspend
$Lig =~ s/fuiv/ſuiv/g;#suivant
$Lig =~ s/fup/ſup/g;#supérieur
$Lig =~ s/fur(p|v)/ſur$1/g;#surpris, surveille
$Lig =~ s/fyft/ſyſt/g;#système
$Lig =~ s/fym/ſym/g;#sympathique
$Lig =~ s/geffe/geſſe/g;#pour sagesse, voir sage dans mots entiers
$Lig =~ s/giff/giſſ/g;#agissant
$Lig =~ s/gofier/goſier/g;#grosse
$Lig =~ s/groff/groſſ/g;#grosse
$Lig =~ s/h(é|e)fi/h$1ſi/g;#hésite
$Lig =~ s/hift/hiſt/g;#histoire
$Lig =~ s/ifar/iſar/g;#camisard
$Lig =~ s/iffaire/iſſaire/g;#commissaire
$Lig =~ s/iffem/iſſem/g;#agissement
$Lig =~ s/iffim/iſſim/g;#sérénissime
$Lig =~ s/ifm/iſm/g;#communisme
$Lig =~ s/iffois/iſſois/g;#applaudissois
$Lig =~ s/ifp/iſp/g;#dispute
$Lig =~ s/ift/iſt/g;#liste
$Lig =~ s/infol/inſol/g;#infolent
$Lig =~ s/iniff/iniſſ/g;#finisse, etc,
$Lig =~ s/int(é|e)reff/int$1reſſ/g;#intéressé
$Lig =~ s/iofit/ioſit/g;#curiosité
$Lig =~ s/juft/juſt/g;#justice
$Lig =~ s/laiff/laiſſ/g;#laisser
$Lig =~ s/\blaff/laſſ/g;#lassant, lasse
$Lig =~ s/liff/liſſ/g;#lisse
$Lig =~ s/luff/luſſ/g;#voulusse
$Lig =~ s/luft/luſt/g;#lustre
$Lig =~ s/menfe/menſe/g;#immense
$Lig =~ s/([Mm])aif/$1aiſ/g;#Maison, maison
$Lig =~ s/m(e|é|l)fa([vl])/m$1ſa$2/g;#mésaventure, mésalliance
$Lig =~ s/(M|m)eff/$1eſſ/g;#Messieurs, messieurs
$Lig =~ s/maff(e|i)/maſſ$1/g;#masse, amasse, massif
$Lig =~ s/miff/miſſ/g;#mission
$Lig =~ s/mif/miſ/g;#mise, misère
$Lig =~ s/moif/moiſ/g;#demoiselle
$Lig =~ s/myft/myſt/g;#mystère
$Lig =~ s/nft/nſt/g;#instant
$Lig =~ s/ndife/ndiſe/g;#marchandise
$Lig =~ s/nfuite/nſuite/g;#ensuite
$Lig =~ s/nfult/nſult/g;#insulte
$Lig =~ s/nfur/nſur/g;#censure, tonsure
$Lig =~ s/noiff/noiſſ/g;#connoisse
$Lig =~ s/nuif/nuiſ/g;#nuisance
$Lig =~ s/obf/obſ/g;#observe
$Lig =~ s/offenf/offenſ/g;#offense
$Lig =~ s/oft/oſt/g;#poste
$Lig =~ s/ouiff/ouiſſ/g;#jouissance
$Lig =~ s/ouift/ouiſt/g;#ouistiti
$Lig =~ s/paff/paſſ/g;#passe
$Lig =~ s/pafſ/paſſ/g;#passe
$Lig =~ s/penf/penſ/g;#pense
$Lig =~ s/p(é|e)riff/p$1riſſ/g;#périsse
$Lig =~ s/(P|p)arif/$1ariſ/g;#Parisien
$Lig =~ s/pefa/peſa/g;#pesa, pesant
$Lig =~ s/plaif/plaiſ/g;#plaisir
$Lig =~ s/poff/poſſ/g;#possède
$Lig =~ s/pof/poſ/g;#pose, positif
$Lig =~ s/ponf/ponſ/g;#réponse
$Lig =~ s/(P|p)rifon/$1riſon/g;#Prison, prison
$Lig =~ s/puiff/puiſſ/g;#puissant
$Lig =~ s/puif/puiſ/g;#puise, épuisant, mais pas puissant qui est pris en comte dans le premier lot
$Lig =~ s/r(é|e)uffi/r$1uſſi/g;#réussir, réussite
$Lig =~ s/r(é|e)fum/r$1ſum/g;#résume
$Lig =~ s/roff/roſſ/g;#crosse
$Lig =~ s/ro([iu])ff/ro$1ſſ/g;#paroisse, paroissons, rousse
$Lig =~ s/teffe/teſſe/g;#comtesse
$Lig =~ s/tiff/tiſſ/g;#tisse
$Lig =~ s/tifon/tiſon/g;#tison
$Lig =~ s/tif(a|o)n/tiſ$1n/g;#tisanne, tison
$Lig =~ s/toif/toiſ/g;#toise
$Lig =~ s/trif/triſ/g;#triste
$Lig =~ s/ucheffe/ucheſſe/g;#(Dd)uchesse
$Lig =~ s/ufu/uſu/g;#usuel
$Lig =~ s/uiff/uiſſ/g;#suisse
$Lig =~ s/uffel/uſſel/g;#mousseline
$Lig =~ s/veff/veſſ/g;#vesse, vessie
$Lig =~ s/(V|v)erf/$1erſ/g;#Versailles, verse
$Lig =~ s/vifi(b|o|t)/viſi$1/g;#visible, vision, visite
#
#
#4. Ponctuation
#
# $Lig =~ s/[']([a-zA-Zàéèëêîïôöûüœ]+)\W/’$1/g;#pose un problème d'encodage
$Lig =~ s/\s-\s/-/g;
$Lig =~ s/\s,/,/g;
# $Lig =~ s/;/ ;/g;
# $Lig =~ s/\?/ ?/g;
# $Lig =~ s/:/ :/g;
# $Lig =~ s/!/ !/g;
# $Lig =~ s/\s{2}/ /g;
#
### 5. Mise en page
#
# $Lig =~ s/\f/\r\n\r\n\f/g;
print OUT_Fic2 $Lig;
}
close (IN_Fic2);
close (OUT_Fic2);
unlink "/$dir/temp2.txt";
#
# FIN DU SCRIPT
</code>
Dernière mise à jour le 15/10/2019, 20:50