3 // filtre qui extrait le contenu texte d'une page html pour rendre du texte plein
4 function version_plein_texte($texte){
6 $texte = charset2unicode($texte);
7 $texte = strtr($texte, array('&'=>'&', '"'=>'"', '<'=>'<', '>'=>'>', 'è'=>'è', 'é'=>'é', 'à' => 'à') );
10 /*a1*/ ',</?h1[^>]*>,',
11 /*a2*/ ',</?h2[^>]*>,',
13 /*a3*/ ',</h3[^>]*>,',
14 /*01*/ '@<script[^>]*?>.*?</script>@si', // Supprime le javascript
15 /*02*/ '@<style[^>]*?>.*?</style>@si', // Supprime les styles inline
16 /*03*/ ",<link[^>]*>,Uims", // les css
17 /*04*/ ",<img[^>]*alt=['\"]([^'\"]*)['\"][^>]*>,Uims", // les images
18 /*05*/ ',(<(div|br|p)),i',
19 /*06*/ '@<[\/\!]*?[^<>]*?'.'>@si', // Supprime les balises HTML
20 /*07*/ '@([\r\n])[\s]+@', // Supprime les espaces
21 /*08*/ ',[\r\n][_]{2},sm',
22 /*09*/ '@&(quot|#34);@i', // Remplace les entites HTML
23 /*10*/ '@&(amp|#38);@i',
24 /*11*/ '@&(lt|#60);@i',
25 /*12*/ '@&(gt|#62);@i',
26 /*13*/ '@&(nbsp|#160);@i',
27 /*14*/ '@&(iexcl|#161);@i',
28 /*15*/ '@&(cent|#162);@i',
29 /*16*/ '@&(pound|#163);@i',
30 /*17*/ '@&(copy|#169);@i',
36 /*a1*/ "\n__--------------------------------------------------------\n",
37 /*a2*/ "\n__...........\n",
58 /*19*/ 'chr(\1)' // Evaluation comme PHP
61 $texte = preg_replace($cherche, $remplace, $texte);
65 // filtre qui extrait le contenu texte d'une page html, a l'exclusion de quelques balises elementaires
66 function version_texte($texte){
67 $texte = charset2unicode($texte);
69 // accentuer le texte avant de suprimer les tags
70 $texte = strtr($texte, array('&'=>'&', '"'=>'"', '<'=>'<', '>'=>'>', 'è'=>'è', 'é'=>'é', 'à' => 'à') );
73 /*01*/ '@<script[^>]*?>.*?</script>@si', // Supprime le javascript
74 /*02*/ '@<style[^>]*?>.*?</style>@si', // Supprime les styles inline
75 /*03*/ ",<link[^>]*>,Uims", // les css
76 /*04*/ ",<img[^>]*alt=['\"]([^'\"]*)['\"][^>]*>,Uims", // les images
88 $texte = preg_replace($cherche, $remplace, $texte);