[SPIP][PLUGINS] v3.0-->v3.2
[lhc/web/www.git] / www / plugins / odt2spip_32 / inc / odt2spip_generer_sortie.php
1 <?php
2 /**
3 * Créer un article à partir d'un fichier au format odt
4 *
5 * @author cy_altern
6 * @license GNU/LGPL
7 *
8 * @package plugins
9 * @subpackage odt2spip
10 * @category import
11 *
12 *
13 */
14
15 if (!defined('_ECRIRE_INC_VERSION')) {
16 return;
17 }
18
19 /**
20 * Création de l'Array contenant les paramètres du futur article
21 *
22 * Le fichier content.xml a été extrait de l'archive .odt, et placé dans le dossier
23 * temporaire propre à l'utilisateur courant. Un premier traitement est effectué
24 * par cette fonction pour qu'il soit finalement transformé en texte utilisant les
25 * balises SPIP. On tient compte de la présence des plugins enluminure_typo et
26 * intertitre_enrichis. Les images sont extraites du document .odt et sont prêtes
27 * à être insérées dans le futur article SPIP.
28 *
29 * @param string $rep_dezip Répertoire où est dezippé le fichier odt
30 * @param string $fichier_source Chemin du fichier source (permet d’affecter un titre si le document n’en a pas trouvé)
31 * @return array Couples (nom de champ d’article => valeur)
32 * @throws \Exception
33 */
34 function inc_odt2spip_generer_sortie($rep_dezip, $fichier_source = '') {
35 // variables en dur pour xml en entree et xslt utilisee
36 $xml_entre = $rep_dezip . 'content.xml'; // chemin du fichier xml a lire
37 $xslt_texte = _DIR_PLUGIN_ODT2SPIP . 'inc/odt2spip.xsl'; // chemin de la xslt a utiliser pour le texte
38
39 // determiner si le plugin enluminure_typo ou intertitres_enrichis est present & actif
40 include_spip('inc/plugin');
41 $Tplugins = liste_plugin_actifs();
42 $intertitres_riches = (
43 (array_key_exists('TYPOENLUMINEE', $Tplugins) or array_key_exists('INTERTITRESTDM', $Tplugins))
44 ? 'oui'
45 : 'non'
46 );
47
48 // si il n'existe pas de titre:h dans le doc, on parametre ici la longueur max du paragraphe utilise pour remplacer
49 $nb_caracteres_titre = 50;
50
51 // faut il mettre les images en mode document?
52 $type = (_request('mode_image') and _request('mode_image') == 'document') ? 'document' : 'image';
53 $ModeImages = ($type == 'document' ? 'doc' : 'img');
54
55 // récupérer la langue de publication + verifier la valeur envoyée
56 $Tlangues = explode(',', $GLOBALS['meta']['langues_proposees']);
57 $LanguePublication = (
58 in_array(_request('lang_publi'), $Tlangues)
59 ? _request('lang_publi')
60 : $GLOBALS['meta']['langue_site']
61 );
62
63 // date pour les champs date et date_modif
64 $date_jour = date('Y-m-d H:i:s');
65
66 // appliquer la transformation XSLT sur le fichier content.xml
67 // on est php5: utiliser les fonctions de la classe XSLTProcessor
68 // verifier que l'extension xslt est active
69 if (!class_exists('XSLTProcessor')) {
70 throw new \Exception(_T('odtspip:err_extension_xslt'));
71 }
72 $proc = new XSLTProcessor();
73
74 // passage des parametres a la xslt
75 $proc->setParameter(null, 'IntertitresRiches', $intertitres_riches);
76
77 $xml = new DOMDocument();
78 $xml->load($xml_entre);
79 $xsl = new DOMDocument();
80 $xsl->load($xslt_texte);
81 $proc->importStylesheet($xsl); // attachement des regles xsl
82
83 // lancer le parseur
84 if (!$xml_sortie = $proc->transformToXml($xml)) {
85 throw new \Exception(_T('odtspip:err_transformation_xslt'));
86 }
87
88 // construire l'array des parametres de l'article
89 preg_match('/<titre>(.*?)<\/titre>/', $xml_sortie, $t);
90 $Tarticle['titre'] = $t[1];
91 preg_match('/<texte>(.*?)<\/texte>/s', $xml_sortie, $a);
92 $Tarticle['texte'] = $a[1];
93 $Tarticle['date_redac'] = '0000-00-00 00:00:00';
94 $Tarticle['date'] = $Tarticle['date_modif'] = $date_jour;
95 $Tarticle['lang'] = $LanguePublication;
96 $Tarticle['statut'] = 'prop';
97 $Tarticle['accepter_forum'] = 'non';
98
99 // traitements complementaires du texte de l'article
100 // remplacer les &gt; et &lt;
101 $a_remplacer = array('&#60;', '&#62;', '&lt;', '&gt;', '"');
102 $remplace = array('<', '>', '<', '>', "'");
103
104 // si plugin TYPOENLUMINE est en version 3 (ou plus) utiliser la syntaxe {{{**titre 2}}} a la place de {2{titre 2}2}
105 // (cf https://contrib.spip.net/odt2spip-creation-d-articles-a-partir-de-fichiers#forum435614)
106 if (
107 array_key_exists('TYPOENLUMINEE', $Tplugins)
108 and intval(substr($Tplugins['TYPOENLUMINEE']['version'], 0, 1)) >= 3
109 ) {
110 array_push($a_remplacer, '{2{', '}2}', '{3{', '}3}', '{4{', '}4}', '{5{', '}5}');
111 array_push($remplace, '{{{**', '}}}', '{{{***', '}}}', '{{{****', '}}}', '{{{*****', '}}}');
112 }
113
114 $Tarticle['texte'] = str_replace($a_remplacer, $remplace, $Tarticle['texte']);
115
116 // gerer la conversion des <math>Object X</math> => on delegue a /inc/odt2spip_traiter_mathml.php
117 if (preg_match_all('/<math>(.*?)<\/math>/', $Tarticle['texte'], $match, PREG_PATTERN_ORDER) > 0) {
118 include_spip('inc/odt2spip_traiter_mathml');
119 foreach ($match[1] as $balise) {
120 $fic_content = $rep_dezip . $balise . '/content.xml';
121 // si le fichier /Object X/content.xml ne contient pas du mathML, virer la balise <math>
122 if (substr_count(file_get_contents($fic_content), '<!DOCTYPE math:math') < 1) {
123 $Tarticle['texte'] = str_replace('<math>' . $balise . '</math>', '', $Tarticle['texte']);
124 continue;
125 }
126 // sinon faire la transfo xsl du contenu du fichier pour obtenir le LateX qu'on place dans la balise
127 $Tarticle['texte'] = str_replace($balise, odt2spip_traiter_mathml($fic_content), $Tarticle['texte']);
128 }
129 }
130
131 // virer les sauts de ligne multiples
132 $Tarticle['texte'] = preg_replace('/([\r\n]{2})[ \r\n]*/m', '$1', $Tarticle['texte']);
133
134 // si malgré toutes les magouille xslt la balise <titre> est vide, mettre le nom du fichier odt
135 if ($Tarticle['titre'] == '') {
136 $Tarticle['titre'] = str_replace(array('_', '-', '.odt'), array(' ', ' ', ''), basename($fichier_source));
137 }
138
139 // traiter les images: dans tous les cas il faut les integrer dans la table documents
140 $rep_pictures = $rep_dezip . 'Pictures/';
141
142 // parametres de conversion de taille des images : cm -> px (en 96 dpi puisque c'est ce que semble utiliser Writer)
143 $conversion_image = 96 / 2.54;
144
145 preg_match_all('/<img([;a-zA-Z0-9\.]*)/', $Tarticle['texte'], $match, PREG_PATTERN_ORDER);
146 if (@count($match) > 0) {
147 if (!isset($odt2spip_retailler_img)) {
148 $odt2spip_retailler_img = charger_fonction('odt2spip_retailler_img', 'inc');
149 }
150 if (!isset($ajouter_documents)) {
151 $ajouter_documents = charger_fonction('ajouter_documents', 'action');
152 }
153 $Timages = array();
154 foreach ($match[1] as $ch) {
155 $Tdims = explode(';;;', $ch);
156 $img = $Tdims[0];
157 // si l'extension du fichier image n'est pas jpg/gif/png virer la balise
158 if (!in_array(strtolower(substr($img, -3)), array('jpg', 'gif', 'png'))) {
159 $Tarticle['texte'] = str_replace($ch, '', $Tarticle['texte']);
160 } elseif (file_exists($rep_pictures . $img)) {
161 // retailler l'image en fct des parametres ;;;largeur;;;hauteur;;;
162 $largeur = round(floatval($Tdims[1]) * $conversion_image);
163 $hauteur = round(floatval($Tdims[2]) * $conversion_image);
164 $odt2spip_retailler_img($rep_pictures . $img, $largeur, $hauteur);
165 $id_document = $ajouter_documents(
166 'new',
167 array(
168 array(
169 'tmp_name' => $rep_pictures . $img,
170 'name' => $img,
171 'titrer' => 0,
172 'distant' => 0,
173 'type' => $type
174 ),
175 ),
176 '',
177 0,
178 $type
179 );
180 if (
181 $id_document
182 and $id_img = intval($id_document[0])
183 and $id_img == $id_document[0]
184 ) {
185 $Timages[] = $id_img;
186 // remplacer les noms de fichier par leur id_document dans les <imgLeNomDuFichier.jpg> du texte
187 $Tarticle['texte'] = str_replace($ch, $id_img, $Tarticle['texte']);
188 }
189 }
190 }
191
192 // si les images doivent êtres intégrées en mode document, remplacer la balise <imgXY> par <docXY>
193 if ($type == 'document') {
194 preg_replace('/<img/', '<doc', $Tarticle['texte']);
195 }
196
197 // intégrer l'array des images dans les parametres de l'article
198 // ce qui permettra de faire la liaison lorsqu'on aura l'id_article
199 $Tarticle['Timages'] = $Timages;
200 }
201
202 // encodage des caracteres pour gerer aussi les SPIP 3 en ISO-8859-1
203 // cf https://contrib.spip.net/odt2spip-creation-d-articles-a-partir-de-fichiers#forum466929
204 if ($GLOBALS['meta']['charset'] != 'utf-8') {
205 include_spip('inc/charsets');
206 $Tarticle['texte'] = importer_charset($Tarticle['texte'], 'utf-8');
207 $Tarticle['titre'] = importer_charset($Tarticle['titre'], 'utf-8');
208 }
209
210 return $Tarticle;
211 }