www/plugins/odt2spip_32/inc/odt2spip_generer_sortie.php

   1 <?php
   2 /**
   3  * Créer un article à partir d'un fichier au format odt
   4  *
   5  * @author cy_altern
   6  * @license GNU/LGPL
   7  *
   8  * @package plugins
   9  * @subpackage odt2spip
  10  * @category import
  11  *
  12  *
  13  */
  14
  15 if (!defined('_ECRIRE_INC_VERSION')) {
  16         return;
  17 }
  18
  19 /**
  20  * Création de l'Array contenant les paramètres du futur article
  21  *
  22  * Le fichier content.xml a été extrait de l'archive .odt, et placé dans le dossier
  23  * temporaire propre à l'utilisateur courant. Un premier traitement est effectué
  24  * par cette fonction pour qu'il soit finalement transformé en texte utilisant les
  25  * balises SPIP. On tient compte de la présence des plugins enluminure_typo et
  26  * intertitre_enrichis. Les images sont extraites du document .odt et sont prêtes
  27  * à être insérées dans le futur article SPIP.
  28  *
  29  * @param string $rep_dezip Répertoire où est dezippé le fichier odt
  30  * @param string $fichier_source Chemin du fichier source (permet d’affecter un titre si le document n’en a pas trouvé)
  31  * @return array Couples (nom de champ d’article => valeur)
  32  * @throws \Exception
  33  */
  34 function inc_odt2spip_generer_sortie($rep_dezip, $fichier_source = '') {
  35         // variables en dur pour xml en entree et xslt utilisee
  36         $xml_entre = $rep_dezip . 'content.xml';  // chemin du fichier xml a lire
  37         $xslt_texte = _DIR_PLUGIN_ODT2SPIP . 'inc/odt2spip.xsl'; // chemin de la xslt a utiliser pour le texte
  38
  39         // determiner si le plugin enluminure_typo ou intertitres_enrichis est present & actif
  40         include_spip('inc/plugin');
  41         $Tplugins = liste_plugin_actifs();
  42         $intertitres_riches = (
  43                 (array_key_exists('TYPOENLUMINEE', $Tplugins) or array_key_exists('INTERTITRESTDM', $Tplugins))
  44                 ? 'oui'
  45                 : 'non'
  46         );
  47
  48         // si il n'existe pas de titre:h dans le doc, on parametre ici la longueur max du paragraphe utilise pour remplacer
  49         $nb_caracteres_titre = 50;
  50
  51         // faut il mettre les images en mode document?
  52         $type = (_request('mode_image') and _request('mode_image') == 'document') ? 'document' : 'image';
  53         $ModeImages = ($type == 'document' ? 'doc' : 'img');
  54
  55         // récupérer la langue de publication + verifier la valeur envoyée
  56         $Tlangues = explode(',', $GLOBALS['meta']['langues_proposees']);
  57         $LanguePublication = (
  58                 in_array(_request('lang_publi'), $Tlangues)
  59                 ? _request('lang_publi')
  60                 : $GLOBALS['meta']['langue_site']
  61         );
  62
  63         // date pour les champs date et date_modif
  64         $date_jour = date('Y-m-d H:i:s');
  65
  66         // appliquer la transformation XSLT sur le fichier content.xml
  67         // on est php5: utiliser les fonctions de la classe XSLTProcessor
  68         // verifier que l'extension xslt est active
  69         if (!class_exists('XSLTProcessor')) {
  70                 throw new \Exception(_T('odtspip:err_extension_xslt'));
  71         }
  72         $proc = new XSLTProcessor();
  73
  74         // passage des parametres a la xslt
  75         $proc->setParameter(null, 'IntertitresRiches', $intertitres_riches);
  76
  77         $xml = new DOMDocument();
  78         $xml->load($xml_entre);
  79         $xsl = new DOMDocument();
  80         $xsl->load($xslt_texte);
  81         $proc->importStylesheet($xsl); // attachement des regles xsl
  82
  83         // lancer le parseur
  84         if (!$xml_sortie = $proc->transformToXml($xml)) {
  85                 throw new \Exception(_T('odtspip:err_transformation_xslt'));
  86         }
  87
  88         // construire l'array des parametres de l'article
  89         preg_match('/<titre>(.*?)<\/titre>/', $xml_sortie, $t);
  90         $Tarticle['titre'] = $t[1];
  91         preg_match('/<texte>(.*?)<\/texte>/s', $xml_sortie, $a);
  92         $Tarticle['texte'] = $a[1];
  93         $Tarticle['date_redac'] = '0000-00-00 00:00:00';
  94         $Tarticle['date'] = $Tarticle['date_modif'] = $date_jour;
  95         $Tarticle['lang'] = $LanguePublication;
  96         $Tarticle['statut'] = 'prop';
  97         $Tarticle['accepter_forum'] = 'non';
  98
  99         // traitements complementaires du texte de l'article
 100         // remplacer les &gt; et &lt;
 101         $a_remplacer = array('&#60;', '&#62;', '&lt;', '&gt;', '"');
 102         $remplace = array('<', '>', '<', '>', "'");
 103
 104         // si plugin TYPOENLUMINE est en version 3 (ou plus) utiliser la syntaxe {{{**titre 2}}} a la place de {2{titre 2}2}
 105         // (cf https://contrib.spip.net/odt2spip-creation-d-articles-a-partir-de-fichiers#forum435614)
 106         if (
 107                 array_key_exists('TYPOENLUMINEE', $Tplugins)
 108                 and intval(substr($Tplugins['TYPOENLUMINEE']['version'], 0, 1)) >= 3
 109         ) {
 110                 array_push($a_remplacer, '{2{', '}2}', '{3{', '}3}', '{4{', '}4}', '{5{', '}5}');
 111                 array_push($remplace, '{{{**', '}}}', '{{{***', '}}}', '{{{****', '}}}', '{{{*****', '}}}');
 112         }
 113
 114         $Tarticle['texte'] = str_replace($a_remplacer, $remplace, $Tarticle['texte']);
 115
 116         // gerer la conversion des <math>Object X</math> => on delegue a /inc/odt2spip_traiter_mathml.php
 117         if (preg_match_all('/<math>(.*?)<\/math>/', $Tarticle['texte'], $match, PREG_PATTERN_ORDER) > 0) {
 118                 include_spip('inc/odt2spip_traiter_mathml');
 119                 foreach ($match[1] as $balise) {
 120                         $fic_content = $rep_dezip . $balise . '/content.xml';
 121                         // si le fichier /Object X/content.xml ne contient pas du mathML, virer la balise <math>
 122                         if (substr_count(file_get_contents($fic_content), '<!DOCTYPE math:math') < 1) {
 123                                 $Tarticle['texte'] = str_replace('<math>' . $balise . '</math>', '', $Tarticle['texte']);
 124                                 continue;
 125                         }
 126                         // sinon faire la transfo xsl du contenu du fichier pour obtenir le LateX qu'on place dans la balise
 127                         $Tarticle['texte'] = str_replace($balise, odt2spip_traiter_mathml($fic_content), $Tarticle['texte']);
 128                 }
 129         }
 130
 131         // virer les sauts de ligne multiples
 132         $Tarticle['texte'] = preg_replace('/([\r\n]{2})[ \r\n]*/m', '$1', $Tarticle['texte']);
 133
 134         // si malgré toutes les magouille xslt la balise  <titre> est vide, mettre le nom du fichier odt
 135         if ($Tarticle['titre'] == '') {
 136                 $Tarticle['titre'] = str_replace(array('_', '-', '.odt'), array(' ', ' ', ''), basename($fichier_source));
 137         }
 138
 139         // traiter les images: dans tous les cas il faut les integrer dans la table documents
 140         $rep_pictures = $rep_dezip . 'Pictures/';
 141
 142         // parametres de conversion de taille des images : cm -> px (en 96 dpi puisque c'est ce que semble utiliser Writer)
 143         $conversion_image = 96 / 2.54;
 144
 145         preg_match_all('/<img([;a-zA-Z0-9\.]*)/', $Tarticle['texte'], $match, PREG_PATTERN_ORDER);
 146         if (@count($match) > 0) {
 147                 if (!isset($odt2spip_retailler_img)) {
 148                         $odt2spip_retailler_img = charger_fonction('odt2spip_retailler_img', 'inc');
 149                 }
 150                 if (!isset($ajouter_documents)) {
 151                         $ajouter_documents = charger_fonction('ajouter_documents', 'action');
 152                 }
 153                 $Timages = array();
 154                 foreach ($match[1] as $ch) {
 155                         $Tdims = explode(';;;', $ch);
 156                         $img = $Tdims[0];
 157                         // si l'extension du fichier image n'est pas jpg/gif/png virer la balise
 158                         if (!in_array(strtolower(substr($img, -3)), array('jpg', 'gif', 'png'))) {
 159                                 $Tarticle['texte'] = str_replace($ch, '', $Tarticle['texte']);
 160                         } elseif (file_exists($rep_pictures . $img)) {
 161                                 // retailler l'image en fct des parametres ;;;largeur;;;hauteur;;;
 162                                 $largeur = round(floatval($Tdims[1]) * $conversion_image);
 163                                 $hauteur = round(floatval($Tdims[2]) * $conversion_image);
 164                                 $odt2spip_retailler_img($rep_pictures . $img, $largeur, $hauteur);
 165                                 $id_document = $ajouter_documents(
 166                                         'new',
 167                                         array(
 168                                                 array(
 169                                                         'tmp_name' => $rep_pictures . $img,
 170                                                         'name' => $img,
 171                                                         'titrer' => 0,
 172                                                         'distant' => 0,
 173                                                         'type' => $type
 174                                                 ),
 175                                         ),
 176                                         '',
 177                                         0,
 178                                         $type
 179                                 );
 180                                 if (
 181                                         $id_document
 182                                         and $id_img = intval($id_document[0])
 183                                         and $id_img == $id_document[0]
 184                                 ) {
 185                                         $Timages[] = $id_img;
 186                                         // remplacer les noms de fichier par leur id_document dans les <imgLeNomDuFichier.jpg> du texte
 187                                         $Tarticle['texte'] = str_replace($ch, $id_img, $Tarticle['texte']);
 188                                 }
 189                         }
 190                 }
 191
 192                 // si les images doivent êtres intégrées en mode document, remplacer la balise <imgXY> par <docXY>
 193                 if ($type == 'document') {
 194                         preg_replace('/<img/', '<doc', $Tarticle['texte']);
 195                 }
 196
 197                 // intégrer l'array des images dans les parametres de l'article
 198                 // ce qui permettra de faire la liaison lorsqu'on aura l'id_article
 199                 $Tarticle['Timages'] = $Timages;
 200         }
 201
 202         // encodage des caracteres pour gerer aussi les SPIP 3 en ISO-8859-1
 203         // cf https://contrib.spip.net/odt2spip-creation-d-articles-a-partir-de-fichiers#forum466929
 204         if ($GLOBALS['meta']['charset'] != 'utf-8') {
 205                 include_spip('inc/charsets');
 206                 $Tarticle['texte'] = importer_charset($Tarticle['texte'], 'utf-8');
 207                 $Tarticle['titre'] = importer_charset($Tarticle['titre'], 'utf-8');
 208         }
 209
 210         return $Tarticle;
 211 }