www/plugins/rss_article_3_0/genie/rssarticle_copie.php

   1 <?php
   2 /**
   3  * Plugin RSS article pour Spip 3.0
   4  * Licence GPL
   5  *
   6  *
   7  */
   8
   9 // TODO
  10 // - gerer les mots-clés hors enclosure ?
  11 include_spip("inc/mail");
  12 include_spip('inc/filtres');
  13 include_spip('inc/distant');
  14 include_spip('inc/chercher_logo');
  15 include_spip('inc/rubriques');
  16 include_spip('inc/config');
  17
  18 function genie_rssarticle_copie_dist($t){
  19
  20         // configuration (ou valeurs par defaut)
  21         if (lire_config('rssarticle/import_statut')=="publie")
  22                 $import_statut="publie";
  23         else
  24                 $import_statut="prop";
  25         if (lire_config('rssarticle/mode')=="auto")
  26                 $mode_auto=true;
  27         else
  28                 $mode_auto=false;
  29         if (lire_config('rssarticle/email_alerte')=="on")
  30                 $email_alerte=true;
  31         else
  32                 $email_alerte=false;
  33         if (lire_config('rssarticle/copie_logo')=="on")
  34                 $copie_logo=true;
  35         else
  36                 $copie_logo=false;
  37         if (lire_config('rssarticle/html2spip')=="on")
  38                 $html2spip=true;
  39         else
  40                 $html2spip=false;
  41         $email_suivi = lire_config('rssarticle/email_suivi');
  42
  43         // autres valeurs
  44         $accepter_forum =       substr($GLOBALS['meta']['forums_publics'],0,3);
  45
  46         // principe de pile:
  47         // on boucle sur les derniers articles syndiques pour les retirer ensuite
  48         // bourrin voir les requetes avec jointure du Miroir ou du site Rezo
  49         $log = "";
  50         $log_c = 0;
  51
  52         // boucle sur les sites publies
  53         if ($mode_auto)
  54                 $u = sql_select("id_syndic,id_rubrique,id_secteur","spip_syndic","statut='publie'");     // tous
  55         else
  56                 $u = sql_select("id_syndic,id_rubrique,id_secteur","spip_syndic","statut='publie' AND rssarticle='oui'");
  57
  58         while ($b = sql_fetch($u)) {
  59                 $id_syndic = (int) $b['id_syndic'];
  60                 $id_rubrique = (int) $b['id_rubrique'];
  61                 $id_secteur = (int) $b['id_secteur'];
  62
  63                 // sur chaque site copie les derniers syndication
  64                 $s = sql_select("*", "spip_syndic_articles", "statut='publie' AND id_syndic='$id_syndic'","","maj DESC","10");  // par flot de 10 articles / site pour limiter la charge
  65                 while ($a = sql_fetch($s)) {
  66                         $titre =        $a['titre'];
  67                         $url =  $a['url'];
  68                         $id_syndic_article = $a['id_syndic_article'];
  69
  70                         // article avec mm titre existe ? (test doublons sur l'url plutot que sr le titre)
  71                         if (!$id_article = sql_getfetsel("id_article","spip_articles","url_site=".sql_quote($url))) {
  72                                 $texte = $a['descriptif'];
  73                                 //traitement pour syntaxe SPIP
  74                                 if($html2spip)
  75                                                         $texte = html2spip($texte);
  76                                 $lang   = $a['lang'];
  77                                 $url     = $a['url'];
  78                                 $tags = $a['tags'];
  79                                 $lsdate = $a['date'];
  80
  81                                 if ($lang=="")
  82                                         $lang = $GLOBALS['spip_lang'];
  83
  84                                 // cas particulier:
  85                                 // site multilingue avec la configuration: 1 lang par rubrique
  86                                 // on force l'article a avoir la langue de la rubrique ds lequel il est importee(pour omaidi)
  87                                 if ($GLOBALS['meta']['multi_rubriques']=='oui') {
  88                                         $s_lang = sql_select("lang", "spip_rubriques", "id_rubrique=$id_rubrique");
  89                                         while ($a_lang = sql_fetch($s_lang))
  90                                                 $lang = $a_lang['lang'];
  91                                 }
  92
  93                                 //$lsdate = date('Y-m-d H:i:s');
  94                                 // creation de l'article
  95                                 $id_article = sql_insertq( 'spip_articles', array(
  96                                                                                                                 'titre'=>$titre, 'id_rubrique'=>$id_rubrique,
  97                                                                                                                 'texte'=>$texte, 'statut'=>$import_statut, 'id_secteur'=>$id_secteur,
  98                                                                                                                 'date'=> $lsdate, 'accepter_forum'=>$accepter_forum, 'lang'=>$lang, 'url_site'=>$url));
  99
 100                                 // lier article et site
 101                                 sql_insertq( 'spip_articles_syndic', array('id_article'=>$id_article, 'id_syndic'=>$id_syndic));
 102
 103                                 // gestion auteur
 104                                 $auteurs= explode(", ",$a['lesauteurs']);
 105                                 foreach ($auteurs as $k => $auteur) {
 106                                                  if ($current_id_auteur = rssarticle_get_id_auteur($auteur))
 107                                                                         sql_insertq( 'spip_auteurs_liens', array('id_auteur'=>$current_id_auteur, 'id_objet'=>$id_article, 'objet'=>'article'));
 108                                 }
 109
 110                                 // tags a convertir en documents distants
 111                                 $doc_distants = extraire_enclosures($tags);
 112                                 foreach ($doc_distants as $k=>$doc_distant) {
 113                                         $infos = recuperer_infos_distantes($doc_distant);
 114                                         if ($infos['extension']) {
 115                                                 $ext            = $infos['extension'];
 116                                                 $taille = $infos['tailles'];
 117                                                 $inclus = sql_getfetsel("inclus", "spip_types_documents", "extension=" . sql_quote($ext) . " AND upload='oui'");        // extension autorisee ?
 118                                                 if ($inclus) {
 119                                                         $id_document = sql_insertq( 'spip_documents', array(
 120                                                                                 'extension'=>$ext,
 121                                                                                 'date'=> $lsdate,
 122                                                                                 'fichier'=> $doc_distant,
 123                                                                                 'taille'=> $taille,
 124                                                                                 'mode' => 'document',
 125                                                                                 'distant' => 'oui'));
 126
 127                                                         sql_insertq( 'spip_documents_liens', array(
 128                                                                                         'id_document' =>$id_document,
 129                                                                                         'id_objet'=> $id_article,
 130                                                                                         'objet'=> 'article',
 131                                                                                         'vu'=> 'non'));
 132                                                 }
 133                                         }
 134                                 }
 135
 136                                 // logo
 137                                 if ($copie_logo) {
 138                                         if ($logo_site = inc_chercher_logo_dist($id_syndic,"id_syndic")) {
 139                                                 $logo_article = "arton$id_article.".$logo_site[3];
 140                                                 @copy($logo_site[0],_DIR_LOGOS."$logo_article");
 141                                         }
 142                                 }
 143
 144                                 $log_c++;
 145                                 $log .= "\n - $titre";
 146
 147                                 // on "depublie" l'article syndique qui vient d'etre copie
 148                                 sql_update("spip_syndic_articles", array('statut' => '"refuse"'), "id_syndic_article=".intval($id_syndic_article));
 149
 150                                 // Mise à jour des dates de rubriques après création d'un article dedans
 151                                 if ($id_article) {
 152                                         if (function_exists('calculer_rubriques'))
 153                                                 calculer_rubriques();
 154                                         if (function_exists('calculer_langues_rubriques'))
 155                                                 calculer_langues_rubriques();
 156                                         if (function_exists('propager_les_secteurs'))
 157                                                 propager_les_secteurs();
 158                                 }
 159                         }       // test doublons
 160                 }
 161         } // FIN PILE
 162
 163         // log et alerte email
 164         $log .= "\n\n---------\nPlugin Copie RSS en Articles: $log_c articles copies\n";
 165         spip_log($log);
 166         $log .= $GLOBALS['meta']['adresse_site']."/ecrire/?exec=accueil";
 167
 168         if ($email_alerte && $email_suivi !="" && $log_c > 0)
 169                 envoyer_mail($email_suivi,"Copie RSS en Articles", $log);
 170         // maintenance generale
 171         // mode auto: on efface les syndic_articles de plus de 2 mois pour soulager le systeme (cf genie/syndic)
 172         // attention: on efface sur l'ensemble des sites syndiques ss tenir compte de l'option
 173         if ($mode_auto) sql_delete('spip_syndic_articles', "maj < DATE_SUB(NOW(), INTERVAL 2 MONTH) AND date < DATE_SUB(NOW(), INTERVAL 2 MONTH)");
 174
 175         return 1;
 176 }
 177
 178
 179 //
 180 // recupere id d'un auteur selon son nom sinon le creer
 181 function rssarticle_get_id_auteur($nom) {
 182         if (trim($nom)=="")
 183                 return false;
 184
 185         if ($id_auteur = sql_getfetsel("id_auteur","spip_auteurs","nom=".sql_quote($nom)))
 186                 return $id_auteur;
 187
 188         // auteur inconnu, on le cree ...
 189         return sql_insertq('spip_auteurs',array('nom'=>$nom,'statut'=>'1comite'));
 190 }
 191
 192 //
 193 // extraire les documents taggues enclosure
 194 // voir http://doc.spip.org/@afficher_enclosures
 195 function extraire_enclosures($tags) {
 196         $s = array();
 197         foreach (extraire_balises($tags, 'a') as $tag) {
 198                 if (extraire_attribut($tag, 'rel') == 'enclosure'
 199                 AND $t = extraire_attribut($tag, 'href')) {
 200                         $s[] = $t;
 201                 }
 202         }
 203         return $s;
 204 }
 205
 206 /**
 207  *
 208  * Nettoyer l'utf-8 et ses accents
 209  *
 210  */
 211 function clean_utf8($t) {
 212         if (!preg_match('!\S!u', $t))
 213                 $t = preg_replace_callback(',&#x([0-9a-f]+);,i', 'utf8_do', utf8_encode(utf8_decode($t)));
 214         return $t;
 215 }
 216
 217
 218 //passe le html en SPIP
 219 //repris de memo.php, merci
 220
 221 function html2spip($lapage){
 222         $lapage=clean_utf8($lapage);
 223
 224         // remettre les double quotes casé par texte_backend
 225         $lapage = str_replace('&#034;','"',$lapage);
 226
 227         // PRETRAITEMENTS
 228         $lapage = str_replace("\n\r", "\r", $lapage); // echapper au greedyness de preg_replace
 229         $lapage = str_replace("\n", "\r", $lapage);
 230
 231         // itals
 232         $lapage = preg_replace(",<(i|em)( [^>\r]*)?".">(.+)</\\1>,Uims", "{\\3}", $lapage);
 233
 234         // gras (pas de {{ pour eviter tout conflit avec {)
 235         $lapage = preg_replace(",<(b|h[4-6])( [^>]*)?".">(.+)</\\1>,Uims", "@@b@@\\3@@/b@@", $lapage);
 236         $lapage = preg_replace(",<strong( [^>]*)?".">(.+)</strong>,Uims", "@@b@@\\2@@/b@@", $lapage);
 237
 238         // entites
 239         include_spip('inc/charsets');
 240         $lapage = html2unicode($lapage, true); //secure?
 241
 242         // liens avec possibilités de non fermeture du tag
 243         $lapage = preg_replace(",<a[ \t\n\r][^<>]*href=[^<>]*(http[^<>]*)[^<>]>(.*?)<,uims", "[\\2->\\1] <", $lapage);
 244
 245         // images (cf ressource)
 246         $lapage = preg_replace(",<img[ \t\n\r][^<>]*src=[^<>]*(http[^<>'\"]*)[^<>]*>,uims","[img]\\1[//img]", $lapage);
 247
 248         // intertitres
 249         $lapage = preg_replace(",<(h[1-3])( [^>]*)?".">(.+)</\\1>,Uims", "\r{{{ \\3 }}}\r", $lapage);
 250         // tableaux
 251         $lapage = preg_replace(",<tr( [^>]*)?".">,Uims", "<br />\r", $lapage);
 252         $lapage = preg_replace(",<t[hd]( [^>]*)?".">,Uims", " | ", $lapage);
 253
 254         // POST TRAITEMENT
 255         $lapage = str_replace("\r", "\n", $lapage);
 256
 257         // SUPPRIME LES TAGS
 258         if (eregi("<title.*>(.*)</title>", $lapage, $regs))
 259         $titre = textebrut($regs[1]);
 260         $lapage = textebrut($lapage);
 261
 262         // Suite tableaux
 263         $lapage = preg_replace(",\n[| ]+\n,", "", $lapage);
 264         $lapage = preg_replace(",\n[|].+?[|].+?[|].+,", "\\0|\r", $lapage);
 265
 266         // retablir les gras
 267         $lapage = preg_replace(",@@b@@(.*)@@/b@@,Uims","{{\\1}}",$lapage);
 268
 269         //retablir les images pour les lire avec le plugin ressource
 270         $lapage = preg_replace('#\[img\](.*)\[\//img\]#Umis', "<$1>", $lapage);
 271
 272         //nettoyer les "] qui dépassent parfois
 273         $lapage = preg_replace(",\"\],uims", "]", $lapage);
 274
 275         return $lapage;
 276 }
 277
 278 ?>