[SPIP] v3.2.7-->v3.2.9
[lhc/web/www.git] / www / ecrire / genie / optimiser.php
1 <?php
2
3 /***************************************************************************\
4 * SPIP, Systeme de publication pour l'internet *
5 * *
6 * Copyright (c) 2001-2019 *
7 * Arnaud Martin, Antoine Pitrou, Philippe Riviere, Emmanuel Saint-James *
8 * *
9 * Ce programme est un logiciel libre distribue sous licence GNU/GPL. *
10 * Pour plus de details voir le fichier COPYING.txt ou l'aide en ligne. *
11 \***************************************************************************/
12
13 /**
14 * Gestion des optimisations de la base de données en cron
15 *
16 * @package SPIP\Core\Genie\Optimiser
17 **/
18
19 if (!defined('_ECRIRE_INC_VERSION')) {
20 return;
21 }
22
23 include_spip('base/abstract_sql');
24 include_spip('inc/config');
25
26 /**
27 * Cron d'optimisation de la base de données
28 *
29 * Tache appelée régulièrement
30 *
31 * @param int $t
32 * Timestamp de la date de dernier appel de la tâche
33 * @return int
34 * Timestamp de la date du prochain appel de la tâche
35 **/
36 function genie_optimiser_dist($t) {
37
38 optimiser_base_une_table();
39 optimiser_base();
40
41 // la date souhaitee pour le tour suivant = apres-demain a 4h du mat ;
42 // sachant qu'on a un delai de 48h, on renvoie aujourd'hui a 4h du mat
43 // avec une periode de flou entre 2h et 6h pour ne pas saturer un hebergeur
44 // qui aurait beaucoup de sites SPIP
45 return -(mktime(2, 0, 0) + rand(0, 3600 * 4));
46 }
47
48 /**
49 * Optimise la base de données
50 *
51 * Supprime les relicats d'éléments qui ont disparu
52 *
53 * @note
54 * Heure de référence pour le garbage collector = 24h auparavant
55 * @param int $attente
56 * Attente entre 2 exécutions de la tache en secondes
57 * @return void
58 **/
59 function optimiser_base($attente = 86400) {
60 optimiser_base_disparus($attente);
61 }
62
63
64 /**
65 * Lance une requête d'optimisation sur une des tables SQL de la
66 * base de données.
67 *
68 * À chaque appel, une nouvelle table est optimisée (la suivante dans la
69 * liste par rapport à la dernière fois).
70 *
71 * @see sql_optimize()
72 *
73 * @global int $GLOBALS ['meta']['optimiser_table']
74 **/
75 function optimiser_base_une_table() {
76
77 $tables = array();
78 $result = sql_showbase();
79
80 // on n'optimise qu'une seule table a chaque fois,
81 // pour ne pas vautrer le systeme
82 // lire http://dev.mysql.com/doc/refman/5.0/fr/optimize-table.html
83 while ($row = sql_fetch($result)) {
84 $tables[] = array_shift($row);
85 }
86
87 spip_log("optimiser_base_une_table ".json_encode($tables), 'genie'._LOG_DEBUG);
88 if ($tables) {
89 $table_op = intval(lire_config('optimiser_table', 0) + 1) % sizeof($tables);
90 ecrire_config('optimiser_table', $table_op);
91 $q = $tables[$table_op];
92 spip_log("optimiser_base_une_table : debut d'optimisation de la table $q", 'genie'._LOG_DEBUG);
93 if (sql_optimize($q)) {
94 spip_log("optimiser_base_une_table : fin d'optimisation de la table $q", 'genie'._LOG_DEBUG);
95 } else {
96 spip_log("optimiser_base_une_table : Pas d'optimiseur necessaire", 'genie'._LOG_DEBUG);
97 }
98 }
99 }
100
101
102 /**
103 * Supprime des enregistrements d'une table SQL dont les ids à supprimer
104 * se trouvent dans les résultats de ressource SQL transmise, sous la colonne 'id'
105 *
106 * @note
107 * Mysql < 4.0 refuse les requetes DELETE multi table
108 * et elles ont une syntaxe differente entre 4.0 et 4.1
109 * On passe donc par un SELECT puis DELETE avec IN
110 *
111 * @param string $table
112 * Nom de la table SQL, exemple : spip_articles
113 * @param string $id
114 * Nom de la clé primaire de la table, exemple : id_article
115 * @param Resource $sel
116 * Ressource SQL issue d'une sélection (sql_select) et contenant une
117 * colonne 'id' ayant l'identifiant de la clé primaire à supprimer
118 * @param string $and
119 * Condition AND à appliquer en plus sur la requête de suppression
120 * @return int
121 * Nombre de suppressions
122 **/
123 function optimiser_sansref($table, $id, $sel, $and = '') {
124 $in = array();
125 while ($row = sql_fetch($sel)) {
126 $in[$row['id']] = true;
127 }
128 sql_free($sel);
129
130 if ($in) {
131 sql_delete($table, sql_in($id, array_keys($in)) . ($and ? " AND $and" : ''));
132 spip_log("optimiser_sansref: Numeros des entrees $id supprimees dans la table $table: " . implode(', ', array_keys($in)), 'genie'._LOG_DEBUG);
133 }
134
135 return count($in);
136 }
137
138
139 /**
140 * Suppression des liens morts entre tables
141 *
142 * Supprime des liens morts entre tables suite à la suppression d'articles,
143 * d'auteurs, etc...
144 *
145 * @note
146 * Maintenant que MySQL 5 a des Cascades on pourrait faire autrement
147 * mais on garde la compatibilité avec les versions précédentes.
148 *
149 * @pipeline_appel optimiser_base_disparus
150 *
151 * @param int $attente
152 * Attente entre 2 exécutions de la tache en secondes
153 * @return void
154 **/
155 function optimiser_base_disparus($attente = 86400) {
156
157 # format = 20060610110141, si on veut forcer une optimisation tout de suite
158 $mydate = sql_quote(date("Y-m-d H:i:s", time() - $attente));
159
160 $n = 0;
161
162 //
163 // Rubriques
164 //
165
166 # les articles qui sont dans une id_rubrique inexistante
167 # attention on controle id_rubrique>0 pour ne pas tuer les articles
168 # specialement affectes a une rubrique non-existante (plugin,
169 # cf. https://core.spip.net/issues/1549 )
170 $res = sql_select("A.id_article AS id",
171 "spip_articles AS A
172 LEFT JOIN spip_rubriques AS R
173 ON A.id_rubrique=R.id_rubrique",
174 "A.id_rubrique > 0
175 AND R.id_rubrique IS NULL
176 AND A.maj < $mydate");
177
178 $n += optimiser_sansref('spip_articles', 'id_article', $res);
179
180 // les articles a la poubelle
181 sql_delete("spip_articles", "statut='poubelle' AND maj < $mydate");
182
183 //
184 // Auteurs
185 //
186
187 include_spip('action/editer_liens');
188 // optimiser les liens de tous les auteurs vers des objets effaces
189 // et depuis des auteurs effaces
190 $n += objet_optimiser_liens(array('auteur' => '*'), '*');
191
192 # effacer les auteurs poubelle qui ne sont lies a rien
193 $res = sql_select("A.id_auteur AS id",
194 "spip_auteurs AS A
195 LEFT JOIN spip_auteurs_liens AS L
196 ON L.id_auteur=A.id_auteur",
197 "L.id_auteur IS NULL
198 AND A.statut='5poubelle' AND A.maj < $mydate");
199
200 $n += optimiser_sansref('spip_auteurs', 'id_auteur', $res);
201
202 # supprimer les auteurs 'nouveau' qui n'ont jamais donne suite
203 # au mail de confirmation (45 jours pour repondre, ca devrait suffire)
204 sql_delete("spip_auteurs", "statut='nouveau' AND maj < " . sql_quote(date('Y-m-d', time() - 45 * 24 * 3600)));
205
206 /**
207 * Permet aux plugins de compléter l'optimisation suite aux éléments disparus
208 *
209 * L'index 'data' est un entier indiquant le nombre d'optimisations
210 * qui ont été réalisées (par exemple le nombre de suppressions faites)
211 * et qui doit être incrémenté par les fonctions
212 * utilisant ce pipeline si elles suppriment des éléments.
213 *
214 * @pipeline_appel optimiser_base_disparus
215 */
216 $n = pipeline('optimiser_base_disparus', array(
217 'args' => array(
218 'attente' => $attente,
219 'date' => $mydate
220 ),
221 'data' => $n
222 ));
223
224
225 spip_log("optimiser_base_disparus : {$n} lien(s) mort(s)", 'genie'._LOG_DEBUG);
226 }