3 /***************************************************************************\
4 * SPIP, Systeme de publication pour l'internet *
6 * Copyright (c) 2001-2017 *
7 * Arnaud Martin, Antoine Pitrou, Philippe Riviere, Emmanuel Saint-James *
9 * Ce programme est un logiciel libre distribue sous licence GNU/GPL. *
10 * Pour plus de details voir le fichier COPYING.txt ou l'aide en ligne. *
11 \***************************************************************************/
14 * Gestion des recherches
16 * @package SPIP\Core\Recherche
19 if (!defined('_ECRIRE_INC_VERSION')) {
25 * Donne la liste des champs/tables où l'on sait chercher / remplacer
26 * avec un poids pour le score
28 * Utilise l'information `rechercher_champs` sur la déclaration
29 * des objets éditoriaux.
31 * @pipeline_appel rechercher_liste_des_champs
32 * @uses lister_tables_objets_sql()
34 * @return array Couples (type d'objet => Couples (champ => score))
36 function liste_des_champs() {
38 if (is_null($liste)) {
40 // recuperer les tables_objets_sql declarees
41 include_spip('base/objets');
42 $tables_objets = lister_tables_objets_sql();
43 foreach ($tables_objets as $t => $infos) {
44 if ($infos['rechercher_champs']) {
45 $liste[$infos['type']] = $infos['rechercher_champs'];
48 // puis passer dans le pipeline
49 $liste = pipeline('rechercher_liste_des_champs', $liste);
56 // Recherche des auteurs et mots-cles associes
57 // en ne regardant que le titre ou le nom
58 // http://code.spip.net/@liste_des_jointures
59 function liste_des_jointures() {
61 if (is_null($liste)) {
63 // recuperer les tables_objets_sql declarees
64 include_spip('base/objets');
65 $tables_objets = lister_tables_objets_sql();
66 foreach ($tables_objets as $t => $infos) {
67 if ($infos['rechercher_jointures']) {
68 $liste[$infos['type']] = $infos['rechercher_jointures'];
71 // puis passer dans le pipeline
72 $liste = pipeline('rechercher_liste_des_jointures', $liste);
78 function expression_recherche($recherche, $options) {
79 // ne calculer qu'une seule fois l'expression par hit
80 // (meme si utilisee dans plusieurs boucles)
81 static $expression = array();
82 $key = serialize(array($recherche, $options['preg_flags']));
83 if (isset($expression[$key])) {
84 return $expression[$key];
87 $u = $GLOBALS['meta']['pcre_u'];
88 if ($u and strpos($options['preg_flags'], $u) === false) {
89 $options['preg_flags'] .= $u;
91 include_spip('inc/charsets');
92 $recherche = trim($recherche);
95 if (substr($recherche, 0, 1) == '/' and substr($recherche, -1, 1) == '/' and strlen($recherche) > 2) {
97 $recherche_trans = translitteration($recherche);
98 $preg = $recherche_trans . $options['preg_flags'];
101 // s'il y a plusieurs mots il faut les chercher tous : oblige REGEXP,
102 // sauf ceux de moins de 4 lettres (on supprime ainsi 'le', 'les', 'un',
105 // attention : plusieurs mots entre guillemets sont a rechercher tels quels
106 $recherche_trans = $recherche_mod = $recherche;
108 // les expressions entre " " sont un mot a chercher tel quel
109 // -> on remplace les espaces par un \x1 et on enleve les guillemets
110 if (preg_match(',["][^"]+["],Uims', $recherche_mod, $matches)) {
111 foreach ($matches as $match) {
112 $word = preg_replace(",\s+,Uims", "\x1", $match);
113 $word = trim($word, '"');
114 $recherche_mod = str_replace($match, $word, $recherche_mod);
118 if (preg_match(",\s+," . $u, $recherche_mod)) {
121 $recherche_inter = '|';
122 $recherche_mots = explode(' ', $recherche_mod);
123 $min_long = defined('_RECHERCHE_MIN_CAR') ? _RECHERCHE_MIN_CAR
: 4;
124 foreach ($recherche_mots as $mot) {
125 if (strlen($mot) >= $min_long) {
126 // echapper les caracteres de regexp qui sont eventuellement dans la recherche
127 $recherche_inter .= preg_quote($mot) . ' ';
130 $recherche_inter = str_replace("\x1", '\s', $recherche_inter);
132 // mais on cherche quand même l'expression complète, même si elle
133 // comporte des mots de moins de quatre lettres
134 $recherche = rtrim(preg_quote($recherche) . preg_replace(',\s+,' . $u, '|', $recherche_inter), '|');
135 $recherche_trans = translitteration($recherche);
138 $preg = '/' . str_replace('/', '\\/', $recherche_trans) . '/' . $options['preg_flags'];
141 // Si la chaine est inactive, on va utiliser LIKE pour aller plus vite
142 // ou si l'expression reguliere est invalide
144 or (@preg_match
($preg, '') === false)
147 $u = $GLOBALS['meta']['pcre_u'];
149 // echapper les % et _
150 $q = str_replace(array('%', '_'), array('\%', '\_'), trim($recherche));
152 // eviter les parentheses et autres caractères qui interferent avec pcre par la suite (dans le preg_match_all) s'il y a des reponses
153 $recherche = preg_quote($recherche, '/');
154 $recherche_trans = translitteration($recherche);
155 $recherche_mod = $recherche_trans;
157 // les expressions entre " " sont un mot a chercher tel quel
158 // -> on remplace les espaces par un _ et on enleve les guillemets
159 // corriger le like dans le $q
160 if (preg_match(',["][^"]+["],Uims', $q, $matches)) {
161 foreach ($matches as $match) {
162 $word = preg_replace(",\s+,Uims", "_", $match);
163 $word = trim($word, '"');
164 $q = str_replace($match, $word, $q);
167 // corriger la regexp
168 if (preg_match(',["][^"]+["],Uims', $recherche_mod, $matches)) {
169 foreach ($matches as $match) {
170 $word = preg_replace(",\s+,Uims", "[\s]", $match);
171 $word = trim($word, '"');
172 $recherche_mod = str_replace($match, $word, $recherche_mod);
177 . preg_replace(",\s+," . $u, "%", $q)
181 $preg = '/' . preg_replace(",\s+," . $u, ".+", trim($recherche_mod)) . '/' . $options['preg_flags'];
184 $q = sql_quote(trim($recherche, '/'));
187 // tous les caracteres transliterables de $q sont remplaces par un joker
188 // permet de matcher en SQL meme si on est sensible aux accents (SQLite)
190 for ($i = 0; $i < spip_strlen($q); $i++
) {
191 $char = spip_substr($q, $i, 1);
193 and $char_t = translitteration($char)
194 and $char_t !== $char
196 $q_t = str_replace($char, $is_preg ?
"." : "_", $q_t);
202 // fix : SQLite 3 est sensible aux accents, on jokerise les caracteres
203 // les plus frequents qui peuvent etre accentues
204 // (oui c'est tres dicustable...)
205 if (isset($GLOBALS['connexions'][$options['serveur'] ?
$options['serveur'] : 0]['type'])
206 and strncmp($GLOBALS['connexions'][$options['serveur'] ?
$options['serveur'] : 0]['type'], 'sqlite', 6) == 0
208 $q_t = strtr($q, "aeuioc", $is_preg ?
"......" : "______");
209 // si il reste au moins un char significatif...
210 if (preg_match(",[^'%_.],", $q_t)) {
215 return $expression[$key] = array($methode, $q, $preg);
221 * Effectue une recherche sur toutes les tables de la base de données
223 * @uses liste_des_champs()
224 * @uses inc_recherche_to_array_dist()
226 * @param string $recherche
227 * Le terme de recherche
228 * @param null|array|string $tables
229 * - null : toutes les tables acceptant des recherches
230 * - array : liste des tables souhaitées
231 * - string : une chaîne listant les tables souhaitées, séparées par des virgules (préférer array cependant)
232 * @param array $options {
233 * @var $toutvoir pour éviter autoriser(voir)
234 * @var $flags pour éviter les flags regexp par défaut (UimsS)
235 * @var $champs pour retourner les champs concernés
236 * @var $score pour retourner un score
238 * @param string $serveur
241 function recherche_en_base($recherche = '', $tables = null, $options = array(), $serveur = '') {
242 include_spip('base/abstract_sql');
244 if (!is_array($tables)) {
245 $liste = liste_des_champs();
247 if (is_string($tables)
251 foreach (explode(',', $tables) as $t) {
253 if (isset($liste[$t])) {
254 $toutes[$t] = $liste[$t];
264 if (!strlen($recherche) or !count($tables)) {
268 include_spip('inc/autoriser');
270 // options par defaut
271 $options = array_merge(array(
272 'preg_flags' => 'UimsS',
277 'jointures' => false,
278 'serveur' => $serveur
285 // Utiliser l'iterateur (DATA:recherche)
286 // pour recuperer les couples (id_objet, score)
287 // Le resultat est au format {
288 // id1 = { 'score' => x, attrs => { } },
289 // id2 = { 'score' => x, attrs => { } },
292 foreach ($tables as $table => $champs) {
293 # lock via memoization, si dispo
294 if (function_exists('cache_lock')) {
295 cache_lock($lock = 'recherche ' . $table . ' ' . $recherche);
300 // TODO: ici plutot charger un iterateur via l'API iterateurs
301 include_spip('inc/recherche_to_array');
302 $to_array = charger_fonction('recherche_to_array', 'inc');
303 $results[$table] = $to_array($recherche,
304 array_merge($options, array('table' => $table, 'champs' => $champs))
306 ##var_dump($results[$table]);
309 spip_log("recherche $table ($recherche) : " . count($results[$table]) . " resultats " . spip_timer('rech'),
321 // Effectue une recherche sur toutes les tables de la base de donnees
322 // http://code.spip.net/@remplace_en_base
323 function remplace_en_base($recherche = '', $remplace = null, $tables = null, $options = array()) {
324 include_spip('inc/modifier');
326 // options par defaut
327 $options = array_merge(array(
328 'preg_flags' => 'UimsS',
329 'toutmodifier' => false
333 $options['champs'] = true;
336 if (!is_array($tables)) {
337 $tables = liste_des_champs();
340 $results = recherche_en_base($recherche, $tables, $options);
342 $preg = '/' . str_replace('/', '\\/', $recherche) . '/' . $options['preg_flags'];
344 foreach ($results as $table => $r) {
345 $_id_table = id_table_objet($table);
346 foreach ($r as $id => $x) {
347 if ($options['toutmodifier']
348 or autoriser('modifier', $table, $id)
351 foreach ($x['champs'] as $key => $val) {
352 if ($key == $_id_table) {
355 $repl = preg_replace($preg, $remplace, $val);
357 $modifs[$key] = $repl;
361 objet_modifier_champs($table, $id,
363 'champs' => array_keys($modifs),