[SPIP] ~spip v3.2.0-->v3.2.1
[lhc/web/www.git] / www / ecrire / exec / valider_xml.php
1 <?php
2
3 /***************************************************************************\
4 * SPIP, Systeme de publication pour l'internet *
5 * *
6 * Copyright (c) 2001-2017 *
7 * Arnaud Martin, Antoine Pitrou, Philippe Riviere, Emmanuel Saint-James *
8 * *
9 * Ce programme est un logiciel libre distribue sous licence GNU/GPL. *
10 * Pour plus de details voir le fichier COPYING.txt ou l'aide en ligne. *
11 \***************************************************************************/
12
13 /**
14 * Gestion de la validation XML selon une DTD
15 *
16 * @package SPIP\Core\Valider_XML
17 */
18
19 if (!defined('_ECRIRE_INC_VERSION')) {
20 return;
21 }
22 include_spip('inc/presentation');
23 include_spip('public/debusquer');
24
25
26 /**
27 * Page d'affichage des résultats de validation XML selon une DTD
28 *
29 * - l'argument var_url peut indiquer un fichier ou un repertoire
30 * - l'argument ext peut valoir "php" ou "html"
31 * -- Si "php", le script est execute et la page valide
32 * -- Si "html", on suppose que c'est un squelette dont on devine les args
33 * en cherchant les occurrences de Pile[0].
34 *
35 * @example
36 * ```
37 * ecrire?exec=valider_xml&var_url=exec&ext=php pour tester l'espace prive
38 * ecrire?exec=valider_xml&var_url=../squelettes-dist&ext=html pour le public
39 * ```
40 *
41 * @uses valider_xml_ok()
42 **/
43 function exec_valider_xml_dist() {
44 if (!autoriser('webmestre')) {
45 include_spip('inc/minipres');
46 echo minipres();
47 } else {
48 $erreur = "";
49 // verifier que les var de l'URL sont conformes avant d'appeler la fonction
50 $url = trim(_request('var_url'));
51 if (strncmp($url,'/',1)==0) $erreur = 'Chemin absolu interdit pour var_url';
52 // on a pas le droit de remonter plus de 1 fois dans le path (pas 2 occurences de ../ ou ..\ (win))
53 if (($p=strpos($url,'..'))!==false AND strpos($url,'..',$p+3)!==false) $erreur = 'Interdit de remonter en dehors de la racine';
54 if (strpos($url,'://')!==false or strpos($url,':\\')!==false) $erreur = 'URL absolue interdite pour var_url';
55
56 $ext = trim(_request('ext'));
57 $ext = ltrim($ext,'.'); // precaution
58 if (preg_match('/\W/',$ext)) $erreur = 'Extension invalide';
59
60 // en GET var_url doit etre signee, en POST seule l'action est signee
61 // CSRF safe
62 $process = true;
63 if ($url){
64 include_spip('inc/securiser_action');
65 if ($_SERVER["REQUEST_METHOD"]=='POST'){
66 if (!$token = _request('var_token')
67 or !verifier_cle_action("valider_xml",$token)){
68 $process = false;
69 }
70 }
71 if ($_SERVER["REQUEST_METHOD"]!='POST'){
72 if (!$token = _request('var_token')
73 or !verifier_cle_action("valider_xml&var_url=$url",$token)){
74 $process = false;
75 }
76 }
77 }
78
79 if ($erreur){
80 include_spip('inc/minipres');
81 echo minipres($erreur);
82 }
83 else {
84 valider_xml_ok($url, $ext, intval(_request('limit')), _request('recur'), $process);
85 }
86 }
87 }
88
89 /**
90 * Vérifie le formatage d'un xml
91 *
92 * @see valider_resultats()
93 * @see valider_dir()
94 * @see valider_pseudo_url()
95 *
96 * @param string $url
97 * @param string $req_ext
98 * @param int $limit
99 * @param array|bool $rec
100 * @param bool $process
101 *
102 **/
103 function valider_xml_ok($url, $req_ext, $limit, $rec, $process = true) {
104 $url = urldecode($url);
105 $rec = !$rec ? false : array();
106 $res = '';
107 if (!$limit) {
108 $limit = 200;
109 }
110 $titre = _T('analyse_xml');
111 if (!$url) {
112 $url_aff = '';
113 $bandeau = $err = '';
114 } else {
115 include_spip('inc/distant');
116
117 if (is_dir($url)) {
118 $dir = (substr($url, -1, 1) === '/') ? $url : "$url/";
119 $ext = !preg_match('/^[.*\w]+$/', $req_ext) ? 'php' : $req_ext;
120 $files = preg_files($dir, "$ext$", $limit, $rec);
121 if (!$files and $ext !== 'html') {
122 $files = preg_files($dir, 'html$', $limit, $rec);
123 if ($files) {
124 $ext = 'html';
125 }
126 }
127 if ($process) {
128 if ($files) {
129 $res = valider_dir($files, $ext, $url);
130 list($err, $res) = valider_resultats($res, $ext === 'html');
131 $err = ' (' . $err . '/' . count($files) . ')';
132 } else {
133 $res = _T('texte_vide');
134 $err = '';
135 }
136 $bandeau = $dir . '*' . $ext . $err;
137 }
138 else {
139 $url_aff = entites_html($url);
140 }
141 } else {
142 if (preg_match('@^((?:[.]/)?[^?]*)[?]([0-9a-z_]+)=([^&]*)(.*)$@', $url, $r)) {
143 list(, $server, $dir, $script, $args) = $r;
144 if (((!$server) or ($server == './')
145 or strpos($server, url_de_base()) === 0)
146 and is_dir($dir)
147 ) {
148 $url = $script;
149 // Pour quand le validateur saura simuler
150 // une query-string...
151 // $args = preg_split('/&(amp;)?[a-z0-9_]+=/', $args);
152 $args = true;
153 }
154 } else {
155 $dir = 'exec';
156 $script = $url;
157 $args = true;
158 }
159
160 $url_aff = entites_html($url);
161 $bandeau = "";
162 if ($process) {
163 $transformer_xml = charger_fonction('valider', 'xml');
164 if (preg_match(',^[a-z][0-9a-z_]*$,i', $url)) {
165 $res = $transformer_xml(charger_fonction($url, $dir), $args);
166 $url_aff = valider_pseudo_url($dir, $script);
167 } else {
168 $res = $transformer_xml(recuperer_page($url));
169 $url_aff = entites_html($url);
170 }
171 list($texte, $err) = emboite_texte($res);
172 if (!$err) {
173 $err = '<h3>' . _T('spip_conforme_dtd') . '</h3>';
174 }
175 $res =
176 "<div style='text-align: center'>" . $err . "</div>" .
177 "<div style='margin: 10px; text-align: left'>" . $texte . '</div>';
178 $bandeau = "<a href='$url_aff'>".$url_aff."</a>";
179 }
180
181 }
182 }
183
184 $commencer_page = charger_fonction('commencer_page', 'inc');
185 $debut = $commencer_page($titre);
186 $jq = http_script("", 'jquery.js');
187
188
189 echo str_replace('<head>', "<head>$jq", $debut);
190 include_spip('inc/securiser_action');
191 $token = calculer_cle_action("valider_xml");
192 $texte = '<input type="text" size="70" value="' . $url_aff . '" name="var_url" id="var_url" placeholder="http://" />';
193 $texte .= '<input type="hidden" value="' . $token . '" name="var_token" />';
194 $texte .= '<input type="hidden" value="' . $req_ext . '" name="ext" />';
195 $texte .= '<input type="submit" value="Go" />';
196 $texte = generer_form_ecrire('valider_xml', $texte, " method='post'");
197
198 $self = generer_url_ecrire('valider_xml');
199 $self = parametre_url($self, 'var_url', $url);
200 $self = parametre_url($self, 'ext', $req_ext);
201 $self = parametre_url($self, 'limit', $limit);
202 $self = parametre_url($self, 'rec', $rec);
203 $self = "<a href='$self'>$self</a>";
204
205 echo "<h1 class='grostitre'>", $titre, " <small>$bandeau</small>", '</h1>',
206 "<div style='text-align: center'>", $texte, "</div>",
207 $res,
208 "<br /><br /><p><small>$self</small></p>",
209 fin_page();
210 }
211
212 /**
213 *
214 * Vérifie la conformité du xml, élément par élément.
215 *
216 * @param array $res
217 * @param string $mode
218 * @return array
219 **/
220 function valider_resultats($res, $mode) {
221 include_spip('inc/securiser_action');
222 $i = $j = 0;
223 $table = '';
224 rsort($res);
225 foreach ($res as $l) {
226 $i++;
227 $class = 'row_' . alterner($i, 'even', 'odd');
228 list($nb, $texte, $erreurs, $script, $appel, $temps) = $l;
229 if ($texte < 0) {
230 $texte = (0 - $texte);
231 $color = ";color: red";
232 } else {
233 $color = '';
234 }
235
236 $err = (!intval($nb)) ? '' :
237 ($erreurs[0][0] . ' ' . _T('ligne') . ' ' .
238 $erreurs[0][1] . ($nb == 1 ? '' : ' ...'));
239 if ($err) {
240 $j++;
241 }
242 if ($mode) {
243 $h = $appel . '&var_mode=debug&var_mode_affiche=validation';
244 }
245 else {
246 $h = generer_url_ecrire('valider_xml', "var_url=" . urlencode($appel));
247 $h = parametre_url($h,'var_token', calculer_cle_action("valider_xml&var_url=$appel"));
248 }
249
250 $table .= "<tr class='$class'>"
251 . "<td style='text-align: right'>$nb</td>"
252 . "<td style='text-align: right$color'>$texte</td>"
253 . "<td style='text-align: right'>$temps</td>"
254 . "<td style='text-align: left'>$err</td>"
255 . "<td>$script</td>"
256 . "<td><a href='$h'>$appel</a></td>";
257 }
258
259 return array(
260 $j,
261 "<table class='spip'>"
262 . "<tr><th>"
263 . _T('erreur_texte')
264 . "</th><th>"
265 . _T('taille_octets', array('taille' => ' '))
266 . "</th><th>"
267 . _T('zbug_profile', array('time' => ''))
268 . "</th><th>"
269 . _T('message')
270 . "</th><th>Page</th><th>args"
271 . "</th></tr>"
272 . $table
273 . "</table>"
274 );
275 }
276
277 /**
278 * Valide l'existence d'un script ou d'une fonction
279 *
280 * @uses valider_pseudo_url()
281 *
282 * @param string $transformer_xml
283 * @param string $script
284 * Nom de la fonction à charger
285 * @param string $dir
286 * Nom du répertoire qui contiendrait le fichier et/ou la fonction à chercher/charger.
287 * @param string $ext
288 * Nom de l'extension du fichier contenant la fonction à vérifier.
289 * @return array
290 */
291 function valider_script($transformer_xml, $script, $dir, $ext) {
292 $script = basename($script, '.php');
293 $dir = basename($dir);
294 $f = charger_fonction($script, $dir, true);
295
296 // ne pas se controler soi-meme ni l'index du repertoire ni un fichier annexe
297 if ($script == _request('exec') or $script == 'index' or !$f) {
298 return array('/', 0, '', $script, '');
299 }
300
301 $val = $transformer_xml($f, true);
302 $appel = '';
303
304 // s'il y a l'attribut minipres, le test est non significatif
305 // le script necessite peut-etre des arguments, on lui en donne,
306 // en appelant la fonction _args associee si elle existe
307 // Si ca ne marche toujours pas, les arguments n'étaient pas bons
308 // ou c'est une authentification pour action d'administration;
309 // tant pis, on signale le cas par un resultat negatif
310
311 if (strpos($val->page, "id='minipres'")) {
312 if (!$g = charger_fonction($script . '_args', $dir, true)) {
313 $res = 0 - strlen($val->page);
314 } else {
315 $args = array(1, 'id_article', 1);
316 $val = $transformer_xml($g, $args);
317 $appel = 'id_article=1&type=id_article&id=1';
318 if (strpos($val->page, "id='minipres'")) {
319 $res = 0 - strlen($val->page);
320 } else {
321 $res = strlen($val->page);
322 }
323 }
324 } else {
325 $res = strlen($val->page);
326 }
327
328 $appel = valider_pseudo_url($dir, $script, $appel);
329 $err = $val->err;
330
331 return array(count($err), $res, $err, $script, $appel);
332 }
333
334 /**
335 * Construire la bonne URL selon l'endroit où on se trouve.
336 *
337 * @param string $dir
338 * Par défaut, on vérifie si on est sur une page `?exec=XX`
339 * @param string $script
340 * @param string $args [description]
341 * @return string
342 */
343 function valider_pseudo_url($dir, $script, $args = '') {
344 return ($dir == 'exec')
345 ? generer_url_ecrire($script, $args, false, true)
346 : ("./?$dir=$script" . ($args ? "&$args" : ''));
347 }
348
349 /**
350 * Essayer de valider un texte même sans Doctype
351 * à moins qu'un Content-Type dise clairement que ce n'est pas du XML
352 *
353 * @param string $transformer_xml
354 * @param string $file
355 * @param string $dir
356 * @param string $ext
357 * @return array
358 */
359 function valider_skel($transformer_xml, $file, $dir, $ext) {
360 if (!lire_fichier($file, $text)) {
361 return array('/', '/', $file, '');
362 }
363 if (!strpos($text, 'DOCTYPE')) {
364 preg_match(",Content[-]Type: *\w+/(\S)+,", $text, $r);
365 if ($r[1] === 'css' or $r[1] === 'plain') {
366 return array('/', 'DOCTYPE?', $file, '');
367 }
368 }
369
370 if ($ext != 'html') {
371 // validation d'un non squelette
372 $page = array('texte' => $text);
373 $url = url_de_base() . _DIR_RESTREINT_ABS . $file;
374 $script = $file;
375 } else {
376 $script = basename($file, '.html');
377 // pas de validation solitaire pour les squelettes internes, a revoir.
378 if (substr_count($dir, '/') <= 1) {
379 $url = generer_url_public($script, $contexte);
380 } else {
381 $url = '';
382 }
383 $composer = charger_fonction('composer', 'public');
384 list($skel_nom, $skel_code) = $composer($text, 'html', 'html', $file);
385
386 spip_log("compilation de $file en " . strlen($skel_code) . " octets de nom $skel_nom");
387 if (!$skel_nom) {
388 return array('/', '/', $file, '');
389 }
390 $contexte = valider_contexte($skel_code, $file);
391 $page = $skel_nom(array('cache' => ''), array($contexte));
392 }
393 $res = $transformer_xml($page['texte']);
394
395 return array(count($res->err), strlen($res->page), $res->err, $script, $url);
396 }
397
398 /**
399 * Analyser le code pour construire un contexte plausible complet
400 *
401 * i.e. ce qui est fourni par `$Pile[0]`
402 * en éliminant les exceptions venant surtout des Inclure
403 *
404 * Il faudrait trouver une typologie pour générer un contexte parfait:
405 * actuellement ça produit parfois des erreurs SQL à l'appel de $skel_nom
406 *
407 * @see valider_skel()
408 * @param string $code
409 * @param string $file
410 * @return array
411 */
412 function valider_contexte($code, $file) {
413 static $exceptions = array('action', 'doublons', 'lang');
414 preg_match_all('/(\S*)[$]Pile[[]0[]][[].(\w+).[]](\S*)/', $code, $r, PREG_SET_ORDER);
415 $args = array();
416 // evacuer les repetitions et les faux parametres
417 foreach ($r as $v) {
418 list(, $f, $nom, $suite) = $v;
419 if (!in_array($nom, $exceptions)
420 and (!isset($args[$nom]) or !$args[$nom])
421 ) {
422 $args[$nom] = ((strpos($f, 'sql_quote') !== false)
423 and strpos($suite, "'int'") !== false);
424 }
425 }
426 $contexte = array(); // etudier l'ajout de:
427 // 'lang' => $GLOBALS['spip_lang'],
428 // 'date' => date('Y-m-d H:i:s'));
429 foreach ($args as $nom => $f) {
430 if (!$f) {
431 $val = 'id_article';
432 } else {
433 // on suppose que arg numerique => primary-key d'une table
434 // chercher laquelle et prendre un numero existant
435 $val = 0;
436 $type = (strpos($nom, 'id_') === 0) ? substr($nom, 3) : $nom;
437 $trouver_table = charger_fonction('trouver_table', 'base');
438 $table = $trouver_table(table_objet_sql($type));
439 if ($table) {
440 $val = @sql_getfetsel($nom, $table['table'], '', '', '', "0,1");
441 }
442 // porte de sortie si ca marche pas,
443 if (!$val) {
444 $val = 1;
445 }
446 }
447 $contexte[$nom] = $val;
448 }
449
450 return $contexte;
451 }
452
453 /**
454 * Valide la conformité XML d'une liste de fichiers dans un répertoire
455 *
456 * @param array $files
457 * Liste des fichiers
458 * @param string $ext
459 * Extension des fichiers
460 * @param string $dir
461 * Chemin du répertoire
462 * @return array
463 **/
464 function valider_dir($files, $ext, $dir) {
465 $res = array();
466 $transformer_xml = charger_fonction('valider', 'xml');
467 $valideur = $ext == 'php' ? 'valider_script' : 'valider_skel';
468 foreach ($files as $f) {
469 spip_timer($f);
470 $val = $valideur($transformer_xml, $f, $dir, $ext);
471 $n = spip_timer($f);
472 $val[] = $n;
473 spip_log("validation de $f en $n secondes");
474 $res[] = $val;
475 }
476
477 return $res;
478 }