[SPIP] ~maj SPIP v3.0.17 --> v3.0.19
[lhc/web/clavette_www.git] / www / ecrire / inc / distant.php
1 <?php
2
3 /***************************************************************************\
4 * SPIP, Systeme de publication pour l'internet *
5 * *
6 * Copyright (c) 2001-2014 *
7 * Arnaud Martin, Antoine Pitrou, Philippe Riviere, Emmanuel Saint-James *
8 * *
9 * Ce programme est un logiciel libre distribue sous licence GNU/GPL. *
10 * Pour plus de details voir le fichier COPYING.txt ou l'aide en ligne. *
11 \***************************************************************************/
12
13 /**
14 * Ce fichier gère l'obtention de données distantes
15 *
16 * @package SPIP\Core\Distant
17 **/
18 if (!defined('_ECRIRE_INC_VERSION')) return;
19
20 if (!defined('_INC_DISTANT_VERSION_HTTP')) define('_INC_DISTANT_VERSION_HTTP', "HTTP/1.0");
21 if (!defined('_INC_DISTANT_CONTENT_ENCODING')) define('_INC_DISTANT_CONTENT_ENCODING', "gzip");
22 if (!defined('_INC_DISTANT_USER_AGENT')) define('_INC_DISTANT_USER_AGENT', 'SPIP-' . $GLOBALS['spip_version_affichee'] . " (" . $GLOBALS['home_server'] . ")");
23 if (!defined('_INC_DISTANT_MAX_SIZE')) define('_INC_DISTANT_MAX_SIZE',2097152);
24 if (!defined('_INC_DISTANT_CONNECT_TIMEOUT')) define('_INC_DISTANT_CONNECT_TIMEOUT',10);
25
26 define('_REGEXP_COPIE_LOCALE', ',' .
27 preg_replace('@^https?:@', 'https?:', $GLOBALS['meta']['adresse_site'])
28 . "/?spip.php[?]action=acceder_document.*file=(.*)$,");
29
30 //@define('_COPIE_LOCALE_MAX_SIZE',2097152); // poids (inc/utils l'a fait)
31
32 /**
33 * Crée au besoin la copie locale d'un fichier distant
34 *
35 * Prend en argument un chemin relatif au rep racine, ou une URL
36 * Renvoie un chemin relatif au rep racine, ou false
37 *
38 * @link http://www.spip.net/4155
39 *
40 * @param $source
41 * @param string $mode
42 * 'test' - ne faire que tester
43 * 'auto' - charger au besoin
44 * 'modif' - Si deja present, ne charger que si If-Modified-Since
45 * 'force' - charger toujours (mettre a jour)
46 * @param string $local
47 * permet de specifier le nom du fichier local (stockage d'un cache par exemple, et non document IMG)
48 * @return bool|string
49 */
50 function copie_locale($source, $mode='auto', $local = null) {
51
52 // si c'est la protection de soi-meme, retourner le path
53 if ($mode !== 'force' AND preg_match(_REGEXP_COPIE_LOCALE, $source, $match)) {
54 $source = substr(_DIR_IMG,strlen(_DIR_RACINE)) . urldecode($match[1]);
55 return @file_exists($source) ? $source : false;
56 }
57
58 if (is_null($local))
59 $local = fichier_copie_locale($source);
60 else {
61 if (_DIR_RACINE AND strncmp(_DIR_RACINE, $local, strlen(_DIR_RACINE))==0) {
62 $local = substr($local, strlen(_DIR_RACINE));
63 }
64 }
65
66 // si $local = '' c'est un fichier refuse par fichier_copie_locale(),
67 // par exemple un fichier qui ne figure pas dans nos documents ;
68 // dans ce cas on n'essaie pas de le telecharger pour ensuite echouer
69 if (!$local) return false;
70
71 $localrac = _DIR_RACINE.$local;
72 $t = ($mode=='force') ? false : @file_exists($localrac);
73
74 // test d'existence du fichier
75 if ($mode=='test') return $t ? $local : '';
76
77 // sinon voir si on doit/peut le telecharger
78 if ($local==$source OR !preg_match(',^\w+://,', $source))
79 return $local;
80
81 if ($mode=='modif' OR !$t){
82 // passer par un fichier temporaire unique pour gerer les echecs en cours de recuperation
83 // et des eventuelles recuperations concurantes
84 include_spip("inc/acces");
85 $res = recuperer_page($source, $localrac, false, _COPIE_LOCALE_MAX_SIZE, '', '', false, $t ? filemtime($localrac) : '');
86 if (!$res) {
87 if (!$t) // si $t c'est sans doute juste un not-modified-since qui fait renvoyer false
88 spip_log("copie_locale : Echec recuperation $source sur $localrac",_LOG_INFO_IMPORTANTE);
89 return $t ? $local : false;
90 }
91 spip_log("copie_locale : recuperation $source sur $localrac taille $res OK");
92
93 // pour une eventuelle indexation
94 pipeline('post_edition',
95 array(
96 'args' => array(
97 'operation' => 'copie_locale',
98 'source' => $source,
99 'fichier' => $local
100 ),
101 'data' => null
102 )
103 );
104 }
105
106 return $local;
107 }
108
109 // http://doc.spip.org/@prepare_donnees_post
110 function prepare_donnees_post($donnees, $boundary = '') {
111
112 // permettre a la fonction qui a demande le post de formater elle meme ses donnees
113 // pour un appel soap par exemple
114 // l'entete est separe des donnees par un double retour a la ligne
115 // on s'occupe ici de passer tous les retours lignes (\r\n, \r ou \n) en \r\n
116 if (is_string($donnees) && strlen($donnees)){
117 $entete = "";
118 // on repasse tous les \r\n et \r en simples \n
119 $donnees = str_replace("\r\n","\n",$donnees);
120 $donnees = str_replace("\r","\n",$donnees);
121 // un double retour a la ligne signifie la fin de l'entete et le debut des donnees
122 $p = strpos($donnees, "\n\n");
123 if ($p!==FALSE){
124 $entete = str_replace("\n", "\r\n", substr($donnees, 0, $p+1));
125 $donnees = substr($donnees, $p+2);
126 }
127 $chaine = str_replace("\n", "\r\n", $donnees);
128 }
129 else {
130 /* boundary automatique */
131 // Si on a plus de 500 octects de donnees, on "boundarise"
132 if ($boundary===''){
133 $taille = 0;
134 foreach ($donnees as $cle => $valeur){
135 if (is_array($valeur)){
136 foreach ($valeur as $val2){
137 $taille += strlen($val2);
138 }
139 } else {
140 // faut-il utiliser spip_strlen() dans inc/charsets ?
141 $taille += strlen($valeur);
142 }
143 }
144 if ($taille>500){
145 $boundary = substr(md5(rand() . 'spip'), 0, 8);
146 }
147 }
148
149 if (is_string($boundary) and strlen($boundary)){
150 // fabrique une chaine HTTP pour un POST avec boundary
151 $entete = "Content-Type: multipart/form-data; boundary=$boundary\r\n";
152 $chaine = '';
153 if (is_array($donnees)) {
154 foreach ($donnees as $cle => $valeur) {
155 if (is_array($valeur)) {
156 foreach ($valeur as $val2) {
157 $chaine .= "\r\n--$boundary\r\n";
158 $chaine .= "Content-Disposition: form-data; name=\"{$cle}[]\"\r\n";
159 $chaine .= "\r\n";
160 $chaine .= $val2;
161 }
162 } else {
163 $chaine .= "\r\n--$boundary\r\n";
164 $chaine .= "Content-Disposition: form-data; name=\"$cle\"\r\n";
165 $chaine .= "\r\n";
166 $chaine .= $valeur;
167 }
168 }
169 $chaine .= "\r\n--$boundary\r\n";
170 }
171 } else {
172 // fabrique une chaine HTTP simple pour un POST
173 $entete = 'Content-Type: application/x-www-form-urlencoded'."\r\n";
174 $chaine = array();
175 if (is_array($donnees)) {
176 foreach ($donnees as $cle => $valeur) {
177 if (is_array($valeur)) {
178 foreach ($valeur as $val2) {
179 $chaine[] = rawurlencode($cle).'[]='.rawurlencode($val2);
180 }
181 } else {
182 $chaine[] = rawurlencode($cle).'='.rawurlencode($valeur);
183 }
184 }
185 $chaine = implode('&', $chaine);
186 } else {
187 $chaine = $donnees;
188 }
189 }
190 }
191 return array($entete, $chaine);
192 }
193
194 //
195 // Recupere une page sur le net
196 // et au besoin l'encode dans le charset local
197 //
198 // options : get_headers si on veut recuperer les entetes
199 // taille_max : arreter le contenu au-dela (0 = seulement les entetes ==>HEAD)
200 // Par defaut taille_max = 1Mo.
201 // datas, une chaine ou un tableau pour faire un POST de donnees
202 // boundary, pour forcer l'envoi par cette methode
203 // et refuser_gz pour forcer le refus de la compression (cas des serveurs orthographiques)
204 // date_verif, un timestamp unix pour arreter la recuperation si la page distante n'a pas ete modifiee depuis une date donnee
205 // uri_referer, preciser un referer different
206 // Le second argument ($trans) :
207 // * si c'est une chaine longue, alors c'est un nom de fichier
208 // dans lequel on ecrit directement la page
209 // * si c'est true/null ca correspond a une demande d'encodage/charset
210 // http://doc.spip.org/@recuperer_page
211 function recuperer_page($url, $trans = false, $get_headers = false,
212 $taille_max = null, $datas = '', $boundary = '', $refuser_gz = false,
213 $date_verif = '', $uri_referer = ''){
214 $gz = false;
215
216 // $copy = copier le fichier ?
217 $copy = (is_string($trans) AND strlen($trans)>5); // eviter "false" :-)
218
219 if (is_null($taille_max))
220 $taille_max = $copy ? _COPIE_LOCALE_MAX_SIZE : _INC_DISTANT_MAX_SIZE;
221
222 // Accepter les URLs au format feed:// ou qui ont oublie le http://
223 $url = preg_replace(',^feed://,i', 'http://', $url);
224 if (!preg_match(',^[a-z]+://,i', $url)) $url = 'http://' . $url;
225
226 if ($taille_max==0)
227 $get = 'HEAD';
228 else
229 $get = 'GET';
230
231 if (!empty($datas)) {
232 $get = 'POST';
233 list($type, $postdata) = prepare_donnees_post($datas, $boundary);
234 $datas = $type . 'Content-Length: ' . strlen($postdata) . "\r\n\r\n" . $postdata;
235 }
236
237 // dix tentatives maximum en cas d'entetes 301...
238 for ($i = 0; $i<10; $i++){
239 $url = recuperer_lapage($url, $trans, $get, $taille_max, $datas, $refuser_gz, $date_verif, $uri_referer);
240 if (!$url) return false;
241 if (is_array($url)){
242 list($headers, $result) = $url;
243 return ($get_headers ? $headers . "\n" : '') . $result;
244 } else spip_log("recuperer page recommence sur $url");
245 }
246 }
247
248 // args comme ci-dessus (presque)
249 // retourne l'URL en cas de 301, un tableau (entete, corps) si ok, false sinon
250 // si $trans est null -> on ne veut que les headers
251 // si $trans est une chaine, c'est un nom de fichier pour ecrire directement dedans
252 // http://doc.spip.org/@recuperer_lapage
253 function recuperer_lapage($url, $trans = false, $get = 'GET', $taille_max = _INC_DISTANT_MAX_SIZE, $datas = '', $refuser_gz = false, $date_verif = '', $uri_referer = ''){
254 // $copy = copier le fichier ?
255 $copy = (is_string($trans) AND strlen($trans)>5); // eviter "false" :-)
256
257 // si on ecrit directement dans un fichier, pour ne pas manipuler
258 // en memoire refuser gz
259 if ($copy)
260 $refuser_gz = true;
261
262 // ouvrir la connexion et envoyer la requete et ses en-tetes
263 list($f, $fopen) = init_http($get, $url, $refuser_gz, $uri_referer, $datas, _INC_DISTANT_VERSION_HTTP, $date_verif);
264 if (!$f){
265 spip_log("ECHEC init_http $url");
266 return false;
267 }
268
269 $result = '';
270 // Sauf en fopen, envoyer le flux d'entree
271 // et recuperer les en-tetes de reponses
272 if ($fopen)
273 $headers = '';
274 else {
275 $headers = recuperer_entetes($f, $date_verif);
276 if (is_numeric($headers)){
277 fclose($f);
278 // Chinoisierie inexplicable pour contrer
279 // les actions liberticides de l'empire du milieu
280 if ($headers){
281 spip_log("HTTP status $headers pour $url");
282 return false;
283 }
284 $t = @parse_url($url);
285 $host = $t['host'];
286 if (!need_proxy($host)
287 AND $result = @file_get_contents($url)){
288 // on peuple les headers de vide et on continue
289 $headers = array('');
290 }
291 else
292 return false;
293 }
294 if (!is_array($headers)){ // cas Location
295 fclose($f);
296 include_spip('inc/filtres');
297 return suivre_lien($url, $headers);
298 }
299 $headers = join('', $headers);
300 }
301
302 if ($trans===NULL) return array($headers, '');
303
304 // s'il faut deballer, le faire via un fichier temporaire
305 // sinon la memoire explose pour les gros flux
306
307 $gz = preg_match(",\bContent-Encoding: .*gzip,is", $headers) ?
308 (_DIR_TMP . md5(uniqid(mt_rand())) . '.tmp.gz') : '';
309
310 # spip_log("entete ($trans $copy $gz)\n$headers");
311 if (!$result){
312 $result = recuperer_body($f, $taille_max, $gz ? $gz : ($copy ? $trans : ''));
313 fclose($f);
314 }
315 if (!$result)
316 return array($headers, $result);
317
318 // Decompresser au besoin
319 if ($gz){
320 $result = join('', gzfile($gz));
321 supprimer_fichier($gz);
322 }
323 // Faut-il l'importer dans notre charset local ?
324 if ($trans===true){
325 include_spip('inc/charsets');
326 $result = transcoder_page($result, $headers);
327 }
328
329 return array($headers, $result);
330 }
331
332 // http://doc.spip.org/@recuperer_body
333 function recuperer_body($f, $taille_max = _INC_DISTANT_MAX_SIZE, $fichier = ''){
334 $taille = 0;
335 $result = '';
336 $fp = false;
337 if ($fichier){
338 include_spip("inc/acces");
339 $tmpfile = "$fichier.".creer_uniqid().".tmp";
340 $fp = spip_fopen_lock($tmpfile, 'w', LOCK_EX);
341 if (!$fp AND file_exists($fichier)){
342 return filesize($fichier);
343 }
344 if (!$fp)
345 return false;
346 $result = 0; // on renvoie la taille du fichier
347 }
348 while (!feof($f) AND $taille<$taille_max){
349 $res = fread($f, 16384);
350 $taille += strlen($res);
351 if ($fp){
352 fwrite($fp, $res);
353 $result = $taille;
354 }
355 else
356 $result .= $res;
357 }
358 if ($fp){
359 spip_fclose_unlock($fp);
360 spip_unlink($fichier);
361 @rename($tmpfile, $fichier);
362 if (!file_exists($fichier))
363 return false;
364 }
365 return $result;
366 }
367
368 // Lit les entetes de reponse HTTP sur la socket $f et retourne:
369 // la valeur (chaine) de l'en-tete Location si on l'a trouvee
370 // la valeur (numerique) du statut si different de 200, notamment Not-Modified
371 // le tableau des entetes dans tous les autres cas
372
373 // http://doc.spip.org/@recuperer_entetes
374 function recuperer_entetes($f, $date_verif = ''){
375 $s = @trim(fgets($f, 16384));
376
377 if (!preg_match(',^HTTP/[0-9]+\.[0-9]+ ([0-9]+),', $s, $r)){
378 return 0;
379 }
380 $status = intval($r[1]);
381 $headers = array();
382 $not_modif = $location = false;
383 while ($s = trim(fgets($f, 16384))){
384 $headers[] = $s . "\n";
385 preg_match(',^([^:]*): *(.*)$,i', $s, $r);
386 list(, $d, $v) = $r;
387 if (strtolower(trim($d))=='location' AND $status>=300 AND $status<400){
388 $location = $v;
389 }
390 elseif ($date_verif AND ($d=='Last-Modified')) {
391 if ($date_verif>=strtotime($v)){
392 //Cas ou la page distante n'a pas bouge depuis
393 //la derniere visite
394 $not_modif = true;
395 }
396 }
397 }
398
399 if ($location)
400 return $location;
401 if ($status!=200 or $not_modif)
402 return $status;
403 return $headers;
404 }
405
406 // Si on doit conserver une copie locale des fichiers distants, autant que ca
407 // soit a un endroit canonique -- si ca peut etre bijectif c'est encore mieux,
408 // mais la tout de suite je ne trouve pas l'idee, etant donne les limitations
409 // des filesystems
410 // http://doc.spip.org/@nom_fichier_copie_locale
411 function nom_fichier_copie_locale($source, $extension){
412 include_spip('inc/documents');
413
414 $d = creer_repertoire_documents('distant'); # IMG/distant/
415 $d = sous_repertoire($d, $extension); # IMG/distant/pdf/
416
417 // on se place tout le temps comme si on etait a la racine
418 if (_DIR_RACINE)
419 $d = preg_replace(',^' . preg_quote(_DIR_RACINE) . ',', '', $d);
420
421 $m = md5($source);
422
423 return $d
424 . substr(preg_replace(',[^\w-],', '', basename($source)) . '-' . $m, 0, 12)
425 . substr($m, 0, 4)
426 . ".$extension";
427 }
428
429 //
430 // Donne le nom de la copie locale de la source
431 //
432 // http://doc.spip.org/@fichier_copie_locale
433 function fichier_copie_locale($source){
434 // Si c'est deja local pas de souci
435 if (!preg_match(',^\w+://,', $source)){
436 if (_DIR_RACINE)
437 $source = preg_replace(',^' . preg_quote(_DIR_RACINE) . ',', '', $source);
438 return $source;
439 }
440
441 // optimisation : on regarde si on peut deviner l'extension dans l'url et si le fichier
442 // a deja ete copie en local avec cette extension
443 // dans ce cas elle est fiable, pas la peine de requeter en base
444 $path_parts = pathinfo($source);
445 $ext = $path_parts ? $path_parts['extension'] : '';
446 if ($ext
447 AND preg_match(',^\w+$,', $ext) // pas de php?truc=1&...
448 AND $f = nom_fichier_copie_locale($source, $ext)
449 AND file_exists(_DIR_RACINE . $f)
450 )
451 return $f;
452
453
454 // Si c'est deja dans la table des documents,
455 // ramener le nom de sa copie potentielle
456
457 $ext = sql_getfetsel("extension", "spip_documents", "fichier=" . sql_quote($source) . " AND distant='oui' AND extension <> ''");
458
459
460 if ($ext) return nom_fichier_copie_locale($source, $ext);
461
462 // voir si l'extension indiquee dans le nom du fichier est ok
463 // et si il n'aurait pas deja ete rapatrie
464
465 $ext = $path_parts ? $path_parts['extension'] : '';
466
467 if ($ext AND sql_getfetsel("extension", "spip_types_documents", "extension=" . sql_quote($ext))){
468 $f = nom_fichier_copie_locale($source, $ext);
469 if (file_exists(_DIR_RACINE . $f))
470 return $f;
471 }
472
473 // Ping pour voir si son extension est connue et autorisee
474 // avec mise en cache du resultat du ping
475
476 $cache = sous_repertoire(_DIR_CACHE, 'rid') . md5($source);
477 if (!@file_exists($cache)
478 OR !$path_parts = @unserialize(spip_file_get_contents($cache))
479 OR _request('var_mode')=='recalcul'
480 ){
481 $path_parts = recuperer_infos_distantes($source, 0, false);
482 ecrire_fichier($cache, serialize($path_parts));
483 }
484 $ext = $path_parts ? $path_parts['extension'] : '';
485 if ($ext AND sql_getfetsel("extension", "spip_types_documents", "extension=" . sql_quote($ext))){
486 return nom_fichier_copie_locale($source, $ext);
487 }
488 spip_log("pas de copie locale pour $source");
489 }
490
491
492 // Recuperer les infos d'un document distant, sans trop le telecharger
493 #$a['body'] = chaine
494 #$a['type_image'] = booleen
495 #$a['titre'] = chaine
496 #$a['largeur'] = intval
497 #$a['hauteur'] = intval
498 #$a['taille'] = intval
499 #$a['extension'] = chaine
500 #$a['fichier'] = chaine
501 #$a['mime_type'] = chaine
502
503 // http://doc.spip.org/@recuperer_infos_distantes
504 function recuperer_infos_distantes($source, $max = 0, $charger_si_petite_image = true){
505
506 # charger les alias des types mime
507 include_spip('base/typedoc');
508 global $mime_alias;
509
510 $a = array();
511 $mime_type = '';
512 // On va directement charger le debut des images et des fichiers html,
513 // de maniere a attrapper le maximum d'infos (titre, taille, etc). Si
514 // ca echoue l'utilisateur devra les entrer...
515 if ($headers = recuperer_page($source, false, true, $max, '', '', true)){
516 list($headers, $a['body']) = preg_split(',\n\n,', $headers, 2);
517
518 if (preg_match(",\nContent-Type: *([^[:space:];]*),i", "\n$headers", $regs))
519 $mime_type = (trim($regs[1]));
520 else
521 $mime_type = ''; // inconnu
522
523 // Appliquer les alias
524 while (isset($mime_alias[$mime_type]))
525 $mime_type = $mime_alias[$mime_type];
526
527 // Si on a un mime-type insignifiant
528 // text/plain,application/octet-stream ou vide
529 // c'est peut-etre que le serveur ne sait pas
530 // ce qu'il sert ; on va tenter de detecter via l'extension de l'url
531 // ou le Content-Disposition: attachment; filename=...
532 $t = null;
533 if (in_array($mime_type, array('text/plain', '', 'application/octet-stream'))){
534 if (!$t
535 AND preg_match(',\.([a-z0-9]+)(\?.*)?$,i', $source, $rext)
536 ){
537 $t = sql_fetsel("extension", "spip_types_documents", "extension=" . sql_quote($rext[1],'','text'));
538 }
539 if (!$t
540 AND preg_match(",^Content-Disposition:\s*attachment;\s*filename=(.*)$,Uims", $headers, $m)
541 AND preg_match(',\.([a-z0-9]+)(\?.*)?$,i', $m[1], $rext)
542 ){
543 $t = sql_fetsel("extension", "spip_types_documents", "extension=" . sql_quote($rext[1],'','text'));
544 }
545 }
546
547 // Autre mime/type (ou text/plain avec fichier d'extension inconnue)
548 if (!$t)
549 $t = sql_fetsel("extension", "spip_types_documents", "mime_type=" . sql_quote($mime_type));
550
551 // Toujours rien ? (ex: audio/x-ogg au lieu de application/ogg)
552 // On essaie de nouveau avec l'extension
553 if (!$t
554 AND $mime_type!='text/plain'
555 AND preg_match(',\.([a-z0-9]+)(\?.*)?$,i', $source, $rext)
556 ){
557 $t = sql_fetsel("extension", "spip_types_documents", "extension=" . sql_quote($rext[1],'','text')); # eviter xxx.3 => 3gp (> SPIP 3)
558 }
559
560
561 if ($t){
562 spip_log("mime-type $mime_type ok, extension " . $t['extension']);
563 $a['extension'] = $t['extension'];
564 } else {
565 # par defaut on retombe sur '.bin' si c'est autorise
566 spip_log("mime-type $mime_type inconnu");
567 $t = sql_fetsel("extension", "spip_types_documents", "extension='bin'");
568 if (!$t) return false;
569 $a['extension'] = $t['extension'];
570 }
571
572 if (preg_match(",\nContent-Length: *([^[:space:]]*),i",
573 "\n$headers", $regs)
574 )
575 $a['taille'] = intval($regs[1]);
576 }
577
578 // Echec avec HEAD, on tente avec GET
579 if (!$a AND !$max){
580 spip_log("tenter GET $source");
581 $a = recuperer_infos_distantes($source, _INC_DISTANT_MAX_SIZE);
582 }
583
584 // S'il s'agit d'une image pas trop grosse ou d'un fichier html, on va aller
585 // recharger le document en GET et recuperer des donnees supplementaires...
586 if (preg_match(',^image/(jpeg|gif|png|swf),', $mime_type)){
587 if ($max==0
588 AND $a['taille']<_INC_DISTANT_MAX_SIZE
589 AND (strpos($GLOBALS['meta']['formats_graphiques'], $a['extension'])!==false)
590 AND $charger_si_petite_image
591 ){
592 $a = recuperer_infos_distantes($source, _INC_DISTANT_MAX_SIZE);
593 }
594 else if ($a['body']){
595 $a['fichier'] = _DIR_RACINE . nom_fichier_copie_locale($source, $a['extension']);
596 ecrire_fichier($a['fichier'], $a['body']);
597 $size_image = @getimagesize($a['fichier']);
598 $a['largeur'] = intval($size_image[0]);
599 $a['hauteur'] = intval($size_image[1]);
600 $a['type_image'] = true;
601 }
602 }
603
604 // Fichier swf, si on n'a pas la taille, on va mettre 425x350 par defaut
605 // ce sera mieux que 0x0
606 if ($a AND $a['extension']=='swf'
607 AND !$a['largeur']
608 ){
609 $a['largeur'] = 425;
610 $a['hauteur'] = 350;
611 }
612
613 if ($mime_type=='text/html'){
614 include_spip('inc/filtres');
615 $page = recuperer_page($source, true, false, _INC_DISTANT_MAX_SIZE);
616 if (preg_match(',<title>(.*?)</title>,ims', $page, $regs))
617 $a['titre'] = corriger_caracteres(trim($regs[1]));
618 if (!$a['taille']) $a['taille'] = strlen($page); # a peu pres
619 }
620 $a['mime_type']=$mime_type;
621
622 return $a;
623 }
624
625
626 /**
627 * Tester si un host peut etre recuperer directement ou doit passer par un proxy
628 * on peut passer en parametre le proxy et la liste des host exclus,
629 * pour les besoins des tests, lors de la configuration
630 *
631 * @param string $host
632 * @param string $http_proxy
633 * @param string $http_noproxy
634 * @return string
635 */
636 function need_proxy($host, $http_proxy = null, $http_noproxy = null){
637 if (is_null($http_proxy))
638 $http_proxy = @$GLOBALS['meta']["http_proxy"];
639 if (is_null($http_noproxy))
640 $http_noproxy = @$GLOBALS['meta']["http_noproxy"];
641
642 $domain = substr($host, strpos($host, '.'));
643
644 return ($http_proxy
645 AND (strpos(" $http_noproxy ", " $host ")===false
646 AND (strpos(" $http_noproxy ", " $domain ")===false)))
647 ? $http_proxy : '';
648 }
649
650 //
651 // Lance une requete HTTP avec entetes
652 // retourne le descripteur sur lequel lire la reponse
653 //
654 // http://doc.spip.org/@init_http
655 function init_http($method, $url, $refuse_gz = false, $referer = '', $datas = "", $vers = "HTTP/1.0", $date = ''){
656 $user = $via_proxy = $proxy_user = '';
657 $fopen = false;
658
659 $t = @parse_url($url);
660 $host = $t['host'];
661 if ($t['scheme']=='http'){
662 $scheme = 'http';
663 $noproxy = '';
664 } elseif ($t['scheme']=='https') {
665 $scheme = 'tls';
666 $noproxy = 'tls://';
667 if (!isset($t['port']) || !($port = $t['port'])) $t['port'] = 443;
668 }
669 else {
670 $scheme = $t['scheme'];
671 $noproxy = $scheme . '://';
672 }
673 if (isset($t['user']))
674 $user = array($t['user'], $t['pass']);
675
676 if (!isset($t['port']) || !($port = $t['port'])) $port = 80;
677 if (!isset($t['path']) || !($path = $t['path'])) $path = "/";
678 if (@$t['query']) $path .= "?" . $t['query'];
679
680 $f = lance_requete($method, $scheme, $user, $host, $path, $port, $noproxy, $refuse_gz, $referer, $datas, $vers, $date);
681 if (!$f){
682 // fallback : fopen
683 if (!need_proxy($host)
684 AND !_request('tester_proxy')
685 AND (!isset($GLOBALS['inc_distant_allow_fopen']) OR $GLOBALS['inc_distant_allow_fopen'])){
686 $f = @fopen($url, "rb");
687 spip_log("connexion vers $url par simple fopen");
688 $fopen = true;
689 }
690 else
691 $f = false;
692 // echec total
693 }
694
695 return array($f, $fopen);
696 }
697
698 // http://doc.spip.org/@lance_requete
699 function lance_requete($method, $scheme, $user, $host, $path, $port, $noproxy, $refuse_gz = false, $referer = '', $datas = "", $vers = "HTTP/1.0", $date = ''){
700
701 $proxy_user = '';
702 $http_proxy = need_proxy($host);
703 if ($user) $user = urlencode($user[0]) . ":" . urlencode($user[1]);
704
705 $connect = "";
706 if ($http_proxy){
707 if (defined('_PROXY_HTTPS_VIA_CONNECT') AND $scheme=="tls"){
708 $path_host = (!$user ? '' : "$user@") . $host . (($port!=80) ? ":$port" : "");
709 $connect = "CONNECT " .$path_host." $vers\r\n"
710 ."Host: $path_host\r\n"
711 ."Proxy-Connection: Keep-Alive\r\n";
712 }
713 else {
714 $path = (($scheme=='tls') ? 'https://' : "$scheme://")
715 . (!$user ? '' : "$user@")
716 . "$host" . (($port!=80) ? ":$port" : "") . $path;
717 }
718 $t2 = @parse_url($http_proxy);
719 $first_host = $t2['host'];
720 if (!($port = $t2['port'])) $port = 80;
721 if ($t2['user'])
722 $proxy_user = base64_encode($t2['user'] . ":" . $t2['pass']);
723 }
724 else
725 $first_host = $noproxy . $host;
726
727 if ($connect){
728 $streamContext = stream_context_create(array('ssl' => array('verify_peer' => false, 'allow_self_signed' => true)));
729 $f = @stream_socket_client("tcp://$first_host:$port", $nError, $sError, _INC_DISTANT_CONNECT_TIMEOUT, STREAM_CLIENT_CONNECT, $streamContext);
730 spip_log("Recuperer $path sur $first_host:$port par $f (via CONNECT)","connect");
731 if (!$f) return false;
732 stream_set_timeout($f, _INC_DISTANT_CONNECT_TIMEOUT);
733
734 fputs($f, $connect);
735 fputs($f, "\r\n");
736 $res = fread($f, 1024);
737 if (!$res
738 OR !count($res = explode(' ',$res))
739 OR $res[1]!=='200'){
740 spip_log("Echec CONNECT sur $first_host:$port","connect"._LOG_INFO_IMPORTANTE);
741 fclose($f);
742 return false;
743 }
744 // important, car sinon on lit trop vite et les donnees ne sont pas encore dispo
745 stream_set_blocking($f, true);
746 // envoyer le handshake
747 stream_socket_enable_crypto($f, true, STREAM_CRYPTO_METHOD_SSLv23_CLIENT);
748 spip_log("OK CONNECT sur $first_host:$port","connect");
749 }
750 else {
751 $f = @fsockopen($first_host, $port, $errno, $errstr, _INC_DISTANT_CONNECT_TIMEOUT);
752 spip_log("Recuperer $path sur $first_host:$port par $f");
753 if (!$f) {
754 spip_log("Erreur connexion $errno $errstr",_LOG_ERREUR);
755 return false;
756 }
757 stream_set_timeout($f, _INC_DISTANT_CONNECT_TIMEOUT);
758 }
759
760 $site = $GLOBALS['meta']["adresse_site"];
761
762 $req = "$method $path $vers\r\n"
763 . "Host: $host\r\n"
764 . "User-Agent: " . _INC_DISTANT_USER_AGENT . "\r\n"
765 . ($refuse_gz ? '' : ("Accept-Encoding: " . _INC_DISTANT_CONTENT_ENCODING . "\r\n"))
766 . (!$site ? '' : "Referer: $site/$referer\r\n")
767 . (!$date ? '' : "If-Modified-Since: " . (gmdate("D, d M Y H:i:s", $date) . " GMT\r\n"))
768 . (!$user ? '' : ("Authorization: Basic " . base64_encode($user) . "\r\n"))
769 . (!$proxy_user ? '' : "Proxy-Authorization: Basic $proxy_user\r\n")
770 . (!strpos($vers, '1.1') ? '' : "Keep-Alive: 300\r\nConnection: keep-alive\r\n");
771
772 # spip_log("Requete\n$req");
773 fputs($f, $req);
774 fputs($f, $datas ? $datas : "\r\n");
775 return $f;
776 }
777