Tell regexp parser to use extra analysis on external link regexp;
[lhc/web/wiklou.git] / includes / Title.php
index b23dd4b..404c7c0 100644 (file)
@@ -90,33 +90,52 @@ class Title {
         * @static
         * @access public
         */
-       /* static */ function newFromText( $text, $defaultNamespace = 0 ) {     
+       /* static */ function &newFromText( $text, $defaultNamespace = 0 ) {    
                $fname = 'Title::newFromText';
                wfProfileIn( $fname );
-
-               if( is_object( $text ) ) {
-                       wfDebugDieBacktrace( 'Called with object instead of string.' );
+               
+               /**
+                * Wiki pages often contain multiple links to the same page.
+                * Title normalization and parsing can become expensive on
+                * pages with many links, so we can save a little time by
+                * caching them.
+                *
+                * In theory these are value objects and won't get changed...
+                */
+               static $titleCache = array();
+               if( $defaultNamespace == 0 && isset( $titleCache[$text] ) ) {
+                       wfProfileOut( $fname );
+                       return $titleCache[$text];
                }
+
+               /**
+                * Convert things like é into real text...
+                */
                global $wgInputEncoding;
-               $text = do_html_entity_decode( $text, ENT_COMPAT, $wgInputEncoding );
+               $filteredText = do_html_entity_decode( $text, ENT_COMPAT, $wgInputEncoding );
 
-               $text = wfMungeToUtf8( $text );
-               
+               /**
+                * Convert things like ā or 〗 into real text...
+                * WARNING: Not friendly to internal links on a latin-1 wiki.
+                */
+               $filteredText = wfMungeToUtf8( $filteredText );
                
                # What was this for? TS 2004-03-03
                # $text = urldecode( $text );
 
-               $t = new Title();
-               $t->mDbkeyform = str_replace( ' ', '_', $text );
+               $t =& new Title();
+               $t->mDbkeyform = str_replace( ' ', '_', $filteredText );
                $t->mDefaultNamespace = $defaultNamespace;
 
-               wfProfileOut( $fname );
-               if ( !is_object( $t ) ) {
-                       var_dump( debug_backtrace() );
-               }
                if( $t->secureAndSplit() ) {
+                       if( $defaultNamespace == 0 ) {
+                               $titleCache[$text] =& $t;
+                       }
+                       wfProfileOut( $fname );
                        return $t;
                } else {
+                       $titleCache[$text] = null;
+                       wfProfileOut( $fname );
                        return NULL;
                }
        }
@@ -171,6 +190,9 @@ class Title {
         * Create a new Title from a namespace index and a DB key.
         * It's assumed that $ns and $title are *valid*, for instance when
         * they came directly from the database or a special page name.
+        * For convenience, spaces are converted to underscores so that
+        * eg user_text fields can be used directly.
+        *
         * @param int $ns the namespace of the article
         * @param string $title the unprefixed database key form
         * @return Title the new object
@@ -182,9 +204,9 @@ class Title {
                $t->mInterwiki = '';
                $t->mFragment = '';
                $t->mNamespace = IntVal( $ns );
-               $t->mDbkeyform = $title;
+               $t->mDbkeyform = str_replace( ' ', '_', $title );
                $t->mArticleID = ( $ns >= 0 ) ? -1 : 0;
-               $t->mUrlform = wfUrlencode( $title );
+               $t->mUrlform = wfUrlencode( $t->mDbkeyform );
                $t->mTextform = str_replace( '_', ' ', $title );
                return $t;
        }
@@ -323,7 +345,7 @@ class Title {
 
                $t = preg_replace( "/\\s+/", ' ', $t );
 
-               if ( $ns == Namespace::getImage() ) {
+               if ( $ns == NS_IMAGE ) {
                        $t = preg_replace( "/ (png|gif|jpg|jpeg|ogg)$/", "", $t );
                }
                return trim( $t );
@@ -354,23 +376,34 @@ class Title {
        function getInterwikiLink( $key ) {     
                global $wgMemc, $wgDBname, $wgInterwikiExpiry, $wgTitleInterwikiCache;
                $fname = 'Title::getInterwikiLink';
+               
+               wfProfileIn( $fname );
+               
                $k = $wgDBname.':interwiki:'.$key;
-
-               if( array_key_exists( $k, $wgTitleInterwikiCache ) )
+               if( array_key_exists( $k, $wgTitleInterwikiCache ) ) {
+                       wfProfileOut( $fname );
                        return $wgTitleInterwikiCache[$k]->iw_url;
+               }
 
                $s = $wgMemc->get( $k ); 
                # Ignore old keys with no iw_local
                if( $s && isset( $s->iw_local ) ) { 
                        $wgTitleInterwikiCache[$k] = $s;
+                       wfProfileOut( $fname );
                        return $s->iw_url;
                }
+               
                $dbr =& wfGetDB( DB_SLAVE );
-               $res = $dbr->select( 'interwiki', array( 'iw_url', 'iw_local' ), array( 'iw_prefix' => $key ), $fname );
-               if(!$res) return '';
+               $res = $dbr->select( 'interwiki',
+                       array( 'iw_url', 'iw_local' ),
+                       array( 'iw_prefix' => $key ), $fname );
+               if( !$res ) {
+                       wfProfileOut( $fname );
+                       return '';
+               }
                
                $s = $dbr->fetchObject( $res );
-               if(!$s) {
+               if( !$s ) {
                        # Cache non-existence: create a blank object and save it to memcached
                        $s = (object)false;
                        $s->iw_url = '';
@@ -378,6 +411,8 @@ class Title {
                }
                $wgMemc->set( $k, $s, $wgInterwikiExpiry );
                $wgTitleInterwikiCache[$k] = $s;
+               
+               wfProfileOut( $fname );
                return $s->iw_url;
        }
 
@@ -466,12 +501,6 @@ class Title {
         * @access public
         */
        function getNamespace() { return $this->mNamespace; }
-       /**
-        * Set the namespace index
-        * @param int $n the namespace index, one of the NS_xxxx constants
-        * @access public
-        */
-       function setNamespace( $n ) { $this->mNamespace = IntVal( $n ); }
        /**
         * Get the interwiki prefix (or null string)
         * @return string
@@ -556,8 +585,6 @@ class Title {
                $s = wfUrlencode ( $s ) ;
                
                # Cleaning up URL to make it look nice -- is this safe?
-               $s = preg_replace( '/%3[Aa]/', ':', $s );
-               $s = preg_replace( '/%2[Ff]/', '/', $s );
                $s = str_replace( '%28', '(', $s );
                $s = str_replace( '%29', ')', $s );
 
@@ -691,33 +718,21 @@ class Title {
 
        /**
         * Does the title correspond to a protected article?
+        * @param string $what the action the page is protected from,
+        *      by default checks move and edit
         * @return boolean
         * @access public
         */
-       function isProtected() {
+       function isProtected($action = '') {
                if ( -1 == $this->mNamespace ) { return true; }
-               $a = $this->getRestrictions();
-               if ( in_array( 'sysop', $a ) ) { return true; }
-               return false;
-       }
-
-       /**
-        * Is the page a log page, i.e. one where the history is messed up by 
-        * LogPage.php? This used to be used for suppressing diff links in
-        * recent changes, but now that's done by setting a flag in the
-        * recentchanges table. Hence, this probably is no longer used.
-        *
-        * @deprecated
-        * @access public
-        */
-       function isLog() {
-               if ( $this->mNamespace != Namespace::getWikipedia() ) {
-                       return false;
-               }
-               if ( ( 0 == strcmp( wfMsg( 'uploadlogpage' ), $this->mDbkeyform ) ) ||
-                 ( 0 == strcmp( wfMsg( 'dellogpage' ), $this->mDbkeyform ) ) ) {
-                       return true;
-               }
+               if($action == 'edit' || $action == '') {
+                       $a = $this->getRestrictions("edit");
+                       if ( in_array( 'sysop', $a ) ) { return true; }
+               }
+               if($action == 'move' || $action == '') {
+                       $a = $this->getRestrictions("move");
+                       if ( in_array( 'sysop', $a ) ) { return true; } 
+               }       
                return false;
        }
 
@@ -735,22 +750,29 @@ class Title {
                return $wgUser->isWatched( $this );
        }
 
-       /**
-        * Can $wgUser edit this page?
+       /**
+        * Is $wgUser perform $action this page?
+        * @param string $action action that permission needs to be checked for
         * @return boolean
-        * @access public
-        */
-       function userCanEdit() {
+        * @access private
+        */
+       function userCan($action) {
+               $fname = 'Title::userCanEdit';
+               wfProfileIn( $fname );
+               
                global $wgUser;
                if( NS_SPECIAL == $this->mNamespace ) {
+                       wfProfileOut( $fname );
                        return false;
                }
                if( NS_MEDIAWIKI == $this->mNamespace &&
                    !$wgUser->isAllowed('editinterface') ) {
+                       wfProfileOut( $fname );
                        return false;
                }
                if( $this->mDbkeyform == '_' ) {
                        # FIXME: Is this necessary? Shouldn't be allowed anyway...
+                       wfProfileOut( $fname );
                        return false;
                }
                
@@ -758,6 +780,7 @@ class Title {
                if ( NS_MEDIAWIKI == $this->mNamespace 
                 && preg_match("/\\.(css|js)$/", $this->mTextform )
                     && !$wgUser->isAllowed('editinterface') ) {
+                       wfProfileOut( $fname );
                        return false;
                }
                
@@ -768,17 +791,38 @@ class Title {
                        && preg_match("/\\.(css|js)$/", $this->mTextform )
                        && !$wgUser->isAllowed('editinterface')
                        && !preg_match('/^'.preg_quote($wgUser->getName(), '/').'\//', $this->mTextform) ) {
+                       wfProfileOut( $fname );
                        return false;
                }
 
-               foreach( $this->getRestrictions() as $right ) {
+               foreach( $this->getRestrictions($action) as $right ) {
                        if( '' != $right && !$wgUser->isAllowed( $right ) ) {
+                               wfProfileOut( $fname );
                                return false;
                        }
                }
+               wfProfileOut( $fname );
                return true;
        }
 
+       /**
+        * Can $wgUser edit this page?
+        * @return boolean
+        * @access public
+        */
+       function userCanEdit() {
+               return $this->userCan('edit');
+       }
+       
+       /**
+        * Can $wgUser move this page?
+        * @return boolean
+        * @access public
+        */     
+       function userCanMove() {
+               return $this->userCan('move');
+       }
+
        /**
         * Can $wgUser read this page?
         * @return boolean
@@ -822,7 +866,7 @@ class Title {
         * @access public
         */
        function isCssJsSubpage() {
-               return ( Namespace::getUser() == $this->mNamespace and preg_match("/\\.(css|js)$/", $this->mTextform ) );
+               return ( NS_USER == $this->mNamespace and preg_match("/\\.(css|js)$/", $this->mTextform ) );
        }
        /**
         * Is this a .css subpage of a user page?
@@ -830,7 +874,7 @@ class Title {
         * @access public
         */
        function isCssSubpage() {
-               return ( Namespace::getUser() == $this->mNamespace and preg_match("/\\.css$/", $this->mTextform ) );
+               return ( NS_USER == $this->mNamespace and preg_match("/\\.css$/", $this->mTextform ) );
        }
        /**
         * Is this a .js subpage of a user page?
@@ -838,7 +882,7 @@ class Title {
         * @access public
         */
        function isJsSubpage() {
-               return ( Namespace::getUser() == $this->mNamespace and preg_match("/\\.js$/", $this->mTextform ) );
+               return ( NS_USER == $this->mNamespace and preg_match("/\\.js$/", $this->mTextform ) );
        }
        /**
         * Protect css/js subpages of user pages: can $wgUser edit
@@ -853,22 +897,44 @@ class Title {
                return ( $wgUser->isAllowed('editinterface') or preg_match('/^'.preg_quote($wgUser->getName(), '/').'\//', $this->mTextform) );
        }
 
+       /**
+        * Loads a string into mRestrictions array
+        * @param string $res restrictions in string format      
+        * @access public
+        */
+       function loadRestrictions( $res ) {
+               foreach( explode( ':', trim( $res ) ) as $restrict ) {
+                       $temp = explode( '=', trim( $restrict ) );
+                       if(count($temp) == 1) {
+                               // old format should be treated as edit/move restriction
+                               $this->mRestrictions["edit"] = explode( ',', trim( $temp[0] ) );
+                               $this->mRestrictions["move"] = explode( ',', trim( $temp[0] ) );
+                       } else {
+                               $this->mRestrictions[$temp[0]] = explode( ',', trim( $temp[1] ) );
+                       }
+               }
+               $this->mRestrictionsLoaded = true;
+       }
+
        /**
         * Accessor/initialisation for mRestrictions
+        * @param string $action action that permission needs to be checked for  
         * @return array the array of groups allowed to edit this article
         * @access public
         */
-       function getRestrictions() {
+       function getRestrictions($action) {
                $id = $this->getArticleID();
                if ( 0 == $id ) { return array(); }
 
                if ( ! $this->mRestrictionsLoaded ) {
                        $dbr =& wfGetDB( DB_SLAVE );
                        $res = $dbr->selectField( 'cur', 'cur_restrictions', 'cur_id='.$id );
-                       $this->mRestrictions = explode( ',', trim( $res ) );
-                       $this->mRestrictionsLoaded = true;
+                       $this->loadRestrictions( $res );
+               }
+               if( isset( $this->mRestrictions[$action] ) ) {
+                       return $this->mRestrictions[$action];
                }
-               return $this->mRestrictions;
+               return array();
        }
        
        /**
@@ -979,8 +1045,7 @@ class Title {
         * @return bool true on success
         * @access private
         */
-       /* private */ function secureAndSplit()
-       {
+       /* private */ function secureAndSplit() {
                global $wgContLang, $wgLocalInterwiki, $wgCapitalLinks;
                $fname = 'Title::secureAndSplit';
                wfProfileIn( $fname );
@@ -990,9 +1055,9 @@ class Title {
 
                # Initialisation
                if ( $imgpre === false ) {
-                       $imgpre = ':' . $wgContLang->getNsText( Namespace::getImage() ) . ':';
+                       $imgpre = ':' . $wgContLang->getNsText( NS_IMAGE ) . ':';
                        # % is needed as well
-                       $rxTc = '/[^' . Title::legalChars() . ']|%[0-9A-Fa-f]{2}/';
+                       $rxTc = '/[^' . Title::legalChars() . ']|%[0-9A-Fa-f]{2}/S';
                }
 
                $this->mInterwiki = $this->mFragment = '';
@@ -1029,7 +1094,7 @@ class Title {
                        $this->mNamespace = NS_MAIN;
                } else {
                        # Namespace or interwiki prefix
-                       if ( preg_match( "/^(.+?)_*:_*(.*)$/", $t, $m ) ) {
+                       if ( preg_match( "/^(.+?)_*:_*(.*)$/S", $t, $m ) ) {
                                #$p = strtolower( $m[1] );
                                $p = $m[1];
                                $lowerNs = strtolower( $p );
@@ -1081,7 +1146,11 @@ class Title {
                        return false;
                }
                
-               # "." and ".." conflict with the directories of those namesa
+               /**
+                * Pages with "/./" or "/../" appearing in the URLs will
+                * often be unreachable due to the way web browsers deal
+                * with 'relative' URLs. Forbid them explicitly.
+                */
                if ( strpos( $r, '.' ) !== false &&
                     ( $r === '.' || $r === '..' ||
                       strpos( $r, './' ) === 0  ||
@@ -1099,7 +1168,14 @@ class Title {
                        return false;
                }
 
-               # Initial capital letter
+               /**
+                * Normally, all wiki links are forced to have
+                * an initial capital letter so [[foo]] and [[Foo]]
+                * point to the same place.
+                *
+                * Don't force it for interwikis, since the other
+                * site might be case-sensitive.
+                */
                if( $wgCapitalLinks && $this->mInterwiki == '') {
                        $t = $wgContLang->ucfirst( $r );
                } else {