Unicode space separator characters (Zs) now terminates links
authorAntoine Musso <hashar@users.mediawiki.org>
Wed, 27 Jul 2011 18:03:01 +0000 (18:03 +0000)
committerAntoine Musso <hashar@users.mediawiki.org>
Wed, 27 Jul 2011 18:03:01 +0000 (18:03 +0000)
commit176f91596c80cf5e41484c7377d809d09f0ecbf7
tree1280c71079068014e3428f7a69616efd7bb2e664
parent3ac5f41d3a2df46ceea69d22e3512d9b21c63db3
Unicode space separator characters (Zs) now terminates links

Fix 19052 which was only reporting the issue for U+3000 IDEOGRAPHIC SPACE.
Covers both external links and images links. See parser tests for examples.

Unicode 'Zs' includes all characters from the 'separator, space' category.
Characters part of this category are:

Char    Name
U+0020  SPACE
U+00A0  NO-BREAK SPACE
U+1680  OGHAM SPACE MARK
U+180E  MONGOLIAN VOWEL SEPARATOR
U+2000  EN QUAD
U+2001  EM QUAD
U+2002  EN SPACE
U+2003  EM SPACE
U+2004  THREE-PER-EM SPACE
U+2005  FOUR-PER-EM SPACE
U+2006  SIX-PER-EM SPACE
U+2007  FIGURE SPACE
U+2008  PUNCTUATION SPACE
U+2009  THIN SPACE
U+200A  HAIR SPACE
U+202F  NARROW NO-BREAK SPACE
U+205F  MEDIUM MATHEMATICAL SPACE
U+3000  IDEOGRAPHIC SPACE

TEST PLAN:

$ php parserTests.php --quiet
This is MediaWiki version 1.19alpha (r93258).

Reading tests from "tests/parser/parserTests.txt"...
Reading tests from "tests/parser/extraParserTests.txt"...
Reading tests from "../mwexts/LabeledSectionTransclusion/lstParserTests.txt"...
Passed 686 of 686 tests (100%)... ALL TESTS PASSED!

Sounds good :-)
RELEASE-NOTES-1.19
includes/parser/Parser.php
tests/parser/parserTests.txt