html5lib/html5lib-pythonPublic

NotificationsYou must be signed in to change notification settings
Fork294
Star1.2k

Commit96da7f5

ambv

authored and

gsnedders

committed

Removesimpletree, changing the default tree builder toetree.

1 parentb0dda81 commit96da7f5Copy full SHA for 96da7f5

File tree

15 files changed

+95

-413

lines changed

CHANGES.rst
html5lib
- html5parser.py
- serializer
  - __init__.py
- tests
- treebuilders
- treewalkers
  - __init__.py
  - simpletree.py
utils
- spider.py

15 files changed

+95

-413

lines changed

`‎CHANGES.rst`

Lines changed: 4 additions & 0 deletions

Original file line number	Diff line number	Diff line change
`@@ -6,6 +6,10 @@ Change Log`
`6`	`6`
`7`	`7`	`Released on XXX, 2013`
`8`	`8`
	`9`	+* Removed ``simpletree`` from the package. The default tree builder is
	`10`	+ now ``etree`` (using the ``xml.etree.ElementTree/cElementTree``
	`11`	`+ implementation).`
	`12`	`+`
`9`	`13`
`10`	`14`	`0.95`
`11`	`15`	`~~~~`

`‎html5lib/html5parser.py`

Lines changed: 6 additions & 6 deletions

Original file line number	Diff line number	Diff line change
`@@ -8,7 +8,6 @@`
`8`	`8`
`9`	`9`	`from .importtreebuilders`
`10`	`10`	`from .treebuilders._baseimportMarker`
`11`		`-from .treebuildersimportsimpletree`
`12`	`11`
`13`	`12`	`from .importutils`
`14`	`13`	`from .importconstants`
`@@ -20,15 +19,15 @@`
`20`	`19`	`from .constantsimporthtmlIntegrationPointElements,mathmlTextIntegrationPointElements`
`21`	`20`
`22`	`21`
`23`		`-defparse(doc,treebuilder="simpletree",encoding=None,`
	`22`	`+defparse(doc,treebuilder="etree",encoding=None,`
`24`	`23`	`namespaceHTMLElements=True):`
`25`	`24`	`"""Parse a string or file-like object into a tree"""`
`26`	`25`	`tb=treebuilders.getTreeBuilder(treebuilder)`
`27`	`26`	`p=HTMLParser(tb,namespaceHTMLElements=namespaceHTMLElements)`
`28`	`27`	`returnp.parse(doc,encoding=encoding)`
`29`	`28`
`30`	`29`
`31`		`-defparseFragment(doc,container="div",treebuilder="simpletree",encoding=None,`
	`30`	`+defparseFragment(doc,container="div",treebuilder="etree",encoding=None,`
`32`	`31`	`namespaceHTMLElements=True):`
`33`	`32`	`tb=treebuilders.getTreeBuilder(treebuilder)`
`34`	`33`	`p=HTMLParser(tb,namespaceHTMLElements=namespaceHTMLElements)`
`@@ -51,9 +50,8 @@ class HTMLParser(object):`
`51`	`50`	`"""HTML parser. Generates a tree structure from a stream of (possibly`
`52`	`51`	`malformed) HTML"""`
`53`	`52`
`54`		`-def__init__(self,tree=simpletree.TreeBuilder,`
`55`		`-tokenizer=tokenizer.HTMLTokenizer,strict=False,`
`56`		`-namespaceHTMLElements=True,debug=False):`
	`53`	`+def__init__(self,tree=None,tokenizer=tokenizer.HTMLTokenizer,`
	`54`	`+strict=False,namespaceHTMLElements=True,debug=False):`
`57`	`55`	`"""`
`58`	`56`	`strict - raise an exception when a parse error is encountered`
`59`	`57`
`@@ -69,6 +67,8 @@ def __init__(self, tree=simpletree.TreeBuilder,`
`69`	`67`	`# Raise an exception on the first error encountered`
`70`	`68`	`self.strict=strict`
`71`	`69`
	`70`	`+iftreeisNone:`
	`71`	`+tree=treebuilders.getTreeBuilder("etree")`
`72`	`72`	`self.tree=tree(namespaceHTMLElements)`
`73`	`73`	`self.tokenizer_class=tokenizer`
`74`	`74`	`self.errors= []`

`‎html5lib/serializer/init.py`

Lines changed: 1 addition & 1 deletion

Original file line number	Diff line number	Diff line change
`@@ -5,7 +5,7 @@`
`5`	`5`	`from .htmlserializerimportHTMLSerializer`
`6`	`6`
`7`	`7`
`8`		`-defserialize(input,tree="simpletree",format="html",encoding=None,`
	`8`	`+defserialize(input,tree="etree",format="html",encoding=None,`
`9`	`9`	`**serializer_opts):`
`10`	`10`	`# XXX: Should we cache this?`
`11`	`11`	`walker=treewalkers.getTreeWalker(tree)`

`‎html5lib/tests/support.py`

Lines changed: 2 additions & 3 deletions

Original file line number	Diff line number	Diff line change
`@@ -16,8 +16,7 @@`
`16`	`16`	`delbase_path`
`17`	`17`
`18`	`18`	`# Build a dict of avaliable trees`
`19`		`-treeTypes= {"simpletree":treebuilders.getTreeBuilder("simpletree"),`
`20`		`-"DOM":treebuilders.getTreeBuilder("dom")}`
	`19`	`+treeTypes= {"DOM":treebuilders.getTreeBuilder("dom")}`
`21`	`20`
`22`	`21`	`# Try whatever etree implementations are avaliable from a list that are`
`23`	`22`	`#"supposed" to work`
`@@ -64,7 +63,7 @@ def __getitem__(self, key):`
`64`	`63`
`65`	`64`	`classTestData(object):`
`66`	`65`	`def__init__(self,filename,newTestHeading="data",encoding="utf8"):`
`67`		`-ifencoding==None:`
	`66`	`+ifencodingisNone:`
`68`	`67`	`self.f=open(filename,mode="rb")`
`69`	`68`	`else:`
`70`	`69`	`self.f=codecs.open(filename,encoding=encoding)`

`‎html5lib/tests/test_parser2.py`

Lines changed: 21 additions & 8 deletions

Original file line number	Diff line number	Diff line change
`@@ -5,7 +5,7 @@`
`5`	`5`	`from .importsupport# flake8: noqa`
`6`	`6`	`fromhtml5libimporthtml5parser`
`7`	`7`	`fromhtml5lib.constantsimportnamespaces`
`8`		`-fromhtml5lib.treebuildersimportdom`
	`8`	`+fromhtml5libimporttreebuilders`
`9`	`9`
`10`	`10`	`importunittest`
`11`	`11`
`@@ -14,29 +14,42 @@`
`14`	`14`
`15`	`15`	`classMoreParserTests(unittest.TestCase):`
`16`	`16`
	`17`	`+defsetUp(self):`
	`18`	`+self.dom_tree=treebuilders.getTreeBuilder("dom")`
	`19`	`+`
`17`	`20`	`deftest_assertDoctypeCloneable(self):`
`18`		`-parser=html5parser.HTMLParser(tree=dom.TreeBuilder)`
	`21`	`+parser=html5parser.HTMLParser(tree=self.dom_tree)`
`19`	`22`	`doc=parser.parse('<!DOCTYPE HTML>')`
`20`	`23`	`self.assertTrue(doc.cloneNode(True))`
`21`	`24`
`22`	`25`	`deftest_line_counter(self):`
`23`	`26`	`# http://groups.google.com/group/html5lib-discuss/browse_frm/thread/f4f00e4a2f26d5c0`
`24`		`-parser=html5parser.HTMLParser(tree=dom.TreeBuilder)`
	`27`	`+parser=html5parser.HTMLParser(tree=self.dom_tree)`
`25`	`28`	`parser.parse("<pre>\nx\n>\n</pre>")`
`26`	`29`
`27`		`-deftest_namespace_html_elements_0(self):`
	`30`	`+deftest_namespace_html_elements_0_dom(self):`
	`31`	`+parser=html5parser.HTMLParser(tree=self.dom_tree,namespaceHTMLElements=True)`
	`32`	`+doc=parser.parse("<html></html>")`
	`33`	`+self.assertTrue(doc.childNodes[0].namespaceURI==namespaces["html"])`
	`34`	`+`
	`35`	`+deftest_namespace_html_elements_1_dom(self):`
	`36`	`+parser=html5parser.HTMLParser(tree=self.dom_tree,namespaceHTMLElements=False)`
	`37`	`+doc=parser.parse("<html></html>")`
	`38`	`+self.assertTrue(doc.childNodes[0].namespaceURIisNone)`
	`39`	`+`
	`40`	`+deftest_namespace_html_elements_0_etree(self):`
`28`	`41`	`parser=html5parser.HTMLParser(namespaceHTMLElements=True)`
`29`	`42`	`doc=parser.parse("<html></html>")`
`30`		`-self.assertTrue(doc.childNodes[0].namespace==namespaces["html"])`
	`43`	`+self.assertTrue(list(doc)[0].tag=="{%s}html"% (namespaces["html"],))`
`31`	`44`
`32`		`-deftest_namespace_html_elements_1(self):`
	`45`	`+deftest_namespace_html_elements_1_etree(self):`
`33`	`46`	`parser=html5parser.HTMLParser(namespaceHTMLElements=False)`
`34`	`47`	`doc=parser.parse("<html></html>")`
`35`		`-self.assertTrue(doc.childNodes[0].namespace==None)`
	`48`	`+self.assertTrue(list(doc)[0].tag=="html")`
`36`	`49`
`37`	`50`	`deftest_unicode_file(self):`
`38`	`51`	`parser=html5parser.HTMLParser()`
`39`		`-doc=parser.parse(io.StringIO("a"))`
	`52`	`+parser.parse(io.StringIO("a"))`
`40`	`53`
`41`	`54`
`42`	`55`	`defbuildTestSuite():`

`‎html5lib/tests/test_sanitizer.py`

Lines changed: 42 additions & 17 deletions

Original file line number	Diff line number	Diff line change
`@@ -5,27 +5,43 @@`
`5`	`5`	`exceptImportError:`
`6`	`6`	`importsimplejsonasjson`
`7`	`7`
`8`		`-fromhtml5libimporthtml5parser,sanitizer,constants`
	`8`	`+fromhtml5libimporthtml5parser,sanitizer,constants,treebuilders`
`9`	`9`
`10`	`10`
`11`		`-defrunSanitizerTest(name,expected,input):`
`12`		`-expected=''.join([token.toxml()fortokeninhtml5parser.HTMLParser().`
`13`		`-parseFragment(expected).childNodes])`
	`11`	`+deftoxmlFactory():`
	`12`	`+tree=treebuilders.getTreeBuilder("etree")`
	`13`	`+`
	`14`	`+deftoxml(element):`
	`15`	`+# encode/decode roundtrip required for Python 2.6 compatibility`
	`16`	`+result_bytes=tree.implementation.tostring(element,encoding="utf-8")`
	`17`	`+returnresult_bytes.decode("utf-8")`
	`18`	`+`
	`19`	`+returntoxml`
	`20`	`+`
	`21`	`+`
	`22`	`+defrunSanitizerTest(name,expected,input,toxml=None):`
	`23`	`+iftoxmlisNone:`
	`24`	`+toxml=toxmlFactory()`
	`25`	`+expected=''.join([toxml(token)fortokeninhtml5parser.HTMLParser().`
	`26`	`+parseFragment(expected)])`
`14`	`27`	`expected=json.loads(json.dumps(expected))`
`15`	`28`	`assertexpected==sanitize_html(input)`
`16`	`29`
`17`	`30`
`18`		`-defsanitize_html(stream):`
`19`		`-return''.join([token.toxml()fortokenin`
	`31`	`+defsanitize_html(stream,toxml=None):`
	`32`	`+iftoxmlisNone:`
	`33`	`+toxml=toxmlFactory()`
	`34`	`+return''.join([toxml(token)fortokenin`
`20`	`35`	`html5parser.HTMLParser(tokenizer=sanitizer.HTMLSanitizer).`
`21`		`-parseFragment(stream).childNodes])`
	`36`	`+parseFragment(stream)])`
`22`	`37`
`23`	`38`
`24`	`39`	`deftest_should_handle_astral_plane_characters():`
`25`		`-assert"<p>\U0001d4b5\U0001d538</p>"==sanitize_html("<p>𝒵 𝔸</p>")`
	`40`	`+assert'<html:p xmlns:html="http://www.w3.org/1999/xhtml">\U0001d4b5\U0001d538</html:p>'==sanitize_html("<p>𝒵 𝔸</p>")`
`26`	`41`
`27`	`42`
`28`	`43`	`deftest_sanitizer():`
	`44`	`+toxml=toxmlFactory()`
`29`	`45`	`fortag_nameinsanitizer.HTMLSanitizer.allowed_elements:`
`30`	`46`	`iftag_namein ['caption','col','colgroup','optgroup','option','table','tbody','td','tfoot','th','thead','tr']:`
`31`	`47`	`continue# TODO`
`@@ -34,25 +50,30 @@ def test_sanitizer():`
`34`	`50`	`iftag_name=='image':`
`35`	`51`	`yield (runSanitizerTest,"test_should_allow_%s_tag"%tag_name,`
`36`	`52`	`"<img title=\"1\"/>foo <bad>bar</bad> baz",`
`37`		`-"<%s title='1'>foo <bad>bar</bad> baz</%s>"% (tag_name,tag_name))`
	`53`	`+"<%s title='1'>foo <bad>bar</bad> baz</%s>"% (tag_name,tag_name),`
	`54`	`+toxml)`
`38`	`55`	`eliftag_name=='br':`
`39`	`56`	`yield (runSanitizerTest,"test_should_allow_%s_tag"%tag_name,`
`40`	`57`	`"<br title=\"1\"/>foo <bad>bar</bad> baz<br/>",`
`41`		`-"<%s title='1'>foo <bad>bar</bad> baz</%s>"% (tag_name,tag_name))`
	`58`	`+"<%s title='1'>foo <bad>bar</bad> baz</%s>"% (tag_name,tag_name),`
	`59`	`+toxml)`
`42`	`60`	`eliftag_nameinconstants.voidElements:`
`43`	`61`	`yield (runSanitizerTest,"test_should_allow_%s_tag"%tag_name,`
`44`	`62`	`"<%s title=\"1\"/>foo <bad>bar</bad> baz"%tag_name,`
`45`		`-"<%s title='1'>foo <bad>bar</bad> baz</%s>"% (tag_name,tag_name))`
	`63`	`+"<%s title='1'>foo <bad>bar</bad> baz</%s>"% (tag_name,tag_name),`
	`64`	`+toxml)`
`46`	`65`	`else:`
`47`	`66`	`yield (runSanitizerTest,"test_should_allow_%s_tag"%tag_name,`
`48`	`67`	`"<%s title=\"1\">foo <bad>bar</bad> baz</%s>"% (tag_name,tag_name),`
`49`		`-"<%s title='1'>foo <bad>bar</bad> baz</%s>"% (tag_name,tag_name))`
	`68`	`+"<%s title='1'>foo <bad>bar</bad> baz</%s>"% (tag_name,tag_name),`
	`69`	`+toxml)`
`50`	`70`
`51`	`71`	`fortag_nameinsanitizer.HTMLSanitizer.allowed_elements:`
`52`	`72`	`tag_name=tag_name.upper()`
`53`	`73`	`yield (runSanitizerTest,"test_should_forbid_%s_tag"%tag_name,`
`54`	`74`	`"<%s title=\"1\">foo <bad>bar</bad> baz</%s>"% (tag_name,tag_name),`
`55`		`-"<%s title='1'>foo <bad>bar</bad> baz</%s>"% (tag_name,tag_name))`
	`75`	`+"<%s title='1'>foo <bad>bar</bad> baz</%s>"% (tag_name,tag_name),`
	`76`	`+toxml)`
`56`	`77`
`57`	`78`	`forattribute_nameinsanitizer.HTMLSanitizer.allowed_attributes:`
`58`	`79`	`ifattribute_name!=attribute_name.lower():`
`@@ -61,20 +82,24 @@ def test_sanitizer():`
`61`	`82`	`continue`
`62`	`83`	`yield (runSanitizerTest,"test_should_allow_%s_attribute"%attribute_name,`
`63`	`84`	`"<p %s=\"foo\">foo <bad>bar</bad> baz</p>"%attribute_name,`
`64`		`-"<p %s='foo'>foo <bad>bar</bad> baz</p>"%attribute_name)`
	`85`	`+"<p %s='foo'>foo <bad>bar</bad> baz</p>"%attribute_name,`
	`86`	`+toxml)`
`65`	`87`
`66`	`88`	`forattribute_nameinsanitizer.HTMLSanitizer.allowed_attributes:`
`67`	`89`	`attribute_name=attribute_name.upper()`
`68`	`90`	`yield (runSanitizerTest,"test_should_forbid_%s_attribute"%attribute_name,`
`69`	`91`	`"<p>foo <bad>bar</bad> baz</p>",`
`70`		`-"<p %s='display: none;'>foo <bad>bar</bad> baz</p>"%attribute_name)`
	`92`	`+"<p %s='display: none;'>foo <bad>bar</bad> baz</p>"%attribute_name,`
	`93`	`+toxml)`
`71`	`94`
`72`	`95`	`forprotocolinsanitizer.HTMLSanitizer.allowed_protocols:`
`73`	`96`	`yield (runSanitizerTest,"test_should_allow_%s_uris"%protocol,`
`74`	`97`	`"<a href=\"%s\">foo</a>"%protocol,`
`75`		`-"""<a href="%s">foo</a>"""%protocol)`
	`98`	`+"""<a href="%s">foo</a>"""%protocol,`
	`99`	`+toxml)`
`76`	`100`
`77`	`101`	`forprotocolinsanitizer.HTMLSanitizer.allowed_protocols:`
`78`	`102`	`yield (runSanitizerTest,"test_should_allow_uppercase_%s_uris"%protocol,`
`79`	`103`	`"<a href=\"%s\">foo</a>"%protocol,`
`80`		`-"""<a href="%s">foo</a>"""%protocol)`
	`104`	`+"""<a href="%s">foo</a>"""%protocol,`
	`105`	`+toxml)`

`‎html5lib/tests/test_treewalkers.py`

Lines changed: 7 additions & 9 deletions

Original file line number	Diff line number	Diff line change
`@@ -45,13 +45,11 @@ def PullDOMAdapter(node):`
`45`	`45`	`raiseNotImplementedError("Node type not supported: "+str(node.nodeType))`
`46`	`46`
`47`	`47`	`treeTypes= {`
`48`		`-"simpletree": {"builder":treebuilders.getTreeBuilder("simpletree"),`
`49`		`-"walker":treewalkers.getTreeWalker("simpletree")},`
`50`		`-"DOM": {"builder":treebuilders.getTreeBuilder("dom"),`
`51`		`-"walker":treewalkers.getTreeWalker("dom")},`
`52`		`-"PullDOM": {"builder":treebuilders.getTreeBuilder("dom"),`
`53`		`-"adapter":PullDOMAdapter,`
`54`		`-"walker":treewalkers.getTreeWalker("pulldom")},`
	`48`	`+"DOM": {"builder":treebuilders.getTreeBuilder("dom"),`
	`49`	`+"walker":treewalkers.getTreeWalker("dom")},`
	`50`	`+"PullDOM": {"builder":treebuilders.getTreeBuilder("dom"),`
	`51`	`+"adapter":PullDOMAdapter,`
	`52`	`+"walker":treewalkers.getTreeWalker("pulldom")},`
`55`	`53`	`}`
`56`	`54`
`57`	`55`	`# Try whatever etree implementations are available from a list that are`
`@@ -103,7 +101,7 @@ def PullDOMAdapter(node):`
`103`	`101`	`else:`
`104`	`102`	`defGenshiAdapter(tree):`
`105`	`103`	`text=None`
`106`		`-fortokenintreewalkers.getTreeWalker("simpletree")(tree):`
	`104`	`+fortokenintreewalkers.getTreeWalker("dom")(tree):`
`107`	`105`	`type=token["type"]`
`108`	`106`	`iftypein ("Characters","SpaceCharacters"):`
`109`	`107`	`iftextisNone:`
`@@ -147,7 +145,7 @@ def GenshiAdapter(tree):`
`147`	`145`	`yieldTEXT,text, (None,-1,-1)`
`148`	`146`
`149`	`147`	`treeTypes["genshi"]= \`
`150`		`- {"builder":treebuilders.getTreeBuilder("simpletree"),`
	`148`	`+ {"builder":treebuilders.getTreeBuilder("dom"),`
`151`	`149`	`"adapter":GenshiAdapter,`
`152`	`150`	`"walker":treewalkers.getTreeWalker("genshi")}`
`153`	`151`

`‎html5lib/treebuilders/init.py`

Lines changed: 2 additions & 11 deletions

Original file line number	Diff line number	Diff line change
`@@ -7,7 +7,7 @@`
`7`	`7`	`1) A set of classes for various types of elements: Document, Doctype,`
`8`	`8`	`Comment, Element. These must implement the interface of`
`9`	`9`	`_base.treebuilders.Node (although comment nodes have a different`
`10`		`-signature for their constructor, see treebuilders.simpletree.Comment)`
	`10`	`+signature for their constructor, see treebuilders.etree.Comment)`
`11`	`11`	`Textual content may also be implemented as another node type, or not, as`
`12`	`12`	`your tree implementation requires.`
`13`	`13`
`@@ -24,10 +24,6 @@`
`24`	`24`	`testSerializer method on your treebuilder which accepts a node and`
`25`	`25`	`returns a string containing Node and its children serialized according`
`26`	`26`	`to the format used in the unittests`
`27`		`-`
`28`		`-The supplied simpletree module provides a python-only implementation`
`29`		`-of a full treebuilder and is a useful reference for the semantics of`
`30`		`-the various methods.`
`31`	`27`	`"""`
`32`	`28`
`33`	`29`	`from __future__importabsolute_import,division,unicode_literals`
`@@ -39,10 +35,8 @@ def getTreeBuilder(treeType, implementation=None, **kwargs):`
`39`	`35`	`"""Get a TreeBuilder class for various types of tree with built-in support`
`40`	`36`
`41`	`37`	`treeType - the name of the tree type required (case-insensitive). Supported`
`42`		`- values are "simpletree", "dom", and "etree"`
	`38`	`+ values are:`
`43`	`39`
`44`		`- "simpletree" - a built-in DOM-ish tree type with support for some`
`45`		`- more pythonic idioms.`
`46`	`40`	`"dom" - A generic builder for DOM implementations, defaulting to`
`47`	`41`	`a xml.dom.minidom based implementation for the sake of`
`48`	`42`	`backwards compatibility (as releases up until 0.10 had a`
`@@ -65,9 +59,6 @@ def getTreeBuilder(treeType, implementation=None, **kwargs):`
`65`	`59`	`implementation=minidom`
`66`	`60`	`# XXX: NEVER cache here, caching is done in the dom submodule`
`67`	`61`	`returndom.getDomModule(implementation,**kwargs).TreeBuilder`
`68`		`-eliftreeType=="simpletree":`
`69`		`-from .importsimpletree`
`70`		`-treeBuilderCache[treeType]=simpletree.TreeBuilder`
`71`	`62`	`eliftreeType=="lxml":`
`72`	`63`	`from .importetree_lxml`
`73`	`64`	`treeBuilderCache[treeType]=etree_lxml.TreeBuilder`

`‎html5lib/treebuilders/dom.py`

Lines changed: 1 addition & 0 deletions

Original file line number	Diff line number	Diff line change
`@@ -163,6 +163,7 @@ def insertText(self, data, parent=None):`
`163`	`163`	`self.dom._child_node_types.append(Node.TEXT_NODE)`
`164`	`164`	`self.dom.appendChild(self.dom.createTextNode(data))`
`165`	`165`
	`166`	`+implementation=DomImplementation`
`166`	`167`	`name=None`
`167`	`168`
`168`	`169`	`deftestSerializer(element):`

`‎html5lib/treebuilders/etree.py`

Lines changed: 1 addition & 0 deletions

Original file line number	Diff line number	Diff line change
`@@ -313,6 +313,7 @@ class TreeBuilder(_base.TreeBuilder):`
`313`	`313`	`elementClass=Element`
`314`	`314`	`commentClass=Comment`
`315`	`315`	`fragmentClass=DocumentFragment`
	`316`	`+implementation=ElementTreeImplementation`
`316`	`317`
`317`	`318`	`deftestSerializer(self,element):`
`318`	`319`	`returntestSerializer(element)`

`‎html5lib/treebuilders/etree_lxml.py`

Lines changed: 4 additions & 3 deletions

Original file line number	Diff line number	Diff line change
`@@ -122,7 +122,7 @@ def serializeElement(element, indent=0):`
`122`	`122`	`ifelement.text:`
`123`	`123`	`rv.append("\|%s\"%s\""% (' '* (indent+2),element.text))`
`124`	`124`	`indent+=2`
`125`		`-forchildinelement.getchildren():`
	`125`	`+forchildinelement:`
`126`	`126`	`serializeElement(child,indent)`
`127`	`127`	`ifhasattr(element,"tail")andelement.tail:`
`128`	`128`	`rv.append("\|%s\"%s\""% (' '* (indent-2),element.tail))`
`@@ -163,7 +163,7 @@ def serializeElement(element):`
`163`	`163`	`ifelement.text:`
`164`	`164`	`rv.append(element.text)`
`165`	`165`
`166`		`-forchildinelement.getchildren():`
	`166`	`+forchildinelement:`
`167`	`167`	`serializeElement(child)`
`168`	`168`
`169`	`169`	`rv.append("</%s>"% (element.tag,))`
`@@ -185,6 +185,7 @@ class TreeBuilder(_base.TreeBuilder):`
`185`	`185`	`elementClass=None`
`186`	`186`	`commentClass=None`
`187`	`187`	`fragmentClass=Document`
	`188`	`+implementation=etree`
`188`	`189`
`189`	`190`	`def__init__(self,namespaceHTMLElements,fullTree=False):`
`190`	`191`	`builder=etree_builders.getETreeModule(etree,fullTree=fullTree)`
`@@ -280,7 +281,7 @@ def getFragment(self):`
`280`	`281`	`element=self.openElements[0]._element`
`281`	`282`	`ifelement.text:`
`282`	`283`	`fragment.append(element.text)`
`283`		`-fragment.extend(element.getchildren())`
	`284`	`+fragment.extend(list(element))`
`284`	`285`	`ifelement.tail:`
`285`	`286`	`fragment.append(element.tail)`
`286`	`287`	`returnfragment`

0 commit comments

Comments

(0)

Movatterモバイル変換

Navigation Menu

Search code, repositories, users, issues, pull requests...

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Commit96da7f5

File tree

15 files changed

15 files changed

`‎CHANGES.rst`

`‎html5lib/html5parser.py`

`‎html5lib/serializer/init.py`

`‎html5lib/tests/support.py`

`‎html5lib/tests/test_parser2.py`

`‎html5lib/tests/test_sanitizer.py`

`‎html5lib/tests/test_treewalkers.py`

`‎html5lib/treebuilders/init.py`

`‎html5lib/treebuilders/dom.py`

`‎html5lib/treebuilders/etree.py`

`‎html5lib/treebuilders/etree_lxml.py`

0 commit comments