Commit9dc49f6

committed

Merge pull request#240 from gsnedders/tree_types

Sort out the tokenizer and tree-construction tests; r=nobody!

2 parentsb5b91cc +68d6f34 commit9dc49f6Copy full SHA for 9dc49f6

File tree

6 files changed

+711

-924

lines changed

.pytest.expect
html5lib/tests

6 files changed

+711

-924

lines changed

`‎.pytest.expect‎`

Lines changed: 459 additions & 729 deletions

Large diffs are not rendered by default.

`‎html5lib/tests/conftest.py‎`

Lines changed: 5 additions & 0 deletions

Original file line number	Diff line number	Diff line change
`@@ -1,10 +1,12 @@`
`1`	`1`	`importos.path`
`2`	`2`
`3`	`3`	`from .tree_constructionimportTreeConstructionFile`
	`4`	`+from .tokenizerimportTokenizerFile`
`4`	`5`
`5`	`6`	`_dir=os.path.abspath(os.path.dirname(__file__))`
`6`	`7`	`_testdata=os.path.join(_dir,"testdata")`
`7`	`8`	`_tree_construction=os.path.join(_testdata,"tree-construction")`
	`9`	`+_tokenizer=os.path.join(_testdata,"tokenizer")`
`8`	`10`
`9`	`11`
`10`	`12`	`defpytest_collectstart():`
`@@ -19,3 +21,6 @@ def pytest_collect_file(path, parent):`
`19`	`21`	`return`
`20`	`22`	`ifpath.ext==".dat":`
`21`	`23`	`returnTreeConstructionFile(path,parent)`
	`24`	`+elifdir==_tokenizer:`
	`25`	`+ifpath.ext==".test":`
	`26`	`+returnTokenizerFile(path,parent)`

`‎html5lib/tests/support.py‎`

Lines changed: 33 additions & 7 deletions

Original file line number	Diff line number	Diff line change
`@@ -13,16 +13,24 @@`
`13`	`13`	`os.path.pardir,`
`14`	`14`	`os.path.pardir)))`
`15`	`15`
`16`		`-fromhtml5libimporttreebuilders`
	`16`	`+fromhtml5libimporttreebuilders,treewalkers,treeadapters`
`17`	`17`	`delbase_path`
`18`	`18`
`19`	`19`	`# Build a dict of available trees`
`20`		`-treeTypes= {"DOM":treebuilders.getTreeBuilder("dom")}`
	`20`	`+treeTypes= {}`
`21`	`21`
`22`		`-# Try whatever etree implementations are available from a list that are`
`23`		`-#"supposed" to work`
	`22`	`+# DOM impls`
	`23`	`+treeTypes["DOM"]= {`
	`24`	`+"builder":treebuilders.getTreeBuilder("dom"),`
	`25`	`+"walker":treewalkers.getTreeWalker("dom")`
	`26`	`+}`
	`27`	`+`
	`28`	`+# ElementTree impls`
`24`	`29`	`importxml.etree.ElementTreeasElementTree`
`25`		`-treeTypes['ElementTree']=treebuilders.getTreeBuilder("etree",ElementTree,fullTree=True)`
	`30`	`+treeTypes['ElementTree']= {`
	`31`	`+"builder":treebuilders.getTreeBuilder("etree",ElementTree,fullTree=True),`
	`32`	`+"walker":treewalkers.getTreeWalker("etree",ElementTree)`
	`33`	`+}`
`26`	`34`
`27`	`35`	`try:`
`28`	`36`	`importxml.etree.cElementTreeascElementTree`
`@@ -33,14 +41,32 @@`
`33`	`41`	`ifcElementTree.ElementisElementTree.Element:`
`34`	`42`	`treeTypes['cElementTree']=None`
`35`	`43`	`else:`
`36`		`-treeTypes['cElementTree']=treebuilders.getTreeBuilder("etree",cElementTree,fullTree=True)`
	`44`	`+treeTypes['cElementTree']= {`
	`45`	`+"builder":treebuilders.getTreeBuilder("etree",cElementTree,fullTree=True),`
	`46`	`+"walker":treewalkers.getTreeWalker("etree",cElementTree)`
	`47`	`+ }`
`37`	`48`
`38`	`49`	`try:`
`39`	`50`	`importlxml.etreeaslxml# flake8: noqa`
`40`	`51`	`exceptImportError:`
`41`	`52`	`treeTypes['lxml']=None`
`42`	`53`	`else:`
`43`		`-treeTypes['lxml']=treebuilders.getTreeBuilder("lxml")`
	`54`	`+treeTypes['lxml']= {`
	`55`	`+"builder":treebuilders.getTreeBuilder("lxml"),`
	`56`	`+"walker":treewalkers.getTreeWalker("lxml")`
	`57`	`+ }`
	`58`	`+`
	`59`	`+# Genshi impls`
	`60`	`+try:`
	`61`	`+importgenshi# flake8: noqa`
	`62`	`+exceptImportError:`
	`63`	`+pass`
	`64`	`+else:`
	`65`	`+treeTypes["genshi"]= {`
	`66`	`+"builder":treebuilders.getTreeBuilder("dom"),`
	`67`	`+"adapter":lambdatree:treeadapters.genshi.to_genshi(treewalkers.getTreeWalker("dom")(tree)),`
	`68`	`+"walker":treewalkers.getTreeWalker("genshi")`
	`69`	`+ }`
`44`	`70`
`45`	`71`
`46`	`72`	`defget_data_files(subdirectory,files='*.dat'):`

`‎html5lib/tests/test_treewalkers.py‎`

Lines changed: 28 additions & 133 deletions

Original file line number	Diff line number	Diff line change
`@@ -1,68 +1,12 @@`
`1`	`1`	`from __future__importabsolute_import,division,unicode_literals`
`2`	`2`
`3`		`-importos`
`4`		`-importsys`
`5`		`-importunittest`
`6`		`-importwarnings`
`7`		`-fromdifflibimportunified_diff`
	`3`	`+importpytest`
`8`	`4`
`9`		`-try:`
`10`		`-unittest.TestCase.assertEqual`
`11`		`-exceptAttributeError:`
`12`		`-unittest.TestCase.assertEqual=unittest.TestCase.assertEquals`
	`5`	`+from .supportimporttreeTypes`
`13`	`6`
`14`		`-from .supportimportget_data_files,TestData,convertExpected`
`15`		`-`
`16`		`-fromhtml5libimporthtml5parser,treewalkers,treebuilders,treeadapters,constants`
	`7`	`+fromhtml5libimporthtml5parser,treewalkers`
`17`	`8`	`fromhtml5lib.filters.lintimportFilterasLint`
`18`	`9`
`19`		`-`
`20`		`-treeTypes= {`
`21`		`-"DOM": {"builder":treebuilders.getTreeBuilder("dom"),`
`22`		`-"walker":treewalkers.getTreeWalker("dom")},`
`23`		`-}`
`24`		`-`
`25`		`-# Try whatever etree implementations are available from a list that are`
`26`		`-#"supposed" to work`
`27`		`-try:`
`28`		`-importxml.etree.ElementTreeasElementTree`
`29`		`-exceptImportError:`
`30`		`-pass`
`31`		`-else:`
`32`		`-treeTypes['ElementTree']= \`
`33`		`- {"builder":treebuilders.getTreeBuilder("etree",ElementTree,fullTree=True),`
`34`		`-"walker":treewalkers.getTreeWalker("etree",ElementTree)}`
`35`		`-`
`36`		`-try:`
`37`		`-importxml.etree.cElementTreeasElementTree`
`38`		`-exceptImportError:`
`39`		`-pass`
`40`		`-else:`
`41`		`-treeTypes['cElementTree']= \`
`42`		`- {"builder":treebuilders.getTreeBuilder("etree",ElementTree,fullTree=True),`
`43`		`-"walker":treewalkers.getTreeWalker("etree",ElementTree)}`
`44`		`-`
`45`		`-`
`46`		`-try:`
`47`		`-importlxml.etreeasElementTree# flake8: noqa`
`48`		`-exceptImportError:`
`49`		`-pass`
`50`		`-else:`
`51`		`-treeTypes['lxml_native']= \`
`52`		`- {"builder":treebuilders.getTreeBuilder("lxml"),`
`53`		`-"walker":treewalkers.getTreeWalker("lxml")}`
`54`		`-`
`55`		`-`
`56`		`-try:`
`57`		`-importgenshi# flake8: noqa`
`58`		`-exceptImportError:`
`59`		`-pass`
`60`		`-else:`
`61`		`-treeTypes["genshi"]= \`
`62`		`- {"builder":treebuilders.getTreeBuilder("dom"),`
`63`		`-"adapter":lambdatree:treeadapters.genshi.to_genshi(treewalkers.getTreeWalker("dom")(tree)),`
`64`		`-"walker":treewalkers.getTreeWalker("genshi")}`
`65`		`-`
`66`	`10`	`importre`
`67`	`11`	`attrlist=re.compile(r"^(\s+)\w+=.(\n\1\w+=.)+",re.M)`
`68`	`12`
`@@ -73,80 +17,29 @@ def sortattrs(x):`
`73`	`17`	`return"\n".join(lines)`
`74`	`18`
`75`	`19`
`76`		`-classTokenTestCase(unittest.TestCase):`
`77`		`-deftest_all_tokens(self):`
`78`		`-expected= [`
`79`		`- {'data': {},'type':'StartTag','namespace':'http://www.w3.org/1999/xhtml','name':'html'},`
`80`		`- {'data': {},'type':'StartTag','namespace':'http://www.w3.org/1999/xhtml','name':'head'},`
`81`		`- {'type':'EndTag','namespace':'http://www.w3.org/1999/xhtml','name':'head'},`
`82`		`- {'data': {},'type':'StartTag','namespace':'http://www.w3.org/1999/xhtml','name':'body'},`
`83`		`- {'data':'a','type':'Characters'},`
`84`		`- {'data': {},'type':'StartTag','namespace':'http://www.w3.org/1999/xhtml','name':'div'},`
`85`		`- {'data':'b','type':'Characters'},`
`86`		`- {'type':'EndTag','namespace':'http://www.w3.org/1999/xhtml','name':'div'},`
`87`		`- {'data':'c','type':'Characters'},`
`88`		`- {'type':'EndTag','namespace':'http://www.w3.org/1999/xhtml','name':'body'},`
`89`		`- {'type':'EndTag','namespace':'http://www.w3.org/1999/xhtml','name':'html'}`
`90`		`- ]`
`91`		`-fortreeName,treeClsinsorted(treeTypes.items()):`
`92`		`-p=html5parser.HTMLParser(tree=treeCls["builder"])`
`93`		`-document=p.parse("<html><head></head><body>a<div>b</div>c</body></html>")`
`94`		`-document=treeCls.get("adapter",lambdax:x)(document)`
`95`		`-output=Lint(treeCls["walker"](document))`
`96`		`-forexpectedToken,outputTokeninzip(expected,output):`
`97`		`-self.assertEqual(expectedToken,outputToken)`
`98`		`-`
`99`		`-`
`100`		`-defrunTreewalkerTest(innerHTML,input,expected,errors,treeClass):`
`101`		`-warnings.resetwarnings()`
`102`		`-warnings.simplefilter("error")`
`103`		`-try:`
`104`		`-p=html5parser.HTMLParser(tree=treeClass["builder"])`
`105`		`-ifinnerHTML:`
`106`		`-document=p.parseFragment(input,innerHTML)`
`107`		`-else:`
`108`		`-document=p.parse(input)`
`109`		`-exceptconstants.DataLossWarning:`
`110`		`-# Ignore testcases we know we don't pass`
`111`		`-return`
`112`		`-`
`113`		`-document=treeClass.get("adapter",lambdax:x)(document)`
`114`		`-try:`
`115`		`-output=treewalkers.pprint(Lint(treeClass["walker"](document)))`
`116`		`-output=attrlist.sub(sortattrs,output)`
`117`		`-expected=attrlist.sub(sortattrs,convertExpected(expected))`
`118`		`-diff="".join(unified_diff([line+"\n"forlineinexpected.splitlines()],`
`119`		`- [line+"\n"forlineinoutput.splitlines()],`
`120`		`-"Expected","Received"))`
`121`		`-assertexpected==output,"\n".join([`
`122`		`-"","Input:",input,`
`123`		`-"","Expected:",expected,`
`124`		`-"","Received:",output,`
`125`		`-"","Diff:",diff,`
`126`		`- ])`
`127`		`-exceptNotImplementedError:`
`128`		`-pass# Amnesty for those that confess...`
`129`		`-`
`130`		`-`
`131`		`-deftest_treewalker():`
`132`		`-sys.stdout.write('Testing tree walkers '+" ".join(list(treeTypes.keys()))+"\n")`
`133`		`-`
	`20`	`+deftest_all_tokens():`
	`21`	`+expected= [`
	`22`	`+ {'data': {},'type':'StartTag','namespace':'http://www.w3.org/1999/xhtml','name':'html'},`
	`23`	`+ {'data': {},'type':'StartTag','namespace':'http://www.w3.org/1999/xhtml','name':'head'},`
	`24`	`+ {'type':'EndTag','namespace':'http://www.w3.org/1999/xhtml','name':'head'},`
	`25`	`+ {'data': {},'type':'StartTag','namespace':'http://www.w3.org/1999/xhtml','name':'body'},`
	`26`	`+ {'data':'a','type':'Characters'},`
	`27`	`+ {'data': {},'type':'StartTag','namespace':'http://www.w3.org/1999/xhtml','name':'div'},`
	`28`	`+ {'data':'b','type':'Characters'},`
	`29`	`+ {'type':'EndTag','namespace':'http://www.w3.org/1999/xhtml','name':'div'},`
	`30`	`+ {'data':'c','type':'Characters'},`
	`31`	`+ {'type':'EndTag','namespace':'http://www.w3.org/1999/xhtml','name':'body'},`
	`32`	`+ {'type':'EndTag','namespace':'http://www.w3.org/1999/xhtml','name':'html'}`
	`33`	`+ ]`
`134`	`34`	`fortreeName,treeClsinsorted(treeTypes.items()):`
`135`		`-files=get_data_files('tree-construction')`
`136`		`-forfilenameinfiles:`
`137`		`-testName=os.path.basename(filename).replace(".dat","")`
`138`		`-iftestNamein ("template",):`
`139`		`-continue`
`140`		`-`
`141`		`-tests=TestData(filename,"data")`
`142`		`-`
`143`		`-forindex,testinenumerate(tests):`
`144`		`- (input,errors,`
`145`		`-innerHTML,expected)= [test[key]forkeyin ("data","errors",`
`146`		`-"document-fragment",`
`147`		`-"document")]`
`148`		`-errors=errors.split("\n")`
`149`		`-yieldrunTreewalkerTest,innerHTML,input,expected,errors,treeCls`
	`35`	`+iftreeClsisNone:`
	`36`	`+continue`
	`37`	`+p=html5parser.HTMLParser(tree=treeCls["builder"])`
	`38`	`+document=p.parse("<html><head></head><body>a<div>b</div>c</body></html>")`
	`39`	`+document=treeCls.get("adapter",lambdax:x)(document)`
	`40`	`+output=Lint(treeCls["walker"](document))`
	`41`	`+forexpectedToken,outputTokeninzip(expected,output):`
	`42`	`+assertexpectedToken==outputToken`
`150`	`43`
`151`	`44`
`152`	`45`	`defset_attribute_on_first_child(docfrag,name,value,treeName):`
`@@ -164,6 +57,8 @@ def set_attribute_on_first_child(docfrag, name, value, treeName):`
`164`	`57`	`defrunTreewalkerEditTest(intext,expected,attrs_to_add,tree):`
`165`	`58`	`"""tests what happens when we add attributes to the intext"""`
`166`	`59`	`treeName,treeClass=tree`
	`60`	`+iftreeClassisNone:`
	`61`	`+pytest.skip("Treebuilder not loaded")`
`167`	`62`	`parser=html5parser.HTMLParser(tree=treeClass["builder"])`
`168`	`63`	`document=parser.parseFragment(intext)`
`169`	`64`	`fornom,valinattrs_to_add:`
`@@ -172,7 +67,7 @@ def runTreewalkerEditTest(intext, expected, attrs_to_add, tree):`
`172`	`67`	`document=treeClass.get("adapter",lambdax:x)(document)`
`173`	`68`	`output=treewalkers.pprint(treeClass["walker"](document))`
`174`	`69`	`output=attrlist.sub(sortattrs,output)`
`175`		`-ifnotoutputinexpected:`
	`70`	`+ifoutputnotinexpected:`
`176`	`71`	`raiseAssertionError("TreewalkerEditTest: %s\nExpected:\n%s\nReceived:\n%s"% (treeName,expected,output))`
`177`	`72`
`178`	`73`

0 commit comments

Comments

(0)

Movatterモバイル変換

Navigation Menu

Search code, repositories, users, issues, pull requests...

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Commit9dc49f6

File tree

6 files changed

6 files changed

`‎.pytest.expect‎`

`‎html5lib/tests/conftest.py‎`

`‎html5lib/tests/support.py‎`

`‎html5lib/tests/test_treewalkers.py‎`

0 commit comments