NotificationsYou must be signed in to change notification settings
Fork33.5k
Star70.1k

Commit3d593ef

committed

Use Lib/token.py and Lib/tokenize.py as the source of tokens

1 parent7e3beaf commit3d593efCopy full SHA for 3d593ef

File tree

4 files changed

+49

-92

lines changed

Parser/pgen

4 files changed

+49

-92

lines changed

`‎Parser/pgen/main.py‎`

Lines changed: 10 additions & 31 deletions

Original file line number	Diff line number	Diff line change
`@@ -1,41 +1,12 @@`
`1`		`-importos`
`2`		`-importsys`
`3`	`1`	`importargparse`
`4`		`-importcollections`
`5`		`-`
`6`		`-fromlib2to3.pgen2importgrammar,tokenize`
`7`		`-`
`8`		`-from .importtoken`
`9`		`-from .importgrammaraspgen_grammar`
`10`		`-`
`11`		`-defmonkey_patch_pgen2(token_lines):`
`12`		`-tokens=dict(token.generate_tokens(token_lines))`
`13`		`-forname,valueintokens.items():`
`14`		`-setattr(tokenize,name,value)`
`15`	`2`
`16`	`3`	`from .pgenimportParserGenerator`
`17`	`4`
`18`		`-`
`19`		`-defmain(grammar_file,tokens_file,gramminit_h_file,gramminit_c_file,verbose):`
`20`		`-withopen(tokens_file)astok_file:`
`21`		`-token_lines=tok_file.readlines()`
`22`		`-`
`23`		`-monkey_patch_pgen2(token_lines)`
`24`		`-`
`25`		`-p=ParserGenerator(grammar_file,token_lines,verbose=verbose)`
`26`		`-grammar=p.make_grammar()`
`27`		`-grammar.produce_graminit_h(gramminit_h_file.write)`
`28`		`-grammar.produce_graminit_c(gramminit_c_file.write)`
`29`		`-`
`30`		`-`
`31`		`-if__name__=="__main__":`
	`5`	`+defmain():`
`32`	`6`	`parser=argparse.ArgumentParser(description="Parser generator main program.")`
`33`	`7`	`parser.add_argument(`
`34`	`8`	`"grammar",type=str,help="The file with the grammar definition in EBNF format"`
`35`	`9`	`)`
`36`		`-parser.add_argument(`
`37`		`-"tokens",type=str,help="The file with the token definition"`
`38`		`- )`
`39`	`10`	`parser.add_argument(`
`40`	`11`	`"gramminit_h",`
`41`	`12`	`type=argparse.FileType('w'),`
`@@ -48,4 +19,12 @@ def main(grammar_file, tokens_file, gramminit_h_file, gramminit_c_file, verbose)`
`48`	`19`	`)`
`49`	`20`	`parser.add_argument("--verbose","-v",action="count")`
`50`	`21`	`args=parser.parse_args()`
`51`		`-main(args.grammar,args.tokens,args.gramminit_h,args.gramminit_c,args.verbose)`
	`22`	`+`
	`23`	`+p=ParserGenerator(args.grammar,verbose=args.verbose)`
	`24`	`+grammar=p.make_grammar()`
	`25`	`+grammar.produce_graminit_h(args.gramminit_h.write)`
	`26`	`+grammar.produce_graminit_c(args.gramminit_c.write)`
	`27`	`+`
	`28`	`+`
	`29`	`+if__name__=="__main__":`
	`30`	`+main()`

`‎Parser/pgen/grammar.py‎`

Lines changed: 0 additions & 3 deletions

Original file line number	Diff line number	Diff line change
`@@ -1,8 +1,5 @@`
`1`	`1`	`fromlib2to3.pgen2importgrammar`
`2`	`2`
`3`		`-from .importtoken`
`4`		`-`
`5`		`-`
`6`	`3`	`classGrammar(grammar.Grammar):`
`7`	`4`
`8`	`5`	`defproduce_graminit_h(self,writer):`

`‎Parser/pgen/pgen.py‎`

Lines changed: 39 additions & 18 deletions

Original file line number	Diff line number	Diff line change
`@@ -1,17 +1,38 @@`
	`1`	`+importos`
	`2`	`+importsys`
`1`	`3`	`importcollections`
`2`		`-fromlib2to3.pgen2importtokenize`
	`4`	`+importimportlib.machinery`
`3`	`5`
`4`		`-from .importtoken,grammar`
	`6`	`+# Use Lib/token.py and Lib/tokenize.py to obtain the tokens. To maintain this`
	`7`	`+# compatible with older versions of Python, we need to make sure that we only`
	`8`	`+# import these two files (and not any of the dependencies of these files).`
	`9`	`+`
	`10`	`+CURRENT_FOLDER_LOCATION=os.path.dirname(os.path.realpath(__file__))`
	`11`	`+LIB_LOCATION=os.path.realpath(os.path.join(CURRENT_FOLDER_LOCATION,'..','..','Lib'))`
	`12`	`+TOKEN_LOCATION=os.path.join(LIB_LOCATION,'token.py')`
	`13`	`+TOKENIZE_LOCATION=os.path.join(LIB_LOCATION,'tokenize.py')`
	`14`	`+`
	`15`	`+token=importlib.machinery.SourceFileLoader('token',`
	`16`	`+TOKEN_LOCATION).load_module()`
	`17`	`+# Add token to the module cache so tokenize.py uses that excact one instead of`
	`18`	`+# the one in the stdlib of the interpreter executing this file.`
	`19`	`+sys.modules['token']=token`
	`20`	`+tokenize=importlib.machinery.SourceFileLoader('tokenize',`
	`21`	`+TOKENIZE_LOCATION).load_module()`
	`22`	`+`
	`23`	`+from .importgrammar`
`5`	`24`
`6`	`25`	`classParserGenerator(object):`
`7`	`26`
`8`		`-def__init__(self,filename,tokens,stream=None,verbose=False):`
	`27`	`+def__init__(self,filename,stream=None,verbose=False):`
`9`	`28`	`close_stream=None`
`10`	`29`	`ifstreamisNone:`
`11`	`30`	`stream=open(filename)`
`12`	`31`	`close_stream=stream.close`
`13`		`-self.tokens=dict(token.generate_tokens(tokens))`
`14`		`-self.opmap=dict(token.generate_opmap(tokens))`
	`32`	`+self.tokens=token`
	`33`	`+self.opmap=token.EXACT_TOKEN_TYPES`
	`34`	`+# Manually add <> so it does not collide with !=`
	`35`	`+self.opmap['<>']=self.tokens.NOTEQUAL`
`15`	`36`	`self.verbose=verbose`
`16`	`37`	`self.filename=filename`
`17`	`38`	`self.stream=stream`
`@@ -87,9 +108,9 @@ def make_label(self, c, label):`
`87`	`108`	`returnilabel`
`88`	`109`	`else:`
`89`	`110`	`# A named token (NAME, NUMBER, STRING)`
`90`		`-itoken=self.tokens.get(label,None)`
	`111`	`+itoken=getattr(self.tokens,label,None)`
`91`	`112`	`assertisinstance(itoken,int),label`
`92`		`-assertitokeninself.tokens.values(),label`
	`113`	`+assertitokeninself.tokens.tok_name,label`
`93`	`114`	`ifitokeninc.tokens:`
`94`	`115`	`returnc.tokens[itoken]`
`95`	`116`	`else:`
`@@ -105,12 +126,12 @@ def make_label(self, c, label):`
`105`	`126`	`ifvalueinc.keywords:`
`106`	`127`	`returnc.keywords[value]`
`107`	`128`	`else:`
`108`		`-c.labels.append((self.tokens['NAME'],value))`
	`129`	`+c.labels.append((self.tokens.NAME,value))`
`109`	`130`	`c.keywords[value]=ilabel`
`110`	`131`	`returnilabel`
`111`	`132`	`else:`
`112`	`133`	`# An operator (any non-numeric token)`
`113`		`-itoken=self.tokens[self.opmap[value]]# Fails if unknown token`
	`134`	`+itoken=self.opmap[value]# Fails if unknown token`
`114`	`135`	`ifitokeninc.tokens:`
`115`	`136`	`returnc.tokens[itoken]`
`116`	`137`	`else:`
`@@ -163,16 +184,16 @@ def parse(self):`
`163`	`184`	`dfas=collections.OrderedDict()`
`164`	`185`	`startsymbol=None`
`165`	`186`	`# MSTART: (NEWLINE \| RULE)* ENDMARKER`
`166`		`-whileself.type!=self.tokens['ENDMARKER']:`
`167`		`-whileself.type==self.tokens['NEWLINE']:`
	`187`	`+whileself.type!=self.tokens.ENDMARKER:`
	`188`	`+whileself.type==self.tokens.NEWLINE:`
`168`	`189`	`self.gettoken()`
`169`	`190`	`# RULE: NAME ':' RHS NEWLINE`
`170`		`-name=self.expect(self.tokens['NAME'])`
	`191`	`+name=self.expect(self.tokens.NAME)`
`171`	`192`	`ifself.verbose:`
`172`	`193`	`print("Processing rule {dfa_name}".format(dfa_name=name))`
`173`		`-self.expect(self.tokens['OP'],":")`
	`194`	`+self.expect(self.tokens.OP,":")`
`174`	`195`	`a,z=self.parse_rhs()`
`175`		`-self.expect(self.tokens['NEWLINE'])`
	`196`	`+self.expect(self.tokens.NEWLINE)`
`176`	`197`	`ifself.verbose:`
`177`	`198`	`self.dump_nfa(name,a,z)`
`178`	`199`	`dfa=self.make_dfa(a,z)`
`@@ -288,7 +309,7 @@ def parse_alt(self):`
`288`	`309`	`# ALT: ITEM+`
`289`	`310`	`a,b=self.parse_item()`
`290`	`311`	`while (self.valuein ("(","[")or`
`291`		`-self.typein (self.tokens['NAME'],self.tokens['STRING'])):`
	`312`	`+self.typein (self.tokens.NAME,self.tokens.STRING)):`
`292`	`313`	`c,d=self.parse_item()`
`293`	`314`	`b.addarc(c)`
`294`	`315`	`b=d`
`@@ -299,7 +320,7 @@ def parse_item(self):`
`299`	`320`	`ifself.value=="[":`
`300`	`321`	`self.gettoken()`
`301`	`322`	`a,z=self.parse_rhs()`
`302`		`-self.expect(self.tokens['OP'],"]")`
	`323`	`+self.expect(self.tokens.OP,"]")`
`303`	`324`	`a.addarc(z)`
`304`	`325`	`returna,z`
`305`	`326`	`else:`
`@@ -319,9 +340,9 @@ def parse_atom(self):`
`319`	`340`	`ifself.value=="(":`
`320`	`341`	`self.gettoken()`
`321`	`342`	`a,z=self.parse_rhs()`
`322`		`-self.expect(self.tokens['OP'],")")`
	`343`	`+self.expect(self.tokens.OP,")")`
`323`	`344`	`returna,z`
`324`		`-elifself.typein (self.tokens['NAME'],self.tokens['STRING']):`
	`345`	`+elifself.typein (self.tokens.NAME,self.tokens.STRING):`
`325`	`346`	`a=NFAState()`
`326`	`347`	`z=NFAState()`
`327`	`348`	`a.addarc(z,self.value)`

`‎Parser/pgen/token.py‎`

Lines changed: 0 additions & 40 deletions

This file was deleted.

0 commit comments

Comments

(0)

Movatterモバイル変換

Navigation Menu

Search code, repositories, users, issues, pull requests...

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Uh oh!

Commit3d593ef

File tree

4 files changed

4 files changed

`‎Parser/pgen/main.py‎`

`‎Parser/pgen/grammar.py‎`

`‎Parser/pgen/pgen.py‎`

`‎Parser/pgen/token.py‎`

0 commit comments

Movatterモバイル変換

Uh oh!

File tree

4 files changed

4 files changed

‎Parser/pgen/__main__.py‎

‎Parser/pgen/grammar.py‎

‎Parser/pgen/pgen.py‎

‎Parser/pgen/token.py‎

0 commit comments

`‎Parser/pgen/main.py‎`

`‎Parser/pgen/grammar.py‎`

`‎Parser/pgen/pgen.py‎`

`‎Parser/pgen/token.py‎`