Commitbb93e22

committed

Merge remote-tracking branch 'origin/develop' into develop

2 parents641b54f +1f5e99e commitbb93e22Copy full SHA for bb93e22

File tree

1 file changed

+26

-15

lines changed

python/dnlp/core
- dnn_crf.py

1 file changed

+26

-15

lines changed

`‎python/dnlp/core/dnn_crf.py‎`

Lines changed: 26 additions & 15 deletions

Original file line number	Diff line number	Diff line change
`@@ -7,7 +7,8 @@`
`7`	`7`
`8`	`8`
`9`	`9`	`classDnnCrf(DnnCrfBase):`
`10`		`-def__init__(self,*,config:DnnCrfConfig=None,data_path:str='',dtype:type=tf.float32,mode:str='train',`
	`10`	`+def__init__(self,*,config:DnnCrfConfig=None,task='cws',data_path:str='',dtype:type=tf.float32,`
	`11`	`+mode:str='train',`
`11`	`12`	`predict:str='ll',nn:str,model_path:str=''):`
`12`	`13`	`ifmodenotin ['train','predict']:`
`13`	`14`	`raiseException('mode error')`
`@@ -17,6 +18,8 @@ def __init__(self, *, config: DnnCrfConfig = None, data_path: str = '', dtype: t`
`17`	`18`	`DnnCrfBase.__init__(self,config,data_path,mode,model_path)`
`18`	`19`	`self.dtype=dtype`
`19`	`20`	`self.mode=mode`
	`21`	`+self.task=task`
	`22`	`+self.nn=nn`
`20`	`23`
`21`	`24`	`# 构建`
`22`	`25`	`tf.reset_default_graph()`
`@@ -34,9 +37,11 @@ def __init__(self, *, config: DnnCrfConfig = None, data_path: str = '', dtype: t`
`34`	`37`
`35`	`38`	`# 查找表层`
`36`	`39`	`self.embedding_layer=self.get_embedding_layer()`
	`40`	`+# 执行drpout`
	`41`	`+self.embedding_layer=self.get_dropout_layer(self.embedding_layer)`
`37`	`42`	`# 隐藏层`
`38`	`43`	`ifnn=='mlp':`
`39`		`-self.hidden_layer=self.get_mlp_layer(tf.transpose(self.embedding_layer))`
	`44`	`+self.hidden_layer=self.get_mlp_layer(self.embedding_layer)`
`40`	`45`	`elifnn=='lstm':`
`41`	`46`	`self.hidden_layer=self.get_lstm_layer(self.embedding_layer)`
`42`	`47`	`elifnn=='bilstm':`
`@@ -63,22 +68,20 @@ def __init__(self, *, config: DnnCrfConfig = None, data_path: str = '', dtype: t`
`63`	`68`	`self.new_optimizer=tf.train.AdamOptimizer()`
`64`	`69`	`self.train=self.optimizer.minimize(-self.loss)`
`65`	`70`
`66`		`-deffit(self,epochs:int=100,interval:int=20):`
	`71`	`+deffit(self,epochs:int=50,interval:int=10):`
`67`	`72`	`withtf.Session()assess:`
`68`	`73`	`tf.global_variables_initializer().run()`
`69`	`74`	`saver=tf.train.Saver(max_to_keep=epochs)`
`70`	`75`	`forepochinrange(1,epochs+1):`
`71`	`76`	`print('epoch:',epoch)`
`72`	`77`	`for_inrange(self.batch_count):`
`73`	`78`	`characters,labels,lengths=self.get_batch()`
`74`		`-# scores = sess.run(self.output, feed_dict={self.input: characters})`
`75`	`79`	`feed_dict= {self.input:characters,self.real_indices:labels,self.seq_length:lengths}`
`76`	`80`	`sess.run(self.train,feed_dict=feed_dict)`
`77`		`-# self.fit_batch(characters, labels, lengths, sess)`
`78`		`-# if epoch % interval == 0:`
`79`		`-model_path='../dnlp/models/cws{0}.ckpt'.format(epoch)`
`80`		`-saver.save(sess,model_path)`
`81`		`-self.save_config(model_path)`
	`81`	`+ifepoch%interval==0:`
	`82`	`+model_path='../dnlp/models/{0}-{1}-{2}.ckpt'.format(self.task,self.nn,epoch)`
	`83`	`+saver.save(sess,model_path)`
	`84`	`+self.save_config(model_path)`
`82`	`85`
`83`	`86`	`defpredict(self,sentence:str,return_labels=False):`
`84`	`87`	`ifself.mode!='predict':`
`@@ -88,10 +91,14 @@ def predict(self, sentence: str, return_labels=False):`
`88`	`91`	`runner= [self.output,self.transition,self.transition_init]`
`89`	`92`	`output,trans,trans_init=self.sess.run(runner,feed_dict={self.input:input})`
`90`	`93`	`labels=self.viterbi(output,trans,trans_init)`
	`94`	`+ifself.task=='cws':`
	`95`	`+result=self.tags2words(sentence,labels)`
	`96`	`+else:`
	`97`	`+result=self.tags2entities(sentence,labels)`
`91`	`98`	`ifnotreturn_labels:`
`92`		`-returnself.tags2words(sentence,labels)`
	`99`	`+returnresult`
`93`	`100`	`else:`
`94`		`-returnself.tags2words(sentence,labels),self.tag2sequences(labels)`
	`101`	`+returnresult,self.tag2sequences(labels)`
`95`	`102`
`96`	`103`	`defpredict_ll(self,sentence:str,return_labels=False):`
`97`	`104`	`ifself.mode!='predict':`
`@@ -104,10 +111,14 @@ def predict_ll(self, sentence: str, return_labels=False):`
`104`	`111`	`# print(output)`
`105`	`112`	`# print(trans)`
`106`	`113`	`labels=np.squeeze(labels)`
	`114`	`+ifself.task=='cws':`
	`115`	`+result=self.tags2words(sentence,labels)`
	`116`	`+else:`
	`117`	`+result=self.tags2entities(sentence,labels)`
`107`	`118`	`ifreturn_labels:`
`108`		`-returnself.tags2words(sentence,labels),self.tag2sequences(labels)`
	`119`	`+returnresult,self.tag2sequences(labels)`
`109`	`120`	`else:`
`110`		`-returnself.tags2words(sentence,labels)`
	`121`	`+returnresult`
`111`	`122`
`112`	`123`	`defget_embedding_layer(self)->tf.Tensor:`
`113`	`124`	`# embeddings = self.__get_variable([self.dict_size, self.embed_size], 'embeddings')`
`@@ -125,8 +136,8 @@ def get_mlp_layer(self, layer: tf.Tensor) -> tf.Tensor:`
`125`	`136`	`hidden_weight=self.__get_variable([self.hidden_units,self.concat_embed_size],'hidden_weight')`
`126`	`137`	`hidden_bias=self.__get_variable([self.hidden_units,1,1],'hidden_bias')`
`127`	`138`	`self.params+= [hidden_weight,hidden_bias]`
`128`		`-layer=tf.sigmoid(tf.tensordot(hidden_weight,layer, [[1], [0]])+hidden_bias)`
`129`		`-returnlayer`
	`139`	`+layer=tf.sigmoid(tf.tensordot(hidden_weight,tf.transpose(layer), [[1], [0]])+hidden_bias)`
	`140`	`+returntf.transpose(layer)`
`130`	`141`
`131`	`142`	`defget_rnn_layer(self,layer:tf.Tensor)->tf.Tensor:`
`132`	`143`	`rnn=tf.nn.rnn_cell.BasicRNNCell(self.hidden_units)`

0 commit comments

Comments

(0)

Movatterモバイル変換

Navigation Menu

Search code, repositories, users, issues, pull requests...

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Commitbb93e22

File tree

1 file changed

1 file changed

`‎python/dnlp/core/dnn_crf.py‎`

0 commit comments