Commit1f5e99e

committed

add ner task mode, add dropout layer

1 parent3527d9d commit1f5e99eCopy full SHA for 1f5e99e

File tree

1 file changed

+31

-20

lines changed

python/dnlp/core
- dnn_crf.py

1 file changed

+31

-20

lines changed

`‎python/dnlp/core/dnn_crf.py‎`

Lines changed: 31 additions & 20 deletions

Original file line number	Diff line number	Diff line change
`@@ -7,7 +7,8 @@`
`7`	`7`
`8`	`8`
`9`	`9`	`classDnnCrf(DnnCrfBase):`
`10`		`-def__init__(self,*,config:DnnCrfConfig=None,data_path:str='',dtype:type=tf.float32,mode:str='train',`
	`10`	`+def__init__(self,*,config:DnnCrfConfig=None,task='cws',data_path:str='',dtype:type=tf.float32,`
	`11`	`+mode:str='train',`
`11`	`12`	`predict:str='ll',nn:str,model_path:str=''):`
`12`	`13`	`ifmodenotin ['train','predict']:`
`13`	`14`	`raiseException('mode error')`
`@@ -17,6 +18,8 @@ def __init__(self, *, config: DnnCrfConfig = None, data_path: str = '', dtype: t`
`17`	`18`	`DnnCrfBase.__init__(self,config,data_path,mode,model_path)`
`18`	`19`	`self.dtype=dtype`
`19`	`20`	`self.mode=mode`
	`21`	`+self.task=task`
	`22`	`+self.nn=nn`
`20`	`23`
`21`	`24`	`# 构建`
`22`	`25`	`tf.reset_default_graph()`
`@@ -34,9 +37,11 @@ def __init__(self, *, config: DnnCrfConfig = None, data_path: str = '', dtype: t`
`34`	`37`
`35`	`38`	`# 查找表层`
`36`	`39`	`self.embedding_layer=self.get_embedding_layer()`
	`40`	`+# 执行drpout`
	`41`	`+self.embedding_layer=self.get_dropout_layer(self.embedding_layer)`
`37`	`42`	`# 隐藏层`
`38`	`43`	`ifnn=='mlp':`
`39`		`-self.hidden_layer=self.get_mlp_layer(tf.transpose(self.embedding_layer))`
	`44`	`+self.hidden_layer=self.get_mlp_layer(self.embedding_layer)`
`40`	`45`	`elifnn=='lstm':`
`41`	`46`	`self.hidden_layer=self.get_lstm_layer(self.embedding_layer)`
`42`	`47`	`elifnn=='bilstm':`
`@@ -62,22 +67,20 @@ def __init__(self, *, config: DnnCrfConfig = None, data_path: str = '', dtype: t`
`62`	`67`	`self.new_optimizer=tf.train.AdamOptimizer()`
`63`	`68`	`self.train=self.optimizer.minimize(-self.loss)`
`64`	`69`
`65`		`-deffit(self,epochs:int=100,interval:int=20):`
	`70`	`+deffit(self,epochs:int=50,interval:int=10):`
`66`	`71`	`withtf.Session()assess:`
`67`	`72`	`tf.global_variables_initializer().run()`
`68`	`73`	`saver=tf.train.Saver(max_to_keep=epochs)`
`69`	`74`	`forepochinrange(1,epochs+1):`
`70`	`75`	`print('epoch:',epoch)`
`71`	`76`	`for_inrange(self.batch_count):`
`72`	`77`	`characters,labels,lengths=self.get_batch()`
`73`		`-# scores = sess.run(self.output, feed_dict={self.input: characters})`
`74`	`78`	`feed_dict= {self.input:characters,self.real_indices:labels,self.seq_length:lengths}`
`75`	`79`	`sess.run(self.train,feed_dict=feed_dict)`
`76`		`-# self.fit_batch(characters, labels, lengths, sess)`
`77`		`-# if epoch % interval == 0:`
`78`		`-model_path='../dnlp/models/cws{0}.ckpt'.format(epoch)`
`79`		`-saver.save(sess,model_path)`
`80`		`-self.save_config(model_path)`
	`80`	`+ifepoch%interval==0:`
	`81`	`+model_path='../dnlp/models/{0}-{1}-{2}.ckpt'.format(self.task,self.nn,epoch)`
	`82`	`+saver.save(sess,model_path)`
	`83`	`+self.save_config(model_path)`
`81`	`84`
`82`	`85`	`defpredict(self,sentence:str,return_labels=False):`
`83`	`86`	`ifself.mode!='predict':`
`@@ -87,10 +90,14 @@ def predict(self, sentence: str, return_labels=False):`
`87`	`90`	`runner= [self.output,self.transition,self.transition_init]`
`88`	`91`	`output,trans,trans_init=self.sess.run(runner,feed_dict={self.input:input})`
`89`	`92`	`labels=self.viterbi(output,trans,trans_init)`
	`93`	`+ifself.task=='cws':`
	`94`	`+result=self.tags2words(sentence,labels)`
	`95`	`+else:`
	`96`	`+result=self.tags2entities(sentence,labels)`
`90`	`97`	`ifnotreturn_labels:`
`91`		`-returnself.tags2words(sentence,labels)`
	`98`	`+returnresult`
`92`	`99`	`else:`
`93`		`-returnself.tags2words(sentence,labels),self.tag2sequences(labels)`
	`100`	`+returnresult,self.tag2sequences(labels)`
`94`	`101`
`95`	`102`	`defpredict_ll(self,sentence:str,return_labels=False):`
`96`	`103`	`ifself.mode!='predict':`
`@@ -103,10 +110,14 @@ def predict_ll(self, sentence: str, return_labels=False):`
`103`	`110`	`# print(output)`
`104`	`111`	`# print(trans)`
`105`	`112`	`labels=np.squeeze(labels)`
	`113`	`+ifself.task=='cws':`
	`114`	`+result=self.tags2words(sentence,labels)`
	`115`	`+else:`
	`116`	`+result=self.tags2entities(sentence,labels)`
`106`	`117`	`ifreturn_labels:`
`107`		`-returnself.tags2words(sentence,labels),self.tag2sequences(labels)`
	`118`	`+returnresult,self.tag2sequences(labels)`
`108`	`119`	`else:`
`109`		`-returnself.tags2words(sentence,labels)`
	`120`	`+returnresult`
`110`	`121`
`111`	`122`	`defget_embedding_layer(self)->tf.Tensor:`
`112`	`123`	`embeddings=self.__get_variable([self.dict_size,self.embed_size],'embeddings')`
`@@ -122,28 +133,28 @@ def get_mlp_layer(self, layer: tf.Tensor) -> tf.Tensor:`
`122`	`133`	`hidden_weight=self.__get_variable([self.hidden_units,self.concat_embed_size],'hidden_weight')`
`123`	`134`	`hidden_bias=self.__get_variable([self.hidden_units,1,1],'hidden_bias')`
`124`	`135`	`self.params+= [hidden_weight,hidden_bias]`
`125`		`-layer=tf.sigmoid(tf.tensordot(hidden_weight,layer, [[1], [0]])+hidden_bias)`
`126`		`-returnlayer`
	`136`	`+layer=tf.sigmoid(tf.tensordot(hidden_weight,tf.transpose(layer), [[1], [0]])+hidden_bias)`
	`137`	`+returntf.transpose(layer)`
`127`	`138`
`128`	`139`	`defget_rnn_layer(self,layer:tf.Tensor)->tf.Tensor:`
`129`		`-rnn=tf.nn.rnn_cell.RNNCell(self.hidden_units)`
	`140`	`+rnn=tf.nn.rnn_cell.BasicRNNCell(self.hidden_units)`
`130`	`141`	`rnn_output,rnn_out_state=tf.nn.dynamic_rnn(rnn,layer,dtype=self.dtype)`
`131`	`142`	`self.params+= [vforvintf.global_variables()ifv.name.startswith('rnn')]`
`132`	`143`	`returnrnn_output`
`133`	`144`
`134`	`145`	`defget_lstm_layer(self,layer:tf.Tensor)->tf.Tensor:`
`135`		`-lstm=tf.nn.rnn_cell.LSTMCell(self.hidden_units)`
	`146`	`+lstm=tf.nn.rnn_cell.BasicLSTMCell(self.hidden_units)`
`136`	`147`	`lstm_output,lstm_out_state=tf.nn.dynamic_rnn(lstm,layer,dtype=self.dtype)`
`137`	`148`	`self.params+= [vforvintf.global_variables()ifv.name.startswith('rnn')]`
`138`	`149`	`returnlstm_output`
`139`	`150`
`140`	`151`	`defget_bilstm_layer(self,layer:tf.Tensor)->tf.Tensor:`
`141`		`-lstm_fw=tf.nn.rnn_cell.LSTMCell(self.hidden_units//2)`
`142`		`-lstm_bw=tf.nn.rnn_cell.LSTMCell(self.hidden_units//2)`
	`152`	`+lstm_fw=tf.nn.rnn_cell.BasicLSTMCell(self.hidden_units//2)`
	`153`	`+lstm_bw=tf.nn.rnn_cell.BasicLSTMCell(self.hidden_units//2)`
`143`	`154`	`bilstm_output,bilstm_output_state=tf.nn.bidirectional_dynamic_rnn(lstm_fw,lstm_bw,layer,self.seq_length,`
`144`	`155`	`dtype=self.dtype)`
`145`	`156`	`self.params+= [vforvintf.global_variables()ifv.name.startswith('rnn')]`
`146`		`-returntf.concat([bilstm_output[0],bilstm_output[1]],-1)`
	`157`	`+returntf.concat([bilstm_output[0],bilstm_output[1]],-1)`
`147`	`158`
`148`	`159`	`defget_gru_layer(self,layer:tf.Tensor)->tf.Tensor:`
`149`	`160`	`gru=tf.nn.rnn_cell.GRUCell(self.hidden_units)`

0 commit comments

Comments

(0)

Movatterモバイル変換

Navigation Menu

Search code, repositories, users, issues, pull requests...

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Commit1f5e99e

File tree

1 file changed

1 file changed

`‎python/dnlp/core/dnn_crf.py‎`

0 commit comments