Commit5b13873

committed

Update results with reference tohttps://github.com/oshizo/JapaneseEmbeddingEval

1 parent32cd1c8 commit5b13873Copy full SHA for 5b13873

File tree

2 files changed

+72

-42

lines changed

README.md
src
- evaluate.py

2 files changed

+72

-42

lines changed

`‎README.md`

Lines changed: 10 additions & 2 deletions

Original file line number	Diff line number	Diff line change
@@ -336,7 +336,8 @@ fine-tuning元のモデルとしては、`cl-tohoku/bert-large-japanese-v2`と`c
`336`	`336`
`337`	`337`
`338`	`338`	`また、公開したモデルと、既存の日本語対応文埋め込みモデルについて、評価結果を比較したものが以下の表になります。`
`339`		-評価には`src/evaluate.py`を用いています。
	`339`	`+補助的な比較対象として、事前学習済み言語モデルをfine-tuningせずに、そのまま文埋め込みモデルとして用いた場合の結果も示しています。`
	`340`	+評価には`src/evaluate.py`を用いました。
`340`	`341`
`341`	`342`	`\| Model\| JSICK (val)\| JSICK (test)\| JSTS (train)\| JSTS (val)\| Avg.\|`
`342`	`343`	`\| --------------------------------------------------------------------------------------------------------------------------------\| :---------:\| :----------:\| :----------:\| :--------:\| :-------:\|`
@@ -349,6 +350,7 @@ fine-tuning元のモデルとしては、`cl-tohoku/bert-large-japanese-v2`と`c
`349`	`350`	`\|[pkshatech/simcse-ja-bert-base-clcmlp](https://huggingface.co/pkshatech/simcse-ja-bert-base-clcmlp)\| 74.47\| 73.46\| 78.05\| 80.14\| 77.21\|`
`350`	`351`	`\|[colorfulscoop/sbert-base-ja](https://huggingface.co/colorfulscoop/sbert-base-ja)\| 67.19\| 65.73\| 74.16\| 74.24\| 71.38\|`
`351`	`352`	`\|[sonoisa/sentence-luke-japanese-base-lite](https://huggingface.co/sonoisa/sentence-luke-japanese-base-lite)\| 78.76\| 77.26\| 80.55\| 82.54\| 80.11\|`
	`353`	`+\|[oshizo/sbert-jsnli-luke-japanese-base-lite](https://huggingface.co/oshizo/sbert-jsnli-luke-japanese-base-lite)\| 72.96\| 72.60\| 77.88\| 81.09\| 77.19\|`
`352`	`354`	`\|\|\|\|\|\|\|`
`353`	`355`	`\|[MU-Kindai/Japanese-SimCSE-BERT-large-sup](https://huggingface.co/MU-Kindai/Japanese-SimCSE-BERT-large-sup)\| 77.06\| 77.48\| 70.83\| 75.83\| 74.71\|`
`354`	`356`	`\|[MU-Kindai/Japanese-SimCSE-BERT-base-sup](https://huggingface.co/MU-Kindai/Japanese-SimCSE-BERT-base-sup)\| 74.10\| 74.19\| 70.08\| 73.26\| 72.51\|`
@@ -357,6 +359,10 @@ fine-tuning元のモデルとしては、`cl-tohoku/bert-large-japanese-v2`と`c
`357`	`359`	`\|[MU-Kindai/Japanese-MixCSE-BERT-base](https://huggingface.co/MU-Kindai/Japanese-MixCSE-BERT-base)\| 76.72\| 76.94\| 72.40\| 76.23\| 75.19\|`
`358`	`360`	`\|[MU-Kindai/Japanese-DiffCSE-BERT-base](https://huggingface.co/MU-Kindai/Japanese-DiffCSE-BERT-base)\| 75.61\| 75.83\| 71.62\| 75.81\| 74.42\|`
`359`	`361`	`\|\|\|\|\|\|\|`
	`362`	`+\|[intfloat/multilingual-e5-small](https://huggingface.co/intfloat/multilingual-e5-small)\| 82.01\| 81.38\| 74.48\| 78.92\| 78.26\|`
	`363`	`+\|[intfloat/multilingual-e5-base](https://huggingface.co/intfloat/multilingual-e5-base)\| 81.25\| 80.56\| 76.04\| 79.65\| 78.75\|`
	`364`	`+\|[intfloat/multilingual-e5-large](https://huggingface.co/intfloat/multilingual-e5-large)\| 80.57\| 79.39\| 79.16\| 81.85\| 80.13\|`
	`365`	`+\|\|\|\|\|\|\|`
`360`	`366`	`\|[sentence-transformers/LaBSE](https://huggingface.co/sentence-transformers/LaBSE)\| 76.54\| 76.77\| 72.15\| 76.12\| 75.02\|`
`361`	`367`	`\|[sentence-transformers/stsb-xlm-r-multilingual](https://huggingface.co/sentence-transformers/stsb-xlm-r-multilingual)\| 73.09\| 72.00\| 77.83\| 78.43\| 76.09\|`
`362`	`368`	`\|\|\|\|\|\|\|`
@@ -373,7 +379,9 @@ fine-tuning元のモデルとしては、`cl-tohoku/bert-large-japanese-v2`と`c
`373`	`379`	`\|[text-embedding-ada-002](https://platform.openai.com/docs/api-reference/embeddings)\| 79.31\| 78.95\| 74.52\| 79.01\| 77.49\|`
`374`	`380`
`375`	`381`	`表から、全体として今回公開したモデルが最もよい性能を示していることがわかります。`
`376`		`-また、OpenAIのtext-embedding-ada-002よりもより性能になっている点は注目に値します。`
	`382`	`+また、OpenAIのtext-embedding-ada-002よりも高い性能になっている点は注目に値するでしょう。`
	`383`	`+`
	`384`	`+さらに、[cl-nagoya/unsup-simcse-ja-large](https://huggingface.co/cl-nagoya/unsup-simcse-ja-large)などUnsupervised SimCSEによってfine-tuningされた文埋め込みモデルの性能が、教師あり学習された他のモデルの性能と遜色ない性能を発揮していることも特筆すべき点と言えるでしょう。`
`377`	`385`
`378`	`386`	`注意として、PKSHA社の文埋め込みモデルはJSTSの開発セットを訓練中の開発セットとして利用しているので、本実験の結果とは直接比較できません。`
`379`	`387`	`また、この評価結果はSTSタスクに限定されたものであり、情報検索タスクなど異なるタスクでの汎用性を保証するものではありません。`

`‎src/evaluate.py`

Lines changed: 62 additions & 40 deletions

Original file line number	Diff line number	Diff line change
`@@ -1,27 +1,29 @@`
`1`		`-importos`
`2`		`-fromconcurrent.futuresimportThreadPoolExecutor`
`3`		`-`
`4`		`-importnumpyasnp`
`5`		`-importopenai`
`6`	`1`	`importtorch.nnasnn`
`7`		`-frommore_itertoolsimportchunked`
`8`		`-fromopenai.openai_objectimportOpenAIObject`
`9`	`2`	`fromsentence_transformersimportSentenceTransformer,models`
`10`	`3`	`fromsrc.stsimportSTSEvaluation`
`11`	`4`	`fromtransformersimportAutoModel,BertModel`
`12`	`5`
`13`		`-openai.api_key=os.environ["OPENAI_API_KEY"]`
`14`		`-`
`15`	`6`	`# MODEL_PATH = "cl-nagoya/sup-simcse-ja-large"`
`16`	`7`	`# MODEL_PATH = "cl-nagoya/sup-simcse-ja-base"`
`17`	`8`	`# MODEL_PATH = "MU-Kindai/Japanese-SimCSE-BERT-large-sup"`
`18`	`9`	`# MODEL_PATH = "colorfulscoop/sbert-base-ja"`
`19`		`-MODEL_PATH="pkshatech/GLuCoSE-base-ja"`
	`10`	`+# MODEL_PATH = "pkshatech/GLuCoSE-base-ja"`
	`11`	`+# MODEL_PATH = "oshizo/sbert-jsnli-luke-japanese-base-lite"`
	`12`	`+MODEL_PATH="intfloat/multilingual-e5-large"`
	`13`	`+`
	`14`	`+`
	`15`	`+sts=STSEvaluation(sts_dir="./datasets/sts")`
	`16`	`+`
`20`	`17`
	`18`	`+defevaluate():`
	`19`	`+model=SentenceTransformer(MODEL_PATH).eval().cuda()`
	`20`	`+print(sts.dev(encode=model.encode))`
	`21`	`+print(sts(encode=model.encode))`
`21`	`22`
`22`		`-defload_jcse(model_name:str):`
`23`		`-backbone=models.Transformer(model_name)`
`24`		`-pretrained_model:BertModel=AutoModel.from_pretrained(model_name)`
	`23`	`+`
	`24`	`+defevaluate_jcse():`
	`25`	`+backbone=models.Transformer(MODEL_PATH)`
	`26`	`+pretrained_model:BertModel=AutoModel.from_pretrained(MODEL_PATH)`
`25`	`27`	`hidden_size=pretrained_model.config.hidden_size`
`26`	`28`
`27`	`29`	`# load weights of Transformer layers`
`@@ -31,7 +33,7 @@ def load_jcse(model_name: str):`
`31`	`33`	`pooling_mode="cls",`
`32`	`34`	`)`
`33`	`35`
`34`		`-if"unsup"inmodel_name:`
	`36`	`+if"unsup"inMODEL_PATH:`
`35`	`37`	`model=SentenceTransformer(modules=[backbone,pooling]).eval().cuda()`
`36`	`38`
`37`	`39`	`else:`
`@@ -49,44 +51,64 @@ def load_jcse(model_name: str):`
`49`	`51`	`mlp.load_state_dict(mlp_state_dict)`
`50`	`52`	`model=SentenceTransformer(modules=[backbone,pooling,mlp]).eval().cuda()`
`51`	`53`
`52`		`-returnmodel`
	`54`	`+print(sts.dev(encode=model.encode))`
	`55`	`+print(sts(encode=model.encode))`
`53`	`56`
`54`	`57`
`55`		`-defload_vanilla(model_name:str):`
`56`		`-backbone=models.Transformer(model_name)`
	`58`	`+defevaluate_vanilla():`
	`59`	`+backbone=models.Transformer(MODEL_PATH)`
`57`	`60`	`pooling=models.Pooling(`
`58`	`61`	`word_embedding_dimension=backbone.auto_model.config.hidden_size,`
`59`	`62`	`pooling_mode="cls",`
`60`	`63`	`)`
`61`		`-returnSentenceTransformer(modules=[backbone,pooling]).eval().cuda()`
	`64`	`+model=SentenceTransformer(modules=[backbone,pooling]).eval().cuda()`
	`65`	`+print(sts.dev(encode=model.encode))`
	`66`	`+print(sts(encode=model.encode))`
`62`	`67`
`63`	`68`
`64`		`-sts=STSEvaluation(sts_dir="./datasets/sts")`
	`69`	`+defevaluate_openai():`
	`70`	`+importos`
	`71`	`+importopenai`
	`72`	`+importnumpyasnp`
	`73`	`+fromconcurrent.futuresimportThreadPoolExecutor`
	`74`	`+frommore_itertoolsimportchunked`
	`75`	`+fromopenai.openai_objectimportOpenAIObject`
	`76`	`+`
	`77`	`+openai.api_key=os.environ["OPENAI_API_KEY"]`
	`78`	`+`
	`79`	`+defencode_openai(batch:list[str]):`
	`80`	`+res:OpenAIObject=openai.Embedding.create(`
	`81`	`+model="text-embedding-ada-002",`
	`82`	`+input=batch,`
	`83`	`+ )`
	`84`	`+return [d.embeddingfordinres.data]`
	`85`	`+`
	`86`	`+defencode(sentences:list[str],batch_size:int=128):`
	`87`	`+embs= []`
	`88`	`+withThreadPoolExecutor(max_workers=32)asexecutor:`
	`89`	`+batches=chunked(list(sentences),batch_size)`
	`90`	`+forembinexecutor.map(encode_openai,batches):`
	`91`	`+embs+=emb`
	`92`	`+embs=np.array(embs)`
	`93`	`+returnembs`
`65`	`94`
`66`		`-# model = load_jcse(MODEL_PATH)`
`67`		`-# model = load_vanilla("cl-tohoku/bert-base-japanese-v3")`
`68`		`-model=SentenceTransformer(MODEL_PATH).eval().cuda()`
`69`		`-print(sts.dev(encode=model.encode))`
`70`		`-print(sts(encode=model.encode))`
	`95`	`+print(sts.dev(encode=encode))`
	`96`	`+print(sts(encode=encode))`
`71`	`97`
`72`	`98`
`73`		`-# def encode_openai(batch: list[str]):`
`74`		`-# res: OpenAIObject = openai.Embedding.create(`
`75`		`-# model="text-embedding-ada-002",`
`76`		`-# input=batch,`
`77`		`-# )`
`78`		`-# return [d.embedding for d in res.data]`
	`99`	`+defevaluate_e5():`
	`100`	`+model=SentenceTransformer(MODEL_PATH).eval().cuda()`
`79`	`101`
	`102`	`+defencode(sentences:list[str]):`
	`103`	`+sentences= [f"query:{s}"forsinsentences]`
	`104`	`+returnmodel.encode(sentences)`
`80`	`105`
`81`		`-# def encode(sentences: list[str], batch_size: int = 128):`
`82`		`-# embs = []`
`83`		`-# with ThreadPoolExecutor(max_workers=32) as executor:`
`84`		`-# batches = chunked(list(sentences), batch_size)`
`85`		`-# for emb in executor.map(encode_openai, batches):`
`86`		`-# embs += emb`
`87`		`-# embs = np.array(embs)`
`88`		`-# return embs`
	`106`	`+print(sts.dev(encode=encode))`
	`107`	`+print(sts(encode=encode))`
`89`	`108`
`90`	`109`
`91`		`-# print(sts.dev(encode=encode))`
`92`		`-# print(sts(encode=encode))`
	`110`	`+if__name__=="__main__":`
	`111`	`+# evaluate()`
	`112`	`+# evaluate_vanilla()`
	`113`	`+# evaluate_openai()`
	`114`	`+evaluate_e5()`

0 commit comments

Comments

(0)

Movatterモバイル変換

Navigation Menu

Search code, repositories, users, issues, pull requests...

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Commit5b13873

File tree

2 files changed

2 files changed

`‎README.md`

`‎src/evaluate.py`

0 commit comments