- Notifications
You must be signed in to change notification settings - Fork2
sociocom/DNorm-J
Folders and files
Name | Name | Last commit message | Last commit date | |
---|---|---|---|---|
Repository files navigation
日本語の病名を正規化するツールです
DNormの日本語実装になります.
Tf-idf ベースのランキング手法により病名を正規化します。
詳細はリンク先の論文をご参照ください.
- python >= 3.6.1
- MeCab >= 0.996.5
- IPA 辞書
pip install git+https://github.com/sociocom/DNorm-J.git
ターミナルなどの端末アプリでコマンドラインアプリケーションとして使えるほか,Python スクリプト内でライブラリとして導入することが可能です.
いずれの使い方でも,初回に学習済みモデルファイルをローカル($HOME/.cache/Dnorm
)にダウンロードします.そのため,初回起動には時間がかかります.
- -i:入力ファイル
- -o:出力ファイル
- -n:正規化先の病名リスト(デフォルト設定では指定する必要はありません)
- -d:略語展開辞書(デフォルト設定では指定する必要はありません)
python -m dnorm_j -i sample.txt -o output.txt
腸閉塞症状高Ca尿症二次性副腎不全
イレウス高カルシウム尿症副腎クリーゼ
fromdnorm_jimportDNormmodel=DNorm.from_pretrained()result=model.normalize('AML')print(result)# => '急性骨髄性白血病'
- 氏家翔吾(奈良先端科学技術大学院大学)
About
Japanese version of DNorm
Resources
License
Uh oh!
There was an error while loading.Please reload this page.
Stars
Watchers
Forks
Releases
No releases published
Packages0
No packages published
Uh oh!
There was an error while loading.Please reload this page.
Contributors3
Uh oh!
There was an error while loading.Please reload this page.