s1r-J/jinmei-dictPublic

NotificationsYou must be signed in to change notification settings
Fork2
Star5

辞書データから人名だけを抜き出し、読み仮名（カタカナ）をキーとして、候補となる書き文字をリストで保持するようなJSON形式に整形しています。

License

Apache-2.0 license

5 stars 2 forks Branches Tags Activity

Star

Notifications

You must be signed in to change notification settings

Branches Tags

Folders and files

Name		Name	Last commit message	Last commit date
Latest commit History 4 Commits
data		data
jinmei		jinmei
scripts		scripts
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
index.html		index.html

Repository files navigation

jinmei-dict

下記の辞書データから人名だけを抜き出し、読み仮名（カタカナ）をキーとして、候補となる書き文字をリストで保持するようなJSON形式に整形しています。

さらに、厚生労働省のウェブサイトにあった異体字リストを参考に異体字対応表（scripts/itaiji.json）を作成し、辞書データから取得した書き文字を異体字に変換して追加登録しました。

NAIST-jdic
mecab-ipadic-neologd
自作辞書データ(data/addon.csv)

2020年4月2日時点では、
姓は読み仮名が54,970語で漢字候補は210,676語、名の読み仮名が15,740語で漢字候補は186,651語となっています。

利用できる辞書データの探索と自作辞書へのデータ追加が課題です。

Description

sei.jsonは姓のデータです。mei.jsonは名のデータです。

scriptsフォルダ以下には人名データを抜き出してJSONに整形するスクリプト（Python）があります。
使い方は以下のとおりです。

各辞書データのCSVファイル（mecab形式）を用意します。
異体字リスト（scripts/itaiji.json）をスクリプトと同じ位置に配置します。
scripts/jinmei-dict.pyを実行します。（Python3）

python jinmei-jdic.py '~/naist-jdic.csv' '~/mecab-user-dict-seed.yyyyMMdd.csv' '~/addon.csv'

Usage

jinmeiフォルダ以下に姓・名それぞれのJSONデータがあります。

かんたんに使うだけなら、GitHub Pagesで作成したサイトで読み仮名から人名漢字を検索する事ができます。

Licence

Apache-2.0

Author

s1r-J

About

s1r-j.github.io/jinmei-dict

Releases

No releases published

Packages

No packages published

Movatterモバイル変換

Navigation Menu

Search code, repositories, users, issues, pull requests...

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

License

Uh oh!

Folders and files

Latest commit

History

Repository files navigation

jinmei-dict

Description

Usage

Licence

Author

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages

Languages

Movatterモバイル変換

License

s1r-J/jinmei-dict

Folders and files

Latest commit

History

Repository files navigation

jinmei-dict

Description

Usage

Licence

Author

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages0

Languages

Packages