- Notifications
You must be signed in to change notification settings - Fork0
2023年1月にリニューアルしたNDL Ngram Viewerのソースコード等一式
License
ndl-lab/ndlngramviewer_v2
Folders and files
Name | Name | Last commit message | Last commit date | |
---|---|---|---|---|
Repository files navigation
図書資料約97万点及び雑誌資料132万点を対象に、2022年5月からNDLラボの実験サービスとして公開しているNDL Ngram Viewerのソースコードです。
2023年1月に対象範囲を大幅に拡大したことに伴い、2022年5月から2023年1月まで公開していたVersion 1に変更を加えたため、リポジトリを分けています。
このREADMEはローカル環境(http://localhost:9981/ngramviewer/)にアプリケーションを構築する手順を説明しています。
自分でビルドする場合は、appディレクトリ内のREADME.mdを参考にしてください。
なお、リリース時のアプリケーションのURLやElasticsearchのエンドポイントの設定はapp/src/main/resources/config/application.ymlを編集してビルドすることで変更可能です。
自分でビルドする場合は、appディレクトリ内のREADME.mdを参考にしてください。
infra-docker/es_dockerに、サービス提供用Elasticsearchのdocker-composeの設定ファイル一式があります。infra-docker/README.mdの指示に従ってElasticsearchコンテナを起動してください。
ビルド済アプリケーションを置いたディレクトリで下記のコマンドを実行してください。
【注意!】Elasticsearchコンテナのデータが初期化されますので気を付けてください
java -jar ngramviewer-0.1.jar batch create-index all
自分で投入用データの作成を行う場合には、datacreationtoolsディレクトリ内のREADME.mdを参考にしてください。
当館が用意したデータを投入する場合、必要な全データセットを次のリポジトリから公開しています。
https://github.com/ndl-lab/ndlngramdata
上記のリポジトリから公開しているデータセットを利用した投入データの作成方法については、datacreationtools/4_merge/README.mdを参考にしてください。
下記のコマンドを実行してください。
java -jar ngramviewer-0.1.jar batch index-gzip sorted-merge-ngram.json.gz
下記のコマンドを実行してサービスを起動してください。
java -jar ngramviewer-0.1.jar web
実行後、
http://localhost:9981/ngramviewer/
から起動したサービスにアクセスできます。
技術的な詳細や機能については、下記の文献を参照してください。
青池亨. 日本語資料の全文テキストデータ分析ツールNDL Ngram Viewerの開発について. じんもんこん2022.
青池亨. E2533 - NDL Ngram Viewerの公開:全文テキストデータ可視化サービス カレントアウェアネス-E, No.442, 国立国会図書館(https://current.ndl.go.jp/e2533)
About
2023年1月にリニューアルしたNDL Ngram Viewerのソースコード等一式
Resources
License
Uh oh!
There was an error while loading.Please reload this page.
Stars
Watchers
Forks
Releases
Packages0
Uh oh!
There was an error while loading.Please reload this page.