Movatterモバイル変換


[0]ホーム

URL:


Skip to content

Navigation Menu

Sign in
Appearance settings

Search code, repositories, users, issues, pull requests...

Provide feedback

We read every piece of feedback, and take your input very seriously.

Saved searches

Use saved searches to filter your results more quickly

Sign up
Appearance settings

【2024年版】BERTによるテキスト分類

License

NotificationsYou must be signed in to change notification settings

hppRC/bert-classification-tutorial-2024

Repository files navigation

本実装はhppRC/bert-classification-tutorialの2024版実装です。
実装の背景や詳細についてはこちらのリポジトリをご覧ください。

以前の実装からの主な変更点は以下の通りです。

  • 実装全体をHuggingFace関連ライブラリを利用するように変更
    • データセットの構築をHuggingFace Datasetsを利用するように変更
    • 訓練をHuggingFaceのTrainerとAccelerateを利用するように変更
  • 仮想環境の構築にryeを利用するよう変更

実行手順

# 環境構築rye sync -fsource .venv/bin/activate# データセット作成python src/prepare.py# 訓練accelerate launch --config_file config/4-ds.json src/train.py --model_name tohoku-nlp/bert-base-japanese-v3 --experiment_name 4-ds

補足

  • configディレクトリにaccelerate利用時のconfigファイルを保存してあります
    • 4-ds.jsonは4GPU+DeepSpeedを利用する場合の設定ファイルです
    • 1.jsonは1GPUのみ利用する場合の設定ファイルです
    • accelerate config --config_file config/hoge.jsonを実行することでお好みの設定ファイルを対話的に作成することができます
  • tensorboard --logdir ./outputsを実行することでTensorBoardを利用して学習の進捗を確認することができます

おわりに

本実装が研究・企業応用・個人利用問わずさまざまな方のお役に立てれば幸いです。

質問・バグ報告などがあればどんなことでもIssueにお書きください。

著者情報・引用

作者:Hayato Tsukagoshi
email:research.tsukagoshi.hayato@gmail.com関連学会記事:BERTによるテキスト分類チュートリアル

論文等で本実装を参照する場合は、以下をお使いください。

@article{  hayato-tsukagoshi-2023-bert-classification-tutorial,,title={{BERT によるテキスト分類チュートリアル}},author={塚越 駿 and 平子 潤},journal={自然言語処理},volume={30},number={2},pages={867-873},year={2023},doi={10.5715/jnlp.30.867},url ={https://www.jstage.jst.go.jp/article/jnlp/30/2/30_867/_article/-char/ja},}

About

【2024年版】BERTによるテキスト分類

Topics

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages


[8]ページ先頭

©2009-2025 Movatter.jp