本記事では、私が 2025 年に Kaggle 部門の「Google Developer Expert」として取り組んだことを紹介します。 「Kaggle Advent Calendar 2025」および「JP_Google Developer Experts Advent Calendar 2025」の 5 日目の記事です。 Google Developer Expert は…
ご縁があり、講談社から共著で『Kaggle ではじめる大規模言語モデル入門 〜自然言語処理〈実践〉プログラミング〜』を出版します。 Amazon ページ や講談社の書籍ページは先日公開され、年明け 2026 年 1 月中旬に出版予定です。 書籍概要 書名の通り、Kaggl…
『先輩データサイエンティストからの指南書 -実務で生き抜くためのエンジニアリングスキル』(技術評論社)を、著者らのご厚意でご恵贈いただきました。実務で求められるコードの品質管理に関する考え方・ツールや、機械学習に特徴的なデータ確認や実験管理…
『原論文から解き明かす生成 AI』(技術評論社)をご恵贈いただきました。書籍の冒頭でご紹介いただいている通り、出版前レビューを担当しています。 gihyo.jp 本書は、生成 AI を支える理論的基礎について論文レベルまで深く踏み込んで解説している野心的な…
2025 年 4 月 25 日(金)〜2025 年 5 月 2 日(金)に開催された「第 1 回日本人工知能オリンピック (JOAI2025)」のコンペティションの出題に協力しました。主に中学生・高校生・高専生を対象としたコンペです。コンペの成績優秀者はその後の解法提出や面談…
『実践 Data Science シリーズ Python ではじめる データ分析のための前処理入門』(講談社)を、出版社のご厚意でご恵贈いただきました。データの前処理からモデリングに至るまでのデータ分析の過程を体系的に解説している書籍です。 www.kspub.co.jp 近年…
「言語処理100本ノック 2025」が2025年4月7日に公開されました。2020年以来、5年ぶりの改訂です。昨今の自然言語処理の研究動向を鑑み、大規模言語モデルに関する問題追加などの変更があります(更新履歴)。 nlp100.github.io 実装のためのプログラミング言…
『データのつながりを活かす技術〜ネットワーク/グラフデータの機械学習から得られる新視点』(技術評論社)を、著者の一人である黒木裕鷹さんのご厚意でご恵贈いただきました。本記事では、概要と感想を綴ります。 gihyo.jp 書籍概要 ネットワーク/グラフ…
年末恒例の振り返り記事です。例年通り、対外公表している事例の一覧をまとめました。社内での取り組みについては対外公表できていない話題も多いですが、今年は一部ですがプレスリリースを打てたのが印象に残っています。 査読付き論文 主著で論文誌に2本採…
「Kaggle Advent Calendar 2024」の 20 日目の記事です。 ニューズレター「Weekly Kaggle News」が本日 5 周年を迎えました。日本語で、Kaggleをはじめとするデータ分析コンペティションに関する話題を取り扱っています。週次で毎週金曜日に更新しており、最…
「Kaggle Advent Calendar 2024」の 17 日目を担当します。 本記事では 12、15、16 日目の記事に関連して、学会で開催されるコンペ(以降、学会コンペ)を通じて、論文執筆の流れを学んだ話を綴ります。 あまり一般的ではないキャリアのため直接参考になる読…
「Kaggle Advent Calendar 2024」の 5 日目の記事です。 2023 年 12 月に出版された『Developing Kaggle Notebooks: Pave your way to becoming a Kaggle Notebooks Grandmaster』(Packt)の書籍メモです。 なお同書は、著者の Gabriel Preda さん のご厚意…
「Kaggle Advent Calendar 2024」の 4 日目の記事では「人工知能学会コンペティション開催支援制度」を紹介します。 著者の私は今年 2024 年、人工知能学会の企画委員(コンペティション担当)を拝命しました。 業務の一つとして本制度の運営に関わっていま…
「Kaggle Advent Calendar 2024」の 1 日目の記事では、2024 年に開催された Kaggle コンペを振り返ります。 コンペで扱うデータの種類の年次推移 Kaggle に関するデータがまとめられた公式データセット「Meta Kaggle」を用いて、コンペティションで扱うデー…
2024 年 6 月 14 日に日本実業出版社から発売された『行動経済学が勝敗を支配する』を読んだので、感想を綴ります。 なお本書は、著者の今泉拓さんのご厚意でご恵贈いただきました。 www.njg.co.jp 本書は、スポーツを題材とした行動経済学の研究成果を、日…
2024 年 6 月 7 日に共立出版から発売された『コンピュータビジョン最前線 Summer 2024』を読んだので、感想を綴ります。なお本書は、寄稿者の一人である清野舜さんのご厚意でご恵贈いただきました。 www.kyoritsu-pub.co.jp コンピュータビジョン最前線 「…
年末恒例の振り返り記事です。 2021 年 4 月の部署異動を契機に、今年も研究開発部署にて案件を自分自身で創出・推進していくことに挑戦した一年でした。 特に「ChatGPT」に代表される大規模言語モデルが社会一般に認知されたことで、ありがたいことにここ数…
「Kaggle Advent Calendar 2023」の 20 日目の記事です。 ニューズレター「Weekly Kaggle News」が本日 4 周年を迎えました。日本語で、Kaggleをはじめとするデータ分析コンペティションに関する話題を取り扱っています。週次で毎週金曜日に更新しており、最…
Kaggle Advent Calendar 2023 の 1 日目の記事です。 「『極意本』サンプルコードをクラウド上で動かそう」の題目で、11 月 26 日開催の「Kaggle Tokyo Meetup 2023」で発表しました。 会場&サポート提供による Google のスポンサーセッションにお招きいた…
問題文 nlp100.github.io 問題の概要 BERT から転移学習します。この章のこれまでの実装と繋がりがなくなりますが、Transformers ライブラリの Trainer を使います。 import os import datasets import evaluate import numpy as np import pandas as pd fro…
問題文 nlp100.github.io 問題の概要 何かしらのパラメータをチューニングします。 # ref: https://www.shoeisha.co.jp/book/detail/9784798157184 import re from collections import defaultdict import joblib import pandas as pd import torch from gen…
問題文 nlp100.github.io 問題の概要 RNN で確率的勾配降下法を用いて学習した 言語処理100本ノック 2020「82. 確率的勾配降下法による学習」 - u++の備忘録 と同様です。 # ref: https://www.shoeisha.co.jp/book/detail/9784798157184 import re from coll…
問題文 nlp100.github.io 問題の概要 CNN を実装します。なお実装時には『現場で使える!PyTorch開発入門 深層学習モデルの作成とアプリケーションへの実装』(翔泳社)のサンプルコードを一部流用しました。 # ref: https://www.shoeisha.co.jp/book/detail…
問題文 nlp100.github.io 問題の概要 RNN を双方向しました。具体的には bidirectional=True にし、続く層の hidden_size を 2 倍にしています。なお実装時には『現場で使える!PyTorch開発入門 深層学習モデルの作成とアプリケーションへの実装』(翔泳社)…
問題文 nlp100.github.io 問題の概要 Google Newsデータセットの学習済み単語ベクトルで単語埋め込みを初期化して学習します。なお実装時には『現場で使える!PyTorch開発入門 深層学習モデルの作成とアプリケーションへの実装』(翔泳社)のサンプルコード…
問題文 nlp100.github.io 問題の概要 ミニバッチでの処理を追加します。なお実装時には『現場で使える!PyTorch開発入門 深層学習モデルの作成とアプリケーションへの実装』(翔泳社)のサンプルコードを一部流用しました。 # ref: https://www.shoeisha.co.…
問題文 nlp100.github.io 問題の概要 確率的勾配降下法による学習の処理を追加します。なお実装時には『現場で使える!PyTorch開発入門 深層学習モデルの作成とアプリケーションへの実装』(翔泳社)のサンプルコードを一部流用しました。 # ref: https://ww…
問題文 nlp100.github.io 問題の概要 RNN を実装します。なお実装時には『現場で使える!PyTorch開発入門 深層学習モデルの作成とアプリケーションへの実装』(翔泳社)のサンプルコードを一部流用しました。 import re from collections import defaultdict…
問題文 nlp100.github.io 問題の概要 指示通りに愚直に実装します。 from collections import defaultdict import joblib import pandas as pd def text2id(text): return [word2token[word] for word in text.split()] X_train = pd.read_table('ch06/train…
問題文 nlp100.github.io 問題の概要 ネットワークを 3 層に変更しています。 import joblib import matplotlib.pyplot as plt import numpy as np import torch from torch import nn, optim from torch.utils.data import DataLoader, TensorDataset from …
Detail:Profile
引用をストックしました
引用するにはまずログインしてください
引用をストックできませんでした。再度お試しください
限定公開記事のため引用できません。