Movatterモバイル変換

Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Speaker Deck

Speaker Deck

テストから始めるAgentic Coding 〜Claude Codeと共に行うTDD〜 / ...

July 08, 2025

5.6k

テストから始めるAgentic Coding 〜Claude Codeと共に行うTDD〜 / Agentic Coding starts with testing

2025/07/08(火)に開催されたClaude Code Meetup Japan #1の登壇資料です
https://aid.connpass.com/event/360017/

r-kagaya

July 08, 2025

More Decks by r-kagaya

See All by r-kagaya

コードの90%をAIが書く世界で何が待っているのか / What awaits us in a world where 90% of the code is written by AI

54

34k

CursorとDevinが仲間！？AI駆動で新規プロダクト開発に挑んだ３ヶ月を振り返る / A Story of New Product Development with Cursor and Devin

6

2.8k

データと事例で振り返るDevin導入の"リアル" / The Realities of Devin Reflected in Data and Case Studies

3

4.4k

AIコーディングエージェントを「使いこなす」ための実践知と現在地 in ログラス / How to Use AI Coding Agent in Loglass

4

2.4k

AIコーディングワークフローの試行〜AIエージェント×ワークフローでの自動化を目指して〜

3

5.7k

Devin入門と最近のアップデートから見るDevinの進化 / Introduction to Devin and the Evolution of Devin as Seen in Recent Update

11

6.8k

Devin入門〜月500ドルから始まるAIチームメイトとの開発生活〜 / Introduction Devin 〜Development With AI Teammates〜

7

4.9k

デザインパターンで理解するLLMエージェントの作り方 / How to develop an LLM agent using agentic design patterns

17

7.1k

Automated Promptingを目指すその前に / Before we can aim for Automated Prompting

1

280

Other Decks in Programming

See All in Programming

RailsGirls IZUMO スポンサーLT

0

200

Hack Claude Code with Claude Code

7

2.5k

PHP 8.4の新機能「プロパティフック」から学ぶオブジェクト指向設計とリスコフの置換原則

2

1k

チームで開発し事業を加速するための"良い"設計の考え方 @ サポーターズCoLab 2025-07-08

1

470

Git Sync を超える！OSS で実現する CDK Pull 型デプロイ / Deploying CDK with PipeCD in Pull-style

4

350

AI コーディングエージェントの時代へ：JetBrains が描く開発の未来

1

200

iOS 26にアップデートすると実機でのHot Reloadができない？

0

140

Model Pollution

1

160

ニーリーにおけるプロダクトエンジニア

0

950

Rails Frontend Evolution: It Was a Setup All Along

0

280

新メンバーも今日から大活躍！SREが支えるスケールし続ける組織のオンボーディング

5

8.7k

Flutterで備える！Accessibility Nutrition Labels完全ガイド

0

170

Featured

See All Featured

Building a Modern Day  E-commerce SEO Strategy

42

7.4k

Raft: Consensus for Rubyists

140

7k

Rebuilding a faster, lazier Slack

83

9.1k

Let's Do A Bunch of Simple Stuff to Make Websites Faster

507

140k

[RailsConf 2023 Opening Keynote] The Magic of Rails

29

9.6k

Faster Mobile Websites

308

31k

Improving Core Web Vitals using Speculation Rules API

sergeychernyshev

18

990

Measuring & Analyzing Core Web Vitals

7

520

The Power of CSS Pseudo Elements

77

5.9k

XXLCSS - How to scale CSS and keep your sanity

248

1.3M

Helping Users Find Their Own Way: Creating Modern Search Experiences

29

2.7k

Distributed Sagas: A Protocol for Coordinating Microservices

331

22k

Transcript

© 2024 Loglass Inc. 0 テストから始めるAgentic Coding 〜Claude Codeと共に行うTDD〜 2025年7⽉8⽇
株式会社ログラス r.kagaya 0
1 ⾃⼰紹介新卒でヤフー株式会社に入社、ID連携システムの開発 2022年に株式会社ログラスに入社経営管理SaaSの開発、開発生産性向上に取り組んだのち、生成AI/LLMチームを立ち上げ、複数LLM機能の開発をリード現在は新規AIプロダクトの立ち上げに従事株式会社ログラス r.kagaya(@ry0_kaga)
2 今日の内容主にテストが主題で、プラスTDD with Claude Code • AIコーディングにおけるテストの捉え方 • Claude
CodeでのTDD Claude Code、TDDよりテストが主役になってしまった
© 2024 Loglass Inc. 3 我々を取り巻く状況
4 1ヶ月前まで https://comemo.nikkei.com/n/n26dc284dcd5a
5 1年間の育休からの異世界転生 https://x.com/jamgodtree/status/1927682077719498893
6 1年間の育休からの異世界転生 https://x.com/jamgodtree/status/1927682077719498893
7 今となってはClaude Codeに大移動余談: Clade Codeの開発責任者はCursorに移籍したらしい（https://x.com/btibor91/status/1940125489311752306）
8 Claude Code開発者の談 https://www.youtube.com/watch?v=Yf_1w00qIKc
9 Claude Code開発者の談 https://www.youtube.com/watch?v=Yf_1w00qIKc 「私はもう何ヶ月もユニットテストを書いていない」「今では手書きコードを書くのが嫌になった。Claudeがあまりにも上手いから」「パンチカードからプロンプトへ」
10 AI時代にテストにどう向き合うか？
© 2024 Loglass Inc. 11 AIコーディングにおけるテスト
12 スタンステストの価値は変わらない・むしろ大きくなった一方で捉え方や向き合い方は多少なり変わっていく
13 AIコーディングエージェントは変幻自在
14 ほとんどの人間よりコーディングに関する知識はある but.. 時たま顔を覗かせる、予測不可能な性質このスーパー知能を我々は上手く協働・制御しないといけない
15 Agentic Coding and Vibe Coding Agentic Coding • Agentic
Codingは、自律的に動く AIエージェントをどのように導くか？オーケストレートするか？ • 「人を増やす」から「Agentを増やす」へのパラダイムシフト Vibe Coding • 対話型・人間主導、探索的なアプローチ https://arxiv.org/pdf/2505.19443
16 Agentic Coding and Vibe Coding Agentic Coding • Agentic
Codingは、自律的に動く AIエージェントをどのように導くか？オーケストレートするか？ • 「人を増やす」から「Agentを増やす」へのパラダイムシフト Vibe Coding • 対話型・人間主導、探索的なアプローチ • https://arxiv.org/pdf/2505.19443 Agentic CodingはAIを「導く」 AIをどこに導きたいか？ゴールに近づいてるかをどう図るか？
17 AIのアウトプットを収斂させるゴールと制約と評価（評価関数）をどう与えるか？ AIの制約・ガードレールとして機能する歴戦の勇たちある種のゴール・制約として機能する通過まで自律的にAIは試行錯誤（勝手にテスト自体を消したりしない限り） • 型システムによる安全性の担保 • 自動テストによる動作保証
• コーディング規約の自動チェック型（Types）テスト（Tests）リント（Lints）
18 テストがあるから色々できる包括的なテストカバレッジがあれば、AIコード生成のリスクは減少する • テストの範囲で、AIによる多少違和感のあるコードでも受け入れられる ◦ なぜなら、テストでその動作は保証されているなら • 納得いくまでAIにリファクタリングを任せることもできる ◦
なぜなら、テストでその動作は保証されているならテストは仕様を形式化し、AIとも共有可能な「認識の装置」
19 Agentic Codingには「明確なゴール・物差し」が必要目的の場所に辿り着くのをただ祈るだけは辛い（これはこれでバイブスで楽しいが）
20 「良い感じに動くようにして」「全ユニットテストをパスするコードを書いて」
21 「良い感じに動くようにして」「全ユニットテストをパスするコードを書いて」限りなくシンプル but 確かな目的地の提示
22 テストで一つの「理想の状態」をAIに示すテストが落ちること自体が具体的なフィードバック
23 ゴールがテストとして示されていれば、少なくとも”テストを通過するコード”というアウトプットを得られる可能性は高い（テストを勝手に消す・コメントアウトするのは辞めさせよう！）
24 > "The role is changing from someone who writes
code to someone who teaches AI what good code looks like. Tests are the curriculum." > （役割は、コードを書く人から、良いコードとは何かをAIに教える人へと変わっています。テストがそのカリキュラムなのです。） Kent Beck談 https://newsletter.pragmaticengineer.com/p/tdd-ai-agents-and-coding-with-kent
© 2024 Loglass Inc. 25 TDD with Claude Code
26 ようやくTDDの話... テストはAIコーディングに有意義と考えていることを話した
27 t-wada氏によるTDD https://levtech.jp/media/article/interview/detail_480/ ・TDDを実践しながらコードを書く感覚をたとえるなら、不確実性にまみれたソフトウェア開発に少しずつ確実性を持たせていく、一種の陣取り合戦みたいなものです。・その中で「こう動いてほしい」という期待を反映したテストを書き、それに対するコードを書いて、動かしてみる。
28 t-wada氏によるTDD https://levtech.jp/media/article/interview/detail_480/ ・TDDを実践しながらコードを書く感覚をたとえるなら、不確実性にまみれたソフトウェア開発に少しずつ確実性を持たせていく、一種の陣取り合戦みたいなものです。・その中で「こう動いてほしい」という期待を反映したテストを書き、それに対するコードを書いて、動かしてみる。仕様や設計を見つける・良くしていく過程がTDD 「何を作るべきか」という不明瞭さ、設計に向き合
いつつも、テストはAIを導く印にもなる
29 TDD with AI Agents テストをAIへの継続的フィードバック・ガードレールとして活用振る舞いや仕様準拠の保証がある程度でも出来ていればその部分は安心 • 期待する動作をテストで定義し、AIへ仕様として提示 •
自動テストでAIが生成したコードの誤りを即座に検出 • 包括的なテストスイートで意図しない変更を防止いかにAI生成コードを信じられる構造を作るか？そして、広範囲かつ高速なテストスイートが欲しくなってくる
30 Claude CodeでTDDを行うなら？（正直大したことはやっていない）
31 TDD with Claude code 最初の一歩はカスタムコマンド BDD + RGBC(RED-GREEN-BLUE-COMMIT)サイクルを模したカスタムコマンドを定義
32 TDD with Claude code BDD + RGBCサイクル + ドキュメント生成まで行う指示を含め
たコマンドを定義
33 Swarm Intelligence 同じテストに対して複数の異なる実装を試す • 例えば、3パターン同時実装からのチェリーピック • 「とりあえず実装してみてから選ぶ」という贅沢「今思えばあの設計の方が..でも期限が..」
34 Simon Willisonが提唱するPerfect Commit 実装・テスト・ドキュメントのフルセットをコミットに含める AIがあるから低コストで実現可能に https://simonwillison.net/2025/May/28/automated-tests/ カスタムコマンド内でPerfect Commitになるように設定 •
機能を実現するコード • その機能が正しく動作することを保証するテスト • コードの使い方や設計意図の説明実装（Implementation）テスト（Tests）ドキュメント（Documentatio）
35 Perfect Commitの実践例コミットメッセージにはドキュメント・テストのパスも含める AIが探索する時のコンテキストになる（と信じて）＊イメージ
36 また別軸の試行錯誤や思考
37 テストの高速化大事（出来ていない）高速で実行される大量のテストを気軽に実行したい Kent Beckによる具体的な数値：遅いテスト実行は人間にも億劫、言わんばAIもや https://newsletter.pragmaticengineer.com/p/tdd-ai-agents-and-coding-with-kent > 私のテストスイートは300ミリ秒で実行されます。これは、すべての変更後に実行できるほど速いのです。AIが何かを誤って壊しても、私はすぐに気づ
きます。
38 試しているピラミッドの上下を手厚くして、砂時計型を目指してみる（Claude Codeの力でテスト生成） Unit Test E2E
39 試しているピラミッドの上下を手厚くして、砂時計型を目指してみる（Claude Codeの力でテスト生成） Unit Test E2E E2Eが最も少なくなるのは、コスト、実行速度、不安定さなどが理由（一方で某ポータルサイトのID連携システ
ムには、ほぼ全てのシナリオを網羅した E2Eがあり、安心感はあった）
40 試しているピラミッドの上下を手厚くして、砂時計型を目指してみる（Claude Codeの力でテスト生成） Unit Test E2E 実行の遅さが解消されるかはわからないが、実装コストは確実に下がる（E2Eテストよりもブラウザ自動化エー
ジェントな世界かもしれない
41 試しているピラミッドの上下を手厚くして、砂時計型を目指してみる（Claude Codeの力でテスト生成） Unit Test E2E いかにAIコードを信用できる構造を作るか？を考えたい E2Eが最適かはさておき、システムレイヤー
で振る舞いが保証されているのはわかりやすい例の一つ
42 試しているピラミッドの上下を手厚くして、砂時計型を目指してみる（Claude Codeの力でテスト生成） Unit Test E2E AIによってテストのコスト構造が変わった時に、今と同じ感覚でE2E（相当の何か）を捉えるべきか？何が変わるのか？
（を考えている）
43 Googleの「AlphaEvolve」出典: https://xtech.nikkei.com/atcl/nxt/column/18/03248/062000001/
44 Googleの「AlphaEvolve」出典: https://xtech.nikkei.com/atcl/nxt/column/18/03248/062000001/ 問題と評価式がインプットの世界考えるべきは評価式。「良い」や「理想状態」を定義・評価したい
45 Googleの「AlphaEvolve」出典: https://xtech.nikkei.com/atcl/nxt/column/18/03248/062000001/ ソフトウェア開発・コーディングにおける評価式/評価関数は？
46 AIコーディングエージェントによる開発 is Reconciliation Loop? Reconciliation Loop is 「記述された理想状態と、現在の状態を比較し、その差分がなくなるまで調整する」
そのためには理想状態を定義できること、現在の状態との差分を評価・測れること宣言的(Declarative)` 継続的(Continuous) 収束的(Convergent) 自己修復的(Self-healing) 46
47 AIコーディングエージェントによる開発 is Reconciliation Loop? Reconciliation Loop is 「記述された理想状態と、現在の状態を比較し、その差分がなくなるまで調整する」
そのためには理想状態を定義できること、現在の状態との差分を評価・測れること宣言的(Declarative)` 継続的(Continuous) 収束的(Convergent) 自己修復的(Self-healing) 47 ここに活用できるのが BDDや形式手法？
© 2024 Loglass Inc. 48 まとめ
• テストはAIに対する指示書でありフィードバックであり、Reconciliation Loop を回すための評価関数かもしれない • テストを書くこと自体にもAIコーディングエージェントをどう使うか考える • Claude Codeでテスト/TDDを行うのにカスタムコマンドやPerfect Commit
の取り組みをしている • Hooksや形式手法ももっとうまく使いたいので、今後の自分に期待 49 まとめ
50

[8]ページ先頭

©2009-2025 Movatter.jp