Movatterモバイル変換

Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Speaker Deck

Speaker Deck

AIと”コードの評価関数”を共有する / Share the "code evaluation...

Shintani Teppei

July 03, 2025

180

AIと”コードの評価関数”を共有する / Share the "code evaluation function" with AI

omotesando.rb #111 での発表資料です。
https://omotesandorb.connpass.com/event/359259/

https://github.com/euglena1215/code-qualia

Shintani Teppei

July 03, 2025

More Decks by Shintani Teppei

See All by Shintani Teppei

ISUCONで型をつける

1

110

3年でバックエンドエンジニアが5倍に増えても破綻しなかったアーキテクチャそして、これから / Software architecture that scales even with a 5x increase in backend engineers in 3 years

11

5.2k

モジュラモノリス、その前に / Modular monolith, before that

8

1.1k

いつか使える ObjectSpace / Maybe useful ObjectSpace

2

230

rbs-inlineを導入してYARDからRBSに移行する

1

800

Ruby の型に関する活動をやっている話 / Activities related to Ruby types

3

380

そろそろ理解する includes / Understanding includes

1

930

習うより慣れる Ruby AST / Ruby AST is better to get used to than to learn.

2

630

Railsでエンドポイントごとのテストカバレッジを測定する / Measuring Test Coverage per Endpoint in Rails

1

550

Other Decks in Programming

See All in Programming

『自分のデータだけ見せたい！』を叶える──Laravel × Casbin で複雑権限をスッキリ解きほぐす 25 分

2

660

React は次の10年を生き残れるか：3つのトレンドから考える

6

1.6k

状態遷移図を書こう / Sequence Chart vs State Diagram

2

200

[SRE NEXT] 複雑なシステムにおけるUser Journey SLOの導入

0

150

ご注文の差分はこちらですか？〜 AWS CDK のいろいろな差分検出と安全なデプロイ

3

570

The Niche of CDK Grant オブジェクトって何者？/the-niche-of-cdk-what-isgrant-object

1

610

NEWT Backend Evolution

1

140

Python型ヒント完全ガイド初心者でも分かる、現代的で実践的な使い方

1

240

AI時代の『改訂新版良いコード／悪いコードで学ぶ設計入門』 / ai-good-code-bad-code

23

9.6k

The Modern View Layer Rails Deserves: A Vision For 2025 And Beyond @ RailsConf 2025, Philadelphia, PA

2

730

Quand Symfony, ApiPlatform, OpenAI et LangChain s'allient pour exploiter vos PDF : de la théorie à la production…

0

220

MDN Web Docs に日本語翻訳でコントリビュートしたくなる

1

130

Featured

See All Featured

Responsive Adventures: Dirty Tricks From The Dark Corners of Front-End

251

21k

Code Reviewing Like a Champion

524

40k

Large-scale JavaScript Application Architecture

512

110k

The Success of Rails: Ensuring Growth for the Next 100 Years

45

7.5k

The Cult of Friendly URLs

79

6.5k

Easily Structure & Communicate Ideas using Wireframe

194

16k

A Modern Web Designer's Workflow

695

190k

How to Create Impact in a Changing Tech Landscape [PerfNow 2023]

53

2.9k

460

140k

Facilitating Awesome Meetings

54

6.5k

The Invisible Side of Design

301

51k

Optimizing for Happiness

379

70k

Transcript

2025/07/03　omotesando.rb #111 株式会社タイミー　新谷哲平 AIと”コードの評価関数”を共有する @euglena1215
自己紹介 Shintani Teppei（@euglena1215） • 株式会社タイミー • バックエンドテックリード • Claude
Pro の枠をスマホゲームのデイリーミッションの気持ちで消費してます
2025/07/03　omotesando.rb #111 株式会社タイミー　新谷哲平 AIと”コードの評価関数”を共有する @euglena1215
AIエージェントとプログラミングをしていて思うこと
AIエージェントとプログラミングをしていて思うこと
AIエージェントとプログラミングをしていて思うこと
AIエージェントとプログラミングをしていて思うこと
AIエージェントとプログラミングをしていて思うこと
AIエージェントとプログラミングをしていて思うこと
AIエージェントとプログラミングをしていて思うこと
AIエージェントとプログラミングをしていて思うこと
AIエージェントとプログラミングをしていて思うことめんどくさい！
✅ AIエージェントが得意なこと • RSpecを実行し、成功するまで修正を繰り返す • RuboCopを実行し、成功するまで修正を繰り返す 󰤇 AIエージェントが苦手なこと • 筋の良い設計・実装になるまで修正を繰り返す
• 大事な部分はテストをしっかり書く AIエージェントとプログラミングをしていて思うこと
✅ AIエージェントが得意なこと • RSpecを実行し、成功するまで修正を繰り返す • RuboCopを実行し、成功するまで修正を繰り返す → 客観的でCLIで検証できる 󰤇 AIエージェントが苦手なこと
• 筋の良い設計・実装になるまで修正を繰り返す • 大事な部分はテストをしっかり書く → 主観的でCLIで検証できない AIエージェントとプログラミングをしていて思うこと
✅ AIエージェントが得意なこと • RSpecを実行し、成功するまで修正を繰り返す • RuboCopを実行し、成功するまで修正を繰り返す → 客観的でCLIで検証できる 󰤇 AIエージェントが苦手なこと
• 筋の良い設計・実装になるまで修正を繰り返す • 大事な部分はテストをしっかり書く → 主観的でCLIで検証できない → 客観的でCLIで検証できればいいのでは？ AIエージェントとプログラミングをしていて思うこと
まだ実験段階で実用レベルはもう少し先 Claude Code 製ツール https://github.com/euglena1215/code-qualia code-qualia：コード改善優先度計算ツール
１. テストカバレッジテストが少ないほど品質低２. 複雑度複雑度が高いほど品質低評価関数: "コードの品質" × "コードの重要度"
３. 変更頻度変更が多いほど重要度高４. アーキテクチャ Modelのようなコアロジックほど重要度高コードの品質コードの重要度 × 品質が低く重要なコードを改善対象として最優先する
評価関数の係数をパラメータとして設定可能コードの品質に関するパラメータコードの重要度に関するパラメータアーキテクチャに関するパラメータ各ディレクトリに対して重み付けを行う
最も重要なのはパラメータチューニング複雑度よりもテストがないのは許せない
最も重要なのはパラメータチューニングこのアプリケーションにとってサービスクラスは特に重要
最も重要なのはパラメータチューニングパラメータチューニング = 開発者の主観・経験則の言語化このやりとりさえもAIエージェントと一緒にできるかも
想定する活用方法 • 「コードを変更したらスコアn以上のメソッドが存在しない状態を保つこと」と書いておく • コードレビューを依頼する際に「スコアを踏まえた上でレビューして」と伝える • 定期実行で「最もスコアの高いメソッドを改善する Pull
Request を作って」と要求する重要ポイント：コマンド実行中は token を消費しないので経済的 💰 AIエージェントにとってコストが高く、安定しない操作は積極的にCLI化すべき
現状と今後の予想今の code-qualia のクオリティはまだまだ • 全テストを実行したカバレッジ結果を手元に置いておく必要がある ◦ ローカルで動かせない規模のテストケースになってくると結構大変 • 今の実装だと中規模〜のRailsだと集計に時間かかる
◦ タイミーのモノリスだと35秒くらい。ちょっと遅い開発者の主観・経験則をうまく表現し、CLIとしてAIに使わせてコードを自律的に改善させるケースはこれからもっと増えていくのではという予想 e.g. https://github.com/mizchi/similarity
Happy Vibe Coding!

[8]ページ先頭

©2009-2025 Movatter.jp