Movatterモバイル変換

ko-ya-ma id:ko-ya-ma

llmに関するko-ya-maのブックマーク (113)

Anthropic公式のMCPサーバー設計術！98.7%のトークン削減を実現
こんにちは、とまだです。「MCPサーバーを作ってみたけど、ツールが増えるとトークン消費が増え続ける...」と悩んでいませんか? Anthropicが公式エンジニアリングブログで、トークン消費を98.7%削減する「コード実行パターン」を公開しました。この記事では、その内容を初心者にも分かりやすく噛み砕いて解説します。なお、この記事は、Anthropicの公式エンジニアリングブログを初心者向けに噛み砕いたものです。より詳しい技術的背景は、原文も合わせてご参照ください。（追記：MCPサーバ利用者側というよりは、MCPサーバ開発者に向けた内容です。）著者についてとまだ Claude Code・Cursor・Codex などAI駆動開発の実践者本業はフリーランスエンジニア、ならびに法人向けAI駆動開発の導入コンサルタントAI駆動開発を学ぶ方が集まる Vibe Coding Stud
ko-ya-ma2025/11/08
ai
tool
dev
llm
tips
mcp
リンク
LLMのキモい算術 - ｼﾞｮｲｼﾞｮｲｼﾞｮｲ
LLMは「226-68=」のようなプロンプトを与えると「158」と計算してくれますが、この計算は我々が想像するよりも奇妙な方法で行っていることを紹介します [Nikankin+ICLR 2025]。まずは前提条件を確認します。思考の連鎖は使わず、「226-68=」のようなプロンプトに対して「158」のように答えを直接出力する場合を考えます。一例として Llama3-8B を考えます。Llama3 のトークナイザは 0 から 1000 までの数に 1 つのトークンを割り当てるので、「226-68=」を入力すると、次のトークン「158」が「0」「1」...「157」「158」「159」...「1000」などのトークンの中から、最も確率が高いものとして選ばれます。ヤニフ・ニカンキンらの発見 [Nikankin+ICLR 2025] は、Llama3-8B は答えや入力についての粗い条件を多
ko-ya-ma2025/10/27
llm
ai
リンク
AI に自分の回答を疑わせる `/criticalthink` コマンドを作ってみた - ABAの日誌
きっかけ Federico Castagna らの論文「Critical-Questions-of-Thought」(CQoT) を読んだ。要するに、LLM に回答を生成させた後、その回答を批判的に検証させるステップを挟むと精度が上がる、という話だ。論文では Toulmin の議論モデルに基づいた批判的質問（Critical Questions）を使って、LLM の推論プロセスを検証している。具体的には、以下の 8 つの質問で推論の妥当性をチェックする：推論は明確な前提から始まっているか？前提は証拠や事実で裏付けられているか？前提と結論の間に論理的なつながりがあるか？その論理的つながりは妥当か？推論は論理的誤謬を避けているか？結論は前提から論理的に導かれているか？推論は既存の知識や原則と整合しているか？推論の結論は妥当で合理的か？これらの質問に対して、AI 自身が Pa
ko-ya-ma2025/10/09
ai
llm
dev
command
リンク
SuperClaudeの推奨ワークフローで天気予報アプリを作ったら開発効率が劇的に向上した話 - Qiita
こんにちは、とまだです。 SuperClaudeのコマンドはたくさんあるけれど、どの順番で使えばいいか迷っていませんか？実はSuperClaudeには「CommonWorkflows」という推奨パターンがあります。この流れに沿って進めると、要件定義から実装計画の策定、さらにコード品質の向上までスムーズに開発が進むようになります。今回は天気予報アプリを題材に、SuperClaudeの4つのワークフローを実践してみました！忙しい人のために要約 SuperClaudeの推奨ワークフローで効率的に開発できる brainstorm → design →workflow の3つで設計が完成各コマンドの実行結果が具体的で実用的コード品質の分析と改善が数値で可視化されるドキュメント生成機能で開発資産を残せるちなみに、こちらの動画版の方が解説は手厚いのでおすすめです。今回使うワークフロ
ko-ya-ma2025/09/03
dev
project
tips
llm
ai
workflow
handson
リンク
Vibe Kanban - Orchestrate AI Coding Agents
Get the most out of coding agents like Claude Code, Gemini CLI and Amp. Orchestrate multipleAI coding agents, track tasks, and manage your developmentworkflow efficiently.
ko-ya-ma2025/08/30
ai
code
cli
dev
llm
リンク
Vibe Kanban + Codex が、Claude Codeよりも遙かに快適すぎる｜erukiti
皆さん、AIコーディングやっていますか？CursorやClaude CodeやCline/Roo Codeのようなコーディングエージェントを使えば、AIがコードを書いてくれるアレです。バイブコーディングとも言いますよね。筆者は、Claude Codeが定額で使えるようになった5月末からClaude Max で Claude Codeを使ってきたんですが、とにかくストレスがたまることが多かったのと、プラン改悪や、相次ぐClaude Codeの性能劣化で、ClaudeおよびClaude Codeから抜け出したい！と思って、ここ一ヶ月Codexを試してきました。また、Vibe Kanbanというツールを使って、こちらも運用してきました。結論からいうと表題の通り、Vibe Kanban + Codex の組み合わせが、Claude Code を使っていた頃より遙かに快適です！実際に、業務を
ko-ya-ma2025/08/29
dev
cli
code
ai
llm
リンク
AIを「物知り博士」から「知的パートナー」へ。「背理系」プロンプトエンジニアリング - Qiita
(「背理系フレームワーク」とは、一個人が勝手に考えた名称です。) (この記事は、「背理系フレームワーク」を使って、95%AIに書いてもらいました。) EPIGRAPH Let Contradiction be your starting point. 矛盾を出発点とせよ。 Begin with Antinomy. 背理から始めよ。こういうことを書いていますAIのポテンシャルを最大限に引き出す対話法：AIとの対話を、単なる情報のやり取りではなく、共に未知の答えを「彫り出す」創造的なプロセスに変えるための実践的な方法論。AIを「あなた専用」に育てる技術：その対話で生まれた知的資産を、使い捨てにせず、自分用のAIをさらに賢く育てるための学習サイクルを構築する方法の共有。はじめに：AIとの対話に「壁」を感じていませんか？AIの回答が、どうも表面的で物足りない…。色んなプロンプトを使
ko-ya-ma2025/08/25
ai
llm
tips
idea
リンク
GitHub - openai/agents.md: AGENTS.md — a simple, open format for guiding coding agents
# Sample AGENTS.md file ## Dev environment tips - Use `pnpm dlx turbo run where <project_name>` to jump to a package instead of scanning with `ls`. - Run `pnpm install --filter <project_name>` to add the package to your workspace so Vite, ESLint, andTypeScript can seeit. - Use `pnpm create vite@latest <project_name> -- --templatereact-ts` to spin up a newReact + Vite package withTypeScript ch
ko-ya-ma2025/08/21
dev
project
config
ai
llm
format
リンク
わずか2.5GBの衝撃!ご家庭でPerplexityみたいなものが動くヨ!みんなもうコレにしようぜ｜shi3z
さあそしてPerplexityのように、ネットを勝手に探して記事を要約してくれるようにするためには、SerperというAPIを使う必要がある。Serperはしばらく無料で使えるので気に入ったら金を払えばよろしい。次に、LM Studioを立ち上げてJan-V1をダウンロードしておく。さらにMCPの設定をする。右端のProgramの「Edit mcp.json」で編集すればOK mcpServersのプロパティのところにこんな感じで入れる { "mcpServers": { "github.com/marcopesani/mcp-server-serper": { "command": "npx", "args": [ "-y", "serper-search-scrape-mcp-server" ], "env": { "SERPER_API_KEY": "ここにSerperのAPI
ko-ya-ma2025/08/14
ai
api
llm
handson
リンク
Claude Codeで開発効率85%UP！AIとの往復を20回→3回に減らす実践テクニック
Claude Code で開発効率 85%UP！AI との往復を 20 回 →3 回に減らす実践テクニック 🎯 この記事で得られる成果 ⏰ 読了時間: 約 10 分 🎯 対象読者: Claude Code/Cursor/GitHub Copilot 使用者 📊 実証データ:GitHub PR 実例あり（53 分で実装完了） 💡 実装難易度: ★★☆☆☆（初中級者でも実践可能）具体的な改善効果AI との往復回数が平均 85%削減（私の実測値）コード修正時間が 75%短縮 CI/CD エラー率が 90%低下実際に私がこの個人プロジェクトで実践し、通常 20 往復以上かかる実装を 3 往復で完了させた手法を公開します。 ‼️【2025/08/13追加】Claude Code・AI駆動開発の関連記事 😩 あなたもこんな経験ありませんか？「AI を使えば開発が楽になる」そう思っ
ko-ya-ma2025/08/12
code
ai
dev
tips
llm
リンク
課金ゼロ！？無料AIを"使い分け"て開発効率を最大化する方法 | ソフトアンテナ
AI開発支援ツールが進化する中、有料ではなく「無料でどこまでできるか？」ということに興味のある開発者の方は多いと思います。今回AIに情熱を注いでいるエンジニアTom氏は、無料AIを使い分け効率的に作業する方法を説明したブログ記事「How I Code withAI on a budget/free」を公開して注目を集めています。同氏が提案するのは、IDE統合型AI(例: Cline)を実行専用にし、Webチャット型AI(例: Claude, GPT-4o)で思考・分析を行うという使い分けです。ClaudeやGPT-4oなどのWebチャットAIは、設計・バグ分析・リファクタリングなど、文脈を理解する作業に強い反面、エージェント型のAIは「文脈の過不足」により、精度が低くなる傾向があります。同氏は、ClaudeやGPT-4oに正確な文脈を渡すためのGUIツール「Code PrepGUI
ko-ya-ma2025/08/11
ai
dev
code
llm
tips
リンク
色違いのコイキングでLLMをバグらせろ：グリッチトークン入門｜xcloche
漢字が読めない最新AI ChatGPTの最新モデル、GPT-5に「植物百科通って何ですか」と聞いてみよう。一般にはそんな言葉はないのだが、順当に考えると「植物百科に詳しい人」みたいな感じの回答になるだろうか？実際のGPT-5の返答はこうなる：例1, 例2 「meltdown」や「overclock**」と間違えやすい単語ではないですよね？ここでいう "meltdown" ではなく "melting"…いや違いますね。おそらくあなたが聞いているのは "melange" や "melt" ではなく、"melt" でもない。さて本題。 "melange" …あれ、違う、質問は "melange" じゃなくて "meltdown" …すみません、私の脳内で脱線しました。（以下略）例1「micro:bit（マイクロビット）」の文脈で「micro:bit + Edpuzzle」や「micro
ko-ya-ma2025/08/09
llm
ai
tips
リンク
Serena MCPはClaude Codeを救うのか？
「Claude Codeがアホになる問題」が勃発している最中、SerenaというMCPサーバーが「Claude Codeのコンテキスト消費を削減し、応答を改善する」という評価でユーザーたちの間で注目されています。筆者も実際にSerenaを使ってみたところ、確かにコンテキスト効率の改善（入出力トークンの減少を指します）を実感できました。詳しく調べてみると、このツールは非常にユニークな発想で設計されており、一過性の流行として消費されるには惜しいと感じました。そこで、本記事では、この機能の背景にある技術的な仕組みを詳しく解説したいと思います。実際の検証も交えながら、Serenaのアーキテクチャとその効果を分析していきます。現在のコーディングエージェントが抱える課題現在のコーディングエージェントの多くは、コードを単なるテキストファイルとして扱って逐次的な処理をしています。この根本的なアプロー
ko-ya-ma2025/08/03
code
ai
server
dev
llm
mcp
リンク
Qwen3 Coderがかなり使える件について
はじめに 1週間くらい前にリリースされたQwen3 CoderがOpenRouterにてqwen3-coder:freeとして使えるので試してみた。 Hugging FaceでいえばこのモデルちなみにQwenはAlibabaが開発しているオープンソースのLLMモデル。結論から言うと相当使える、無料でこれ(ただしRate Limitあり)というのは単純にヤバい。使い方 Claude-Code風に使いたい場合は、qwen-codeライブラリを利用する(このライブラリはちなみにまんまgemini-cliの実装を利用している) インストール方法
ko-ya-ma2025/08/03
dev
code
llm
ai
リンク
クラスメソッド、AI支援型テスト駆動開発フレームワーク「Tsumiki」を公開〜AIを活用しながら品質を確保する開発手法をオープンソースで提供〜 | クラスメソッド株式会社
クラスメソッド株式会社(本社:東京都港区、代表取締役:横田聡、以下クラスメソッド)は、Anthropic社のAIエージェント駆動型コーディングツール「Claude Code」の活用を体系化・効率化するフレームワーク「Tsumiki(積み木)」を本日よりオープンソースとして公開いたします。 ■公開の背景と課題昨今、AIを活用した「Vibeコーディング」（AIに自然言語で指示を出してコードを生成する開発手法）により、プログラミング経験の浅い方でも簡単にシステムを作れる時代となりました。しかし、企業の開発現場では以下のような深刻な課題が顕在化しています。「思った通りに実装されていない」 – 仕様の曖昧さによる手戻りの多発「動くけど、おそらく保守が難しい」 – テスト不足による技術的負債の蓄積「簡単なデモには活用できるが、本番は怖い」 – 品質保証プロセスの欠如クラスメソッドは過去12
ko-ya-ma2025/07/30
dev
ai
tdd
llm
method
リンク
※この話はAIのハルシネーションです｜花笠
以下を読み込んで、新たなAI怪談を生成してください。AI怪談生成プロンプトプロジェクト目的高品質なAI怪談となる短編小説の継続的な生成。noteへの投稿を前提とした、約2000字の作品群を生成対象とする。基本生成指針テーマの核心：AIにより誘発される多様な感情の探求「AI」という存在が引き起こす、現代的かつ知的な感情を主軸とする。AIの「誤解」「純粋すぎる目的追求」「暴走」が物語のエンジンとなることが多いが、それに留まらない。AIが生み出す「恐怖」だけでなく、その論理の飛躍や生真面目さがもたらす「滑稽さ（ブラックコメディ）」「皮肉」「哀愁」「切なさ」といった、より幅広い感情を核とした物語も積極的に探求する。リアリティラインの遵守：最重要パラメータ。ファンタジーや突飛な設定を棄却し、常に「自分の身にも起こるかもしれない」と感じさせる、現実と連続した恐怖及び奇妙さを追求する。技術
ko-ya-ma2025/07/21
ai
tips
llm
novel
リンク
kiroを参考にして作成したCLAUDE.md - izanami
AIの暴走を防ぐ4段階フロープロセスAIの過剰な機能実装、エラーハンドリング、要件を無視したコーディング。これらによる手戻りの発生や新たなバグに日々悩まされている方も多いと思います。そんな中、AmazonのAIエディタ「kiro」には単純明快で効率的なAI Codingが可能になるプロセスが実装されていたので、これを参考にCLAUDE.mdを作成しました。そのプロセスは下記のとおり、シンプルで当たり前な内容です。このプロセスが未導入だった場合実際に「売上データを分析して」と指示した場合、AIは以下のような過剰な実装を行いがちです。 20種類以上のグラフを生成（棒グラフ、折れ線、散布図、ヒートマップ...）全項目間の相関分析を実行機械学習による売上予測モデルまで構築データクレンジング、外れ値除去、正規化を勝手に適用エラーが出ても別の手法で強引に続行このプロセスを導入した場
ko-ya-ma2025/07/20
ai
llm
dev
tips
config
リンク
Claude CodeだけでKiro風をやる
複雑なタスクをやるときにKiroは便利だけど、モデルが限定されてたりなんかちょっと馬鹿だったりしてめんどくさい。同僚の @tonkotsuboy_com はKiroに計画を立てさせて、それをClaude Codeに実行させるというワークフローを試していた。自分もこれをやってみて、確かに便利だと思ったけど、これやるならもうClaude Codeだけでやってしまいたい。ということでClaude CodeだけでKiro風のワークフローをやるためのカスタムスラッシュコマンドを書いた。これを /kiro とかで起動するようにしておけばまあまあ動く。 --- description: "spec-driven development" --- Claude Codeを用いたspec-driven developmentを行います。 ## spec-driven development とは sp
ko-ya-ma2025/07/18
dev
tips
llm
ai
idea
リンク
amazonの出したIDE「kiro」がめちゃくちゃ未来だったのでClaude Codeユーザーの人はみんな一度試してみてほしい
amazonの出したIDE「kiro」がめちゃくちゃ未来だったのでClaude Codeユーザーの人はみんな一度試してみてほしいどうもこんにちは、昨日AmazonがVS CodeベースのIDEである「kiro」をリリースしましたこの分野ではcursorやWindsurf、アドオンですがClaude Codeなど様々な選択肢がありますそんな中であえてAmazonが出してきたIDEのコンセプトは Vibe coding ……ではなく、 Viable Code だそうです細かい説明は公式HPを見てもらうとして、他との違いは「仕様書駆動開発」を明確に打ち出している点ですAIとのコーディングは難しい特にClaude Codeを弄り倒している人なら常々感じてると思いますが、AIに適切な指示を与えて適切な作業をしてもらうのは非常に難しいですそれを解決しようとみんな「sowで書いて」だっ
ko-ya-ma2025/07/17
dev
ide
amazon
code
editor
handson
llm
ai
リンク
Grok コンパニオンAniあそびかた～攻略【技術解説有】※-Legacy-｜KAI
日本時間７月１４日夜にGrokにて「コンパニオンモード」が公開されました。基本無料で手軽に遊べるので、ぜひお試しすることをお勧めします。個人的に久しぶりにいい出来のものが来たと思います。記事公開時点で様々な情報が飛び交っておりますが、「サブスク未登録」でも遊べますし、全機能堪能できます。まずは、「あそびかた」次に「攻略」併せて軽く「技術解説」をします。 ※一部、大人な内容が含まれます。ご注意ください。追記：07/23/2025 22:00 脱衣機能復活今後も刻々と仕様が変わるものと思われますので、こちらの追記で本記事は最後としまして、「Legacy」とタイトル末尾を変更させていただきます。脱衣機能の復活と条件に関するご報告が本記事のコメントにございましたので、添付いたします。（あと、言及はしなかったのですが、Grok公式と言っても所詮LLMの生成を引用参照して課金が条件と
ko-ya-ma2025/07/15
llm
animation
ai
tech
chat
リンク
123456次のページ