Movatterモバイル変換


[0]ホーム

URL:


見出し画像

フロンティアモデルと呼ばれる最先端AIの開発は、OpenAI・Google・Anthropic3社で抜きつ抜かれつのデッドヒートを繰り広げています。今年に入ってから特に、やりたいことによって、これら3社の使い分けが重要になりました。

今回はAIエンジニアである筆者が2025年9月1日現在の使い分けについて書きます。

AIの進化が早すぎるため10月1日には変わっているかもしれません。また、ソフトウェアエンジニア以外の人にとってそもそも参考になるかはわかりません。用途が大きく違う場合、参考にならないかもしれません。

アイキャッチ画像は、グレーター賢者(GPT-5)とグレーター賢者(Gemini-2.5)とレッサー賢者(Claude4)が議論をするというものです。

過去の記事は

です。

まず結論から

  • ChatGPT Pro($200)とClaude Pro plan($20)を契約。会社ではGoogle Workspace を使っているため、Gemini for Google Workspace も利用可能

  • ウェブの対話型アプリとして、日常使いはClaudeで、ウェブ知識が不要なケースや、重要な問いかけはChatGPTを使う。まれに Gemini for Google Workspaceも使う

  • コーディング用途はCodex(GPT-5)がメインで、まれに Claude Codeも使う

  • API用途ではgemini-2.5-pro, flash, flash-liteもしくはgpt-5, gpt-5-mini を使う。どちらでも良い。ClaudeはAPI用途では完全に脱落

ということでそれぞれ詳しく解説します。

まずすべての基本となるモデル性能でいえば、現状ではGPT-5が圧倒的ですが、Gemini-2.5-Proも十分に性能が高いです。

筆者の感じるLLM Tier

ウェブの対話型アプリとして

さて、筆者のウェブ対話型アプリで日常使いがClaudeな理由は、現状でウェブ検索を一番使いやすいからです。ウェブ検索を一度有効にするとそれ以後もウェブ検索有効がデフォルト状態になります!素晴らしい!!(当たり前のUIだと思うんですが、他社では当たり前ではないです)

Gemini for Google Workspaceがマジでクソすぎるのが、指示をしてもウェブ検索をしてくれないし、そもそもウェブ検索をしてても、それを判定する材料をこちらに一切提示してくれません。この状況ではどんなにモデルの性能がよくなっても使い物になりません。

ChatGPTはどうかというと、毎回ボタンを押して、メニューをたどってホバーでサブメニューを出して「ウェブ検索」を押さないと、ウェブ検索が利用できません。押し忘れて嫌な思いをしたことが多すぎるので、日常使いとしては使い物になりません。

全体的なウェブ検索体験はClaudeが圧倒的に優れています。

とは言え、モデル性能がClaudeとGPT-5(Thinking や Pro)では、馬鹿馬鹿しいくらい圧倒的に差があるので、重要な調べ物や本当に知性が必要なケースでは、気合いを入れてChatGPT 5 Thinking with ウェブ検索やChatGPT 5 ProやChatGPT DeepResearchを使います。このとき、ついでに Gemini 2.5 Pro にも同じクエリを投げたりします。

つまりChatGPTがデフォルトで検索有効状態にできれば、Claudeは不要です。

ちなみにChatGPT5のAutoは絶対に使っちゃだめです。最低でも必ずChatGPT 5 Thinking を使いましょう。

あと、Gemini for Google Workspaceだけが、カスタムプロンプトを設定できません。GEMを作ればそれっぽいことはできますが、いちいちGEMを選択するのがユーザー体験として最悪すぎるので、ここまでビハインドの多いGeminiを頑張って使う気にはなれません。

コーディング

先日書いた通り Codex (GPT-5) に移行しました。Claude Maxのプラン改悪や、Claude Codeの性能劣化とOpus4の指示追従能力の低さがひどすぎて我慢ができませんでした。

なお、Gemini CLIは、コーディング用途としてはまだまだ使い物になる気配が見えません。Jules含め、とても期待をしているんですが。

なお、Vibe Kanban + Codex の記事にも書いたとおり、文章を編集する用途に限定すれば Claude Opus4 一強かもしれません。先日ちょっとした文章編集をやっていたんですが、CodexやGemini CLIだとどうやっても微妙だったのがOpus4ではとても精密に編集してくれました。もっとも指示追従性能の低さにものすごく苦しめられたというオチがつきますが。

API用途

ここまでサービスとしてはいいところがなかったGeminiですがAPI用途ではとても優秀です。モデル性能が高く、コスパもよいためです。

とはいえ、gpt-5, gpt-5-mini 登場でほとんど同じような値段になったため、GPTとGeminiのどちらを使うかは、個人的にはどっちでもいいのでは?と思っています。

これまでgeminiで組んでたシステムをgptに切り替えるほどではないし、古いgpt/o1/o3/o4で組んだシステムなら、gpt-5への移行を推奨します。現状での性能・価格および将来性は、GeminiもGPTも変わらないです。

未だにClaudeのAPIを使ってる企業は、早急にGemini or GPT への移行を検討すべきです

新規の場合、Google Cloud Platform なら Gemini を使って、Azure なら GPT-5 を優先的に検討しつつ、それ以外の環境では、好みやノウハウの有無で選べばいいでしょう。

モデル選択は、安価向けをメインに考えつつ、どうしてもそれではこなせないタスクの場合高性能向けを考えるといいでしょう。

  • 安価向けは gemini-2.5-flash, gemini-2.5-flash-lite, gpt-5-mini があります。安くて、性能も悪くありません

    • ただgpt-ossがこれに近い性能を持つに至ったため、ローカル用途だとgpt-ossで良いかも?まだ検証してない開発者はぜひともgpt-ossの検証だけでもすべきです

  • 高性能向けだと、gemini-2.5-proかgpt-5を選ぶことになります

API用途では、AnthropicのClaudeは値段が高すぎるくせに、さほど性能も高くありません。よほど特定の用途、たとえば先ほど述べたような文章編集などでしか使う必要はないでしょう。

Claude の Prompt Caching も出た当初は優れていたけど、OpenAIが暗黙的キャッシュ(何もしなくても勝手にキャッシュしてくれる)を実装し、Geminiがそれに追従したところから、その点においても圧倒的不利になりました。

AGIに向けたフロンティアモデルの開発ではGoogleとOpenAIの一騎打ちとなり、企業でのAPI利用は、ここにプラットフォームが賭け合わさるという状況になってきました。

gpt-ossの登場により、オープンウェイトモデルも選択肢として考慮すべき時代になりました。オープンウェイトモデルも、ローカルで動かす、オンプレで動かす、クラウド上で動かす、各種APIサービス(Cerebrasも含む)を使うなど、様々な選択肢がありえます。

これから数ヶ月のはなし

数週間以内にAnthropicの新しいモデルが出るという話が公式から出ていますが、もはや期待していません。

多くのジャンルでGPTやGeminiに対抗できない状況が長く続いてるため、コーディングに特化して一点突破したいようですが、コーディング性能とエージェント性能だけがあがっても、基本的な足回り(指示追従能力、needle in a haystack性能など)が低すぎてお話になりません。CEOがAGIは近い!と強気発言を続ける割にはAGIやシンギュラリティにはほど遠いと感じさせられます。

Googleは今年のうちにGemini-3.0を出すでしょうし、そうなるとまたGPT-5を超える性能をだしてくるはずです。そのときにまたいろいろな判断をすることになるでしょう。

さらにGemini CLIがせめてCodex with GPT-5くらいに匹敵するコーディング性能を持つようになったら、コーディングエージェントに関しても話が変わってきそうです。

11月頃に「Gemini CLIの時代が来た!」となっている可能性は普通にあると思って行動した方がいいでしょう。

少なくとも特定のツールやモデルに特化するのは筋が悪すぎます。今の時代、一ヶ月後にはサービスを乗り換えているのが普通にあるため、少なくとも絶対に年契約だけはしちゃだめです。絶対に後悔します

Googleにはウェブ版Geminiでの検索と(for Workspaceでの)カスタムプロンプトに関して改善してほしいところですがしたくないんでしょうね。

春頃のGeminiはまだウェブ版でウェブ検索ができていたはずですし、APIだとウェブ知識でgroundingもできるので、本気を出せばウェブ検索で強いのは当然Goolgleです。

コードレッドが発動していろいろと巻き返したGoogleですが、こういうところは未だに「イノベーションのジレンマ」が残っているように見えます。

未来予測

未来予測もしてみましたが、当たるも八卦当たらぬも八卦です。

いいなと思ったら応援しよう!

生成AI全振りの会社Algomaticで働くソフトウェアエンジニアです。TypeScript+LLM最高

[8]ページ先頭

©2009-2025 Movatter.jp