連載目次 Anthropicは2025年10月15日、同社のAIモデル「Claude」シリーズで最も小さいモデル「Haiku」の最新版「Claude Haiku 4.5」を公開した。軽量モデルでありながら、前世代の上位モデル「Claude Sonnet 4」をわずかに上回るコーディング性能を実現している。 ソフトウェアエンジニアリング分野のベンチマーク(SWE-bench Verified)におけるコーディング性能比較(公式発表ページより引用) 横軸は主要AIモデル(例:Claude Sonnet 4.5、Claude Haiku 4.5、GPT-5-Codex、Gemini 2.5 Proなど)を示し、縦軸は「課題を正しく解決できた割合(%)」を表している。上に行くほどコード生成や修正タスクの精度が高いことを意味する。色付きのバーはClaudeシリーズ(Haiku/Sonnet)を示して

Today we're releasing Claude Opus 4.1, an upgrade to Claude Opus 4 on agentic tasks, real-world coding, and reasoning. We plan to release substantially larger improvements to our models in the coming weeks. Opus 4.1 is now available to paid Claude users and in Claude Code.It's also on ourAPI,Amazon Bedrock, andGoogle Cloud's VertexAI. Pricing is the same as Opus 4. Claude Opus 4.1Opus 4.1 adv
今回の発表前には、楽天グループもOpus 4.1の性能を検証していた。楽天グループは「Opus 4.1が大規模なコードベース内で適切に誤りを特定し、不要な変更やバグの導入を回避する点で優れている。社内チームは日常のデバッグ作業でこの正確さを評価している」と報告したという。 関連記事 ここにきてLLMに“新たなリスク”判明か? 米Anthropicが指摘する「潜在学習」とは何か LLMといえば、生成AI系アプリケーションを実現する基盤の技術として、すっかりおなじみとなった感がある。そのリスクについても、ハルシネーションなどがあると伝えられているが、ここにきて新たなリスク「潜在学習」を指摘する声が上がっている。 Anthropic、「Claude Code」に週次レート制限設定 Anthropicは、AIコーディング支援機能「Claude Code」に週次の利用制限を導入すると発表した。最上位

米Anthropicは5月22日(現地時間)、最新AIモデル「Claude Opus 4」「Claude Sonnet 4」のリリースにあわせ、両モデル向けのプロンプトエンジニアリングのコツを公開した。両モデルは、米OpenAIの「o3」などを超えるコーディング性能を備えるとしており、何点かポイントを押さえることで、より効果的なプロンプトエンジニアリングができるという。 両モデルは、前世代のモデルよりもユーザーの指示に忠実に従うため、具体的に指示を出す必要がある。例えば、ダッシュボードを作成する場合、「分析ダッシュボードを作成してください」と指示するより、「分析ダッシュボードを作成してください。できるだけ多くの関連機能とインタラクションを含めてください。基本的な機能にとどまらず、フル機能での実装を構築してください」と指示するほうが効果的という。 他にも原則として、「なぜその動作が重要なのか

tl;dr Anthropic の開発者向けイベント Code with Claude が開催されたよ Claude 4 Opus と Claude 4 Sonnet が発表されたよ 無課金を含むすべてのプランで Claude 4 Opus と Claude 4 Sonnet が使えるよ AnthropicAPI に Code Execution Tool、MCP Connector、FilesAPI、Extended Prompt Caching の 4 つの機能が追加されたよ(ベータ版) Claude Code が正式リリースされたよ これはなに? 2025 年 5 月 22 日にサンフランシスコにて開催された Anthropic の開発者向けイベント、Code with Claude に関する発表まとめ。公開されたモデルや機能などをひと通り紹介、実際に動かすところまでを解説した記

アンソロピックが新しいAIモデル「Claude Opus 4」と「Claude Sonnet 4」を発表した。数千ステップの複雑なタスクを数時間かけて自律実行できるのが特徴で、24時間以上のゲーム攻略や7時間の自律コーディングが可能。楽天が導入を発表した。 by Rhiannon Williams2025.05.23 12 この記事の3つのポイント アンソロピックが「Claude 4」を発表、数時間の自律作業が可能 24時間ゲーム攻略、7時間自律コーディングを実証、楽天も導入 「アシスタントから真のエージェント」への進化で、人間監督なしの長期作業を実現 summarized by Claude 3 アンソロピック(Anthropic)は、2つの新しい人工知能(AI)モデルを発表した。AIエージェントを真に有用なものにするための大きな一歩となる。 発表されたのは、「Claude Opus 4

Today, we’re introducing the next generation of Claude models: Claude Opus 4 and Claude Sonnet 4, setting new standards for coding, advanced reasoning, andAI agents. Claude Opus 4 is the world’s best coding model, with sustained performance on complex, long-running tasks and agentworkflows. Claude Sonnet 4 is a significant upgrade to Claude Sonnet 3.7, delivering superior coding and reasoning wh
米Anthropicは5月22日(現地時間)に開催した開発者向けイベント「Code with Claude」で、最新AIモデル「Claude Opus 4」「Claude Sonnet 4」を発表した。いずれもソフトウェア開発などの分野で米OpenAIの「o3」を超える性能という。 どちらのモデルも応答速度に長けたモードと、長考によって高いクオリティーの回答を出す「拡張思考」モードを使い分け可能。拡張思考中に同社のWeb検索用APIを使い、回答に反映することもできるという。 Opus 4は同社で「最も強力なモデル」をうたう。コーディングと複雑な問題解決に向くといい、ソフトウェア開発における現実的な課題に対する性能を測るベンチマーク「SWE-bench Verified」では72.5%(計測手法によっては79.4%)の正答率を記録。o3(69.1%)や米Googleの「Gemini 2.5

1リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く