Claude Opus 4.8 とは — 4.7 から何が変わったか

はじめに — Opus 4.8 は何が「最上位」なのか

2026 年 5 月 28 日、Anthropic が最新の最上位モデル Claude Opus 4.8 を公開しました。Claude Code でも同日のアップデート (v2.1.154) から選べるようになり、AI 駆動開発のクリエイティブスタジオである FIXIT でも、公開当日からクライアントワークと社内開発の両方で使い始めています。

モデルの世代交代は数か月おきに起きますが、今回の 4.7 → 4.8 は「賢くなった」だけではありません。料金を据え置いたままコーディング性能を引き上げ、さらに数百のエージェントを束ねて動かす新しい仕組みまで同時に投入された、開発のやり方そのものに効く更新でした。

本記事では、Opus 4.7 から何が変わったのかを、公式が公開したベンチマークと料金、そして新機能の観点で整理します。実際に使ってみた体感は Opus 4.8 を即日プロジェクト投入して分かったことで、設定の使いこなしは Opus 4.8 を使いこなす要点でそれぞれ掘り下げています。

ひと目でわかる 4.7 → 4.8 の変更点

まずは全体像です。細かい背景はこの後のセクションで順に補足します。

観点	Opus 4.7	Opus 4.8
コーディング性能 (SWE-Bench Pro)	64.3%	69.2%
料金 (100 万トークンあたり)	$5 / $25	$5 / $25 (据え置き)
Fast mode	提供あり	約 2.5 倍速・従来から大幅値下げ
システムプロンプト	従来構成	軽量な lean 構成が既定
並列オーケストレーション	—	dynamic workflows (Claude Code 側)

数字を一段深く見ていきましょう。

ベンチマーク — コーディングで前世代を明確に上回る

公式発表によると、エージェント型のコーディング能力を測る SWE-Bench Pro で、Opus 4.8 は 69.2% を記録しました。Opus 4.7 の 64.3% から約 5 ポイントの上積みで、他社の最新モデル (GPT-5.5 が 58.6%、Gemini 3.1 Pro が 54.2%) をいずれも上回っています。

実務で効くのは、この「コーディングに強い」という性格です。Claude Code を毎日の開発の中心に据えているチームでは、コーディング系ベンチの数ポイントが、長いタスクを最後までやり切れるかどうかの差として表れます。

もっとも、Opus 4.8 がすべてのベンチマークで首位というわけではありません。たとえばターミナル操作を測る Terminal-Bench 2.1 では、実行環境次第で GPT-5.5 が上回る結果も報告されています。「コーディングと長時間のエージェント作業に強いモデル」という捉え方が実態に近く、用途によって冷静に見極める前提で付き合うのが健全です。

なお、本記事のベンチマーク値は Anthropic の公開情報に基づくもので、比較対象のスコアは公開時点のものです。

補足

モデル選びで効くのは総合点の高さより得意分野の形です。数ポイントの差に反応するより、自分たちの作業時間が最も長い領域に強いかどうかで判断すると、移行の損得を見誤りません。

料金は据え置き、Fast mode の料金が下がった

新モデルというと値上がりを警戒しがちですが、Opus 4.8 の通常料金は 100 万トークンあたり入力 $5・出力 $25 で、Opus 4.7 から据え置きです。性能が上がって価格が同じなら、同じ予算で得られる成果は実質的に増えます。

さらに大きいのが Fast mode です。Opus 4.8 の Fast mode は、同じモデルを約 2.5 倍の速度で動かしながら、以前のモデルの Fast mode のおよそ 3 分の 1 の料金になりました (通常料金の 2 倍にあたる入力 $10・出力 $50)。「速さは欲しいがコストは抑えたい」という日常のイテレーションで、十分に選びやすい選択肢になっています。

速度と料金のバランスは作業の性質で変わります。どの場面で Fast mode を使い、どこで通常モードに戻すかの目安は Opus 4.8 を使いこなす要点にまとめました。

dynamic workflows — 数百のエージェントを束ねて動かす

Opus 4.8 と同じタイミングで、Claude Code には dynamic workflows が入りました。やりたいことを伝えると、Claude が裏側で数十〜数百のサブエージェントを編成し、大きな作業を分担して進めます。/workflows で進行中の実行を確認できます。

flowchart TD
  R["1 つの依頼<br/>(例: 大規模リプレイス)"] --> W["dynamic workflow"]
  W --> A1["サブエージェント"]
  W --> A2["サブエージェント"]
  W --> A3["サブエージェント"]
  W --> An["… 数百規模"]
  A1 --> M["結果を統合"]
  A2 --> M
  A3 --> M
  An --> M

公式が例に挙げているのは、数十万行規模のコードベース横断のリプレイスのような、一度に抱えるには大きすぎるタスクです。これまで人手で分割していた「広く浅い一括変更」を、数百規模のエージェントに分担させられるようになります (執筆時点では Claude Code の Enterprise / Team / Max プランで利用可能)。

Claude Code そのものの導入・定着を体系立てて進めたい場合は Claude Code を実務に導入する完全ガイドが出発点になります。

新しいモデルやツールを自社の開発フローに取り込む支援は AI 開発ツール定着支援で、個別のご相談はお問い合わせから承っています。

Claude Opus 4.8 とは — 4.7 から何が変わったか

はじめに — Opus 4.8 は何が「最上位」なのか

ひと目でわかる 4.7 → 4.8 の変更点

ベンチマーク — コーディングで前世代を明確に上回る

料金は据え置き、Fast mode の料金が下がった

dynamic workflows — 数百のエージェントを束ねて動かす

軽くなったシステムプロンプトと、「無駄に聞かない」改善

Anthropic が「最も honest」とうたう改善点

FIXIT の受け止め — まず何から試すか

関連する Insights

2026 年度の AI 開発・DX 関連補助金まとめ｜IT 導入補助金の活用法

AI エージェント設計パターン入門 - 実務で使う 6 つの型

AI 開発ツールの組織定着をご相談ください

RECRUIT

CONTACT