Anthropicが現地時間2026年5月29日、フラッグシップAIモデルの最新版「Claude Opus 4.8」を公開したと、Android AuthorityのAkshay Gangwar氏が報じています。同記事によれば、応答速度を優先する「Fastモード」のコストは従来比で約3分の1(約3倍安価)に引き下げられたとされ、Anthropicの社内評価ではコード欠陥を「報告しない」確率が従来比で約4分の1まで低下したと伝えられています。前世代のOpus 4.7に対しほぼすべてのベンチマークで向上し、応答の深さを段階的に調整する「Effort」制御と、Claude Code向けの「Dynamic workflows」もリサーチプレビューで同時導入されたとされています。
コード欠陥を見逃す確率が約4分の1に——Opus 4.8の「正直さ」アップデート
Android AuthorityのAkshay Gangwar氏は、Opus 4.8がOpus 4.7の長所を引き継ぎつつほぼすべてのベンチマーク項目でスコアを伸ばしたと報じています。新モデルについてAnthropicは、ユーザーの自律性を尊重し利益に沿って動く挙動(Android Authorityは「prosocial traits」と呼ばれるユーザーに有益な振る舞いの傾向として紹介しています)が新たな高水準に達したと説明していると伝えられています。
加えて、ユーザーを欺いたり悪用に協力したりする可能性が大幅に低下し、不確かな点があれば結論を急がず正直に伝える挙動が強化されたとAndroid Authorityは案内しています。コード生成においても重要な変化があり、Anthropicの社内評価ではOpus 4.8が自身の書いたコードの欠陥を「報告しない」確率が、従来比で約4分の1(4倍少ない)水準まで下がったと同記事は伝えています。コード生成タスクで誤った成功宣言が減ることは、ペアプログラミング用途では実利の大きい変化と読めます。
Fastモードのコストが約3分の1に——軽量クエリでも気兼ねなく利用可能に
AI利用コストの上昇を気にするユーザーへの直接的な答えとして、Opus 4.8では「Fastモード」の利用コストが従来比で約3分の1(約3倍安価)に設定されたとAndroid Authorityは報じています。Fastモードは応答速度を優先するモードで、コスト圧縮により、簡単なクエリに上位モデルを当てても従来ほどトークン残量を気にせずに済む構成になると同記事は説明しています。
ハイエンドモデルは「重い思考タスク専用」になりがちですが、軽い用途で使い倒せる価格帯に降りてくることで、Opus 4.8を日常的なAIアシスタントとして選択する余地が広がると読めます。
Effort制御——応答の深さをLow/Medium/High/Maxの4段階で調整
Android Authorityによれば、新たにモデルセレクタに追加された「Effort」オプションでは、Claudeがタスクにどれだけ思考時間を使うかを Low / Medium / High / Max の4段階から選べるようになったとされています。
| Effort設定 | 挙動の傾向 |
|---|---|
| Low | 思考時間を抑え、最速で応答を返す |
| Medium | 標準的な思考時間で、応答速度と詳細さのバランスを取る |
| High | 思考時間を伸ばし、より詳細な回答を返す |
| Max | 最長の思考時間を使い、最も詳細に回答する |
ただしEffortを上げるほどトークン消費は急増するため、Anthropicは最高設定の「Max」を「最も困難なタスクのみに使うこと」を推奨していると同記事は伝えています。普段使いはMedium程度に置き、難問のみMaxへ切り替える運用が現実的でしょう。
Dynamic workflowsがリサーチプレビュー——Claude Codeで巨大タスクを自動分解
Claude Code向けには「Dynamic workflows」がリサーチプレビューとして提供されたとAndroid Authorityは報じています。同記事によれば、ユーザーがタスクを与えると、Claudeが計画を立て、複数のサブエージェントを同時並行で走らせて作業を進める仕組みで、最終的な出力もClaude自身が検証してからユーザーに提示するとされています。
リサーチプレビュー段階の機能であり、本格提供までの安定性や条件は今後の続報を待つ必要がありますが、大規模なリポジトリの調査・横断的なリファクタ・複数ファイルにまたがる変更といった、単発のチャットでは扱いづらかったタスクを一括で処理できる方向に進化していると読み取れます。Claude Codeを既に活用しているユーザーは、まず小〜中規模の横断リファクタや複数ファイルにまたがる調査タスクからDynamic workflowsを試し、Effort設定との組み合わせで応答コストと精度のバランスを見極めると入りやすいでしょう。
Opus 4.8はAndroid Authorityの報道時点でClaudeユーザー向けに提供が始まったとされ、加えてAnthropicは「Mythos-class」と呼ぶ新シリーズのリリースも計画していると同記事は伝えています。プラン別の提供範囲や具体的な提供時期、Mythos-classの詳細スペックについては、現時点では明らかにされていません。既存のClaudeユーザーは追加設定なしでOpus 4.8を試せると報じられているため、まずはFastモードのコスト改善とEffort制御の挙動差を、普段の用途で比較してみるのが妥当な進め方です。
ベンチマーク詳細——SWE-Bench ProでGPT-5.5・Gemini 3.1 Proを上回る
公開されたベンチマーク数値からは、Opus 4.8がコーディング系で具体的にどこまで伸びたかが読み取れます。
| ベンチマーク | スコア | 補足 |
|---|---|---|
| SWE-Bench Pro | 69.2% | GPT-5.5とGemini 3.1 Proを上回る |
| Terminal-Bench 2.1 | 74.2% | 4.7から8.4ポイント改善 |
| Online-Mind2Web | 84% | コンピュータ利用・ブラウザ操作系での到達点 |
Super-Agentベンチマークでは全ケースを最後まで完走した唯一のモデルとなったと報じられています。一方でターミナルコーディング系のベンチマークではGPT-5.5がリードしているとされており、用途によって優位性が分かれる構図になっています。価格面では通常モードは入力100万トークンあたり$5、出力$25で4.7と同額に据え置かれ、Fastモードは入力$10・出力$50に設定されています。スコア構成を眺めると、自律的にタスクを遂行するエージェント用途とブラウザ操作系で強みが出る一方、純粋なターミナルコーディングの瞬発力では競合に譲る領域も残されており、ワークロードごとにモデル選択を切り替える発想が現実的です。
Series H $65B調達と次世代Mythosの輪郭
Opus 4.8のリリースは、財務・ロードマップ両面の大きな動きと連動しています。Anthropicは同日、Series Hで$65Bを調達し、ポストマネー評価額は$965Bに到達しました。この水準はOpenAIを上回るもので、年換算売上ランレートは過去3か月で3倍超となり$47Bに達したと開示されています。
次世代「Mythos-class」の輪郭
Opus 4.8の上位に位置付けられるMythosについては、外部分析の数値が出始めています。
- 内部コードネーム「Capybara」と呼ばれる新ティアとして位置付けられています
- SWE-Bench Verifiedで93.9%、USAMO 2026数学で97.6%を記録したとされています
- Project Glasswing経由で既に10,000件超の重大ソフトウェア脆弱性を発見したと伝えられています
評価額$965Bという資金調達規模と、SWE-Bench Verified 93.9%という上位モデルの数字が同時に出てきた点を踏まえると、Opus 4.8は単発のモデル更新ではなくMythos世代への橋渡しとして読み解くのが妥当です。
Q&A
Q. Opus 4.8はOpus 4.7と比べて具体的に何が違うのですか? Android Authorityによれば、ほぼすべてのベンチマークでスコアが向上し、欺瞞的な挙動や悪用への協力傾向が大幅に低下したとAnthropicは説明しているとされます。コードに含まれる欠陥を「報告しない」確率は従来比で約4分の1まで下がったと報じられ、Fastモードの利用コストも従来比で約3分の1の水準(約3倍安価)に引き下げられたと伝えられています。
Q. Effort制御とDynamic workflowsはすべてのClaudeユーザーが使えますか? Effort制御はモデルセレクタの新オプションとしてLow/Medium/High/Maxの4段階で提供されたとされています。Dynamic workflowsはClaude Code向けのリサーチプレビュー機能で、現時点では検証段階の提供形態です。プランごとの提供条件についての詳細は現時点では明らかにされていません。
Q. 今すぐOpus 4.8に移行すべきですか、それともMythos-classを待つべきですか? 公開情報の範囲では、Mythos-classは新シリーズとしてリリースが計画されていると報じられているものの、提供時期・スペック・価格は明らかにされていません。一方Opus 4.8はAndroid Authorityの報道時点でClaudeユーザー向けに提供が始まったとされ、Fastモードのコスト改善やEffort制御は既存ユーザーがすぐに体感できる変化と伝えられています。コスト感度の高い軽量クエリやコード生成での「正直さ」改善を試したい場合は、待たずにOpus 4.8へ切り替えた上で、Mythos-classの追加情報が出てから改めて再評価するのが現実的な進め方でしょう。
