重要ポイント

  • Anthropicは、Opus 4.8がコーディング、エージェント作業、知識労働の評価で前世代より改善したと説明しています。
  • Claude Codeには research preview として dynamic workflows が追加され、大規模タスクを多数の並列 subagents で進められると案内されています。
  • claude-opus-4-8 としてAPI利用でき、通常利用時の価格はOpus 4.7から据え置きです。
  • 元記事では、不確かな点を申告しやすくなり、問題のあるコードを見逃しにくくなった点も改善点として挙げています。

初心者向け補足

AIを仕事で使うときは、「答えが速い」だけでなく、「怪しいところを怪しいと言えるか」が重要です。コード修正や調査のような長い作業では、とくにこの性質が効きます。Opus 4.8は、派手な一発回答よりも、長い作業を最後まで運ぶ品質を上げようとしているモデルとして理解するとよいです。

自分のコメント

同じ話題でも、最近はベンチマークの点数より「長時間動かしたときにどれだけ破綻しにくいか」が差別化要因になっています。dynamic workflows まで含めて見ると、モデル単体ではなく、作業オーケストレーション込みで開発体験を作ろうとしているのが見えて興味深いです。

元記事

Anthropic の元記事を読む