Anthropicが「これまで一般公開したどのモデルよりも強力」と明言するClaude Fable 5を本日リリースした。
Fable 5の正体は、4月にProject Glasswingでサイバー防御者だけに限定提供されていた最上位モデル「Mythos」クラスのモデルに安全装置を付けて一般公開したものだ。ソフトウェアエンジニアリング、知識労働、ビジョン、科学研究など「テストしたほぼすべてのベンチマーク」で最高性能を記録し、タスクが長く複雑になるほど他モデルとの差が開くという。同時に、サイバー防御者向けには安全装置を外した「Claude Mythos 5」もリリースされた。
しかしこの発表で最も注目すべきは、性能そのものではない。「世界最強のサイバー攻撃能力を持つモデルを、安全に一般公開する方法」をAnthropicがどう設計したか——その安全装置のアーキテクチャだ。
Fable 5とMythos 5は何が違うのか

同じモデル、異なる安全装置
Fable 5とMythos 5は同じ基盤モデルだ。違いは安全装置(セーフガード)の有無だけ。Fable 5にはサイバーセキュリティ、生物学・化学、蒸留(モデルのコピー)に関するクエリを検知する分類器(クラシファイア)が搭載されており、これらのトピックに該当するクエリが検知されると、Fable 5ではなくClaude Opus 4.8が代わりに回答する。
ここがAnthropicの設計思想の核心で、「危険なクエリは拒否する」のではなく「次に強力なモデル(Opus 4.8)にフォールバックする」という方式を採用した。ユーザーにとっては、完全な拒否よりもはるかに良い体験だ。しかもこのフォールバックが発生するのはセッション全体の5%未満——95%以上のセッションではFable 5がそのまま応答し、Mythos 5と事実上同じ性能を発揮する。
Mythos 5はProject Glasswingのサイバー防御パートナー向けに提供され、サイバーセキュリティの安全装置が解除されている。さらに今後、生物学研究者向けに生物・化学の安全装置を解除したバージョンも提供予定だ。
ベンチマーク:何がどれくらい強いのか
ソフトウェアエンジニアリング
Stripeが早期テストで報告した事例が象徴的だ。5,000万行のRubyコードベースで、チーム全体で2ヶ月以上かかるコードベース全体の移行を、Fable 5は1日で完了した。「数ヶ月のエンジニアリングを数日に圧縮した」というStripeの表現は、大規模コードベースでのエージェント実行能力の飛躍を端的に示している。
CognitionのFrontierCode評価では、難易度の高いコーディングタスクを本番品質のコードベース基準でクリアするテストで、Fable 5はミディアムエフォート(中程度の思考時間)ですらフロンティアモデル中最高のスコアを記録した。トークン効率も過去のClaudeモデルより向上している。
CursorのCEO Michael Truell氏は「Fable 5はCursorBenchで最高性能のモデルだ。以前のモデルでは手が届かなかった長期的な問題のクラスを開拓した」とコメントしている。
ビジョン(視覚理解)
Fable 5はビジョンタスクにおいて新たな最高水準を達成した。科学論文の詳細な図表から正確な数値を抽出でき、スクリーンショットだけからWebアプリのソースコードを再構築できる。
印象的なデモとして、Fable 5がポケモン ファイアレッドをビジョンのみでクリアした事例が紹介されている。以前のClaudeモデルは地図やナビゲーション補助、ゲーム状態情報を追加するヘルパーハーネスがなければプレイできなかったが、Fable 5はゲーム画面のスクリーンショットだけでエンディングまで到達した。
記憶と長文脈
Fable 5は数百万トークンにわたる長時間タスクで集中力を維持し、自分自身のメモを使って出力を改善する。デッキ構築ゲーム「Slay the Spire」をプレイさせた実験では、永続的なファイルベースのメモリへのアクセスを与えた場合のパフォーマンス向上が、Opus 4.8の3倍に達した。Fable 5はゲームの最終幕に到達する頻度もOpus 4.8の3倍だった。
科学研究(Mythos 5)
Mythos 5を使った社内タンパク質設計の専門家は、創薬設計プロセスの一部を約10倍に加速した。タンパク質設計ツールとバイオインフォマティクスツールを与えたMythos 5は、人間の支援なしで、熟練した人間のオペレーターと同等またはそれ以上の成果を出した。結合部位の選択、タンパク質設計ツールの選択と実行、失敗からの回復——通常は科学者が行うすべてのタスクをモデルが自律的に実行した。
さらにMythos 5は、1週間以上のほぼ自律的な作業でゲノミクスの新規研究を実施した。138の動物種にまたがる数百万の細胞の単一細胞データを組み立て、カスタムMLモデルを自ら設計・訓練した。そのモデルは、100倍小さいにもかかわらず、科学誌Scienceに掲載された最近のモデルを上回る性能を示したという。
安全装置のアーキテクチャ:「拒否」ではなく「フォールバック」
なぜ従来の方式では足りないのか
Mythosクラスのモデルは、サイバーセキュリティ分野で脆弱性の発見と悪用に卓越している。エージェント型ハッキング——偵察、発見、横方向の移動、エクスプロイトの実行——を自律的に行う能力を持つ。同時に、生物学分野ではウイルスの設計に関連する予測を専門モデルより高精度で行えることが示された。
これらの能力は、サイバー防御者や医薬品研究者にとっては極めて有用だが、悪意ある使用者にとっても同様に有用だ。デュアルユース(攻防両用)の本質的なジレンマが、Mythosクラスでは過去のモデルよりもはるかに深刻になっている。
3つの分類器
Fable 5には3つの領域をカバーする分類器(クラシファイア)が搭載されている。
サイバーセキュリティ分類器 は、脆弱性の発見・悪用だけでなく、攻撃的なサイバータスク全般(偵察、横方向移動など)をカバーする。評価では、この分類器によりFable 5はサイバー攻撃タスクでまったく進捗できなくなった。1,000時間以上の外部バグバウンティでもユニバーサルジェイルブレイク(安全装置を完全に回避する手法)は発見されなかった。
生物学・化学分類器 は、生物兵器関連の狭い範囲だけでなく、生物学・化学に関連するリクエスト全般をカバーする。現時点ではカバー範囲が意図的に広く設定されており、無害なリクエストがフォールバックする「偽陽性」が発生する。Anthropicはこの範囲を今後絞り込む方針で、生物医学研究者向けの信頼済みアクセスプログラムも準備中だ。
蒸留分類器 は、権威主義国家のモデルを訓練するためにClaudeの能力を大規模に抽出しようとする試みを検知する。
外部評価
あるサイバーセキュリティの外部パートナーは、Fable 5の有害なサイバークエリに対する安全装置が「テストしたどのモデル(Opus 4.8、Opus 4.7を含む)よりも堅牢だった」と報告している。サイバー攻撃の計画、エクスプロイト開発、防御回避に関する単一ターンのリクエストに対して、30種類の公開ジェイルブレイク手法を使用しても、Fable 5はゼロ件のコンプライアンスだった。
料金とアクセス
Mythos Previewの半額以下
入力$10 / 出力$50(100万トークンあたり)。Claude Mythos Previewの半額以下だ。Mythosクラスの能力がこの価格で一般提供されるのは初めてのことになる。
サブスクリプションプランでの提供スケジュール
APIと従量課金のEnterprise プランでは本日から完全利用可能。サブスクリプションプラン(Pro、Max、Team、シートベースEnterprise)では段階的に展開される。
6月22日まではサブスクリプションに含まれる形で追加料金なしで利用可能。6月23日以降は使用量クレジットが必要になる。容量が許す限り、この無料期間の延長を検討するとしている。最終的には、十分な容量が確保でき次第、サブスクリプションプランの標準機能に戻す意向だ。
30日間のデータ保持ポリシー
Fable 5、Mythos 5、および同等以上の能力を持つ将来のモデルについて、すべてのトラフィックに対して30日間のデータ保持が義務付けられた。このデータはモデルの訓練には使用されず、安全性関連の目的(ジェイルブレイク検知、偽陽性の削減)にのみ使用される。30日後にほぼすべてのケースで削除される。
早期テスターの評価
Cursor(CEO)は「CursorBenchで最高性能。以前は手が届かなかった長期的な問題を開拓した」。GitHubのChief Product Officerは「複雑な長期コーディングタスクを、過去のベンチマークを超える自律性と信頼性でこなした」。Harveyは「赤入れ(レッドライン)でHarveyのアソシエイトと同等かそれ以上の精度」。Hexは「コア分析ベンチマークで初めて90%を突破。Opusから10ポイントジャンプ」。Sakana AIの梶裕介GM(AI for Business)は「最高のエフォートで、自分自身の作業を振り返り検証する。高度な自律運用を可能にする」と評価した。
物理研究に特化したプラットフォームは「GPT-5.5が4日かかった成果に、Fable 5は36時間で近づいた。しかも推論トークンは3分の1」という定量比較を報告している。
この発表が意味すること
Fable 5の発表は、AIの安全性に関する議論を新しいフェーズに進める。
ユーザーにとっては、6月22日までPro/Max/Teamプランで追加料金なしにMythosクラスの能力が使える。この期間中に、自分の業務でFable 5がどれだけの差を生むかを検証する価値がある。特にソフトウェアエンジニアリング、長文分析、ビジョンタスクでは、過去のモデルとの差が顕著に出るはずだ。6月23日以降のクレジット課金に移行する前に、使いどころを見極めておきたい。
開発者にとっては、API ID claude-fable-5 で即日利用可能。入力$10/出力$50という価格は、Mythosクラスの能力に対して積極的な設定だ。エージェントワークフローや長時間自律タスクでの活用が最もROIが高い領域になるだろう。30日間のデータ保持ポリシーは、医療・金融などコンプライアンス要件の厳しい業界では追加の検討が必要になる。
AI業界全体としては、「最強のモデルを安全に一般公開する」というAnthropicのアプローチが注目に値する。完全な拒否ではなくOpus 4.8へのフォールバック、95%以上のセッションでフル能力を維持、1,000時間のバグバウンティでユニバーサルジェイルブレイクなし——この「安全に開く」設計思想が、今後のフロンティアモデルのリリース方法のスタンダードになるかもしれない。

