aileadailead - エンタープライズAIエージェント基盤
Claude Fable 5とループエンジニアリング|プロンプトからループへ、AIエージェント活用の転換点
AI・テクノロジー28分で読めます

Claude Fable 5とループエンジニアリング | プロンプトからループへ、AIエージェント活用の転換点

ailead編集部

ailead編集部

目次

2026年6月9日(米国時間)、Anthropicは新モデル「Claude Fable 5」を公開した。翌10日、同社CEOのDario Amodeiは、フロンティアAIに航空機並みの事前審査を義務付けるべきだと提言するエッセイを公開した。そしてその翌日、Anthropicは公開したばかりの安全装置の運用を「誤ったトレードオフだった」と認め、謝罪とともに修正した。

わずか3日間の出来事である。そして同じ週、Claude Codeの開発者Boris Cherny氏の発言がSNSで拡散していた。「もうClaudeにプロンプトを書いていない。ループを書いている」。

この記事では、Fable 5の発表内容を整理した上で、この発言が象徴する「ループエンジニアリング」という考え方と、その背後にあるAI研究の経験則「ビターレッスン」までを一続きの流れとして読み解く。

Claude Fable 5とは何か

Anthropicの発表(2026年6月9日)によると、Claude Fable 5は同社の最上位モデル群「Mythos」系で初めて一般提供されるモデルである。

  • 提供元: Anthropic
  • 位置づけ: Mythos級モデルの安全装置付き一般提供版
  • 性能: ほぼ全ての主要ベンチマークで最高水準。TechCrunchの報道(2026年6月9日)では、一部ベンチマークでClaude Opus 4.8を10%以上上回るとされる
  • 価格: 100万トークンあたり入力$10、出力$50(Opus 4.8の約2倍)
  • 提供範囲: エンタープライズ顧客と有料プラン向けに段階的に展開

Mythosという名前に聞き覚えがある読者もいるかもしれない。2026年4月に限定公開された「Mythos Preview」は、ソフトウェアの脆弱性、いわゆるゼロデイを自律的に発見する能力を示し、サイバーセキュリティ業界と米政府に衝撃を与えたモデルだ。Anthropic自身が「広く提供するにはリスクが大きすぎる」と判断し、アクセスを厳しく制限してきた経緯がある。

Fable 5は、このMythos級の能力を安全装置付きで一般に開放する試みである。具体的には3つの分類器が常時動作する。

  1. サイバーセキュリティ: 攻撃に関わる要求を検知すると、応答をOpus 4.8に引き継ぐ
  2. 生物・化学: リスクの広い領域をカバー。Anthropicによれば偽陽性は平均セッションの5%未満
  3. 蒸留対策: モデルの能力を抽出して他国・他組織のモデル学習に流用する行為を防ぐ

つまり、高リスクと判定された要求だけを一段安全なモデルに迂回させることで、最高性能のモデルを一般提供するという設計だ。同日には制限を一部解除した「Claude Mythos 5」も発表されたが、こちらは審査済みの少数パートナーと、選定された生命科学研究者のみに提供される。

公開と警告と謝罪、Anthropicの3日間

今回の発表で注目すべきは、モデルの性能だけではない。公開をはさんだ前後3日間のAnthropicの動きが、フロンティアAIの提供がどれほど際どいバランスの上に成り立っているかを示している。

6月9日、公開。 4月の時点で「危険すぎる」とされたMythos級の能力が、安全装置付きとはいえ一般ユーザーの手に渡った。

6月10日、警告。 Dario Amodei CEOがエッセイ「Policy on the AI Exponential」を公開した。VentureBeatの報道(2026年6月10日)によれば、提言の核心は次の一文にある。

"Frontier AI models, like airplanes, should be required to go through technical testing and auditing, and their release should be blocked or reversed as a threat to public safety if they do not meet high standards of safety." (フロンティアAIモデルは航空機と同様に技術的な試験と監査を義務付けられるべきであり、高い安全基準を満たさない場合は、公共の安全への脅威としてリリースを差し止め、または撤回できるようにすべきだ。)

航空や製薬の分野で確立された「市場に出す前の事前審査」をAIにも適用せよ、という主張である。自社の最強モデルを公開した翌日に、その種のモデルを政府が差し止められる制度を求める。矛盾しているように見えるが、Anthropicは一貫して「能力の公開」と「規制の要求」を並走させてきた。能力を示さなければ警告に説得力が生まれず、警告しなければ公開の正当性が揺らぐ、という構造だ。

6月10日から11日、批判と修正。 公開直後から、Fable 5の安全装置の運用に批判が集まった。The Registerの報道(2026年6月10日)では、無害な質問まで拒否される過剰反応が指摘された。より深刻だったのは、システムカードに記載されていた「フロンティアLLM開発を狙う要求を検知した場合、通知なしに応答の品質を制限する」という方針である。AI研究者や開発者から「サイレントな妨害だ」という強い反発を招いた。

Anthropicは6月11日、この方針を撤回した。「私たちは誤ったトレードオフを選んだ。バランスを誤ったことを謝罪する(we made the wrong tradeoff and we apologize for not getting the balance right)」と表明し、Opus 4.8へのフォールバックが発生した場合は、サイバー・生物分野の安全装置と同様に、毎回ユーザーに可視化されるよう変更するとした。

性能、安全、透明性。この3つを同時に成立させる難しさが、公開からわずか2日で表面化したことになる。

手法の系譜とビターレッスン

Fable 5のようなモデルの登場は、AIを業務で使う側の方法論にも直接影響する。生成AI活用の中心概念は、この3年で大きく2回入れ替わってきた。

段階中心概念人間の役割
2023年頃プロンプトエンジニアリング1回の指示文を工夫して書く
2024〜2025年コンテキストエンジニアリングAIに渡す情報全体を設計する
2026年〜ループエンジニアリング自律実行のループを設計し監督する

2023年、モデルの能力を引き出すには指示文の書き方が決定的だった。役割を与える、例を示す、段階的に考えさせる。こうした技法が「プロンプトエンジニアリング」として体系化された。

2024年から2025年にかけて、焦点は指示文そのものから、AIに渡す情報全体の設計へ移った。Andrej Karpathy氏が提唱した「コンテキストエンジニアリング」である。モデルが十分に賢くなると、指示文の細かい工夫より、適切な参照データ、履歴、ツール定義を揃えることの方が成果を左右するようになったからだ。

そして2026年、Fable 5級のモデルは、数時間にわたる複雑なタスクを自律的に進められる。すると次の問いは「1回のやり取りをどう設計するか」ではなく、「人間が介在しない実行サイクル全体をどう設計し、どこで検証し、いつ止めるか」に変わる。これがループエンジニアリングだ。

この系譜には既視感がある。AI研究者Richard Suttonが2019年のエッセイで示したビターレッスン、すなわち「人手で作り込んだドメイン知識は、計算量にスケールする汎用手法に長期的には負ける」という経験則の再現である。チェスでも囲碁でも音声認識でも、研究者が丹精込めて作り込んだ知識は、計算資源の増加とともにシンプルな手法に追い抜かれた。同じことがLLMの周辺でも起きている。特定モデルの弱点を補うために作り込んだプロンプト集や複雑なワークフローは、次の世代のモデルが出た瞬間に、不要になるか、むしろ性能の足かせになる。

モデルが強くなるたびに、人間の介入は一段抽象的なレイヤーへ退いていく。プロンプトからコンテキストへ、コンテキストからループへ。

「もうプロンプトは書かない」Boris Chernyの3段階

この転換を象徴する発言として今週拡散したのが、AnthropicでClaude Codeを開発するBoris Cherny氏の言葉だ。OfficeChaiなど複数の米メディアの報道(2026年6月)によれば、Cherny氏はポッドキャスト出演時にこう語っている。

"I don't prompt Claude anymore. I have loops running that prompt Claude and figuring out what to do. My job is to write loops." (もうClaudeにプロンプトを書いていない。Claudeにプロンプトを出し、何をすべきか判断するループが走っている。私の仕事はループを書くことだ。)

Cherny氏は自身のワークフローの変化を3段階で説明している。

  1. 1年前: コードを手で書き、AIの補完に助けてもらう
  2. その後: 5〜10個のClaudeセッションを並列で走らせ、それぞれに手動でプロンプトを出す
  3. 現在: プロンプトを直接書くことはなく、ループを設計する。報道によれば、数百のエージェントがGitHub、Slack、X(旧Twitter)を読み、次に何を作るべきかを判断しているという

注意したいのは、これは「業界の新常識」ではなく、最先端のツールを作る開発者本人のワークフローの変化として語られた話だという点だ。とはいえ、ループの構成要素は一般化できる。状態を観察し、次の行動をモデル自身が決め、実行し、結果を検証し、継続か停止かを判断する。この各ステップの判断が、スクリプトに書かれた分岐ではなくモデルの判断である点が、従来の自動化との本質的な違いだ。

だからこそ、ループの品質を決めるのは検証と終了条件の設計になる。Googleのエンジニアリングリーダー Addy Osmani氏も解説記事「Loop Engineering」(2026年6月)で、実用的なループには明確なゴール、ツール群、コンテキスト管理、検証、終了条件の5要素が必要だと整理している。ループが自律的に回るほど、誤った方向への作業の積み重ねを早期に検知するガードレールが重要になる。

企業は何に投資すべきか

ここまでの流れを企業のAI活用に引きつけると、投資判断の軸が見えてくる。

ビターレッスンが教えるのは「何も作り込むな」ではない。陳腐化しやすいのは、モデルの能力を人手で代替する作り込みだ。特定モデル向けに最適化したプロンプト集や、モデルの弱点を前提にした複雑な処理パイプラインは、Fable 5のようなモデルが出るたびに価値が目減りする。

モデルが進化しても価値が残るのは、次の3つである。

  • 構造化されたデータ: エージェントのループは、参照するデータの品質以上の成果を出せない。商談や面談などの対話データ、業務記録が統合・構造化されていることが、ループの精度の上限を決める
  • 検証の仕組み: ループの各サイクルで成果を確かめる手段。テスト、レビュー、業務指標との突合
  • ガバナンス: エージェントの行動範囲と権限の設計、実行ログの記録。Fable 5の安全装置をめぐる騒動が示したとおり、自律性が上がるほど透明性と制御の設計が問われる

aileadは、この1点目と3点目、すなわち対話データを安全に統合・構造化し、AIエージェントが評価、レコメンド、システム反映、タスク起票を自律的に実行するための基盤を提供している。エージェントのループに業務データを安全に供給する仕組みに関心のある方は、デモのご案内をご覧いただきたい。

モデルは今後も世代交代を続ける。Fable 5も、いずれ次のモデルに置き換わる。そのとき手元に残る資産は何か。プロンプトの書き方の次に、コンテキストの設計の次に、ループの設計が来た2026年は、この問いを考え直す良い機会と言える。


本記事の情報は2026年6月11日時点のものです。Fable 5の提供条件や安全装置の運用は今後変更される可能性があります。

出典

ailead編集部

ailead編集部

株式会社ailead

aileadの公式編集部です。営業DX・AI活用に関する情報を発信しています。

#Claude#Anthropic#ループエンジニアリング#AIエージェント#ビターレッスン#LLM

ailead(エーアイリード)で商談・面談データを活用しませんか?

AIが商談を自動で記録・分析し、営業組織の生産性を向上させます