TECH · AI SECURITY · CYBER

Cloudflare の Mythos 実装と、金融庁作業部会まで動いた日本 — Project Glasswing の6週間

Project Glasswing公表から約6週間。Cloudflareが追加参加組織の立場で50超リポジトリへMythosを適用した実装記録を公開、Mozillaも Firefox 150 で 271件のセキュリティパッチを当てた経緯を開示。日本側も3メガバンクのMythosアクセス確保、金融庁の官民作業部会設置、5/22の政府アクセス表明と動いた、この6週間を整理します。

tech 2026-05-24 48 min read by ちらりんの飼い主
cover · 1024×1024

はじめに

5月18日、Cloudflareが Claude Mythos Preview を50を超える自社リポジトリに適用した実装記録を公開しました。8段階のハーネスでエージェントを並列に回し、第2エージェントで元の所見を反証して誤検知を削っていく流れが、自社の試行錯誤ごと書かれています。Project Glasswing をめぐる4月以降の発表のなかで、ハーネス設計と運用上の学びまで踏み込んでいる点で、独特の一本でした(約2,000件・うち400件 high/critical の数字は、後述のとおり Anthropic 側の Initial Update が出典です)。

時系列で言えば Mozilla の方が先行していて、Firefox 150 のリリースに合わせた 4月21日の公式ブログと、5月7日の Mozilla Hacks で実装の中身まで開示しています。Firefox 150 で 271件のセキュリティパッチ、ひとつ前の Firefox 148 が Opus 4.6 ベースで 22件だったのと比べると 12倍超。2025年の月次セキュリティ修正が 20〜30件台で推移していたのに対し、2026年4月全体は 423件まで増えた、と説明されています。

そして日本側。4月時点ではProject Glasswingの公表されたパートナーに日本企業の名前がない状況だったのが、5月に入って3メガバンクのMythosアクセス確保と金融庁の官民作業部会設置という形で動き始めました。

この記事は、4月15日に書いた Claude MythosとProject Glasswing、そしてOpenAIのTAC — サイバーAIの配り方を各社はどう設計したか の続編です。設計思想の比較だった前回に対し、今回は Cloudflare と Mozilla の実装レポート、そして日本側の動きを並べて、この6週間で何が動いたかを整理します。


Project Glasswingの今

Glasswingの枠組み自体については前回記事に書きました。ここでは更新分だけ。

5月22日にAnthropicが公開した Glasswing Initial Update では、参加組織全体で10,000件以上の脆弱性発見という総数と、CiscoのFoundry Security SpecがOSS化されたことが報告されました。

ただ「10,000+」という総数だけ見せられても、何がどう見つかったかは分かりません。重要なのは個別組織が出してくる「中身」のレポートです。時系列で先行したのは Mozilla(4月21日の公式ブログ + 5月7日の Mozilla Hacks)で、その後 5月18日に Cloudflare が踏み込みの深い実装記録を出した、というのがこの6週間の流れでした。本記事ではまず Cloudflare のレポートをじっくり読み解き、続けて Mozilla の打ち出したメッセージを並べます。


Cloudflareレポートをじっくり読む

Project Glasswing: what Mythos showed us(5月18日公開)は、Glasswing関連の公開レポートのなかでも、ハーネス設計や運用上の学びまで踏み込んだ具体性の高い一本でした。

立ち位置から押さえる

まず事実として押さえておきたいのは、Cloudflareはlaunch時の創設パートナー12組織には含まれていないということです。4月7日の発表で名前が並んだのは、Anthropic自身を含む12組織(Amazon Web Services、Anthropic、Apple、Broadcom、Cisco、CrowdStrike、Google、JPMorgan Chase、Linux Foundation、Microsoft、NVIDIA、Palo Alto Networks)。Cloudflareはここに入っていません。

その後の「追加参加40組織以上」の枠の中にCloudflareが入り、ハーネス設計まで踏み込んだ実装記録を公開した、という構図です。インナーサークルではない組織が、本記事で扱う公開レポートのなかでも具体性の高い一本を出した。 この事実は記憶しておく価値があります。

何を走査したか

Cloudflareが対象にしたのは以下のような自社の重要コードベース群です。

  • ランタイム(Workers実行基盤)
  • エッジのデータパス
  • プロトコルスタック
  • コントロールプレーン
  • 依存しているOSSコンポーネント

50を超えるリポジトリが対象になりました。なお、約2,000件のバグ・うち約400件がhigh/criticalという数字は Cloudflare 自身の記事ではなく、Anthropic の Glasswing Initial Update(5月22日) で Cloudflare の成果として示されているものです。出典を分けて読む必要があります。

「10万行で0.1%」問題への対応

レポートで特に目を引いたのは、エージェントの限界に正面から向き合っている部分です。

10万行規模のリポジトリに対して、単一エージェントのセッションを単純に走らせると、コードベースの0.1%程度しかカバーできない

これはMythos級のモデルでも例外ではない、という前提に立っています。そこでCloudflareは8段階のハーネスを組んで継続的にカバレッジを広げました。

段階役割
調査リポジトリ全体の把握とリスク領域の特定
探索仮説に基づくコードパス選定
検証候補となる脆弱性の再現
穴埋めカバレッジの抜けに対する追加走査
重複排除同一根本原因のクラスタリング
トレース影響範囲とコールグラフの特定
フィードバック過去の発見を次回ループへ反映
レポート人間レビュアー向けの構造化出力

「単発のチャットセッションでAIに脆弱性を見つけさせる」のではなく、プロセスとして組むという発想です。

第2エージェントで誤検知を削る

誤検知(False Positive)削減の手法には、納得感がありました。Cloudflareは、初期所見と処理キューの間に別プロンプト・別モデルで元の所見を反証しようとする第2エージェントを置き、ノイズを減らしたと説明しています。

単一エージェントに自信度を出させると、自信度の根拠そのものが幻覚に巻き込まれるリスクがある。それを別系統の検証エージェントで外側から潰しに行く設計は、現場で動く仕組みとして納得感がありました。

「速度より設計」という主張

Cloudflareのレポートで筆者が一番響いたのは、終盤の次のくだりです。

パッチを迅速に適用しても、パッチを作成するプロセスの形が変わるわけではありません。回帰テストを省略することで発生するバグは、パッチ適用しようとしていたバグよりも悪化する傾向があります。

そしてもう一段踏み込んで、脆弱性を「取り巻くアーキテクチャをどのように設計すべきか」を考えるべきだ、と続けています。バグがあっても攻撃者が悪用しにくい設計に倒すこと、つまり速度より設計が本丸だという主張だと筆者は読みました。前回記事で引用したContrast SecurityのDavid Lindner(「問題は発見ではなく修正だ」)と同じ系譜の主張です。AIで発見が加速しても、修正のキャパシティとアーキテクチャ設計の質が追いつかなければ根本的には変わらない。Cloudflareは自社でその両方を回しながら、この立場を取り続けています。


Mozillaの「攻撃者の長期的優位性を崩す」

Cloudflareの対比軸として、Mozillaのレポートも合わせて読む価値があります。AI and security: How AI is helping us find zero-day vulnerabilities(Mozilla公式)と、技術詳細を扱った Behind the Scenes: Hardening Firefox(Mozilla Hacks)です。

Firefox 150の数字

重要度件数
sec-high180
sec-moderate80
sec-low11
合計271

この271件は、ひとつ前のFirefox 148でClaude Opus 4.6により特定された22件と比べると 12倍超にあたります。Mozilla Hacks は、2025年の月次セキュリティ修正が概ね20〜30件台で推移していたのに対し、Mythosが入った 2026年4月全体では Firefox の修正件数が 423件(Mythos 271 + 外部報告 41 + その他の内部発見 111)まで跳ね上がったと説明しています。

キーメッセージは「時間軸」

Mozilla公式ブログのタイトル The zero-days are numbered が示しているのは、ゼロデイの「個数」だけでなく**「持ち時間」**の話です。Mozilla は、機械が発見できるバグと人間が発見できるバグの差(gap)こそが攻撃者を有利にしてきた、と前置きしたうえで、こう書いています。

Closing this gap erodes the attacker’s long-term advantage by making all discoveries cheap.

意訳すると、「この差を縮めることが、すべての発見を安価にし、攻撃者の長期的優位性を削る」。攻撃者は今まで、人間の防御者が気付かないバグを長期間ストックできていました。AIがその差を縮めると、攻撃者が抱え込めるストックの時間軸そのものが短くなる、という読みです。

これはMythosのベンチマーク数値より構造的に重要な視点だと感じました。単発の発見能力ではなく、攻撃者と防御者の時間軸の非対称性が変わる、という捉え方です。

Mozillaの慎重な立ち位置

Mozilla自身は、自分たちの立場をかなり慎重に位置取っています。Mythosが見つけたバグは「人間のエリート研究者にも見つけ得た範囲」のものだと位置づけたうえで、ただし 271件をこの速さで見つけ、修正まで持っていける人間チームは現実的ではない、と書き分けています。能力の質的飛躍ではなく、スループットの量的変化として位置づける筆致で、ハイプを慎重に避けるトーンが好印象でした。

Microsoft / Ciscoは方針表明まで

CloudflareやMozillaほどの実装記録ではないものの、関連する動きとして補足します。Microsoftは MSRCのAI活用方針 で、24x7の連続監視Human-in-the-Loopのハイブリッド設計という2軸を示しました。「AIだけで判断させない」を業界最大級のSIRTが公式に宣言した形です。Ciscoは前述のFoundry Security SpecをOSS化。実装に踏み込んだレポートはまだ出ていないので、続報待ちです。


日本:3メガバンク + 金融庁作業部会

4月時点でこの分野を見ていた人なら、おそらく同じ感想を持ったはずです。Glasswingの創設パートナー12社にも、OpenAIのTAC初期発表にも、日本企業は名前がなかった。

それが5月に入って動きました。3日間の経緯を時系列で並べます。

  • 5月12日 — 来日中のベッセント米財務長官との会合をめぐり、米側が3メガバンク(三菱UFJ・三井住友・みずほ)に対してClaude Mythosアクセス付与を前向きに検討する姿勢を伝えたと報じられる
  • 5月13日3メガバンクがMythosアクセス権確保 と日経電子版で報道(翌5月14日朝刊にも 同件の続報 が掲載)。日本企業として初。5月末をめどにアクセス取得が進む見込み
  • 5月14日 — 金融庁が官民作業部会を設置(金融庁公式リリース / ITmedia AI+報道)。3メガ、日銀、AIセーフティ・インスティテュート、Anthropic / OpenAI / Google各日本法人、主要ITベンダー、業界団体などが参加

3日間で「米側の付与方針が伝わる → 国内報道 → 官民作業部会設置」まで動いたスピード感は、4月までの不在ぶりからすると異例の速さです。少なくとも財務省レベルの外交チャネルがこの動きを加速させた可能性は高そうですが、金融庁の側が即座に作業部会を立てた動きには、独自の危機感の濃淡が見えます。作業部会には3メガ・日銀・JPX に加え、ネット銀やシステム開発側のITベンダー、地銀協・生保協・損保協など業界団体まで広く入っており、規模感としては「主要金融インフラを横断する全員参加」に近い構成です。

さらに5月22日、片山金融相は記者会見で、日本政府および金融機関にも Claude Mythos アクセス権を付与する計画が米側から伝えられていたと表明しました(日経報道)。同日、金融庁は金融機関に対して「短期的対応」として、必要に応じてシステムを能動的に停止することも含めた検討を要請しています(時事通信報道)。日本側の動きは、3メガ単独ではなく政府アクセスと運用ガイダンスを含む段階に入りつつあります。

「参加表明」と「実装レポート」の距離

ここで冷静に整理しておきたいのは、3メガバンクは今のところ「アクセス取得」フェーズに過ぎないということです。

Cloudflareは、12組織外の追加参加組織でありながら、50超のリポジトリを走査し、8段階のハーネスを組んだ実装の全プロセスを公開しました(数字自体は Anthropic 側の Initial Update に整理されている)。「アクセスを得たこと」と「実装して回したこと」の間には大きな距離があります。

3メガバンクが次に問われるのは、Mythosを自社のレガシー基幹システムや顧客接点のあるサービスに対してどう走らせ、何を見つけ、何を直したかを、どこまで開示できるかです。金融機関のセキュリティ事情を考えると、Cloudflareと同じ密度のレポートを出すのは難しいでしょう。それでも、抽象度の高いサマリーであっても「使ってみてどう変わったか」を業界に共有することには意味があります。

4月時点で「日本は不在」に見えた構図が、5月に「1周目に乗った」段階まで進んだことは素直に歓迎したい。ただし次に注視すべきは『参加表明』ではなく、Cloudflare 並みの密度の実装レポートが日本側から出てくるかどうかだと見ています。

金融庁作業部会への期待

金融庁作業部会には、もう1つの役割が期待できます。Glasswing で扱う脆弱性情報の開示タイミングの非対称性を、日本の文脈でどう扱うかの議論です。

Glasswing は責任ある開示の慣行に沿っており、詳細公開には発見から90日、またはパッチ提供後の一定期間といった時間差が生じ得ます(前回記事参照)。一方で Anthropic は5月時点で、参加組織が Glasswing 外の組織にも一定条件下で知見・ツール・コードを共有できるよう運用を見直したと Reuters に伝えています。3メガが先に固くなることで、地銀・信金・信組や、銀行依存度の高い決済事業者との間にギャップが生まれる可能性は残りますが、それを埋める正規ルートを Anthropic 側が用意し始めた、ということでもあります。作業部会が3メガから他金融機関への知見展開プロセスまで踏み込めるなら、日本独自の処方箋になり得ます。これは推測の域ですが、議題として注目したい論点です。


まとめ

Project Glasswing公表から約6週間で、状況は次のフェーズに移りました。

  • Cloudflare が踏み込みの深い実装記録を出した。 launch 12組織外の追加参加組織が、ハーネス設計や運用上の学びまで踏み込んだ実装レポートを公開した構図は印象的。50超リポジトリ・8段階ハーネス・第2エージェントによる反証、そして「速度より設計」。なお約2,000バグ・うち約400件 high/critical は Anthropic の Initial Update 側で示された数字
  • Mozillaは時間軸の話に踏み込んだ。 Firefox 150で271件パッチ(Firefox 148 の Opus 4.6 ベース22件と比べて12倍超、2026年4月全体では Firefox の修正は423件まで増加)。「攻撃者の長期的優位性が削れる」というキーメッセージは、Mythosの能力評価より構造的に重要な視点
  • 日本は5月にようやく1周目に乗った。 3メガバンクのアクセス確保と金融庁作業部会設置。3日間で動いた異例のスピード感はあるが、まだ「アクセス取得」段階で、Cloudflare 並みの実装記録はこれから
  • 観察すべきは『参加表明』ではなく『実装の中身』。 Cloudflareのような実装記録が今後どの組織からどれだけ出てくるか。それが、AI内製度・実装文化・公表慣行という、組織の体力差を浮き彫りにする

このフェーズは、4月の「能力評価と設計思想の比較」から、**「実装と公表慣行の比較」**に移ったと言えます。問いはたぶんこの 3 つです。3メガバンクは、いつ・どんな粒度で実装レポートを出すのか。日本の地銀・信金・SIerが Mythos 級を扱うときの処方箋を、金融庁作業部会はどこまで具体化できるのか。そしてあなたの組織は、その答えが出る前に何を準備しておくべきか。


参考リンク

前提となる前回記事(合わせて読むと、設計思想と実装記録の対比が見えやすいです)

今回参照した公式・一次ソース

今回参照した報道ソース

· · ·

コメント