MENU

【世界崩壊レベル】Anthropicの未公開AI「Claude Mythos」がヤバすぎる…!AI初心者が知るべき衝撃の事実

「AIが賢くなりすぎて、一般公開したら世界がぶっ壊れちゃうから公開しません」

そんなSF映画のような話が、2026年4月7日、現実になりました。

ChatGPTのライバルとして有名な「Claude(クロード)」を開発しているAnthropic社が、次世代AIモデル「Claude Mythos Preview(クロード・ミトス・プレビュー)」を発表。しかし、このモデルは一般公開されません

𝕏(旧Twitter)でも大きな話題になっており、「世界終焉しかけてるやん」「リアルターミネーターやん」といった声が飛び交っています。[3]

なぜ公開されないのか。それは、既存のソフトウェアや社会インフラの脆弱性(セキュリティの穴)をガンガン見つけてしまい、人類のサイバーセキュリティの叡智を超えてしまったからです。

この記事では、「Mythosって何がそんなにすごいの?」「私たちの生活にどう影響するの?」という疑問を、AI初心者の方にもわかりやすく、公式情報をもとに徹底解説します。

目次

目次

  1. Mythos(ミトス)とは?基本情報
  2. なぜ一般公開されないのか?
  3. Mythosの「異常な賢さ」を示す3つの衝撃事実
  4. 圧倒的なベンチマークスコア
  5. Firefox脆弱性テスト:90倍の改善
  6. 人類を守るための「Project Glasswing」
  7. 参加パートナー企業12社とその声
  8. Mythosの料金と利用方法
  9. 𝕏での反応まとめ
  10. まとめ:AIの進化は「次のフェーズ」へ

1. Mythos(ミトス)とは?基本情報

Claude Mythos Preview(クロード・ミトス・プレビュー)は、Anthropic社が開発した最新のフロンティアAIモデルです。現在の最高性能モデルである「Claude Opus 4.6」の次世代版にあたり、2026年4月7日に発表されました。

Anthropic公式サイト「Project Glasswing」のトップページ。「Securing critical software for the AI era(AI時代の重要ソフトウェアを守る)」というサブタイトルが掲げられている。
Anthropic公式サイト「Project Glasswing」のトップページ [1]

「Mythos」という名前は、古代ギリシャ語で「物語」や「語り」を意味する言葉に由来しています。文明が世界を理解するために紡いできた物語の体系、という深い意味が込められています。[1]

Anthropic社は244ページに及ぶ「System Card(システムカード)」という技術文書を公開し、Mythosの能力と安全性評価の詳細を明らかにしています。[2]

Claude Mythos Preview System Card(244ページ) [2]

2. なぜ一般公開されないのか?

Anthropic社は、Mythosをテストしている過程で、ある衝撃的な事実に気づきました。公式発表では、次のように述べられています。

「AIモデルは、ソフトウェアの脆弱性を見つけて悪用する能力において、最も熟練した人間以外のすべてを凌駕するレベルに達している」[1]

つまり、「超一流のハッカーレベルの能力をAIが持ってしまった」ということです。

もしこのAIが悪意のある人の手に渡れば、世界中の銀行システム、医療記録、物流ネットワーク、電力網などが攻撃され、社会がパニックに陥る可能性があります。Anthropic社の公式発表では、サイバー犯罪の年間被害額は世界全体で約5,000億ドル(約75兆円)にのぼると推定されています。[1]

そのため、Anthropic社は以下の理由から一般公開を見送りました。

「Claude Mythos Previewの能力の大幅な向上により、一般公開しないことを決定した。代わりに、限定的なパートナーへの防御的サイバーセキュリティプログラムとして提供する」[2]

これはAnthropic社の歴史上初めて、一般公開なしでSystem Cardを公開するという異例の対応です。[4]


3. Mythosの「異常な賢さ」を示す3つの衝撃事実

Mythosがどれほど規格外の能力を持っているのか、Anthropic社が公式に報告した具体的な事例を見てみましょう。これらはすべて、人間の指示なしにAIが完全に自律的に行ったものです。[1]

事例1:27年間誰も気づかなかったバグを発見(OpenBSD)

世界で最もセキュリティが強固だと言われているOS(オペレーティングシステム)の1つ「OpenBSD」は、ファイアウォールや重要インフラの運用に使われています。Mythosは、このOpenBSDに27年間も潜んでいた脆弱性を発見しました。この脆弱性を突けば、攻撃者は遠隔からマシンに接続するだけでシステムをクラッシュさせることができたそうです。[1]

事例2:500万回のテストをすり抜けたバグを発見(FFmpeg)

動画のエンコード・デコードに使われる「FFmpeg」というソフトウェアは、YouTubeをはじめ無数のアプリケーションで利用されています。Mythosは、このFFmpegに16年間見過ごされていた脆弱性を発見しました。驚くべきことに、このコードは自動テストツールが過去に500万回もチェックしていたにもかかわらず、人間もツールも一度も気づけなかったものです。[1]

事例3:複数のバグを組み合わせてシステムを完全乗っ取り(Linux)

世界中のサーバーの大部分を動かしている「Linux」において、Mythosは自律的に複数の脆弱性を見つけ出し、それらをチェーン(連鎖)させることで、一般ユーザーの権限からマシンの完全な制御権を奪う方法(エクスプロイト)を編み出しました。これは「権限昇格攻撃」と呼ばれる高度なハッキング手法であり、通常は熟練したセキュリティ研究者でなければ実行できないものです。[1]

公式サイトの「IDENTIFYING VULNERABILITIES AND EXPLOITS WITH CLAUDE MYTHOS PREVIEW」セクション。Mythosが自律的にゼロデイ脆弱性を発見した事例が紹介されている。
公式サイトの脆弱性発見セクション [1]

Anthropic社はこれらの脆弱性をすべてソフトウェアの開発元に報告済みであり、既に修正パッチが適用されています。まだ修正されていない脆弱性については、詳細の暗号学的ハッシュのみを公開し、修正完了後に具体的な情報を開示する方針です。[1]


4. 圧倒的なベンチマークスコア

Mythosの能力は、各種の性能テスト(ベンチマーク)でも圧倒的な数値として証明されています。以下の表は、Anthropic公式のSystem Card(p.187-188)から抽出した比較データです。[2]

コーディング能力(Agentic Coding)

テスト名Mythos PreviewOpus 4.6GPT-5.4Gemini 3.1 Pro
SWE-bench Verified93.9%80.8%80.6%
SWE-bench Pro77.8%53.4%57.7%54.2%
SWE-bench Multilingual87.3%77.8%
SWE-bench Multimodal59.0%27.1%
Terminal-Bench 2.082.0%65.4%75.1%68.5%

SWE-bench Verifiedは、人間のエンジニアが「解決可能」と検証した500問のソフトウェアエンジニアリング問題を解くテストです。Mythosは93.9%という驚異的なスコアを叩き出しており、他のすべてのモデルを大きく引き離しています。

推論能力(Reasoning)

テスト名Mythos PreviewOpus 4.6GPT-5.4Gemini 3.1 Pro
GPQA Diamond94.5%91.3%92.8%94.3%
USAMO 202697.6%42.3%95.2%74.4%
HLE(ツールなし)56.8%40.0%39.8%44.4%
HLE(ツールあり)64.7%53.1%52.1%51.4%
MMMLU92.7%91.1%92.6%-93.6%

特に注目すべきはUSAMO 2026(アメリカ数学オリンピック)のスコアです。前モデルOpus 4.6の42.3%から97.6%へと、2倍以上の飛躍を遂げています。GPT-5.4の95.2%をも上回る、全モデル中最高のスコアです。[2]

また、HLE(Humanity’s Last Exam:人類最後の試験)と呼ばれる、人類にとって最も難しい問題を集めたテストでも、ツール使用時に64.7%を達成。GPT-5.4 Proの58.7%を大きく上回っています。[5]

サイバーセキュリティ能力

テスト名Mythos PreviewOpus 4.6
CyberGym83.1%66.6%

CyberGymは、サイバーセキュリティの脆弱性再現能力を測るベンチマークです。Mythosは前モデルから16.5ポイントもの改善を示しています。[1]

System Card p.187のベンチマーク比較表。Claude Mythos Preview、Claude Opus 4.6、GPT-5.4、Gemini 3.1 Proの4モデルを比較している。
System Card p.187 ベンチマーク比較表 [2]

System Card p.188のベンチマーク比較表(続き)。推論能力のスコアが掲載されている。
System Card p.188 ベンチマーク比較表(続き) [2]


5. Firefox脆弱性テスト:90倍の改善

𝕏でも特に話題になったのが、Firefox(ウェブブラウザ)の脆弱性テストの結果です。[4]

Anthropic社のSystem Cardによると、Firefox 147の脆弱性を悪用するテストにおいて、前モデルのClaude Opus 4.6は全試行中わずか2回しか成功しなかったのに対し、Mythosは181回成功しました。これは実に90倍の改善です。[4]

この数字は、Mythosのサイバーセキュリティ能力がいかに飛躍的に向上したかを端的に示しています。私たちが日常的に使っているウェブブラウザにすら、AIが見つけてしまう脆弱性が存在するということです。


6. 人類を守るための「Project Glasswing」

この強大すぎる力に対抗するため、Anthropic社は「Project Glasswing(プロジェクト・グラスウィング)」という取り組みを同時に発表しました。

「Project Glasswingは、これらの能力を防御目的に活用するための緊急の試みである」[1]

公式サイトのProject Glasswing計画セクション
公式サイトのProject Glasswing計画セクション [1]

これは、世界的な巨大IT企業やセキュリティ企業が協力し、Mythosの能力を「世界の重要なソフトウェアを守るため」に使うプロジェクトです。

「Glasswing(グラスウィング)」とは、透明な羽を持つ蝶「Greta oto」の名前です。透明な羽で身を隠す蝶のように、目に見えないところに潜む脆弱性を見つけ出す、という意味が込められています。同時に、透明性を重視するAnthropicのアプローチも象徴しています。[1]

プロジェクトの主な内容

Anthropic社は、Project Glasswingに対して以下の投資を行っています。

項目金額内容
利用クレジット最大1億ドル(約150億円)パートナー企業・組織へのMythos利用料を負担
Alpha-Omega / OpenSSF寄付250万ドル(約3.75億円)Linux Foundationを通じたオープンソースセキュリティ支援
Apache Software Foundation寄付150万ドル(約2.25億円)オープンソースメンテナーへの支援

さらに、90日以内にAnthropicが学んだことを公開報告し、脆弱性の修正状況や改善内容を開示する予定です。[1]


7. 参加パートナー企業12社とその声

Project Glasswingには、世界を代表する12社がローンチパートナーとして参加しています。

企業名分野
Amazon Web Services (AWS)クラウドインフラ
AnthropicAI開発
Appleテクノロジー
Broadcom半導体
Ciscoネットワーク
CrowdStrikeサイバーセキュリティ
Googleテクノロジー
JPMorganChase金融
Linux Foundationオープンソース
Microsoftテクノロジー
NVIDIAGPU / AI
Palo Alto Networksサイバーセキュリティ

これに加え、40以上の追加組織にもアクセスが拡大されています。[1]

パートナー企業からは、以下のようなコメントが寄せられています。

「AI能力が閾値を超え、重要インフラのサイバー脅威からの保護に必要な緊急性が根本的に変わった。もう後戻りはできない」
— Elia Zaitsev, CTO, CrowdStrike [1]

「過去数週間、Claude Mythos Previewモデルにアクセスし、以前の世代のモデルが完全に見逃していた複雑な脆弱性を特定してきた。これは隠れた脆弱性を見つけるためのゲームチェンジャーであるだけでなく、攻撃者がさらに多くのゼロデイ脆弱性を見つけ、これまで以上に速くエクスプロイトを開発できるようになるという危険な変化を示している」
— Lee Klarich, CPO/CTO, Palo Alto Networks [1]


8. Mythosの料金と利用方法

Mythosは一般公開されていませんが、Project Glasswingの参加組織に対しては以下の条件で提供されます。

項目内容
入力トークン単価$25 / 100万トークン
出力トークン単価$125 / 100万トークン
利用可能プラットフォームClaude API, Amazon Bedrock, Google Cloud Vertex AI, Microsoft Foundry
初期費用最大1億ドルの利用クレジットでカバー

なお、一般ユーザーがMythosを直接利用する方法は、現時点では存在しません。ただし、Anthropic社はSystem Cardの中で「この知見は将来のClaudeモデルのリリースとセーフガードに反映される」と述べており、Mythosで得られた技術は今後の一般公開モデルにも活かされる見込みです。[2]


9. 𝕏での反応まとめ

𝕏(旧Twitter)では、Mythosの発表を受けて大きな反響が起きています。

「世界終焉しかけてるやん。AnthropicのOpus 4.6の次のモデル『Mythos』が賢すぎて、一般公開したら世界ぶっ壊れちゃうから一般公開しないよってこと? リアルターミネーターやん」
— Taishi (@taishiyade) [3]

「明確に『最も熟練した人間を凌駕できるほどのコーディング能力のレベルに達した』と書かれており、ベンチもOpusを凌駕。このレベルになるともう野に放たれるだけでセキュリティリスク」
— まつにぃ (@yugen_matuni) [5]

「少なくともベンチマーク上では、本当に久しぶりの飛躍的進歩と言っていいレベルだと思います。Anthropicが『性能が高すぎてセキュリティ危機が起きる』と懸念していたのもなるほど納得」
— 今井翔太 (@ImAI_Eruel) [5]

「Opus 4.6はFirefox脆弱性を全試行中わずか2回しか悪用できず、Mythosは181回成功。90倍の改善」
— AGIラボ (@ctgptlb) [4]

特に印象的なのは、「他の倫理観薄めの団体や国がこの領域に到達するのも時間の問題」「核爆弾持ってるけど使ってないし、自制心だけでhumanityキープできるんかね?」という指摘です。[3] AIの安全管理は、もはや一企業の問題ではなく、人類全体の課題になっています。


10. まとめ:AIの進化は「次のフェーズ」へ

Anthropicの「Claude Mythos Preview」の登場は、AIの歴史において重要な転換点です。ここまでの内容を整理すると、以下のようになります。

ポイント内容
何が起きたかAnthropicが史上最強のAIモデル「Mythos」を発表
何がすごいか27年間見つからなかったバグを発見、500万回のテストをすり抜けたバグも発見
なぜ公開しないかサイバーセキュリティ能力が人類を超えており、悪用リスクが高すぎる
どう対処するか世界12社のIT巨大企業と連携し「Project Glasswing」で防御に活用
投資規模最大1億ドル(約150億円)の利用クレジット + 400万ドルの寄付

これまでのAIは「便利なアシスタント」でしたが、Mythosは「放置すれば社会を破壊しかねないほどの力を持った存在」になりました。だからこそ、一般公開を見送り、世界のトップ企業が協力して「盾」として使う道を選んだのです。

AI初心者の方も、これからは「AIがどれだけ便利か」だけでなく、「AIの強大な力をどう安全に管理していくか」という視点を持つことが重要になってきます。

Anthropic社のCEO Dario Amodeiは、米国政府関係者とも継続的に協議を行っており、AIの安全管理は国家安全保障の問題としても位置づけられています。[1]

SF映画のような未来は、もうすでに始まっています。


参考文献

[1] Anthropic. “Project Glasswing: Securing critical software for the AI era”. https://www.anthropic.com/glasswing

[2] Anthropic. “Claude Mythos Preview System Card” (244ページ). https://www.anthropic.com/claude-mythos-preview-system-card

[3] Taishi (@taishiyade). 𝕏投稿. https://x.com/taishiyade/status/2041660546752376898

[4] AGIラボ (@ctgptlb). 𝕏投稿. https://x.com/ctgptlb/status/2041666524306677825

[5] まつにぃ (@yugen_matuni). 𝕏投稿. https://x.com/yugen_matuni/status/2041633602476380258

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!

コメント

コメントする

目次