Anthropic AI開発停止を提言 AI自己改良とAGIリスクに警鐘

2026/06/05 更新: 2026/06/05

米サンフランシスコに本社を置く人工知能(AI)企業Anthropicは6月4日、声明を発表し、世界の主要なAI研究機関に対し、最先端AIシステムの開発ペースを落とす、あるいは一時停止することを検討するよう呼びかけた。同時に、AIは「再帰的自己改良(Recursive Self-Improvement)」の能力に徐々に接近していると警告した。  

これは、人間の介入をほとんど必要とせずにAIシステムが自ら性能を向上させることを意味し、社会に重大なリスクをもたらす可能性があるとされる。  

AnthropicがAI開発停止を呼びかけた背景  

同社が発表した声明によると、研究者らは「最先端AI開発の減速または一時的な停止」が実現すれば、社会的ガバナンスや安全性研究が技術進展の速度に追いつく助けになると考えている。  

この声明は、Anthropic研究所の責任者マリナ・ファヴァロ氏と、同社共同創業者ジャック・クラーク氏が共同で執筆したものである。  

声明では、現在のAIモデルの能力が非常に速いペースで進歩しており、「再帰的自己改良」に向かいつつあると指摘する。すなわち、AIが自律的に自身のシステムを最適化・更新し、大量の人手を必要としなくなる方向にあるという。  

再帰的自己改良とは何か

「再帰的自己改良」のメカニズムは、AIが人間の知能の水準を超え、「知能爆発」を引き起こす中核的要因とみなされており、Google DeepMindやAnthropicなどの主要研究機関における重点分野となっている。  

Anthropicは、現時点ではこの状況はまだ発生していないとしつつも、その到来は「多くの政府や機関の予測よりも早い可能性がある」との見方を示した。  

また同社は、「AI開発の各段階において、人間の役割が着実に縮小していることを示唆する証拠がある」と指摘している。  

さらに、仮に世界的にAI開発の一時停止を実現する場合には、米国や中国といった主要国、および複数の巨大テック企業の共同参加が不可欠であり、同時に検証可能な監督体制の構築も必要であると強調した。  

業界内の批判と利害対立  

Anthropicは近年、ClaudeシリーズのAIモデルの投入によって急速に台頭し、OpenAIなどとの競争の中で市場の注目を集めている。  

報道によれば、同社は最近、新たな資金調達を完了し、企業評価額は約1兆ドル(約150兆円)に達したとされる。また、すでに秘密裏に上場手続きを開始したとの見方もある。  

一方で同社は、長年にわたりAIの安全性を強調しており、業界内で議論を呼んできた。  

ベンチャー投資家であり、トランプ政権で非公式顧問を務めたデイヴィッド・サックス氏は、Anthropicを批判し、「安全」を名目に、実際には規制を通じて競合の発展を抑制しようとしていると指摘した。  

また一部の批評家は、同社が自社の最新AIモデルの潜在的リスクを繰り返し強調すること自体が、結果的にマーケティング効果を生んでいる可能性もあるとみている。  

クロード・ミュトスが示したリスクと能力

Anthropicは2026年4月、最先端で極めて秘匿性の高いプレビュー版モデル「Claude Mythos(クロード・ミュトス、またはMythos Preview)」を発表した。このモデルは非常に強力で、セキュリティ分野の専門家をも驚かせる自律的なサイバーセキュリティ能力を示したとされる。  

テストでは、クロード・ミュトスが複数のゼロデイ脆弱性(Zero-day vulnerabilities)を自律的に発見し、連鎖的に悪用できることが確認された。その脆弱性の発見および悪用能力は、従来のAIモデル(Claude 4.6 Opusなど)を大きく上回るとされる。  

さらに、主要なオペレーティングシステムやブラウザにおいて、数十年にわたり見過ごされてきたセキュリティ欠陥を発見したとされ、人間の専門家や従来の自動化ツールでも検出されなかった問題を特定したという。  

このモデルが悪意あるハッカーによって攻撃に転用され、壊滅的なサイバー攻撃を引き起こす可能性が懸念されたため、Anthropicはミュトスを一般公開しない方針を採った。  

その代わり、「Project Glasswing」と呼ばれる計画を通じて限定的に提供し、このAIモデルを少数の特定機関のみに開放している。当初は約40〜50社であったが、2026年6月時点では約150社に拡大した。  

提供先には、大手テクノロジー企業やサイバーセキュリティ機関、重要インフラ関連組織(マイクロソフト、アップル、アマゾン、CrowdStrike、欧州連合サイバーセキュリティ機関ENISAなど)が含まれ、防御目的での脆弱性修復に活用されている。  

Anthropicのこの対応については、一部の専門家から、技術力を示すための戦略的措置との見方も出ている。  

AIの未来像を巡る分裂した見解

現在、AI業界では、人工知能が「汎用人工知能(AGI)」に近づいているかどうかを巡り、見解が大きく分かれている。  

AGIとは、人間の知能に匹敵、あるいはそれを超え、あらゆる知的作業を理解・学習・実行できる理論上のAIシステムを指す。  

AI分野の著名な研究者であり、Meta Platformsの元チーフAIサイエンティストであるヤン・ルカン氏は、現在の大規模言語モデルが真に人間レベルの知能に到達するのは難しいとの見解を示している。  

同氏はこれまで、現在のAIの知能は「猫のレベル」に近く、人間には遠く及ばないと表現している。  

一方で、AnthropicのCEOであるダリオ・アモデイ氏は、AIが社会的不平等を拡大させ、大量の初級ホワイトカラー職を代替する可能性について、繰り返し警告してい。

Anthropicは、今後数カ月以内に政策立案者や研究者、他のAI企業と協議を行い、AIの急速な発展に伴うリスクに対処するための国際的な協調メカニズムの構築を検討するとしている。

高杉
関連特集: アメリカ社会