米政府が輸出管理対象に指定、アンソロピック最新AIの提供停止
アンソロピックの最新AI「Claude Mythos(クロード・ミュトス)5」は、サイバー攻撃に近い高度な作業で高い性能を示したことを受け、米政府が輸出管理対象に指定した。これを受け、同社は米国人を含む提供を停止した。日本企業や国産AIへの注目も強まっている。
ミュトス5の性能
ミュトス5は米国時間9日に公表された。12日に米政府が輸出管理対象に指定したため、アンソロピックは即日で提供を止めた。開発各社は、広く使われる指標に基づく性能試験を公表することが多く、今回は各社のモデル公表日に合わせて公開された試験結果を比較した。
とりわけ差が出たのは、システム向けの大規模なコードを読み込み、バグを修正する能力を測る「SWE-ベンチpro」だった。米スケールAIが公開するこの試験では、ミュトス5の正答率は80.3%に達した。一方、オープンAIの最新AI「GPT-5.5」は58.6%、グーグルの「Gemini3.5フラッシュ」は55.1%だった。一般に正答率の差が5%程度あれば性能差が見え始めるとされ、20%近い差は大きい。
ブラウザやアプリを操作して作業する能力、端末からシステム環境を構築する能力を測る試験でも、ミュトス5はGPT-5.5やGeminiを上回った。英政府機関のAIセキュリティー・インスティテュート(AISI)が実施したサイバー攻撃能力の試験では、5月中旬時点で前世代の「ミュトス・プレビュー」がGPT-5.5をわずかに上回る程度だったが、今回は複雑な作業を処理する力で差が広がった。
人間なら6〜20時間、あるいは数日かかるような長時間の作業でこそ、ミュトス5の優位が目立つ。こうした粘り強く複雑なタスクを続ける能力は、現実のサイバー攻撃の精度向上につながりかねず、AIモデルの危険性を見極める重要な指標とされる。
提供停止と国産AIの存在感
ミュトスに安全対策を加えて9日に一般提供を始めた「Claude Fable(クロード・フェイブル)5」も、12日に提供を取りやめた。これに対し、4月公表の「ミュトス・プレビュー」については提供状況が明らかにされていない。ただ、日本の3メガバンクや日立製作所、トレンドマイクロなどがアクセス権を得ており、国内企業からは「プレビューは使えている」との声もある。
米政府が輸出管理制度に基づく対応を指示した背景には、ミュトス5のサイバー対策能力がオープンAIやグーグルを大きく上回る水準に達したとの判断があるもようだ。敵対国に悪用されれば安全保障上の脅威になり得るとみている。
アンソロピックのダリオ・アモデイ最高経営責任者(CEO)は、中国のAIも6〜12カ月後にはミュトスに追いつくとの見方を示しており、AIの進化は速い。オープンAIは22日、サイバーセキュリティー能力に特化した「GPT-5.5サイバー」を更新し、サイバー攻撃能力を測るテストの1つ「サイバージム」でミュトス5をわずかに上回ったと発表した。
日本では、Sakana AI(サカナAI、東京・港)が22日に一般提供を始めた「Sakana Fugu(サカナ・フグ)」が、プログラミング分野でグーグルなどの最新AIを上回る性能を示した。複数のAIモデルを切り替えて使えるのが特徴で、米企業の先端AIが禁輸対象になった場合でも継続利用しやすい。米国のAI提供停止に備え、国産AIの重要性は一段と高まっている。
この記事が役に立ったら、ぜひシェアしてください。