「語られるもの」との距離 Claude Fable5をめぐる覚書

公開からわずか三日で、米政府はAnthropicの最新AIモデルFable 5を締め出した。きっかけは、投資家でもあるAmazonが持ち込んだ「ジェイルブレイク(脱獄)」の報告。その手口を、攻撃ではなく守る側の技術だと語るセキュリティ専門家もいる。何を語ってよいかは企業が、誰が語りを聞いてもいいかは国家が決めた。「安全」の名のもとで、ひとつのモデルの語りが二重に選別された、三日間の記録。
テック・デザインノート 2026.06.15
誰でも

2026年6月13日、Claude Codeの画面に短い文が出た。「選択されたモデル(claude-fable-5)に問題があります。存在しないか、アクセス権がないかもしれません。別のモデルを選んでください」[1]。Claudeのチャット画面でモデルの一覧を開くと、Fable(フェイブル) 5はグレーアウトしていて選べなくなっていた[2]。

Claudeのチャット画面でも、Fable5がグレーアウトされており選択できなくなっていた。カーソルを当てると「一時的に利用できません」のモーダル。

Claudeのチャット画面でも、Fable5がグレーアウトされており選択できなくなっていた。カーソルを当てると「一時的に利用できません」のモーダル。

API経由で返ってくる文言はこうだった。「Claude Fable 5は利用できません。Opus 4.8をご利用ください」。続けて、Claudeを開発するAI企業Anthropicの声明ページへのリンクが貼られていた[3]。

声明によれば、ことのいきさつは以下だという。

6月12日午後5時21分(米東部時間)、Anthropicは米政府から書簡を受け取った。Fable 5と、そのおおもとであるMythos 5へのアクセスを、すべての外国籍者に対して止めよ、という指令だったという。輸出を管理する規則にもとづく命令で、対象は米国外の人間に限らない。米国内にいる外国籍者も、Anthropic自身の外国籍の従業員も含む[3]。

外国籍のユーザーだけを、その場で選り分けることはできない。そのためAnthropicは、命令を守るために両モデルの提供を、全世界の全顧客に対して停止した。Opus 4.8をはじめ、他のモデルは動いたままだ[3]。公開からわずか三日後だった。書簡の差出元は商務省だと報じられている[4]。

引っかかったのは「みなし輸出」だという。軍事に転用されうる技術が海外に渡ることを防止するために設けられた、米国の輸出管理の仕組みがある。その制度には、国内にいる外国籍の人に規制対象の技術を見せたり使わせたりすること自体を、その人の母国への「輸出」とみなす考え方がある。研究室で外国籍の技術者に設計図を見せる場面を想定して作られた発想だ。これを、ネット越しに使うAIモデルに当てはめた例ではないか……と分析されている[5]。米経済誌Fortuneによれば、一般に広く使われている商用のAIモデルに対するアクセスを政府が輸出管理で止めたのは、これが初めてだとしている[6]。

書簡そのものは公表されていないが、ニューヨーク・タイムズがその文面を入手している。報道によれば、商務長官ハワード・ラトニックはAnthropicのCEOダリオ・アモデイに、両モデルを「輸出先となるすべての国・地域」へ、また非米国市民へ配布するには特別ライセンスが必要だと伝えたという。文面には「従わなければ、法律に基づき刑事・民事の罰則が直ちに科される」旨が記されていた[7]。

この種の制限は、これまで兵器システムのような技術に限って使われてきた、と同紙は指摘する。今回の措置は、政権自身が今月はじめに掲げたばかりの、AI産業には極力介入しないという方針からも外れていた。元政府関係者やセキュリティの専門家の多くが、措置の正当性そのものに疑問を呈したことが報じられている[7]。

Anthropicは、命令には従いつつ、その根拠に反対だと表明している。数億人が使う商用モデルを、狭い範囲での潜在的なジェイルブレイクを理由に回収するのは妥当でない。この基準を業界全体に当てはめれば、新しいモデルの公開はすべて止まってしまう。危険なAIを止める政府の権限は認めるが、それは透明で公正な、技術的事実にもとづく法的手続きによるべきで、今回の措置はその原則に反するという[3]。そして、見つかったのはモデル全体を破るジェイルブレイクではなく限定的な領域での抜け道だとアモデイは反論している。週末には、Anthropicの技術幹部が協議のためワシントンに入る[8]。

この対立は、突然始まったものではない。Anthropicは今年のはじめ、開発したモデルを「あらゆる合法的目的」に使わせるための契約条項を拒否した。その後、米政府は同社を国防総省の調達先として「サプライチェーン上のリスク」に指定した。Anthropicは、完全自律型兵器と国内の大量監視にモデルを使用させることはできないとし、政府の対応について法廷で争っている[9]。

告げられない制限

Fable 5がローンチされた6月9日。Anthropicは319ページにわたる文書を発表した。モデルの性能と安全対策を細かく記した公開資料で、システムカードと呼ばれる。Fortuneによれば、そこにはこう書かれていた。Fable 5は、最先端のAI開発(Fable級のAIモデルを作る作業)を検知すると、応答の質をひそかに引き下げる。モデルの応答は表面上、止まらない。だが本来の力は発揮しない。システムカードはこの措置を「ユーザーには見えない(not visible to the user)」と明記していた[6]。

こうした対策は、サイバーセキュリティや生物・化学に関する制限とは異なる。通常は、ユーザーの要求が引っかかると画面に通知が表示され、能力が一段下のOpus 4.8に切り替わる。AI開発に関する制限だけが、告げられないまま実行される設計になっていた[6]。引き下げのための手法はプロンプト(モデルへの指示文)の書き換えや、モデルの内部に手を入れるやり方だと報じられている[10]。Anthropicの計算によると、この措置が発動したのは、やり取り全体の約0.03%(およそ1万回に3回)にすぎないという。そしてそれは、利用している組織のうち0.1%に満たないごく少数(1000社に1社未満)に実施された[6]。

Anthropicの言い分によれば、この制限をかけておくことで、規約を破ってでも最先端のAIを作ろうとする相手に、Fable 5が手を貸して開発を速めてしまうのを避けられるらしい[6]。すぐに批判が生じた。元ホワイトハウス科学技術政策局顧問のディーン・ボールは、これを「隠れた妨害工作(secret sabotage)」と呼んだ[6]。非営利のAI研究団体Fast.aiを率いるジェレミー・ハワードは、Anthropicが自社の研究者には全能力を残しながら外部の研究者を絞る、その非対称を非難した[6]。Anthropicの元研究者で、AIに科学研究をさせる仕組みの開発を共同で率いたベフナーム・ネイシャブール(Behnam Neyshabur)は、がんやアルツハイマーのためのAI研究すら手伝えなくなる、と指摘している[6]。

6月11日、Anthropicはこの仕様を撤回した。公開から二日後だった。以後、AI開発に関する要求も、サイバーや生物と同じく、断る理由を示してOpus 4.8に切り替わる。見える形に変わった[10]。

「ジェイルブレイク」とはなにか

停止の理由として政府が挙げたのは、Fable 5の「ジェイルブレイク(脱獄)」手法が把握できた、というものだった。政府からの書簡には具体的な方法の記述がなく、口頭での説明のみであったという[3]。ジェイルブレイクとは、安全のための制限をかいくぐって、本来はシステムが答えないはずの内容を引き出す手口を指す。この語が、この数日で少なくとも三つの別の事態を指していた。

ひとつは、政府が問題だと指摘した手口。これは、Amazonの研究者がFableをテストして見つけ、報告書にまとめたものだった。Fableについては複数のテック企業がホワイトハウスに懸念を伝えていたが、なかでもAmazonのCEOアンディ・ジャシーが木曜の夜に送った通報が後押しとなり、停止の引き金になった[9]。

ここで気にかかるのが、Amazonの立ち位置だ。AmazonはAnthropicの主要投資家で、2026年第1四半期だけで、この持分から税引前で168億ドルの評価益を計上している。チップとクラウドの供給元でもあり、AnthropicはAmazonに今後10年で1,000億ドル超を支払う約束をしている。Amazonのクラウド部門AWSは、自社のAIプラットフォームBedrock経由でClaudeを再販してもいる。しかもAnthropicは6月1日、約9,650億ドルの評価額でIPO(株式公開)を秘密裏に申請したばかりだった[11]。米ニュースメディアのAxiosは、主要投資家であるAmazonがなぜ取引先に打撃を与えたのか疑問が残る、と書いている[9]。

政府側の言い分は、ホワイトハウスのAI顧問デイビッド・サックスが代弁している。サックスによれば、「Anthropicとアメリカ政府の双方から信頼される取引先」が、Fable 5のガードレールを破るジェイルブレイクを見つけた。(サックスは名指ししていないが、その「取引先」とは、報告を持ち込んだAmazonのことだ。)政権はAnthropicのCEOアモデイに修正かモデルの撤回を求めたが、拒まれた。やむなく輸出管理を出したのであり、直せばすぐ解除する、ボールはAnthropicのコートにある、と主張する。ただしサックスは、以前からAnthropicを繰り返し非難してきた人物でもある。サックスに言わせれば、AIの危険を大げさに言い立て、自社に有利な規制を政府に作らせようとしているのはAnthropicのほう、ということになる(regulatory capture)。この辺りは差し引いて読む必要がある[8]。

Amazonの報告書そのものを見た専門家は、それを「ジェイルブレイク」と呼ぶこと自体に異を唱えている。ジェイルブレイクとは、モデルの安全装置をかいくぐって、本来はモデルが拒むはずの出力を引き出す手口を指す。Anthropicに頼まれて報告書を検証したセキュリティ企業Luta SecurityのCEO、ケイティ・ムソーリスによれば、Amazonがやったのは、何段階かのやり取りでモデルにコードの欠陥を洗い出させ、検証用のスクリプトを書かせることだった。これはセキュリティ技術者が日常的に行う脆弱性の分析、「防御のためのプロンプティング(Defense Oriented Prompting)」だという。もちろん、こうして洗い出された弱点は、そのまま攻撃の下調べにもなる。同じやり取りを悪意の側が使っても、出てくるものは変わらない。手口そのものは、攻撃にも防御にも開かれている。論点は、その両刀の能力を、守る側に欠かせない道具と見るか、止めるべき危険物と見るかにある。同じことはOpenAIが公開しているGPT-5.5など他のモデルでも再現でき、Fableを封じても能力そのものは世界から消ない。守る側だけが道具を失う。国家防衛が目的なら、これは「自陣へのオウンゴールだ」、とムソーリスは言う[12]。

この力が守りに使われてきたことには、実例がある。Anthropicが信頼する組織にのみ先行して渡していたMythos Previewを使い、ブラウザFirefoxで知られるMozillaは、AIの助けで数百件の脆弱性を修正したと述べている[13]。Anthropic自身も、確認されたのは「限定的な領域における、汎用的でないジェイルブレイク」にすぎず、すでに知られている軽微な弱点が少数で、同じことはGPT-5.5など他のモデルでも再現可能だ、と反論している[3]。

もうひとつ、話題になっていたのはSNSの投稿だ。「解放者(Pliny the Liberator)」というハンドルネームのアカウントがある。このアカウントは、安全対策の穴を探して破ってみせることで知られている。6月10日、解放者はXで、Fable 5を破ったとポストした。

Pliny the Liberator 🐉󠅫󠄼󠄿󠅆󠄵󠄐󠅀󠄼󠄹󠄾󠅉󠅭
@elder_plinius
🚨 JAILBREAK ALERT 🚨



ANTHROPIC: PWNED 🫡

FABLE-5: LIBERATED 🦋



let's start with the 🐘...



the consensus seems to be that this has been one of the most disappointing model drops of all time, effectively preventing legitimate researchers from contributing their talents to our
2026/06/11 03:26
1445Retweet 13417Likes

複数のAIを連携させる手口で、サイバー攻撃や爆発物、覚醒剤の合成に関する出力の画面を公開し、約12万字あるとされるシステムプロンプト(モデルにあらかじめ与えられた、ふるまいを決める指示文)を、プログラムを共有するサイトGitHubに流出させた[14]。Anthropicによれば、これはジェイルブレイクではない。会話の流れで要求を押し通す手口は、多くのAIに残る昔からの弱点にすぎない。危険な領域を止める中核の防御機構は、モデル本体ではなく、それとは別に動く見張り役のAIが担っている。だから本体が断るのを突破できても、「見張り」は無効にならない。提示された例の一部は、そもそもFable 5の出力ですらなかった、とAnthropicは説明している[15]。

三つめは、真偽が不明なジェイルブレイクの噂。米ニュースメディアのSemaforは、政府が、「中国系のグループがFable 5のジェイルブレイクをしたのではないかと疑っている」ことを報じた。根拠は明らかでない。Anthropic側は、政府との会話で中国の話は出ておらず、同社は中国からのアクセスを禁じている、と述べている[16]。

これら三つの「ジェイルブレイク」が同じ事態を示しているのかは不明だ。米テックメディアのVentureBeatは、「解放者」の主張が政府の命令の引き金になったジェイルブレイクと同じものかどうかをAnthropicは明言しておらず、政府が示したジェイルブレイクの情報はきちんと文書化されていない、と指摘している[17]。

「語られるもの」へのアクセス権

米ニュースメディアAxiosの取材に、政府当局のある人物は、市場の他のモデルはMythosが達した能力水準を超えていないので同じ国家安全保障上のリスクとは見なさない、その水準を超える今後のモデルは公開前に政府を通す必要がある、と語った。別の関係者はこれを「事実上の許認可制だ」と指摘している[9]。射程は一社にとどまらない。カナダのカーニー首相は、米国からの供給に頼りすぎることの危うさを警告した[18]。フランスの元首相エドゥアール・フィリップは、AIはいまや電気やインターネットに並ぶ重要インフラであり、自分たちが制御できないインフラは他者に止められる、と語った[8]。

また、今回のやり方では、各社が政府に脆弱性を共有することをためらうようになるかもしれない。進歩研究所(Institute for Progress)の研究者ベン・マーフィーは、これは「技術のバルカン化」の一歩だと看破する。各ラボがモデルを社内に抱え込んだり、政府に脆弱性を報告することを控えたりするようになれば、安全のために透明であろうとしたAnthropicの姿勢は裏目に出る[12]。

「AIによってもたらされる力」なるものは、誰の手中にあるかで「脅威」にも「盾」にもなる。国家はそれを外国籍という線で切り分けようとした。切り分けは技術的に不可能であったため、すべての人々の手中から取り上げられた。

され、Anthropicによれば、「Fable」という名はラテン語のfabula、「語られるもの」に由来するようだ。この語はギリシャ語で「語り」や「神話」を意味するmythos(ミュトス)に通じる。中身は同じひとつのモデルで、安全策のかけ方とアクセスできる相手だけが違う。完全版がMythos、そこに恒久的な安全層をかぶせた一般公開版がFableだ。名にそれ以上の含意を込めたかどうかは、公式には記されていない[19]。

それでも、Fableが含意する「語られるもの」は、この数日間をうまく言い当てているように思えてくる。フランスの哲学者ミシェル・フーコーは『言説の領界』で、どんな社会も、何が語られてよいかを選別し、誰がその語りに参加できるかを制限することで、言説の生産を統御してきたと論じた[20]。何を語ってよいかは、安全策を規定した企業によって選別される。「危険な」会話が完治されると、秘密裏に、より弱いモデルへと振り替えられる。「語られるもの」へのアクセス権は、国家が国籍に基づいて決定した。「安全」と呼ばれているのは、語りうるものの範囲と、語りに参加できる者の範囲を、二つの権力が同時に引き直す操作にすぎない。

選択されたモデル (claude-fable-5)に問題があります。存在しないか、アクセス権がない可能性があります。

There's an issue with the selected model (claude-fable-5). It may not exist or you may not have access to it.

[1] GitHub, "[Bug] Anthropic API Error: Invalid or inaccessible model claude-fable-5 #68137", 2026年6月13日。

このエラー通知文は、さまざまな意味で、真実のように見える。

脚注

[1] GitHub, "[Bug] Anthropic API Error: Invalid or inaccessible model claude-fable-5 #68137", 2026年6月13日。

[2] GitHub, "[BUG] [Fable 5 model] is grayed out although I have a max account (individual) #68200", 2026年6月13日。

[3] Anthropic, "Statement on the US government directive to suspend access to Fable 5 and Mythos 5", 2026年6月12日。

[4] Bloomberg, "Anthropic Says US Orders Halt to Foreign Access for Fable 5, Mythos 5 AI Models", 2026年6月13日。

[5] Tech Times, "Anthropic Fable 5 Shutdown: US Export Order Forces a Global Customer Cutoff", 2026年6月12日。

[6] Fortune, "Anthropic walks back covert capability limits on Claude Fable 5, after it was accused of 'secret sabotage'", 2026年6月10日。

[7] The New York Times, "Trump Administration Reignites Its Feud With Anthropic Over Latest A.I. Models", 2026年6月14日。

[8] Fortune, "How a warning from Amazon led the White House to shut down Anthropic’s Mythos model", 2026年6月14日。

[9] Axios, "How Amazon and the White House ended Anthropic's Fable", 2026年6月13日。

[10] MLQ News, "Anthropic Reverses Secret Policy That Silently Degraded Claude for Rival AI Researchers", 2026年6月。

[11] Fortune, "Amazon and Google have billions riding on Anthropic. The IPO will finally reveal how much.", 2026年6月4日。

[12] Fortune, "'It's not a jailbreak' — Research leading to U.S. export restrictions on top Anthropic models was for defense, cybersecurity CEO says", 2026年6月13日。

[13] 9to5Mac, "Anthropic pulls Claude Mythos 5 and Claude Fable 5 following US government directive", 2026年6月12日。

[14] Cyber Security News, "Anthropic's Claude Fable 5 Alleged Jailbreak to Generate Stack Exploits", 2026年6月。

[15] SecurityWeek, "Anthropic Disputes Fable 5 AI Jailbreak", 2026年6月13日。

[16] Semafor, "White House move to limit Anthropic linked to concerns about Chinese access to Mythos", 2026年6月13日。

[17] VentureBeat, "Anthropic blocks all public access to Claude Fable 5, Mythos 5 following US government order — what enterprises should do", 2026年6月13日。

[18] Fortune, "Canadian Prime Minister Mark Carney warns U.S. restrictions on new Anthropic AI models show danger of relying too much on American providers", 2026年6月14日。

[19] Anthropic, "Claude Fable 5 and Claude Mythos 5", 2026年6月9日。

[20] ミシェル・フーコー『言説の領界』慎改康之訳、河出書房新社、2014年。

無料で「岡田麻沙のテック・デザインノート」をメールでお届けします。コンテンツを見逃さず、読者限定記事も受け取れます。

すでに登録済みの方は こちら

サポートメンバー限定
うまくなる、ということが持っている根源的なくだらなさについて
誰でも
親密さを装うLLM
誰でも
「性的ディープフェイク」の構造
誰でも
ウミウシのダンスとSNS
サポートメンバー限定
希死念慮とテクノロジー
誰でも
フィジカルAIとケアのこと
誰でも
アルゴリズムによる差別とAI政策——トランプ政権と高市政権の類似
誰でも
信頼を売る技術 トランプコインとサナエトークンが示すもの