著者:Frank Fu、IOSG。2023年にDavid Cahnが提起したそのギャップは、トレーニング側では決して埋められませんでした。推論側で埋められ、市場はここ数週間でようやくそれを価格に織り込み始めました。Nvidiaが「サービストークン」を中心に決算の口径を再編成し、CerebrasがIPOで20倍の過剰申込を獲得したことで、ボトルネック論争は終結し、真の問題は次のものになりました。推論が希少資源になったとき、価値はコンピューティングスタックのどの層に沈殿するのか。
一、GPUに追随する:2000億ドルの問題から6000億ドルの問題へ
2023年、SequoiaのDavid Cahnは、AI構築全体に影を落とす「2000億ドルの問題」を提起しました。GPUを1ドル購入するごとに、データセンターでの電力供給に約1ドルを追加で費やす必要があるため、GPUの年間CapExは、最終的に約2000億ドルの収益を生み出して初めて資本を回収できることを意味します。AI収益について非常に寛大な仮定をしても、彼は「投資」と「エンドユーザーが実際に支払う金額」の間に1250億ドル以上のギャップがあることを発見しました。懸念は明白でした。GPUは、実際の需要を超えて過剰に構築されているのです。
1年後、そのギャップは縮小するどころか拡大しました。Cahnは2024年の続編で、超大規模ベンダーのCapExの膨張に伴い、それを「6000億ドルの問題」として再定義しました。弱気論は、見慣れた形に収束します。過剰構築が供給過剰を引き起こし、過剰が資本を燃やすのです。両方の記事は、同じことを問うています。誰がこのギャップを埋めるのか?答えは「トレーニング」側の帳簿には決して現れませんでした。それは推論側に現れ、市場はここ数週間でようやくそれを価格に織り込み始めました。
二、Cerebras IPOと推論の圧迫
Cerebrasは木曜日に上場しました。今回のIPOは20倍の過剰申込を獲得し、水曜日の最終的な値上げのほぼ2倍の価格で設定されました。需要は「次のNvidiaキラー」への賭けから来るのではなく、より単純な事実から来ています。市場は、AIにおける真のボトルネックはトレーニングではなく推論であると認識し始めたのです。Cerebrasの得意技は、推論を非常に高速にするチップアーキテクチャです。トレーニングではなく、推論です。これがウォール街を興奮させている点です。
推論市場は定期的であり、使用量とともに拡大します。Claudeが質問に答えるたびに、エージェントがタスクを実行するたびに、コンピューティング能力が消費されます。トレーニングは一度しか発生しませんが、推論は決して止まりません。J.P. Morganは推論市場の規模をトレーニングの10倍から50倍と推定しています。マシンが他のマシンから指示されたタスクを実行し始めると、つまりエージェント的な拡張では、推論需要はユーザー数ではなくコンピューティング能力自体とともに拡大します。
三、Nvidiaの再描画:推論がヘッドラインを飾る
Cerebrasが市場の覚醒だとすれば、Nvidiaの最新四半期決算はサプライチェーンの頂点からの確認です。最新の決算説明会で、Jensen Huangは暗黙の了解だった言葉をはっきりと述べました。AI需要は放物線状に増加していると。理由は簡単です。エージェントAIが到来したのです。主流AIは、一度限りの推論から、論理的推論を経て、自分でツールを呼び出し、タスクを整理するエージェント段階に入りました。Huangは、「トークンは今や収益を生み出している」と述べました。AI時代において、コンピューティング能力は収益と利益です。これは業界全体を再構築しました。
トレーニングはモデルを構築するための一回限りのコストであり、推論はそれを実行するための定期的なコストです。そして現在、ボトルネックは推論にあり、トレーニングにはありません。Nvidiaはこの判断を自社の決算口径に書き込みました。それは今や、一つのプラットフォームではなく、データセンターとエッジコンピューティングの2つのプラットフォームで開示されています。データセンター(当四半期は約750億ドル、前年比+92%)はさらに、ハイパースケール(約380億ドル、前期比+12%)とACIE、すなわちAIクラウド、産業、企業(約370億ドル、前期比+31%)に細分化されました。全く新しいラインはエッジコンピューティングです。64億ドル、前年比+29%で、エージェントAIと物理AIが実際に動作するエンドポイント、例えばPC、ワークステーション、AI-RAN基地局、ロボット、自動車をカバーしています。
エッジは現在も総収益の8%未満を占めていますが、Nvidiaはそれをデータセンターと同等の「第二のプラットフォーム」に引き上げました。このシグナルは、推論が2つの戦線に分裂していることを示しています。データセンター内のクラウド推論と、エッジ側のエンドポイント推論です。AIは物理世界で見て、移動し、行動する必要があります。ロードマップは同じ論理に従っています。第3四半期から出荷されるVera Rubinは、推論スループットがBlackwellの最大35倍に達します。Huangはまた、エージェント負荷向けに構築されたVera CPUに、全く新しい2000億ドルのTAMを提示しました。最先端のモデル企業のすべてが、初日から全面的に移行すると予想されます。地球上で最も時価総額の高い企業が「サービストークン」を中心に財務開示を再編成する時、ボトルネック論争はすでに決着しています。
この記事の残りの部分は、推論(トレーニングではなく)が希少資源になったとき、誰が価値を捉えるのかを議論します。まず範囲を説明します。これらの2つの戦線の中で、この記事はクラウド推論、すなわち外部にAPIトークンサービスを提供する、レンタルされたデータセンターGPUについて議論します。エンドポイント推論は、デバイス自体内部のローカルチップ(NvidiaのJetson、RTX、Drive、AI-RAN)で実行され、その下のGPUレンタルおよび集約スタックを全く通過しません。ここでは、これを推論経済全体を拡大し、ボトルネック論点を裏付ける追い風と見なしてください。HyperbolicとVeniceが存在する市場ではなく、これら2社は完全にクラウド側のライン上にあります。
四、圧迫はすでに到来している
Anthropicは炭鉱のカナリアです。使用量が事前に設定されたキャパシティをはるかに超え、Claudeが「脳葉切除」されたという苦情が全ウェブを駆け巡りました。これには、制限された応答、遅くなった推論、圧縮されたコンテキストウィンドウが含まれます。解決策はむき出しのコンピューティング能力です。2026年5月、AnthropicはSpaceXからColossus 1データセンター全体、22万枚以上のNvidia GPU、300メガワット以上を引き継ぎ、それをトレーニングではなく推論専用にしました。このキャパシティは、一連の制限変更を解除し、そのたびにシグナルを発しました。
5月6日、AnthropicはClaude Codeの5時間制限を倍増し、ピーク時の制限を解除し、OpusのAPIレート制限を大幅に引き上げました。5月13日、Claude Codeの週制限をさらに50%引き上げました(7月13日まで)。その後、6月15日から、それは「寛大さ」とは反対のことを行いました。エージェントおよびプログラムによる使用(Agent SDK、ヘッドレスモードclaude -p、CIパイプライン)をフラットサブスクリプションから切り離し、独立して測定されるクレジットプール(月額20〜200ドル、API価格で課金)に入れました。最後のステップは、議論全体を1つのアクションに凝縮しました。エージェントは、フラットサブスクリプションの設計許容能力をはるかに超える速度で推論を消費するため、本来の「定期的なコスト」として価格設定する必要があるのです。トレーニングは一回限りの資本支出です。推論は、各新規ユーザー、各新規エージェントとともに複利で蓄積される、定期的な運用コストです。
五、このスタック:6層、1つのボトルネック
すべてのAIアプリケーションは、TSMCのウェハー工場から始まりAPIエンドポイントで終わるサプライチェーン上に位置しています。ほとんどの企業はそのうちの1層しか所有していません。Nvidiaはシリコンを所有し、CoreWeaveはベアメタルを所有し、Together AIは推論最適化を所有し、OpenRouterはモデルAPIルーティングを所有しています。例外は1社だけです。
六、Hyperbolic:唯一3層にまたがる企業
Hyperbolicは2025年6月にオンデマンドGPU市場を立ち上げました。最初の数ヶ月で、開発者数は20万人を超え、採用企業は最先端のAIラボ、検索、および大規模コンシューマープラットフォームをカバーしました。興味深いのはそのアーキテクチャです。Hyperbolic自身はGPUを一切所有していません。すべてのカードはneocloudとデータセンター、CoreWeave、Lambda Labs、Nebius、および余剰キャパシティを保有する小規模オペレーターから来ています。これは弱点のように聞こえますが、実際には堀です。
GPUの供給側と消費側の間に位置することで、Hyperbolicは他者が見えないリアルタイムデータを見ることができます。誰が、どの価格で、いつ、どのGPUを購入しているかを知っています。供給過剰が公になる前にそれを見て、需要急増が市場を襲う前にそれを見ています。現在、堀そのものがこのマルチクラウド集約です。Hyperbolicは、数十の独立したクラウドとデータセンターからの断片化されたキャパシティを、標準化された統一プールに縫い合わせ、開発者が各オペレーターと交渉したり、多数のアカウントを管理したりすることなく、どこでも最も安い利用可能なGPUをレンタルできるようにしています。接続するクラウドが多いほど、流動性は深まり、価格データは豊富になります。
さらに、チームはこれらのデータを使用してGPU価格曲線を作成し、最終的には自己資本を投入して需給を平滑化し、物理的なコンピューティング能力のマーケットメーカーの役割を果たすことを模索していますが、この目標はまだ初期段階です。現在実際に複利で蓄積されているのは集約層です。これがフライホイールです。より多くのクラウドに接続→より多くの集約された供給→より深い市場とリアルタイム価格データ→より賢いルーティング。Hyperbolicは、GPUレンタル層、デプロイ層、モデルAPI層のすべてにまたがる唯一の企業です。
七、Veniceという鏡
Veniceは、推論経済のアプリケーション層における最も明確な現れであり、Hyperbolicの位置との有用な対比です。これはプライバシーを優先した推論アプリケーションです。OpenAI互換のAPIセットと、コンシューマー向けのサブスクリプションにより、約75のモデルにリクエストをルーティングします。重要なのは、Venice自身は意味のあるコンピューティング能力を所有していないことです。それは、公開されていないGPUパートナーや機密コンピューティングサプライヤーからレンタルし、最先端ラボに透過処理のために支払いを行っているため、実際の売上原価はSaaSホスティングではなく、推論コンピューティング能力です。
Veniceが実際に販売しているのはプライバシーです。ここで言う「プライベート化」とは、パブリックコンピューティング能力をプライベート資産に変えることではなく、商品化された推論に保証の層を被せることです。データを保存しない、トレーニングに使用しない、リクエストを匿名化する。基盤となるコンピューティング能力は汎用品であり、付加価値は、このプライバシー包装によって支えられています。Veniceの粗利益=サブスクリプション価格−下流に支払う推論コストであり、裸のAPI価格よりも多く受け取れる部分は、ほぼすべてこのプライバシープレミアムによって支えられています。これは現実のビジネスですが、薄利のビジネスであり、その経済性は購入したコンピューティング能力に制約されます。これがHyperbolicがその上に位置する理由です。Veniceがガソリンスタンドだとすれば、Hyperbolicは製油所です。
八、なぜ今これが重要なのか
Nvidiaは「サービストークン」を中心に財務を再編成しました。CerebrasのIPOは、市場が推論がボトルネックであることを理解していることを証明しました。Anthropicはキャパシティを求めて奔走しており、それが現実の問題であることを証明しています。エージェントAIと物理AIは、クラウドとエンドポイントの両方のラインにわたって、需要を数桁増幅させるでしょう。そしてそれは、「6000億ドルの問題」の輪を反対側から閉じます。Cahnの弱気論、すなわち過剰構築、そして過剰は、最終的に証明される可能性が高いです。しかし、過剰はまさに、軽量な集約プレイヤーにとって最適な状況です。GPU価格が下落し、供給が数十のクラウドに断片化分散されると、ハードウェアを一切所有せず、すべてのワークロードを最も安い利用可能なカードにルーティングするプレイヤーが価格差を稼ぐでしょう。
Hyperbolicは過剰をロングするものであり、ショートするものではありません。最終的に勝利する企業は、最も多くのGPUを所有する企業ではなく、どのGPUがどこで、いくらで利用可能かを教えてくれ、すべてのワークロードを最低コストで実行できる場所にルーティングしてくれる企業になるでしょう。Hyperbolicは、そのような会社を構築しています。GPUを所有せず、純粋なソフトウェアで、3層にまたがり、しかし推論の究極のコンピューティング能力の集約層を構築しています。[IOSG]
推論がボトルネックとなる時:AIの6000億ドル問題における暗号通貨の機会
暗号通貨市場におけるAIへの関心は、主にミームコイン、液体ステーキング派生商品、AI駆動取引ボットに集中してきました。一方で、ほとんどの市場参加者が見落としている、基盤となるAIインフラにおいて根本的な変化が起きています。IOSGのFrank Fuの分析が示す重要な転換点:AIのボトルネックは明確にトレーニングから推論へと移行しており、市場が価格に反映し始めたばかりの6000億ドルの機会を創出しています。
トレーニングから推論への転換
David Cahnの「2000億ドル問題」は、ハイパースケールベンダーの資本支出が実際のエンドユーザーの収益を上回り続けるにつれて、「6000億ドル問題」へと膨張しました。市場が当初、GPUの過剰供給が供給過剰と資本破壊につながると懸念した一方で、このギャップを埋める本当の答えはトレーニング側ではなく、推論側から現れました。
これは単なる学術的な議論ではありません—市場の最重要プレイヤーによって実証されています。Nvidiaが「サービストークン」として財務諸表を再編成し、CerebrasのIPOが20倍の超応募となったのは偶然ではありません。これらは、ウォール街と半導体業界が今や推論を真のボトルネックとして認識していることを示しています。Jensen Huangが述べたように、「トークンは現在収益性がある」というのは、計算能力がAPIサービスを通じて直接的に収益化可能になったという驚くべき認識です。
推論市場は基本的にトレーニング市場とは異なります—それは一度きりではなく継続的であり、各ユーザーのインタラクションやエージェントの展開につれて拡大します。JPモルガンは、トレーニング市場より10倍から50倍大きいと推定しており、AIが基本的な推論からエージェントベースのオーケストレーションに移行するにつれて、需要曲線はほぼ垂直になります。
推論スタックにおけるトークン化の機会
暗号通貨投資家にとって、この転換はいくつかの魅力的な機会をもたらします:
1. 計算リソースのトークン化
最も直接的な含意は、計算リソースのトークン化の可能性です。Nvidiaの「サービストークン」というフレームワークは、GPU容量に対する請求権を表す金融商品が現れることを示唆しています。暗号通貨では、これらは以下のように発展する可能性があります:
– GPU容量の先物または永久スワップ
– 分散型GPUファームの株式を表すトークン
– アイドルな計算リソースを最高の入札者に割り当てるステーキングメカニズム
2. 分散型GPUマーケットプレイス
GPUリソースの分散型マーケットプレイスを創出するプロジェクトは、市場がますます断片化するにつれて大きな価値を捉えることができます。ハードウェアを所有せずに複数のクラウドプロバイダーから容量を集約するHyperbolicの成功は、アグリゲーターモデルの力を示しています。暗号通貨ネイティブな実装では以下が可能になります:
– 個人がアイドルなGPU容量を収益化できるようにする
– 計算リソースのための透明性のある価格決定メカニズムを提供する
– GPU容量の流動性市場を創出する
3. AIエージェントオラクルとデータ市場
AIエージェントが他のエージェントのためにタスクを遂行し始めるにつれて、信頼性の高いリアルタイムデータの必要性が重要になります。以下を提供する暗号通貨プロジェクト:
– AIデータのための分散型オラクルネットワーク
– トレーニングと微調整のためのトークン化データセット
– 感度の高いAIトレーニングデータのためのプライバシー保護データ市場
は不可欠なインフラになる可能性があります。
4. トークンインセンティブを通じたルーティングの最適化
記事は正しく特定しているように、勝者は最も多くのGPUを持つ企業ではなく、利用可能な最も安いリソースにワークロードをルーティングできる企業になります。これは以下の機会を創出します:
– プロバイダー間でワークロードを最適化するトークンベースのルーティングプロトコル
– 断片化された計算市場における価格発見のメカニズム
– アイドル容量の利用に対するインセンティブ構造
リスクと課題
魅力的なテーゼにもかかわらず、いくつかのリスクを考慮する必要があります:
中央集権リスク:暗号通貨コミュニティが分散型ソリューションを構築する一方で、基盤となるハードウェアは依然として少数の大手プロバイダーの手に集中しています。この中央集権は、分散型アプローチの有効性を制限する可能性があります。
市場のタイミング:市場は推論の機会を価格に反映する点で先走っている可能性があります。Cahnが提示するベアケース—過剰な供給が供給過剰につながる—が依然として現実化し、インフラプロバイダーに短期的な逆風をもたらす可能性があります。
規制の不確実性:AIがインフラにとってより重要になるにつれて、規制の監視は増加する可能性があります。AIと暗号通貨の交差点で活動するプロジェクトは、独自の規制的課題に直面する可能性があります。
技術的陳腐化:AI開発の速さは、今日の最適なソリューションがすぐに時代遅れになる可能性を意味します。プロジェクトは価値提案を維持するための継続的な革新を必要とします。
Hyperbolicの位置付けとアグリゲーターの堀
分析は、ハードウェアを一切所有せずにGPUリース、デプロイ、モデルAPIレイヤーにまたがるHyperbolicを興味深いケーススタディとして挙げています。この「資産軽量」アプローチは、市場がより断片化するにつれて強力な堀を創出します。
暗号通貨投資家にとって、これは最も価値のあるプロジェクトが物理的インフラを構築するものではなく、既存のリソースの配分を最適化する経済層を創出するものになる可能性があることを示唆しています。真の価値はリソースの所有にあるのではなく、既存リソースの調整と最適化にあります。
結論
トレーニングから推論への転移は、AIスタックにおける価値の根本的な再配列を表しています。暗号通貨投資家にとって、これは計算リソースの効率的な配分を可能にする金融および経済層を構築する機会を創出します。最も有望なプロジェクトは、断片化された市場で流動性を創出し、プロバイダー間でのルーティングを最適化し、計算容量のトークン化を可能にするものになるでしょう。
推論の絞り込みが加速し、AIエージェントが指数関数的なレートでリソースを消費し始めるにつれて、暗号通貨市場がこの新しいパラダイムの金融インフラを創造する役割はますます重要になります。6000億ドルの問題は、最終的により多くのハードウェアを構築することではなく、既存リソースのためのより効率的な市場を創造することによって解決される可能性があります。