著者: 51CTO チーフエディター
オリジナル: https://mp.weixin.qq.com/s/YthTgJEOlrXtL8NGeQz3TA
GMI Cloud による翻訳、読みやすいように編集
アレックス・イェーは、自分のスタートアップであるGMI Cloudを「深海で生き残るために奮闘するサメ」にたとえて、過去2年半の起業家としての道のりを振り返りました。海の奥深くには、目に見えないところに隠れた危険が潜んでいます。そして、その周りを航行することは、生き残り、前進するためのサメの日々の戦いとなっています。
アレックスは、2023年に設立されたAIネイティブクラウドプロバイダーであるGMI Cloudの創設者兼CEOです。彼にとっては2度目のスタートアップです。GMI Cloudを設立する前、アレックスはアジア太平洋地域の大手プライベートエクイティおよびベンチャーキャピタル会社で取締役を務めていました。また、暗号通貨とブロックチェーンの分野で最年少のパートナーでもあり、AI関連の投資を100件以上経験しました。
進歩が日々起こり、不確実性が当たり前であるAIのような分野では、このメタファーは特に適切だと感じます。それでも、アレックスが言うように、現実はもっと異常なことが多いのです。
2年半前、アレックスはGMIクラウドを立ち上げるために米国に移住しました。多大な努力を経て、500 ヘクタールを超える土地と 100 メガワットの発電所を確保し、新たな AI インフラストラクチャー・ベンチャーの始まりとなりました。わずか 4 か月で、彼は次の 4 つの大きなマイルストーンを達成しました。
- Google Xから技術専門家を募集しました
- グローバルなソフトウェア展開プラットフォームを構築
- 国際データセンターを建設
- 安全なアンカー顧客
そして、それはほんの始まりに過ぎませんでした。「AI が長期的にどのようなものになるかは予測できません」と Alex 氏は言います。「しかし、揺るぎない空母のような、10 年続くトゥルーノースが必要です。」
DeepSeek R1のリリース後、2025年初頭までに、世界中のユーザーがこのモデルを試そうと急いでいました。GMI クラウドは H200 ハードウェアを使用して DeepSeek-R1 を迅速にデプロイ、適応、最適化しました。需要が急増し、アレックスの電話は鳴り止みませんでした。GMI Cloud は現在、ハイエンドハードウェアを使用して AI 推論のパフォーマンスとトークンのスループットを向上させることに重点を置いています。
今年の第1四半期に、GMI Cloudの収益は前年比で3倍になりました。この成長により、「推論時代のユーザーは AI クラウドサービスに何を求めているのか」という重要な疑問が生じます。GMI クラウドはグーグル、マイクロソフト、アマゾンのような巨大企業とどのように競争できるのか?インフラストラクチャーとアプリケーションの双方で何が変わっているのか?
アレックスと80分間の会話を交わして調べました。

慎重な準備から戦闘まで
技術革新は、特にAIにおいて、短期的には誇大宣伝され、長期的には過小評価される傾向があります。スタートアップ企業にとって最も難しい試練は、成長前の静かな時期を乗り切ることです。
DeepSeek R1がローンチする数か月前、アレックスは戦略的な判断を下しました。GMI Cloudは堅牢な推論エンジンを迅速に構築する必要がありました。後から考えると、それは避けられないことでした。「ビッグモデルはすでに十分良かった。航空会社のコールセンターでは AI カスタマーサービスが使用され、アプリでは即時翻訳が行われていました。次のステップは明らかにエッジ展開とローカル展開でしたが、これには超低レイテンシーが必要です。」
彼は3つの重要な目標を設定しました: オートスケーリング、 グローバルスケーリング、および ホットスワップ。最初の 2 つは簡単ですが、なぜホットスワップが必要なのでしょうか?なぜなら、推論では、マシンのダウンタイムは大きな問題になるからです。ホットスワップは即時の機械交換により信頼性を確保します。
3月、GMI Cloudは自社開発の推論エンジンクラウドプラットフォームを立ち上げ、99.995%の稼働率を実現しました。
この好調なスタートは、過去6か月で報われました。2月にDeepSeek R1が爆発的に普及したとき、顧客の需要はほぼ完全に推論に変わりました。
需要とともに新たな圧力が加わりました。AMDのようなハードウェアメーカーはパートナーに連絡を取りましたが、アレックスは断りました。「私たちはクラウド企業であり、ハードウェアベンダーではありません」と彼は言います。リソースが限られているため、GMI Cloudは多様化ではなく規模に焦点を当てる必要があります。
「海外ではDeepSeek R1が優勢で、H200が最適です。お客様は高性能な推論を必要としています。サポートするチップの種類が多すぎると、速度が低下します。私たちがCoreWeaveと同じくらい大きくなったら、多様化を再検討するつもりです。」
エンジニアリングチームは現在、警戒態勢に入っています。「テクノロジーは急速に変化しています。NVIDIA はある週に Dynamo を廃止し、次の週には新しいコミュニティペーパーが発表されるかもしれません。早急にダイジェストして導入する必要があります。」
主要顧客を探し、延々と繰り返す
そこで、仮説を立ててみました。アレックスがアプリケーションのスタートアップ企業を立ち上げるとしたら、B2B か B2C か、という仮説を立てました。
彼の答えは「B2B」です。「収益化方法が異なります。B2B にはエンタープライズサポートが必要です。B2Cは、大規模なユーザーシナリオを見つけることにかかっています。発売後のフィードバックは強く、トレンドサイクルは急速に変化しています。」
彼は、人工知能の創始者はすべて一種のスーパーヒーローであると信じており、彼の超能力はB2Bで最もよく発揮されます。
彼のプレイブックは「絶望的だけどシンプル」です。主要顧客を見つけ、絶えず話し合い、ニーズを理解し、迅速に反復し、成果を上げることです。
それでも、アレックスは世界の消費者(B2C)市場に可能性を見出しています。「中国企業は消費者向け製品でグローバル化するのが得意です。実行、プロモーション、ハードウェア統合、オープンソースが得意です。新しいオープンソースコミュニティの多くは、中国のチームが率いています。そのサポートがあれば、収益化のために独自のサイトを構築する必要すらありません。」
それがB2BであろうとC2Cであろうと、どちらも機会を提供します。たとえば、テキストから画像へ、またはテキストから動画へ:「C2Cはデザイナーのクリエイティブスタジオを強化できます。B2B はアドビと提携することも、垂直型 API を提供することもできます。」
ジェネラルエージェントへの長い道のり
なぜAIエージェントは離陸していないのですか?
アレックスは、汎用エージェントの爆発的な成長の時代はまだ到来していないと断固として結論付けました。1つは、モデルの主な領域、特に物理世界とのインタラクション能力の点で、いまだにパフォーマンスが劣っているという点です。第二に、計算コストは依然として高すぎて、真に費用対効果が高いとは言えません。また、アプリケーションシナリオ間には根強い障壁があり、プライベートデータセットが主な障壁となっています。これらのデータセットが統合されるまで、エージェントが顧客が実際に必要としている種類のサービスを提供することは困難です。
それでも、AIコーディングツール(Cursor、Windsurf)やコンテンツジェネレーターなど、ニッチなユースケースは増え続けています。
コスト面では、DeepSeekのリリース以降、オープンソースモデルが一部のクローズドソースの代替モデルよりも優れ始めています。メモリやハードウェアからモデルアーキテクチャに至るまで、AIインフラストラクチャ全体で継続的な改善が行われているため、トークンあたりのコストは着実に低下しています。より精度の低い実装とより効率的なソリューションにより、コストはさらに下がると予想されます。
シナリオ固有の障壁を突破するには、さまざまな業種の専有データを持つ企業が、各ドメインに合わせた専用のエージェントを構築できます。プロダクトエクスペリエンスが十分に充実していれば、クライアントは当然、データを委託する意欲が高まるでしょう。
「私の現在の評価に基づくと、汎用エージェント技術が本格的なブレークスルーに達するまでにはまだ長い道のりがあります」とアレックス氏は言います。AIGC やテキストから画像への生成などの分野では、いまだに最も急速な進歩が見られます。しかし、今後数年のうちに、データフライホイール効果が現れるにつれて、アプリケーションは有意義なインタラクションデータを大規模に生成し始めるでしょう。そのデータは、より強力なマルチモーダルモデルを促進し、ひいては次のブレークスルーの波を開くことになるでしょう。」
まずアクセシブルにする、次に品質、次に価格にする
データ関連の問題の責任はアプリケーション層にあり、コスト削減の負担はGMI Cloudのようなクラウドプロバイダーにあります。
トークンの価格は、特に国際的に高いままです。GMI Cloud は、プレフィル/デコード分離や伸縮自在プロビジョニングなどの手法を使用して、パフォーマンスを損なうことなくトークンのコストを削減しています。
価格競争について、アレックスは次のように率直に語っています。「まず、顧客はそれを望んでいます。 存在する。それなら彼らはそうなりたがる 良い。それなら彼らはそうなりたがる 安い。安いのに信頼性がなければ、何の価値もありません。あるいは、米国では最も安いが、顧客はアジアで事業を行っているとしても、やはり費用対効果が高くありません。」
GPT-4Oのジブリスタイルの画像生成のような最近の例は、推論の需要がいかに速く急増し、OpenAIが制限を課すことを余儀なくされるかを示しています。
では、どれくらいの速さでコストは下がるのでしょうか?
アレックスは次のように予測しています。非常に迅速です。NVIDIA などは 1 ~ 2 年のサイクルごとに、新しいアーキテクチャをリリースしています。毎回、推論コストは半減する可能性があります。5 年も経たないうちに、ゼロに近づく可能性があります。
スケーリングの法則とムーアの法則は、次の2つの傾向を示しています。
- モデルは小さく、より速く、そしてより安価になります
- チップメーカーは推論コストの削減を競い合う
クラウドプロバイダーは引き続きモデルとハードウェアを統合します。間もなく、トークンの価格がボトルネックにならなくなるでしょう。
「Shopify of AI」
2024年10月、GMIクラウドはシリーズAで8,200万ドルを調達しました。時が経つにつれ、アレックスは自分のビジョンを明確に伝える方法を開発しました。
「私たちは Shopify of AI。」
Shopifyは世界的に認められたeコマースプラットフォームであり、創業以来、起業家やインフルエンサーが迅速にオンラインストアを立ち上げ、ビジネスの夢を追求できるよう支援してきました。米国では、かつてはeBayとAmazonが市場を独占していました。これらのプラットフォームは、起業家を柔軟性に欠ける厳格なエコシステムに閉じ込めていました。Shopifyは、クリエイターに、より自律的で制御可能な代替手段を提供することで、この状況を変えました。
アレックスは GMI Cloud のミッションに類似点があると考えています。「これまで、ほとんどのイノベーションは米国の「3大企業」のクラウドプロバイダーに限定されていたため、顧客が真の付加価値のあるブレークスルーを達成することは困難でした」と彼は説明しました。「私たちは、クラウドの制御権を与えたいのです。 環境 クライアントに戻りましょう。」
GMI Cloudはどのようにしてこれを実現しているのでしょうか?製品設計の柔軟性を優先することで。このプラットフォームは、次の 3 つのコアコンポーネントを中心に構築されています。GPU インスタンス、 クラスターエンジン、および 推論エンジン—個別に購入することも、まとめて購入することもできます。クライアントは、ローカルでトレーニングされたモデルの導入、GMI Cloud の事前最適化済みサービスの使用、サードパーティプラットフォームの統合など、ニーズに応じてこれらのレイヤーを組み合わせることができます。GPU リソースでさえベンダーロックインがないため、お客様は完全な制御と自律性を維持できます。
GMI クラウドは NVIDIA GTC 2025 で、自社のサービスとしてのモデル (MaaS) レイヤーへのゲートウェイである推論エンジンを正式にリリースしました。
Alex 氏は次のように説明しています。これは ML のバックグラウンドを持たない製品チーム向けに設計されています。推論エンジンでは、ベースモデルのデバッグではなく、成長と製品に焦点を当てています。マーケットプレイスからモデルを選ぶだけです。
ニュー・フロンティアーズ・イン・ザ・フラッド
では、次は何?
GMI Cloudの3年から5年のロードマップについて尋ねられたとき、アレックスは「インターネットのAI」を構築するという野心的なビジョンを共有しました。「これは非常にエキサイティングなビジョンです」と彼は言います。「私たちは、目に見えない GPU クラウドネットワークを構築したいと考えています。これは、スタートアップ企業やエンタープライズイノベーターが AI のアイデアを実現できるようにする、サイレント・イネーブラーです。私たちは、AI分野のあらゆるブレークスルーと緊密に連携しながら、シナリオ固有の計算能力とエンジンサポートを幅広いAI研究開発のユースケースに提供していきます。私たちの目標は、AI 業界の未来を形作る手助けをすることです。ただ待って展開するのを見守るだけではありません。」
彼が28か月前に設立したGMIクラウドは、コンピューティングからストレージ、アプリケーションレイヤーまで、すべてモジュール式のフルスタックAIプラットフォームへと進化しつつあります。
「高級ホテルのように、スーツケースを持ってチェックインし、快適に暮らしましょう。部屋で気に入ったものがあれば、家に持ち帰ることができます。」
.png)

