作者: 51 技術主任總編輯
原文: https://mp.weixin.qq.com/s/YthTgJEOlrXtL8NGeQz3TA
由 GMI 雲翻譯,編輯以提高可讀性
Alex Yeh 反思過去兩年半的創業旅程,將他的創業公司 GMI Cloud 與「一隻在深海中努力生存的鯊魚」進行比較。在海洋深處,隱藏的危險隱藏在眼睛之外,並且周圍導航已成為鯊魚生存和前進的日常戰鬥。
Alex 是 GMI Cloud 的創始人兼首席執行官,這是一家在 2023 年推出的 AI 原生雲提供商。這是他的第二家創業公司。在創立 GMI Cloud 之前,Alex 曾擔任亞太地區領先的私募股權和風險投資公司的董事。他也是加密和區塊鏈領域中最年輕的合作夥伴,擁有超過 100 個 AI 相關的投資。
在人工智能這樣的領域中 —— 每天都會發生進展,而不確定性是常態 —— 比喻感覺特別適合。然而,正如 Alex 會告訴你的那樣,現實往往更加非凡。
兩年半前,Alex 搬到美國推出 GMI 雲端。經過大量努力,他獲得了超過 500 公頃的土地和一座 100 兆瓦的發電廠,這標誌著新的 AI 基礎設施企業的開始。在短短四個月內,他實現了四大里程碑:
- 從谷歌 X 招募技術專家
- 建立全球軟體部署平台
- 建立國際數據中心
- 安全的錨點客戶
而這只是開始。Alex 說:「您無法預測 AI 長遠來看如何。」「但你需要一個持續十年的真正北方,就像一艘不可搖的航空母艦一樣。」
到 2025 年初,在 DeepSeek R1 發布後,全球用戶急於嘗試該模型。GMI 雲端使用 H200 硬體快速部署、調整和優化 DeepSeek-R1。需求激增,亞歷克斯的手機不停止響鈴。GMI Cloud 現在專注於使用高端硬件提高 AI 推論性能和令牌輸送量。
今年第一季度,GMI Cloud 的收入同比增加了三倍。增長引起了關鍵問題:在推論時代,用戶對 AI 雲服務想要什麼?GMI 雲如何與谷歌、微軟和亞馬遜等巨頭競爭?基礎架構和應用程式有什麼變化?
我們和亞歷克斯坐了 80 分鐘的對話來找出答案。

從謹慎的準備到戰鬥
在短期上,科技創新往往被過度推廣,從長遠來看,尤其是在人工智能方面的評價低估。對於初創企業來說,最難的考驗是在成長前的安靜時期應付。
在 DeepSeek R1 推出前幾個月,Alex 發出了一個策略性呼籲:GMI Cloud 必須迅速建立一個強大的推論引擎。後來看,這是不可避免的。「大型模特已經夠好了。我們看到航空公司呼叫中心使用 AI 客戶服務,應用程序進行即時翻譯。下一步明顯是邊緣部署和本機部署,這需要超低延遲。」
他設立了三個關鍵目標: 自動縮放, 全球擴展,以及 熱交換。前兩個很簡單,但為什麼要熱交換?因為在推論中,機器停機是一個破壞了交易。熱交換通過即時更換機器來確保可靠性。
3 月,GMI Cloud 推出了自己開發的推論引擎雲端平台,具有 99.995% 的正常運行時間可用性。
在過去六個月中,這一頭頭開始已經得到回報。2 月 DeepSeek R1 爆炸時,客戶需求幾乎完全轉為推論。
隨著需求帶來了新的壓力。AMD 這樣的硬件製造商與合作夥伴聯繫,但 Alex 拒絕了。他說:「我們是一家雲端公司,而不是硬件供應商。由於資源有限,GMI Cloud 必須專注於規模,而不是多元化。
「深搜集 R1 在海外主導地位,H200 最適合它。我們的客戶需要高效能推論。支持太多芯片類型會使我們減慢速度。當我們像 CoreWeave 一樣大,我們將重新考慮多元化。」
工程團隊現在處於高警報模式。「技術發展迅速 —— Nvidia 可能會在一週推出 Dynamo,接下來,有一個新的社區論文。我們必須迅速消化和部署。」
尋找主要客戶並不斷地反覆
我們問了一個假設:如果 Alex 正在構建一個應用程序創業公司,他會選擇 B2B 還是 B2C?
他的答案:B2B。「他們不同的營利。B2B 需要企業支持。B2C 取決於尋找大型用戶場景。發布後的反饋很激烈,趨勢週期發展迅速。」
他相信每個 AI 創始人都是一種超級英雄,而且他的超能力在 B2B 中最有效。
他的手冊「絕望但簡單」:找到主要客戶,不斷交談,了解他們的需求,快速反覆並交付。
儘管如此,Alex 看到全球消費者(B2C)市場的潛力。「中國企業對消費產品進入全球性方面非常出色。他們在執行、推廣、硬體整合和開放原始碼方面都很強。許多新的開源社區由中國團隊領導。有了這種支持,您甚至不需要建立自己的網站即可獲利。」
無論是 B2B 還是 C2C,都提供機會。例如,文字轉圖像或文本轉視頻:「C2C 可以為設計師提供創意工作室的支持。B2B 可以與 Adobe 合作,或提供垂直 API。」
通往總代理的漫長之路
為什麼人工智能代理沒有離開?
亞歷克斯決定的結論說,通用特工的爆發時代尚尚未到來。首先,模型在關鍵領域仍然表現不佳,尤其是在與物理世界互動的能力方面。第二,計算成本仍然太高,無法真正具有成本效益。應用程式案例之間也存在持續的障礙,私人資料集是主要的。在整合這些資料集之前,代理程式將很難提供客戶實際需要的服務類型。
儘管如此,利基的使用案例正在增長,例如 AI 編碼工具(Cursor,Windsurf)和內容生成器。
在成本方面,自 DeepSeek 發布以來,開源模型甚至開始優於一些封閉源代碼替代品。隨著從內存和硬件到模型架構的 AI 基礎架構不斷改進,每個令牌的成本正在穩定下降。預計精度較低的實作和更高效的解決方案將會進一步降低成本。
至於突破情境特定的障礙,擁有各種垂直領域的專有資料的公司可以為每個網域量身打造專門的代理程式。如果產品體驗足夠強大,客戶自然會更願意委託他們的數據。
Alex 表示:「根據我目前的評估,通用代理技術在達到全面突破之前,還有很長的路要走。最快的進展仍在發生在 AIGC 和文本轉圖像生成等領域。但在未來幾年中,隨著數據飛輪效果啟動,應用程序將開始大規模生成有意義的互動數據。這些數據將推動更強大的多模式模型,從而解鎖下一波突破。」
首先讓它可以訪問,然後是質量,然後價格
對數據相關問題的責任歸於應用程序層,而降低成本的負擔則歸於 GMI Cloud 等雲端供應商。
代幣價格仍然高,尤其是在國際上。GMI Cloud 使用預填-解碼分組和彈性佈建等方法來降低令牌成本,而不會損害性能。
對價格戰爭,Alex 直接說:「首先,客戶希望這樣做 存在。然後他們希望它是 好。然後他們希望它是 便宜。如果它便宜但不可靠,那麼它是無價值的。或者,如果它是美國最便宜的,但客戶在亞洲經營,它仍然不具有成本效益。」
最近的例子,例如 GPT-4o 的 Ghibli 風格的圖像生成,顯示推論需求可以有多快速發生,強迫 OpenAI 施加限制。
那麼成本會有多快下降?
亞歷克斯預測:非常迅速。NVIDIA 和其他人每 1-2 年的週期都會發布新的架構。每次推論成本都可以減半。在五年內,它可以接近零。
縮放定律和摩爾定律指出兩種趨勢:
- 模型將變小,更快,更便宜
- 芯片製造商將爭取降低推論成本
雲端供應商將繼續整合模型和硬體。很快,代幣價格不會成為瓶頸。
「人工智慧之旅」
2024 年 10 月,GMI Cloud 在 A 系列中籌集了 82 億美元,隨著時間的推移,Alex 開發了一種清晰地傳達他的願景的方法:
「我們是 人工智慧的商品。」
Shopify 是一個全球公認的電子商務平台,自成立以來,一直致力於幫助企業家和有影響力的人快速開設網上商店並實現他們的商業夢想。在美國,這個市場曾經由 eBay 和 Amazon 主導,這些平台將企業家鎖定在硬性的生態系統中,但靈活性有限。Shopify 通過為創作者提供更自主和可控的替代方案來改變了這一點。
亞歷克斯在 GMI 雲端的任務中看到相似之處。他解釋說:「從歷史上,大多數創新都僅限於美國的「三大」雲提供商,這使客戶難以實現真正的增值突破。「我們想讓控制 環境 回到我們的客戶。」
GMI 雲如何實現這一目標?通過優先考慮產品設計的靈活性。該平台圍繞三個核心元件構建:GPU 執行個體, 叢集引擎,以及 推論引擎— 可以單獨購買或一起購買。客戶可以根據自己的需求混合和匹配這些層:部署本地訓練的模型,使用 GMI Cloud 的預先優化產品,或整合第三方平台。即使 GPU 資源也沒有供應商鎖定,確保客戶保持完全控制權和自主性。
在 NVIDIA GTC 2025 上,GMI 雲端正式推出其推論引擎,這是通往其模型即服務 (MaaS) 層的門戶。
Alex 解釋說:它專為沒有 ML 背景的產品團隊設計。使用推論引擎,他們專注於成長和產品,而不是調試基本模型。只需從市場中選擇一個模型即可。
洪水中的新邊界
那麼,接下來是什麼?
當被問到 GMI Cloud 的 3-5 年路線圖時,Alex 分享了一個雄心勃勃的願景:建立「互聯網的 AI」。他說:「這是我覺得非常令人興奮的願景。」「我們希望創建一個隱形 GPU 雲端網路,這是一個靜默的啟動器,能夠讓初創企業和企業創新者能夠將他們的 AI 想法實現。我們將在各種 AI 研發使用案例中提供特定情境的計算能力和引擎支持,並與該領域的每一項突破緊密保持一致。我們的目標是協助塑造 AI 行業的未來,而不只是在旁觀看它發展。」
他 28 個月前創立的 GMI Cloud 正在發展為一個全堆疊的 AI 平台,從運算到存儲到應用程序層,全部都是模塊化的。
「就像豪華酒店一樣:用行李箱辦理入住,舒適地生活。如果你喜歡房間裡的東西,你可以把它帶回家。」
.png)

