AI算力争夺催生新推理云:General Compute获1500万美元种子轮
AI推理需求激增,新创公司General Compute采用SambaNova专用芯片,以风冷低功耗方案解决芯片获取与部署难题,获1500万美元种子轮融资,估值6000万美元。
运行AI模型的计算需求持续飙升,但业内玩家必须克服两大障碍:获得合适的芯片,并将其部署到数据中心以产生收入。
General Compute 是一家专注于推理阶段的新型 neocloud(即出租AI处理能力,专门服务于模型运行和响应用户而非训练阶段的公司),它对这些问题的回答揭示了AI生态系统的未来走向。
这些答案帮助它以6000万美元的投后估值筹集了1500万美元的种子轮融资,由 FUSE VC 领投,Carya Venture Partners 和 Village Global Ventures 参投。
首先,什么是合适的芯片?GPU 需求已暴涨,但业界逐渐形成共识:GPU 并非训练完成后运行AI模型的最佳芯片。模型主动生成响应的推理阶段与训练阶段的计算需求不同,因此专门设计了一类新型芯片。
Nvidia 在12月以200亿美元收购 Groq,以及 Cerebras 上周570亿美元的IPO,都指明了方向。
由于这两家公司产能紧张,General Compute 的联合创始人兼CEO Finn Puklowski 和CTO Jason Goodison 找到了另一种选择。
他们转向了 SambaNova 制造的专用芯片。SambaNova 是一家英特尔支持的芯片制造商,专注于推理领域,但已逐渐淡出硅谷的讨论。当 SambaNova 今年发布新芯片时,情况可能会改变。
该架构更加灵活,在推理计算中使用更多内存来存储上下文,SambaNova 声称其性能不仅优于 GPU,也优于 Groq 或 Cerebras 等公司制造的专用芯片。
Puklowski 表示,新芯片每秒可生成600至700个 token,而 GPU 约为250个 token。General Compute 已订购了价值3亿美元的 SambaNova SN50 芯片,并声称将成为首家部署这些芯片的 neocloud。
这些芯片还帮助 General Compute 解决了第二个大问题——部署地点:它们是风冷而非水冷,功耗更低,因此可以安装在现有数据中心设施中,无需新的基础设施投资。
Puklowski 正在寻求托管交易——即 General Compute 将硬件安装在他人设施中的安排——不仅与数据中心提供商合作,还与希望重新利用基础设施的加密货币矿工合作,因为生产比特币的成本往往超过其价格。
General Compute 上周推出了其云服务,声称它已经是运行 MiniMax 2.7(一个强大的开源LLM)最快的平台。
风险投资人 Joe Hasselmann 在2021年投资 Groq 时便进入了推理热潮的底层。今年,他推出了专注于AI领域的新基金 Evercrest Capital Partners,并将 General Compute 作为其首批投资之一。
Hasselmann 认为 SambaNova 与 General Compute 的合作关系类似于 CoreWeave 与 Nvidia 的关系,也类似于 Groq 的芯片制造与其之前的云服务的配对。
Hasselmann 说:“他们确实需要一个健康的客户组合,将芯片部署在能够实现高增长的环境中。就像 General Compute 押注 SambaNova 一样,SambaNova 也在押注 General Compute。
”问题在于,哪种计算机架构将在AI未来中捕获最大价值。推理云本质上是对一个多模型、多智能体世界的押注——在这个世界中,没有单一供应商占主导地位,推理速度和成本成为关键竞争变量。
本周 OpenRouter 筹集了1.13亿美元的B轮融资,反映出该公司能够为客户提供多种模型访问以优化 token 支出的能力。速度在计算中至关重要,无论是对价格还是能力而言。
Puklowski 希望将编码智能体长达一小时的工作负载缩短为5到10分钟的任务,并让用于客户服务的音频智能体(需要更快的推理才能有效对话)更加经济。
Puklowski 告诉 TechCrunch:“如果你使用 ChatGPT,它每秒给你50个 token,这仍然比我们的阅读速度快得多。现在事情已经转向智能体对智能体,智能体代表我们阅读或查询数据库,它们需要更快。
”