精选· 重要性 4/5

AI算力争夺催生新推理云：General Compute获1500万美元种子轮

TechCrunch — AI·13 天前·Tim Fernholz·约 4 分钟阅读

中文导读

AI推理需求激增，新创公司General Compute采用SambaNova专用芯片，以风冷低功耗方案解决芯片获取与部署难题，获1500万美元种子轮融资，估值6000万美元。

运行AI模型的计算需求持续飙升，但业内玩家必须克服两大障碍：获得合适的芯片，并将其部署到数据中心以产生收入。

General Compute 是一家专注于推理阶段的新型 neocloud（即出租AI处理能力，专门服务于模型运行和响应用户而非训练阶段的公司），它对这些问题的回答揭示了AI生态系统的未来走向。

这些答案帮助它以6000万美元的投后估值筹集了1500万美元的种子轮融资，由 FUSE VC 领投，Carya Venture Partners 和 Village Global Ventures 参投。

首先，什么是合适的芯片？GPU 需求已暴涨，但业界逐渐形成共识：GPU 并非训练完成后运行AI模型的最佳芯片。模型主动生成响应的推理阶段与训练阶段的计算需求不同，因此专门设计了一类新型芯片。

Nvidia 在12月以200亿美元收购 Groq，以及 Cerebras 上周570亿美元的IPO，都指明了方向。

由于这两家公司产能紧张，General Compute 的联合创始人兼CEO Finn Puklowski 和CTO Jason Goodison 找到了另一种选择。

他们转向了 SambaNova 制造的专用芯片。SambaNova 是一家英特尔支持的芯片制造商，专注于推理领域，但已逐渐淡出硅谷的讨论。当 SambaNova 今年发布新芯片时，情况可能会改变。

该架构更加灵活，在推理计算中使用更多内存来存储上下文，SambaNova 声称其性能不仅优于 GPU，也优于 Groq 或 Cerebras 等公司制造的专用芯片。

Puklowski 表示，新芯片每秒可生成600至700个 token，而 GPU 约为250个 token。General Compute 已订购了价值3亿美元的 SambaNova SN50 芯片，并声称将成为首家部署这些芯片的 neocloud。

这些芯片还帮助 General Compute 解决了第二个大问题——部署地点：它们是风冷而非水冷，功耗更低，因此可以安装在现有数据中心设施中，无需新的基础设施投资。

Puklowski 正在寻求托管交易——即 General Compute 将硬件安装在他人设施中的安排——不仅与数据中心提供商合作，还与希望重新利用基础设施的加密货币矿工合作，因为生产比特币的成本往往超过其价格。

General Compute 上周推出了其云服务，声称它已经是运行 MiniMax 2.7（一个强大的开源LLM）最快的平台。

风险投资人 Joe Hasselmann 在2021年投资 Groq 时便进入了推理热潮的底层。今年，他推出了专注于AI领域的新基金 Evercrest Capital Partners，并将 General Compute 作为其首批投资之一。

Hasselmann 认为 SambaNova 与 General Compute 的合作关系类似于 CoreWeave 与 Nvidia 的关系，也类似于 Groq 的芯片制造与其之前的云服务的配对。

Hasselmann 说：“他们确实需要一个健康的客户组合，将芯片部署在能够实现高增长的环境中。就像 General Compute 押注 SambaNova 一样，SambaNova 也在押注 General Compute。

”问题在于，哪种计算机架构将在AI未来中捕获最大价值。推理云本质上是对一个多模型、多智能体世界的押注——在这个世界中，没有单一供应商占主导地位，推理速度和成本成为关键竞争变量。

本周 OpenRouter 筹集了1.13亿美元的B轮融资，反映出该公司能够为客户提供多种模型访问以优化 token 支出的能力。速度在计算中至关重要，无论是对价格还是能力而言。

Puklowski 希望将编码智能体长达一小时的工作负载缩短为5到10分钟的任务，并让用于客户服务的音频智能体（需要更快的推理才能有效对话）更加经济。

Puklowski 告诉 TechCrunch：“如果你使用 ChatGPT，它每秒给你50个 token，这仍然比我们的阅读速度快得多。现在事情已经转向智能体对智能体，智能体代表我们阅读或查询数据库，它们需要更快。

”

原文出处

本文为机器翻译辅以 AI 润色，仅供参考。原始事实以原文为准。

相关阅读