AI 见闻
精选· 重要性 4/5

互联网正为机器重建:AWS推出专为AI代理设计的无服务器搜索数据库

TechCrunch — AI··Rebecca Bellan·约 4 分钟阅读
中文导读

随着AI代理流量激增,传统面向人类设计的云基础设施不堪重负。AWS发布新一代OpenSearch Serverless,通过计算与存储解耦实现秒级弹性伸缩,标志着云厂商开始为机器主导的互联网重构底层架构。

长期以来,云基础设施一直围绕人类设计,人类以稳定且可预测的方式搜索、点击、滚动和观看流媒体。AI代理的行为则不同。它们可以释放大量活动,瞬间启动多个子代理,在几秒内查询数百个数据库、搜索文档、调用API,然后像出现时一样迅速消失。

基于这一前提,亚马逊正在重新设计其云基础设施的核心部分。周四,AWS推出了下一代OpenSearch Serverless,这是一个完全托管的搜索和向量数据库——本质上是一个用于大规模存储和检索信息的系统——专为代理工作负载设计。

AWS表示,新系统可以在代理触发任务时立即扩容,并在空闲时缩容至零。这一发布反映了整个科技行业日益增长的认识:最初为人类驱动的互联网设计的基础设施,在代理日益增多的世界中已不再高效。虽然AI代理在互联网活动中仍占相对较小比例,但机器生成的流量已经相当可观,并且有望增长。

Cloudflare表示,过去六个月中,机器人占HTTP总流量的31%。在此期间,AI爬虫、搜索引擎和助手约占所有机器人请求的四分之一。Cloudflare高级产品经理Li Yi Ohlsen对TechCrunch表示:“到2027年上半年,非人类流量将超过人类流量。

在上周举行的谷歌I/O开发者大会上,该公司表示,用户将能够开始将任务委托给AI系统,例如研究购买、预订旅行、浏览网页以及与应用程序交互。但责任并不止于面向消费者的AI代理。企业越来越多地在内部以及为客户部署代理,在幕后创造新型机器生成的流量。

因此,云提供商和基础设施公司一直在思考如何将为人构建的系统适应这样一个代理不断自主检索信息、调用工具并生成机器对机器流量的世界。这正是AWS新OpenSearch Serverless的用武之地。

“时机很直接。代理正从实验转向生产,它们产生的流量模式是以前的基础设施根本未设计的,”亚马逊OpenSearch Service总经理Tia White告诉TechCrunch。“它们毫无征兆地激增,悄无声息地闲置,企业需要能够跟上节奏的搜索,而无需为空闲计算付费。

”这一代的关键技术变化是将计算与存储解耦,使计算能在几秒内扩容以应对代理流量突发,并缩容至零,因此客户在代理空闲时支付0美元。

“以前,即使在我们之前的Serverless版本中,你也必须至少有一个实例在运行,因为存储和计算是耦合的,”White说。“你无法以所需的速度自动启动计算,所以无论是否使用,你总是为工作负载预留了空闲计算。

”可以想象成总是为停车位付费,即使你不在使用。而AWS升级后的Serverless,更像是按停车时长付费。发布时,OpenSearch Serverless将原生集成Vercel和Kiro等AI开发平台,因此开发者无需管理基础设施即可为代理部署生产就绪的搜索和向量后端。

这一转变正在整个云行业显现。Databricks和Snowflake正在将自己重新定位为企业数据的AI存储和检索系统。微软已推出Azure更新,旨在处理AI代理突发并在代理之间共享内存。

Cloudflare与亚马逊类似,上个月推出了旨在为代理提供持久环境和即时可扩展性的基础设施。部署AI代理的公司越多,围绕机器生成的工作负载重新设计基础设施的压力就越大,这反过来可能使代理更便宜、更容易大规模部署。

原文出处
The internet is being rebuilt for machines

本文为机器翻译辅以 AI 润色,仅供参考。原始事实以原文为准。

相关阅读