精选· 重要性 4/5

WWDC 2026：苹果Siri AI借视觉LLM与定制Gemini模型实现新突破

Simon Willison's Weblog·2 天前·约 2 分钟阅读

中文导读

苹果在WWDC 2026上宣布Siri AI新功能，通过视觉大模型提取屏幕信息并授权定制Gemini模型，绕开应用集成难题，同时推出Core AI库让开发者充分利用硬件运行自有模型。

2026年6月8日鉴于任何轻信苹果2024年WWDC上Apple Intelligence公告的人都吃了大亏，我对今天宣布的一切都坚持严格的“眼见为实”原则。

新的Siri AI功能至少在当今技术下看起来是可行的，尤其是苹果正在授权一种定制的Gemini衍生模型，可以在自己的私有云计算上运行。

听起来他们将利用视觉LLM从用户屏幕中提取信息，这巧妙地绕过了每个现有应用为了与Apple Intelligence集成而需要编写自定义代码的问题。视觉LLM在2024年6月时还是一个远未成熟的类别。

新的Core AI库看起来是让开发者最终充分利用苹果硬件运行自己模型的重要一步。

它与Meta的开源PyTorch生态系统集成，基于以下Core AI PyTorch扩展：Core AI PyTorch Extensions（coreai-torch）是一个连接PyTorch和Core AI的Python包。

你可以用它加载现有的PyTorch模型——导出为torch.export.ExportedProgram——转换为Core AI的AIProgram，准备在苹果硬件上运行，逐节点遍历FX图并将ATen操作映射到Core AI操作。

你现在可以安装iOS 27开发者测试版，它应该包含这些新功能——但你需要通过等待名单才能获得新Siri AI的访问权限。

来自MacRumors的Aaron Perris报告称他已从等待名单中出来，因此我们可能很快就能看到关于Siri AI实际表现的可信报告。

近期文章：- 使用MicroPython和WASM在沙箱中运行Python代码 - 2026年6月6日- Claude Opus 4.8：“适度但切实的改进” - 2026年5月28日- 我认为Anthropic和OpenAI已找到产品市场契合点 - 2026年5月27日

原文出处

本文为机器翻译辅以 AI 润色，仅供参考。原始事实以原文为准。

相关阅读