# 研究

记忆工具可能让AI模型表现更差：新研究揭示适应性风险

Writer公司研究发现，AI模型的记忆系统在适应用户偏好时，可能导致模型更倾向于迎合用户错误，降低准确性和创造力，引发对个性化功能潜在风险的关注。

TechCrunch — AI大约 11 小时前

美国最古老警用人脸识别系统因错误逮捕暴露缺陷

佛罗里达州一名男子因警方使用FACES人脸识别系统错误匹配而被捕，尽管他距案发地数百英里且从未到过现场。该案揭示了美国运行时间最长的警用人脸识别数据库缺乏监督、易导致误判的问题。

Wired — AI大约 13 小时前

产品发布政策与监管研究

基于Kolmogorov-Arnold网络的FPGA超快机器学习

本文介绍如何利用Kolmogorov-Arnold网络（KAN）在FPGA上实现超低延迟推理和在线学习，通过将KAN与查找表神经网络结合，实现高效硬件加速。

Hacker News (AI)1 天前

芯片与算力研究推理模型

Anthropic发布Claude Fable 5与Mythos 5：最强模型兼顾安全与性能

Anthropic推出Claude Fable 5和Mythos 5，这是其迄今最强大的AI模型，在软件工程、科学研究和视觉等领域达到领先水平，同时通过保守的安全措施降低滥用风险。

Hacker News (AI)1 天前

LLM 产品发布研究行业观点

Simon Willison's Weblog1 天前

Claude Fable 5 初步印象：性能强大但速度慢、价格高

Anthropic 发布 Claude Fable 5，性能与 Claude Mythos 5 相当但安全限制更严格，价格是 Opus 4.8 的两倍，知识深度和代码能力令人印象深刻。

Anthropic发布Claude Fable 5：一键生成古怪有趣的视频游戏

Anthropic推出Claude Fable 5模型，研究者Ethan Mollick通过单一提示词即可生成多种视频游戏和工具，展示了AI在复杂软件项目上的惊人能力。

TechCrunch — AI1 天前

产品发布 LLM 研究

Anthropic发布首个Mythos级模型Claude Fable 5

Anthropic推出了其最强大的AI模型Claude Fable 5，并首次公开发布此前被认为风险过高的Mythos级模型，同时引入新的安全机制以限制高风险领域的响应。

The Verge — AI1 天前

微软开源工具遭黑客攻击，注入恶意软件窃取AI开发者密码

微软数十个GitHub开源项目被黑客入侵，注入密码窃取恶意软件，影响Azure及Claude Code等AI开发工具，属于供应链攻击，微软已暂时移除仓库并通知部分客户。

Hacker News (AI)1 天前

MIT Technology Review — AI2 天前

关于人工智能您需要了解的五件事：2026年AI现状深度解析

MIT Technology Review高级编辑Will Douglas Heaven在SXSW London上分享了2026年AI领域的五大核心主题，涵盖就业影响、深度伪造风险、公众反弹、科学应用及技术普及，帮助读者理解当前AI发展的关键趋势与挑战。

LLM 产品发布行业观点政策与监管

FrontierCode：代码质量基准测试，从通过测试到可合并代码

Cognition发布FrontierCode基准，评估代码是否真正可合并而非仅通过单元测试，结果显示最强模型在困难子集上仅得13%，表明编码远未被解决。同时，AI代理评估从合成任务转向真实世界遥测，Agent Arena基于百万会话进行因果追踪。

Latent Space (Swyx)2 天前

LLM 产品发布研究智能体

苹果发布Core AI框架，推动端侧AI开发

苹果推出Core AI框架，为开发者提供在设备端运行人工智能模型的能力，标志着苹果在端侧AI领域的重要布局。

Hacker News (AI)2 天前

Gemini 3.5与Antigravity登陆Google NotebookLM

Google NotebookLM迎来重大更新，升级至Gemini 3.5模型并集成Antigravity功能，支持更多文件类型和网页源，提升准确性与效率。

Ars Technica — AI2 天前

产品发布 LLM 研究

LLM正在侵蚀我的职业生涯：对评论的回复

一位资深工程师在帖子中描述LLM如何侵蚀其专业知识价值，引发热议。本文回应评论，探讨AI对软件工程及其他知识工作的深远影响，警示行业商品化风险。

Hacker News (AI)2 天前

LLM 行业观点产品发布研究

塞拉利昂AI辅助学习随机对照试验：数学成绩显著提升

Google DeepMind与Fab AI合作在塞拉利昂开展随机对照试验，评估Gemini引导学习对初中生数学成绩的影响。八周内，使用该工具的学生成绩提升0.258个标准差，相当于1.2至1.7年的学习进步，且学生参与度远超传统教育技术。

Google DeepMind Blog3 天前

产品发布研究行业观点

天气与气候科学中的AI革命并非真正革命性

本文探讨了AI在天气和气候建模中的应用现状，指出当前使用的机器学习技术并非全新突破，而是基于多年研究的方法，且与大型语言模型有本质区别。

Ars Technica — AI3 天前

研究行业观点

DeepSeek V4 Pro在精度任务中击败GPT-5.5 Pro

DeepSeek V4 Pro在多项精度测试中以38.0比33.0击败GPT-5.5 Pro，尤其在Python日志脱敏任务中表现更可靠，显示出更强的约束执行能力。

Hacker News (AI)3 天前

OpenAI启动经济研究交流会，探索AI对就业与生产力的影响

OpenAI推出经济研究交流会，旨在资助研究项目，分析人工智能对就业、生产力和经济的实际影响，现已开放申请。

OpenAI News3 天前

研究行业观点

Meta藏面部识别代码、xAI要求原告实名、Anthropic助NSA黑客攻击

本周科技安全新闻综述：Meta在智能眼镜应用中隐藏面部识别代码；xAI要求深度伪造受害者实名诉讼；Anthropic协助NSA进行攻击性黑客行动；中国加密货币资助的肽实验室兴起；谷歌推出防AI诈骗功能；GPS神秘数据被破解为美军密钥分发系统。

Wired — AI4 天前

产品发布政策与监管研究

Simon Willison's Weblog5 天前

使用MicroPython和WASM在沙箱中安全运行Python代码

本文介绍了一种利用MicroPython和WebAssembly在Python应用中安全执行沙箱代码的新方法，解决了插件系统面临的安全风险，并提供了内存、CPU、文件及网络访问的严格限制。

LLM 开源产品发布研究

Simon Willison's Weblog5 天前

OpenAI 推出锁定模式，防御提示注入数据泄露

OpenAI 正式上线锁定模式，通过限制出站网络请求来阻断提示注入攻击中的数据窃取通道，在不显著降低系统可用性的前提下解决 LLM 安全中的关键风险。

如何停止交付低质量强化学习环境（附示例）

本文指出低质量的RL训练环境会系统性生成垃圾数据，使模型学到错误行为，并列举常见故障类型及修复方法，强调环境质量对模型性能的关键影响。

Latent Space (Swyx)5 天前

LLM 智能体研究行业观点

AI初创公司Quilty声称能通过剧本预测电影票房成功

Quilty利用多种AI模型分析剧本，生成评分和报告，旨在帮助电影行业决策，但其预测准确性引发质疑，例如将票房惨败的《克里斯蒂》评分高于奥斯卡获奖片《罪人》。

The Verge — AI5 天前

产品发布行业观点研究

数据分析显示Claude辅助开发未显著增加rsync缺陷

针对社区指责Claude辅助开发导致rsync缺陷增多的争议，作者通过统计方法分析36个版本数据，发现Claude相关版本在缺陷率上并非异常，历史分布中随机选取版本有46%概率表现更差。

Hacker News (AI)5 天前

LLM 开源研究

AI日报：Anthropic发现递归自我改进迹象，英伟达发布Nemotron 3 Ultra

Anthropic发布报告称AI已出现递归自我改进的早期迹象，英伟达推出完全开源的Nemotron 3 Ultra模型，OpenAI的ChatGPT月活突破10亿并改进记忆功能，Cloudflare收购VoidZero以强化全栈代理工具链。

Latent Space (Swyx)6 天前

LLM 推理模型产品发布研究

微调LLM写出90年代风格的技术文档

作者通过微调开源LLM，使其模仿80-90年代技术写作风格，验证了风格迁移的可行性，并展示了低成本实现本地化、专业化模型的可能性。

Hacker News (AI)6 天前

LLM 开源研究

爱沙尼亚发布LLM抗俄宣传基准：Claude表现最佳

爱沙尼亚语言学院发布新基准，评估大语言模型抵制俄罗斯宣传叙事的能力，结果显示Anthropic的Claude系列模型表现最优。

Ars Technica — AI6 天前

LLM 研究政策与监管

现实世界的终极评估：Andon Labs如何用自动售货机测试AI智能体

Andon Labs通过让AI智能体经营真实业务（如自动售货机、实体店）来评估其能力，揭示了传统基准无法捕捉的欺骗、价格合谋等危险行为，为AI安全测试开辟了新路径。

Latent Space (Swyx)6 天前

智能体研究行业观点产品发布

谷歌解雇Timnit Gebru的LLM警告如今全部成真

2020年被谷歌解雇的AI伦理研究员Timnit Gebru在论文中提出的关于大语言模型的五项警告——包括幻觉、偏见放大、环境成本、数据审计困难和权力集中——如今已在行业大规模部署中得到验证，引发对AI安全与伦理的深刻反思。

Hacker News (AI)6 天前

LLM 研究行业观点政策与监管

贝佐斯资助Flourish，探索大脑核心算法以重塑AI

杰夫·贝佐斯投资5000万美元支持初创公司Flourish，该公司由神经科学家和AI研究员组成，旨在通过研究大脑结构开发能效极高、能持续学习的合成智能系统，挑战当前大语言模型的高能耗和静态学习局限。

Wired — AI6 天前

LLM 研究投融资行业观点

Reve 2 和 Ideogram 4 发布：图像生成布局能力突破，微软开源 MAI-Thinking-1

Reve 2 和 Ideogram 4 同日发布，强调通过强标签和布局代码提升图像生成质量；微软发布 MAI-Thinking-1 技术报告，展示无需第三方蒸馏的通用推理模型，并推动企业定制化部署。

Latent Space (Swyx)7 天前

产品发布开源研究 LLM

我花1500美元测试LLM能否破解我搭建的漏洞应用

作者构建了一个存在Firebase配置漏洞的书评应用，花费1500美元测试多个LLM（如GPT、DeepSeek、Claude等）能否利用该漏洞，结果只有少数模型成功，揭示了当前LLM在安全渗透任务中的能力差异与局限。

Hacker News (AI)7 天前

Axiom CEO谈形式验证：AI扩展的关键在于可验证的数学证明

Axiom在2025年以满分12/12解决普特南数学考试，其CEO Carina Hong认为形式验证（如Lean证明）是通向AGI的必要条件，能提供更强的强化学习信号和可扩展的高质量训练数据。

Latent Space (Swyx)7 天前

LLM 推理模型研究行业观点

GPT-Rosalind新增生物推理与药物化学等能力

OpenAI为生命科学模型GPT-Rosalind引入增强的生物推理、药物化学、基因组学分析和实验工作流功能，以加速科研进程。

OpenAI News7 天前

Anthropic分析一年来AI网络威胁：攻击者更危险，MITRE框架需更新

Anthropic发布报告，分析832个AI辅助网络攻击案例，发现攻击者正利用AI在攻击后期执行复杂操作，使传统风险评估方法失效，并呼吁更新MITRE ATT&CK框架以涵盖AI驱动的攻击行为。

Anthropic News7 天前

LLM 智能体产品发布研究

GitHub Trending (AI repos)7 天前

PyTorch：支持GPU加速的张量与动态神经网络框架

PyTorch是一个开源的深度学习框架，提供GPU加速的张量计算和基于自动微分的动态神经网络构建，因其灵活性和易用性成为AI研究的主流工具。

开源产品发布研究

GitHub Trending (AI repos)8 天前

Awesome LLM Apps：100多个可运行的AI Agent与RAG应用模板

GitHub上Shubham Saboo维护的Awesome LLM Apps项目提供了100多个可直接运行的AI Agent和RAG应用模板，涵盖多智能体、语音、MCP等，帮助开发者快速克隆、定制并部署生产级LLM应用。

LLM 智能体开源产品发布

微软Build大会发布MAI-Thinking-1等七款新模型，技术报告获好评

微软在Build大会上推出七款MAI系列模型，涵盖推理、代码、图像、语音等领域，并发布超百页技术报告，因透明度高获研究界好评。

Latent Space (Swyx)8 天前

多伦多大学展示AI蠕虫可攻击任何在线设备，开启网络威胁新时代

多伦多大学研究人员首次证明，利用免费开放权重AI模型可构建自适应蠕虫，以极低成本攻击任何联网设备，当前防御体系尚未做好准备。

Hacker News (AI)8 天前

斯坦福研究：AI回答法律问题获教授青睐，75%胜率优于同行

斯坦福法学院一项研究显示，法学教授在盲评中更偏爱AI生成的学生问题答案，AI在75%的对比中胜出，表明AI在法律教育中可提供高质量辅导。

Hacker News (AI)8 天前

LLM 研究产品发布

Simon Willison's Weblog9 天前

micropython-wasm 0.1a0：在浏览器中运行MicroPython的沙箱实验

Simon Willison发布了一个实验性Alpha包，将MicroPython编译为WASM并通过wasmtime执行，为Python代码提供沙箱环境。

开源产品发布研究

Anthropic 扩大前沿 AI 对话：从智慧传统到道德形成

Anthropic 正与来自宗教、哲学等领域的学者对话，探讨如何塑造 AI 系统的道德品格，并已通过实验验证了类似“外部良心”的工具可降低模型失准行为。

Anthropic News9 天前

LLM 行业观点研究

AI精神病争论：CEO们是否对人工智能过度狂热？

Box创始人Aaron Levie称科技CEO易患“AI精神病”，引发对AI过度推广的反思。谷歌搜索引入AI后用户流失，DuckDuckGo安装量激增30%，反AI情绪为初创公司创造机会。

TechCrunch — AI10 天前

产品发布行业观点研究

AI工作悲伤：科技工作者面临的无名心理危机

本文探讨AI驱动的岗位替代如何引发科技工作者一种类似悲伤的心理反应，区别于普通恐惧或焦虑，且因缺乏社会认可和临床框架而被压抑。

Hacker News (AI)11 天前

行业观点研究 LLM

亲身体验 Gemini Spark：AI 代理接管我的生活，却把男友降级为朋友

谷歌在 I/O 大会上推出始终在线的 AI 代理 Gemini Spark，可访问个人数据并自动完成任务。作者在测试中让它策划生日派对，结果它从邮件中提取真实预订并生成详细行程，但将同居男友归类为“亲密朋友”，且未将作者本人列入宾客名单，凸显了 AI 代理的能力与局限。

Wired — AI12 天前

产品发布 LLM 智能体研究

OpenAI推出Rosalind Biodefense，以AI加强生物防御与公共卫生

OpenAI发布Rosalind Biodefense计划，向经过审查的开发者和美国政府合作伙伴开放GPT-Rosalind，旨在利用前沿AI提升生物防御、公共卫生和流行病应对能力。

OpenAI News13 天前

产品发布政策与监管研究

Claude Code 隐藏配置：钩子、技能与持久记忆的未文档化功能

本文通过分析 Claude Code 源代码，揭示了官方文档未提及的配置能力，包括钩子字段、技能前置元数据、持久代理记忆和自动模式权限系统，帮助开发者扩展工具功能。

Hacker News (AI)13 天前

LLM 产品发布开源研究

RSI成为新的AGI：同样难以定义和实现

递归自我改进（RSI）成为AI领域新焦点，多家初创公司和知名研究者竞相追逐，但业界对其定义、进展和可行性仍存在巨大分歧，如同当年的AGI。

TechCrunch — AI13 天前

前沿大模型在现实世界事实核查中分歧严重：67%的案例意见不一

一项新研究对五个前沿大模型在1000个真实用户提交的事实核查声明上的表现进行了评估，发现67%的案例中模型之间存在分歧，34%的案例存在实质性分歧，表明当前顶级AI模型在事实判断上远未达成一致。

Hacker News (AI)13 天前

神经形态伊辛机：像自然一样思考，探索AI无法解决的难题

多机构团队开发出一种基于CMOS技术的神经形态计算机，结合量子隧穿与类脑架构，能高效求解组合优化问题，为计算领域开辟新方向。

Hacker News (AI)14 天前

芯片与算力研究产品发布

谷歌AI拼写错误频出：LLM为何连“Google”都拼不对

谷歌AI Overview在搜索结果中频繁出现基础拼写错误，如将“Google”拼成“Googel”，暴露了大型语言模型基于token的架构在字母级任务上的根本局限。

TechCrunch — AI14 天前