# 推理模型

13 篇相关资讯

基于Kolmogorov-Arnold网络的FPGA超快机器学习

本文介绍如何利用Kolmogorov-Arnold网络（KAN）在FPGA上实现超低延迟推理和在线学习，通过将KAN与查找表神经网络结合，实现高效硬件加速。

AI日报：Anthropic发现递归自我改进迹象，英伟达发布Nemotron 3 Ultra

Anthropic发布报告称AI已出现递归自我改进的早期迹象，英伟达推出完全开源的Nemotron 3 Ultra模型，OpenAI的ChatGPT月活突破10亿并改进记忆功能，Cloudflare收购VoidZero以强化全栈代理工具链。

Latent Space (Swyx)6 天前

LLM 推理模型产品发布研究

精选· 重要性 4/5

Axiom CEO谈形式验证：AI扩展的关键在于可验证的数学证明

Axiom在2025年以满分12/12解决普特南数学考试，其CEO Carina Hong认为形式验证（如Lean证明）是通向AGI的必要条件，能提供更强的强化学习信号和可扩展的高质量训练数据。

Latent Space (Swyx)7 天前

LLM 推理模型研究行业观点

精选· 重要性 4/5

微软发布首个高级推理AI模型MAI-Thinking-1

微软在Build 2026大会上推出旗舰推理模型MAI-Thinking-1，标志着其摆脱对OpenAI依赖、自主开发AI模型的重要一步。

The Verge — AI8 天前

LLM 推理模型产品发布

精选· 重要性 4/5

在AMD MI300X上部署DeepSeek-V4-Flash的工程挑战与解决方案

本文记录了在AMD MI300X上运行DeepSeek-V4-Flash推理时遇到的FP8方言不兼容、注意力内核缺失、HIP图支持等软件问题及修复过程，揭示了AMD旧款加速器在AI软件生态上的短板。

Hacker News (AI)8 天前

LLM 推理模型芯片与算力开源

精选· 重要性 4/5

AI术语全解析：从AGI到微调，一文读懂

本文是TechCrunch发布的AI术语表，系统解释了AGI、AI智能体、思维链、扩散模型等常见术语，帮助读者理解AI领域的关键概念。

TechCrunch — AI12 天前

LLM 多模态推理模型产品发布

精选· 重要性 4/5

标准GPU上实现实时LLM推理：单请求每秒3000个token

Kog AI发布推理引擎技术预览，在标准数据中心GPU上实现单请求每秒3000个token的解码速度，通过软硬件协同优化突破内存带宽瓶颈，为AI智能体应用带来数量级的延迟改善。

Hacker News (AI)12 天前

LLM 推理模型芯片与算力

精选· 重要性 5/5

Anthropic发布Claude Opus 4.8：性能提升、诚实度增强并引入动态工作流

Anthropic发布Claude Opus 4.8，在编码、推理和代理任务上显著超越前代，同时大幅提升诚实度并降低错误率，并引入动态工作流和努力控制等新功能。

Hacker News (AI)13 天前

LLM 产品发布智能体推理模型

精选· 重要性 5/5

OpenAI模型推翻离散几何80年猜想，AI驱动数学获里程碑

OpenAI的AI模型解决了80年历史的单位距离问题，反驳了离散几何中的一项核心猜想，展示了AI在数学研究中的突破性能力。

OpenAI News22 天前

研究 LLM 推理模型

精选· 重要性 4/5

GSPO：面向语言模型的可扩展强化学习新算法

Qwen团队提出组序列策略优化（GSPO）算法，通过序列级优化解决现有RL算法在长时间训练中的不稳定问题，显著提升训练效率与稳定性，并成功应用于Qwen3模型的大规模RL训练。

Qwen Team Blog11 个月前

LLM 研究推理模型

精选· 重要性 4/5

通义千问发布QVQ-72B-Preview：多模态推理模型新突破

阿里通义千问团队推出QVQ-72B-Preview，一个基于Qwen2-VL-72B的开源多模态推理模型，在MMMU等基准上表现优异，显著提升了AI在视觉理解和复杂问题求解方面的能力。

Qwen Team Blog超过 1 年前

LLM 多模态推理模型开源

精选· 重要性 5/5

Qwen2.5-Math：开源数学大模型新标杆，支持中英文与工具推理

阿里云发布Qwen2.5-Math系列模型，在数学推理能力上大幅超越前代及多数闭源模型，并首次在开源数学模型中支持工具集成推理（TIR），显著提升复杂计算与符号操作能力。

Qwen Team Blog超过 1 年前

LLM 开源推理模型产品发布

精选· 重要性 5/5

Qwen2-Math：超越GPT-4o的数学专用大语言模型系列

Qwen团队发布Qwen2-Math系列数学专用大语言模型，在多个数学基准上超越GPT-4o、Claude-3.5等闭源模型，展示了开源模型在数学推理领域的重大突破。

Qwen Team Blog将近 2 年前

LLM 推理模型开源产品发布