基于Kolmogorov-Arnold网络的FPGA超快机器学习
本文介绍如何利用Kolmogorov-Arnold网络(KAN)在FPGA上实现超低延迟推理和在线学习,通过将KAN与查找表神经网络结合,实现高效硬件加速。
本文介绍如何利用Kolmogorov-Arnold网络(KAN)在FPGA上实现超低延迟推理和在线学习,通过将KAN与查找表神经网络结合,实现高效硬件加速。
Anthropic发布报告称AI已出现递归自我改进的早期迹象,英伟达推出完全开源的Nemotron 3 Ultra模型,OpenAI的ChatGPT月活突破10亿并改进记忆功能,Cloudflare收购VoidZero以强化全栈代理工具链。
Axiom在2025年以满分12/12解决普特南数学考试,其CEO Carina Hong认为形式验证(如Lean证明)是通向AGI的必要条件,能提供更强的强化学习信号和可扩展的高质量训练数据。
微软在Build 2026大会上推出旗舰推理模型MAI-Thinking-1,标志着其摆脱对OpenAI依赖、自主开发AI模型的重要一步。
本文记录了在AMD MI300X上运行DeepSeek-V4-Flash推理时遇到的FP8方言不兼容、注意力内核缺失、HIP图支持等软件问题及修复过程,揭示了AMD旧款加速器在AI软件生态上的短板。
本文是TechCrunch发布的AI术语表,系统解释了AGI、AI智能体、思维链、扩散模型等常见术语,帮助读者理解AI领域的关键概念。
Kog AI发布推理引擎技术预览,在标准数据中心GPU上实现单请求每秒3000个token的解码速度,通过软硬件协同优化突破内存带宽瓶颈,为AI智能体应用带来数量级的延迟改善。
Anthropic发布Claude Opus 4.8,在编码、推理和代理任务上显著超越前代,同时大幅提升诚实度并降低错误率,并引入动态工作流和努力控制等新功能。
OpenAI的AI模型解决了80年历史的单位距离问题,反驳了离散几何中的一项核心猜想,展示了AI在数学研究中的突破性能力。
Qwen团队提出组序列策略优化(GSPO)算法,通过序列级优化解决现有RL算法在长时间训练中的不稳定问题,显著提升训练效率与稳定性,并成功应用于Qwen3模型的大规模RL训练。
阿里通义千问团队推出QVQ-72B-Preview,一个基于Qwen2-VL-72B的开源多模态推理模型,在MMMU等基准上表现优异,显著提升了AI在视觉理解和复杂问题求解方面的能力。
阿里云发布Qwen2.5-Math系列模型,在数学推理能力上大幅超越前代及多数闭源模型,并首次在开源数学模型中支持工具集成推理(TIR),显著提升复杂计算与符号操作能力。
Qwen团队发布Qwen2-Math系列数学专用大语言模型,在多个数学基准上超越GPT-4o、Claude-3.5等闭源模型,展示了开源模型在数学推理领域的重大突破。