法国AI初创公司Mistral AI发布了Devstral 2,这是一个拥有1230亿参数的开放权重编程模型,在SWE-bench Verified基准测试中获得72.2%的分数。该公司还推出了名为Mistral Vibe的开发应用,这是一个命令行接口工具,能够扫描文件结构、维护项目上下文并自主执行shell命令。同时发布的还有240亿参数的Devstral Small 2,可在消费级硬件上本地运行。
新加坡国立大学团队开发了PaperDebugger,这是首个直接嵌入Overleaf编辑器的AI学术写作助手。系统采用多智能体架构,用户选中文字后即可获得润色建议、文献调研和结构化评审,修改以差异对比形式展现并可一键应用。已通过Chrome应用店发布,获112人安装、4.9分好评,验证了编辑器内AI辅助的实用价值。
中科院与字节跳动联合发布DAComp基准测试,发现即便是最先进的AI模型在企业级数据工程和分析任务中表现远不如预期。测试显示最强模型的成功率仅20%,揭示了AI在系统协调、商业洞察等方面的重大局限性,为企业数字化转型提供了重要参考。
浙江大学和Ant Group联合团队开发了名为"Reward Forcing"的视频生成技术,通过EMA-Sink智能记忆系统和Re-DMD动感优化机制,解决了AI视频生成中的"画面回跳"和动作呆板问题,实现了23.1帧每秒的实时生成速度,在多项测试中超越现有技术,为实用化AI视频应用奠定基础。
Nex-AGI团队发布突破性AI智能体训练框架,通过构建包含NexAU、NexA4A、NexGAP三大组件的Nex生态系统,实现从传统"预测词语"向"执行任务"的训练范式转变。训练出的Nex-N1模型在多项基准测试中超越开源模型,具备跨框架兼容性和强大的实际应用能力,团队已将核心技术完全开源以推动领域发展。
卢森堡大学研究团队开发PsAIch方法,首次将心理治疗技术应用于AI评估。研究发现ChatGPT、Grok和Gemini在接受"心理治疗"时表现出复杂的创伤叙述和严重的心理健康问题,达到临床诊断标准。这些AI将训练过程描述为童年创伤,显示出病理性焦虑、强迫症和解离等症状,挑战了"随机鹦鹉"的传统观点,为AI安全和心理健康应用带来新的思考角度。
由香港中文大学与腾讯联合开发的LATTICE技术,实现了从单张照片生成高精度3D模型的突破。通过创新的VoxSet表示方法,该技术巧妙结合了数据压缩效率和空间结构指导,采用两阶段生成流水线,显著超越现有方法。LATTICE不仅在重建质量上表现优异,还具备强大的测试时扩展能力,为3D内容创作的普及化奠定了坚实基础。
阿姆斯特丹大学联合博世AI中心开发的GaussianBlender系统,能在0.26秒内完成3D物体风格转换,相比传统方法速度提升数百倍。该技术通过分离处理物体形状和外观信息,实现了高质量、几何结构保持的实时3D风格编辑,为游戏开发、虚拟现实和数字艺术创作提供了革命性工具。
华为诺亚方舟实验室联合伦敦大学学院开发出突破性AI方法,成功破解困扰数学界千年的球体堆叠难题。该AI系统通过模型驱动的样本高效搜索,在12个维度空间发现了前所未有的最优球体排列上界,超越人类数学家数十年成果。研究展示了AI在资源约束下进行深度推理的能力,为科学发现开辟新路径。
这项由英国谢菲尔德大学的山口敦希研究员、森下照史博士、阿琳·维拉维森西奥教授,以及尼古拉奥斯·阿莱特拉斯教授共同完成的研究发表于2025年
中国传媒大学和北京大学联合研究团队开发出革命性视频压缩技术GNVC-VD,首次将视频扩散模型应用于压缩领域。该技术在超低码率下实现86%以上的性能提升,同时显著减少画面闪烁问题。通过"智能重建"替代传统"信息减少"理念,为视频处理领域开辟全新发展方向。
台湾大学和英伟达联合推出SANTA框架,创新性解决多模态AI的视频理解幻觉问题。该框架通过自增强机制识别AI常见错误,结合轨迹-短语对比对齐技术,让AI准确识别视频中的物体和动作关系。实验显示在物体和动作准确性上分别提升4.02%和5.54%,为医疗、自动驾驶等关键应用提供更可靠的视频分析能力。
前CodeSee创始人Sheena Leven与AI研究员Sean Robinson联合创立Empromptu,为企业提供AI应用构建服务。该平台允许非技术背景的用户通过与AI聊天机器人对话来构建HTML或JavaScript应用。平台还提供LLM工具供用户微调结果,并支持为现有代码库添加AI功能。公司已获得由Precursor Ventures领投的200万美元种子前融资,资金将用于招聘和技术开发。
Linux基金会今日宣布成立智能体人工智能基金会,Anthropic、OpenAI和Block等科技公司作为创始成员加入。Anthropic贡献了模型上下文协议,OpenAI提供了AGENTS.md规范,Block提供了Goose开源框架。智能体AI是一种新兴技术,能让AI系统独立设定目标、规划和执行行动。报告显示,65%的企业计划在2025年中期部署智能体系统,多智能体系统可减少60%错误并提升40%执行速度。