至顶AI实验室频道最新文章

2025-08-19

阿里推出Ovis2.5：多模态大语言模型的又一重要突破

Ovis2.5是阿里集团开发的新一代多模态大语言模型，在视觉感知和推理能力上实现重大突破。

2025-08-18

可实时交互的AI生成世界，腾讯发布的AI框架Yan，会是元宇宙的破局者吗？

2025-08-15

阿里达摩院与多所高校共推机器人抓取新突破：让灵巧的手学会像人一样安全抓取

阿里达摩院联合多所高校提出AffordDex框架，让机器人灵巧手首次具备类人功能感知能力。通过两阶段训练结合负面功能感知分割技术，实现既自然又安全的物体抓取，成功率达89.2%，人类相似性评分8.6分，功能正确性远超现有方法，为通用机器人智能发展奠定重要基础。

2025-08-14

能听能看的贴心AI伴侣来了，字节推出M3-Agent多模态智能体框架

2025-08-13

阿里团队推出DeepPHY：首个专门测试AI视觉模型物理推理能力的综合评估平台

阿里团队推出首个AI物理推理综合测试平台DeepPHY，通过六个物理环境全面评估视觉语言模型的物理推理能力。研究发现即使最先进的AI模型在物理预测和控制方面仍远落后于人类，揭示了描述性知识与程序性控制间的根本脱节，为AI技术发展指明了重要方向。

2025-08-12

全新搜索方式出现，字节发布宽度优先搜索基准WideSearch，垫底的竟是DeepSeek

2025-08-11

Anthropic CEO：我们每一代模型都赚钱，亏损是因扩展定律，和云不同，模型API业务不会商品化，一亿美金挖人只为几行代码

Stripe联合创始人John Collison最近与Anthropic CEO Dario Amodei（达里奥·阿莫代）进行了一次对话。

2025-08-11

OpenAI GPT-5突破性安全架构：当AI学会"思考"后如何确保不越界

GPT-5是OpenAI于2025年8月发布的新一代多模式大模型，兼具高效应答与深度推理能力，并在安全性、准确性和多语言表现上取得显著提升，尤其在医疗、内容安全与防越狱方面展现突破性进步。

2025-08-08

字节推出全模态训练框架VeOmni：让AI模型训练像搭积木一样简单

2025-08-07

Anthropic CEO：我们每一代模型都赚钱，亏损是因扩展定律，和云不同，模型API业务不会商品化，一亿美金挖人只为几行代码

Stripe联合创始人John Collison最近与Anthropic CEO Dario Amodei（达里奥·阿莫代）进行了一次对话。

2025-08-07

字节Seed团队联合清华大学发布全球最快代码生成AI模型

ByteDance Seed团队联合清华大学推出的Seed Diffusion Preview模型，通过离散状态扩散技术实现了每秒2146个token的超高代码生成速度，比传统模型快约五倍，同时保持了高质量输出。

2025-08-06

实测对比OpenAI开源的gpt-oss，奥特曼给的是诚意还是糊弄？

2025-08-04

一句话生成虚拟世界的时代到来，腾讯混元团队发布3D世界生成框架HunyuanWorld 1.0

2025-08-01

英伟达CEO黄仁勋与Zoom CTO 黄学东在2025年斯坦福AASF峰会炉边对话实录

从4万亿芯片帝国到AI革命，黄仁勋揭秘英伟达30年创新密码：'你必须相信你所相信的'。当计算成本10年下降10万倍，人类将面临怎样的未来？这场斯坦福对话给出了颠覆性答案。

2025-07-30

AI届也有自己的拼多多，阶跃星辰推出超省钱的AI模型：Step-3

2025-07-29

AI教父弗里·辛顿学术讲座：AI正在以我们想象不到的方式变得比人类更聪明

辛顿首度访华，揭秘AI超越人类的必然性：数字智能将接管一切，神经网络已彻底颠覆传统逻辑范式。

2025-07-25

深度研究系统能自我进化，谷歌发布基于扩散的TTD-DR系统

2025-07-24

清华大学团队揭秘AI视觉识别“轻装上阵"的秘密：无需真实数据也能让神经网络变聪明

清华大学团队突破性开发"零样本量化"技术，让AI模型在不接触真实数据的情况下完成高效压缩，性能反超传统方法1.7%，为隐私保护时代的AI部署开辟新路径。

2025-07-23

月之暗面Kimi K2技术报告：解读万亿参数的智能体模型（含K2与DeepSeek R1对比）

2025-07-22

阿里团队突破多角色动画难题：FantasyPortrait让静态照片开口说话更自然

阿里团队开发的FantasyPortrait系统突破了传统人像动画的局限，通过隐式表情表示和掩码交叉注意力机制，实现了高质量的单人和多人肖像动画生成，特别在跨身份表情迁移方面表现出色，为视频制作和虚拟交流等领域带来新的技术可能性。

阿里推出Ovis2.5：多模态大语言模型的又一重要突破

可实时交互的AI生成世界，腾讯发布的AI框架Yan，会是元宇宙的破局者吗？

阿里达摩院与多所高校共推机器人抓取新突破：让灵巧的手学会像人一样安全抓取

能听能看的贴心AI伴侣来了，字节推出M3-Agent多模态智能体框架

阿里团队推出DeepPHY：首个专门测试AI视觉模型物理推理能力的综合评估平台

全新搜索方式出现，字节发布宽度优先搜索基准WideSearch，垫底的竟是DeepSeek

Anthropic CEO：我们每一代模型都赚钱，亏损是因扩展定律，和云不同，模型API业务不会商品化，一亿美金挖人只为几行代码

OpenAI GPT-5突破性安全架构：当AI学会"思考"后如何确保不越界

字节推出全模态训练框架VeOmni：让AI模型训练像搭积木一样简单

Anthropic CEO：我们每一代模型都赚钱，亏损是因扩展定律，和云不同，模型API业务不会商品化，一亿美金挖人只为几行代码

字节Seed团队联合清华大学发布全球最快代码生成AI模型

实测对比OpenAI开源的gpt-oss，奥特曼给的是诚意还是糊弄？

一句话生成虚拟世界的时代到来，腾讯混元团队发布3D世界生成框架HunyuanWorld 1.0

英伟达CEO黄仁勋与Zoom CTO 黄学东在2025年斯坦福AASF峰会炉边对话实录

AI届也有自己的拼多多，阶跃星辰推出超省钱的AI模型：Step-3

AI教父弗里·辛顿学术讲座：AI正在以我们想象不到的方式变得比人类更聪明

深度研究系统能自我进化，谷歌发布基于扩散的TTD-DR系统

清华大学团队揭秘AI视觉识别“轻装上阵"的秘密：无需真实数据也能让神经网络变聪明

月之暗面Kimi K2技术报告：解读万亿参数的智能体模型（含K2与DeepSeek R1对比）

阿里团队突破多角色动画难题：FantasyPortrait让静态照片开口说话更自然

关于AI Agent落地，李开复强调了两件事：“价值交付”和“一把手工程”

AWS re:Inforce：费城这天不只拼进球，还拼生成式AI安全

在欧洲之门马德里，我们再次见证了SAP激活企业增长的“飞轮”

IEEE专家委员胡凝：消解AI幻觉“阴影”，洞见“超级个体”价值锚点

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: