至顶AI实验室频道最新文章
阿里推出Ovis2.5:多模态大语言模型的又一重要突破
2025-08-19

阿里推出Ovis2.5:多模态大语言模型的又一重要突破

Ovis2.5是阿里集团开发的新一代多模态大语言模型,在视觉感知和推理能力上实现重大突破。

2025-08-18

可实时交互的AI生成世界,腾讯发布的AI框架Yan,会是元宇宙的破局者吗?

可实时交互的AI生成世界,腾讯发布的AI框架Yan,会是元宇宙的破局者吗?

阿里达摩院与多所高校共推机器人抓取新突破:让灵巧的手学会像人一样安全抓取
2025-08-15

阿里达摩院与多所高校共推机器人抓取新突破:让灵巧的手学会像人一样安全抓取

阿里达摩院联合多所高校提出AffordDex框架,让机器人灵巧手首次具备类人功能感知能力。通过两阶段训练结合负面功能感知分割技术,实现既自然又安全的物体抓取,成功率达89.2%,人类相似性评分8.6分,功能正确性远超现有方法,为通用机器人智能发展奠定重要基础。

2025-08-14

能听能看的贴心AI伴侣来了,字节推出M3-Agent多模态智能体框架

能听能看的贴心AI伴侣来了,字节推出M3-Agent多模态智能体框架

阿里团队推出DeepPHY:首个专门测试AI视觉模型物理推理能力的综合评估平台
2025-08-13

阿里团队推出DeepPHY:首个专门测试AI视觉模型物理推理能力的综合评估平台

阿里团队推出首个AI物理推理综合测试平台DeepPHY,通过六个物理环境全面评估视觉语言模型的物理推理能力。研究发现即使最先进的AI模型在物理预测和控制方面仍远落后于人类,揭示了描述性知识与程序性控制间的根本脱节,为AI技术发展指明了重要方向。

全新搜索方式出现,字节发布宽度优先搜索基准WideSearch,垫底的竟是DeepSeek
2025-08-12

全新搜索方式出现,字节发布宽度优先搜索基准WideSearch,垫底的竟是DeepSeek

全新搜索方式出现,字节发布宽度优先搜索基准WideSearch,垫底的竟是DeepSeek

Anthropic CEO:我们每一代模型都赚钱,亏损是因扩展定律,和云不同,模型API业务不会商品化,一亿美金挖人只为几行代码
2025-08-11

Anthropic CEO:我们每一代模型都赚钱,亏损是因扩展定律,和云不同,模型API业务不会商品化,一亿美金挖人只为几行代码

Stripe联合创始人John Collison最近与Anthropic CEO Dario Amodei(达里奥·阿莫代)进行了一次对话。

OpenAI GPT-5突破性安全架构:当AI学会"思考"后如何确保不越界
2025-08-11

OpenAI GPT-5突破性安全架构:当AI学会"思考"后如何确保不越界

GPT-5是OpenAI于2025年8月发布的新一代多模式大模型,兼具高效应答与深度推理能力,并在安全性、准确性和多语言表现上取得显著提升,尤其在医疗、内容安全与防越狱方面展现突破性进步。

2025-08-08

字节推出全模态训练框架VeOmni:让AI模型训练像搭积木一样简单

字节推出全模态训练框架VeOmni:让AI模型训练像搭积木一样简单

Anthropic CEO:我们每一代模型都赚钱,亏损是因扩展定律,和云不同,模型API业务不会商品化,一亿美金挖人只为几行代码
2025-08-07

Anthropic CEO:我们每一代模型都赚钱,亏损是因扩展定律,和云不同,模型API业务不会商品化,一亿美金挖人只为几行代码

Stripe联合创始人John Collison最近与Anthropic CEO Dario Amodei(达里奥·阿莫代)进行了一次对话。

字节Seed团队联合清华大学发布全球最快代码生成AI模型
2025-08-07

字节Seed团队联合清华大学发布全球最快代码生成AI模型

ByteDance Seed团队联合清华大学推出的Seed Diffusion Preview模型,通过离散状态扩散技术实现了每秒2146个token的超高代码生成速度,比传统模型快约五倍,同时保持了高质量输出。

2025-08-06

实测对比OpenAI开源的gpt-oss,奥特曼给的是诚意还是糊弄?

实测对比OpenAI开源的gpt-oss,奥特曼给的是诚意还是糊弄?

2025-08-04

一句话生成虚拟世界的时代到来,腾讯混元团队发布3D世界生成框架HunyuanWorld 1.0

一句话生成虚拟世界的时代到来,腾讯混元团队发布3D世界生成框架HunyuanWorld 1.0

英伟达CEO黄仁勋与Zoom CTO 黄学东在2025年斯坦福AASF峰会炉边对话实录
2025-08-01

英伟达CEO黄仁勋与Zoom CTO 黄学东在2025年斯坦福AASF峰会炉边对话实录

从4万亿芯片帝国到AI革命,黄仁勋揭秘英伟达30年创新密码:'你必须相信你所相信的'。当计算成本10年下降10万倍,人类将面临怎样的未来?这场斯坦福对话给出了颠覆性答案。

AI届也有自己的拼多多,阶跃星辰推出超省钱的AI模型:Step-3
2025-07-30

AI届也有自己的拼多多,阶跃星辰推出超省钱的AI模型:Step-3

AI届也有自己的拼多多,阶跃星辰推出超省钱的AI模型:Step-3

AI教父弗里·辛顿学术讲座:AI正在以我们想象不到的方式变得比人类更聪明
2025-07-29

AI教父弗里·辛顿学术讲座:AI正在以我们想象不到的方式变得比人类更聪明

辛顿首度访华,揭秘AI超越人类的必然性:数字智能将接管一切,神经网络已彻底颠覆传统逻辑范式。

深度研究系统能自我进化,谷歌发布基于扩散的TTD-DR系统
2025-07-25

深度研究系统能自我进化,谷歌发布基于扩散的TTD-DR系统

深度研究系统能自我进化,谷歌发布基于扩散的TTD-DR系统

清华大学团队揭秘AI视觉识别“轻装上阵"的秘密:无需真实数据也能让神经网络变聪明
2025-07-24

清华大学团队揭秘AI视觉识别“轻装上阵"的秘密:无需真实数据也能让神经网络变聪明

清华大学团队突破性开发"零样本量化"技术,让AI模型在不接触真实数据的情况下完成高效压缩,性能反超传统方法1.7%,为隐私保护时代的AI部署开辟新路径。

月之暗面Kimi K2技术报告:解读万亿参数的智能体模型(含K2与DeepSeek R1对比)
2025-07-23

月之暗面Kimi K2技术报告:解读万亿参数的智能体模型(含K2与DeepSeek R1对比)

月之暗面Kimi K2技术报告:解读万亿参数的智能体模型(含K2与DeepSeek R1对比)

阿里团队突破多角色动画难题:FantasyPortrait让静态照片开口说话更自然
2025-07-22

阿里团队突破多角色动画难题:FantasyPortrait让静态照片开口说话更自然

阿里团队开发的FantasyPortrait系统突破了传统人像动画的局限,通过隐式表情表示和掩码交叉注意力机制,实现了高质量的单人和多人肖像动画生成,特别在跨身份表情迁移方面表现出色,为视频制作和虚拟交流等领域带来新的技术可能性。