阿里达摩院联合多所高校提出AffordDex框架,让机器人灵巧手首次具备类人功能感知能力。通过两阶段训练结合负面功能感知分割技术,实现既自然又安全的物体抓取,成功率达89.2%,人类相似性评分8.6分,功能正确性远超现有方法,为通用机器人智能发展奠定重要基础。
阿里团队推出首个AI物理推理综合测试平台DeepPHY,通过六个物理环境全面评估视觉语言模型的物理推理能力。研究发现即使最先进的AI模型在物理预测和控制方面仍远落后于人类,揭示了描述性知识与程序性控制间的根本脱节,为AI技术发展指明了重要方向。
全新搜索方式出现,字节发布宽度优先搜索基准WideSearch,垫底的竟是DeepSeek
Stripe联合创始人John Collison最近与Anthropic CEO Dario Amodei(达里奥·阿莫代)进行了一次对话。
GPT-5是OpenAI于2025年8月发布的新一代多模式大模型,兼具高效应答与深度推理能力,并在安全性、准确性和多语言表现上取得显著提升,尤其在医疗、内容安全与防越狱方面展现突破性进步。
Stripe联合创始人John Collison最近与Anthropic CEO Dario Amodei(达里奥·阿莫代)进行了一次对话。
ByteDance Seed团队联合清华大学推出的Seed Diffusion Preview模型,通过离散状态扩散技术实现了每秒2146个token的超高代码生成速度,比传统模型快约五倍,同时保持了高质量输出。
一句话生成虚拟世界的时代到来,腾讯混元团队发布3D世界生成框架HunyuanWorld 1.0
从4万亿芯片帝国到AI革命,黄仁勋揭秘英伟达30年创新密码:'你必须相信你所相信的'。当计算成本10年下降10万倍,人类将面临怎样的未来?这场斯坦福对话给出了颠覆性答案。
清华大学团队突破性开发"零样本量化"技术,让AI模型在不接触真实数据的情况下完成高效压缩,性能反超传统方法1.7%,为隐私保护时代的AI部署开辟新路径。
月之暗面Kimi K2技术报告:解读万亿参数的智能体模型(含K2与DeepSeek R1对比)
阿里团队开发的FantasyPortrait系统突破了传统人像动画的局限,通过隐式表情表示和掩码交叉注意力机制,实现了高质量的单人和多人肖像动画生成,特别在跨身份表情迁移方面表现出色,为视频制作和虚拟交流等领域带来新的技术可能性。