最新文章
MacBook Pro即将迎来重大改版,超薄设计引发争议

MacBook Pro即将迎来重大改版,超薄设计引发争议

苹果计划在2026年推出全新设计的MacBook Pro,预计将采用更轻薄的机身、OLED无刘海显示屏、触控支持和C2蜂窝调制解调器。尽管这可能是多年来Mac产品线最大的升级,但轻薄化设计让部分用户担心重蹈2016年的覆辙。当年苹果为追求轻薄而牺牲了功能性,备受诟病。新M6 MacBook Pro的成功将取决于苹果能否在保持轻薄的同时,不损失任何端口、性能或续航能力。

AWS悄然上调GPU价格15%,云计算定价逻辑生变

AWS悄然上调GPU价格15%,云计算定价逻辑生变

AWS在周末悄然将EC2机器学习容量块的GPU实例价格上调约15%,p5e.48xlarge实例从每小时34.61美元涨至39.80美元。这是AWS罕见的直接涨价举措,打破了云服务价格只降不升的惯例。分析认为,全球GPU资源紧张是涨价主因,此举为竞争对手提供了争夺企业客户的机会,同时可能开创云服务涨价的先例。

六成美国成年人用ChatGPT问诊,OpenAI嗅到商机

六成美国成年人用ChatGPT问诊,OpenAI嗅到商机

OpenAI研究显示,过去三个月内约60%的美国成年人使用ChatGPT等AI工具寻求健康建议。全球每日超过4000万人向ChatGPT咨询医疗问题,占所有消息的5%以上。美国医疗体系成本高昂且满意度低,促使民众转向AI寻求帮助。然而依赖AI获取医疗信息可能导致严重后果,因为AI经常提供不准确答案。OpenAI却将此视为商机,计划发布医疗AI政策蓝图。

第三代英特尔酷睿Ultra处理器,CES 2026正式发布
2026-01-06

第三代英特尔酷睿Ultra处理器,CES 2026正式发布

搭载第三代英特尔酷睿Ultra处理器的边缘系统预计将于2026年第二季度开始面市。

英伟达推出Alpamayo开源AI模型,让自动驾驶汽车"像人类一样思考"

英伟达推出Alpamayo开源AI模型,让自动驾驶汽车"像人类一样思考"

在CES 2025上,英伟达发布了Alpamayo开源AI模型家族,包含模拟工具和数据集,用于训练物理机器人和车辆。核心产品Alpamayo 1是一个100亿参数的视觉语言行动模型,能让自动驾驶汽车像人类一样思考,解决复杂边缘案例。该模型通过分解问题、推理各种可能性来选择最安全路径,并能解释其驾驶决策。英伟达还发布了包含1700小时驾驶数据的开放数据集和AlpaSim开源模拟框架。

UCSD团队打造终极仿真世界:让AI智能体在虚拟城市中自立更生的惊人实验

UCSD团队打造终极仿真世界:让AI智能体在虚拟城市中自立更生的惊人实验

SimWorld是由UCSD等多所顶尖院校联合开发的革命性AI仿真平台,基于虚幻引擎5构建了具备真实物理规律的虚拟城市环境。该平台支持无限扩展的程序化世界生成和自然语言交互,让AI智能体能够在复杂环境中学会生存、合作和竞争,为通用人工智能的发展提供了前所未有的训练平台。

浙江大学团队提出C2DLM:让AI推理更像人类思维的全新语言模型

浙江大学团队提出C2DLM:让AI推理更像人类思维的全新语言模型

浙江大学联合华为提出C2DLM,这是一种因果概念引导的扩散语言模型,通过自动提取因果关系并融入注意力机制来增强AI推理能力。相比传统方法,C2DLM在推理任务上平均提升1.31%-12%,训练效率提高3.2倍,为解决语言模型推理能力不足开辟了新路径。

南洋理工大学团队重新定义AI看世界:让机器像人类一样观察和思考

南洋理工大学团队重新定义AI看世界:让机器像人类一样观察和思考

南洋理工大学等机构联合开发的Artemis框架通过创新的"结构化视觉推理"方法,让AI系统学会像人类一样直接在视觉空间中思考,而不是依赖语言描述。该系统使用(标签,边界框)对进行推理,在多项视觉任务中取得显著提升,特别是在零样本任务中表现出色,为AI视觉理解提供了新范式。

韩国大学团队揭秘:ChatGPT等AI模型是如何"类比思考"的?

韩国大学团队揭秘:ChatGPT等AI模型是如何"类比思考"的?

韩国大学研究团队深入探索ChatGPT等大型语言模型的类比推理机制,发现这些AI模型既能像人类一样进行关系抽象,又在应用环节存在独特局限。通过精巧的"认知探针"技术和干预实验,研究揭示了AI模型内部信息流动规律,并成功将模型类比推理准确率提升超60%,为未来开发更智能AI系统提供了重要洞察和具体改进方向。

密歇根大学团队让AI视觉推理更靠谱:从"瞎猜"到"真看懂"的技术革命

密歇根大学团队让AI视觉推理更靠谱:从"瞎猜"到"真看懂"的技术革命

密歇根大学团队开发了CodeV视觉AI系统,解决了现有AI"看图猜答案"的问题。通过让AI编写Python代码分析图像,配合工具感知策略优化训练方法,确保AI基于真实视觉证据推理。测试显示,基于正确视觉证据得出正确答案的比例从50%提升至68%,同时在多项基准测试中达到领先水平,为构建可信赖的AI视觉系统提供了新方案。

剑桥大学最新发现:AI"口罩"原来是干扰器?扩散模型的神秘弱点被揭开

剑桥大学最新发现:AI"口罩"原来是干扰器?扩散模型的神秘弱点被揭开

剑桥大学与高通AI研究院合作发现,新一代掩码扩散语言模型存在意外弱点:过度依赖近距离信息而忽略远程上下文,且额外的"口罩"标记会显著干扰性能。研究团队开发了专门的训练方法来缓解这些问题,为扩散模型的实际应用提供了重要指导,揭示了当前AI技术中训练策略与实际需求之间的错配问题。

阿里巴巴推出Ovis-Image:7B参数就能完美渲染文字的图像生成模型

阿里巴巴推出Ovis-Image:7B参数就能完美渲染文字的图像生成模型

阿里巴巴AIDC-AI团队推出的Ovis-Image是一个仅70亿参数的文字图像生成模型,专门优化文字渲染能力。该模型采用四阶段训练策略,结合Ovis 2.5多模态骨干网络和MMDiT扩散解码器,在文字渲染性能上可媲美参数量更大的开源模型,能在单个高端GPU上高效运行,为文字图像生成技术的普及应用提供了新的可能性。

DeepReinforce团队突破GPU矩阵计算瓶颈:用AI自动生成比英伟达官方库更快的CUDA核心代码

DeepReinforce团队突破GPU矩阵计算瓶颈:用AI自动生成比英伟达官方库更快的CUDA核心代码

DeepReinforce团队突破性研究成果:开发出CUDA-L2系统,首次让人工智能在GPU矩阵计算领域超越英伟达官方库性能11.4%-28.7%。该系统结合大型语言模型和强化学习,能自动生成高性能GPU代码,在1000种矩阵配置测试中全面胜出,为AI计算效率和成本优化开创新paradigm。

浙江大学团队全球首创AI创新能力测试:让机器人也能当"发明家"

浙江大学团队全球首创AI创新能力测试:让机器人也能当"发明家"

浙江大学团队开发了全球首个AI创新能力测试框架InnoGym,首次提出用"性能突破"和"方法新颖"双维度评估AI创新。研究发现现有AI虽有创造力但稳健性不足,无法将新想法可靠实现。该框架包含18个真实竞赛任务,为评估AI科学发现能力建立了新标准。

统一多模态AI模型的"减肥"秘诀:字节跳动团队揭示如何让万能AI变得更高效

统一多模态AI模型的"减肥"秘诀:字节跳动团队揭示如何让万能AI变得更高效

字节跳动团队发现统一多模态AI模型存在严重资源浪费问题,开发出免训练压缩和专家混合适应两套优化方法。研究揭示理解与生成模块使用不同神经元组合,通过动态专家选择机制,让BAGEL模型在保持性能的同时只需激活一半参数,为AI高效部署开辟新路径,显著降低计算成本并提升用户体验。

谷歌研究院如何让AI学会像人类一样从零开始思考问题

谷歌研究院如何让AI学会像人类一样从零开始思考问题

谷歌DeepMind研究团队发现,大型语言模型内部本就具备思维链推理能力,无需外部提示词激发。他们开发的CoT-decoding方法通过让模型生成多个答案路径并筛选包含推理过程的答案,在数学和常识推理任务上显著提升了准确率。这项研究揭示了AI模型内在的推理机制,证明思维链能力是模型固有特性而非外部强加,为提升AI可靠性和可解释性开辟了新方向。

斯坦福团队揭秘:AI大模型竟像学生一样也会"临时抱佛脚"?

斯坦福团队揭秘:AI大模型竟像学生一样也会"临时抱佛脚"?

这项由斯坦福大学和卡内基梅隆大学联合开展的研究,提出了一种创新的AI学习方法——可微归纳逻辑编程。该方法首次系统性地融合了经典逻辑学习与现代深度学习技术,使AI既能从数据中学习,又能掌握可解释的通用规则而非仅记忆具体案例。实验证明这种方法在泛化能力、可解释性和小样本学习上显著优于传统神经网络,在医疗诊断、法律推理等需要透明决策的领域展现出独特应用价值。

澳门大学团队突破实时人脸动画技术:让虚拟主播告别卡顿和延迟

澳门大学团队突破实时人脸动画技术:让虚拟主播告别卡顿和延迟

澳门大学等机构联合开发的PersonaLive技术实现了革命性突破,仅需一张静态照片即可实时生成高质量人物动画视频。该技术采用创新的三阶段训练策略和双重动作控制系统,生成速度比现有技术快7-22倍,延迟仅0.253秒,为虚拟主播、在线教育、远程会议等领域提供了强大的技术支持,标志着实时虚拟人物交互时代的到来。

从电影中的视角体验世界:KAIST团队如何让我们"穿越"到任何角色的第一视角

从电影中的视角体验世界:KAIST团队如何让我们"穿越"到任何角色的第一视角

KAIST研究团队开发了EgoX技术,能将普通第三人称视频转换为逼真的第一人称视角,让用户体验电影主角或运动员的主观视角。该技术采用几何引导自注意力机制和统一条件策略,仅需单个视频输入就能生成高质量的主观视角视频,在娱乐、教育、VR等领域具有广泛应用前景。