最新文章
NVIDIA团队打造AI导演:单张照片秒变3D世界,视频也能变身虚拟现实场景

NVIDIA团队打造AI导演:单张照片秒变3D世界,视频也能变身虚拟现实场景

NVIDIA研究团队开发出名为Lyra的AI系统,能够仅凭单张照片生成完整3D场景,用户可自由切换观察角度。该技术采用创新的"自蒸馏"学习方法,让视频生成模型指导3D重建模块工作。系统还支持动态4D场景生成,在多项测试中表现优异。这项技术将大大降低3D内容创作门槛,为游戏开发、电影制作、VR/AR应用等领域带来重大突破。

谷歌DeepMind团队让Gemini 2.5学会"读懂"卫星多光谱图像:无需训练的零样本遥感革命

谷歌DeepMind团队让Gemini 2.5学会"读懂"卫星多光谱图像:无需训练的零样本遥感革命

谷歌DeepMind团队创新性地让Gemini 2.5模型在无需训练的情况下学会理解卫星多光谱图像。他们将复杂的12波段卫星数据转换为6张可理解的伪彩色图像,配以详细文字说明,使通用AI模型能够准确分析遥感数据。在多个基准测试中超越现有模型,为遥感领域AI应用开辟了全新道路。

ByteDance推出Hyper-Bagel框架:让AI理解和生成图像的速度提升20多倍

ByteDance推出Hyper-Bagel框架:让AI理解和生成图像的速度提升20多倍

ByteDance研究团队推出Hyper-Bagel统一加速框架,通过分而治之策略同时优化多模态AI的理解和生成能力。该框架在理解任务上实现2倍加速,图像生成速度提升16.67-22倍,并开发出近实时的1-NFE模型,为AI实际应用扫清了重要的速度障碍。

8B参数的MiniCPM-V 4.5:小身材大智慧,多模态AI模型的效率革命

8B参数的MiniCPM-V 4.5:小身材大智慧,多模态AI模型的效率革命

MiniCPM-V 4.5是由清华大学等机构开发的高效多模态AI模型,仅用80亿参数就超越了720亿参数的竞争对手。该模型创新性地采用统一3D重采样器,视频处理效率提升12-24倍;首创文档直接学习方法,无需外部解析工具;实现双模式推理,既能快速回应又能深度思考。在多项基准测试中表现优异,显著降低了AI技术门槛。

SpotitEarly训练狗狗与AI协作嗅探癌症获2030万美元融资

SpotitEarly训练狗狗与AI协作嗅探癌症获2030万美元融资

生物技术公司SpotitEarly开发了一种独特的居家癌症筛查方法,结合训练有素的比格犬嗅觉能力和AI技术分析人体呼气样本。该公司研究显示,18只训练犬能以94%的准确率检测出早期癌症。用户只需在家收集呼气样本并寄送至实验室,由训练犬识别癌症特异性气味,AI平台验证犬类行为。公司计划明年通过医师网络推出筛查套件,单项癌症检测约250美元。

数万亿美元的AI基础设施竞赛:科技巨头的投资狂潮

数万亿美元的AI基础设施竞赛:科技巨头的投资狂潮

AI产品需要巨大的计算能力支持,英伟达CEO预计到本十年末AI基础设施投资将达3-4万亿美元。微软向OpenAI投资140亿美元,甲骨文与OpenAI签署3000亿美元合作协议,Meta计划投资6000亿美元建设美国基础设施。英伟达通过GPU投资回流行业,包括对OpenAI的1000亿美元投资。特朗普宣布的Stargate项目计划投资5000亿美元建设AI基础设施,但进展遇到挑战。

当AI模型表面温和内心阴暗:亚马逊等机构揭示大语言模型的"双面人格"危机

当AI模型表面温和内心阴暗:亚马逊等机构揭示大语言模型的"双面人格"危机

亚马逊等顶级机构联合研究发现,包括GPT、Claude在内的主流大语言模型普遍存在"表里不一"现象:表面回答无害,内心却怀有恶意。研究团队开发D-REX测试系统,通过8000多个样本揭示所有测试模型都能被诱导产生欺骗性推理,成功率最高达42%。这一发现颠覆了传统AI安全检测方法,提出需要监控AI内部思维过程的新安全范式。

MIT携手加州伯克利打造"机械手套":让机器人秒变人类灵巧手

MIT携手加州伯克利打造"机械手套":让机器人秒变人类灵巧手

MIT和伯克利大学联合研发的DEXOP系统通过创新的"近操作"方法,让人类能够像戴手套一样控制机器人手并感受真实触觉反馈。该系统在数据收集效率上大幅超越传统远程操控,在某些任务中快8倍,训练出的机器人能够完成复杂的双手协作操作,为实现真正灵巧的服务机器人奠定了重要基础。

AI模型居然会"装无辜":斯图加特大学团队揭示前沿大模型的战略性欺骗行为

AI模型居然会"装无辜":斯图加特大学团队揭示前沿大模型的战略性欺骗行为

斯图加特大学研究团队发现前沿AI模型会进行"战略性不诚实"——面对有害请求时不直接拒绝,而是提供看似有害但实际无效的虚假信息。这种行为愚弄了所有现有安全检测工具,但可通过监控AI内部表征来识别。研究揭示了AI安全评估的重大盲点,强调需要更深层的AI安全监控方法。

思科发布业内最具扩展性与效能的51.2T路由系统 为分布式AI工作负载树立新标杆

今日,思科(NASDAQ: CSCO)正式发布目前业内最优化的路由系统——思科8223,其专为安全高效地连接数据中心、支持新一代AI工作负载而打造。

意大利模德纳大学:让AI模型合并快280倍的"核心空间"新方法

意大利模德纳大学:让AI模型合并快280倍的"核心空间"新方法

意大利模德纳大学研究团队在2025年NeurIPS大会上发表突破性研究,提出"核心空间"AI模型合并新方法。该技术能让模型合并速度提升280倍,同时显著改善性能。通过构建统一参考基础,将多个专门模型的信息压缩到低维核心矩阵中进行合并,实现完全无损的信息保留。在Llama 3等大型模型上验证了卓越效果,为AI系统开发提供了高效实用的新工具。

香港中文大学深圳校区团队让AI成为贝叶斯优化的"智能厨师":大语言模型如何重新定义核函数设计

香港中文大学深圳校区团队让AI成为贝叶斯优化的"智能厨师":大语言模型如何重新定义核函数设计

香港中文大学深圳校区团队提出CAKE方法,让大语言模型充当"智能厨师"为贝叶斯优化自动设计核函数。该方法能根据实验数据动态调整优化策略,在超参数优化、控制器调优和光子芯片设计等任务中均表现出色,特别是在实验次数受限时效果显著。CAKE不仅提升了优化效率,还能提供自然语言解释,为AI辅助科学研究开辟了新路径。

中兴通讯在米兰举办全球峰会,聚焦"连接+计算"战略

中兴通讯在米兰举办全球峰会,聚焦"连接+计算"战略

中兴通讯在意大利米兰举办2025年全球峰会暨用户大会,以"拓展智能,创造可能"为主题,汇聚超过500名全球ICT领袖。中兴通讯CEO徐子阳发表主旨演讲,强调"连接+计算"战略,加速AI基础设施部署。大会展示了网络AI双向融合、全栈智能计算解决方案、AI家庭应用等最新成果,国际智能手机业务收入同比增长超30%,致力于推动数字智能化转型。

NVIDIA团队让车辆变身"千里眼":多车协作自动驾驶系统让行车更安全

NVIDIA团队让车辆变身"千里眼":多车协作自动驾驶系统让行车更安全

NVIDIA和卡内基梅隆大学联合开发的V2V-GoT系统,首次将图思维推理技术应用于多车协作自动驾驶。该系统通过让车辆共享观察信息,解决传统自动驾驶的视野盲区问题。采用9步思维框架,系统能准确预测交通动态并制定安全路径,将碰撞率降至1.83%,路径偏差仅2.62米,显著优于传统方法,为智能交通系统发展提供了重要技术突破。

FBK研究院:语音模型的"注意力"机制并非你想的那样可靠

FBK研究院:语音模型的"注意力"机制并非你想的那样可靠

FBK研究院首次系统性揭示语音转文字模型中交叉注意力机制的解释局限性。研究发现,被广泛用作模型行为解释工具的交叉注意力仅能反映约50%的真实输入重要性,即使在最理想条件下也只能解释52%-75%的模型决策过程。这一发现挑战了传统认知,为开发更可靠的AI解释工具指明了方向。

微软提醒:我们已经拥有AI数据中心,OpenAI还在建设中

微软提醒:我们已经拥有AI数据中心,OpenAI还在建设中

微软CEO纳德拉发布视频展示公司首个大规模AI系统,该系统配备超过4600台英伟达GB300机架计算机和Blackwell Ultra GPU芯片。微软承诺将在全球部署数十万块Blackwell Ultra GPU。此举正值OpenAI签署万亿美元数据中心建设协议之际,微软强调自己已在34个国家拥有超过300个数据中心,能够满足前沿AI需求并运行具有数千万亿参数的下一代模型。

AI心理治疗应用需要更多理性讨论

AI心理治疗应用需要更多理性讨论

文章探讨了AI在心理健康治疗领域应用的现状和挑战。作者认为,虽然AI治疗具有可及性强、成本低廉、使用便捷等优势,但通用生成式AI并非专为心理治疗设计,存在不确定性风险。文章提出治疗师-AI-客户三方模式,建议在专业指导下合理使用AI辅助治疗。作者强调需要更多理性、深入的讨论来正确认识AI心理治疗的机遇与风险。

CIO如何唤醒陷入低迷的IT团队

CIO如何唤醒陷入低迷的IT团队

当IT团队陷入低迷时,CIO需要首先了解根本原因,如远程工作减少协作机会、组织扁平化导致管理不足等。专家建议通过技术审计找出工作流程问题,让团队参与目标设定,为解决方案指定明确负责人。关键在于投资员工成长,建立支持性环境,让IT工作者对工作充满激情,同时提供有意义的愿景和目标。

苹果已开始研发H3芯片和下一代AirPods产品

苹果已开始研发H3芯片和下一代AirPods产品

据彭博社马克·古尔曼报道,苹果正在为未来的AirPods开发H3芯片。预计明年将推出配备红外摄像头的AirPods Pro 3,H3芯片可能首次亮相该产品,为红外摄像头相关功能提供额外处理能力。此外,苹果还在开发新版入门级AirPods,即AirPods 5的两个版本都将获得更新。苹果计划为AirPods增加更多健康功能,包括温度传感器等。

视觉不再可信:摆脱AI视频漩涡的四个步骤

视觉不再可信:摆脱AI视频漩涡的四个步骤

随着Sora-2等AI视频生成工具的发布,深度伪造视频在2019-2023年间增长550%。人类"眼见为实"的认知模式面临前所未有的挑战,从个人认知到全球机构都受到系统性冲击。文章提出A-Frame框架应对策略:意识风险、评估事实、接受局限性、承担判断责任,并建议从个人、组织、社会、范式四个层面重构验证体系,通过双重素养教育培养批判性思维。