最新文章
2025-10-09

智慧城市的绿色引擎:从楼宇到数据中心的可持续之路

智慧城市的意义不止于管理效率的提升。它既是应对能源和环境挑战的重要抓手,也是增强城市韧性、推动社会可持续发展的关键路径。特别是在 AI、大数据、云计算等新兴技术驱动下,智慧城市已成为实现减碳目标和构建绿色社会的战略性引擎。

加拿大女王大学:开源AI生态系统中的"版权炸弹"即将引爆?

加拿大女王大学:开源AI生态系统中的"版权炸弹"即将引爆?

加拿大女王大学研究团队首次对开源AI生态系统进行端到端许可证合规审计,发现35.5%的AI模型在集成到应用时存在许可证违规。他们开发的LicenseRec系统能自动检测冲突并修复86.4%的违规问题,揭示了AI供应链中系统性的"许可证漂移"现象及其法律风险。

语音识别遇上"扩散大脑":剑桥-清华-伊利诺伊团队让机器听得更准确

语音识别遇上"扩散大脑":剑桥-清华-伊利诺伊团队让机器听得更准确

这项由剑桥大学、清华大学和伊利诺伊大学合作的研究首次将扩散大语言模型引入语音识别领域,开发出Whisper-LLaDA系统。该系统具备双向理解能力,能够同时考虑语音的前后文信息,在LibriSpeech数据集上实现了12.3%的错误率相对改进,同时在大多数配置下提供了更快的推理速度,为语音识别技术开辟了新的发展方向。

微软研究院突破性成果:AI也能像"建筑师"一样从零开始建造完整的代码世界了!

微软研究院突破性成果:AI也能像"建筑师"一样从零开始建造完整的代码世界了!

微软研究院突破性AI编程技术RPG能够像建筑师绘制蓝图一样规划整个软件项目,通过图形化结构替代模糊的自然语言描述,实现从零开始构建大规模代码库。ZeroRepo系统基于RPG生成的代码平均达3.6万行,比竞争对手多4倍,功能覆盖率81.5%,有望根本性改变软件开发方式。

中科院团队发布"万能评委"BaseReward:彻底解决AI多模态模型的"判官难题"

中科院团队发布"万能评委"BaseReward:彻底解决AI多模态模型的"判官难题"

中科院团队发布BaseReward多模态奖励模型,通过系统性实验建立了构建高性能多模态奖励模型的完整方法论。该模型采用简洁的两层架构设计,在精心筛选的280万偏好数据上训练,在多个权威基准测试中创下新纪录,准确率提升超过11%。研究还发现纯文本数据能显著提升多模态判断能力的重要现象,为AI对齐技术发展提供了重要指导。

IBM大型机本月获得Spyre AI加速器升级

IBM大型机本月获得Spyre AI加速器升级

IBM Spyre加速器将于本月晚些时候正式推出,为z17大型机、LinuxONE 5和Power11系统等企业级硬件的AI能力提供显著提升。该加速器基于定制芯片的PCIe卡,配备32个独立加速器核心,专为处理AI工作负载需求而设计。系统最多可配置48张Spyre卡,支持多模型AI处理,包括生成式AI和大语言模型,主要应用于金融交易欺诈检测等关键业务场景。

Ganiga将在TechCrunch Disrupt展示AI垃圾分拣机器人

Ganiga将在TechCrunch Disrupt展示AI垃圾分拣机器人

意大利初创公司Ganiga开发了AI驱动的智能垃圾分拣机器人Hoooly,能自动识别并分类垃圾和可回收物。该公司产品包括机器人垃圾桶、智能盖子和废物追踪软件,旨在解决全球塑料回收率不足10%的问题。2024年公司收入50万美元,已向谷歌和多个机场销售超120台设备,计划融资300万美元并拓展美国市场。

新加坡昇菘集团获批自动驾驶车队运营供应链

新加坡昇菘集团获批自动驾驶车队运营供应链

新加坡Fair Price集团成为首家获准在公路使用自动驾驶车辆进行供应链运营的机构。该集团与自动驾驶技术公司Zelos合作,将部署近30辆Z10无人驾驶电动车在配送中心间运输货物,占其车队总数近30%。车辆载重1.5吨,单次充电续航210公里,预计每年减少27吨碳排放。此举是Fair Price构建可持续供应链战略的一部分。

思科新路由器将分散数据中心整合为AI训练集群

思科新路由器将分散数据中心整合为AI训练集群

思科发布8223路由器,搭载自研Silicon One P200 ASIC芯片,提供51.2 Tbps带宽。结合800 Gbps相干光学技术,可支持1000公里跨度连接。该架构理论上可实现3 EB/s聚合带宽,足以连接当今最大的AI训练集群,支持数百万GPU的多站点部署。微软和阿里巴巴等云服务商正在评估该技术。尽管延迟仍是挑战,但谷歌DeepMind研究表明通过模型压缩和通信调度可克服相关问题。

CoreWeave推出无服务器强化学习平台降低企业AI成本

CoreWeave推出无服务器强化学习平台降低企业AI成本

GPU租赁公司CoreWeave发布无服务器强化学习平台,旨在让企业更容易使用强化学习技术。该平台基于其收购的OpenPipe和Weights & Biases构建,客户无需手动配置虚拟机或裸机服务器,仅需为生成的令牌付费。据称该方案比本地Nvidia H100快1.4倍且成本降低40%。这是CoreWeave拓展AI服务业务、实现客户群体多元化战略的一部分。

微软研究院破解AI统一难题:一个神奇网络同时精通生成、识别和分类

微软研究院破解AI统一难题:一个神奇网络同时精通生成、识别和分类

微软研究院提出潜在分区网络(LZN),首次实现生成建模、表示学习和分类任务的真正统一。该框架通过共享高斯潜在空间和创新的潜在对齐机制,让原本独立的AI任务协同工作。实验显示LZN不仅能增强现有模型性能,还能独立完成各类任务,多任务联合训练效果更是超越单独训练。这项研究为构建下一代通用AI系统提供了新的架构思路。

机器人学会自己进步:上海AI实验室让机器人在真实世界中像人类一样从错误中学习

机器人学会自己进步:上海AI实验室让机器人在真实世界中像人类一样从错误中学习

上海AI实验室开发的VLAC模型让机器人首次具备真实世界自主学习能力。该系统如同给机器人配备智能导师,能实时评估动作效果并从中学习。在四个操作任务测试中,机器人成功率从30%提升至90%,仅需200次练习。技术结合视觉、语言理解和动作生成,支持跨场景适应和人机协作,为家庭服务、医疗护理等领域应用奠定基础。

当你和Siri说"用悲伤的语气读这段话"时,它真的理解了你的意思吗?

当你和Siri说"用悲伤的语气读这段话"时,它真的理解了你的意思吗?

台湾大学研究团队通过大规模人类听觉测试,首次系统评估了五个主流AI语音系统对自然语言指令的理解准确度。研究发现GPT-4o-mini-TTS在程度副词和情感强度控制方面表现最佳,但所有系统在年龄模仿和重音控制上都存在明显不足,普遍倾向于生成成年人声音,揭示了当前AI语音技术在精细控制方面的局限性。

康卡斯特和UCL联手:让语音识别模型学会"脑补",仅凭文字就能适应新领域

康卡斯特和UCL联手:让语音识别模型学会"脑补",仅凭文字就能适应新领域

康卡斯特和UCL研究团队开发了WhisTLE技术,解决语音识别模型在新领域适应中只能依赖昂贵语音数据的问题。该方法通过训练变分自编码器模拟语音编码器输出,实现仅用文本进行深度监督适应。实验显示平均降低12.3%词错误率,且推理时无额外计算成本,为跨域语音识别提供了高效实用的解决方案。

复旦大学团队重磅突破:机器人终于学会了"问问题",从被动执行者进化为主动合作伙伴

复旦大学团队重磅突破:机器人终于学会了"问问题",从被动执行者进化为主动合作伙伴

复旦大学团队开发出Ask-to-Clarify机器人框架,让机器人首次具备主动询问澄清模糊指令的能力。该系统采用双组件架构和两阶段训练策略,在8项真实任务中全面超越现有技术,成功率达90-98%。这一突破将机器人从被动执行者转变为主动合作伙伴,为家庭服务机器人的实用化扫清重要障碍。

苹果公司首次发布统一多模态AI模型Manzano:一个模型既能看懂图片又能画出图片

苹果公司首次发布统一多模态AI模型Manzano:一个模型既能看懂图片又能画出图片

苹果公司发布突破性AI模型Manzano,首次实现单一模型同时具备图像理解和生成能力。该模型采用创新的混合视觉标记器设计,通过统一的语义空间有效解决了传统多模态模型中理解与生成任务的冲突问题。在多项基准测试中,Manzano不仅达到了专门化模型的性能水平,还展现出优异的规模化效应和实用性。

伊利诺伊大学团队突破手机视频重建难题:不需要额外传感器,仅凭摄像头就能完美还原动态场景

伊利诺伊大学团队突破手机视频重建难题:不需要额外传感器,仅凭摄像头就能完美还原动态场景

伊利诺伊大学团队开发出ROS-Cam系统,仅需普通RGB视频即可精确重建动态三维场景,无需激光雷达等额外传感器。该技术通过补丁式追踪过滤器、异常值感知优化和两阶段策略,在多个数据集上超越现有方法,处理速度提升2-12倍。这项突破有望让普通用户轻松创建专业级三维内容,在电商、教育、文化保护等领域具有广阔应用前景。

小米研究院推出革命性GUI自动化框架:让AI像人一样"眨眼-思考-执行"操作界面

小米研究院推出革命性GUI自动化框架:让AI像人一样"眨眼-思考-执行"操作界面

小米研究院推出的BTL-UI是一个革命性的GUI智能代理框架,通过模拟人类"眨眼-思考-执行"的认知过程,让AI能够像人类一样自然地操作各种应用界面。该技术在多个基准测试中实现了显著性能提升,为未来的人机交互和自动化应用奠定了重要基础。

当年只有30人在训练AGI:Anthropic预训练负责人访谈的万字实录,曾经的AI实验室都是通才,现在大家都是专才
2025-10-09

当年只有30人在训练AGI:Anthropic预训练负责人访谈的万字实录,曾经的AI实验室都是通才,现在大家都是专才

Y Combinator合伙人Ankit Gupta与Anthropic预训练负责人Nick Joseph最近进行了一次深度对话。

NBA中国与阿里云宣布达成多年合作,重塑球迷互动体验

NBA中国与阿里云宣布达成多年合作,重塑球迷互动体验

NBA中国将利用阿里云的人工智能和云计算服务,支持一系列数字球迷互动计划。双方将基于阿里巴巴通义千问大模型,开发一个专属AI模型。