香港中文大学团队开发的TR2M系统突破性地解决了计算机视觉中的距离测量难题,通过结合图像和文字信息,让AI既能在各种环境中通用工作,又能给出精确的距离数字。该技术参数量小、效果好,在室内外及医疗场景测试中均表现优异,为自动驾驶、机器人导航、增强现实等应用提供了重要技术支撑,代表了多模态AI融合的重要进展。
中科院团队开发的Stream-Omni是一个突破性的多模态AI模型,能同时处理文字、图像和语音,实现真正的"看听说"一体化交互。该模型创新性地采用了针对性的模态对齐策略,仅用2.3万小时语音数据就达到优秀性能,并能在交互中实时显示中间结果,为AI助手的自然化交流开辟了新路径。
复旦大学研究团队首次系统分析了扩散大语言模型的长文本处理能力,发现其具有独特的"局部透视"现象和稳定的困惑度表现。基于位置编码机制的深入分析,团队开发了LongLLaDA技术,实现了6倍长文本扩展能力且无需重新训练,为AI长文本处理开辟了新路径。
2025年6月21日,以新安全 新价值为主题的第五届数字安全大会在北京隆重召开,本次大会由数世咨询主办,聚焦数据要素化安全、可信数据空间、安全智能体、安全优先的大模型、数智化安全运营等热点话题
斯坦福大学研究团队在2025年提出了首个从语言反馈学习的理论框架,创新性地引入转移消元维度来衡量语言反馈的信息量,并开发了HELiX算法。研究证明语言反馈能带来指数级学习加速,在多个游戏测试中表现优异,为AI学习从简单数值反馈转向丰富语言指导奠定了理论基础,有望推动教育、推荐系统等领域的AI应用革新。
MIT最新研究显示,过度依赖大语言模型的学生出现神经连接减弱、记忆衰退等"认知负债"现象。面对AI工具的普及,我们需要采用更明智的方法来平衡人机协作。文章提出"4A因子"框架:态度上明确使用动机,方法上协调价值观与算法,能力上培养双重素养,雄心上放大而非替代人类潜能。通过有意识的认知训练和混合智能模式,可以将短期便利转化为长期的创造力红利。
据报道,苹果公司高管已就收购Perplexity AI展开内部讨论。这家总部位于旧金山的公司运营着一款由人工智能驱动的消费者搜索引擎,能够生成自然语言回复而非传统网页列表。Perplexity在最近融资中获得140亿美元估值,月活跃用户超过1500万,每月查询量增长20%。苹果企业发展副总裁已与多位高管讨论此收购想法。
数据中心防护涂层正成为应对能耗上升和温室气体排放的关键解决方案。随着行业快速扩张带来环境挑战,这些创新涂层技术为平衡数字化增长与环境责任提供重要工具。专业涂层可延长设施寿命、降低维护成本,同时通过隔热涂层、反射涂层等技术优化能效,减少冷却系统负担。未来涂层将与被动冷却技术结合,支持可持续发展目标实现。
随着大语言模型快速发展,如何避免《终结者》中天网般的AI威胁成为关注焦点。专家指出,组织需要在AI创新与风险控制间找到平衡点,建立可扩展的责任制度。面对AI代理技术兴起,人机协作模式正发生根本变化,网络安全边界也从硬件转向认知层面。由于恶意攻击者往往率先采用AI技术,防御方必须快速构建对应措施,否则可能面临数字智能主导的未来威胁。
特斯拉计划在德州奥斯汀推出配备安全员的无人驾驶出租车试点服务。文章回顾了自动驾驶汽车安全员的发展历史,以及帮助自动驾驶汽车解决复杂道路问题的各种技术。移除安全员是将测试原型车转变为真正无人驾驶出租车的关键步骤。目前的解决方案包括车内安全员、远程驾驶、远程监督、远程协助等多种模式,各公司都在探索不同的人机协作方式来确保自动驾驶的安全性和可靠性。
谷歌AI概览功能自2024年5月发布以来,虽然搜索展示量增长49%,但网站点击率下降30%。企业分析公司BrightEdge数据显示,AI搜索让用户无需点击原网站即可获得答案。旅游网站搜索流量同比下降20%,新闻媒体下降17%。Cloudflare CEO透露,谷歌爬取页面与引流比例从十年前的2:1恶化至现在的18:1,AI公司获取更多内容却提供更少回报,严重冲击依赖搜索流量的网站生态。
网络弹性供应商Cohesity通过其DataProtect产品,成为首批通过MongoDB第三方备份运维管理API提供MongoDB工作负载保护的数据保护软件供应商之一。该集成方案提供并行数据流处理、比传统方法快4倍的数据库恢复速度、PB级扩展架构支持,以及不可变存储、数据加密等安全功能,专为拥有大规模关键MongoDB环境的企业设计。
特斯拉原定6月22日在奥斯汀推出"车内无人"的Robotaxi服务未能如期实现。公司宣布将采用限制性服务模式,配备特斯拉员工作为安全员。与传统做法不同,安全员将坐在副驾驶座而非驾驶座,这一做法此前曾被俄罗斯Yandex公司采用。服务将限制在上午6点至午夜时段,仅对受邀乘客开放,避开复杂路段,恶劣天气下暂停服务。业内普遍认为副驾驶配置主要为营造视觉效果,实际安全性不如传统驾驶位配置。
法国AI公司Mistral发布开源模型Mistral Small 3.2-24B,在3.1版本基础上改进指令遵循、输出稳定性和函数调用可靠性。新版本可在单个A100/H100 80GB GPU上运行,降低了企业部署门槛。虽然整体架构未变,但在指令准确性和减少重复输出方面有显著提升,同时保持Apache 2.0开源许可。
微出行行业正经历转型,从早期疯狂扩张转向可持续商业模式。在布鲁塞尔微出行欧洲会议上,多家初创企业展示创新解决方案:英国Convoy推出自行车货运改装套件;德国Azora Charge开发太阳能充电停车站;Fleetser打造二手电动车辆交易平台;意大利Switch将AI应用于车队管理;波黑Zapp推出特许经营超级应用;法国J2R设计时尚电动摩托车;德国Trace Mobility提供商业智能服务。这些企业代表着微出行产业的新发展阶段。
NVIDIA研究团队揭示了训练AI模型同时掌握数学推理和编程能力的突破性方法。通过精心设计的监督学习和强化学习协同训练,他们发现仅用数学题训练就能显著提升编程能力。研究提出了温度调节、阶段性训练等关键技术,最终的AceReason-Nemotron 1.1模型在多项权威测试中达到业界领先水平,为AI跨领域能力发展提供了新范式。
弗吉尼亚理工大学推出AR-RAG技术,让AI像拼图高手一样在生成图像时动态检索参考片段。该技术突破传统"闭门造车"模式,实现边生成边参考,显著提升图像质量和细节准确性。提供免训练DAiD和优化训练FAiD两种方案,在多个权威测试中创造同规模模型最佳成绩。
Soul AI团队发布突破性研究成果TransDiff,首次成功融合自回归变换器与扩散模型,实现图像生成质量与速度的双重突破。该技术在ImageNet数据集上创造FID 1.42新纪录,同时推理速度比传统方法快112倍,并提出多参考自回归全新生成范式。
新加坡研究团队深入探讨了0.5B参数小型推理语言模型的能力边界和优化策略。研究发现强化学习是提升小模型推理能力最有效的方法,而传统的监督微调和知识蒸馏效果有限。经过优化的小模型在数学推理任务上表现显著提升,为AI技术普及化提供了新路径。
日本奈良先端科学技术大学院大学研究团队提出SeqPE方法,突破传统AI位置编码局限。该方法像教AI"数数"一样处理位置信息,支持任意长度文本和图像处理。通过序列化表示和两个训练辅助器,SeqPE在语言建模、问答和图像分类中显著超越现有方法,为通用AI系统发展奠定重要基础。