最新文章第35页

2025-10-15

Sita推出新一代光纤通信技术助力数据密集型机场建设

航空运输行业技术提供商Sita发布高速光纤服务，提供超可靠、可扩展且安全的连接，有望在复杂机场环境中取代铜缆。Sita无源光网络技术可覆盖20公里距离，无需中间设备，有效支持高清视频监控、智能终端、物联网设备和云服务等数据密集型应用。该方案与Tellabs合作开发，通过集中式无源光网络消除复杂布线需求，为机场、航空公司和地勤服务商提供下一代光纤基础设施。

芬兰量子AI融合项目取得重大突破

芬兰国家技术研究中心VTT与IQM量子计算机公司合作，推出欧洲首台50量子比特量子计算机。IQM通过公开招标获得了向VTT交付300量子比特超导量子计算机的合同，该项目由芬兰政府7000万欧元资助，计划2027年第四季度交付。VTT正致力于寻找量子计算与人工智能融合的突破性应用领域，通过VTT QX云平台为芬兰研究机构和企业提供免费使用机会，巩固芬兰在全球量子计算领域的前沿地位。

宾夕法尼亚大学团队让AI不再违背物理定律：一张照片就能生成符合真实物理规律的视频

宾夕法尼亚大学研究团队开发了PhysCtrl系统，能从单张照片生成符合真实物理定律的视频。该系统通过学习55万个物理仿真数据，结合空间-时间注意力机制和物理约束，准确预测不同材质物体在外力作用下的运动轨迹，解决了传统AI视频生成中物理不合理的问题，在多项评估中显著优于现有方法。

Google DeepMind重磅发现：视频AI不仅会"看"，还会"推理"

Google DeepMind最新研究发现，视频生成AI模型Veo 3展现出惊人的零样本学习能力，能够在未经专门训练的情况下完成图像分割、边缘检测、迷宫求解等多种视觉任务。研究团队通过18,384个视频样本验证了这一发现，认为视频模型正朝着通用视觉智能方向发展，可能引发类似大语言模型的行业变革。

北航团队突破3D重建难题：让电脑像人眼一样"看懂"立体世界

北航团队开发的GeoSVR技术突破了传统3D重建方法的局限，采用稀疏体素表示和体素不确定性评估，无需依赖初始点云即可实现高精度表面重建。该方法通过智能的深度约束和体素协同优化策略，在DTU等标准数据集上取得了最佳性能，为VR/AR、文物保护、影视制作等领域提供了新的技术选择。

Google团队发布史上最轻便AI文本理解模型：3亿参数挑战7亿级性能

Google DeepMind团队发布了EmbeddingGemma，这是一个仅有3.08亿参数的轻量级文本理解模型，却能达到7亿参数模型的性能水平。该模型在权威的多语言文本嵌入基准测试中排名第一，支持250多种语言，特别适合移动设备部署。研究团队通过创新的编码器-解码器初始化、三重损失函数训练和模型融合技术，实现了性能与效率的完美平衡，为AI技术普及化开辟了新路径。

AI智能编程助手正在改变软件开发：奈良先端科学技术大学首次揭示代码生成工具在开源项目中的真实表现

日本奈良先端科学技术大学等机构首次深入研究AI编程工具Claude Code在真实开源项目中的表现。通过分析567个代码贡献，发现83.8%被成功接受，54.9%无需修改直接使用。AI擅长重构、测试和文档工作，但需要人工修正bug处理、代码风格等问题。研究揭示了AI编程工具的实际能力边界和改进方向。

CommonForms：如何教会AI像人一样自动识别表单中的填写区域

这项研究首次创建了CommonForms大规模表单数据集，从800万PDF文档中筛选出5.9万份高质量表单，涵盖20多种语言和14个领域。基于此训练的FFDNet模型在表单字段识别上超越Adobe Acrobat，能识别文本框、复选框和签名区域，训练成本仅500美元且完全开源，为自动化表单处理提供了经济实用的解决方案。

Meta公司发布"软令牌"新技术：让AI思考过程更像人类大脑的连续推理

Meta公司联合多所大学发布"软令牌"新技术，首次实现AI连续推理训练。该方法让AI摆脱传统的逐步推理模式，能同时探索多种思维路径，如人脑般灵活思考。在数学推理任务中，新技术保持了原有准确率，在多样性指标上显著超越传统方法，且对模型原有能力影响更小。关键突破是发现软训练配合硬推理的最佳组合，让现有部署系统无需改造即可受益。

机器人学会"看图说话"：华盛顿大学让机器人像人类一样理解任务

华盛顿大学研究团队开发的PEEK系统通过视觉语言模型为机器人提供路径和重点区域指导，实现了机器人操作任务的零样本泛化。该系统将复杂的环境理解交给专门的视觉模型处理，让机器人专注于动作执行，在真实环境测试中将成功率提升了41.4倍。这种模块化设计方法具有广泛的通用性，可适配多种不同类型的机器人平台。

2025-10-14

点燃个体创新之火 NVIDIA DGX Spark 向全球 AI 开发者正式交付

DGX Spark 萌生AI原生应用的“生命之种”

查尔斯大学突破性发现：同声传译AI系统的评价标准终于有了答案

查尔斯大学和意大利布鲁诺·凯斯勒基金会的研究团队首次系统性解决了同声传译AI系统延迟评估的准确性问题。他们发现现有评估方法存在严重偏差，常给出相互矛盾的结果，并提出了YAAL新指标和SOFTSEGMENTER对齐工具。YAAL准确性达96%，比传统方法提升20多个百分点。研究还开发了专门的长音频评估工具LongYAAL，为AI翻译技术发展提供了可靠的测量标准。

印度理工学院发布史上最大规模印度文化AI测试：15种语言64000题，揭示AI的文化盲区

印度理工学院团队构建了史上最大规模印度文化AI测试基准DRISHTIKON，包含64288道多语言多模态题目，覆盖15种语言和36个地区。研究评估了13个主流AI模型的文化理解能力，发现即使最先进的AI也存在显著文化盲区，特别是在低资源语言和复杂推理任务上表现不佳，为构建文化感知AI提供了重要指导。

沙特Misraj团队打造阿拉伯文档"火眼金睛"：让机器读懂天书般的阿拉伯文字

沙特Misraj团队开发出专门识别阿拉伯文档的AI模型Baseer，解决了阿拉伯文从右到左书写、字母变形、变音符号复杂等技术难题。该模型在50万对图像-文本数据上训练，词错误率仅0.25，显著超越谷歌、微软等产品。研究团队还创建了高质量评测基准，为全球4亿阿拉伯语使用者的数字化需求提供了重要技术支撑。

机器人不再需要"内感觉"？上海交通大学团队发现视觉就够了

上海交通大学研究团队发现，机器人仅依靠视觉就能完成复杂操作任务，无需传统的"内感觉"信息。这种"无状态"控制方法在环境变化时表现更好：高度变化测试中成功率从0%提升至85%，水平变化测试中从6%提升至64%。研究还显示该方法具有更高的数据效率和跨平台适应能力，为未来机器人技术发展开辟了新路径。

德国方言也有被AI歧视？约翰内斯·古腾堡大学美因茨分校重大发现

德国约翰内斯·古腾堡大学美因茨分校研究团队发现，主流AI大语言模型对德国方言使用者存在系统性偏见，将其与教育程度低、思想保守等负面特征关联。研究测试了十个模型和七种德国方言，发现所有AI系统都表现出显著歧视。更意外的是，明确标注方言身份比暗示性提及产生更严重偏见，挑战了现有AI公平性认知。

早稻田大学团队重磅发布：AI看懂旅游视频后竟能制定完美旅行攻略

早稻田大学研究团队开发了VIR-Bench基准，通过200个日本旅游视频测试AI理解地理空间和时间序列的能力。研究发现即使最先进的AI模型在复杂地理推理和时间顺序理解上仍有局限，但开发的AI旅行规划助手在结合多源信息时已能生成实用的旅行方案。

腾讯提出RLPT：让AI像学生一样自主探索，不再依赖人工标注的突破性训练方法

腾讯研究团队提出RLPT新方法，让大语言模型通过预测文章下一段内容进行自主学习，无需人工标注。该技术在多个基准测试中显著提升AI性能，特别是数学推理能力提升5-8分，为解决AI训练中的数据瓶颈和标注依赖问题提供了创新解决方案，展现出良好的可扩展性和实用前景。

Meta研究团队发现大模型"长思考"可能是个误区：高质量推理的真正秘密

Meta研究团队通过分析十个大型推理模型发现，AI推理质量的关键不在思考时长，而在推理效率。他们创新提出"失败步骤比例"指标，发现减少错误探索比延长思考时间更能提升准确率。研究颠覆了"长思考更好"的观念，为AI推理系统设计提供了质量导向的新思路。

在迪拜Gitex 2025大会上，阿联酋成为全球AI领导者的雄心备受关注。微软正帮助该地区组织从AI实验阶段转向实际应用，通过三重方法提供AI助手、协同AI代理和AI战略顾问。微软已在阿联酋大举投资数据中心，去年培训了10万名政府员工，计划到2027年培训100万学习者。阿联酋任命了全球首位AI部长，各部门都配备了首席AI官。微软与政府机构和企业合作，在公民服务和金融流程等领域实现AI的实际应用，构建全面的AI生态系统。

从“支撑工具”到“智能中枢”，AI原生ERP进化

阿里要用AI将云计算重做一遍

PEC 2025 AI创新者大会

用AI，在数字身份验证风暴中心重构信任坐标

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: