Sarang Gupta从小热爱动手解决问题,11岁开始学习编程。他拥有香港科技大学工业工程与商业管理双学士及哥伦比亚大学数据科学硕士学位。曾在高盛开发自动化工具优化交易流程,后加入Asana主导AI功能团队并申请多项专利。2025年9月加入OpenAI,专注为销售与营销团队构建数据驱动模型,助力企业高效采用ChatGPT等产品。他的目标是让AI惠及更多人。
北京大学与香港大学联合团队首次开发出透明化AI智能体评估框架Claw-Eval,解决了传统评估只看结果不看过程的问题。该框架通过三个独立证据通道全程监控AI执行,涵盖300个测试任务,发现传统方法遗漏44%安全违规。研究揭示AI一致性比峰值能力更重要,多模态能力存在严重不均衡,为AI发展提供重要指导。
南京大学团队开发出ACES方法,解决AI代码生成中的测试可靠性评估难题。该方法通过"留一法"评估测试间一致性,无需知道代码正确性即可判断测试质量,在HumanEval等基准上超越现有方法。研究首次提供可证明准则区分有效测试与误导测试,为AI辅助编程提供更可靠的代码筛选方案。
今天讲的出海案例是运达股份,国内第四大风电整机制造商,在阿联酋设立境外公司承载数据中心与算力业务。
微软于4月14日发布本月补丁更新,涉及超过160个独立漏洞,加上第三方及Chromium补丁共近250项,规模创历史之最。其中包含两个零日漏洞:CVE-2026-32201为SharePoint Server跨站脚本漏洞,已被野外利用;CVE-2026-33825为Defender权限提升漏洞,已公开披露但暂未发现利用案例。此外还有8个严重级别漏洞及一个Chromium远程代码执行漏洞,安全专家建议企业立即优先部署补丁。
英伟达宣布推出全球首个面向量子计算的开源AI模型系列——Ising,涵盖实时量子纠错与校准两大模型。其中,Ising Decoding基于3D卷积神经网络,速度和精度分别比现有开源标准提升2.5倍和3倍;Ising Calibration则通过视觉语言模型自动优化量子处理器的控制信号。目前,该模型已被康奈尔大学、IonQ等多家机构采用。
美国多地掀起限制数据中心建设浪潮,桑德斯等议员提出立法,要求在建立全国性保障措施前暂停新建AI数据中心。据统计,2024年5月至2025年6月间,至少36个数据中心项目遭延误或叫停,涉及投资约1620亿美元。业界人士指出,电网潜力尚未充分释放,关键在于提升利用效率而非停止建设。专家警告,暂停令讨论已显著抬高项目执行风险,北美市场或将分化为联邦主导的增长枢纽与受地方监管限制的资源区。
Firefox Nightly已添加Web Serial API支持,距该提案首次提出已过去13年。该API允许浏览器与3D打印机、Arduino等微控制器及支持USB/蓝牙串口模拟的设备直接通信。Chrome早在2021年便已支持该功能。Mozilla此前曾以安全为由反对该API,但于2022年开始重新评估立场。目前激活需手动开启实验标志,正式文档尚未发布。苹果WebKit团队仍以安全和隐私问题为由反对该API。
Commvault发布新产品AI Protect,支持在AWS、Azure和GCP环境中发现、监控AI代理,并在出现异常时回滚其操作。该工具通过建立行为基线模型,识别异常活动并发出警报。此外,Commvault还推出Data Activate和AI Studio两款产品,分别用于将备份数据纳入机器学习流水线,以及帮助企业构建和部署自定义AI代理,全面布局AI弹性保护领域。
英国政府AI安全研究所(AISI)近日发布了对Anthropic旗下Mythos Preview模型的独立评估报告。结果显示,该模型在单项网络安全任务测试中与其他前沿模型表现相近,但在模拟32步企业网络数据渗透的"最后防线"测试中,Mythos成为首个完整完成全程攻击链的模型。AISI指出,该模型已具备自主攻击小型、防御薄弱企业系统的能力,并建议系统防护设计者同样借助AI工具强化防御体系。
马里兰大学研究团队发现AI模型压缩存在任务依赖性悖论:同一个"瘦身"模型在分类检索等任务中表现稳定,但在文本生成任务中却严重失效。研究揭示了模型内部三层信息处理的差异敏感性,其中概率转换层的非线性放大效应是导致生成任务失败的关键因素,为AI模型压缩策略提供重要理论指导。
Video-MME团队开发了迄今最严格的AI视频理解评测基准Video-MME-v2,采用三层递进式测试架构和创新的群组评分机制。测试结果显示当前最强AI模型与人类专家存在巨大差距(49.4分vs90.7分),揭示了AI在视频理解方面的层次性瓶颈和过度依赖文字信息的问题,为未来AI视频理解技术发展指明方向。
越来越多的美国人借助AI获取健康建议,各大医疗机构也随之推出自有品牌聊天机器人。哈特福德医疗系统与K Health合作推出PatientGPT,Epic旗下也有Emmie等产品陆续上线。支持者认为此举能弥补医疗资源缺口,但专家对其安全性、监管机制及实际效果仍存疑虑。研究显示,LLM在真实场景中的诊断准确率不足三分之一,医疗AI落地之路仍面临挑战。
华盛顿州贝尔维尤市正借助AI技术改革繁琐的建筑许可审批流程。该市CIO Sabra Schneider与初创公司Govstream.ai合作,目标是将每年2万小时的许可审批工时减少30%,并将重复提交率降低50%。为更好地与AI初创企业合作,贝尔维尤市于2025年7月通过"创新设计合作政策",取代传统招标模式。目前已有198名开发服务部门用户使用该AI工具,项目进展乐观。
Gartner分析师指出,AI正重塑IT团队的工作模式,推动CIO重新思考员工技能培养方向。预计到2030年,75%的工作将由人机协同完成。然而,AI的普及也带来"经验饥渴"问题——初级员工因缺乏实战积累,难以有效驾驭AI工具。调查显示,当前仅25%的IT从业者具备多元技能。Gartner建议CIO采用"AI增强型领导力"策略,将人类经验与机器效率结合,重点培养预防性网络安全、情境工程等前沿技能。
谷歌I/O 2026将于5月19日至20日在加利福尼亚州山景城举行,主题聚焦AI进展与全平台产品更新。预计大会将带来Gemini 4模型、Android 17开发者预览、ChromeOS与Android融合平台(代号"Aluminium OS")等重磅内容,Veo文本生成视频模型与Project Astra通用AI助手或也将亮相。硬件方面,Android XR设备比Pixel手机更可能登场。外界同样期待谷歌带来出人意料的创新惊喜。
据SoftServe与MIT技术评论联合发布的报告显示,半数软件工程团队将智能体AI列为今年首要投资重点,84%的团队认为其将在未来三年内成为核心投资方向。调查覆盖300名CIO、CTO及技术领导者。然而,现有系统集成难度与计算资源成本成为主要障碍,目前仅12%的团队实现了广泛应用。专家指出,一旦全面落地,智能体AI将渗透代码生成、测试、重构及部署等各环节,但数据质量与治理信任问题仍是不可忽视的挑战。
美国银行首席技术与信息官Hari Gopalkrishnan在Semafor世界经济2026峰会上,阐述了该行AI战略的四大重点:端到端流程变革、规模化复用、治理合规及投资回报。该行将135亿美元技术预算的30%用于AI等新举措,旗下约21.3万名员工中逾90%已使用AI助手Erica。银行还推出AI赋能会议工具,大幅缩短财务顾问的服务周期,同时建立AI学院对员工进行系统培训,近年来44%的职位通过内部晋升填补。
Google Home发布2026年4月更新,重点优化Gemini语音助手体验。更新后,Gemini能更准确判断用户说话结束时机,减少打断情况,并对简单问题给出更快响应。音乐播放识别能力增强,即便发音不准或环境嘈杂也能找到正确歌单。自然语言理解能力提升,支持更灵活的笔记与列表编辑操作。此外,家长控制功能扩展,iOS摄像头体验优化,温控界面也更精准。