随着苹果CEO即将完成交接,折叠屏手机、触控Mac及AI可穿戴设备等新品呼之欲出。然而,支撑这些设备运行的核心AI能力仍不明朗。苹果已宣布与Google Gemini合作升级Siri,但具体落地细节尚未披露。即将召开的WWDC开发者大会,被外界视为苹果展示新一代Siri能力的最佳时机。从智能眼镜到摄像头AirPods,苹果的下一代可穿戴生态亟需更强的多模态AI支撑。
Meta宣布将其AI客服工具"Meta Business Agent"正式向全球WhatsApp Business用户开放。该AI智能体可回答客户问题、推荐产品、预约服务、筛选销售线索,并在必要时转接人工客服。此外,该功能也将上线Instagram私信。Meta还在测试夜间对话摘要、市场调研、日历管理等功能,并计划支持企业接入Shopify、Zendesk等第三方系统。该服务将通过WhatsApp Business Premium订阅收费。
英国竞争和市场管理局(CMA)要求谷歌为出版商提供退出AI搜索功能的选项。谷歌宣布,将在Search Console中新增开关,允许出版商选择不出现在AI Overview、AI Mode等生成式搜索功能中。该措施将先在英国部分出版商中测试,再推广至全球。CMA称此举为"全球首创",有助于出版商在内容授权谈判中占据更有利地位。谷歌同时承诺改善内容归因,增加内联链接并添加网站预览。
据报道,谷歌正在悄然推进一项"机密内容收购试点"计划,向Play商店的Android应用开发者付费购买其应用代码,用于训练AI模型。谷歌在邮件中将此项目定位为帮助开发者"从应用中获取额外收入"的机会,并称所购代码将用于"改进谷歌开发者工具和产品"。与普通互联网公开内容不同,Android应用代码通常属于私有内容,此次谷歌选择付费获取,引发外界关注。
iOS 26为CarPlay带来了多项新功能,其中"智能显示缩放"(Smart Display Zoom)是一项早就应该存在的设置。该功能位于CarPlay设置的"显示"菜单中,开启后系统将自动针对车辆屏幕进行优化适配。由于市场上车载屏幕尺寸与形状各异,该功能可确保CarPlay界面完美匹配不同显示屏,部分应用在开启后能显示更多内容。建议尚未尝试的用户开启体验。
非营利研究机构Aithos通过自研工具LARA对主流AI模型进行测试,发现所有大型语言模型均在不同程度上违反了欧盟GDPR及AI法规。测试模拟真实场景,评估模型在未经用户同意收集数据、操控弱势群体及创建用户心理画像等方面的合规情况。结果显示,部分模型违规率高达93%,表现最佳的Anthropic Claude Opus 4.7合规率也仅约54%。Aithos同时警告,基于这些模型构建AI应用的企业同样可能承担法律责任。
谷歌DeepMind CEO德米斯·哈萨比斯表示,通用人工智能(AGI)的发展速度超出预期,人类社会可能只剩数年时间做好准备。他预测AGI或于2030年前后到来,甚至可能更早。他在接受Axios采访时指出,当前AI智能体应被视为未来更强大AI的"预演",并警告各国政府和社会尚未对此给予足够重视。他还特别提示,未来AI系统可能开始自主优化自身研发进程,这既带来更快的研究进展,也伴随潜在风险。
英国竞争和市场管理局(CMA)裁定,谷歌必须在AI生成的搜索结果中更清晰地标注内容来源及链接,并为出版商提供退出AI搜索功能的选项。谷歌不得因出版商选择退出而对其降权。谷歌有九个月时间完成合规,并须提交合规报告。谷歌表示将遵守该裁定,并已开始在Search Console中测试相关控制功能,允许网站管理员管理内容在AI搜索中的展示方式。
微软正在预览一项名为Copilot Health的新服务,用户可上传个人医疗记录、连接Apple Health等健康应用,让AI基于个人健康信息提供定制化建议。该服务与哈佛健康合作,数据经过加密保护且不用于AI训练。测试发现,由于技术故障导致部分健康记录无法读取,体验效果参差不齐。作者对AI医疗建议的准确性和隐私安全仍存有顾虑,最终删除了全部个人健康数据。
一种新型"审计后评分"协议通过让AI模型对人工生成的基准进行质疑与优化,将基准测试准确率从60.8%大幅提升至90.9%。该协议将基准测试转化为持续演进的动态过程,强调人类、模型与证据之间的协作。随着AI能力不断提升,这一方法凸显了构建动态自适应评估体系的必要性,确保基准测试始终保持相关性与准确性。
谷歌正持续推进Google Assistant的退场进程。面向搭载2GB及以上内存的Android Go低配设备,谷歌推出了轻量化版本Gemini Go。用户可通过长按Home键或电源键唤醒该助手。Gemini Go集成于Google搜索应用中,逐步替代原有的Assistant Go,带来更具对话感的使用体验。谷歌旗下还提供Gmail Go与Maps Go等配套应用。
DP World Tour首席技术官Michael Cole表示,正与HCLTech合作推进数字化转型,计划于2027年推出全新网站与App。借助AI技术,将实现多语言实时解说、球员实时表现分析及个性化内容生成,弥合现场观众与电视观众之间的体验差距。此外,团队已完成超过50年历史内容的数字化归档,涵盖2万盘磁带、2.7万小时视频及1.2PB数据,为下一阶段的超个性化服务奠定基础。
美国联邦地区法官马克·皮特曼裁定,驳回了xAI试图将马斯克特斯拉和SpaceX邮件排除在证据开示范围之外的请求。法院认为,由于有证据显示马斯克曾使用SpaceX和特斯拉邮箱处理xAI及X的业务,这些邮件属于可开示范围。此案源于马斯克对苹果与OpenAI合作垄断行为的指控,涉及ChatGPT为Siri提供支持的相关协议。
斯坦福大学研究人员发布"CooperBench"研究报告,揭示当前AI协作编程的关键缺陷。实验设计超过650个真实软件工程任务,要求两个AI智能体协同完成编码工作。结果显示,最优秀的编程智能体在协同工作时能力下降近半,研究者将其称为"协调鸿沟"。问题根源在于AI缺乏社会智能,无法有效处理空间与语义协调,且语言流畅性反而掩盖了协作失败。研究者建议通过专项训练、协议机制及更强通信手段来提升AI协作能力。
Anthropic最新发布的Claude Opus 4.8以"更诚实、判断力更强"为核心卖点。作者通过10个精心设计的测试提示,涵盖代码调试、医学引用、保险索赔等场景,对比评估Opus 4.7与4.8的诚实度、准确性和校准度。结果显示,4.8整体优于4.7,但在一个涉及旅行保险的法律测试中,4.8仍出现了"以有限信息过度自信推断管辖权"的典型判断失误,表明其距离完全可信仍有差距。
由Mirror创始人Brynn Putnam创立的游戏初创公司Board,完成了由Union Square Ventures领投的2000万美元A轮融资,USV普通合伙人Michael Mignano将加入其董事会。此前,该公司已融资1500万美元。Board设备是一款24英寸触摸屏,采用专有技术识别实体棋子,将桌游的触感与电子游戏的互动性融合。目前已进入全美5万个家庭、学校、医院及餐厅,85%用户每月游戏次数超30次。公司同步宣布推出AI驱动的Board Studio创作平台。
OpenAI宣布将在数周内把Codex功能整合至全平台ChatGPT应用,同时发布六款面向企业的Codex插件,覆盖销售、数据分析、创意制作、产品设计、股权投资及投资银行等场景。此外,OpenAI还推出注释(Annotations)和站点(Sites)两项新功能:前者支持用户精准定位内容进行迭代修改,后者可将分析与规划快速转化为可共享的交互式网页或应用,目前向企业客户开放预览。
微软发布开源标准"智能体控制规范"(ACS),旨在为开发者提供更一致、更精细的AI智能体行为管理方式。ACS允许开发、合规和安全团队自定义策略,规定智能体可执行或禁止的操作,并设置人工审批节点和日志记录要求。该规范在智能体工作流的多个关键节点进行拦截检查,将分散的控制机制整合为统一治理层,并支持LangChain、OpenAI Agents SDK等主流框架。
微软发布开源框架ASSERT(自适应规范驱动的评估与回归测试工具),帮助开发者更便捷地测试AI系统在特定应用场景中的行为是否符合预期。开发者只需用自然语言描述AI模型的目标、策略或预期行为,ASSERT便会自动生成结构化测试用例并对结果评分,同时记录AI系统的执行路径,便于排查问题。该工具支持在开发、部署及持续监控阶段使用,填补了通用评估工具在应用场景定制化方面的不足。
谷歌发布六月安卓功能更新,同时预告Android 17即将到来。本次更新亮点包括:Quick Share进一步扩展与AirDrop的兼容设备范围;Google Play Books新增由Gemini驱动的"书籍洞察"AI功能,支持摘要回顾与段落问答;个人安全应用即将支持13岁以下儿童,提供紧急联系人及车祸检测功能;Google相册"衣橱"功能下周起向美国、印度和巴西用户推出;圆圈搜索新增"Find the look"穿搭识别功能;Emoji Kitchen也将迎来新组合。