优化模型 关键字列表
微软在Word、Excel和PowerPoint中推出"vibe working"功能

微软在Word、Excel和PowerPoint中推出"vibe working"功能

微软本周正式在Office应用中推出全新Agent模式,即此前所称的"氛围办公"功能。该模式是Copilot体验的升级版本,能够更好地执行文档编辑指令。微软Office产品团队副总裁表示,随着基础模型能力的显著提升,Copilot已从被动助手进化为可直接操作文档的主动代理。用户可通过侧边栏实时查看AI操作步骤,在Excel中自动添加公式和表格,在PowerPoint中更新内容并保留模板样式。该功能已面向Microsoft 365 Copilot及Premium订阅用户默认开启。

天文学家借助AI探索星系,加剧全球GPU资源紧张

天文学家借助AI探索星系,加剧全球GPU资源紧张

NASA宣布将于2026年9月提前发射南希·格雷斯·罗曼太空望远镜,预计在其寿命期内产生20,000TB天文数据。加之詹姆斯·韦伯太空望远镜每日下传57GB图像,以及智利薇拉·鲁宾天文台每晚采集20TB数据,天文学家正大规模转向GPU处理海量数据。加州大学圣克鲁兹分校天体物理学家布兰特·罗伯逊与Nvidia合作开发了深度学习模型Morpheus,用于识别星系,并正将其架构升级为Transformer模型以提升分析效率。然而,全球GPU资源紧张及NSF预算削减,给天文AI研究带来持续压力。

过时的英国政府网页正在误导AI概览,英国民众正在被错误信息误导

过时的英国政府网页正在误导AI概览,英国民众正在被错误信息误导

英国商业与贸易部内容设计师指出,谷歌等平台的AI概览功能正从过时的GOV.UK页面抓取数据,向用户呈现错误的政府信息。例如,关于英国慈善机构注册费用的搜索结果,AI引用了已废弃页面上的旧价格,与实际收费相差悬殊。为此,该部门审查了五年内未更新的页面,将150个问题页面重定向至存档或现行内容,并测试每半年审查一次的更新机制,以提升公众对政府信息的信任度。

Anthropic新模型Claude Opus 4.7:刻意弱于Mythos背后的战略逻辑

Anthropic新模型Claude Opus 4.7:刻意弱于Mythos背后的战略逻辑

Anthropic正式发布Claude Opus 4.7,相较Opus 4.6在软件工程、视觉处理、指令遵循和金融分析等方面均有明显提升,视觉能力提升3倍,支持最高2576像素的高清图像。然而,Anthropic坦承该模型能力刻意低于尚未正式发布的Claude Mythos,旨在平衡性能与安全风险。Opus 4.7已在Claude全线产品及AWS、Google Cloud、Microsoft Foundry等平台上线,定价与前代保持一致。

生活中的摩擦感:AI推崇者永远无法理解的人类本质

生活中的摩擦感:AI推崇者永远无法理解的人类本质

作者以深夜失眠查询"划火柴速度"为引,探讨了AI与人类体验之间的根本差异。硅谷数十年来以"无摩擦体验"替代真实生活,而AI加速这一趋势,将反思与等待变成"效率的敌人"。作者认为,AI只能模仿语言模式,无法真正理解意识、情感与生命体验。多数普通人对AI的态度是忧虑而非兴奋,一场人文主义的反弹正在酝酿之中。

Google Gemini for Home智能音箱恢复连续对话功能

Google Gemini for Home智能音箱恢复连续对话功能

谷歌宣布,Gemini for Home助手将为Google Home智能音箱重新引入"连续对话"功能。该功能允许用户无需重复唤醒词即可与音箱进行连续交互,音箱在每次响应后会保持短暂待机状态以接收后续指令。相比原Google Assistant版本,新版本具备更强的上下文理解能力,支持更多语言,且能更好地过滤环境噪音干扰。目前该功能仍处于早期测试阶段,Gemini全面取代Google Assistant的时间表尚未公布。

教会AI模型说"我不确定"

教会AI模型说"我不确定"

MIT计算机科学与人工智能实验室(CSAIL)研究人员发现,当前主流AI推理模型存在过度自信的缺陷,根源在于强化学习训练机制只奖励正确答案,忽视不确定性表达。为此,研究团队提出RLCR方法,通过在奖励函数中引入Brier评分,训练模型同步输出答案与置信度估计。实验显示,该方法可将校准误差降低高达90%,同时保持或提升准确率,对医疗、法律、金融等高风险应用场景具有重要意义。

Google升级Workspace:AI助手全面融入办公场景

Google升级Workspace:AI助手全面融入办公场景

谷歌在Cloud Next大会上宣布对Workspace进行多项AI升级。新推出的Workspace Intelligence系统可整合用户的Gmail、日历、聊天及云端硬盘数据,实现跨任务自动化协助。Gemini现可帮助用户快速构建和填充Google表格,数据录入速度提升9倍;Google文档也引入AI写作工具,支持生成、编写和润色文档,并能模仿用户写作风格。谷歌凭借其在企业级市场的深厚积累,与微软、苹果及众多初创公司展开激烈竞争。

企业AI框架的合理选型:如何规避失败风险

企业AI框架的合理选型:如何规避失败风险

企业在探索AI工具与模型时,面临"一套方案无法通吃"的挑战。检索增强生成(RAG)适合提升用户体验,而长上下文模型则更擅长处理大规模数据集。IBM首席AI开放创新架构师Gabe Goodhart与Hippo Insurance首席数据官Robin Gordon,分享了如何为企业用例选择合适AI资源的实践经验,探讨了数据规模、目标结果与组织需求三者之间的平衡之道。

数据库行业再度探索自然语言查询系统,大语言模型能否实现突破?

数据库行业再度探索自然语言查询系统,大语言模型能否实现突破?

数据库和分析厂商正借助大型语言模型(LLM)重燃"自然语言转SQL"的梦想。AWS、Snowflake、MongoDB等巨头相继推出Text-to-SQL工具,旨在让业务用户无需掌握SQL即可查询数据。然而,多伦多大学教授Nick Koudas指出,当前系统准确率仅约80%,存在生成语法正确但语义错误查询的风险。他建议将人工审核机制引入流程,并认为现阶段该技术更适合提升开发者效率,而非完全替代SQL专业人员。

机器人扎克伯格:AI如何帮助CEO从日常事务中解放出来

机器人扎克伯格:AI如何帮助CEO从日常事务中解放出来

Meta CEO马克·扎克伯格正在构建一个AI版本的自己,该虚拟CEO将模拟其行为举止,并载入其企业战略观点,以便员工更便捷地获取指导。此前,OpenAI的萨姆·奥特曼曾警告称,AI超级智能未来或将比任何高管更胜任CEO职位。Klarna CEO也已尝试用AI分身向分析师汇报财务业绩并接听客户来电。AI替代高管的趋势正逐步从概念走向现实。

苹果新任CEO约翰·特纳斯将如何应对这些棘手挑战

苹果新任CEO约翰·特纳斯将如何应对这些棘手挑战

苹果公司即将由约翰·特纳斯接任CEO一职,他将继承蒂姆·库克15年任期内留下的一系列难题:FBI加密之争、App Store反垄断诉讼、中国市场的艰难平衡,以及AI战略的滞后。目前苹果在AI领域依赖谷歌和OpenAI的模型支撑部分功能,自研能力备受质疑。与此同时,多名高管相继离职,领导团队大幅重组。更深远的挑战在于,AI Agent的崛起可能从根本上动摇App Store的商业模式,苹果的护城河面临前所未有的威胁。

Anthropic新模型Opus 4.7:刻意降低能力以平衡安全与性能

Anthropic新模型Opus 4.7:刻意降低能力以平衡安全与性能

Anthropic正式发布Claude Opus 4.7,相比前代在软件工程、视觉处理、指令遵循及金融分析等方面有所提升,视觉能力提升3倍,支持最高2576像素高分辨率图像。然而,Anthropic明确表示该模型能力不及尚未正式发布的Claude Mythos,这是有意为之的策略。公司通过限制其网络安全能力,将其定位为能力与安全风险之间的平衡点,并借此在企业市场中验证自动化网络安全防护机制。

社会科学亟需21世纪的新型研究工具与数据支撑

社会科学亟需21世纪的新型研究工具与数据支撑

多位学者就社会科学研究的可复现性问题展开探讨。牛津学者指出,社会科学长期依赖文化语言描述人类行为,而非像自然科学那样通过系统观察建立独立术语,这是导致研究难以复现的深层原因。坎贝尔协作组织负责人强调,数据是推动社会科学进步的核心燃料,当前工具尚显原始,需大力投资公共数据建设。斯特灵大学教授则建议,将同行评审贡献纳入研究者绩效评估体系,以激励更严格的学术审查。

Extra:前Pinterest团队重新设计的邮件应用,真的好用

Extra:前Pinterest团队重新设计的邮件应用,真的好用

由前Pinterest设计师和工程师创立的BuildForever公司,正式推出邮件应用Extra。该应用抛弃传统主题行、文件夹和标签,以"Today"标签为核心,将重要邮件整合为可操作的实时概览。AI技术在后台自动将收件箱分类为旅行、购物、活动等个性化标签。目前Extra已获950万美元种子轮融资,支持Gmail接入,提供iOS和网页版,现阶段免费使用。

丹麦物流巨头DSV加速推进全球最大规模IT系统整合

丹麦物流巨头DSV加速推进全球最大规模IT系统整合

丹麦物流巨头DSV以143亿欧元收购德国DB Schenker后,成为全球最大第三方物流企业,但随之承担了覆盖90个国家的复杂IT系统整合压力。面对AI驱动竞争对手的冲击、高额债务、利润下滑及货运市场低迷,DSV正以"前所未有的速度"推进IT整合,计划将全球业务系统统一至单一平台,为后续AI自动化奠定基础,预计整合完成后可实现12亿欧元永久性成本节约。

「护士版Uber」:报告揭示零工平台正游说放开医疗行业管制

「护士版Uber」:报告揭示零工平台正游说放开医疗行业管制

据AI Now研究所报告显示,价值数十亿美元的科技平台正积极推动"护士优步"行业去监管化,以扩大医疗领域零工经济。这些平台利用AI技术设定工资、监控绩效,并通过竞价机制让护士相互压价抢班。报告警告称,技术的广泛应用正以牺牲工人权益为代价。自2022年以来,至少17个州已提出豁免零工护理平台监管的法案,多州相关政策已取得进展。

控制AI幻觉:在临床与科学工作流中构建基于证据的信任

控制AI幻觉:在临床与科学工作流中构建基于证据的信任

生成式AI在医疗和制药领域潜力巨大,但AI幻觉问题正成为临床信任的核心障碍。2025年调查显示,44%的组织因使用生成式AI遭受负面影响,平均每次损失达440万美元。AI生成的虚假或不准确内容可渗透电子健康记录,危及患者安全。为降低风险,业界须从通用模型转向文档锚定的证据优先系统,严格限制AI输出范围,并强制要求专业人员对AI生成内容进行审核,确保合规与准确性。

劳埃德银行任命首席数据与AI官,推动AI战略规模化落地

劳埃德银行任命首席数据与AI官,推动AI战略规模化落地

Sameer Gupta将于今年6月出任劳埃德银行集团首席数据与AI官,结束其在星展银行长达12年的分析领域任职生涯。他将负责领导该行AI战略,推动技术规模化落地,同时确保AI合规治理。劳埃德银行生成式AI去年创造约5000万英镑价值,预计2026年将突破1亿英镑。目前该行在全球50家大型银行AI采用指数中位列前15,并正为6.7万名员工提供AI技能培训。

Mythos:新AI模型引发的恐慌,是真实威胁还是公关炒作?

Mythos:新AI模型引发的恐慌,是真实威胁还是公关炒作?

一款名为Mythos的新型AI模型引发广泛关注,有声音称其"对公众而言过于强大"。本文深度剖析Anthropic在AI舆论战中的运作逻辑,探讨围绕新模型的恐慌情绪究竟源于真实的技术风险,还是一场精心设计的公关营销行动,揭示AI公司在产品发布时如何塑造公众认知与媒体叙事。