微软宣布为Word和Excel推出基于OpenAI的AI代理模式,通过简单提示即可自动生成文档和分析数据。Word用户可享受"氛围写作"功能,利用现有文档组装报告和提案。Excel代理能分析电子表格数据并生成可视化报告。尽管在SpreadsheetBench基准测试中准确率仅为57.2%,低于人类平均水平71.3%,但微软强调其针对实际工作场景优化。此外,微软还发布了基于Anthropic的Office代理,显示其正逐步减少对OpenAI的依赖。
OpenAI为美国ChatGPT用户推出"即时结账"功能,用户可在对话中直接购买Etsy和Shopify商品,无需跳转至外部网站。该功能支持Apple Pay、Google Pay等多种支付方式,并计划接入超过100万家Shopify商户。OpenAI还将开源其代理商务协议技术,与谷歌的代理支付协议形成竞争。这标志着电商购物模式的重大转变,AI聊天机器人可能重塑在线零售发现和支付生态系统。
中国AI实验室DeepSeek本周爆红,其聊天机器人应用登顶苹果和谷歌应用商店榜首。DeepSeek由量化对冲基金High-Flyer支持,使用计算高效技术训练AI模型,让华尔街分析师质疑美国能否保持AI领先地位。该公司发布的V3和R1推理模型在多项基准测试中表现出色,价格远低于同类产品。尽管面临美国芯片出口限制和政府设备禁用,DeepSeek仍凭借技术创新和低成本策略在全球AI市场引发关注。
初创公司ComplexChaos正在开发AI工具来促进合作并缩短群体达成共识的时间。该工具结合了谷歌的Habermas Machine和OpenAI的ChatGPT,能够生成问题、设定对话目标并总结长文档。在与九个非洲国家的年轻代表进行的气候谈判准备试验中,参与者报告协调时间减少了60%,91%的参与者表示AI工具帮助他们看到了原本会错过的观点。
VirtualZ公司在原有Lozen数据访问和PropelZ数据提取产品基础上,新推出FlowZ和Zaac两款产品。FlowZ支持大机与x86服务器及公有云应用间的双向文件数据访问,无需额外编码。Zaac作为双向网关,将本地存储和云存储呈现为大机本地设备,显著降低成本并加快部署速度。两款产品均支持将大机数据整合到AI管道中,助力企业实现混合云集成。
软件交付公司Harness宣布收购AI驱动的漏洞检测企业Qwiet AI,旨在将安全性直接嵌入DevOps管道。此次收购将Qwiet的代码属性图与Harness的软件交付图集成,提升漏洞检测精度。Qwiet声称拥有97%的真阳性率和92%的开源漏洞检测率,可帮助开发者专注于真正重要的安全风险,并提供经验证的代码修复方案。
全球顶级人工智能公司正加大对"世界模型"的投资,寻求实现机器"超级智能"的新途径。谷歌DeepMind、Meta和英伟达等公司正开发能通过视频和机器人数据学习导航物理世界的系统,而非仅依赖语言。这一转变源于大语言模型发展遭遇瓶颈,各公司LLM性能提升速度放缓。英伟达表示世界模型市场潜力巨大,可达100万亿美元规模。
英伟达CEO预计到本十年末,AI基础设施投资将达3-4万亿美元。微软向OpenAI投资近140亿美元,Oracle获得3000亿美元计算合约,Meta计划在2028年前投资6000亿美元建设美国基础设施。这些投资正推动超大规模数据中心建设,但也给电网带来巨大压力。特朗普宣布的Stargate项目计划投资5000亿美元建设AI基础设施,成为历史上最大的AI基础设施项目。
风投正通过AI改造传统服务业务以获取软件般的高利润率。通用催化剂等公司投入15亿美元收购成熟专业服务公司,用AI自动化任务后再收购更多企业。虽然该策略在某些案例中显示出效果,但斯坦福研究发现40%员工因AI生成的低质量工作内容而承担更多负担,每人每月造成186美元的隐性成本。这表明仅仅部署AI并不能保证改善结果,服务业AI转型可能比预期更复杂。
TELUS与NVIDIA和HPE合作,在魁北克省里穆斯基市推出加拿大首个完全主权AI工厂。该设施运行在加拿大本土基础设施上,让企业能够在不跨境的情况下开发、训练和运营AI模型。设施采用可再生能源,具备高效冷却系统。这一举措呼应了全球主权AI发展趋势,旨在确保加拿大在敏感数据处理方面的自主权,为医疗和金融等行业提供符合数据驻留要求的AI解决方案。
AI安全组织METR通过随机对照试验发现,经验丰富的开源开发者使用AI工具时,完成任务时间比不使用工具时延长19%。研究涉及16名开发者,平均每个任务耗时2小时。研究人员认为,AI基准测试可能高估了AI能力,因为现实开发中存在需要人类直觉和常识解决的问题,而AI模型在这些方面表现不足。
经济奇点指绝大多数人类失去工作的时刻。作者分析了关于经济奇点的五个常见误区:自动化不会造成失业、工作提供人生意义、经济奇点是坏事、收入分配问题及就业逐步消失。文章指出,认知自动化与过往机械化不同,将全面替代人类工作。失去工作后人们仍可从家庭、兴趣中获得意义。关键挑战是收入分配,需要大规模财富再分配和接近免费的商品服务。就业可能突然全面消失,社会必须提前准备应对方案。
ChatGPT是强大的AI工具,能帮助写邮件和头脑风暴,但在某些领域使用它可能造成严重后果。大语言模型可能自信地给出错误、过时或有偏见的信息。在健康诊断、心理治疗、紧急安全决策、个人财务规划、机密数据处理、违法行为、学术作弊、实时信息监控、赌博预测、法律文件起草和艺术创作等11个方面,依赖ChatGPT可能带来真实世界的风险和危害。
医疗AI的前景不再是理论,但大多数试点项目无法规模化。在Epic和Cerner等EMR平台中,AI要实现企业级应用,必须证明技术可靠性和可衡量价值。严格的AI评估(evals)和明确的关键绩效指标(KPIs)是成功的必要支柱。评估确保系统准确性和安全性,KPIs量化临床价值和投资回报率。
哈佛大学伯克曼·克莱因中心探讨人类智能是否实际上就是一种计算智能形式。谷歌技术与社会首席技术官在秋季演讲系列中力挺"大脑即计算机"观点,认为大脑不仅像计算机,本身就是计算机。该理论将大脑比作预测性处理器,类似大语言模型通过预测下一个词元工作。支持者认为通过扩大计算规模可实现AGI,但也有声音质疑当前架构可能遇到瓶颈。研究者希望通过破解AI内部机制来理解人类思维。
一项调查显示,31%的美国技术领导者表示,由于AI转型的紧迫性,CEO与CIO的合作比一年前更加密切。79%的技术领导者认为企业对AI的关注提升了他们在董事会层面的地位。数据分析和AI成为企业未来12个月的重点投资领域,37%的受访者将其列为优先事项。虽然28%的技术领导者预测首席AI官将承担CIO职责,但86%的企业尚未设立该职位。
答案引擎优化(AEO)正在重新定义真相的标准。与传统搜索引擎优化不同,AEO让AI系统直接生成答案,而非提供链接。研究显示70%的人会直接接受机器提供的信息,不加质疑。当资本主义与此结合,真相本身变得可以被购买和优化。AEO实质上是一种设计性审查,通过专有数据和封闭算法隐藏推理过程。我们需要重新引入摩擦和质疑机制,要求算法透明度和可追溯性,否则现实本身将成为可以随意调节的设置。
AI数据中心开发商Nscale在宣布与英伟达和OpenAI合作一周后,成功融资11亿美元。挪威能源集团Aker ASA领投,Point72、英伟达、诺基亚等参投。Nscale成立于2024年,从加密货币挖矿业务转型而来,现已成为英国AI设施建设计划的核心。公司估值约31亿美元,正与微软合作在英国建设最大AI超级计算机。
心理健康挑战已达史无前例的水平,2024年美国近6000万成年人患有心理疾病,但仅半数接受治疗。专家正探索智能AI代理系统作为解决方案,这些自主代理具备独立决策、持续学习和主动干预能力。未来应用包括自主治疗代理、预测性心理健康生态系统和主动危机预防。该技术可提供24/7支持、实时监测心理状态、预测危机并部署个性化干预措施,有望创建更具响应性和预防性的心理健康生态系统。
Spotify宣布已从其目录中删除7500万首"垃圾"音乐,作为打击日益泛滥的欺诈性音频内容和"AI垃圾"的努力。公司发布新政策禁止冒充、垃圾提交和欺诈版税生成。目前流媒体服务每日收到约15万首新曲目,其中28%为纯AI生成。主要唱片公司担心低质量内容稀释人类艺术家的版税池,而AI工具进一步加速了这一趋势。