谷歌推出新款多模态AI模型Gemini 3.1 Flash-Lite,专注成本效益优化。该模型定价仅为每百万输入token 0.25美元,比旗舰版Gemini 3.1 Pro便宜8倍。性能测试显示其响应速度比Gemini 2.5 Flash快45%,首次输出等待时间缩短2.5倍。模型可处理100万token的多模态提示,在11项基准测试中有6项超越GPT-5 mini和Claude 4.5 Haiku,适用于电商翻译、内容审核等高频场景。
Atlassian首席执行官向投资者保证,公司能够在不大幅增加成本或压缩利润率的情况下将AI整合到服务中。该公司的Rovo智能AI产品已拥有500万用户,通过优化运营而非高价格策略保持了稳定的利润率。公司第二季度营收达16亿美元,同比增长23%,运营亏损从5750万美元收窄至4770万美元。
Anthropic发布了面向成本敏感用户的Claude Haiku 4.5大语言模型,定价为每百万输入令牌1美元,输出令牌5美元,比旗舰版Sonnet 4.5便宜三倍。该模型采用混合推理架构,可根据需求调整计算资源,支持多模态输入最多20万令牌。在八项基准测试中,性能仅比Sonnet 4.5低不到10%,但在编程和数学任务上超越了前代Sonnet 4。模型响应速度比Sonnet 4快两倍以上,适用于客服聊天机器人等低延迟应用场景。