最新文章
AI搜索智能体遭遇新挑战:滑铁卢大学团队提出更公平透明的评测新标准

AI搜索智能体遭遇新挑战:滑铁卢大学团队提出更公平透明的评测新标准

滑铁卢大学团队发布BrowseComp-Plus基准测试,解决AI搜索智能体评测中的公平性、透明度和可及性问题。通过构建包含830个问题和10万文档的固定数据集,研究发现检索系统质量是影响AI搜索表现的关键因素,开源与闭源模型在工具使用能力上存在巨大差距。

2025-08-14

AI的隐藏瓶颈:网络如何影响企业LLM战略

长期以来,对AI网络进行基准测试和优化都需要在昂贵、耗电的GPU上运行实时工作负载。但GPU的可用性有限,而且大规模测试环境的配置需要时间和资金。因此,网络验证往往要推迟到实际工作负载运行时才能进行——这对于发现设计缺陷或性能瓶颈来说已经太迟了。

Continua获800万美元融资,让智能体在群聊中大显神威

Continua获800万美元融资,让智能体在群聊中大显神威

前谷歌资深工程师David Petrou创立的AI初创公司Continua宣布完成800万美元种子轮融资,由GV领投。该公司开发AI智能体技术,可加入SMS、iMessage和Discord等群聊平台,为用户协作提供智能支持。Continua能够在群聊中自动设置提醒、发起投票、添加日历邀请或生成待办清单,解决群聊混乱问题。公司通过微调技术让AI理解群聊动态,具备社交智能,只在需要时提供帮助。

Anthropic的Claude AI模型现可处理更长的提示内容

Anthropic的Claude AI模型现可处理更长的提示内容

Anthropic宣布为企业客户增加Claude单次提示词的信息处理量,以吸引更多开发者使用其AI编程模型。Claude Sonnet 4现支持100万token上下文窗口,可处理75万词或7.5万行代码的请求,是此前限制的5倍,超过OpenAI GPT-5的40万token。该功能也将通过Amazon Bedrock和Google Cloud等云合作伙伴提供。更大的上下文窗口有助于AI模型更好地处理软件工程问题和长期自主编程任务。

AI陪伴应用收入激增,2025年有望突破1.2亿美元

AI陪伴应用收入激增,2025年有望突破1.2亿美元

根据应用情报公司Appfigures数据,全球337款活跃且盈利的AI伴侣应用中,128款于2025年发布。这类应用通过让用户与定制角色对话来拟人化AI交互,包括朋友、恋人、幻想角色等。2025年上半年该市场已产生8200万美元收入,预计年底将超1.2亿美元。热门应用包括Replika、Character.AI等。截至7月,全球下载量达2.2亿次,上半年同比增长88%。数据显示17%的应用名称包含"女友"一词。

Perplexity出价345亿美元欲收购Chrome浏览器

Perplexity出价345亿美元欲收购Chrome浏览器

AI搜索公司Perplexity提出以345亿美元收购谷歌Chrome浏览器,这一报价约为其自身估值的两倍。这家成立近三年、估值180亿美元的初创公司刚推出基于Chromium的浏览器Comet。Chrome拥有全球67.9%的市场份额,约38亿用户。美国法官正在考虑是否强制谷歌剥离Chrome以恢复搜索市场竞争,OpenAI等AI公司也对此表示兴趣并准备推出自己的浏览器。

思科AI基础设施订单激增推动强劲财报表现

思科AI基础设施订单激增推动强劲财报表现

思科系统公司第四财季业绩超预期,营收147亿美元同比增长8%,净利润40亿美元。AI基础设施订单本季度达8亿美元,全年达20亿美元,是原定目标的两倍以上。网络业务增长12%,安全产品增长9%。云业务同比增长49%,连续四个季度在大规模网络客户中实现三位数订单增长。公司预计下季度营收146.5-148.5亿美元。

SEO已死,大语言模型时代企业如何重塑营销策略?

SEO已死,大语言模型时代企业如何重塑营销策略?

随着ChatGPT等AI聊天机器人成为"互联网入口",传统SEO面临颠覆。企业开始关注如何在AI生成的答案中获得更好展示。Evertune等初创公司应运而生,通过每月运行数百万次提示来帮助企业监测品牌在AI回答中的表现。同时,Perplexity出价345亿美元收购Chrome浏览器,OpenAI发布GPT-5模型,显示AI搜索领域竞争加剧。

OpenAI的GPT-5表现不佳,被迫重新添加模型选择开关

OpenAI的GPT-5表现不佳,被迫重新添加模型选择开关

OpenAI在GPT-5发布后遭遇用户强烈反对,被迫进行调整。CEO阿尔特曼宣布为GPT-5增加"自动"、"快速"和"思考"三种模式选择,并恢复4o模型。付费用户可通过"显示其他模型"开关访问o3、4.1等模型。阿尔特曼承认突然弃用旧模型是错误决定,并表示正在优化GPT-5的个性化设置,让其比当前版本更温和但不像GPT-4o那样令人烦恼。

机器人终于会"想"再"动"了——艾伦人工智能研究院的MolmoAct模型让机器人拥有空间推理能力

机器人终于会"想"再"动"了——艾伦人工智能研究院的MolmoAct模型让机器人拥有空间推理能力

艾伦人工智能研究院开发的MolmoAct是首个开源的机器人空间推理模型,通过"看懂-规划-执行"三步思考法让机器人具备类人的空间理解能力。它不仅在多项基准测试中表现优异,还支持直观的视觉轨迹调教,用户可直接在屏幕上画线指导机器人行为。研究团队完全开源了模型、代码和数据集,为全球机器人研究提供强大基础平台。

让AI学会"以史为鉴,向未来学习":北京大学与清华大学联合提出时间自奖励语言模型

让AI学会"以史为鉴,向未来学习":北京大学与清华大学联合提出时间自奖励语言模型

这项由北京大学和清华大学联合完成的研究首次提出时间自奖励语言模型,通过"锚定拒绝"和"未来引导选择"策略解决了AI自学习中的梯度消失问题。该方法让AI既能从过去的低水平样本中学习反面教材,又能向未来的高水平样本学习正面目标,成功维持了清晰的学习对比信号,在多个基准测试中显著优于传统自奖励方法。

香港科技大学新技术:AI也能像PS高手一样精准换形状

香港科技大学新技术:AI也能像PS高手一样精准换形状

香港科技大学研究团队提出Follow-Your-Shape技术,通过创新的轨迹分歧图机制实现精准的AI图像形状编辑。该方法无需遮罩和训练,能准确识别编辑区域并保持背景完整,在新构建的ReShapeBench基准测试中全面超越现有方法,为创意设计、广告制作和内容创作等领域提供强大工具支持。

卡内基梅隆大学突破性研究:AI模型推理速度提升1.1倍的"少即是多"革命

卡内基梅隆大学突破性研究:AI模型推理速度提升1.1倍的"少即是多"革命

卡内基梅隆大学等机构联合开发的LessIsMore技术,通过发现AI推理中的空间局部性和时间局部性规律,创新性地采用统一注意力头选择和稳定时间窗口机制,在保持准确性的同时实现1.1倍推理加速。该技术无需重新训练即可应用,为AI推理效率提升开辟了新路径。

斯坦福大学等多校联手:首个多语言视觉检索基准VisR-Bench,让AI真正"看懂"全球文档

斯坦福大学等多校联手:首个多语言视觉检索基准VisR-Bench,让AI真正"看懂"全球文档

斯坦福大学等研究机构联合发布首个多语言视觉检索基准VisR-Bench,系统评估AI在16种语言、1286份真实文档上的检索能力。研究发现现有AI系统在表格理解和低资源语言处理方面存在显著局限,最先进模型准确率仅75%,阿拉伯语等语言表现更差。该基准为改进多语言文档AI提供重要参考。

Jumio用AI,在数字身份验证风暴中心重构信任坐标

Jumio用AI,在数字身份验证风暴中心重构信任坐标

生物识别技术、人工智能和机器学习的深度融合,正推动身份验证从被动识别向主动风险评估和持续监控转变,尤其在对抗深度伪造等新兴欺诈手段方面,展现出不可或缺的关键作用。

谷歌为Gemini添加有限聊天个性化功能,在记忆功能方面落后于竞争对手

谷歌为Gemini添加有限聊天个性化功能,在记忆功能方面落后于竞争对手

谷歌正在为其Gemini应用缓慢增加定制化和个性化功能,以追赶Anthropic和OpenAI。新功能"个人上下文"将默认启用,允许从过往对话中学习并提供个性化回应。同时推出临时聊天功能和额外数据控制选项。然而,谷歌用户无法编辑或删除偏好设置,这与竞争对手形成差异。该功能首先在部分国家的Gemini 2.5 Pro上推出。

Windows最新补丁导致事件查看器出现虚假错误警报

Windows最新补丁导致事件查看器出现虚假错误警报

微软最新Windows补丁更新后,用户在事件查看器中发现错误ID 57的误报信息,显示"Microsoft Pluton加密提供程序"初始化失败。该错误出现在安装7月非安全预览更新或8月安全更新后,影响Windows 11 24H2系统。微软表示这是正在开发功能相关的错误,用户可安全忽略,不会影响Windows进程运行,公司正在修复中。

印度Rapido开始测试外卖服务,挑战Swiggy和Zomato

印度Rapido开始测试外卖服务,挑战Swiggy和Zomato

印度知名出行平台Rapido已在班加罗尔悄然开始测试外卖服务,首次正式挑战市场领导者Swiggy和Zomato。该公司成立全资子公司推出名为Ownly的外卖服务,采用固定费用模式而非佣金制,为餐厅提供比竞争对手低15%的价格。Rapido拥有约1000万辆车队,将利用其配送网络和从Swiggy合作中获得的市场洞察来发展外卖业务。印度在线外卖市场预计到2030年将超过2万亿卢比。

SAP力推Business Suite为企业AI应用的关键基础

SAP力推Business Suite为企业AI应用的关键基础

德国软件巨头SAP将其商务套件定位为企业AI成功的必要基础,认为数据碎片化是最大障碍。该套件集成销售、财务等业务应用,直接挑战"最佳组合"模式。SAP全球商务套件负责人表示,碎片化应用产生碎片化数据,失去业务语境,使企业80%时间用于管理应用和数据。SAP推广AI助手Joule作为用户交互中心,并开发各种AI代理。澳洲多家客户分享实践经验,南澳电力网络利用AI改善资产管理,西格玛医疗自动化HR流程节省70%时间。