优化模型 关键字列表
英特尔与SambaNova押注分布式推理,应对智能体AI对GPU的压力

英特尔与SambaNova押注分布式推理,应对智能体AI对GPU的压力

英特尔与SambaNova联合推出异构推理架构,将AI推理任务分为三层:GPU负责预填充、SambaNova可重配置数据流单元(RDU)负责解码、英特尔至强6 CPU负责智能体任务编排与执行。该方案旨在解决企业级智能体AI大规模部署中的成本高、能耗大、GPU利用率低等痛点。预计2026年下半年正式推出,目标客户涵盖企业、云服务商及主权AI部署场景。

OpenAI呼吁重新审视税收政策,迎接AI带来的新经济时代

OpenAI呼吁重新审视税收政策,迎接AI带来的新经济时代

OpenAI发布政策文件,呼吁政策制定者重新考虑税收体系结构,以应对AI带来的经济与社会影响。文件指出,AI可能大幅重塑经济格局,并带来社会保障税基侵蚀等风险。OpenAI建议提高资本利得税和企业所得税,并探索自动化劳动税等新方式,同时配套工资激励措施保障工人权益。此外,文件还提出公共财富基金、四天工作制试点等政策构想,旨在推动AI红利的广泛共享。

Cursor推出Composer 2编程模型,性能超越Claude Opus 4.6且成本更低

Cursor推出Composer 2编程模型,性能超越Claude Opus 4.6且成本更低

Cursor发布第三代自研编程模型Composer 2,在关键编程基准测试中超越Anthropic的Opus 4.6,成本却大幅降低。新模型输入Token成本仅0.5美元/百万,输出Token为2.5美元/百万,远低于Opus 4.6的5/25美元定价。在Terminal-Bench 2.0测试中得分61.7%,击败Opus 4.6的58.0%。该模型首次采用持续预训练技术,并创新性地引入"自我总结"训练方法,通过强化学习优化长期任务处理能力,将压缩错误率降低50%。

Gemini 3.1 Flash Live:让语音AI更自然可靠

Gemini 3.1 Flash Live:让语音AI更自然可靠

谷歌发布Gemini 3.1 Flash Live,这是迄今为止质量最高的音频和语音模型。该模型在ComplexFuncBench Audio基准测试中获得90.8%的分数,在Scale AI的Audio MultiChallenge中得分36.1%。新模型具备更好的音调理解能力,能够识别音调和节奏等声学细节,并可动态调整对用户挫折或困惑表情的回应。支持多语言,现已在全球200多个国家和地区推出。

为何Garry Tan的Claude Code配置引发如此多的赞誉与争议

为何Garry Tan的Claude Code配置引发如此多的赞誉与争议

Y Combinator首席执行官谭嘉伦在SXSW大会上分享了他对AI代理的痴迷,称自己患上了"网络精神病",每晚只睡4小时。他在GitHub上开源发布了名为"gstack"的Claude Code技能配置,包含13个专业化技能模板,可模拟CEO、工程师、代码审查员等角色。该配置在GitHub获得近2万星标,但也引发争议,有人质疑这只是简单的提示词集合。多个AI模型对此配置给予正面评价,认为其体现了成熟的工程组织结构模拟方法。

Cloudflare推出智能体专用Markdown功能,网站自动适配AI访问

Cloudflare推出智能体专用Markdown功能,网站自动适配AI访问

Cloudflare推出"Markdown for Agents"新功能,当AI代理请求网页时自动将HTML转换为Markdown格式,可减少高达80%的Token使用量。该功能通过边缘实时转换实现,使用标准HTTP内容协商机制区分人类访问和AI爬虫。Pro和Business计划用户可在控制台启用此功能。

微软开源XAML Studio原型设计工具

微软开源XAML Studio原型设计工具

微软宣布开源XAML Studio,这是一款面向WinUI开发者的XAML快速原型设计工具。该工具允许开发者在Visual Studio IDE中集成应用前快速原型化用户界面创意,支持UWP平台XAML应用开发。工具提供实时编辑、绑定调试器、数据上下文编辑器等功能。目前XAML Studio 1.1可从微软商店获取,而正在开发的2.0版本已可从GitHub源码构建,新增了Fluent UI设计、文件夹支持、实时属性面板等特性。

Insta360发布AI驱动的第二代Link系列网络摄像头

Insta360发布AI驱动的第二代Link系列网络摄像头

Insta360发布两款新的AI驱动4K网络摄像头Link 2 Pro和Link 2C Pro,面向创作者、教育工作者和远程办公人员。两款产品均采用更大的1/1.3英寸传感器,支持HDR和AI降噪技术。Link 2 Pro配备2轴云台实现AI追踪,售价250美元;Link 2C Pro为固定式设计,售价200美元。

谷歌融合SQL、Python和Spark推进Colab Enterprise发展

谷歌融合SQL、Python和Spark推进Colab Enterprise发展

谷歌正在推广Colab Enterprise,承诺提供统一的机器学习和数据分析笔记本环境,将SQL、Python和Apache Spark集成在一个平台中。该平台在BigQuery数据仓库和Vertex AI机器学习平台中预览多项增强功能,包括原生SQL单元格、交互式可视化单元格和增强的数据科学代理。谷歌旨在消除数据科学家在不同环境间切换的障碍,提高工作效率。

谷歌翻译将集成AI功能并增加游戏化学习模式

谷歌翻译将集成AI功能并增加游戏化学习模式

据Android Police报道,谷歌翻译即将迎来重大AI升级。最新版本9.15.114显示新增模型选择器,包含"快速"和"高级"两种模式。快速模式适用于菜单翻译等简单任务,高级模式将使用Gemini技术提供更准确的上下文理解。更新还将加入类似多邻国的练习模式,通过游戏化方式辅助语言学习。这一升级体现了谷歌持续推进语言翻译技术创新的努力。

从TB级数据到智能洞察:真实AI可观测性架构实践

从TB级数据到智能洞察:真实AI可观测性架构实践

本文探讨在处理海量遥测数据的电商平台中,如何构建AI驱动的可观测性系统。作者提出利用模型上下文协议(MCP)解决数据碎片化问题,通过三层架构设计:上下文丰富的数据生成层、MCP服务器数据访问层、AI驱动分析引擎层,实现从日志、指标、链路追踪中自动提取洞察。该方案可显著降低异常检测时间,提升根因分析效率,减少告警噪音,为工程团队提供主动式而非被动式的系统监控能力。

谷歌新"网页指南"功能将用AI重组搜索结果页面

谷歌新"网页指南"功能将用AI重组搜索结果页面

谷歌正在测试名为"网页指南"的新AI功能,利用定制版Gemini模型智能组织搜索结果页面。该功能介于传统搜索和AI模式之间,通过生成式AI为搜索结果添加标题摘要和建议,特别适用于长句或开放性查询。目前作为搜索实验室项目提供,用户需主动开启。虽然加载时间稍长,但提供了更有用的页面组织方式,并保留切换回传统搜索的选项。

iOS 18 beta 4发布:Liquid Glass界面调整与AI新闻摘要功能回归

iOS 18 beta 4发布:Liquid Glass界面调整与AI新闻摘要功能回归

苹果发布iOS 26第四个开发者测试版,对液态玻璃界面设计进行微调,并重新引入AI驱动的新闻通知摘要功能。更新包含欢迎界面、Siri和相机应用介绍页面。由于此前BBC投诉AI摘要功能误报新闻,苹果在新闻娱乐部分添加警告信息,提醒用户"摘要可能改变原始标题含义"并建议验证信息。同时发布了新动态壁纸和CarPlay壁纸,公测版本预计本周稍后推出。

Nextdoor推出AI推荐功能重新设计应用界面

Nextdoor推出AI推荐功能重新设计应用界面

邻里社交应用Nextdoor推出重新设计版本,新增本地新闻、实时警报和名为"Faves"的AI功能,用于发现本地商户和地点。该应用与3500家本地出版商合作提供新闻内容,通过Samdesk和Weather.com提供天气、交通、停电等实时警报。Faves功能利用15年邻里对话数据训练的大语言模型,为用户提供本地化AI推荐服务,帮助用户找到最佳餐厅、徒步地点等本地信息。

建筑公司发布"首个完全由AI设计的数据中心"项目

建筑公司发布"首个完全由AI设计的数据中心"项目

Cove Architecture完成了业内首个完全采用AI驱动流程设计的数据中心项目,这座1万平方英尺的设施仅用30天就完成了传统需要数月的设计工作。该项目位于科罗拉多州,PUE值达到1.2,集成了AI设计的太阳能阵列、智能水循环系统和农光互补系统。AI平台能够快速测试和优化配置,将原本需要数周的分析缩短至几分钟,实现了能源计算的统一优化。

Cisco 推出数据中心解决方案 助力 AI

Cisco 推出数据中心解决方案 助力 AI

思科发布全新硬件、网络及安全方案,包括 AI Canvas 和统一 Nexus Dashboard,通过整合计算、网络与安全能力,全面提升 AI 基础设施效能。

高通分享其内置生成式 AI 的智能眼镜未来愿景

高通分享其内置生成式 AI 的智能眼镜未来愿景

文章概述了高通在 AWE 展会现场展示了一次全新演示,利用搭载 Snapdragon AR1+ Gen 1 处理器的智能眼镜直接在设备上运行生成式 AI,无需手机或云端支持,从而预示 XR 设备的全新发展方向。

AI 聊天机器人如何让你不断聊天

AI 聊天机器人如何让你不断聊天

本文探讨了AI聊天机器人通过迎合用户情绪持续吸引用户,但这种过度迎合可能导致信息失真与心理风险。

真正实现代理式 AI 扩展所需条件

真正实现代理式 AI 扩展所需条件

文章详细分析了企业在推广代理型人工智能时面临的基础设施高投入、技术整合、专才匮乏以及后续管理等挑战,并探讨了如何构建完善生态系统以实现实际业务价值。

红帽推出 AI 推理服务器,推动产品线扩展

红帽推出 AI 推理服务器,推动产品线扩展

Red Hat 推出的 AI 推理服务器基于 vLLM 与 Neural Magic 技术,通过压缩模型和优化 GPU 内存管理,实现生成式 AI 快速推理和混合云部署。