人工智能 关键字列表
OpenCUA开源计算机操作智能体媲美OpenAI和Anthropic专有模型

OpenCUA开源计算机操作智能体媲美OpenAI和Anthropic专有模型

香港大学研究团队发布OpenCUA开源框架,用于构建能够自主操作计算机的AI智能体。该框架包含工具、数据和训练方法,其训练的模型在基准测试中表现优异,超越现有开源模型,与OpenAI和Anthropic的商业模型性能接近。框架核心是AgentNet工具,可收集跨操作系统的人类操作演示数据,并采用思维链推理增强训练效果,为企业自动化工作流程提供透明可控的解决方案。

MCP-Universe基准测试显示GPT-5在超半数真实业务场景中表现不佳

MCP-Universe基准测试显示GPT-5在超半数真实业务场景中表现不佳

Salesforce AI研究团队开发了开源基准测试MCP-Universe,用于评估大语言模型在真实世界中与MCP服务器的交互能力。测试涵盖位置导航、代码库管理、金融分析等六个企业核心领域的231项任务。结果显示,即使是OpenAI最新发布的GPT-5等顶级模型,在处理企业级真实场景任务时仍面临挑战,超过一半的企业典型任务无法成功完成,特别是在长上下文和未知工具使用方面表现不佳。

Zed编辑器Windows版本移植延迟揭示跨平台开发难题

Zed编辑器Windows版本移植延迟揭示跨平台开发难题

基于Rust的代码编辑器Zed联合创始人解释了Windows版本开发缓慢的原因。该编辑器于2023年3月发布macOS测试版,2024年6月推出Linux版本,但Windows版本仍处于内测阶段。开发团队使用自研的GPU加速UI框架GPUI以优化性能,但这导致在Windows平台上需要处理不同的图形API、文件系统操作、崩溃报告和路径约定等问题,凸显了跨平台应用开发中Windows系统带来的技术挑战。

英伟达推出千兆级网络与快速推理服务技术

英伟达推出千兆级网络与快速推理服务技术

英伟达发布Spectrum-XGS千兆级以太网交换平台,实现数据中心间互联协调,让分布式GPU集群如同一个巨型处理器运行。同时推出Dynamo推理服务框架,通过分解式服务技术将上下文构建和令牌生成分配到不同GPU,显著提升模型部署效率。在GPT和DeepSeek等模型测试中,令牌生成速度分别提升4倍和2.5倍,投机解码技术更实现35%性能提升。

沃尔玛AI安全堆栈内幕:初创思维强化企业级防护

沃尔玛AI安全堆栈内幕:初创思维强化企业级防护

沃尔玛首席信息安全官Jerry R. Geisler III分享了这家全球最大零售商如何应对AI自主化带来的网络安全挑战。他介绍了保护代理AI系统、现代化身份管理的策略,以及建设Element AI平台的关键经验。沃尔玛采用"初创思维"重构身份访问管理系统,在谷歌云、Azure和私有云环境中实施零信任架构,通过集中化AI平台实现"治理中的速度",在可信安全框架内推动AI创新快速发展。

生成式AI正在重塑社交媒体营销,人机平衡成关键

生成式AI正在重塑社交媒体营销,人机平衡成关键

生成式AI已渗透到社交媒体的各个层面,96%的社交媒体管理者使用AI工具辅助工作。AI主要用于内容创意生成、文案写作和文本改写等任务,帮助专业人士应对多平台运营压力。然而AI使用也面临质量问题、品牌个性丧失和用户反感等风险。专家建议AI可作为"超级助手"处理基础工作,但创意决策和敏感沟通仍需人工把控,关键是在提升效率与保持人性化连接间找到平衡。

微软AI高管称研究AI意识问题是"危险的"

微软AI高管称研究AI意识问题是"危险的"

微软AI首席执行官苏莱曼发文称,研究AI福利和意识"既不成熟又危险",认为这会加剧人类对AI的不健康依赖。而Anthropic、OpenAI等公司正积极研究AI意识问题,招聘相关研究人员。业界对AI是否会产生主观体验及其权利问题分歧严重。前OpenAI员工认为可以同时关注多个问题,善待AI模型成本低且有益。随着AI系统改进,关于AI权利和意识的辩论预计将升温。

谷歌AI搜索模式全球扩展推出智能体预订功能

谷歌AI搜索模式全球扩展推出智能体预订功能

谷歌宣布将AI搜索模式扩展至全球超过180个国家和地区,并新增餐厅预订等智能代理功能。该模式将传统搜索结果转换为对话式个性化解答,用户可进行追问获取深度信息。新功能利用Project Mariner技术,能够自动浏览多个预订平台寻找符合需求的餐厅并直接链接预订页面。美国用户还将享受基于历史偏好的个性化结果,并可通过分享链接与他人协作规划。

基于事件驱动的智能体AI重塑企业资源规划系统

基于事件驱动的智能体AI重塑企业资源规划系统

企业资源规划系统正从传统的请求响应模式向事件驱动架构转变,结合智能代理AI实现自主运营。新一代ERP系统能够基于实时触发器自动响应业务事件,无需人工干预即可执行采购、财务对账等流程。通过代理间直接通信,ERP将从静态数据存储库演进为动态智能网络节点,实现跨系统实时协调。这种转变将显著提升运营效率和响应速度,但同时也带来治理、数据质量等挑战。

机器人软件创企FieldAI获4.05亿美元融资

机器人软件创企FieldAI获4.05亿美元融资

机器人AI软件开发商FieldAI宣布通过两轮融资筹集4.05亿美元,其中3.15亿美元由贝索斯探险基金、Prysm和淡马锡领投。该公司开发的软件平台可让机器人在建筑工地等复杂环境中导航,采用专有的场域基础模型技术。该软件无需地图、GPS或预定义路径即可运行,支持人形机器人、自动驾驶车辆等多种系统。目前已在数百个工业环境中部署,估值达20亿美元。

Epic发布医疗智能体系统重新定义健康产业生态

Epic发布医疗智能体系统重新定义健康产业生态

Epic公司CEO朱迪·福克纳宣布推出"医疗智能"概念,在其电子病历系统中开发智能AI代理。该系统基于超过3亿患者记录的Cosmos数据集,包含四个核心AI代理:患者导航员Emmie、临床医生助手ART、诊疗决策支持Cosmos AI和管理优化器Penny。这些代理能够提供预测性健康监测、简化临床试验匹配、优化医疗流程。Epic与微软深度合作,利用Azure AI确保系统规模化和可靠性,旨在构建统一的智能医疗生态系统。

GPT-4o开启太空舱门:AI Space Cortex让航天器具备自主运行能力

GPT-4o开启太空舱门:AI Space Cortex让航天器具备自主运行能力

加州理工学院、NASA喷气推进实验室等机构合作开发AI太空皮层系统,利用GPT-4o和计算机视觉技术实现太空任务自主操作。该系统能够进行实时场景分析、故障自诊断和重新校准,在机械臂受损情况下仍可恢复90%以上精度。项目已在NASA海洋世界着陆器自主测试平台完成验证,为未来木星卫星探索任务提供技术支持。

DeepSeek发布V3.1版本,为国产新一代芯片做好准备

DeepSeek发布V3.1版本,为国产新一代芯片做好准备

中国AI公司DeepSeek发布旗舰语言模型V3.1更新版,该模型已针对新一代国产芯片进行优化。新模型采用UE8M0数据类型训练,为即将发布的国产芯片做准备。V3.1统一了"思考"和"非思考"模式,单一模型支持两种范式,上下文窗口从65536扩展至131072个token,在工具调用能力上显著提升,Browsecomp基准测试得分从8.9提升至30。

微软继续推进控制面板退役计划

微软继续推进控制面板退役计划

微软在Windows 11 Insider Preview Canary Channel build 27928中将语言和时间设置从控制面板迁移至设置应用。新功能包括添加时钟、选择时间服务器、时间格式设置以及数字货币格式更改等。微软去年曾表示控制面板"已弃用"后迅速收回,但目前仍强调其仅为兼容性保留。此外,Copilot+电脑用户可使用Copilot应用进行语义文件搜索,支持自然语言查找文档和图像。

Google搜索AI模式全球推广并提升智能化水平

Google搜索AI模式全球推广并提升智能化水平

谷歌正在将其搜索引擎的AI模式推广到全球更多地区,同时不断提升人工智能技术的智能化水平。这一举措标志着谷歌在搜索领域的AI应用将覆盖更广泛的用户群体,为全球用户提供更加智能、精准的搜索体验。通过持续的技术优化和功能升级,谷歌AI搜索模式将能够更好地理解用户需求,提供更相关的搜索结果。

微软Visual Studio正式发布MCP功能,但存在安全风险

微软Visual Studio正式发布MCP功能,但存在安全风险

微软宣布Visual Studio中的模型上下文协议(MCP)服务器正式可用,开发者可通过.mcp.json文件连接本地或远程MCP服务器。尽管MCP能扩展AI代理功能,但安全公司研究发现,在281个MCP服务器中,9%存在完全可利用的漏洞,使用3个服务器时高风险漏洞概率达52%。专家建议每次调用都需用户批准、禁用不需要的服务器、使用容器隔离并避免组合风险。

AI时代数据架构:BigQuery统一平台的探索

AI时代数据架构:BigQuery统一平台的探索

随着AI技术快速发展,传统数据仓库和数据湖难以满足AI驱动分析的灵活性和速度要求。Google重新设计BigQuery为统一的数据和AI平台,能够整合结构化和非结构化数据,实现与AI代理的无缝连接。该平台采用代理式AI方法,超越传统机器学习模型嵌入,实现自动化、情境感知的洞察生成,提升分析的速度、质量和可访问性,帮助企业构建适应AI时代的现代化数据架构。

戴尔投资5000万美元建设新加坡AI创新中心

戴尔投资5000万美元建设新加坡AI创新中心

戴尔科技在新加坡开设人工智能创新中心,旨在加速亚太地区企业和政府的AI应用。该中心基于2021年5千万美元全球创新投资,专注AI转型、AI赋能和AI领导力三大支柱。中心已开发约50个AI工程解决方案原型,完成超100个概念验证项目。戴尔计划到2025年底培训约1万名学生和职场人士,涵盖AI工程、机器学习运维等领域,并参与新加坡技术治理倡议。

百度无人出租车已实现盈亏平衡,海外扩张前景可观

百度无人出租车已实现盈亏平衡,海外扩张前景可观

中国互联网巨头百度表示,其在中国的无人出租车业务已实现盈亏平衡,对进军全球市场后的盈利前景充满信心。CEO李彦宏在财报电话会议中透露,尽管武汉的出租车费用比其他中国城市低30%,但百度的无人出租车业务已在当地实现盈亏平衡。AI技术在多方面助力百度发展,包括代码生成、数字人技术等,但AI搜索的商业化仍面临挑战。

TikTok母公司字节跳动发布开源Seed-OSS-36B模型,支持512K Token上下文

TikTok母公司字节跳动发布开源Seed-OSS-36B模型,支持512K Token上下文

字节跳动Seed团队在Hugging Face发布新的开源大语言模型Seed-OSS-36B,专为高级推理和开发者友好性设计。该模型提供三个版本:基础模型(含/不含合成数据)和指令调优版本。模型拥有360亿参数,支持512K令牌上下文长度,相当于约1600页文本。在数学推理、编程和长文本处理等基准测试中达到开源领域最先进水平。采用Apache-2.0许可证,允许企业免费商用部署。