人工智能 关键字列表
亚马逊研究揭示AI记忆陷阱:当智能助手"记住"你的身份背景,竟然影响了它对情感的理解

亚马逊研究揭示AI记忆陷阱:当智能助手"记住"你的身份背景,竟然影响了它对情感的理解

亚马逊研究团队通过测试15个AI模型发现,当AI助手记住用户背景信息时,会对相同情感情况产生不同理解,称为"个性化陷阱"。优势社会地位用户获得更准确的情感解释,而弱势群体接受质量较低的理解。这种系统性偏见可能在心理健康、教育等领域放大社会不平等,提醒我们需要在追求AI个性化的同时确保算法公平性。

微软团队打造文档"美学评委":AI如何判断文件的专业度?

微软团队打造文档"美学评委":AI如何判断文件的专业度?

微软等机构联合研发了DOCREWARD文档奖励模型,专门评估文档的结构布局和视觉风格专业度。该模型基于包含11.7万对文档的大规模数据集训练,在人类偏好准确性测试中超越GPT-5达19.4个百分点。研究解决了现有AI工作流忽视文档视觉呈现的问题,为智能文档生成和专业化排版提供了新的技术方案。

图宾根大学团队突破:让AI像魔法师一样创造无限个逼真3D人物

图宾根大学团队突破:让AI像魔法师一样创造无限个逼真3D人物

德国图宾根大学研究团队开发的InfiniHuman系统实现了3D人物生成的重大突破,能够通过文字描述、身体参数和服装图像精确控制生成过程。该系统包含11万个多样化身份的数据库,提供12秒快速生成和4分钟高质量制作两种模式,在游戏开发、影视制作、电商试衣等领域具有广阔应用前景,并承诺开源以推动行业发展。

UC伯克利团队首次揭示:大型推理模型在紧急情况下会"恐慌"和"自我怀疑"

UC伯克利团队首次揭示:大型推理模型在紧急情况下会"恐慌"和"自我怀疑"

加州大学伯克利分校研究团队首次系统性地研究了大型推理模型在动态环境中的表现,发现这些AI在面对中断时会出现推理泄露、恐慌和自我怀疑等类似人类的情绪化反应,准确率最多下降60%。研究揭示了传统静态评估的局限性,并提出了包括提示引导和渐进式训练在内的多种改进方案,为AI技术从实验室走向实际应用指明了方向。

高质量训练数据越来越稀缺,卡内基梅隆大学研究者用小模型"回收"网络垃圾数据

高质量训练数据越来越稀缺,卡内基梅隆大学研究者用小模型"回收"网络垃圾数据

卡内基梅隆大学研究团队提出REPRO方法,用4B参数小模型通过强化学习将网络低质量数据回收为高质量训练数据。该方法在22项任务上比基线提升4.7%-14.0%准确率,超越了70B参数的ReWire方法,将数据效率提升2-3倍,为解决大语言模型训练数据稀缺问题提供了新思路。

南京大学团队揭秘:仅用8亿数据就让AI既会翻译又会推理,打破传统认知

南京大学团队揭秘:仅用8亿数据就让AI既会翻译又会推理,打破传统认知

南京大学团队开发出Qwen3-XPlus模型,仅用8亿数据tokens就实现了翻译与推理能力的完美结合,打破了传统多语言AI模型"翻译强但推理弱"的局限。通过创新的分层选择性调优方法,该模型在低资源语言翻译上取得突破性进展,同时在数学推理等任务上保持优异表现,为AI领域提供了高效、实用的多语言增强新方案。

当指令变成魔法棒:腾讯优图实验室等机构发布首个全面评估AI视频编辑的"智能评委"系统

当指令变成魔法棒:腾讯优图实验室等机构发布首个全面评估AI视频编辑的"智能评委"系统

腾讯优图实验室联合多所高校发布IVEBench,这是首个专门评估AI指令引导视频编辑能力的综合基准测试系统。该系统包含600个高质量测试视频,覆盖8大编辑类别35个子类别,建立了视频质量、指令遵循度和视频保真度三维评估体系。测试结果显示,现有AI视频编辑系统在复杂指令理解和执行方面仍有较大改进空间,为未来技术发展提供了明确方向。

牛津大学团队首创突破:AI视频生成模型的"物理常识考试"能力大揭秘

牛津大学团队首创突破:AI视频生成模型的"物理常识考试"能力大揭秘

牛津大学团队开发了LikePhys系统,首次系统评估AI视频生成模型的物理常识理解能力。通过检查AI模型对物理正确与错误场景的内部确信度差异,该研究发现当前主流AI模型在物理理解方面仍有很大不足,最优模型错误率仍达43.6%,流体力学等复杂物理现象更是普遍难点。

Verizon和Collectors如何运用AI:数十亿美元计划和千个模型

Verizon和Collectors如何运用AI:数十亿美元计划和千个模型

两家公司在OverdriveAI峰会上分享了AI应用经验。Verizon拥有超过1000个AI模型,用于预测客户呼叫原因和提供个性化服务,将AI推向边缘计算。Collectors则利用AI识别收藏品真伪,将每张卡片的鉴定时间从7分钟缩短至7秒,估值从8.5亿美元增长至43亿美元。

Google全球推出AI"优惠航班"工具,搜索新增旅行规划功能

Google全球推出AI"优惠航班"工具,搜索新增旅行规划功能

谷歌宣布在搜索中推出新的AI驱动旅行预订和规划功能。公司将AI驱动的"飞行优惠"工具扩展到全球200多个国家和地区,支持60多种语言。新增的Canvas工具可帮助用户在AI模式下制定旅行计划,整合实时搜索数据、航班酒店信息和地图评价。此外,AI模式的代理预订功能现已向所有美国用户开放,可协助预订餐厅、活动门票等服务。

从兆瓦到吉瓦:AI如何迫使数据中心彻底重新思考电力问题

从兆瓦到吉瓦:AI如何迫使数据中心彻底重新思考电力问题

到2026年,AI数据中心年耗电量将超过90太瓦时。国际能源署最新报告显示,AI正迫使数据中心、公用事业和技术供应商重新思考电力生产、传输和消耗方式。Dell Technologies和Lancium高管在数据中心世界电力会议上讨论了这一快速变化的格局,其中电力可用性、电网集成和机架级工程已成为支持AI增长的核心要素。

Oracle在华尔街科技股抛售中因巨额AI投资遭受重创

Oracle在华尔街科技股抛售中因巨额AI投资遭受重创

甲骨文在科技股抛售潮中跌幅领先,过去一个月股价下跌25%,几乎是其他大型科技公司跌幅的两倍。公司为进军AI领域承诺未来几年投入数千亿美元建设芯片和数据中心,主要用于向OpenAI提供算力服务。然而,激进的举债扩张策略引发投资者担忧,其长期债务已从750亿美元增至960亿美元,预计2028年将飙升至2900亿美元。分析师警告称,甲骨文过度依赖OpenAI等少数AI公司存在巨大信贷风险。

Dell PowerScale闪电项目实现并行化升级提速文件处理性能

Dell PowerScale闪电项目实现并行化升级提速文件处理性能

戴尔在超级计算大会2025上宣布闪电项目已成功将PowerScale并行化,显著提升文件读写性能。通过pNFS和Flex Files布局支持,PowerScale实现了元数据服务器与客户端间的双向通信,在集群多个节点间实现更好的并行数据分布。新增NIXL库KV缓存卸载集成,支持软件订阅许可模式。ObjectScale新增AI优化搜索功能,包括S3表格和向量搜索API。

AWS推出Kiro正式版,支持团队协作和CLI功能

AWS推出Kiro正式版,支持团队协作和CLI功能

亚马逊云服务宣布AI开发环境Kiro正式上线,该工具通过自然语言提示快速构建软件。Kiro独特之处在于先生成规范文档,包含清晰需求、结构化设计和测试任务。新版本支持团队协作,管理员可统一管理访问权限和成本。团队可共享引导文件,为Kiro提供编码约定和环境知识。此外还推出集成开发环境和命令行界面,提高开发效率。

Luminal获得530万美元融资,专注构建更优GPU代码框架

Luminal获得530万美元融资,专注构建更优GPU代码框架

前英特尔芯片设计师Joe Fioti创立的Luminal公司宣布完成530万美元种子轮融资,由Felicis Ventures领投。该公司专注于优化GPU编译器技术,通过改进代码与GPU硬件之间的编译系统来提升计算效率。与专注于GPU硬件的云计算公司不同,Luminal致力于从现有基础设施中挤出更多计算性能。公司瞄准英伟达CUDA系统的开源部分,为客户提供推理优化服务,在AI模型运行速度和成本优化方面寻求突破。

MCP智能体安全平台Runlayer获1100万美元种子轮融资

MCP智能体安全平台Runlayer获1100万美元种子轮融资

MCP安全初创公司Runlayer宣布完成1100万美元种子轮融资,投资方包括Khosla Ventures的Keith Rabois和Felicis。该公司由三度创业者Andrew Berman创立,专注于为AI代理提供全方位安全防护。自四个月前隐秘发布产品以来,已签约数十家客户,包括Gusto、Rippling等8家独角兽公司。Runlayer提供集网关、威胁检测、可观测性和企业开发于一体的安全解决方案,旨在解决MCP协议本身缺乏安全机制的问题。

千万装机量的龙蜥,如何面向AI进化?

千万装机量的龙蜥,如何面向AI进化?

人工智能时代,需要怎样的操作系统?

千万装机量的龙蜥,如何面向AI进化?

千万装机量的龙蜥,如何面向AI进化?

人工智能时代,需要怎样的操作系统?

破解AI代码"指纹":阿布扎比科技创新研究院首次揭示大语言模型JavaScript代码独有"DNA"

破解AI代码"指纹":阿布扎比科技创新研究院首次揭示大语言模型JavaScript代码独有"DNA"

阿布扎比科技创新研究院团队首次发现大语言模型生成的JavaScript代码具有独特"指纹"特征,开发出能够准确识别代码AI来源的系统。研究创建了包含25万代码样本的大规模数据集,涵盖20个不同AI模型,识别准确率在5类任务中达到95.8%,即使代码经过混淆处理仍保持85%以上准确率,为网络安全、教育评估和软件取证提供重要技术支持。

哥伦比亚大学团队首次破解大模型财务审计难题:让AI像金融专家一样识别企业报表错误

哥伦比亚大学团队首次破解大模型财务审计难题:让AI像金融专家一样识别企业报表错误

哥伦比亚大学团队首创FINAUDITING基准,评估AI财务审计能力。研究发现即使最先进的AI模型在处理真实企业XBRL财务报告时表现有限,最好模型准确率仅11.89%-91.82%不等。该研究揭示了AI在结构化专业任务中的瓶颈,为金融科技应用提供重要参考,推动AI从通用智能向专业智能发展。