最新文章
中科院软件所提出SolutionRAG系统:工程师的智能助手,让复杂工程设计变得简单易行

中科院软件所提出SolutionRAG系统:工程师的智能助手,让复杂工程设计变得简单易行

中科院软件所联合阿里巴巴推出SolutionRAG智能工程设计系统,通过双重思维树机制自动生成复杂工程解决方案。该系统能像资深工程师一样同时考虑地震、土壤、降雨等多重约束条件,在八个工程领域的测试中均达到最佳性能,为工程设计的智能化应用开辟了新方向。

推荐系统也要"三思而后行":中国人民大学发现让AI推荐更聪明的新方法

推荐系统也要"三思而后行":中国人民大学发现让AI推荐更聪明的新方法

中国人民大学研究团队开发了ReaRec推荐系统,让AI学会"三思而后行"。不同于传统推荐系统的直接反应,ReaRec通过多步推理深度理解用户需求,特别擅长为新用户和小众商品提供精准推荐。实验显示平均性能提升7.49%,理论上限可达30-50%提升,为推荐系统开辟了推理时计算的全新方向。

AI届也有自己的拼多多,阶跃星辰推出超省钱的AI模型:Step-3
2025-07-30

AI届也有自己的拼多多,阶跃星辰推出超省钱的AI模型:Step-3

AI届也有自己的拼多多,阶跃星辰推出超省钱的AI模型:Step-3

Positron推出专业AI推理芯片,挑战英伟达市场地位

Positron推出专业AI推理芯片,挑战英伟达市场地位

初创公司Positron获得5160万美元A轮融资,推出专门针对AI推理的Atlas芯片。该公司声称其芯片在性能功耗比和成本效益方面比英伟达H100高出2-5倍,并已获得Cloudflare等企业客户采用。Positron专注于内存优化设计,无需液体冷却,可直接部署在现有数据中心。公司计划2026年推出支持16万亿参数模型的下一代Titan平台。

从试点到回报:将AI投资转化为真实投资回报率

从试点到回报:将AI投资转化为真实投资回报率

忽视智能体AI的潜力,特别是其对现代化数据基础设施的需求,面临着与忽视互联网的零售商相同的生存风险。关键不在于是否投资,而在于如何确保投资转化为可衡量的现实收益。企业需要超越AI试验阶段,明确业务目标,从治理开始构建ROI模型。成功的组织在整个技术栈中嵌入智能体,从面向客户的应用到内部治理系统。通过强化数据治理、减少重复工具和统一平台,AI的ROI将从理论变为现实。

Prophet Security获3000万美元A轮融资,推动AI智能体自主网络防御

Prophet Security获3000万美元A轮融资,推动AI智能体自主网络防御

Prophet Security宣布完成3000万美元A轮融资,用于开发自主人工智能网络安全防御系统。该公司推出业内首个全面的代理AI安全运营中心平台,能够在无人工干预情况下自主调查和响应威胁。过去六个月,该平台已执行超100万次自主调查,节省36万小时调查时间,响应速度提升10倍,误报率降低96%。公司旨在解决企业每日平均960个安全警报中40%因资源限制而被忽视的问题。

ChatGPT推出学习模式,旨在引导学习而非直接给答案

ChatGPT推出学习模式,旨在引导学习而非直接给答案

OpenAI推出ChatGPT学习模式,旨在帮助学生建立深度理解而非简单提供答案。该模式采用苏格拉底式教学法,通过引导性问题和知识检查点逐步展开信息。与传统ChatGPT直接给出总结不同,学习模式会询问学生的熟悉程度,提供个性化反馈,并在学生试图直接要答案时引导其思考解题过程,为学生提供24/7不知疲倦的个人导师体验。

Stack Overflow数据揭示"几乎正确"的AI代码带来隐性生产力负担

Stack Overflow数据揭示"几乎正确"的AI代码带来隐性生产力负担

Stack Overflow 2025年开发者调查显示,84%的开发者使用或计划使用AI工具,但对AI工具的信任度却大幅下降。仅33%的开发者信任AI准确性,低于去年的43%。66%的开发者反映"几乎正确但不完全正确"的AI解决方案是最大困扰,45%表示调试AI生成代码比预期耗时更长。AI工具承诺提升生产力,却可能创造新的技术债务类别,成为企业AI应用的隐性生产力税收。

微软与OpenAI谈判:确保AGI里程碑后技术访问权限

微软与OpenAI谈判:确保AGI里程碑后技术访问权限

微软正与OpenAI进行高级谈判,旨在确保即使OpenAI实现通用人工智能后仍能继续使用其技术。据报道,双方谈判进展积极,可能在几周内达成协议。该协议将为OpenAI向完全商业化企业转型扫清关键障碍。微软已投资137.5亿美元,希望在重组后的公司中获得更大股份,谈判涉及30%左右的股权比例,同时确保Azure和Copilot等服务的技术供应安全。

Arcee推出企业级可定制AI模型AFM-4.5B,基于严格筛选的清洁数据训练

Arcee推出企业级可定制AI模型AFM-4.5B,基于严格筛选的清洁数据训练

AI初创公司Arcee.ai发布45亿参数的企业级AI模型AFM-4.5B,采用严格筛选的清洁数据训练。该模型专为商业和企业用途设计,年收入低于175万美元的企业可免费使用。相比数百亿参数的大模型,AFM-4.5B在保持强劲性能的同时具备成本效益和监管合规性。模型支持云端、本地和边缘部署,内置函数调用和智能体推理功能,旨在满足企业对速度、主权和规模的需求。

SOSV押注等离子体技术将改变半导体到航天器的一切

SOSV押注等离子体技术将改变半导体到航天器的一切

SOSV投资者认为等离子技术将成为从核聚变发电到半导体制造等多领域的关键工具。该公司计划未来五年投资超过25家等离子相关初创企业,并与新泽西州经济发展局和美国能源部普林斯顿等离子物理实验室合作开设新的Hax实验室。除核聚变外,等离子技术还可用于数据中心芯片冷却、航天器推进器、半导体新材料制造以及化学品生产等领域。

2025-07-30

Arm 洞察与思考:为什么 AI 向边缘迁移的速度超乎想象

Arm 最新发布了《AI 效率热潮:更小的模型与加速的计算正驱动 AI 无处不在》报告,该报告深度解析了驱动这一转变的核心因素,以及其如何重塑半导体、AI 和终端设备生态系统。

为创意写作量身定制:Midjourney团队如何让AI写作变得更有趣更多样化

为创意写作量身定制:Midjourney团队如何让AI写作变得更有趣更多样化

这项由Midjourney团队主导的研究解决了AI创意写作中的关键问题:如何让AI既能写出高质量内容,又能保持创作的多样性和趣味性。通过引入"偏差度"概念和开发DDPO、DORPO两种新训练方法,他们成功让AI学会从那些被传统方法忽视的优秀独特样本中汲取创意灵感,最终训练出的模型在保持顶级质量的同时,创作多样性接近人类水平,为AI创意写作开辟了新方向。

改写多模态AI的"火眼金睛":上海AI实验室让机器学会逐步推理判断

改写多模态AI的"火眼金睛":上海AI实验室让机器学会逐步推理判断

上海AI实验室联合多所高校开发出VisualPRM系统,这是首个专门用于多模态推理的过程奖励模型。该系统能像老师批改作业一样逐步检查AI的推理过程,显著提升了AI在视觉推理任务上的表现。研究团队构建了包含40万样本的训练数据集和专门的评估基准,实现了在七个推理基准上的全面性能提升,即使是最先进的大型模型也获得了5.9个百分点的改进。

上海AI实验室团队提出LEGO-Puzzles:揭露多模态大模型在空间推理上的惊人短板

上海AI实验室团队提出LEGO-Puzzles:揭露多模态大模型在空间推理上的惊人短板

上海AI实验室团队通过LEGO积木设计了创新评测基准LEGO-Puzzles,系统测试了20个先进多模态大语言模型的空间推理能力。研究发现即使最强AI模型准确率仅57.7%,远低于人类93.6%的表现,揭示了当前AI在三维空间理解和多步序列推理方面的重大不足,为机器人、自动驾驶等应用发展提供重要参考。

字节跳动团队突破性成果:让AI记住你的脸,随心所欲重塑照片的新技术

字节跳动团队突破性成果:让AI记住你的脸,随心所欲重塑照片的新技术

字节跳动团队突破了AI图像生成领域的三大难题:身份识别不准确、文字理解偏差和图片质量不佳。他们开发的InfiniteYou技术采用创新的InfuseNet架构和多阶段训练策略,能够根据用户照片和文字描述生成高质量个性化图像。实验显示该技术在身份相似度、文本匹配度和图像质量方面均超越现有最佳方案,并具备出色的兼容性,为个性化内容创作开辟了新道路。

AI推理能力再次升级!新加坡国立大学团队发布多模态思维链推理全面调研报告

AI推理能力再次升级!新加坡国立大学团队发布多模态思维链推理全面调研报告

这份由新加坡国立大学等顶尖学府研究团队发布的调研报告,系统梳理了多模态思维链推理这一前沿AI技术的发展现状。该技术让AI具备了同时处理文字、图像、音频等多种信息并进行逐步推理的能力,在医疗诊断、自动驾驶、智能机器人等领域展现出巨大应用潜力,代表了AI从简单工具向真正智能伙伴进化的重要一步。

机器人也能从"失败"中学习?上海交大团队让机器人训练数据少用80%却更聪明

机器人也能从"失败"中学习?上海交大团队让机器人训练数据少用80%却更聪明

上海交大等机构联合提出ADC方法,通过双人协作的对抗性数据收集策略,让机器人仅用20%的训练数据就能获得更强的环境适应能力和指令理解能力。该方法引入"对抗操作员"在训练过程中制造视觉和语言扰动,迫使主操作员实时调整策略,从而大幅提升数据信息密度和机器人的鲁棒性表现。

让静态人像"开口说话":Hedra公司推出MagicInfinite,用声音和文字让照片动起来

让静态人像"开口说话":Hedra公司推出MagicInfinite,用声音和文字让照片动起来

Hedra公司推出的MagicInfinite技术能够让静态人像照片"开口说话",支持通过声音和文字双重控制生成高质量动态视频。该系统采用3D全注意力机制和两阶段训练方案,可处理各种风格人像(真实照片、动漫、艺术作品),实现精确的嘴唇同步。经过模型蒸馏优化后,生成速度提升20倍,10秒内可生成10秒视频。在用户测试中,91.33%的参与者认为其表现优于现有同类技术。