埃默里大学等五大机构的这项研究发现,AI团队的效率提升不应仅靠增加成员数量,而应重点投资于记忆和学习能力。他们开发的LLMA-Mem系统包含情节、程序和协作三种记忆类型,能让AI团队从经验中学习。实验证明,配备先进记忆系统的小团队往往能超越规模更大但缺乏记忆能力的团队,同时节省高达71.7%的计算成本,为AI系统设计提供了全新思路。
字节跳动种子团队与北京大学联合推出原地测试时间训练技术,首次实现大语言模型的动态参数调整。该技术通过巧妙重用现有MLP组件作为快速权重,配合专门设计的语言建模目标,让模型能在推理过程中实时学习适应。实验显示该方法可直接增强现有预训练模型,在长文本处理上取得显著提升,为实现持续学习的AI系统开辟新路径。
浙江大学等高校联合研究团队开发了AI绘图程序员SciTikZer,能够直接"看懂"科学图表并自动生成TikZ绘图代码。该系统采用创新的双向自一致性强化学习方法,不仅要求AI从图片生成代码,还要能从代码重新生成图片,确保理解的准确性。在23万高质量数据集上训练后,SciTikZer-8B达到97.2%的编译成功率,显著超越现有模型,将极大降低科学图表制作门槛。
新加坡国立大学团队开发了Paper Espresso开源系统,通过AI技术自动筛选和分析arXiv热门论文,解决科研人员面临的信息过载问题。系统连续运行35个月,处理超过1.3万篇论文,提供结构化摘要、主题分析和多时间尺度趋势报告,揭示AI研究领域动态规律,发现新颖主题组合能获得2倍关注度。
新加坡国立大学和百度联合开发的ONE-SHOT框架,通过创新的空间解耦技术,实现了人物动作、环境背景和摄像机运动的独立控制与完美融合。该技术突破了传统视频生成中复杂3D预处理的限制,既保持精确控制又维持创造灵活性,能生成长达数分钟的高质量人机环境交互视频,为数字内容创作开辟了新的可能性。
研究发现科学AI模型在处理生物和物理数据时存在"几何对齐税"问题:将连续自然现象转换为离散代码会造成几何扭曲。实验证明连续输出比离散输出几何稳定性好8.5倍,大模型反而稳定性更差。识别出三种失效模式:局部-全局解耦、表示压缩和几何空虚。发现Evo2的DNA反向互补能力实为统计假象。
谷歌近日在Chrome浏览器中推出"Skills"功能,允许用户将常用的Gemini提示词保存为快捷指令,浏览网页时只需单击即可调用。用户可通过输入"/"或点击加号按钮访问已保存的Skills,操作结果将在当前标签页中直接执行。该功能同步支持跨设备使用,登录谷歌账号即可共享。此外,Chrome还提供内置的Skills资源库,包含多种预设提示词供用户选用和编辑。该功能对所有英语版Chrome用户免费开放,无需付费订阅。
英伟达发布多款开放权重AI模型,旨在帮助量子硬件开发者大幅降低处理器错误率。其中,350亿参数的视觉语言模型Ising Calibration可自动优化量子系统配置以减少噪声;Ising Decoding系列模型则基于卷积神经网络架构,能以比传统方法快2.25至2.5倍的速度实时检测并纠正错误。相关模型权重已上传至Hugging Face平台,并配套提供训练框架与推理蓝图。
GitHub正式预览"堆叠PR"(Stacked PRs)新功能,旨在解决大型拉取请求难以审查的痛点。该功能允许多个PR形成堆叠结构,每个PR可独立审查和合并,也可整体合并。其核心优势在于鼓励开发者提交更小、更聚焦的代码变更,避免因等待合并而产生庞大的PR。该功能灵感源自Facebook早年开发的Phabricator工具集,目前配套提供命令行工具gh stack,同时支持纯UI操作,并已针对AI智能体的使用场景进行优化设计。
Core AI Holdings与Allianca集团宣布成立合资公司,旨在加速AI就绪数据中心的交付能力。双方将整合Core AI的基础设施战略与Allianca的交钥匙交付模式,构建覆盖选址、预建设规划、模块化部署及设施调试的一体化平台。当前AI基础设施市场需求持续超过供给,执行能力已取代资本成为项目推进的核心瓶颈,超大规模云服务商仍主导市场格局。
两份独立报告显示,美国数据中心建设正从传统沿海地区向内陆迁移,电力供应与成本是主要驱动因素。德克萨斯州是最大受益者,威斯康星、印第安纳、密歇根等中西部州也吸引了亚马逊、谷歌、微软等科技巨头的大量投资。然而,受零部件短缺及民众与政府抵制等因素影响,今年预计投入使用的16GW数据中心中,仅三分之一在建,30%至50%的项目或将延期。
前Neuralink联合创始人Max Hodak创立的Science Corporation,已邀请耶鲁大学医学院神经外科主任Murat Günel博士担任科学顾问,推进其生物混合脑机接口的首次人体试验。该公司成立于2021年,上月完成2.3亿美元C轮融资,估值达15亿美元。其核心技术将实验室培育的神经元与电子器件结合,旨在建立大脑与计算机之间的可靠连接,用于治疗帕金森症等神经系统疾病,并探索人体功能增强的可能性。预计最早2027年启动人体临床试验。
金融风险管理平台Pillar宣布完成由Andreessen Horowitz领投的2000万美元种子轮融资,迄今总融资额达2300万美元。该平台成立于2023年,专为金属、食品、航空等大宗商品驱动型企业提供AI驱动的自动化对冲服务。系统可整合合同、现金流、ERP软件及WhatsApp消息等多源数据,持续分析风险敞口,自动构建并管理对冲组合,目标是让中小企业也能享有机构级风险管理工具。
谷歌近日宣布为Chrome浏览器新增AI功能——"技能"(Skills)。该功能允许用户保存常用的AI提示词,并在不同网页上一键复用,无需重复输入。Skills与Chrome内置的Gemini AI深度整合,用户可通过输入"/"或点击"+"按钮调用已保存的技能。例如,用户可保存"在食谱中推荐纯素替代品"的提示词,以便在浏览各类食谱页面时快速使用。此外,谷歌还推出技能库,涵盖生产力、购物、预算等常见场景,支持个性化定制。该功能即日起面向已登录谷歌账号的Chrome桌面用户推出,初期仅支持英语(美国)界面。
微软即将为Windows Insider成员提供一种便捷方式,让用户自主选择测试哪些新功能。此前,内测用户只能等待微软通过"受控功能推出"程序随机分配测试功能,或借助ViVeTool等第三方软件手动启用。新设置名为"功能标志",对企业管理员尤为实用。目前该功能尚未正式启用,微软设计负责人Marcus Ash表示将于近期分享更多细节。
苹果本周宣布其Studio Display XDR显示器的医学影像校准功能获得FDA认证,正式进军价值426亿美元的全球医疗影像设备市场。相比传统超过1.5万美元的放射科工作站,一台Mac加一块2899美元的苹果显示器即可满足需求。结合Apple Silicon的本地AI处理能力与MLX框架,苹果为未来AI辅助医疗影像诊断提供了高性价比的解决方案,有望推动医疗影像工具的普及化。
StrictlyVC年度首场活动将于4月30日在旧金山Sentro Filipino文化中心举行。本次活动汇聚多位重量级嘉宾:TDK Ventures总裁Nicolas Sauvage将分享企业风投运作逻辑,其任内已推动52家初创企业获投,孵化出Groq等三家独角兽;Meta前新闻负责人Campbell Brown将探讨AI平台信息可信度问题;Replit联合创始人Amjad Masad将分享AI编程革命的前沿洞察。活动还设有多轮交流环节,为创业者提供融资对接机会。
谷歌正在为桌面版Chrome推出名为"Skills"的新功能,允许用户保存常用的Gemini提示词,以便快速访问和重复执行特定任务。例如,用户可保存提示词来计算食谱营养成分,或对多个标签页中的产品进行规格对比。保存的提示词可通过输入"/"或点击加号按钮调用,并在已登录账户的所有桌面版Chrome中同步。目前该功能仅向浏览器语言设置为美式英语的用户开放。
随着AI基础设施规模扩张,铜、金等数据中心硬件所需关键金属的供应压力持续上升。思科正与英国DEScycle公司合作,在英国威尔顿试验一种分布式模块化金属回收平台,通过处理思科废旧硬件中的电子废料板,评估金属回收效率与经济可行性。该试验旨在探索更贴近硬件部署地点的本地化回收模式,减少对传统集中式冶炼设施的依赖,助力AI基础设施供应链的可持续发展。