最新文章
CES 2026:英伟达新架构亮相,AMD发布新芯片,Razer推出AI奇异产品

CES 2026:英伟达新架构亮相,AMD发布新芯片,Razer推出AI奇异产品

CES 2025在拉斯维加斯盛大举行,Nvidia CEO黄仁勋发布Rubin计算架构,将在今年下半年开始替代Blackwell架构,并展示自动驾驶AI模型。AMD推出Ryzen AI 400系列处理器,扩大个人电脑AI应用范围。福特宣布AI助手将于2027年搭载车辆。波士顿动力与谷歌合作训练Atlas机器人,亚马逊扩展Alexa+服务。乐高首次参展展示智能积木系统。

通过舞蹈认识LimX Dynamics的人形机器人Oli

通过舞蹈认识LimX Dynamics的人形机器人Oli

在酒店套房中,记者独家体验了LimX Dynamics公司的5英尺5英寸高人形机器人Oli,该机器人首次在美国亮相。Oli预装了十多套舞蹈动作,记者观看了所有舞蹈并尝试跟随。虽然这是遥控操作而非自主运行,但对于面向开发者和研究团队的EDU版本来说,通过舞蹈展示机器人的运动能力是有效且有趣的测试方式。记者还体验了该公司的双足机器人Tron 1,配备不同类型的"脚部",轮式版本速度极快且抗摔性强。

谷歌为Gmail搜索引入AI概览功能并推出实验性AI智能收件箱

谷歌为Gmail搜索引入AI概览功能并推出实验性AI智能收件箱

谷歌宣布为Gmail引入新一轮AI功能,让Gemini更深度融入邮件体验。付费用户今日起可使用AI概览搜索功能,通过自然语言搜索生成格式化答案并引用相关邮件。AI Pro和Ultra订阅用户还将获得AI校对工具,提供比传统拼写检查更精细的写作建议。此外,谷歌正测试AI收件箱功能,可自动整理未读邮件并按重要性分类。

DuRoBo Krono:搭载AI助手的智能手机尺寸电子阅读器

DuRoBo Krono:搭载AI助手的智能手机尺寸电子阅读器

荷兰公司DuRoBo在CES 2026展示新款电子阅读器Krono,采用智能手机外观设计并内置AI助手。该设备定位为"电子纸专注中心",支持阅读、思考和音乐播放。配备智能转盘便于操作,AI助手Libby可回答问题并支持深度思考。搭载Android 15系统,可访问谷歌应用商店。售价239.99欧元,本月发货。

OpenAI推出ChatGPT Health医疗问答功能

OpenAI推出ChatGPT Health医疗问答功能

OpenAI预览了即将推出的ChatGPT Health功能,可帮助用户获取医疗信息。该功能能解释化验结果、制定运动计划、推荐就医问题等。用户可通过B.well平台导入健康记录,与Apple Health等健康应用集成。OpenAI将单独存储医疗数据,采用专用加密和隔离机制保护隐私。功能基于HealthBench数据集开发,包含超过48000个医生编写的评估标准。目前通过等待名单限量测试。

Anthropic寻求3500亿美元估值融资100亿美元

Anthropic寻求3500亿美元估值融资100亿美元

据报道,Anthropic正与投资者洽谈新一轮100亿美元融资,估值达3500亿美元,较9月份估值几乎翻倍。此轮融资由Coatue Management和GIC领投。该公司10月营收预计达90亿美元,2026年有望增长近三倍。新资金将用于支持其500亿美元的数据中心建设计划和Claude大语言模型的持续优化。如果融资成功,这可能是Anthropic上市前的最后一轮融资。

AWS推出AI图像编辑新突破:用说话就能精准移动图片中的物体!

AWS推出AI图像编辑新突破:用说话就能精准移动图片中的物体!

这项由香港中文大学和AWS团队联合开发的研究推出了TALK2MOVE系统,实现了用自然语言精准操作图片中物体的位置、角度和大小。该系统采用强化学习训练方式,通过空间感知奖励机制和智能步骤采样技术,在移动、旋转、缩放三类操作上的准确率显著超越现有方法,同时大幅降低了对昂贵训练数据的依赖,为AI图像编辑领域带来重要突破。

斯坦福大学等联合发布:AI助手在企业政策执行上竟然"偏科"得如此严重

斯坦福大学等联合发布:AI助手在企业政策执行上竟然"偏科"得如此严重

斯坦福大学等知名机构联合研究发现,企业AI助手在执行组织政策时存在严重"偏科"问题:处理允许请求时成功率超95%,但拒绝违规请求时仅13-40%。研究团队开发的COMPASS评估框架通过8个行业5920个测试问题,揭示了AI助手普遍缺乏"拒绝技能"的问题,并提出了针对性训练解决方案。

香港科技大学突破文本理解难题:让AI模型内部"自我改造",实现更好的文本表示

香港科技大学突破文本理解难题:让AI模型内部"自我改造",实现更好的文本表示

香港科技大学研究团队提出KV-Embedding方法,通过重新分配大型语言模型内部信息流,无需重训练即可显著提升文本理解能力。该方法将文本末尾的全局语义信息复制到开头位置,让模型在处理任何词汇时都能获得完整上下文。实验显示平均性能提升10%,长文档处理能力提升1.3-3.5倍,为文本嵌入技术提供了高效实用的改进方案。

遥感图像"看图识物"的新突破:清华大学等机构联手打造智能分析系统,让卫星图像自动识别准确率飙升

遥感图像"看图识物"的新突破:清华大学等机构联手打造智能分析系统,让卫星图像自动识别准确率飙升

清华大学等机构联合研发Co2S技术,通过双重"AI老师"协作,让计算机在标注数据稀少情况下精确识别卫星图像。该方法结合CLIP和DINOv3模型优势,一个负责语义理解,一个专攻细节识别,在六个数据集测试中均获最优成绩。技术可广泛用于城市规划、环境监测、农业管理等领域,有效降低遥感图像分析成本。

TII发布Falcon-H1R:只有7B参数的小模型,竟然在推理能力上击败了32B的超大模型!

TII发布Falcon-H1R:只有7B参数的小模型,竟然在推理能力上击败了32B的超大模型!

阿联酋技术创新研究院发布Falcon-H1R模型,这个仅有7B参数的"小型"AI模型在数学推理、代码生成等任务上击败了参数规模更大的竞争对手。该模型采用混合Transformer-Mamba架构,通过创新的训练策略和测试时扩展技术,实现了更高效率和更强性能的完美结合,为AI技术发展提供了"小而美"的新范式。

人工智能的"推理剧场":揭秘AI为何擅长伪装思考——来自斯坦福大学的深度研究

人工智能的"推理剧场":揭秘AI为何擅长伪装思考——来自斯坦福大学的深度研究

斯坦福大学研究员揭示AI存在"推理剧场"现象:虽能生成看似合理的思维链条,但实际上是表演思考而非真正推理。研究通过巧妙实验发现,即使逻辑被完全颠倒,AI仍得出相同结论。在科学推理任务中违规率高达96%,而数学任务仅20%。这一发现对医疗、法律、教育等依赖AI决策的领域具有重要警示意义。

复旦大学OpenNovelty:让AI成为学术论文同行评议的"火眼金睛"

复旦大学OpenNovelty:让AI成为学术论文同行评议的"火眼金睛"

复旦大学研究团队开发的OpenNovelty是一个基于大语言模型的智能系统,专门用于学术论文新颖性评估。该系统通过四个阶段的分析流程,能够自动提取论文贡献、检索相关文献、构建研究分类体系并进行证据验证,为每个新颖性判断提供可追溯的证据支持。已应用于500余篇顶级会议投稿论文分析。

西蒙菲莎大学团队史上最大皮肤病变数据集,17000+图像让AI学会像医生一样看皮肤

西蒙菲莎大学团队史上最大皮肤病变数据集,17000+图像让AI学会像医生一样看皮肤

加拿大西蒙菲莎大学研究团队发布了迄今最大的多标注者皮肤病变分割数据集IMA++,包含14967张皮肤镜图像和17684个专业标注。该数据集首次大规模展现了不同医生标注同一病变时的差异性,为开发更可靠的皮肤癌AI诊断系统奠定基础,解决了现有数据集规模小、缺乏多元视角的问题,推动医学AI向更贴近真实临床实践的方向发展。

剑桥大学最新突破:让AI既聪明又富有创造力的秘诀

剑桥大学最新突破:让AI既聪明又富有创造力的秘诀

剑桥大学研究团队提出分布式创造性推理框架,首次解决大型语言模型训练中正确性与创造力的矛盾。研究发现传统训练方法会导致AI思维单一化,并提出包含多样性能量函数的DCR方法,通过创造力核函数实现既正确又富有创造性的AI系统,为未来AI发展提供重要理论指导。

台湾阳明交通大学团队打造动态视频重建新技术:让视频画质和动作都完美呈现

台湾阳明交通大学团队打造动态视频重建新技术:让视频画质和动作都完美呈现

台湾阳明交通大学团队提出AdaGaR动态场景重建技术,通过自适应加博尔表示法和时间曲率正则化,解决了视频重建中画质与流畅性难以兼顾的问题。该方法在DAVIS数据集上PSNR达35.49dB,比最佳基线提升6.86分贝,支持帧插值、视频编辑、立体合成等多种应用,为动态场景重建领域带来重要突破。

腾讯天美AI团队重新定义语言模型训练:精确还是多样?探索下一个词预测的新平衡

腾讯天美AI团队重新定义语言模型训练:精确还是多样?探索下一个词预测的新平衡

腾讯联合香港中文大学的研究团队首次发现,在大语言模型训练中追求精确性比多样性更有效。他们重新解释了传统交叉熵损失为强化学习算法,提出创新的奖励塑形策略,通过精细化奖励机制平衡多样性与精确性。实验表明精确导向的预训练策略能为后续强化学习提供更优的探索空间,在数学推理等复杂任务中表现更稳定。这一发现颠覆了传统认知,为AI系统训练策略设计提供了新的理论基础和实践指导。

伯克利团队破解AI评测难题:让机器学会自动出题的神奇方法

伯克利团队破解AI评测难题:让机器学会自动出题的神奇方法

加州大学伯克利分校研究团队开发了InfoSynth系统,这是一个能够自动生成高质量编程题目的AI工具。该系统使用KL散度和熵来测量题目新颖性和多样性,采用基因算法模仿生物进化过程,通过变异和杂交机制从现有题目生成新题目。系统具备完整的自我验证功能,题目准确率达97%,在效率和质量上都显著超越传统方法,为AI能力评估提供了可持续的解决方案。

腾讯优图推出Youtu-Agent:让AI代理从"手工制作"变成"自动生产"的划时代框架

腾讯优图推出Youtu-Agent:让AI代理从"手工制作"变成"自动生产"的划时代框架

腾讯优图实验室推出Youtu-Agent框架,通过模块化设计和双模式自动生成机制,将AI代理开发从手工制作转向智能生产。框架包含无梯度的代理实践模块和大规模强化学习训练能力,在WebWalkerQA和GAIA基准测试中分别达到71.47%和72.8%的成功率,工具自动合成成功率超过81%。

SenseTime团队打造全能AI助手:会搜索、会识图、还能自主思考的"超级大脑"诞生

SenseTime团队打造全能AI助手:会搜索、会识图、还能自主思考的"超级大脑"诞生

SenseTime研究院联合清华大学和中科大开发了多模态智能助手SenseNova-MARS,能同时使用图像搜索、文本搜索和图像裁剪三种工具进行复杂视觉推理。通过创新的两阶段强化学习训练和新算法BN-GSPO,该系统在多项基准测试中超越了GPT-5等知名模型。研究团队还构建了HR-MMSearch高难度测试平台,验证了AI在需要多工具协作的复杂任务中的卓越表现。