最新文章
Jina AI推出2.4B参数多语言视觉语言模型:小身材,大本事的AI视觉助手

Jina AI推出2.4B参数多语言视觉语言模型:小身材,大本事的AI视觉助手

Jina AI推出了仅24亿参数的jina-vlm视觉语言模型,在同等规模模型中实现了最佳多语言表现。该模型通过创新的注意力池化连接器将SigLIP2视觉编码器与Qwen3语言模型连接,采用分块图像处理策略和两阶段训练方法,在30多种语言的视觉问答任务中表现出色,同时保持了优异的英语性能,为小型化高效AI模型的发展提供了新思路。

当AI也有了"户籍":MIT团队揭秘开放模型世界的权力版图大洗牌

当AI也有了"户籍":MIT团队揭秘开放模型世界的权力版图大洗牌

本文基于MIT等机构研究团队对全球最大开放AI模型平台Hugging Face的深度分析,通过22亿次下载记录和85万个模型数据,首次系统揭示了开放AI生态系统中的权力分布变化。研究发现美国科技巨头主导地位正在衰落,中国AI企业强势崛起,个人开发者影响力大幅提升,同时AI模型正向大规模多模态发展,但透明度却在下降,为理解AI技术发展趋势和制定相关政策提供了重要参考。

腾讯团队首创视觉"聪明眼",让AI像人一样智能看图

腾讯团队首创视觉"聪明眼",让AI像人一样智能看图

腾讯AI实验室首创AdaptVision系统,让AI像人类一样先看整体再聚焦细节,实现视觉问答任务的智能资源分配。该系统通过创新的"解耦回合策略优化"训练方法,学会根据问题复杂度动态决定是否需要查看高分辨率图像区域。实验表明,在保持准确性的同时,AdaptVision仅使用传统方法33%的视觉信息量,为AI视觉领域带来效率革命。

台大等顶尖高校联手破解图像去模糊难题:让AI学会物理规律的BlurDM模型

台大等顶尖高校联手破解图像去模糊难题:让AI学会物理规律的BlurDM模型

这项由台湾多所顶尖高校联合完成的研究首次将物理模糊形成过程融入AI去模糊技术。BlurDM通过双重扩散机制,同时处理随机噪声和结构化模糊,在四个基准数据集上全面超越现有方法。该技术采用三阶段训练策略和潜在空间优化,仅需5步迭代即可实现高质量图像恢复,为手机摄影、监控系统等实际应用奠定了技术基础。

NPU芯片上的多模态AI突破:Nexa AI与吉利汽车联手打造边缘智能新方案

NPU芯片上的多模态AI突破:Nexa AI与吉利汽车联手打造边缘智能新方案

Nexa AI与吉利汽车联合开发的AutoNeural系统,专门解决车载AI的效率问题。通过MobileNet视觉识别和混合Transformer-SSM语言架构,在NPU芯片上实现14倍速度提升,支持实时安全监控、智能交互等汽车应用。该技术已在高通芯片上验证成功,为智能座舱普及奠定基础。

南京大学团队发布PosterCopilot:让AI成为真正懂设计的海报制作助手

南京大学团队发布PosterCopilot:让AI成为真正懂设计的海报制作助手

南京大学团队开发的PosterCopilot系统通过创新的三阶段训练方法,解决了AI海报设计中的几何理解和美学判断难题。该系统不仅能生成专业水准的海报,还支持精确的分层编辑,让普通用户也能轻松制作高质量设计作品,为AI在创意领域的应用开辟了新路径。

清华大学和微软联手破解视频理解难题:让AI像人一样"看懂"长视频

清华大学和微软联手破解视频理解难题:让AI像人一样"看懂"长视频

清华大学和微软联合研究团队提出DIG框架,解决AI长视频理解难题。该框架首次区分全局和局部查询类型,对不同问题采用相应策略:全局问题用均匀采样,局部问题用智能帧选择。实验显示性能提升达7%,在256帧输入下仍保持优势,为视频内容分析、推荐系统等提供重要技术支撑。

手机里的NPU越来越强,为什么AI体验还在原地踏步?

手机里的NPU越来越强,为什么AI体验还在原地踏步?

尽管芯片厂商不断推出性能更强的神经处理单元,声称比上代产品快30-40%,但大多数AI功能仍依赖云端处理。专家指出,云端AI模型拥有数千亿参数,而手机NPU只能处理约30亿参数的模型。本地AI处理虽然在隐私保护和可靠性方面具有优势,但受限于内存容量和处理能力,目前主要应用于特定场景。业界正致力于优化模型压缩技术,实现云端与本地AI的混合处理模式。

如何使用现有基础设施让数据做好AI准备

如何使用现有基础设施让数据做好AI准备

Hammerspace通过现有NVMe存储最大化GPU使用率。随着AI计算在混合云和多云环境中扩展,基础设施团队面临着加速洞察时间同时最大化GPU投资的压力。Hammerspace Tier 0将GPU服务器集群内的本地NVMe存储转换为超高速共享存储层,性能比传统网络存储提升10倍,减少检查点时间,提高GPU使用率,改善推理响应时间,无需额外存储系统,节省数百万美元成本。

IT领导者快问快答:思科光网络公司首席数字信息官Craig Williams分享AI转型经验

IT领导者快问快答:思科光网络公司首席数字信息官Craig Williams分享AI转型经验

Ciena副总裁兼首席数字信息官Craig Williams分享了光网络和高速连接提供商如何应对AI挑战。他指出这一转型过程"既令人兴奋又让人谦卑,没有既定的变革模板"。Williams团队已评估超过250个AI创意,并将最有前景的项目投入实施。他强调了两个AI战略应用:利用AI辅助编程提升内部效率,以及通过AI降低数字基础设施能耗。

Anthropic CEO警告AI行业泡沫化,批评"YOLO"式投资

Anthropic CEO警告AI行业泡沫化,批评"YOLO"式投资

Anthropic首席执行官达里奥·阿莫代在峰会上警告AI行业存在泡沫风险,暗示某些竞争对手采取过于激进的策略。他提到一些公司存在"YOLO"心态,进行大规模循环投资,可能因时机判断错误而面临风险。阿莫代强调,虽然技术发展稳健,但经济层面存在不确定性,数据中心建设需要提前1-2年规划,买多买少都有风险。

雅虎利用AI实时总结橄榄球比赛精彩内容

雅虎利用AI实时总结橄榄球比赛精彩内容

雅虎在其体育应用中推出了名为"比赛解析"的新功能,利用AI模型自动生成比赛快照。该功能包含三个核心部分:比赛摘要、重要比赛片段流和后续问题提示。AI模型不仅挖掘统计数据,还试图理解比赛的情感层面和人文故事。雅虎计划结合自身记者团队和用户反馈来训练系统,使其更好地理解体育比赛中真正重要的内容。未来该功能将扩展到其他体育项目,并可能提供个性化定制服务。

押注AI智能体,奇奇科技跨越十年的“换挡”与远航

押注AI智能体,奇奇科技跨越十年的“换挡”与远航

阿里云正在携手伙伴将AI像水电一样输送到各行各业,而像奇奇科技这样的生态“毛细血管”,必须具备将这些“水电”接入企业“最后一公里”的能力。

联想天禧AI及创新终端设备在2025 AIE博览会获两项大奖,引领个人AI体验创新
2025-12-05

联想天禧AI及创新终端设备在2025 AIE博览会获两项大奖,引领个人AI体验创新

联想集团在AIE 上,集中展示了混合式AI战略下的系列创新成果,凭借在个人AI领域的突出表现,接连荣获两项行业重要奖项。

2025-12-05

豆包手机助手调整部分AI能力 呼吁保障用户AI使用权

豆包手机助手调整部分AI能力 呼吁保障用户AI使用权

浙江大学突破视频AI瓶颈:让计算机用"金字塔眼光"看视频,速度提升10倍不掉质量

浙江大学突破视频AI瓶颈:让计算机用"金字塔眼光"看视频,速度提升10倍不掉质量

浙江大学研究团队提出金字塔稀疏注意力技术,通过模仿人类视觉的自适应处理机制,为不同重要性的视频信息分配不同精度的计算资源。该方法在保持视频质量的同时将计算量降低至35%,在视频生成任务中即使在91%稀疏度下仍保持优异性能,为解决视频AI的计算瓶颈提供了突破性方案。

KAIST团队破解大模型"组队"难题:什么时候"合作"最有效?

KAIST团队破解大模型"组队"难题:什么时候"合作"最有效?

KAIST研究团队提出SAFE框架,解决大语言模型合作中的关键问题。通过主厨+助手分工模式,SAFE只在必要时触发模型合作,避免传统方法的"事事商量"低效模式。该方法基于语言兼容性和意见一致性两大判断标准,在数学推理等复杂任务中平均提升5.72%性能,运行速度接近单模型,为AI系统协作提供了高效实用的解决方案。

北京大学团队突破AI图像编辑瓶颈:让机器像人类一样理解编辑指令

北京大学团队突破AI图像编辑瓶颈:让机器像人类一样理解编辑指令

北京大学团队开发了革命性的AI图像编辑训练框架Edit-R1,通过让多模态大语言模型充当"导师"实时指导AI学习,突破了传统训练方法的局限。该框架在权威测试中全面超越现有技术,让AI能像人类一样理解编辑指令。这项技术将大大降低图像编辑门槛,让普通用户仅通过自然语言就能实现专业级编辑效果,有望彻底改变图像编辑行业的未来发展。

浙江大学提出XKG:让AI自动复现科研论文的神奇知识图谱

浙江大学提出XKG:让AI自动复现科研论文的神奇知识图谱

浙江大学研究团队开发了XKG(可执行知识图谱),这是一个革命性的AI系统,能够自动复现科研论文中的实验结果。XKG通过将技术概念与可执行代码直接关联,解决了传统AI系统只能生成粗糙代码框架的问题。在PaperBench测试中,XKG使AI智能体性能提升超过10%,特别是在处理基于现有技术改进的分析性论文时效果显著。该系统采用完全自动化的构建流程,为大规模科研知识管理提供了新思路。

中科院团队突破AI诚信对齐新难题:仅需千分之一标注数据,让大模型学会"知之为知之"

中科院团队突破AI诚信对齐新难题:仅需千分之一标注数据,让大模型学会"知之为知之"

中科院团队提出EliCal框架,通过两阶段训练解决大语言模型诚信对齐难题。该方法仅需0.18%的标注数据就能达到传统方法98%的性能,并在未见任务上表现优异。研究还构建了包含63万样本的HonestyBench基准数据集,为AI诚信评估提供标准平台,推动可信AI发展。