最新文章
东京大学突破性研究:用AI生成日语多模态理解测试,揭示开源模型惊人缺陷

东京大学突破性研究:用AI生成日语多模态理解测试,揭示开源模型惊人缺陷

东京大学研究团队开发了JMMMU-Pro基准和Vibe基准构建法,用于评估AI模型的日语图文整合理解能力。实验发现开源模型表现不佳(最高47%),远低于商业闭源模型(80-90%),主要原因是OCR能力不足和视觉文本整合理解缺陷。该研究为日语AI发展提供了重要评估工具。

当AI学会看电影:复旦大学团队如何教会机器理解"动作"语言

当AI学会看电影:复旦大学团队如何教会机器理解"动作"语言

复旦大学团队构建了专门针对动作表达的大规模视频分割数据集MeViS,包含2006个视频、8171个物体和33072个动作描述表达式。该数据集强调通过动作而非静态特征识别目标物体,并开发了LMPM++方法引入大型语言模型进行时序推理。研究揭示了传统AI模型在动作理解方面的局限性,为视频理解、智能监控、体育分析等应用提供了重要技术基础。

香港大学团队突破:让AI拍出60秒连贯视频不再是梦想 - MemFlow技术革新长视频生成

香港大学团队突破:让AI拍出60秒连贯视频不再是梦想 - MemFlow技术革新长视频生成

这项由香港大学、快手科技和香港科技大学联合完成的研究,成功为AI视频生成配备了智能"记忆银行"。MemFlow技术通过动态检索相关历史片段,让AI在生成长达60秒的视频时能保持角色和场景的连贯性。该技术在保证高质量的同时,仅增加7.9%的计算开销,在单GPU上可达到18.7帧每秒的实时生成速度,为影视制作、教育培训等领域带来广阔应用前景。

当AI成为你的编程助手:一场关于人机协作编程的深度思考

当AI成为你的编程助手:一场关于人机协作编程的深度思考

本论文由中国科学院计算技术研究所等多家机构的研究人员共同完成,首次系统地分析了"氛围编程"这一新兴的AI辅助软件开发范式。研究通过分析1000多篇论文,建立了理论框架,总结了五种开发模式,并指出了成功的人机协作编程不仅需要强大的AI能力,更需要系统的上下文工程、完善的开发环境和科学的协作模式。

武汉大学团队破解网络文学翻译难题:如何让AI真正理解文化内涵和人物感情

武汉大学团队破解网络文学翻译难题:如何让AI真正理解文化内涵和人物感情

武汉大学研究团队推出DITING框架,这是首个专为网络文学翻译设计的全面评估体系。该框架包含六个评估维度(成语翻译、词汇歧义、术语本地化、时态一致性、零代词翻译、文化安全),配备超18000个专家标注的中英文句子对。研究团队还开发了AgentEval,一个多代理评估框架,通过模拟专家讨论过程来评估翻译质量,相关性达0.669,超越所有现有自动评估指标。评估结果显示,DeepSeek-V3和GPT-4o等大语言模型已超越传统商业翻译系统,中文训练的模型优于大型外文模型。

浩云长盛的算力工具箱:让兼容与前瞻同行

浩云长盛的算力工具箱:让兼容与前瞻同行

数据中心正是站在这种未来前沿的关键角色,它必须提前布局,以迎接AI发展的各种可能。浩云长盛的策略是基于AI未来的三大特点,算力增长、算法优化、生态开放推导对基础设施的要求,即“急速迭代与持续升级”。

英特尔酷睿Ultra第三代,如何推动AI PC规模化落地?
2025-12-18

英特尔酷睿Ultra第三代,如何推动AI PC规模化落地?

2026年AI PC出货量将达到1.43亿台,市场份额将达到55%。

Google发布Gemini 3 Flash并将其设为默认模型

Google发布Gemini 3 Flash并将其设为默认模型

谷歌发布基于Gemini 3的快速低成本模型Flash,并将其设为Gemini应用和AI搜索的默认模型。新模型在多项基准测试中表现优异,在MMMU-Pro多模态推理测试中得分81.2%超越所有竞品。该模型已向全球用户开放,并通过Vertex AI和API向企业及开发者提供服务。定价为每百万输入token 0.5美元,输出token 3美元,速度比2.5 Pro快三倍且更节省token用量。

思科自研AI模型正式应用于产品,首先赋能身份安全服务

思科自研AI模型正式应用于产品,首先赋能身份安全服务

思科宣布其自主开发的AI模型已准备就绪,开始为公司产品提供支持。该模型名为"Foundation-Sec-1.1-8B-Instruct",是基于Meta Llama-3.1-8B架构的80亿参数指令调优模型,专门针对网络安全应用进行优化。首个应用场景是Duo身份智能服务,通过分析用户登录行为、地理位置和设备使用情况,识别传统访问控制容易遗漏的异常模式,并生成每周安全摘要报告,帮助管理员更好地进行安全决策。

超大规模云厂商在2025年是解决了电力问题还是重新思考了问题?

超大规模云厂商在2025年是解决了电力问题还是重新思考了问题?

2025年,GPU短缺、电网连接延迟及AI计算需求激增使电力成为云计算发展的限制因素。超大规模云厂商加速建设的同时重写了能源、网络和风险策略。预计到2030年,超大规模云厂商将控制全球60%的数据中心容量。AI工厂园区规模达吉瓦级,机架密度超200千瓦,电力供应成为首要瓶颈。云巨头通过大规模太阳能采购、次级市场建设和海底光缆投资来应对。电力可用性成为塑造所有决策的核心摩擦点。

英伟达成为唯一能免费提供AI模型的厂商

英伟达成为唯一能免费提供AI模型的厂商

英伟达凭借其利润丰厚的硬件业务,成为唯一能够免费提供AI模型的公司。在OpenAI、谷歌等竞争对手纷纷转向闭源模型之际,英伟达加大了对开源Nemotron模型的投入。最新发布的Nemotron 3采用混合Mamba-Transformer架构和专家混合模型,推出Nano、Super和Ultra三个版本,参数规模从30亿到500亿不等,在推理速度和准确性上均有显著提升,展现了英伟达从芯片到软件栈的全栈整合战略。

Retell AI推出自动化质检系统,解决语音智能体人工审核瓶颈

Retell AI推出自动化质检系统,解决语音智能体人工审核瓶颈

AI语音平台Retell AI发布质检解决方案Retell Assure,可监控通话、识别问题并减少人工抽检需求。该系统使用多模型分析每通电话的延迟、中断、幻觉和客户情绪等指标,自动标记故障并提供改进建议。目前企业仍依赖人工审核AI表现,难以应对大规模通话量。Retell认为多数AI故障源于配置不当而非模型限制,其质检系统可形成持续训练循环。加拿大电动汽车充电公司Switch Energy使用该平台后,月处理8000通电话的成本降低50%,响应时间从数分钟缩短至5秒。

法国生物科技公司发布全球首个生物学通用AI模型

法国生物科技公司发布全球首个生物学通用AI模型

法国AI初创公司Bioptomus推出新一代临床生物AI模型H-Optimus-1和全球首个通用多模态生物医学研究基础模型M-Optimus。H-Optimus-1在组织分析领域取得突破,可辅助疾病识别。M-Optimus整合全球最大专有数据集,涵盖数百万患者、50多种器官类型数据,能够创建数字孪生体预测疾病进展和治疗反应,加速药物设计并大幅降低临床试验成本和时间。该模型现已在AWS SageMaker平台开放使用。

JEDEC开发减少引脚数的HBM4标准以提升容量

JEDEC开发减少引脚数的HBM4标准以提升容量

JEDEC固态技术协会正在开发标准封装高带宽内存SPHBM4标准,通过减少引脚数量实现更高内存容量。SPHBM4采用512个引脚,仅为HBM4的四分之一,但通过4:1串行化和更高频率运行,可提供与HBM4相同的总吞吐量。更少的引脚允许更宽间距,支持成本更低的有机基板连接。这使得内存堆栈可以距离GPU更远,从而增加每个GPU的内存堆栈数量,提升整体容量。三星、美光和SK海力士等HBM供应商需支持该标准才能实现商用。

Ewigbyte光学归档存储技术及战略解析

Ewigbyte光学归档存储技术及战略解析

新兴企业Ewigbyte采用直接在未涂层玻璃上写入数据的光学存储技术,数据物理嵌入基板可保存数百至数千年。与Cerabyte不同,该公司不出售硬件设备,而是提供托管服务模式。其首代玻璃介质容量约10GB,读写速度目标为每头500MB/s,支持8个并行头。公司计划明年年中展示首个运营机架,2026年9月实现TB级写入演示。该技术无需能耗和冷却,适合冷数据长期存储。

2025年:可穿戴设备全面转向AI技术

2025年:可穿戴设备全面转向AI技术

2025年成为可穿戴技术的转折之年。过去十年,该领域主要聚焦健康健身,但今年科技公司纷纷将可穿戴设备定位为AI载体。智能眼镜被重新命名为"AI眼镜",Meta、谷歌等巨头强调AI交互才是核心卖点。市场还涌现出AI吊坠、AI别针等随身监听设备。三星、苹果、Garmin等品牌也在智能手表中加入AI功能。业界认为可穿戴设备是唯一能保证全天候贴身存在的计算设备,成为AI助手的理想载体。

Oracle领衔科技巨头5000亿美元AI数据中心租赁狂潮

Oracle领衔科技巨头5000亿美元AI数据中心租赁狂潮

甲骨文、微软、Meta等云计算巨头未来将投入5000亿美元租赁数据中心,反映行业对人工智能的巨额押注。甲骨文承诺最高达2480亿美元,其中仅去年11月单季就签约1500亿美元,主要用于支撑OpenAI模型训练部署。与亚马逊、微软相比,甲骨文云业务规模较小但单一客户风险集中。Meta承诺租赁支出达580亿美元,是一年前的三倍。这些租赁成本独立于资本支出统计,六家公司过去四季度资本开支达3720亿美元。

2025-12-17

新农人:西云数据如何绘制智慧农牧“全景图”

通过提供强大的云计算、大数据和人工智能技术,西云数据正致力于打造一幅 “智慧农牧全景图”,构建面向未来的“新质生产力”,助力农牧企业实现从“降本增效”到“全链智能”的根本性飞跃。

据说算力高达1000 TOPS,华硕Ascent GX10深度评测——开箱
2025-12-17

据说算力高达1000 TOPS,华硕Ascent GX10深度评测——开箱

当超级计算机被压缩进一个比书本还小的盒子里,这画面有多炸裂?想象一下,你桌面上摆着的不是什么花瓶摆件,而是一台能跑200B参数AI推理的"超算怪兽"——这就是我们今天要聊的主角:华硕Ascent GX10。

Adobe与UCLA联手突破AI模型速度瓶颈:让图像生成快一倍的"稀疏化魔法"

Adobe与UCLA联手突破AI模型速度瓶颈:让图像生成快一倍的"稀疏化魔法"

Adobe研究院与UCLA合作开发的Sparse-LaViDa技术通过创新的"稀疏表示"方法,成功将AI图像生成速度提升一倍。该技术巧妙地让AI只处理必要的图像区域,使用特殊"寄存器令牌"管理其余部分,在文本到图像生成、图像编辑和数学推理等任务中实现显著加速,同时完全保持了输出质量。