最新文章
Luma AI推出终端速度匹配:一步生成高质量图像的革命性突破

Luma AI推出终端速度匹配:一步生成高质量图像的革命性突破

Luma AI推出的终端速度匹配(TVM)是一种革命性的图像生成技术,能够在单次计算中生成高质量图像,突破了传统方法需要数十步采样的限制。该技术通过关注生成路径的"终点"而非"起点",实现了从噪声到图像的直接跳跃,在保证数学理论基础的同时大幅提升了生成效率,为实时AI应用开辟了新路径。

NVIDIA推出轻量级文档解析神器:885M参数的OCR模型如何做到既快又准?

NVIDIA推出轻量级文档解析神器:885M参数的OCR模型如何做到既快又准?

NVIDIA发布Nemotron-Parse 1.1轻量级文档解析模型,仅用8.85亿参数就实现了端到端的OCR、格式化文本提取、表格解析和语义分类功能。该模型采用创新的无位置编码设计和多令牌推理技术,在多个基准测试中表现出色,处理速度达到每秒4-5页。研究团队还开源了模型权重和训练管道,为文档数字化和AI应用提供了高效实用的解决方案。

布朗大学新研究:AI模型训练"简单题目"却在"困难题目"上表现不佳,跨难度学习能力令人意外

布朗大学新研究:AI模型训练"简单题目"却在"困难题目"上表现不佳,跨难度学习能力令人意外

布朗大学研究团队通过对数千个AI模型的系统测试发现,当前大语言模型存在显著的跨难度泛化局限性——在简单任务上训练的模型难以处理复杂任务,反之亦然。研究采用项目反应理论客观评估任务难度,发现模型表现高度依赖训练数据的难度级别,难度差距越大泛化效果越差。这一发现挑战了AI能力评估方法,提醒开发者需要平衡各难度级别的训练数据。

北大团队开发Monet-7B:AI终于学会"脑海中想象"来解决复杂视觉问题

北大团队开发Monet-7B:AI终于学会"脑海中想象"来解决复杂视觉问题

北京大学联合Kling团队和MIT开发的Monet-7B多模态大语言模型,首次实现AI在"脑海"中进行抽象视觉推理。该模型通过潜在视觉推理机制,能像人类一样在内部视觉空间生成连续表征来解决复杂问题,无需依赖外部工具。研究团队设计了三阶段训练框架和专门的VLPO强化学习算法,在多项基准测试中显著超越现有方法,为AI发展提供了新的技术路径。

普林斯顿大学突破性发现:AI智能体也能"心灵相通",无需文字对话就能完美协作

普林斯顿大学突破性发现:AI智能体也能"心灵相通",无需文字对话就能完美协作

普林斯顿大学等机构联合研发的LatentMAS系统,让AI智能体首次实现了类似"心灵感应"的协作方式。该系统摒弃传统文字交流,直接在潜在思维层面进行信息共享,效率比传统方法提升4倍以上,准确性提高14.6%,同时大幅减少计算资源消耗,为构建高效AI协作生态提供了革命性解决方案。

OpenAI 科学家:为什么大语言模型会产生幻觉?
2025-11-27

OpenAI 科学家:为什么大语言模型会产生幻觉?

为什么语言模型会"幻觉"(hallucinate)?

2025-11-27

从太空到地面:Qorvo波束成形芯片助力卫星通信发展

近年来,从低空飞行器到轨道卫星,人类对空域的利用正不断向更高维度延伸。尤其是低地球轨道(LEO)卫星技术的快速发展,使得“从地面到太空”的全域通信成为产业竞争的焦点。

2025-11-27

豆包语音对话功能更新,能讲4种地道方言,具备思考能力

近日,豆包语音对话功能迎来更新,可以说4种地道方言,包括粤语、四川话、东北话及陕西话。用户打开豆包App对话框,发送简单的文字或语音指令,要求豆包使用上述方言对话,通过默认的“温柔桃子”升级版音色,即可开启对话体验。

联想刘军获评“年度科技领军人物” 前瞻布局和实践打造AI落地范本
2025-11-27

联想刘军获评“年度科技领军人物” 前瞻布局和实践打造AI落地范本

联想集团执行副总裁兼中国区总裁刘军入选2025年度科技领军人物榜!

贝索斯"普罗米修斯项目"收购AI智能体初创公司

贝索斯"普罗米修斯项目"收购AI智能体初创公司

由贝索斯共同领导的普罗米修斯项目已收购AI初创公司General Agents。该公司开发了名为Ace的AI智能体,可自主执行视频编辑、数据复制等计算机任务。General Agents基于视频语言行为架构开发模型,这与普罗米修斯项目专注制造业AI系统的目标高度契合。收购完成后,普罗米修斯团队已超过100人,预计将推进工业机器人领域的AI应用发展。

全新Mac浏览器Orion发布:主打速度与隐私保护

全新Mac浏览器Orion发布:主打速度与隐私保护

Kagi公司发布Orion浏览器1.0版本,这是一款专为苹果平台设计的全新浏览器。该浏览器主打极速浏览体验和用户隐私保护,完全免费使用并附赠200次Kagi搜索。Orion还提供月费5美元的付费订阅服务,解锁更多高级功能。未来计划包括更深度的自定义选项和性能优化。

Opera AI浏览器推出1分钟深度研究模式和Gemini 3 Pro集成

Opera AI浏览器推出1分钟深度研究模式和Gemini 3 Pro集成

Opera AI浏览器Opera Neon近日发布重要更新,新增"一分钟深度研究"模式,让用户能够快速获取深入的研究结果。此次更新还引入了模型选择器功能,支持谷歌Gemini 3 Pro和Nano Banana Pro模型,用户可在对话中途切换模型。此外,Neon的"Do"智能助手现已支持Google Docs集成,这是用户最期待的功能之一。Opera Neon需要每月19.99美元的订阅费用。

马斯克xAI计划在Colossus数据中心旁建设小型太阳能发电场

马斯克xAI计划在Colossus数据中心旁建设小型太阳能发电场

马斯克创立的人工智能公司xAI计划在其Memphis的Colossus数据中心旁建设一个占地88英亩的太阳能发电场。该发电场预计产能约30兆瓦,仅能满足数据中心约10%的电力需求。此前,xAI因无许可证运营超400兆瓦天然气涡轮机而受到批评,这些设备每年排放超2000吨氮氧化物污染。当地居民报告呼吸道疾病增加。

微软联手思科那发布零信任光网络架构框架

微软联手思科那发布零信任光网络架构框架

微软与Ciena合作定义了零信任分层光网络架构蓝图。该架构结合两个完全独立的光学系统,包括基于ROADM的传输网络和光学业务连续性灾难恢复层,仅在路由以太网边缘连接。架构具备人为错误隔离、维护灵活性、零停机时间和带宽灵活性四大优势,支持10G/100G/400G服务,能在系统性故障期间维持不间断服务,为关键业务流量提供卓越的网络弹性。

国内唯一,阿里千问斩获NeurIPS 2025最佳论文奖

阿里千问斩获NeurIPS 2025最佳论文奖,成功揭秘模型性能提升原理。

2025-11-27

管理嵌入式软件的开发

近年来,关于软件定义汽车(Software-defined Vehicles)的讨论非常多。但事实上,其他电子产品也早已越来越多地依赖软件。这对制造商而言意味着:他们必须掌控全新的开发流程,以确保透明度、可追溯性与合规性。

斯科尔科技学院团队破解AI"说谎"难题:让机器自己识破自己的虚假回答

斯科尔科技学院团队破解AI"说谎"难题:让机器自己识破自己的虚假回答

斯科尔科技学院联合俄罗斯多家研究机构开发出革命性的多语言AI虚假信息检测技术。该研究构建了覆盖14种语言的大型数据集PsiloQA,通过"诱导AI说谎"的创新方法自动生成训练样本,成本仅为传统人工标注的数十分之一。实验证明多语言训练的检测模型性能显著优于单语言模型,为全球AI可信度监督提供了实用解决方案。

NVIDIA团队惊人发现:最简单的机器人训练方法竟然最有效

NVIDIA团队惊人发现:最简单的机器人训练方法竟然最有效

NVIDIA研究团队发现,训练机器人最有效的方法竟然是最简单的:直接用普通文字告诉机器人该做什么,而不需要复杂的编码系统。他们开发的VLA-0系统在标准测试中超越了所有复杂方法,平均成功率达94.7%,在真实机器人测试中也比预训练系统高出12.5个百分点。这项发现挑战了"越复杂越好"的传统观念,可能加速智能家用机器人的普及。

UCLA团队新突破:AI"虚拟世界"让机器人变身"万能助手",训练效率提升66%

UCLA团队新突破:AI"虚拟世界"让机器人变身"万能助手",训练效率提升66%

UCLA研究团队提出UI-Simulator系统,通过AI生成虚拟用户界面环境来训练数字助手,突破了传统方法需要大量人工数据收集的瓶颈。该系统结合LLM数字世界模拟器、引导式探索和智能训练策略,在WebArena和AndroidWorld测试中表现优异,UI-Simulator-Grow策略仅用66%训练数据就达到了传统方法的效果,为AI助手训练提供了高效低成本的解决方案。

Dell PowerScale for Microsoft Azure构筑本地与云端的无缝存储体验
2025-11-27

Dell PowerScale for Microsoft Azure构筑本地与云端的无缝存储体验

在高速发展的数字化环境中,企业所需的已不止是单纯的存储能力,更需要一个能够推动创新、灵活扩展,并可胜任严苛工作负载的存储平台。