人工智能 关键字列表
Reddit凭借人类原创内容在AI时代获得新机遇

Reddit凭借人类原创内容在AI时代获得新机遇

Reddit凭借人工创作内容在AI时代获得丰厚回报。公司第二季度收入达5亿美元,同比增长78%,净利润8900万美元。CEO胡夫曼表示,Reddit为当前时代而生,人类对话和知识价值凸显。公司数据授权业务收入3500万美元,与OpenAI和谷歌建立合作伙伴关系。Reddit将搜索视为机遇,本地搜索产品拥有7000万周活用户,Reddit Answers用户从100万增至600万。

雀巢如何用数字孪生和AI重塑创意营销未来

雀巢如何用数字孪生和AI重塑创意营销未来

在快节奏的零售环境中,消费者偏好瞬息万变,品牌需要脱颖而出。英伟达和微软正帮助雀巢等企业利用AI和3D数字孪生技术变革创意工作流程,推动营销创新。基于微软Azure平台上的英伟达Omniverse库,雀巢已建立4000个3D数字产品库,计划两年内将10000个产品转换为数字孪生。该技术能够实现高质量内容规模化创建、预测分析、产品配置和沉浸式客户体验,帮助企业降低成本、提升营销效率。

Cohere发布企业级视觉模型Command A Vision

Cohere发布企业级视觉模型Command A Vision

加拿大AI公司Cohere发布了Command A Vision视觉模型,专门针对企业应用场景。该模型拥有1120亿参数,仅需两个GPU即可运行,能够处理图表、图形、扫描文档和PDF等企业常见视觉数据。在九项基准测试中,Command A Vision平均得分83.1%,超越了GPT-4.1、Llama 4等竞争对手。该模型采用开放权重系统,支持23种语言,旨在为企业提供成本优化的多模态AI解决方案。

Deep Cogito发布四款开源混合推理大语言模型,具备自我改进"直觉"能力

Deep Cogito发布四款开源混合推理大语言模型,具备自我改进"直觉"能力

旧金山AI研究初创公司Deep Cogito发布四款新的大语言模型,参数规模从700亿到6710亿不等。这些模型采用混合推理系统设计,能够学习更有效的推理方式并自我改进。通过迭代蒸馏放大技术,模型将推理过程内化到训练中,发展出"机器直觉",使用比同类模型短60%的推理链条就能达到相似性能。模型在数学、法律推理和多跳问题等任务中表现出色,训练成本仅350万美元。

AI"看"视频推理有了新突破:中大团队让机器像人一样理解视频中的时间关系

AI"看"视频推理有了新突破:中大团队让机器像人一样理解视频中的时间关系

香港中文大学团队首次将DeepSeek-R1推理范式应用到视频理解,开发出Video-R1系统。该系统通过创新的T-GRPO训练方法,让AI学会利用视频时序信息进行深度推理,而非简单识别画面。在多项测试中表现优异,甚至在空间推理任务上超越GPT-4o,为AI视频理解开辟新道路。

计算机也能看图说话了?上海AI实验室发布视觉推理新突破

计算机也能看图说话了?上海AI实验室发布视觉推理新突破

上海AI实验室发布视觉强化微调技术,让计算机学会"边看边思考"。该方法通过强化学习训练视觉模型先进行推理再给出答案,在少样本学习中表现优异,单样本图像分类准确率提升24.3%,物体检测精度提升超20分,在开放词汇检测等任务上也实现显著突破。

北大与腾讯联手破解AI智能体难题:让机器像人类团队一样协作思考

北大与腾讯联手破解AI智能体难题:让机器像人类团队一样协作思考

这项由北京大学主导、联合多家国际顶尖机构完成的研究,首次系统性地梳理了大语言模型智能体领域的完整技术图谱。研究提出了"构建-协作-进化"的统一框架,深入分析了智能体的技术架构、应用场景和发展挑战,为理解这一前沿技术提供了重要指南,对推动AI智能体技术的健康发展具有重要意义。

AIRI研究院:让AI看图更高效,一半图像特征就够用了

AIRI研究院:让AI看图更高效,一半图像特征就够用了

这项由莫斯科人工智能研究院完成的研究证明了AI可以通过智能特征选择在保持性能的同时大幅提高效率。研究团队开发了基于自编码器和Gumbel-Softmax的特征筛选方法,在文字识别任务中即使删除50%视觉特征也能维持近似性能,为多模态AI系统的效率优化提供了新思路。

AI语言生成迎来重大突破:康奈尔团队推出"块扩散"模型,让机器既能快速写作又能精确表达

AI语言生成迎来重大突破:康奈尔团队推出"块扩散"模型,让机器既能快速写作又能精确表达

康奈尔科技学院研究团队开发出突破性的"块扩散"AI语言模型,巧妙结合自回归和扩散模型优势,实现了既快速又准确的文本生成。该技术支持任意长度文本创作,生成速度显著提升,在标准测试中创下扩散模型新纪录,为AI写作助手和对话系统开辟了新的发展路径。

阿联酋顶尖AI大学打造"万能语音助手":30M参数让任何大模型瞬间开口说话

阿联酋顶尖AI大学打造"万能语音助手":30M参数让任何大模型瞬间开口说话

阿联酋穆罕默德·本·扎耶德人工智能大学研究团队开发出轻量级语音合成系统LLMVoX,仅用3000万参数就能让任何大语言模型获得流式语音输出能力。该系统实现475毫秒超低延迟,词错误率仅3.7%,支持多语言扩展,可与视觉语言模型集成,为AI语音交互提供了"即插即用"的革命性解决方案。

Google DeepMind发布高精度地球AI模型AlphaEarth

Google DeepMind发布高精度地球AI模型AlphaEarth

谷歌DeepMind发布AlphaEarth Foundations AI模型,能处理每日数TB卫星数据追踪地表变化。该模型如"虚拟卫星"般将全球陆地和沿海水域映射为数字表示,帮助科学家监测食品安全、森林砍伐、城市扩张等关键问题。模型整合光学卫星图像、雷达、激光测绘等数据源,以10×10米精度追踪变化,错误率比其他模型低24%。

这11种情况下千万别用ChatGPT

这11种情况下千万别用ChatGPT

ChatGPT虽然是目前最受欢迎的AI聊天机器人,但它并非万能。文章指出11个不应该使用ChatGPT的场景:诊断健康问题、处理心理健康、紧急安全决策、个人财务税务规划、处理机密数据、违法行为、学术作弊、监控实时信息、赌博预测、起草法律文件以及创作艺术。AI可能产生错误信息、缺乏实时数据更新,在高风险场景下可能造成严重后果。用户应了解其局限性,在关键决策时寻求专业帮助。

ServiceNow瞄准"数据地狱",布局商业智能领域

ServiceNow瞄准"数据地狱",布局商业智能领域

ServiceNow正构建数据基础架构支持AI智能体应用,解决企业AI部署的最大障碍"数据地狱"。公司推出三大核心组件:AI原生数据库RaptorDB、工作流数据结构Workflow Data Fabric,以及收购的数据目录平台Data.world。该公司还推出AI控制塔提供统一管理,并计划扩展商业智能分析领域,挑战传统BI厂商。

清华大学团队打造超级机器人管家:一个会自己"思考"的全能型人形机器人诞生了!

清华大学团队打造超级机器人管家:一个会自己"思考"的全能型人形机器人诞生了!

清华大学团队开发出革命性人形机器人系统Being-0,具备类人思维能力。该系统采用创新的"三层大脑"架构:顶层基础模型负责理解指令和制定策略,中间层连接器模块负责将计划转化为具体动作,底层技能库负责执行各种操作。机器人能够理解自然语言,自主规划复杂任务如制作咖啡,并在动态环境中灵活调整策略,在长期任务中达到84.4%的成功率。

Azure AI Speech升级:仅需几秒音频即可生成逼真语音克隆

Azure AI Speech升级:仅需几秒音频即可生成逼真语音克隆

微软升级了Azure AI Speech服务,用户仅需几秒钟的语音样本即可快速生成逼真的语音复制品。该个人语音功能于2024年5月21日正式发布,采用名为"DragonV2.1Neural"的零样本文本转语音模型,支持100多种语言。微软表示新版本在语音自然度、韵律稳定性和发音准确性方面都有显著提升,可用于定制聊天机器人语音、视频配音等应用。尽管微软要求用户遵守使用政策并获得原说话者同意,但该技术仍可能被恶意使用。

GUI界面上的智能助手:vivo和香港中文大学让机器人学会像人类一样操作手机

GUI界面上的智能助手:vivo和香港中文大学让机器人学会像人类一样操作手机

vivo和香港中文大学的研究团队开发了UI-R1系统,首次将强化学习技术应用到图形界面操作中。该系统仅用136个训练样本就能让AI学会操作手机、电脑界面,在跨平台测试中表现优异,为智能设备交互开辟了高效的新路径。

新加坡国立大学推出IPV-BENCH:首个专门评估AI视频模型处理"不可能场景"的基准测试

新加坡国立大学推出IPV-BENCH:首个专门评估AI视频模型处理"不可能场景"的基准测试

新加坡国立大学研究团队开发了IPV-BENCH,首个专门评估AI视频模型处理"不可能场景"能力的基准测试平台。研究发现,当前最先进的AI视频模型在生成和理解违反物理定律、生物规律等不可能场景时表现不佳,最好的生成模型成功率仅37.3%,理解模型在时间推理方面尤其困难,揭示了AI技术在创造力和复杂推理方面的重大局限性。

香港科大提出PreSelect:用AI预测能力来筛选高质量训练数据,10倍提升语言模型训练效率

香港科大提出PreSelect:用AI预测能力来筛选高质量训练数据,10倍提升语言模型训练效率

香港科技大学研究团队提出PreSelect方法,通过分析文本对不同AI模型能力的预测能力来筛选高质量训练数据。该方法基于"能够准确反映模型能力差异的文本往往也是最佳训练材料"的核心洞察,仅用轻量级fastText分类器就能实现大规模数据筛选,在多项实验中展现出10倍训练效率提升,为AI模型开发提供了经济高效的解决方案。

人工智能真的知道答案,却选择保持沉默?Google与Technion揭示大模型的"隐性知识"现象

人工智能真的知道答案,却选择保持沉默?Google与Technion揭示大模型的"隐性知识"现象

Google Research与以色列理工学院联合研究发现,大型语言模型存在显著的"隐性知识"现象——AI内部掌握的知识远超其外部表现,平均差距达40%。研究团队通过测试三个主流AI模型的1700个事实性问题,发现AI在内部完全知道答案但1000次尝试都不会说出的极端情况。这一发现揭示了AI语言生成机制的根本局限,为改进AI表现和理解智能系统认知机制提供了新视角。

西安交通大学团队提出MAPS:基于性格理论的多智能体系统,让AI像人类专家团队一样协作解决科学难题

西安交通大学团队提出MAPS:基于性格理论的多智能体系统,让AI像人类专家团队一样协作解决科学难题

西安交通大学团队提出MAPS多智能体系统,基于心理学大七人格理论设计7个专门化AI智能体协作解决多模态科学问题。系统采用苏格拉底式质疑方法进行自我监督,在数学、物理、化学问题求解上比现有最佳AI提升15.84%,甚至超越人类专家3.58%,为AI协作系统设计提供了新思路。