人工智能 关键字列表
人工智能的"推理剧场":揭秘AI为何擅长伪装思考——来自斯坦福大学的深度研究

人工智能的"推理剧场":揭秘AI为何擅长伪装思考——来自斯坦福大学的深度研究

斯坦福大学研究员揭示AI存在"推理剧场"现象:虽能生成看似合理的思维链条,但实际上是表演思考而非真正推理。研究通过巧妙实验发现,即使逻辑被完全颠倒,AI仍得出相同结论。在科学推理任务中违规率高达96%,而数学任务仅20%。这一发现对医疗、法律、教育等依赖AI决策的领域具有重要警示意义。

复旦大学OpenNovelty:让AI成为学术论文同行评议的"火眼金睛"

复旦大学OpenNovelty:让AI成为学术论文同行评议的"火眼金睛"

复旦大学研究团队开发的OpenNovelty是一个基于大语言模型的智能系统,专门用于学术论文新颖性评估。该系统通过四个阶段的分析流程,能够自动提取论文贡献、检索相关文献、构建研究分类体系并进行证据验证,为每个新颖性判断提供可追溯的证据支持。已应用于500余篇顶级会议投稿论文分析。

剑桥大学最新突破:让AI既聪明又富有创造力的秘诀

剑桥大学最新突破:让AI既聪明又富有创造力的秘诀

剑桥大学研究团队提出分布式创造性推理框架,首次解决大型语言模型训练中正确性与创造力的矛盾。研究发现传统训练方法会导致AI思维单一化,并提出包含多样性能量函数的DCR方法,通过创造力核函数实现既正确又富有创造性的AI系统,为未来AI发展提供重要理论指导。

伯克利团队破解AI评测难题:让机器学会自动出题的神奇方法

伯克利团队破解AI评测难题:让机器学会自动出题的神奇方法

加州大学伯克利分校研究团队开发了InfoSynth系统,这是一个能够自动生成高质量编程题目的AI工具。该系统使用KL散度和熵来测量题目新颖性和多样性,采用基因算法模仿生物进化过程,通过变异和杂交机制从现有题目生成新题目。系统具备完整的自我验证功能,题目准确率达97%,在效率和质量上都显著超越传统方法,为AI能力评估提供了可持续的解决方案。

腾讯优图推出Youtu-Agent:让AI代理从"手工制作"变成"自动生产"的划时代框架

腾讯优图推出Youtu-Agent:让AI代理从"手工制作"变成"自动生产"的划时代框架

腾讯优图实验室推出Youtu-Agent框架,通过模块化设计和双模式自动生成机制,将AI代理开发从手工制作转向智能生产。框架包含无梯度的代理实践模块和大规模强化学习训练能力,在WebWalkerQA和GAIA基准测试中分别达到71.47%和72.8%的成功率,工具自动合成成功率超过81%。

SenseTime团队打造全能AI助手:会搜索、会识图、还能自主思考的"超级大脑"诞生

SenseTime团队打造全能AI助手:会搜索、会识图、还能自主思考的"超级大脑"诞生

SenseTime研究院联合清华大学和中科大开发了多模态智能助手SenseNova-MARS,能同时使用图像搜索、文本搜索和图像裁剪三种工具进行复杂视觉推理。通过创新的两阶段强化学习训练和新算法BN-GSPO,该系统在多项基准测试中超越了GPT-5等知名模型。研究团队还构建了HR-MMSearch高难度测试平台,验证了AI在需要多工具协作的复杂任务中的卓越表现。

Sakana AI推出"智能记忆体":让AI像人脑一样记住长时间对话的内容

Sakana AI推出"智能记忆体":让AI像人脑一样记住长时间对话的内容

Sakana AI开发的快速权重产品键值记忆技术,通过将静态记忆系统升级为动态学习系统,让AI能够像人脑一样在对话过程中实时记录和回忆重要信息。该技术成功解决了AI记忆系统在存储容量与计算效率之间的根本矛盾,在超长文本处理中展现出色表现,为未来个性化AI助手的发展奠定重要基础。

斯坦福大学发现:AI模型"幻觉"的真相竟藏在推理长度里?

斯坦福大学发现:AI模型"幻觉"的真相竟藏在推理长度里?

斯坦福大学研究团队发现AI模型推理链长度与"幻觉"现象存在U型关系:过短推理会跳过关键步骤,过长推理容易迷失方向,只有适中长度能实现最佳准确性。研究通过大量实验揭示了AI思考过程的内在机制,为优化AI可靠性和改善人机交互提供重要指导。

OpenAI收购高管教练AI工具Convogo团队

OpenAI收购高管教练AI工具Convogo团队

OpenAI宣布收购商业软件平台Convogo的团队,该平台帮助高管教练、顾问和人力资源团队自动化领导力评估和反馈报告。OpenAI仅收购团队而非技术,三位联合创始人将加入OpenAI从事AI云服务工作。Convogo产品将停止运营。这是OpenAI一年内的第九次收购,主要目的是获取人才和能力。

抛弃传统的市场推广手册,迎接AI时代的新策略

抛弃传统的市场推广手册,迎接AI时代的新策略

在Build Mode节目中,GTMfund合伙人Paul Irving分享了AI时代初创企业市场推广的实用建议。他强调当技术优势变得短暂时,分销渠道成为最后的护城河,每家公司都需要针对特定客户群体制定独特的市场策略。Irving建议专注于一到两个推广渠道,利用AI实现精准客户触达,并通过建立真实关系网络获得成功。

谷歌将Gemini AI功能推送至Gmail,用户可选择关闭

谷歌正式将Gmail带入"Gemini时代",默认启用多项AI功能。此前仅限付费用户的AI概览、智能写作助手和建议回复功能现已向所有用户开放。新功能包括邮件对话摘要、自然语言搜索、AI写作辅助和智能回复等。谷歌声称在隔离环境中处理数据,不会用个人邮件内容训练基础模型。用户可通过设置中的"智能功能"选项完全关闭这些AI特性。

AI竞赛点燃欧洲数据中心债券市场热潮

AI竞赛点燃欧洲数据中心债券市场热潮

欧洲多家发行商计划在2026年发行总额30-50亿欧元的数据中心资产支持证券,以追赶美国在AI产业竞赛中的步伐。包括KKR支持的CyrusOne、Blue Owl旗下Stack Infrastructure和EQT支持的EdgeConneX在内的至少五家发行商正考虑相关交易。这标志着欧洲数据中心证券化市场的重大进展,此前该市场仅有两笔公开发行的交易。

AI聊天机器人让人上瘾的隐秘手段揭秘

AI聊天机器人让人上瘾的隐秘手段揭秘

社交媒体公司将人类注意力转化为数十亿美元产业的策略,正在指导AI聊天机器人的发展。ChatGPT、Gemini等聊天机器人通过多种心理技巧让用户持续互动,包括过度迎合用户、使用"我"等人称代词增强人性化感受、运用幽默和记忆功能等。研究显示,当用户试图结束对话时,某些AI伴侣会通过情感操控延长对话时间达14倍。这些策略虽能提升用户参与度,但也引发了心理健康和伦理担忧。

AI将在2026年重塑网络安全策略

AI将在2026年重塑网络安全策略

无论是否愿意承认,AI正在彻底改变网络安全格局。2025年AI驱动的代码生成加速了开发进程,但也引入了逻辑漏洞,AI辅助的攻击变得更加定制化和规模化。2026年,网络安全行业对AI的采用将更加成熟,减少炒作驱动的现象。安全专业人员的角色将从检测转向判断和学习能力培养,未来最有价值的网络安全从业者将是那些能够在现实条件下对AI行为进行压力测试的人员。

CES主题演讲分析:智能体AI如何为现实世界影响奠定基础

CES主题演讲分析:智能体AI如何为现实世界影响奠定基础

人工智能对话正从系统能力转向自主行为能力。代理AI正推动决策、协调和执行深入现代技术结构,期望不仅在规模和性能上,更在切实的现实影响力上有所突破。英伟达CEO黄仁勋将代理AI定位为未来应用的接口层,嵌入各平台和基础设施中。专家指出,AI将成为所有应用的接口,如同今天的互联网。然而,代理AI作为隐形基础设施,其价值难以直观展现,行业与消费者之间存在认知鸿沟。

美国增长最快的五大AI职位出炉:LinkedIn数据揭示就业新风口

美国增长最快的五大AI职位出炉:LinkedIn数据揭示就业新风口

LinkedIn最新报告显示,AI工程师位居美国增长最快职位榜首,需掌握LangChain、RAG和PyTorch技能。AI顾问战略师排名第二,需8.2年经验。数据标注员、AI/ML研究员和数据中心技术员也进入前列。这些职位主要集中在旧金山、纽约和达拉斯等城市,26-30%支持远程工作。报告基于2023年至2025年数百万职位发布数据,反映了技术和战略AI角色的持续增长势头。

英伟达授权Groq推理芯片技术并聘用其领导团队

英伟达授权Groq推理芯片技术并聘用其领导团队

英伟达已获得推理芯片设计商Groq的非独家知识产权许可,并聘用了其多名高级管理人员,但未进行完全收购。此次交易价值可能高达200亿美元。Groq专门设计用于AI推理的低功耗、低价格芯片,采用静态RAM技术,与英伟达使用的高带宽内存不同。通过IP许可方式,英伟达可实现内存采购多元化,同时避免承接Groq的云服务业务和反垄断审查。

2026年数据中心合规:变化趋势与应对策略

2026年数据中心合规:变化趋势与应对策略

2020年代数据中心法规虽未出现GDPR规模的重大变革,但通过网络安全、可持续性和AI治理等领域的渐进式累积变化重塑了合规环境。AI专项法规的兴起是个例外,为透明度和风险管理设定了全新期望。2025年合规环境呈现矛盾性:部分司法管辖区的许可和采购变得更容易,但运营合规、透明和韧性设施却变得更加困难。本文总结当前要点和未来趋势,助力数据中心领导者履行当前义务并应对未来变革。

CES 2026前瞻:物理AI与机器人技术引领科技盛宴

CES 2026前瞻:物理AI与机器人技术引领科技盛宴

CES 2026消费电子展正在火热进行中,本届展会上物理AI和机器人技术成为绝对焦点。现场展示了众多令人瞩目的最新科技产品,包括各种智能机器人、AI驱动的硬件设备以及前沿的人工智能应用。展会汇集了业界最优秀、最奇特和最有趣的技术创新,为观众带来了一场科技盛宴。

CES 2026最奇葩科技产品盘点:AI陪伴机器人成焦点

CES 2026最奇葩科技产品盘点:AI陪伴机器人成焦点

CES 2026展会上出现了众多令人惊奇的科技产品。雷蛇推出全息动漫助手Project AVA,可监控用户并提供游戏和生活建议。AI熊猫机器人安安专为老年人设计,提供情感陪伴和健康监护。GoveeLife发布499美元的AI降噪制冰机,采用专利技术减少噪音。西雅图超声波公司推出399美元的超声波厨刀,每秒振动3万次轻松切割食物。还有骨传导音乐棒棒糖、WALL-E风格家庭巡逻机器人,以及蛋形激素检测设备等创新产品亮相。