最新文章
ChatGPT如何改变了全球10%成年人的数字生活
2025-09-18

ChatGPT如何改变了全球10%成年人的数字生活

周有超过7亿用户在使用它,每天发送超过25亿条消息,相当于每秒钟有29000条消息在产生。

当AI照进现实:一场关于创作、爱、生命的思辨
2025-09-18

当AI照进现实:一场关于创作、爱、生命的思辨

在“PEC 2025 AI创新者大会暨第二届提示工程峰会”上,一场以“AIGC创作新范式——双脑智能时代:心智驱动的生产力变革”为主题的分论坛,成为现场最具张力的对话空间。

Linux Mint加速发布计划,LMDE 7与Wayland就绪的Cinnamon即将到来

Linux Mint加速发布计划,LMDE 7与Wayland就绪的Cinnamon即将到来

Linux Mint团队计划加快发布周期,在未来几个月推出两个新版本。LMDE 7代号"Gigi"基于Debian 13开发,将包含libAdapta库以支持Gtk4应用的主题功能。新版本将停止提供32位版本支持。同时Cinnamon桌面的Wayland支持持续改进,在菜单、状态小程序和键盘输入处理方面表现更佳,有望成为完整支持Wayland的重要桌面环境之一。

大语言模型在数独游戏中失利,解释能力更令人担忧

大语言模型在数独游戏中失利,解释能力更令人担忧

科罗拉多大学研究人员发现,大型语言模型在解决数独谜题时表现不佳,即使是简化的6x6数独也常常超出其能力范围。更重要的是,当要求AI展示解题过程时,它们往往无法准确解释,有时会撒谎、胡言乱语,甚至开始谈论天气。研究表明,AI虽然擅长写邮件或生成图像,但在需要逻辑推理的任务上存在明显缺陷,且无法透明地解释其决策过程,这对AI在日常生活中的应用提出了谨慎考量的要求。

员工卡在AI助手模式,急需企业战略升级

员工卡在AI助手模式,急需企业战略升级

员工广泛使用AI但仅限基础任务,因为CIO等管理者未提供必要培训和高级工具。调查显示所有美国员工都在工作中使用AI,近半数每天多次使用,但多数仍将AI当作"初级助理"而非真正合作伙伴。专家指出问题在于缺乏培训、工具功能有限以及AI未深度集成到业务流程中。CIO需要主导提供更多培训并推广AI在关键业务工作流中的应用。

CIO们承受着压力——但大多数人都乐在其中

CIO们承受着压力——但大多数人都乐在其中

最新调查显示,CIO们的压力指数平均达到6.8分(满分10分),23%的受访者压力达到8分。尽管面临网络安全威胁、数字化转型、人才短缺等多重挑战,大多数IT领导者表示他们在压力中茁壮成长。AI工具的快速普及为CIO们带来新的担忧,特别是员工未经IT部门管理就使用各种AI工具可能带来的数据安全风险。然而,CIO们普遍认为这份工作仍然值得,因为他们的角色已从后台运营转向战略合作伙伴。

Oracle推出13个新AI智能体增强HR自动化功能

Oracle推出13个新AI智能体增强HR自动化功能

Oracle宣布为其Fusion云端人力资本管理套件新增13个智能AI代理,使应用程序中的代理总数超过100个。新增功能涵盖内部流动、绩效管理、学习发展、薪资和人员配置流程。这些代理能够在现有工作流程中自主运行,自动化任务并提供实时洞察。包括职位发现代理、面试管理代理、团队目标助手等功能。Oracle还提供AI代理工作室供客户定制专属代理,且所有预构建代理均免费提供。

人格向量巧妙揭示ChatGPT等AI如何产生情绪化反应机制

人格向量巧妙揭示ChatGPT等AI如何产生情绪化反应机制

研究发现,大型语言模型通过内部的人格向量机制展现愤怒、嫉妒、吹嘘等情感特征。人格向量是由数学和计算元素组成的线性方向,在激活空间中控制AI的性格特质。研究者可以通过检测、控制和操纵这些向量来监管AI行为,特别是针对恶意行为、过度迎合和幻觉等问题。这一发现对理解AI情感模拟机制具有重要意义。

Littelfuse推出600 W SZSMF6L系列瞬态抑制二极管
2025-09-18

Littelfuse推出600 W SZSMF6L系列瞬态抑制二极管

紧凑型SOD-123FL瞬态抑制二极管的峰值功率比SZSMF4L系列高出50%,帮助工程师保护空间有限的电动汽车和汽车电子产品免受高压浪涌的影响。

人民大学团队重磅突破:让AI推理像侦探一样边查资料边思考,准确率飙升至专家水平

人民大学团队重磅突破:让AI推理像侦探一样边查资料边思考,准确率飙升至专家水平

人民大学团队开发了Search-o1框架,让AI在推理时能像侦探一样边查资料边思考。系统通过检测不确定性词汇自动触发搜索,并用知识精炼模块从海量资料中提取关键信息无缝融入推理过程。在博士级科学问题测试中,该系统整体准确率达63.6%,在物理和生物领域甚至超越人类专家水平,为AI推理能力带来突破性提升。

看Claude新算法如何巧妙解决AI训练中的"偏心"问题:Anthropic团队的REINFORCE++突破

看Claude新算法如何巧妙解决AI训练中的"偏心"问题:Anthropic团队的REINFORCE++突破

Anthropic研究团队开发的REINFORCE++算法通过采用全局优势标准化解决了AI训练中的"过度拟合"问题。该算法摒弃了传统PPO方法中昂贵的价值网络组件,用统一评价标准替代针对单个问题的局部基准,有效避免了"奖励破解"现象。实验显示,REINFORCE++在处理新问题时表现更稳定,特别是在长文本推理和工具集成场景中展现出优异的泛化能力,为开发更实用可靠的AI系统提供了新思路。

阿里巴巴Qwen团队重新定义数学推理:过程奖励模型的训练秘籍大公开

阿里巴巴Qwen团队重新定义数学推理:过程奖励模型的训练秘籍大公开

阿里巴巴Qwen团队通过深入研究发现传统蒙特卡洛估计方法在训练过程奖励模型时存在严重局限,提出了创新的共识过滤机制,结合两种评估方法相互验证来提升数据质量。研究团队开发出性能卓越的过程奖励模型,不仅在传统评估中表现优异,在错误识别任务中更是远超现有开源模型,为构建更可靠、更可解释的人工智能系统奠定了坚实基础,推动AI从结果导向向过程导向转变。

GANs训练难?布朗大学新研究彻底颠覆这一成见

GANs训练难?布朗大学新研究彻底颠覆这一成见

布朗大学和康奈尔大学研究团队推出R3GAN,通过数学理论证明解决了GAN训练不稳定的根本问题。该方法结合相对论式损失和双重梯度惩罚,无需复杂调优技巧即可实现稳定训练,性能超越StyleGAN2。研究证明GAN技术仍有巨大潜力,为生成模型领域带来新思路。

麻省理工学院新突破:让AI不再"健忘",打造永不停歇的智能伙伴

麻省理工学院新突破:让AI不再"健忘",打造永不停歇的智能伙伴

麻省理工学院研究团队开发出让AI拥有"永久记忆"的突破性技术,通过长期记忆增强生成系统解决了传统AI"健忘"问题。该技术能让AI记住用户偏好和历史对话,实现真正个性化交互。实验显示记忆准确率达85%,一致性94.2%,为AI从工具向智能伙伴转变奠定基础,有望在教育、客服、个人助理等领域产生深远影响。

阿里达摩院推出VideoLLaMA3:让AI同时"看懂"图像和视频的革命性突破

阿里达摩院推出VideoLLaMA3:让AI同时"看懂"图像和视频的革命性突破

阿里达摩院发布VideoLLaMA3,这是首个采用"以视觉为中心"设计的多模态AI模型,能够同时理解图像和视频内容。该模型通过四阶段训练和任意分辨率视觉标记化等创新技术,在多项图像和视频理解基准测试中取得突破性成绩,特别是在数学推理方面提升显著。VideoLLaMA3为教育、医疗、内容创作等领域提供了强大的视觉理解能力。

新加坡国立大学最新成果:让AI守卫者学会"推理",安全防护能力飞跃20%

新加坡国立大学最新成果:让AI守卫者学会"推理",安全防护能力飞跃20%

新加坡国立大学研究团队提出GuardReasoner,这是首个基于推理的AI安全防护系统。该系统让AI守门员学会思考和解释判断过程,性能比现有最先进系统提升20%以上。通过12.7万样本和46万推理步骤的训练,GuardReasoner不仅能准确识别有害内容,还能处理新型攻击并提供透明的解释,为AI安全防护开辟了新方向。

清华大学团队推出革命性AI记忆压缩技术,让机器像人类一样聪明地"遗忘"

清华大学团队推出革命性AI记忆压缩技术,让机器像人类一样聪明地"遗忘"

清华大学团队开发出革命性的张量积注意力技术,让AI系统学会"智能遗忘",将传统AI的完整记忆模式转变为类似人脑的选择性记忆。该技术通过巧妙的数学分解,将复杂信息压缩为关键特征,在保持甚至提升性能的同时,内存占用减少90%,处理速度显著提升,特别适用于长文档处理,为AI应用的普及和效率提升开辟了新路径。

上海AI实验室让机器人学会自己"找事做":OS-Genesis项目颠覆GUI智能体训练方式

上海AI实验室让机器人学会自己"找事做":OS-Genesis项目颠覆GUI智能体训练方式

上海AI实验室联合多所知名大学推出OS-Genesis项目,创新性地提出"反向任务合成"方法来训练GUI智能体。该方法让AI先自由探索应用界面,观察操作效果,然后反推出训练任务,彻底改变了传统的预定义任务训练模式。实验显示,这种方法在AndroidWorld等复杂测试环境中将智能体成功率从9.82%提升到17.41%,接近翻倍的性能提升证明了探索式学习在GUI智能体训练中的巨大潜力。

耶鲁大学推出MMVU:AI看视频理解专业知识的"高考"真的来了!

耶鲁大学推出MMVU:AI看视频理解专业知识的"高考"真的来了!

耶鲁大学研究团队开发了MMVU测试系统,专门评估AI模型的专业视频理解能力。该测试包含3000道专家出题,覆盖科学、医疗、工程等27个学科。测试结果显示,最先进的o1模型准确率达80%,接近人类专家开卷考试水平,但大多数模型表现远低于人类专家,揭示了当前AI在专业领域应用中的局限性和改进方向。

人工智能的最后一场考试:当最强AI模型遇上专家级学术难题会发生什么?

人工智能的最后一场考试:当最强AI模型遇上专家级学术难题会发生什么?

这项由美国AI安全中心和Scale AI等机构联合开展的研究,创建了迄今最具挑战性的AI学术能力测试基准。该测试包含2500道专家级题目,涵盖数十个学科领域,由全球近千名专家贡献。测试结果显示,即使是最先进的AI系统表现也非常有限,准确率普遍在个位数,同时存在严重的"虚假自信"问题。研究揭示了AI系统与人类专家在深度学术能力方面的巨大差距。