最新文章
提示工程正在深入探索最新发布的ChatGPT工作效率提升提示包

提示工程正在深入探索最新发布的ChatGPT工作效率提升提示包

OpenAI最新发布了一系列ChatGPT工作效率提升提示模板包,涵盖撰写专业邮件、会议议程制定、根本原因分析等商务场景。这些现成模板旨在帮助更多用户认识到生成式AI在工作中的实用价值。提示工程师应关注这些模板,既可直接使用也可用于提升技能。使用时需注意隐私安全,选择合适的AI平台,并采用交互式对话方式获得更好效果。用户还应要求AI解释推理过程,仔细检查输出内容避免错误和幻觉问题。

NRG能源如何通过技术创新重塑传统电力行业

NRG能源如何通过技术创新重塑传统电力行业

NRG能源公司通过收购智能家居公司Vivint、建立虚拟电厂网络,将传统电力服务转变为智能化体验。公司采用产品运营模式,整合业务与技术团队,利用AI技术优化客户服务和需求预测。面对德州等地因AI数据中心激增的电力需求挑战,NRG通过虚拟电厂和传统发电厂双重投资策略应对。这一转型展示了传统行业如何通过技术创新从商品化服务转向客户价值体验。

CIO将承担业务主导AI项目失败的收拾责任

CIO将承担业务主导AI项目失败的收拾责任

Forrester预测,2026年将有25%的CIO被要求拯救组织内业务主导的失败AI项目。许多组织采用自下而上的AI采用方式,业务团队在缺乏IT深度参与下启动项目,低估了技术工作需求。专家建议从项目开始就让IT领导参与,建立包含IT和业务领导的项目启动团队,确保适当的治理和数据管理。目前仅39%的AI决策者认为CIO主导技术策略,这一比例预计将翻倍。

企业高管担忧公有云数据主权问题

企业高管担忧公有云数据主权问题

Kyndryl第二年度准备度报告显示,地缘政治压力在IT决策中的重要性较12个月前有所上升。调查涵盖21个国家的3700名高级领导者,83%的受访者认为新兴数据主权和回流法规正在影响IT决策,82%认为地缘政治不稳定性影响其IT决策。报告指出,75%的组织越来越担心在全球云环境中存储和管理数据的地缘政治风险,86%认为云服务商的原产国和监管一致性成为云评估的重要因素。

认知科学研究院首次发现:进化策略竟能超越强化学习训练大语言模型

认知科学研究院首次发现:进化策略竟能超越强化学习训练大语言模型

美国认知科学研究院团队首次成功将进化策略扩展到数十亿参数的大语言模型微调,在多项测试中全面超越传统强化学习方法。该技术仅需20%的训练样本就能达到同等效果,且表现更稳定,为AI训练开辟了全新路径。

当机器学会"热眼看世界":纽约大学等联合团队让AI精通"热感翻译术"

当机器学会"热眼看世界":纽约大学等联合团队让AI精通"热感翻译术"

纽约大学等机构联合开发的ThermalGen系统能够将普通彩色照片智能转换为对应的热成像图片,解决了热成像数据稀缺昂贵的难题。该系统采用创新的流匹配生成模型和风格解耦机制,能适应从卫星到地面的多种拍摄场景,在各类测试中表现优异。研究团队还贡献了三个大规模新数据集,并计划开源全部技术资源,为搜救、建筑检测、自动驾驶等领域提供强有力的技术支撑。

阿里巴巴团队重磅发布:让AI像苏格拉底一样自我学习,仅用100道题就能碾压GPT-5

阿里巴巴团队重磅发布:让AI像苏格拉底一样自我学习,仅用100道题就能碾压GPT-5

阿里巴巴团队联合多所知名高校开发出革命性AI训练框架Socratic-Zero,该系统模拟苏格拉底教学法,通过三个AI角色协作进化实现自主学习。仅从100道数学题开始,系统就培养出超越GPT-5等顶级商业模型的数学推理能力,在七项基准测试中平均提升20.2个百分点,展示了"以小博大"的惊人效果,为AI发展开辟了全新路径。

普渡大学研究团队推出TENET:让AI像程序员一样先写测试再写代码的革命性方法

普渡大学研究团队推出TENET:让AI像程序员一样先写测试再写代码的革命性方法

普渡大学研究团队开发出TENET系统,将测试驱动开发引入AI代码生成领域。该系统通过智能筛选关键测试用例、使用专门工具收集代码库信息、并采用反思式改进流程,让AI像程序员一样先写测试再写代码。在两个重要基准测试中,TENET的成功率分别达到69.08%和81.77%,比最佳竞争对手高出9.49和2.17个百分点,展现了测试驱动方法在AI辅助软件开发中的巨大潜力。

伊利诺伊大学香槟分校发现:AI需要找到"创意平衡点",太深或太浅都不够聪明

伊利诺伊大学香槟分校发现:AI需要找到"创意平衡点",太深或太浅都不够聪明

这项来自伊利诺伊大学香槟分校的研究首次系统探索了AI模型的组合创造力规律。研究发现AI创造力存在最优的深度宽度平衡点,并揭示了新颖性与实用性之间的根本权衡关系。这种权衡即使在大规模模型中也持续存在,为理解AI创造力局限性和"构思执行鸿沟"现象提供了重要洞察,对未来AI创造性系统的设计具有指导意义。

北卡罗来纳大学团队破解大语言模型信心预测难题:让AI学会准确评估自己的回答可靠性

北卡罗来纳大学团队破解大语言模型信心预测难题:让AI学会准确评估自己的回答可靠性

北卡罗来纳大学研究团队通过大量实验发现,大语言模型缺乏准确的自我认知能力,无法可靠评估自身回答的正确性。他们提出通用正确性模型,通过学习多个AI模型的历史表现来预测回答可靠性,准确率比传统自我评估方法提升2.22%。研究还发现回答表述方式和世界知识对正确性预测具有重要影响,为构建更可靠的AI系统提供了实用技术路径。

北大腾讯联手破解语音AI"变脸"难题:一项让语音助手在嘈杂环境中保持"人格稳定"的突破性研究

北大腾讯联手破解语音AI"变脸"难题:一项让语音助手在嘈杂环境中保持"人格稳定"的突破性研究

北京大学和腾讯联合研究团队开发出StableToken技术,解决了语音AI在噪音环境下不稳定的关键问题。该技术采用多路径投票机制和共识训练策略,将标记稳定性错误率从26.17%降至10.17%,相对改善超过60%。这项突破使语音助手能在嘈杂环境中保持稳定表现,为实际应用中的语音AI系统可靠性提供了重要技术保障。

华为诺亚方舟实验室重新定义AI训练:约束强化学习让小模型更聪明地模仿大模型

华为诺亚方舟实验室重新定义AI训练:约束强化学习让小模型更聪明地模仿大模型

华为诺亚方舟实验室提出了一种基于约束强化学习的大语言模型知识蒸馏新方法,首次将蒸馏过程重新定义为约束优化问题。该方法在保证学生模型与教师模型差异不超过预设阈值的前提下最大化任务奖励,避免了传统方法的参数调节难题。实验表明新方法在约束满足率和推理质量方面表现出色,为资源受限环境下的AI模型部署提供了理论严谨且实用高效的解决方案。

Meta重磅:让AI从真实对话中学习,RLHI技术如何颠覆传统人工智能训练方式

Meta重磅:让AI从真实对话中学习,RLHI技术如何颠覆传统人工智能训练方式

Meta AI研究院联合约翰斯·霍普金斯大学开发的RLHI技术,让AI能从真实用户对话中学习成长,而非依赖专家标注数据。该技术通过用户引导重写和个性化奖励系统,实现因材施教式的AI训练。实验显示个性化能力提升24.3%,推理能力平均提升5.3%,为AI发展指明了更人性化的方向。

威斯康星大学麦迪逊分校首创数据清洗评估基准:让AI更听话的关键在于精挑细选训练数据

威斯康星大学麦迪逊分校首创数据清洗评估基准:让AI更听话的关键在于精挑细选训练数据

威斯康星大学麦迪逊分校研究团队创建了首个AI训练数据清洗方法评估基准PrefCleanBench,系统比较了13种数据清洗技术。研究发现删除低质量数据比修正错误标签更有效,多模型投票方法表现最佳,最优数据删除比例为20-30%。该研究为提升AI安全性和可靠性提供了重要技术基础。

比亚迪出海:从"建"到"简"的车联网修行
2025-10-24

比亚迪出海:从"建"到"简"的车联网修行

比亚迪不仅是中国汽车出海的一面旗帜,也是中国智能制造比肩全球的担当代表。

2025-10-24

从“成本中心”到“质量飞轮”,IT部门如何重塑软件交付的价值公式

当前的数字化转型浪潮中,IT预算的投向已成为企业领导层最核心的战略考量。对于CIO和CTO而言,最大的挑战并非采纳新技术,而是如何让技术投入不再仅仅是开支,而是能立即产生可量化的业务价值。

2025-10-24

英特尔公布2025年三季度财报:营收137亿美元,同比增长3%

第三季度,英特尔公司从运营中产生了25亿美元的现金。

威斯康星大学最新研究:AI在"背书"时容易撒谎,LUMINA系统如何识破这些"花言巧语"

威斯康星大学最新研究:AI在"背书"时容易撒谎,LUMINA系统如何识破这些"花言巧语"

威斯康星大学研究团队开发了LUMINA系统,专门检测AI在回答问题时的"撒谎"行为。该系统发现AI有时会忽视提供的参考资料,固执地依赖内部知识生成不准确回答。LUMINA通过监测AI对外部文档和内部知识的依赖程度来识别这种行为,在多个测试中达到90%以上的准确率,比以往方法提升13%,为构建更可信的AI系统提供了重要工具。

当AI学会"思考":CentraleSupélec团队揭秘推理训练何时真正有效

当AI学会"思考":CentraleSupélec团队揭秘推理训练何时真正有效

这项由法国CentraleSupélec大学领导的研究通过严格控制的实验,系统比较了AI的推理训练与传统训练方式。研究发现推理训练在数学、开放式任务中效果显著,但需要70亿参数以上模型才能充分发挥优势,且成本增加明显。研究为AI开发者提供了明确的应用指导,有助于根据具体场景选择最优训练策略。

AI助手可以"量身定制"了?首个个性化深度研究系统评测基准在OPPO等机构诞生

AI助手可以"量身定制"了?首个个性化深度研究系统评测基准在OPPO等机构诞生

这项由OPPO等机构完成的研究首次建立了评估AI研究助手个性化能力的标准基准。研究团队构建了250个真实用户场景,开发了PQR三维评价框架,测试发现开源系统个性化能力更强,用户信息越详细AI表现越好,为推动AI从标准化服务向个性化伙伴转变提供了重要参考。