神经网络 关键字列表
谷歌研究科学家用实证研究助手探索的四个前沿领域

谷歌研究科学家用实证研究助手探索的四个前沿领域

谷歌研究团队自去年秋季推出实证研究助手(ERA)以来,已将其应用于流行病学、宇宙学、大气监测和神经科学四大领域。ERA帮助科学家生成专家级实证软件,成功实现了对美国流感、新冠及RSV住院率的实时预测,解决了宇宙弦引力辐射的数学难题,从现有气象卫星数据中提取二氧化碳浓度信息,并揭示了斑马鱼神经回路机制,展示了AI加速科学发现的巨大潜力。

新AI创业公司Humans&获英伟达和GV支持的4.8亿美元融资

新AI创业公司Humans&获英伟达和GV支持的4.8亿美元融资

成立仅三个月的AI初创公司Humans& Inc.宣布完成4.8亿美元种子轮融资,估值44.8亿美元。本轮融资由SV Angel和公司创始人之一、谷歌早期员工Georges Harik领投,谷歌母公司Alphabet通过GV基金参投,英伟达、贝索斯等也参与投资。该公司约20名AI专家团队来自OpenAI、Anthropic、Meta等知名AI公司,正在开发提升工作效率的神经网络,专注于长期任务处理和多智能体协作功能。

Anthropic研究人员绘制AI模型"人格地图"以驱逐"恶魔"人设

Anthropic研究人员绘制AI模型"人格地图"以驱逐"恶魔"人设

Anthropic等机构的研究人员观察到大语言模型有时会表现出有用的个人助手行为,正在深入研究这一现象以确保聊天机器人不会偏离正轨并造成伤害。研究团队通过映射神经网络,识别出一组被称为"助手人格"的响应模式。他们发现模型在预训练过程中会学习模拟各种文学原型,而后训练则会引导响应朝向助手或类似有用的人格发展。通过理解人格空间,研究人员希望能更好地约束大语言模型行为。

AI研究发现神经网络记忆与推理功能完全分离

AI研究发现神经网络记忆与推理功能完全分离

Goodfire.ai研究人员首次发现AI语言模型中记忆和推理功能通过完全独立的神经通路运作。研究显示,移除记忆通路后,模型丧失97%的训练数据复述能力,但逻辑推理能力几乎完全保留。令人意外的是,算术运算与记忆共享神经通路而非推理通路,这可能解释了AI模型在数学方面的困难。该技术未来有望用于移除版权内容或敏感信息而不损害模型核心功能。

通用人工智能和超级智能可能催生全新外星智能形态

通用人工智能和超级智能可能催生全新外星智能形态

人工通用智能和超级人工智能的出现,可能会创造出一种全新的外星智能形态。传统AI基于人类智能模式构建,但AGI和ASI一旦存在,可能会选择创造完全不同于人类认知方式的新型智能。这种外星人工智能既可能带来突破性进展,如找到癌症治愈方法,也可能存在未知风险。目前尚不确定这种新智能形态是否会超越人类智能,以及我们是否应该追求这一可能改变人类命运的技术突破。

OpenAI 想要改变版权规则,但研究表明它并未等待许可就开始行动

OpenAI 想要改变版权规则,但研究表明它并未等待许可就开始行动

一项新研究揭示,OpenAI 可能在未经许可的情况下使用 O'Reilly 出版社的版权保护书籍来训练其 GPT-4o 模型。这引发了对 AI 公司使用版权材料的争议,以及对内容创作者公平补偿的担忧。研究还警告,如果不解决这个问题,可能导致互联网内容质量和多样性的下降。

Google 的 Titans:赋予 AI 人类般的记忆能力

Google 的 Titans:赋予 AI 人类般的记忆能力

Google 推出名为 Titans 的新型 AI 架构,是 Transformer 的直接进化版。Titans 引入了神经长期记忆、短期记忆和基于惊喜的学习系统,使 AI 更接近人类思维方式。这一突破性技术有望彻底改变 AI 范式,推动机器智能向人类认知迈进一大步。

Cognizant 推出神经 AI 多智能体加速器

Cognizant 推出神经 AI 多智能体加速器

Cognizant 推出了神经 AI 多代理加速器和服务套件,旨在帮助企业快速开发和部署 AI 代理。该技术通过预构建的代理网络模板和无代码框架,实现了跨职能的可扩展性和自主决策能力。这一创新有望推动 AI 代理在企业工作流程中的广泛应用,促进人机协作,提升业务效率和适应性。

伊利亚·苏茨克沃尔:预训练时代即将终结,接下来是能推理且有自我意识的“超级智能”

伊利亚·苏茨克沃尔:预训练时代即将终结,接下来是能推理且有自我意识的“超级智能”

伊利亚因2014年与Oriol Vinyals、Quoc Le共同撰写的“神经网络的序列到序列学习”论文,获得了NeurIPS 2024时间检验奖。该论文引入的编码器-解码器架构,使用多层长短期记忆网络(LSTM)将输入序列映射到固定维度的向量,再从向量解码目标序列,极大地拓展了自然语言处理的边界,为序列到序列的任务提供了一种高效的方法,是自然语言处理及机器学习领域的重要基石。

人工智能教父:大语言模型并不是简单的词汇预测机器,具有理解能力,还有主观体验

人工智能教父:大语言模型并不是简单的词汇预测机器,具有理解能力,还有主观体验

大语言模型并不是简单的词汇预测机器,这些模型实际上具有理解它们所生成内容的能力。如果大语言模型只是简单地基于统计概率来预测下一个词汇,那么它们不可能在处理复杂问题时表现出色。

微软人工智能首席执行官:具有无限记忆能力的AI将在2025年上市,一开始可能会比较贵

微软人工智能首席执行官:具有无限记忆能力的AI将在2025年上市,一开始可能会比较贵

利用神经网络来表示复杂的思想,神经网络能够捕捉和学习数据中的复杂模式,从而在各种预测任务中表现出色,这种预测能力是智能的一个主要技能,也是人类作为物种的一个显著特点。

AI时代,关于人工智能你需要知道的一切

AI时代,关于人工智能你需要知道的一切

机器会不会就此爆发,迅速脱离人类的掌控?

Nvidia升级NeMo Megatron开发工具以加速AI训练

Nvidia升级NeMo Megatron开发工具以加速AI训练

Nvidia今天推出了新版本的NeMo Megatron AI开发工具,该工具将让软件团队能够更快地训练神经网络。

Meta开源AI文本翻译系统质量提升44%,利用超500亿参数翻译200种语言

Meta开源AI文本翻译系统质量提升44%,利用超500亿参数翻译200种语言

Meta Platforms今天开放了NLLB-200的系统代码,NLLB-200是Meta内部开发的一个人工智能系统,可以翻译200种语言的文本。

2021-12-06

全网最全-混合精度训练原理

通常我们训练神经网络模型的时候默认使用的数据类型为单精度FP32。近年来,为了加快训练时间、减少网络训练时候所占用的内存,并且保存训练出来的模型精度持平的条件下,业界提出越来越多的混合精度训练的方法。

MIT开发了一种神经网络 可以在一秒内完成MRI扫描

MIT开发了一种神经网络 可以在一秒内完成MRI扫描

麻省理工学院的研究人员表示,他们已经开发出了一种能够在不到一秒钟内处理磁共振图像的算法,这对于医疗行业来说将是一项至关重要的进展。