人工智能 关键字列表
ElevenLabs 推出自研语音转文本模型

ElevenLabs 推出自研语音转文本模型

ElevenLabs是一家刚刚完成1.8亿美元融资的人工智能初创公司,主要以其音频生成能力而闻名。该公司通过推出首个独立的语音转文本模型Scribe,迈出了另一个技术方向。该初创公司估值为33亿美元,已帮助许多其他公司提供语音转文本服务,利用其庞大的声音库。然而,该公司现在希望进入语音检测领域,与Gladia、Speechmatics、AssemblyAI、Deepgram和OpenAI的Whisper模型竞争。

OpenAI 发布迄今最大规模的 AI 模型 GPT-4.5 "Orion"

OpenAI 发布迄今最大规模的 AI 模型 GPT-4.5 "Orion"

OpenAI 推出代号"Orion"的 GPT-4.5 模型,这是公司迄今最大规模的 AI 模型。GPT-4.5 在计算能力和训练数据方面均超越以往版本,但 OpenAI 并不认为它是前沿模型。该模型将逐步向付费用户开放,但运营成本高昂。尽管在某些基准测试中表现出色,但 GPT-4.5 在部分任务上仍落后于其他 AI 推理模型,凸显了传统预训练方法的局限性。

Amazon 混合模型与智能代理,重塑智能 AI 助手 Alexa

Amazon 混合模型与智能代理,重塑智能 AI 助手 Alexa

亚马逊正在重塑其旗舰语音助手 Alexa,通过整合 AI 代理、模型混合和浏览器操作能力,打造更智能的 Alexa+。新版本不仅可以主动提供个性化信息,还能理解复杂指令并完成多步骤任务。亚马逊希望通过这种创新方式,让 Alexa 成为更强大、更智能的家庭语音助手。

Amazon 的 Alexa+ 在消费者智能助手领域展开新布局

Amazon 的 Alexa+ 在消费者智能助手领域展开新布局

亚马逊在周三分享了一个令人印象深刻的“代理”未来愿景——在这个未来中,改进后的 Alexa+ 将处理无数日常任务,从预订餐厅到寻找家电维修工。如果亚马逊能够实现这一目标,它可能会成为首个推出全面、以消费者为中心的代理工具的公司。该公司希望将更自然、更具表现力的 Alexa(由生成性 AI 模型驱动)与能够以完全自主、智能的方式接入第一方和第三方应用、服务及平台的能力结合起来。

Microsoft 新推出的 Phi-4 AI 模型:小巧身材蕴含强大性能

Microsoft 新推出的 Phi-4 AI 模型:小巧身材蕴含强大性能

微软推出了新一代高效 AI 模型 Phi-4,可同时处理文本、图像和语音,且计算资源需求大幅降低。其中 Phi-4-Multimodal 仅有 56 亿参数,Phi-4-Mini 仅有 38 亿参数,性能却超越同等规模竞品,甚至在某些任务上媲美两倍大小的模型。这一突破性进展为开发者提供了先进的 AI 能力,有望推动边缘计算和普及 AI 应用。

阿里云开源视频基础模型

阿里云开源视频基础模型

阿里云开源了其视频基础模型系列,为企业和研究人员提供视频创作能力。这包括两个版本的四个模型,分别拥有140亿和13亿参数。这些模型可以从文本和图像输入生成高质量视频,支持中英文文本效果,并在视频生成模型基准测试中表现出色。此举旨在降低AI应用门槛,让更多企业能够创建高质量视觉内容。

Amazon 订阅版 Alexa+ 功能强大但引发质疑

Amazon 订阅版 Alexa+ 功能强大但引发质疑

亚马逊推出Alexa+订阅服务,大幅提升Alexa的对话和任务处理能力。它能理解日常用语,执行复杂指令,并整合多种第三方服务。Prime会员可免费使用,非会员每月需付20美元。这项服务旨在提升Alexa的盈利能力,但也引发了隐私和数据使用方面的担忧。

2025 年迄今已诞生 7 家科技独角兽公司

2025 年迄今已诞生 7 家科技独角兽公司

尽管风险投资市场依然紧张,但每个月仍有新的独角兽公司诞生。根据 Crunchbase 和 PitchBook 的数据,TechCrunch 跟踪了截至 1 月底新成立的风险投资支持的独角兽初创公司。这些公司包括医疗保健公司 Hippocratic AI 和卫星公司 Loft Orbital。此列表将在全年更新,敬请关注今年的强劲企业!

Akool 将生成式 AI 模型与 2D 头像结合打造真实角色

Akool 将生成式 AI 模型与 2D 头像结合打造真实角色

Akool推出了一项创新技术,将生成式AI模型与2D头像相结合,创造出栩栩如生的虚拟角色。用户只需上传照片和录音,即可定制个性化头像,实现与AI模型的自然交互。这项技术可广泛应用于电商、教育、医疗等领域,大幅提升用户体验和参与度。Akool的解决方案已为多家全球品牌节省了大量制作成本,加速了市场拓展。

Qualcomm 和诺基亚贝尔实验室展示多供应商 AI 模型如何在无线网络中协同工作

Qualcomm 和诺基亚贝尔实验室展示多供应商 AI 模型如何在无线网络中协同工作

高通和诺基亚贝尔实验室成功展示了多厂商AI模型在无线网络中的互操作性。通过序列学习技术,他们实现了编码器和解码器模型的无缝协作,提高了网络效率和用户体验。这项突破性成果为AI在无线通信领域的应用开辟了新的可能性,有望显著提升网络容量、可靠性和能源效率。

Continue 希望帮助开发者创建和分享自定义 AI 编程助手

Continue 希望帮助开发者创建和分享自定义 AI 编程助手

一家新创公司希望帮助开发者创建定制化的上下文编码助手,这些助手可以与任何模型连接,并与他们的开发环境无缝集成。Continue成立于2023年6月,由首席执行官Ty Dunn和首席技术官Nate Sesti创办,作为Y Combinator的校友,Continue在过去几年中已经在GitHub上获得了约23,000个星标,并在Discord社区中拥有11,000名成员。为了进一步发展,Continue宣布其产品的1.0版本,并获得了300万美元的种子资金支持。

AI 如何帮你调整工作邮件的语气

这篇文章探讨了如何使用人工智能工具 goblin.tools 来改善工作邮件的语气,避免不必要的冒犯。作者分享了自己在准备一项活动时的挫折感,并介绍了 goblin.tools 的功能,特别是其“Formalizer”工具,能够将邮件内容转化为更专业、更礼貌的表达。通过使用这个工具,作者发现自己能够更有效地传达需求,同时保持良好的沟通关系。

Flexport 发布一系列 AI 工具,灵感来自"创始人模式"

Flexport 发布一系列 AI 工具,灵感来自"创始人模式"

Flexport 推出一系列新产品和功能,大多基于 AI 技术。这是公司首次尝试半年一次的产品发布模式,灵感来自 Airbnb。新产品旨在提高物流效率,包括自然语言查询和全网络可视化控制等功能。Flexport 希望通过 AI 实现自动化,同时保持"以人为本"的服务理念。

Matthew Kull 谈 Inova 医疗系统的 AI、数据和数字创新

Matthew Kull 谈 Inova 医疗系统的 AI、数据和数字创新

Inova健康系统是弗吉尼亚州最大的医疗系统,致力于满足城市人口日益增长的医疗需求。首席信息与数字官马修·库尔负责传统IT职能及人工智能、分析和流程改进等数字化项目。他的愿景是创建一个“数据流畅的组织”,确保所有决策都有坚实的证据支持。Inova通过与临床医生的合作,推动前沿研究,特别是在女性健康领域,同时重视数据隐私和安全,利用人工智能减轻行政负担,提升患者护理效率。

制造业拥抱工业 5.0,工程技术迎来转折点

制造业拥抱工业 5.0,工程技术迎来转折点

随着人工智能(AI)渗透到连接生产和工程的世界,AI的成熟度和创建强大AI模型的能力推动工业部门进入一个基于经验代理和生成经济的新纪元。

IBM 发布新的 Granite 3.2 系列模型,实现按需推理能力

IBM 发布新的 Granite 3.2 系列模型,实现按需推理能力

IBM 公司今天推出了新的 Granite AI 模型系列,具备实验性推理、视觉和预测能力,旨在在企业人工智能市场中占据一席之地。所有 Granite 模型均在 Apache 2.0 开源许可证下开放,现已在 Hugging Face 和 IBM watson.ai 等平台上提供。新系列的旗舰产品是 Granite 3.2 Instruct 变体,支持文本处理,能够执行摘要、问题解决和代码生成等任务,并设计为遵循指令。

AI 如何塑造数据存储的未来

AI 如何塑造数据存储的未来

社会要信任人工智能需要什么?人工智能算法生成的每一个决策、预测和洞察都依赖于数据的可用性和质量。为了充分发挥人工智能的潜力,数据必须有效且高效地存储。换句话说,数据支撑着人工智能,而存储则支撑着数据。这种相互促进的关系使得人工智能也推动了当今存储创新的发展。要理解人工智能如何帮助创造更好的存储解决方案,我们首先需要考察它与数据的关系。

Grok 3 似乎正推动 Grok 使用量创下新高

Grok 3 似乎正推动 Grok 使用量创下新高

埃隆·马斯克的人工智能公司 xAI 推出了备受期待的旗舰 AI 模型 Grok 3。新模型推出后,Grok 应用的下载量和活跃用户数大幅增长。然而,近期围绕 Grok 3 的争议可能会影响用户的热情。能否保持增长势头并留住用户,成为 xAI 面临的重要挑战。

Gemini AI 代码工具现向个人用户免费开放

Gemini AI 代码工具现向个人用户免费开放

Google 宣布面向个人开发者的 Gemini Code Assist 正式推出公开预览版。这款强大的 AI 编程助手每月提供高达 18 万次代码补全,远超其他同类产品。它支持多种编程语言和开发环境,通过自然语言交互为用户提供代码生成、补全和调试等全方位辅助,旨在让学生、爱好者和自由职业者等个人开发者也能便捷地使用先进的 AI 编程工具。

GenAI 时代的计算引擎策略

GenAI 时代的计算引擎策略

随着生成式人工智能和 GPU 加速 AI 训练与推理的兴起,数据中心仍需关注 CPU 的重要性。现代化 CPU 不仅可以提升传统工作负载性能,还能帮助企业为昂贵的 AI 基础设施投资节省成本。高性能 CPU 可以显著提升 AI 推理和训练效率,同时在某些场景下直接运行 AI 算法。企业应考虑采用单插槽服务器等创新方案,以优化数据中心架构。