多模态处理 关键字列表
Liquid AI推出LFM2-VL模型,让智能手机拥有快速视觉AI能力

Liquid AI推出LFM2-VL模型,让智能手机拥有快速视觉AI能力

Liquid AI发布了新一代视觉语言基础模型LFM2-VL,专为智能手机、笔记本电脑和嵌入式系统等设备高效部署而设计。该模型基于独特的LIV系统架构,GPU推理速度比同类模型快2倍,同时保持竞争性能。提供450M和1.6B两个版本,支持512×512原生分辨率图像处理,采用模块化架构结合语言模型和视觉编码器。模型已在Hugging Face平台开源发布。

Microsoft 新推出的 Phi-4 AI 模型:小巧身材蕴含强大性能

Microsoft 新推出的 Phi-4 AI 模型:小巧身材蕴含强大性能

微软推出了新一代高效 AI 模型 Phi-4,可同时处理文本、图像和语音,且计算资源需求大幅降低。其中 Phi-4-Multimodal 仅有 56 亿参数,Phi-4-Mini 仅有 38 亿参数,性能却超越同等规模竞品,甚至在某些任务上媲美两倍大小的模型。这一突破性进展为开发者提供了先进的 AI 能力,有望推动边缘计算和普及 AI 应用。

OpenAI 发布 Operator 代理,竞争对手同步升级 AI 服务

OpenAI 发布 Operator 代理,竞争对手同步升级 AI 服务

OpenAI 推出名为 Operator 的 AI 代理,可自动执行用户任务。与此同时,主要竞争对手 Perplexity AI 和 Anthropic 也宣布了产品更新。Perplexity AI 在其 Android 应用中引入类似功能,而 Anthropic 则推出了改进 AI 模型引用能力的工具。这些动作反映了 AI 服务领域的激烈竞争和快速发展。