多模态AI文章列表第1页-至顶网频道

多模态AI 关键字列表

谷歌在I/O大会上宣布，旗舰AI Ultra订阅计划月费从250美元降至200美元，同时推出100美元的新版Ultra方案。此外，谷歌发布了Gemini Spark助手工具，可跨应用完成任务，并将接入Chrome浏览器，通过Android Halo界面展示实时进度。谷歌还推出全新多模态模型家族Gemini Omni，支持文本、音频、图像和视频处理，首款产品Gemini Omni Flash即日起向付费用户开放。

人工智能

多模态AI

新型算法

2026-04-08

阿联酋发布Falcon Perception多模态AI模型推进AI独立

阿布扎比技术创新研究院发布Falcon Perception多模态AI模型，该系统能让机器高效地观察、阅读和解释物理世界。该模型拥有约6亿参数，比传统多模态系统更紧凑高效。通过统一的变换器架构，Falcon Perception可直接处理视觉和语言特征，实现端到端集成。该系统可应用于制造业自动检测、机器人自然语言指令执行等领域，是阿联酋推进AI主权能力建设的重要一步。

人工智能

多模态AI

工作流程自动化

2026-03-25

多模态AI自动化复杂金融工作流程

金融领导者正通过采用强大的多模态AI框架来自动化复杂工作流程。传统光学字符识别系统在处理复杂布局时表现不佳，而大语言模型的多样化输入处理能力实现了可靠的文档理解。专业工具如LlamaParse将传统文本识别与视觉解析相结合，在标准测试环境中比直接处理原始文档提升13-15%的效果。金融机构利用AI驱动风险缓解和运营效率提升。

人工智能

智能眼镜

多模态AI

2025-10-27

三星谷歌联手打造未来智能眼镜新形态

三星Galaxy XR头显是两家科技巨头合作的首个阶段，下一步将推出适合日常佩戴的智能眼镜。Galaxy XR搭载的Gemini AI能够"看到"用户所见，包括真实世界和虚拟屏幕内容。两公司正与Warby Parker和Gentle Monster合作开发AI眼镜，将与Meta的Ray-Ban产品竞争。未来智能眼镜将通过手机提供算力支持，并与手表、戒指等可穿戴设备连接，重点关注健身和健康功能。

人工智能

多模态AI

战略转变

2025-06-16

多模态AI：强大飞跃背后的复杂权衡考量

多模态AI使系统能够处理文本、图像、音频和视频等多种格式信息，更接近人类感知方式。它能统一孤立的数据源，在医疗、物流、零售等领域实现更精准诊断和个性化体验。然而，多模态AI面临数据整合复杂性、偏见放大、安全隐私等挑战。不同数据类型结合可能产生不可预测的偏见效应，同时对数据安全和隐私保护提出更高要求。企业需要在技术能力与责任治理之间找到平衡。

白皮书

数字化转型方略

人工智能

多模态AI

新品发布

谷歌下调最高级AI订阅计划价格，Gemini功能全面升级

人工智能

多模态AI

新型算法

阿联酋发布Falcon Perception多模态AI模型推进AI独立

人工智能

多模态AI

工作流程自动化

多模态AI自动化复杂金融工作流程

人工智能

智能眼镜

多模态AI

三星谷歌联手打造未来智能眼镜新形态

人工智能

多模态AI

战略转变

多模态AI：强大飞跃背后的复杂权衡考量

三一集团：数字化是必选项，AI是生存项

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: