计算机视觉 关键字列表
SkyfireAI获1100万美元融资,推动无人机自主协同作战

SkyfireAI获1100万美元融资,推动无人机自主协同作战

美国AI无人机自主技术公司SkyfireAI完成1100万美元种子轮融资,由Mucker Capital领投,AI Fund等机构跟投。该公司致力于开发AI驱动的无人机自主协同软件平台,支持多架无人机在无需大量人工干预的情况下协同执行任务。平台面向急救响应、执法、国防及关键基础设施等高风险场景,可覆盖从任务规划到实时调度的完整流程。公司联合创始人团队来自美国海军、情报机构及DARPA,计划利用本轮资金加速产品开发并扩大部署规模。

AWS允许智能体控制云端虚拟桌面,但每次点击可能消耗50万Token

AWS允许智能体控制云端虚拟桌面,但每次点击可能消耗50万Token

亚马逊云服务(AWS)推出新功能,允许AI代理通过Amazon IAM获取独立身份,访问WorkSpaces云端虚拟PC并操控其中的应用程序。该服务目前处于预览阶段,代理通过托管MCP端点连接,支持截图、鼠标控制和文本输入等操作。AWS建议为每个代理分配唯一身份以便追踪。然而,AI编程公司Reflex的研究显示,视觉代理完成一次下拉菜单点击需消耗约50万tokens,成本是直接调用API的45倍。

Google Photos推出AI数字衣橱功能,让《独领风骚》成真

Google Photos推出AI数字衣橱功能,让《独领风骚》成真

Google Photos宣布即将推出一项AI新功能,可将用户照片中的服装自动识别并生成数字衣橱。用户可按上衣、下装、珠宝等类别筛选单品,自由搭配造型,并支持虚拟试穿效果预览。搭配方案可分享给好友或保存至数字灵感板,适用于旅行、约会、工作等多种场合。该功能将于今年夏季晚些时候率先在Android版Google Photos上线,随后推出iOS版本。

戛纳AI电影节引发争议:AI电影的未来在哪里?

戛纳AI电影节引发争议:AI电影的未来在哪里?

全球首届世界AI电影节(WAIFF)在戛纳举办,共征集到5000部AI生成影片参赛。节上展映作品风格迥异,从反乌托邦幻想到超现实噩梦不一而足。然而版权争议随之而来——一部酷似奥斯卡获奖动画《超级无敌掌门狗》角色的短片入围后被取消资格。尽管好莱坞大腕纷纷投资AI影视技术,传统戛纳电影节仍拒绝AI作品参赛。业界普遍认为,AI电影正处于类似1895年电影诞生之初的关键时刻。

劳氏船级社完成AI航海导航系统评估

劳氏船级社完成AI航海导航系统评估

劳氏船级社对Orca AI航行平台开展了实船评估,测试航线从意大利焦陶罗港至马耳他马尔萨什洛克,全程828海里,途经复杂水域。评估结合目标检测精度指标与船员操作反馈,重点考察AI系统在提升态势感知与辅助人工决策方面的实际表现。Orca AI SeaPod搭载日光与热成像摄像头,可实现360°视野覆盖,目前已在逾1200艘船舶上部署应用。

角度即一切:用AI重新构图,让照片焕然一新

角度即一切:用AI重新构图,让照片焕然一新

Google Photos新增Auto frame功能,利用机器学习与生成式AI技术,让用户无需重拍即可调整照片拍摄角度。该功能将2D照片解析为3D场景,自动估算原始相机位置,通过调整焦距和视角生成全新构图。尤其适合修正广角镜头产生的透视变形问题,智能补全因视角转换而出现的画面空白区域,实现一键式照片优化体验。

科学家完成澳大利亚北部珊瑚礁海域地图绘制

科学家完成澳大利亚北部珊瑚礁海域地图绘制

澳大利亚海洋科学研究所联合昆士兰大学,通过叠加数百张卫星图像构建合成影像的方法,成功绘制出澳大利亚北部海岸超过3600处珊瑚礁和2900处岩礁地图,填补了长期以来的测绘空白。此前,该区域浑浊的水体使传统勘测手段难以识别礁体。相关数据集已通过eAtlas等公共平台开放共享,将为海洋生态系统的保护与沿海开发规划提供重要依据。

美国各州隐私保护法:如何限制AI监控与车牌追踪

美国各州隐私保护法:如何限制AI监控与车牌追踪

随着AI识别技术的快速发展,自动车牌识别摄像头和无人机监控对个人隐私构成日益严峻的威胁。本文梳理了美国各州在隐私保护领域的立法实践,涵盖限制AI检测功能、规范警方摄像头权限、要求数据定期删除、禁止跨州数据共享及无人机使用须持令状等多类法规。伊利诺伊、新罕布什尔、弗吉尼亚等州的立法经验值得关注,公民也可通过参与倡导活动和联系议员推动隐私保护立法。

VisiPrint:麻省理工开发3D打印外观预览工具

VisiPrint:麻省理工开发3D打印外观预览工具

麻省理工学院研究人员开发了名为VisiPrint的AI驱动预览工具,能够准确预测3D打印物体的外观效果。用户只需上传设计截图和材料图像,系统就能自动生成包含颜色、纹理、光泽度等细节的渲染效果图。该工具采用双AI模型协作,考虑熔融沉积建模过程对材料外观的影响,预览过程仅需约一分钟。这项技术有助于减少因外观不符预期而产生的重复打印,降低材料浪费,特别适用于牙科和建筑设计等对外观要求较高的领域。

Nomadic获8400万美元融资,专攻自动驾驶数据管理

Nomadic获8400万美元融资,专攻自动驾驶数据管理

Nomadic ML是一家专注于自动驾驶和机器人视频数据处理的初创公司,刚刚完成840万美元种子轮融资。该公司开发的平台能够将海量视频数据转化为结构化、可搜索的数据集,解决自动驾驶汽车和机器人公司95%数据闲置在档案库中的问题。通过视觉语言模型,平台可以识别边缘案例,为强化学习创建独特数据集,提升车队监控效率。

计算机视觉技术助力公民科学鱼类监测项目

计算机视觉技术助力公民科学鱼类监测项目

麻省理工学院等机构研究团队开发出基于水下视频和计算机视觉的鱼类监测新方法,用于补充传统的公民科学监测项目。研究人员构建了端到端的自动化管道,从水下摄像头视频采集到模型训练,实现了AI驱动的鱼类自动计数。通过标注1435个视频片段和59850帧图像训练深度学习模型,系统在2024年河鲱鱼迁徙监测中准确计数42510条鱼,并揭示了鱼类迁徙的昼夜模式规律。

8个实用家居AI功能让聊天机器人相形见绌

8个实用家居AI功能让聊天机器人相形见绌

生成式AI和大型语言模型在家庭环境中展现出独特应用价值。包括包裹识别、声音异常检测、智能恒温器习惯学习、宠物行为识别、对话式智能助手、漏水检测、视频事件摘要和野火预警协调等功能。这些AI技术通过视觉识别、声音分析和行为模式学习,为用户提供安全监控、节能建议和便捷操作,在实用性和安全性方面远超普通聊天机器人。

Google在更多市场测试Search Live功能

Google在更多市场测试Search Live功能

谷歌正在更多市场测试Search Live功能,该功能允许用户通过手机摄像头对准物体或场景并提出相关问题。公司原计划宣布全球推广,但目前仅在美国和印度正式推出,其他市场仍在测试阶段。功能已升级至Gemini 3.1 Flash模型,提供更自然的对话体验和多语言支持,用户可通过安卓和iOS的谷歌应用或谷歌镜头访问。

英伟达超低功耗芯片:毫秒级人脸检测技术突破

英伟达超低功耗芯片:毫秒级人脸检测技术突破

英伟达研究人员开发的常开计算机视觉系统可在不到1毫秒内检测人脸,功耗仅5毫瓦。该芯片通过本地存储2MB数据和"竞速休眠"机制大幅降低功耗,检测准确率达99%。系统可应用于笔记本电脑智能息屏、自动驾驶汽车、机器人等领域,为设备提供无缝的节能体验。

AI视觉监控初创公司City Detect获得1300万美元A轮融资

AI视觉监控初创公司City Detect获得1300万美元A轮融资

City Detect是一家利用视觉AI技术帮助地方政府监控建筑和社区健康状况的公司,刚刚完成1300万美元A轮融资。该公司在垃圾车等公共车辆上安装摄像头,拍摄周边建筑物照片,然后使用计算机视觉技术分析图像,识别涂鸦、违法倾倒、建筑损坏等城市问题。相比人工每周检查50栋建筑,该系统能检查数千栋。目前已在17个城市部署,包括达拉斯和迈阿密。

三星Galaxy S26成摄影领域的噩梦

三星Galaxy S26成摄影领域的噩梦

三星Galaxy S26虽然在硬件上进行了常规升级,S26 Ultra的隐私显示功能表现出色,但其AI相机功能却令人担忧。这些新功能似乎要彻底改变拍照的概念,甚至让人质疑拍摄的还算不算"照片"。同时,微软Xbox团队发生重大人事变动,Phil Spencer和Sarah Bond离职,Asha Sharma接任。此外还讨论了OpenAI基础设施投资和Claude AI意识等话题。

Ring智能门铃寻狗功能引发公众隐私担忧

Ring智能门铃寻狗功能引发公众隐私担忧

Ring公司推出的"搜索派对"功能允许丢失宠物的主人向附近门铃用户发送照片和描述,摄像头识别匹配狗只后会通知用户。该功能现已扩展至非Ring用户。由于公司此前推出面部识别功能,公众担心该技术可能被用于监控人类,特别是针对移民和被认为"可疑"的人群。参议员等政界人士和媒体均表达担忧,认为这一功能具有反乌托邦色彩。

Razer推出桌面AI动漫全息投影智能助手

Razer推出桌面AI动漫全息投影智能助手

Razer的Project Ava项目推出桌面全息投影版本,采用5.5英寸动漫角色形象,能通过内置摄像头监控屏幕内容和用户行为。该AI助手可回答问题、提供游戏建议、协助解决问题,甚至给出穿搭建议。用户可通过自定义按键与助手对话,目前使用Grok大语言模型驱动。Razer计划今年底推出该产品并接受预订。

纳瓦尔Flow 2扫地机器人问世:配备AI识别技术能找到丢失物品

纳瓦尔Flow 2扫地机器人问世:配备AI识别技术能找到丢失物品

Narwal在CES 2026上发布了最新的Flow 2扫地机器人,具备30,000Pa吸力和AI无限物体识别功能。该设备能够自动适应不同家庭环境,包括婴儿和宠物模式。通过双1080p摄像头和AI视觉模型,可识别地面贵重物品并发送通知提醒。还配备轨道拖把系统,支持140度热水清洁。同时发布V50系列无绳吸尘器和U50系列床垫吸尘器。

CES 2026最令人期待的AI可穿戴设备

CES 2026最令人期待的AI可穿戴设备

Memories.ai在CES 2026发布Project LUCI研究原型,为开发者提供AI可穿戴设备开发平台。该系统以大型视觉记忆模型为核心,具备持久记忆层,能像人类一样理解和记忆用户生活。LUCI包含轻量化硬件、移动应用和实时世界模型,支持连续录制2-3小时。公司与高通合作实现本地化处理,确保用户隐私安全。