StorMagic 新任 CEO Susan Odle 提出以边缘虚拟化技术和全方位客户支持为基础,推动企业级边缘部署增长,确保业务持续稳定运营。
Yelp 正在测试基于 AI 的语音代理,通过 OpenAI Realtime API 与企业数据整合,实现自动接听电话、管理预订、过滤垃圾信息和通话分析,疑难问题由人工跟进,助力客户服务。
谷歌发布三款个性化语言学习AI实验:一款即时提供情境短语;一款教你掌握地道口语;一款通过拍照识别周边物品,助你扩充词汇。支持多种语言,让独立学习更动态高效。
报告显示,中国汽车厂商正积极拥抱公有云,在汽车云基础设施市场中,公有云市场规模29.94亿元,其中阿里云市场份额提升至35.7%,连续四年稳居汽车云基础设施(公有云)市场份额第一。
OpenAI 改进了 ChatGPT 的网页搜索功能,用户查询商品时能直观获得包含图片、价格和评价的结构化信息,且支持智能问答,帮助购物决策。
阿里巴巴推出全新 Qwen3 系列人工智能模型,采用混合专家技术在编码、数学和推理测试中超越部分美国顶级模型,支持119种语言,助力实现超越人类智慧的通用人工智能目标。
OpenAI更新ChatGPT搜索功能,新增购物体验,提供产品推荐与直购链接,力图挑战Google购物服务。
这篇文章介绍了 14 款在心理健康领域具有创新性的生成式 AI 工具,涵盖正念应用、聊天机器人、个性化疗法助手以及 AI 驱动的日记记录。虽然 AI 还无法完全替代专业治疗师的人性关怀,但这些平台正在为更广泛人群提供便捷、匿名的支持和指导,推动数字心理健康护理的普及与革新。
Nvidia 推出基于 BlueField 处理单元的 DOCA Argus 框架,实现对 AI 工作负载的无代理实时威胁检测,并与 Cisco 合作,为 AI 基础设施提供全方位安全防护。
2025年1月,DeepSeek 从中国闪亮登场,挑战 OpenAI 及美国巨头。其通过优化 KV 缓存、采用 MoE 策略及强化学习,提升硬件与能源效率,为大语言模型领域开辟新路径。
阿里巴巴全新发布的 Qwen 3 系列模型支持 119 种语言,采用混合思考模式,可根据任务需求灵活调整“思考预算”。该系列模型规模从 0.6 亿到 2350 亿参数不等,在编程、数学推理等多项测试中部分超越 OpenAI 与 Google 同类产品,且大部分模型将通过 Hugging Face 和 GitHub 开放下载。
想象一下,你有一辆非常省油的汽车(比如BitNet b1.58这样的1比特模型),但每次加油都必须使用高级燃油(8比特激活值)。虽然车辆本身很节能,但燃油成本仍然不低。这正是当前大语言模型面临的困境。
想象一下,你有一位智能助手,它能够理解各种视频内容并回答你的问题。你给它看一段关于中国传统节日的视频,问它"这个节日人们通常会吃什么食物?"。如果这个助手主要是"看过"西方文化背景的视频,它很可能会对中国文化相关的问题感到困惑。
想象你在一个拥挤的派对上。虽然房间里有50个人,但你不可能同时与所有人交谈。你的注意力自然会集中在几个关键人物身上——也许是你的朋友,或者正在讲有趣故事的人。大型语言模型(LLM)中的"稀疏注意力"机制正是基于类似原理:让模型只关注真正重要的信息,而忽略次要内容。
你有没有注意到,人类在面对复杂问题时会放慢思考速度,仔细推敲每个步骤?而在日常简单问题上,我们则可以快速直觉地给出答案。现代AI也在模仿这种"快思考"和"慢思考"的双系统思维模式。
想象一下,你正在看一部喜剧片。剧中角色面无表情地说:"我棒极了。"单看文字,你可能认为这是自信的表达。但如果你看到他说这话时翻了个白眼,用讽刺的语调,你立刻就会理解——这是在自嘲或嘲讽他人。这种理解需要同时分析文字内容、表情和语调。这正是多模态语言分析的核心:通过整合多种信息渠道(如文本、视频和音频),来理解人类交流中的高级语义。
想象一下,当你走在一条陌生的街道上,你会不自觉地移动你的头部和眼睛来感知周围的环境。你可能会抬头看看高楼,左右张望观察街道两侧的店铺,或者转身看看身后是否有车辆驶来。这种自然的观察方式实际上非常类似于电影中摄像机的运动方式。