德国TNG Technology Consulting公司基于DeepSeek R1-0528开发出新变体R1T2 Chimera,采用专家组装技术融合三个预训练模型。该模型在保持90%原版推理能力的同时,输出token数量减少60%,推理速度提升200%。新模型采用MIT开源许可,已在Hugging Face平台发布,为企业应用提供更高效的AI推理解决方案。
英超联赛与微软达成五年合作协议,将在官方应用中推出AI虚拟助手Premier League Companion。该工具基于Azure OpenAI技术,能回答球迷关于球员数据、比赛分析等问题,提供个性化内容推荐。这一举措旨在让球迷更多使用官方应用,同时为联赛获取更好的用户数据。全球体育联赛正掀起AI技术竞赛,通过智能工具增强球迷互动体验。
瑞典AI初创公司Lovable正在进行新一轮超1.5亿美元的融资,估值接近20亿美元。该公司专注于"氛围编程"领域,仅在今年2月完成1500万美元融资后数月就迎来估值大幅跃升。Lovable可通过文本提示构建完整网页应用,包括前端界面和数据库连接。公司去年11月发布产品,CEO称六个月内年经常性收入达5000万美元。近期还推出AI代理测试版,可自动执行代码编辑和调试等任务,采用基于使用量的收费模式。
MIT、哈佛和芝加哥大学研究人员提出"波将金理解"概念,用于描述大语言模型的新型失效模式。这些模型在概念基准测试中表现优异,但缺乏实际应用这些概念的真正理解能力。研究显示,模型能准确解释概念定义,却无法正确识别、生成或编辑相关实例。测试发现模型概念识别准确率达94.2%,但在实际应用中失败率高达40-55%。这种现象使基准测试结果产生误导性,表明AI距离真正的通用人工智能还有很长路要走。
MIT研究发现,使用生成式AI完成任务时,大脑运作方式与单纯依靠自身思考存在显著差异。研究显示,使用ChatGPT等工具的用户记忆力更差,神经连接活动减少,对所写内容的回忆能力明显下降。虽然AI工具能提高效率,但可能导致用户缺乏对知识的深度理解和掌控感。研究强调需要更多科学数据来了解AI使用对人类认知的长期影响。
Anthropic产品负责人Scott White分享了AI从简单代码补全工具发展为自主工作系统的快速演进。Claude 4在编程基准测试中达到72.5%的成绩,能够独立分析代码库、搜索文档并提交代码。诺和诺德等企业已将原本需要10周完成的临床报告工作缩短至10分钟。通过标准化的模型上下文协议,AI智能体正从简单的问答工具发展为能够自主追求目标的协作伙伴,从根本上改变企业的工作流程和效率。
Anthropic今日升级其Artifacts功能,为用户提供与Claude AI模型协作的实时专用工作空间。升级后用户可将AI功能直接嵌入创作中,转化为AI驱动应用。自功能推出以来,数百万用户已创建超5亿个作品,包括生产力应用和教育游戏。新功能支持创建"会思考"的应用,如记忆选择的游戏角色、智能导师等。用户可免费分享创作,任何Claude账户都可访问。
存储行业近期动态频繁,Arctera、Wasabi和TD SYNNEX联合推出渠道专属数据保护解决方案;AWS启用EC2环境SAN启动功能;Broadcom发布VMware Cloud Foundation 9.0版本;Commvault与Kyndryl合作提升网络弹性服务;CTERA成为首家支持模型上下文协议的混合云存储供应商;多家企业获得新一轮融资,推动AI基础设施和数据管理技术发展。
体验管理专家Qualtrics发布新AI功能Qualtrics Assist for CX,旨在缩短收集客户反馈与采取行动之间的差距。该副驾驶工具让管理者能直接探索客户体验数据,通过引导式洞察回答简单问题并提供数据支持的答案。公司每年处理12亿份调查数据,AI体验代理能理解客户需求并采取正确行动。然而调研显示,仅10%的组织能成功将体验数据转化为行动,澳洲高管在AI采用方面相对保守。
牛津大学研究发现,尽管大语言模型在医学考试中表现出色,但在实际应用中效果大打折扣。研究显示,LLM直接测试时能94.9%准确识别病症,但人类使用LLM诊断时准确率仅34.5%,甚至低于不使用AI的对照组。问题源于用户提供信息不完整、LLM理解偏差等人机交互问题。专家指出,仅凭非交互式基准测试评估LLM存在误导性,需要真实的人机交互测试才能准确评估AI系统的实际性能。
文章探讨企业搜索由单纯关键词匹配向语义理解及自主AI代理转变,通过向量搜索、知识图谱、NL2SQL与RAG技术,实现数据整合与高效决策。
Amazon旗下秘密研发机构Lab126新成立团队,专注在机器人上嵌入自主代理AI,实现通过自然语言完成复杂任务,从而提升仓储物流与配送效率,同时开发高精度地图技术。
OnePlus 推出多项 AI 功能,包括语音记录、翻译、智能拍照及屏幕录制,并通过全新 Plus Key 整合这些体验,将率先在印度市场的 OnePlus 13 系列手机中应用。
本文介绍了微软最新开源协议 NLWeb,它利用现有结构化数据,将网站转变为支持自然语言交互的 AI 应用,为企业构建 agentic AI 提供新路径,同时对比了当前其他 AI 协议的特性与优劣。
本文介绍了 Salesforce 推出专为金融服务设计的 Agentforce 平台预建 AI 模板,帮助银行、保险和理财等业务自动化,从而减轻专业人员的行政负担,提升客户体验。
文章介绍了 OpenAI 推出的全新编码系统 Codex,该系统可根据自然语言指令执行复杂编程任务,并引领从传统自动补全向自主完成编程任务转变,同时讨论了此类工具面临的挑战与未来发展前景。
宏碁在台湾Computex 2025展会上发布了一系列配备AI技术的穿戴及移动产品,包括健康监测戒指、实时翻译耳机和智能电动车,助力健康管理与便捷出行。
本文讨论了生成式人工智能如何通过逐步弱化名词的作用来重塑语言结构与现实认知,揭示品牌建设和人文沟通中的潜在风险及语义流失问题。
本文探讨技术进步如何促使人类从体力劳作向认知转变,从工业革命、数字时代到 AI 驱动下的全新认知迁移与自我重塑。