尽管谷歌AlphaFold在2021年带来突破,但医药AI发展正面临数据瓶颈。在BIO 2025大会上,业界领袖指出,AI在蛋白质领域成功源于丰富的历史数据,而临床试验等领域数据稀缺成为主要挑战。医药公司正将AI应用于研发全链条,从靶点识别到临床试验优化,但需要专业团队和数据支撑。行业合作模式也在转变,从服务供应商关系转向深度合作伙伴关系。专家提醒,AI应用需平衡速度与质量,确保程序的严谨性。
哈尔滨工业大学团队开发的Optimus-3是首个在Minecraft环境中具备完整认知能力的AI系统,能够同时处理感知、规划、行动、定位和反思五大任务。该系统采用专家混合架构和任务级路由机制,有效解决了多任务学习中的干扰问题,并通过多模态推理增强强化学习显著提升了视觉相关任务的表现。实验结果显示,Optimus-3在各项任务上均超越了现有最先进系统,为通用人工智能的发展提供了重要技术路径。
随着AI快速重塑商业格局,企业领导者被迫重新审视人性化管理的价值。长期以来,管理者专注于数据优化和效率提升,却忽视了信任、创造力、同理心等人文要素。AI的发展并非威胁人性,而是提供了重新平衡的机会。混合智能结合人工智能与人类智慧,创造出更可持续、创新和可信的结果。领导者需要培养双重素养:既要理解AI技术能力,更要深刻认识人性化管理的独特价值,从而打造真正服务于人类福祉的组织。
香港科技大学团队提出PosterCraft统一框架,通过四阶段训练流程实现高质量美学海报端到端生成。该方法摒弃传统模块化设计,采用整体性创作思路,在文字准确性和视觉美感方面显著超越现有开源模型,接近商业系统水平,为AI创意设计领域带来重要突破。
字节跳动Seed团队推出的Seedance 1.0是一个突破性的AI视频生成模型,能够根据文字描述或静态图片快速生成高质量视频。
新加坡国立大学研究团队通过分析150多篇相关论文,首次建立了评估提示词质量的21属性框架。研究发现当前提示词研究存在严重不平衡,某些模型和任务被过度关注。通过969个高质量提示词样本分析,团队发现属性间存在强关联性。实验显示单一属性优化往往比多属性组合效果更佳,且用属性增强数据训练的模型表现显著提升。
下一波数字化转型浪潮由智能体AI驱动。与简单回答问题或生成内容不同,AI智能体能够以最少的人工干预执行复杂的多步骤任务。它们可以执行从日常任务协助到创建和自动化新业务流程的广泛任务。最好的是几乎任何人都能做到这一点,因为智能体可以使用与ChatGPT交互相同的无代码自然语言过程来构建。
宾州大学与Adobe联合推出LAMP-CAP数据集,首次实现多模态个性化图表说明生成。通过分析同一论文中的参考图表,AI能学习作者独特写作风格。实验显示,视觉信息对个性化效果贡献巨大,参考资料越相似效果越好。这项研究为学术写作助手开发奠定基础,预示着未来AI将更好地适应个人表达习惯。
中国AI初创公司MiniMax发布最新开源大语言模型MiniMax-M1,采用Apache 2.0许可证,支持商业应用。该模型拥有100万输入token和8万输出token的超大上下文窗口,采用创新的混合专家架构和强化学习技术。训练成本仅53.47万美元,计算效率比DeepSeek R1高75%。在数学竞赛等基准测试中表现优异,为企业提供了高性能、低成本的AI解决方案。
这项由上海人工智能实验室、南京大学和中科院深圳先进技术研究院联合完成的研究,开发了全球首个专门测试AI长视频推理能力的评估平台VRBench。该平台包含1010个多语言长视频和超过9000个多步推理问答对,创新性地采用双重评估机制,既测试AI的答案准确性,也评估推理过程质量。测试结果显示,即使是最先进的AI模型在复杂视频推理任务上仍存在显著不足,特别是推理过程的可靠性方面。
企业数据基础设施正从回答"发生了什么"转向支持AI实时决策。传统架构无法满足AI对语义理解的需求,知识图谱通过节点和边的方式组织信息,提供实体间的关系和上下文。谷歌十多年的知识图谱实践表明,从"字符串到实体"的转变是现代AI的核心特征。随着智能代理AI的发展,知识图谱将作为智能层为自主代理提供上下文支持。
韩国KAIST团队首次提出文字感知图像修复技术,解决了传统图像修复无法准确恢复文字内容的难题。研究构建了包含10万张图像的SA-Text数据集,开发了TeReDiff模型,通过三阶段训练和智能提示机制,实现图像修复与文字识别的协同工作。实验显示该技术在文字识别准确率上比传统方法提升15-20%,为历史文献保护、档案数字化等领域提供了重要解决方案。