最新文章
南洋理工大学重磅突破:AI图像编辑的"调色板革命"让人人都能成为修图大师

南洋理工大学重磅突破:AI图像编辑的"调色板革命"让人人都能成为修图大师

这项由南洋理工大学研究团队开发的DragFlow技术,首次实现了在先进AI模型FLUX上的高质量区域级图像编辑。通过创新的区域监督、硬约束背景保护和适配器增强等技术,将传统点对点编辑升级为更自然的区域编辑模式,在多项基准测试中显著超越现有方法,为图像编辑技术带来革命性突破。

苹果公司突破性研究:用AI推理技术解决大模型"胡说八道"问题

苹果公司突破性研究:用AI推理技术解决大模型"胡说八道"问题

苹果公司联合台湾大学开发的RL4HS系统,首次将强化学习应用于训练AI识别文本中的虚假信息片段。该系统让AI学会侦探式推理,能精确定位AI生成内容中的错误部分,而非简单的对错判断。实验显示,7B参数的RL4HS模型在多项任务中超越了更大规模的通用推理模型,甚至优于GPT-4等商业模型,为解决AI"幻觉"问题提供了新的技术路径。

华盛顿大学和IBM联合发布TOUCAN:1.5万亿条AI智能体训练数据,模型工具使用能力大幅提升

华盛顿大学和IBM联合发布TOUCAN:1.5万亿条AI智能体训练数据,模型工具使用能力大幅提升

华盛顿大学和IBM联合发布TOUCAN数据集,包含150万条高质量AI工具使用训练轨迹,基于495个真实MCP服务器生成。通过创新的五阶段数据生成流水线和三大扩展机制,TOUCAN让AI在真实环境中学习工具使用,而非依赖模拟数据。实验显示经过TOUCAN训练的模型显著超越了更大规模的闭源模型,代表了AI训练范式的重要突破。

香港科技大学:AI图像生成迎来"信心革命",一个会"察言观色"的智能系统让画质提升15%

香港科技大学:AI图像生成迎来"信心革命",一个会"察言观色"的智能系统让画质提升15%

香港科技大学团队开发的ScalingAR系统通过实时监测AI绘画过程中的"信心状态",首次实现了图像生成的智能过程控制。该系统采用双通道信心评估机制,能够在提升图像质量12.5%-15.2%的同时降低62%的计算消耗,为AI图像生成领域带来了质量与效率的双重突破。

UC圣迭戈分校研发新模型:让AI视频理解媲美人类,只需4%计算资源

UC圣迭戈分校研发新模型:让AI视频理解媲美人类,只需4%计算资源

UC圣迭戈分校研发VideoNSA模型,采用创新的三重稀疏注意机制,仅用传统方法3.6%计算资源就实现更优视频理解性能。该技术通过压缩、选择和滑动窗口三个分支协同工作,能处理超万帧视频内容,在长视频理解、时间推理等任务上表现卓越,为智能监控、自动驾驶、在线教育等领域带来重大应用前景,标志着视频AI从高成本向普及化转变的重要突破。

中国科大突破:让AI学会拼图,意外发现视觉推理新天地

中国科大突破:让AI学会拼图,意外发现视觉推理新天地

这项研究还为我们提供了一个重要的启示:有时候最好的训练方法不是直接针对目标任务,而是通过精心设计的代理任务来间接提升能力。这种思路在人类教育中也很常见,比如通过音乐训练来提升数学能力,通过体育运动来培养团队合作精神。在AI训练中,拼图任务就扮演了这样一个代理任务的角色,通过培养基础的视觉感知和空间推理能力,间接提升了模型在各种视觉任务上的表现。

VUNO团队重磅突破:AI如何像老医生一样读懂胸部X光片的前世今生

VUNO团队重磅突破:AI如何像老医生一样读懂胸部X光片的前世今生

韩国VUNO公司联合KAIST等机构开发出革命性医学AI系统C-SRRG,首次让AI能像经验丰富的放射科医生一样综合分析患者完整病史。该系统整合多角度X光片、症状描述、技术参数和历史记录四种信息,在三个顶级医学AI模型上验证显示诊断准确性大幅提升,AI幻觉现象显著减少,为医学AI从单纯图像识别向临床推理的转变奠定了重要基础。

苏黎世联邦理工学院:AI画家再也不会把猫画成狗了——让多主体图像生成告别"张冠李戴"

苏黎世联邦理工学院:AI画家再也不会把猫画成狗了——让多主体图像生成告别"张冠李戴"

苏黎世联邦理工学院研究团队提出FOCUS技术,基于最优控制理论解决AI图像生成中的多主体纠缠问题。该方法通过控制注意力分配机制,防止不同主体特征混淆、身份纠缠和主体遗漏。提供测试时控制和轻量级训练两种方案,在主流模型上验证有效,显著提升多主体场景生成质量的同时保持原有艺术风格,为AI辅助创作开辟新路径。

AI红队攻击新突破:乔治亚理工学院团队让人工智能学会"策略性对话"破解安全防线

AI红队攻击新突破:乔治亚理工学院团队让人工智能学会"策略性对话"破解安全防线

这项由乔治亚理工学院和甲骨文公司合作完成的研究首次提出DIALTREE-RPO方法,通过多轮策略性对话实现AI攻击,成功率比现有方法提高25.9%。研究发现现有AI安全机制在面对多轮攻击时存在重大盲点,揭示了从单次检测向多轮行为分析转变的必要性,为AI安全领域提供了重要启示和新的研究方向。

2025-10-28

PTC:高科技企业数字化转型的4个案例

在快速演变的高科技产业格局中,企业正越来越多地寻求创新解决方案来优化流程、增强协作并提升效率。以下笔者将通过四个领先的高科技企业成功实现数字化转型的案例。

亚马逊将从Rivian分拆公司Also采购数千辆助力货运车

亚马逊将从Rivian分拆公司Also采购数千辆助力货运车

Rivian分拆公司Also与亚马逊达成多年合作协议,将为这家电商巨头提供数千辆新型踏板助力四轮货运车TM-Q。该车辆载重超过400磅,体积小巧可使用自行车道。双方将合作定制车辆以满足亚马逊在欧美的配送需求,预计2026年春季投入使用。Also从Rivian内部项目发展而来,今年独立融资1.05亿美元,将利用可拆卸电池技术和专业物流软件为密集城区提供最后一公里配送解决方案。

Accel与Prosus联手支持印度早期创业公司

Accel与Prosus联手支持印度早期创业公司

知名投资机构Accel和Prosus宣布建立新的投资合作伙伴关系,专门支持印度初创企业从零开始发展,重点关注那些能够为南亚地区大众提供大规模解决方案的创始人。这是Prosus首次在企业成立阶段进行投资。双方将从创业公司最早期开始共同投资,专注于解决自动化、能源转型、互联网服务和制造业等领域的系统性挑战,初始投资金额从10万到100万美元不等。

CIO们在AI时代最看重新员工的哪些能力

CIO们在AI时代最看重新员工的哪些能力

随着AI在各行业深度应用,传统的"学会编程"建议已不再适用。UCLA等机构的CIO表示,现在更看重候选人的批判性思维、问题解决能力和适应技术变化的敏捷性。新毕业生需要展现AI素养、数据理解能力、云技术expertise和安全意识。编程岗位演变为更具战略性的角色,类似指挥家协调AI工具。入门级职位因自动化而减少,求职者需具备更高技能水平,能够与AI协作而非被其取代。

LockBit 5.0扩大攻击范围,勒索软件威胁持续升级

LockBit 5.0扩大攻击范围,勒索软件威胁持续升级

9月份LockBit勒索软件新版本的幕后操作者大幅扩大了攻击目标,整体勒索软件攻击激增超过四分之一。NCC集团报告显示攻击量六个月来首次上升28%至421起事件。尽管LockBit曾在Operation Cronos行动中被重创,但其管理员LockBitSupp持续活动。LockBit 5.0新增多平台支持、增强反分析功能、更快加密速度等特性,9月份至少造成十几个受害者,标志着该组织运营恢复。

AI时代的身体黑客:病理学新发现

AI时代的身体黑客:病理学新发现

随着AI技术的发展,我们对细胞病理学的认识大幅提升。研究发现,病毒等慢性病原体如"身体黑客"般潜伏在人体内,劫持细胞代谢、干扰基因表达,甚至驱动衰老过程。这些病原体从线粒体中窃取原料为己所用,破坏细胞正常功能。专家建议,在进行基因编辑等先进治疗前,应优先利用AI诊断技术识别和控制这些持续性病原体,开发新的抗病原体疗法,将病原体活动纳入衰老模型中。

COI Energy解决企业售电难题:让闲置电力变现

COI Energy解决企业售电难题:让闲置电力变现

COI Energy创新性地解决了大型企业园区电力分配的老旧问题。传统模式下企业需按最大用电需求购买月度电力容量,即使很少达到峰值使用量。该公司开发了专利能源网关设备,通过大数据预测企业90天内的实际用电需求,让企业在平台上出售闲置电力容量给其他买家。目前已在加州等四个州运营,服务五个试点客户,并承诺将企业节省资金的1%捐赠给帮助弱势群体的能源公益组织。

高通发布AI加速器并计划部署在神秘机架系统中

高通发布AI加速器并计划部署在神秘机架系统中

高通发布了面向AI数据中心市场的AI200和AI250加速器卡片。AI200支持每卡768GB LPDDR内存,AI250采用近存储计算架构,将在推理工作负载中实现10倍以上的有效内存带宽提升和更低功耗。产品将以预配置机架形式交付,采用直接液冷、PCIe扩展和以太网连接。沙特AI公司Humain已成为首个客户,计划从2026年开始部署200兆瓦的高通AI解决方案。

变形金刚"学会"分子结构:加州大学伯克利分校团队让AI不用图谱也能预测化学反应

变形金刚"学会"分子结构:加州大学伯克利分校团队让AI不用图谱也能预测化学反应

加州大学伯克利分校研究团队成功让Transformer AI直接从原子三维坐标学习分子结构,无需传统的分子图谱。10亿参数模型在OMol25数据集上的表现可媲美先进图神经网络,且运行更快。AI自发学会了距离-相互作用关系,并能根据分子环境自适应调整关注范围。研究验证了分子AI的规模定律,暗示更大模型将带来更好性能。这项工作为分子建模提供了全新范式,有望推动药物设计和材料科学发展。

MediaTek Research重新定义神经网络:颠覆传统的"沙漏"MLP架构让AI更聪明

MediaTek Research重新定义神经网络:颠覆传统的"沙漏"MLP架构让AI更聪明

MediaTek Research团队提出颠覆性"沙漏"MLP架构,将传统"窄-宽-窄"设计反转为"宽-窄-宽",在高维空间进行渐进改进。通过固定随机投影技术,新架构在多项生成任务中显著优于传统设计,用更少参数实现更好性能。研究验证了高维空间增量学习的优越性,为神经网络设计开辟新思路,并展示了向变换器等架构扩展的潜力。

机器人会思考了?GigaAI团队的VLA-R1让机器人像人一样推理后再行动

机器人会思考了?GigaAI团队的VLA-R1让机器人像人一样推理后再行动

GigaAI团队联合中科院和清华大学开发的VLA-R1模型,首次让机器人具备了类人推理能力。该系统采用链式思维机制和可验证奖励强化学习方法,能够在执行任务前进行深度分析和规划。在标准测试中,VLA-R1的目标识别准确率提升17.78%,轨迹规划误差降低17.25%,在真实环境中的成功率达到62.5%-75%,为智能机器人的实际应用奠定了重要基础。