研究人员提出SharpZO混合优化方法,解决资源受限边缘设备上视觉语言模型微调难题。该方法采用双阶段优化:全局探索阶段使用进化策略平滑损失景观,局部搜索阶段使用零阶优化抑制梯度估计异常值。实验显示,相比传统前向传播方法,准确率提升最高7%,收敛速度显著加快,同时避免梯度存储大幅降低内存占用。