Snowflake推出客户端连接器,支持在其云数据仓库中直接运行Apache Spark代码,无需集群设置。该方案基于Spark Connect的客户端-服务器架构,让用户可以使用Spark客户端连接Snowflake分析引擎。据称,预览用户的代码运行性能平均提升5.6倍,成本降低约40%。此举体现了数据湖和数据仓库市场的融合趋势。
Databricks 开源了其核心声明式 ETL 框架——Apache Spark Declarative Pipelines(原 Delta Live Tables),简化了批量和流式数据处理,显著缩短开发和维护时间,并将这一技术普惠于整个 Apache Spark 社区,同时向 Snowflake 发起挑战,提供从数据源到可用信息的全流程处理能力。