Snowflake 全面拥抱开源:深化 Iceberg 支持,构建 AI 互操作性
创始人
2026-04-10 22:34:18
0

Snowflake 周三正式宣布,将进一步扩大对 Apache Iceberg 的支持,计划兼容该开源表格式的最新版本。这一举措旨在打破系统壁垒,提升数据互操作性,使其更好地服务于人工智能应用。

此外,Snowflake 重申了其对开源技术的坚定承诺。公司指出,近期开源的 pg_lake(PostgreSQL 数据库扩展,用于简化交易数据与分析数据的集成)以及参与 Apache Polaris 数据目录、OpenLineage 标准和语义建模开源标准的开发,都是这一战略的重要组成部分。

Snowflake 致力于通过这些开源项目,实现跨系统的数据互操作性,从而更高效地集成数据并赋能 AI 与分析应用。

唯有拥抱开源才能获得数据自主权

Snowflake全力拥抱开源,不只是为迎合技术趋势,也是客户需求推动的结果。

“Snowflake 参与开源生态对客户至关重要,因为它直接应对了数据碎片化带来的成本飙升,并解锁了真正的数据自主权。”William McKnight,McKnight Consulting 总裁,介绍了企业极力拥抱开源的初衷。

如果没有对开放互操作性的承诺,客户将面临庞大的数据管道、支离破碎的治理层以及复杂的安全风险,这无异于支付沉重的“架构税”。

Omdia(Informa TechTarget 旗下部门)分析师 Stephen Catanzano 也强调了 Snowflake 拥抱开源工具的价值:“这种做法赋予了用户在跨平台和引擎管理数据时的灵活性与自由,既减少了厂商锁定,又让客户能继续享受 Snowflake 的先进能力。这正是当前客户所期望的。”

深化 Apache Iceberg 支持

Apache Iceberg 是一种开源表格式,专为在数据湖和湖仓中存储大型数据集而设计。与文件格式不同,Iceberg 在数据文件之上提供了一层逻辑结构(行和列),允许用户添加元数据和语义信息,极大地便利了 AI 和分析数据的管理与发现。

从有限支持到全面兼容:Snowflake 于 2022 年首次提供对 Iceberg 的有限支持,当时仅涵盖治理和安全等核心功能。用户被迫在“Snowflake的完整功能”和“开放表的灵活性”之间做选择。直到 2025 年 4 月,Snowflake 才实现了对 Iceberg 的全面支持,将查询性能、数据共享和治理功能完全覆盖到Iceberg 表中。

迈向 V3 版本:此前 Iceberg 的最新版本是 2021 年发布的 V2。现在,Snowflake 计划支持 2025 年 6 月发布的 Iceberg V3。

V3 的新特性:扩展了对半结构化数据、行级变更数据捕获 (CDC)、地理空间数据以及纳秒级时间戳的支持,能更精准地识别事件或交易发生的瞬间。

Stephen Catanzano 评价道:“支持 Iceberg V3 是一个重要的里程碑。这些能力提升了性能,支持更精细的数据管理,并开启了高频和复杂数据环境下的新用例。特别是对于 AI 代理所需的结构化、半结构化甚至非结构化数据,Iceberg 都能提供支持。”

William McKnight 则指出,支持 V3 是保持竞争力的关键:“V3 是最新标准,如果你支持 Iceberg,就必须支持它。这进一步推动了 Iceberg 的市场渗透。”

广泛的开源生态布局

除了即将支持 Iceberg V3,Snowflake 还在与开源社区合作,推进数据集成、治理、质量和发现等多个领域的项目:

pg_lake:2025 年 11 月开源。它消除了构建复杂 ETL 流水线的需求,弥合了事务性 PostgreSQL 数据与分析性 Iceberg 表之间的鸿沟。

ApachePolaris 目录:2024 年由 Snowflake 开发并开源。这是一个供应商中立的数据目录,专为Iceberg 设计,可与 Snowflake Horizon、AWS Glue 等专有目录集成。

其他项目:包括旨在建立语义建模开放标准的 Open Semantic Interchange,以及创建数据流动开放标准的 OpenLineage。Snowflake 还在参与开发 Iceberg V4,以提升流数据工作负载的支持。

Snowflake 产品管理总监 James Rowland-Jones 介绍,大约两年前,公司从单纯的开源技术“消费者”转变为重要的“贡献者”。

“我们认为开放性是企业数据和 AI 未来的关键,”Rowland-Jones 表示,“当互操作性运作良好时,客户能够自由地从任何引擎操作他们的数据。”

为 AI 构建开放基石

Rowland-Jones 强调,随着企业加大对 AI 的投入,Snowflake 的重点是帮助客户基于开放、互操作的数据基础构建和扩展 AI 项目。

客户驱动:推动这些开源工作的动力主要来自客户反馈。随着组织从 AI 实验转向生产环境,数据孤岛和分散架构成为主要障碍,“在 AI 时代,互操作性已不再是可选项”。

治理与安全:McKnight 指出,仅靠开放格式不足以实现数据自主,像 Polaris 这样的目录对于维持治理和业务环境至关重要。

简化流程:Catanzano 认为 pg_lake 极具价值,因为它无需复杂的 ETL 流程即可桥接交易数据和分析数据集,这对许多组织来说是颠覆性的变革。

结论:

McKnight 和 Catanzano 一致认为,Snowflake 持续参与开源开发(如 Iceberg 下一代标准、语义建模和数据血缘标准)不仅对现有客户有价值,也将巩固其作为开放数据生态系统领导者的地位,并吸引新的开源用户。

相关内容

热门资讯

投资界AI周报 | 阿里诞生一... 本周必读AI投资动态周报投资方:阿里云领投,中网投,九安海棠,好未来,光合创投等投资人战略投资,星连...
AI电力需求攀升,巨头押注核能... 随着人工智能产业对电力需求的快速攀升,全球科技巨头正通过资本投入与合作协议,推动小型模块化反应堆(S...
鸿合科技:公司以AI技术为核心... 证券之星消息,鸿合科技(002955)04月10日在投资者关系平台上答复投资者关心的问题。投资者提问...
AI+呼吸机、AI+轮椅……C... 第93届中国国际医疗器械博览会(CMEF)日前在沪举行。作为“十五五”规划开局之年首场全球医疗旗舰展...
AI 营销,到底改变了什么 没有真正接入生产数据的AI营销工具越多,流程越低效作者|Cynthia编辑|郑玄最近有一个感受,AI...
Snowflake 全面拥抱开... Snowflake周三正式宣布,将进一步扩大对ApacheIceberg的支持,计划兼容该开源表格式...
4月10日兆丰股份涨5.05%... 证券之星消息,4月10日兆丰股份(300695)涨5.05%,收盘报72.0元,换手率1.96%,成...
梁文锋称DeepSeek V4... PChome4月10日消息,据《创智记》从多位知情人士处获悉,DeepSeek创始人梁文锋近日在内部...
法国政府将放弃微软Window... IT之家4月10日消息,据科技媒体Tom'sHardware今天报道,法国政府数字化部门DINUM本...
大疆 Pocket 4 将在 ... Anthropic推出ClaudeManagedAgents公开测试版,AIAgent开发和部署一站...