据TechCrunch报道,5月4日Databricks官方宣布完成对数据管理服务商Okera的收购,具体收购价未被披露。Okera致力于异构数据环境的大规模数据访问和治理管理领域,可为用户提供数据治理及访问软件产品。据Crunchbase的数据,Okera此前筹集近3000万美元。投资者包括Felicis、Bessemer Venture Partners、Cyber Mentor Fund、ClearSky和Emergent Ventures。

探寻大语言模型时代数据治理新方案,独角兽Databricks收购「Okera」

数据治理已经成为热门话题,人们对人工智能的普遍关注的同时,揭露了传统数据治理模式的缺陷。纵观历史,数据治理技术无论多么复杂,都依赖于特定的细腰结构(narrow-waist)实施控制,工作负载也因此受限于该结构。由于资产数量增长与AI环境变化速度极快,标准访问控制无法快速捕捉变化,传统模式在大型语言模型时代将不再适用。

Databricks由加州大学伯克利分校负责开发开源Apache Spark数据处理框架的团队于2013年创建,致力于提供基于 Spark 的云服务,可用于数据集成,数据管道等任务。该公司通过向企业销售基于云的数据挖掘和分析软件,去年收入超过 10 亿美元,最新估值已经达到 380 亿美元,超过 OpenAI 公司 290 亿美元的估值。

Databricks收购Okera的主要技术原因有两个。首先,Okera开发了新型人工智能驱动的系统——利用无代码接口自动发现、分类个人身份信息,并对其进行标记并应用相关功能,突破传统技术限制;其次,该系统的隔离技术支持在预算有限的情况下对任意工作负载实施治理控制。尽管这项技术仍处于内部预览阶段,但已经吸引很多关注。

Databricks计划将Okera的技术整合到其现有人工智能资产Unity Catalog中。同时,该公司指出,此次收购将使Databricks有能力公开更多的API,方便其数据治理合作伙伴利用新增API为客户提供解决方案。

通过此次收购,Databricks还邀请Okera联合创始人Nong Li加入团队。据悉,在创建Okera之前,Li是Databricks的一名工程师,创建了Apache Parquet数据存储格式。起初,他担任Okera首席技术官,并于2022年2月成为首席执行官。

Li在声明中写道:“随着数据在不同应用程序中的数量、速度和多样性不断增长,管理跨多个云的访问策略痛苦且耗时。许多组织没有足够的技术人才来大规模管理访问政策,他们需要一个现代的、以人工智能为中心的治理解决方案。希望我们能为世界上一些最具前瞻性的企业提供安全、可扩展和简单的治理解决方案。”