OpenLineage Specification, LF AI & Data Foundation, 2023 (LF AI & Data Foundation) - 定义了一个开放标准,用于收集和管理来自各种数据系统的元数据,适用于复杂分布式数据管道。
Data Governance for Machine Learning: A Survey, Shaghayegh Ebrahimi, Marinka Zitnik, Daniel F. M. S. de R. P. E, Peter F. E, 2020ACM Computing Surveys, Vol. 53 (Association for Computing Machinery (ACM))DOI: 10.1145/3375883 - 一项关于机器学习系统中数据治理挑战和解决方案的调查,涉及数据质量、隐私和可解释性。
DataHub: A Metadata Platform for the Modern Data Stack, Shirshanka Das, John Ma, Pedro Silva, Andy Su, Bo Fu, Hichel Lammas, Kevin Liu, Mark Mamon, Mike Minami, Roy Xue, Sethu Raman, Yingjun Wu, David Lee, 2020ACM SIGMOD Record, Vol. 49 (Association for Computing Machinery (ACM))DOI: 10.1145/3444453.3444465 - 描述了DataHub作为元数据平台的架构和功能,支持大型数据环境中的数据发现、治理和血缘。