DVC 是一个开源版本控制系统,专为数据科学和机器学习项目设计。它提供类似 Git 的体验,帮助用户组织数据、模型和实验。DVC 支持大规模数据管理,确保实验的可重复性,并能在几秒钟内过滤数十亿个样本。此外,用户可以通过查询创建数据集。DVC 是免费且永久开源的,支持管理和版本控制图像、音频、视频和文本文件,并将机器学习建模过程组织成可重复的工作流程。