在现代数据栈的背景下,数据质量空间从 2020 年的小众类别发展到过去 18 个月内完全爆发。2021 年,有 2 亿美元的资金流入该空间,这实在是令人难以置信。G2 在他们最近的“ What Is in the Data in 2022”这篇文章中指出,2022 年将会是数据质量占据主导地位。他们在 2021 年察觉到数据质量类别的流量大幅上升,这是一个不同寻常的趋势。
在现代云数据基础设施的大环境中,数据质量类别的兴起具有重要意义。数据质量是任何现代数据驱动型公司的基础,涵盖普通报告、商业智能、运营分析以及高级机器学习等方面。2022 年的《State of Data》调查显示,数据质量和验证是调查对象(主要是数据工程师)提及的首要挑战。调查对象中有 27%不确定他们的组织使用何种(若有)数据质量解决方案。在成熟度低的组织中,这一比例上升到了 39%。