
图源摄图网
摘要:数字经济时代下, 数据成为新型生产要素. 然而, 普遍存在的数据质量问题严重制约着数据要素的价值释放, 甚至可能会演变成数字经济发展的"灰犀牛". 目前, 数据科学发展日新月异, 围绕数据质量的研究亟待进一步归纳总结, 以期有效地支撑数据管理实践和数据要素可信流通. 本文以系统化视角探寻数据质量发展脉络, 综合多种方法对于30多年来国内外相关文献进行梳理, 总结了研究所遵循的"内涵-理论-方法-应用"逻辑链条, 并构建了数据质量研究体系框架. 其次, 分别针对数据质量内涵及维度、理论基础发展、评估与优化方法、影响因素与价值作用四个方面进行回顾总结. 最后, 探讨数据质量研究发展趋势, 并对未来的发展方向提供一些洞察.
关键词:数据质量;数据要素;数字经济;研究述评
一、研究背景与意义
随着我国数据要素市场建设的加速推进和“人工智能+”战略的深入实施,夯实数据质量的理论基础尤为必要。从已有文献来看,学术界目前更加关注数字技术和数据应用的创新研究缺乏对数据质量理论和方法的深入梳理和归纳总结。虽然部分学者对数据质量研究进行过一系列探讨,但数据质量的内涵和外延不断拓展,关于数据质量理论的演进逻辑尚不明晰,相关研究仍存在改进空间。
本研究期望为组织开展数据质量管理实践提供理论和方法支持;另一方面,希望引起更多国内学者从中国情境出发,关注和探讨新环境下的数据质量问题,并加快数据质量前沿研究布局,夯实我国数字经济高质量发展根基。
二、主要内容
立足上述背景,本文秉承系统思维,基于文献计量法, 对数据质量研究开展回顾和述评,对以下问题进行了研究:数据质量内涵及维度,数据质量研究的历史脉络、关注的主题和研究体系框架,数据质量的理论与方法,数据质量未来研究展望。
三、主要结论及政策建议
数据质量研究历经概念界定与探索阶段、模型与技术发展阶段、场景应用深化阶段。研究主要围绕以下4个方面开展:数据质量的内涵与维度划分问题研究、数据质量理论问题研究、数据质量方法问题研究、数据质量应用研究,四个方面研究遵循“内涵—理论—方法—应用”的逻辑链条,推动数据质量领域不断发展创新。相关研究覆盖了计算机科学、管理学、经济学等多个学科领域,涌现出元素、产品、资源三种不同的研究视角。
随着全球迈入数字经济时代,数据作为一种生产要素已成共识。数据质量作为数据要素价值释放的“牛鼻子”,须提前布局,主动应对。数据质量管理是一个系统性问题,需要针对数据质量问题的诱发因素,妥善解决数据工作中存在的系列问题,通过建立健全法律制度,加快推进行业数据质量标准化体系建设,强化事前事中事后数据质量管理,加快推进数据质量领域关键技术攻关,加大数据质量人才培养力度,做到“标本兼治”,推动存量数据质量有效改善,增量数据及时准确。
四、边际贡献与未来拓展
本文主要贡献在于:首先,在全面梳理近30年国内外数据质量研究的基础上,构建了数据质量研究框架,厘清了数据质量研究的创新规律;其次,通过对数据质量理论发展脉络的梳理和特征提炼,探究了数据质量理论的演进逻辑,明晰了数据质量研究视角深化的发展方向;最后,本文从理论和实践角度分析了数据质量未来研究方向,探讨了新时期数据质量待解决的“卡脖子”问题。一方面,本研究期望为组织开展数据质量管理实践提供理论和方法支持;另一方面,希望引起更多国内学者从中国情境出发,关注和探讨新环境下的数据质量问题,并加快数据质量前沿研究布局,夯实我国数字经济高质量发展根基。
在我国着力推进“数字中国”建设,推动数据要素流通交易的时代背景下,数据的本身形态、发展环境、处理技术、应用需求不断革新,许多重要问题值得研究,包括数据质量内涵革新及维度拓展研究、中国情境下的数据质量理论研究、多模态数据和新一代数字技术引发评估与优化方法创新研究、面向数据要素流通场景的数据质量价值作用研究。
五、写作、投稿过程的心得体会
在数字经济蓬勃发展的当下,广泛存在的数据质量问题成为阻碍数据要素价值充分释放的瓶颈。对相关研究进行系统归纳与总结具有迫切的现实需求和重要意义。团队采用系统化的研究视角,深入探寻数据质量的发展脉络,提炼形成了数据质量研究体系框架,并给出了未来方向,希望能吸引更多的学者和专家关注到数据质量研究,共同开拓这片充满无限可能的学术蓝海。投稿之后,论文评审过程中收到编辑部老师和审稿专家建设性的修改建议,为团队提供了宝贵的改进方向。在此特向编辑部老师和审稿专家表示诚挚谢意!
本文摘编自《系统工程理论与实践》2025年,第45卷,第7期论文《数字经济发展根基: 数据质量研究述评与未来展望》(点击题目链接全文);
作者:刘祺1, 2, 副研究员, 博士, 研究方向: 信息管理;黄君义1, 博士研究生, 研究方向: 大数据分析与人工智能管理;冯耕中1, 2,*(通信作者), 博士, 教授, 研究方向: 供应链管理与决策优化;汪寿阳3, 4,研究员, 博士, 研究方向: 经济预测, 金融风险管理
1. 西安交通大学 管理学院, 西安 710049
2. 过程管理与效率工程教育部重点实验室, 西安 710049
3. 中国科学院 数学与系统科学研究院, 北京 100190
4. 中国科学院 预测科学研究中心, 北京 100190