吴晓锋, 金颖, 谭言, 袁梦, 任鑫, 张朝辉, 魏明明, 孙哲
上海船舶运输科学研究所学报. 2025, 48(4): 63-70.
针对传统数据质量治理方法在效率、覆盖度和适应性等方面存在的不足,提出一种基于智能算法的数据质量规则自动推荐方法。通过构建动态演化的企业级数据资产特征库,融合基于相似度计算的准确性规则匹配算法与基于血缘分析的时效性规则预测算法,实现从元数据提取到规则生成再到规则推荐落地的全流程自动化处理。该研究的核心创新点包括:建立多维度特征抽取机制,支持结构化属性、业务语义和数据血缘统一建模;设计双算法协同推荐策略,分别解决结构性质量问题和时效性约束问题;开发轻量化推荐引擎组件,实现与现有数据中台系统的无缝集成。目前该方法已在某集团大数据平台和供应链协同业务平台上应用,结果显示其能使单条规则的平均生成时间缩短至10 s以内,整体规则配置效率相比传统人工方式提升约5倍,推动数据质量治理由“人工经验驱动”转变为“智能算法驱动”,具有良好的实用性和可推广性。