摘要: 为推动数据交易与数据市场的发展,解决传统数据评估方法在成本和计算复杂性方面的挑战,本文提出了一种新的基于因果推断的数据增量价值评估方法——数据合成控制法(data synthetic control method,DSCM)。DSCM从数据买方视角出发,将新增数据视为一项干预,创新性地构建反事实推断框架,以精准量化新增数据对监督学习模型性能的贡献。在仿真数据实验中,DSCM对不同模型的数据价值估计与实际数据价值高度吻合,平均误差仅为0.0032。在广告点击预测实际应用中,DSCM对用户中心数据价值的估计与实际价值的平均误差率仅为9%,显著优于传统评估方法。这表明DSCM能够提供准确、稳定的数据价值评估,有效支持企业的数据驱动决策。
中图分类号: