【例会预告】
会议名称:数据科学与创新管理团队例会
会议时间:2026年4月29日(周三)晚上19:00-21:00
会议地点: 经管楼609会议室
汇报人:李虎峰
汇报题目:
《对DAC方法的几点再补充》
汇报摘要:
在相较于传统的实证、案例等研究方法,数据驱动分析方法(Data-driven Analysis for studying the influence mechanism of Complex factors,DAC)综合了定量和定性研究的优势,通过机器学习的方法研究复杂系统关键核心因素的机制。有助于提供基于企业异质性的高度细分的管理建议,通过CART决策树有助于理解要素间存在的高阶交互作用。在前序的汇报中,针对DAC方法的异质性分析、决策树结果的稳健性,决策树得到路径的显著性等问题开展了一些探讨。(2025年11月20日例会预告-李虎峰《一种基于DAC方法的统计学检验思路》)
然而,在整个DAC执行流程中,仍然存在一些不可忽视的问题,例如,在K-Means聚类过程中,由于随机初始种子的设定,我们每次聚类得到的结果往往并不稳健,尤其是针对一些本身分类就较为模糊的点,不同聚类批次可能存在较大的差池。另一方面,在通过爬山算法等方法构建贝叶斯网络的过程中,对连续变量的离散化分箱方式可能也会对结果产生一些的影响。因此,还需要探讨更加稳健的聚类方式(从数据或是算法层面进行优化),并对贝叶斯网络的结果进行进一步的稳健性检验(MNLogistic回归和针对网络结果的安慰剂检验),对方法进行进一步的补充,同时研究使用了GeNIe软件分析贝叶斯网络结果,能够得到信息更加丰富的分析内容。

图1 基于GeNIe软件构建的贝叶斯网络

图2 目前对DAC方法的内容补充