北京师范大学统计学院郭旭教授团队在高维统计推断领域取得系列重要成果
统计学院郭旭教授团队长期致力于高维统计推断领域的前沿研究,并取得了系列重要成果。近期,团队撰写的三篇学术论文发表在统计学国际顶尖期刊Journal of the American Statistical Association(简称JASA),郭旭均为第一作者或通讯作者。
目前针对高维统计推断问题所发展的统计方法大多建立在特定的参数模型之下。如果模型设定错误,那么基于错误设定的模型所建立的推断方法就可能得出错误的结论。鉴于此,郭旭及合作者提出模型自由的统计推断方法。他们首先借助充分性降维理论将原始的假设检验问题进行重表达,发现在假定自变量服从椭球分布或者其他类似条件下,原始的假设检验问题可转化为检验一个系数向量是否为零的问题。他们借助正交化思想提出了适当的统计量,并得出了所提统计量在原假设和局部备择假设下的渐近分布。他们进一步研究了多重假设检验问题,用以在控制错误发现率的基础上识别重要的自变量。最后他们提出了相应的错误率控制方法,并证明了所提方法能够渐近地控制错误发现率。
为避免上一研究中所采用的分布假定,郭旭及合作者进一步基于机器学习算法进行了模型自由的统计推断研究。机器学习算法的黑箱特性给相应的推断问题带来了挑战,对此一种典型的处理思路是样本分割策略,即用一部分数据训练模型,而用另一部分数据构造统计量进行统计推断。但这一策略面临严峻的理论挑战。实际上现有方法在原假设下存在渐近分布退化问题,这导致我们无法进行有效的推断。郭旭及合作者通过比较响应变量变换的条件期望和无条件期望构造了检验统计量,并得出了所提统计量的渐近分布。他们进一步发现现有统计量在原假设下的退化现象可被用来提高统计量在备择假设下的功效表现,并基于此提出了功效提升算法。在拒绝原假设之后,他们又提出了偏广义相关度量。他们考察了该度量的一些性质,并利用机器学习算法对它进行了估计。理论上建立了所提估计量的渐近正态性并基于此构造了置信区间。
除了对模型的稳健性之外,对异常值或者重尾数据的稳健性也是个非常重要的问题。秩估计由于能同时兼顾稳健性和有效性受到了很多学者的关注和研究。为降低惩罚秩估计的计算量,已有学者采用了光滑化技术,提出了惩罚卷积秩估计。该估计量具有很多优良的理论性质,但惩罚卷积秩估计无法直接用以进行统计推断。郭旭及合作者深入探究了高维卷积秩回归的统计推断问题。他们提出了纠偏惩罚估计并建立了该纠偏估计量的渐近展开。和以往对纠偏惩罚估计的研究不同,纠偏惩罚卷积秩估计涉及U统计量。这使得相关理论分析存在一定难度。为进一步开展高维同时推断,他们建立了纠偏估计量的高维高斯逼近理论。在具体实现时,他们提出了高斯乘子Bootstrap算法并证明了该算法的合理性。
具体论文目录如下:
1. Guo, X., Li, R. Z., Zhang, Z., and Zou, C. L. (2024). Model-free statistical inference on high-dimensional data. Journal of the American Statistical Association, https://doi.org/10.1080/01621459.2024.2310314
2. Cai L. H., Guo, X., and Zhong, W. (2024). Test and measure for partial mean dependence based on machine learning methods. Journal of the American Statistical Association, https://doi.org/10.1080/01621459.2024.2366030
3. Cai L. H., Guo, X., Lian, H., and Zhu, L. P. (2025). Statistical inference for high dimensional convoluted rank regression. Journal of the American Statistical Association, https://doi.org/10.1080/01621459.2025.2471054
© 版权声明
本文由分享者转载或发布,内容仅供学习和交流,版权归原文作者所有。如有侵权,请留言联系更正或删除。
相关文章
暂无评论...