北京大学邓明华教授为我系做线上学术报告

发布人:数学系 发布日期:2020-09-02

87日,北京大学邓明华教授我系做线上学术报告,报告的主题是大数据的处理和分析方法。

报告主要主要介绍了近些年来大数据处理的一些新方法和新思想等。主要包括缺失数据的处理(定值填充,统计量填充,插值法填充,模型填充等), 离群点处理(包括3 sigma原则,基于绝对离差中位数,基于距离,基于密度,基于聚类),数据规范化(最大-最小规范化,Z-Score标准化, LOG变换等),数据离散化(分段的原则,等距离,等频率,聚类,优化等),探索性分析(包括数据预处理,数据宏观描述,数据变量间的关系,高维数据可视化等),结合数学建模的例子给出了一些方法的分析和应用。同时介绍了奇异值分解,神经网络通用逼近定理,分类器准确性评价,PR曲线等,高斯混合模型,M-MEANS相关算法等,深度聚类算法,AP聚类算法,聚类个数的确定,距离相关系数,相关性检验,回归分析等。参数的最小二乘估计等。

我系部分教师聆听了该报告,并就一些问题进行了探讨。