课程编号:0712020111
课程基本情况:
1.课程名称:应用多元统计分析
2.英文名称:Applied Ultivariate Statistical Analysis
3.课程属性:专业必修课
4.学 分:3 总学时:51
5.适用专业:应用统计学
6.先修课程:高等代数、数学分析、概率论、数理统计
7.考核形式:考试
一、本课程的性质、地位和作用
应用多元统计分析是应用统计学专业的一门专业必修课.它是统计学的一个重要分支,也是近三、四十年迅速发展的一个分支.多元统计学研究的是多个变量的统计总体,这使它能够一次性处理多个变量的庞杂数据,而不需考虑异度量的问题,即它是处理多个变量的综合统计分析方法,它可以把多个变量对一个或多个变量的作用程度大小线性地表示出来,反映事物多变量间的相互关系;可以消除多个变量的共线性,将高维空间的问题降至低维空间中,在尽量保存原始信息量的前提下,消除重叠信息,简化变量间的关系;可以通过事物的表象,挖掘事物深层次的、不可直接观测到的属性即引起事物变化的本质;也可以透过繁杂事物的某些性质,将事物进行识别、归类.随着电子计算机的普及和软件的发展,信息储存手段以及数据信息的成倍增长,多元统计学中的方法已广泛应用于自然科学和社会科学的各个领域.国内国外实际应用中卓有成效的成果,已证明了多元统计方法是处理多维数据不可缺少的重要工具,并日益显示出无比的魅力.
2.教学目的与要求
1.教学目的
通过本课程的学习,让学生会应用多元统计学中的诸多方法进行数据分析,通过和不同的学科知识相结合,对所考虑具体问题给出合理的推断.
2.教学要求
要求学生掌握回归分析、判别分析、聚类分析、主成分分析、因子分析和典型相关分析等各种多元统计方法的思想及统计分析方法.了解其应用背景,且能运用这些方法解决一些典型的实际问题.
三、课程教学内容及学时安排
按照教学方案安排,本课程安排在第五学期讲授,全学程共51学时,其中课内讲授39学时,习题课12学时,具体讲授内容及学时安排见下表:
《应用多元统计分析》教学内容及学时分配表
章 |
标题 |
学时数 |
课内讲授 |
习题 |
备注 |
1 |
绪论 |
2 |
2 |
|
|
2 |
多元正态分布及参数的估计 |
4 |
3 |
1 |
|
3 |
多元正态总体参数的假设检验 |
4 |
3 |
1 |
|
4 |
回归分析 |
7 |
6 |
1 |
|
5 |
判别分析 |
6 |
4 |
2 |
|
6 |
聚类分析 |
7 |
5 |
2 |
|
7 |
主成分分析 |
8 |
6 |
2 |
|
7 |
因子分析 |
8 |
6 |
2 |
|
9 |
典型相关分析 |
5 |
4 |
1 |
|
合计 |
51 |
39 |
12 |
|
四、参考教材与书目
1.参考教材
朱建平.应用多元统计分析.北京:科学出版社,2016
2.参考书目
[1] 任雪松,于秀林.多元统计分析.第二版.北京:中国统计出版社,2011
[2] 张尧庭,方开泰.多元统计分析引论.北京:科学出版社.1999
[3] 高惠璇.应用多元统计.北京:北京大学出版社,2005
第1章 绪论(2学时)
【教学目的与要求】
1.理解多元统计分析的概念、研究的内容和方法;
2.理解多元统计分析的应用领域;
3.掌握多元统计数据的图表示法.
【教学重点】
了解多元统计分析能解决什么样的问题;掌握多元统计数据的几种图表示法.
【教学难点】
多元统计分析的思想.
【教学方法】
讲授、讨论.
【教学内容】
多元统计分析研究的对象、应用领域
多元统计数据的图表示法
【教学建议】
通过引入实例表明遇到的随机现象中需要涉及到多个随机变量,这时候不能利用以往概率统计中的知识解决,从而来介绍处理多个变量的方法,即多元统计分析.简单介绍什么是多元统计分析以及它能解决什么样的问题,并介绍多元统计数据的几种图表示法.
第2章 多元正态分布及参数的估计(4学时)
【教学目的与要求】
了解并掌握随机向量的分布、数字特征、均值向量和协方差阵的性质;
掌握多元正态分布的定义与基本性质;
掌握多元正态分布中参数的最大似然估计及其性质.
【教学重点】
多元正态分布的定义与基本性质;多元正态分布中参数的最大似然估计及其性质.
【教学难点】
多元正态分布中参数的最大似然估计。
【教学方法】
讲授,讨论。
【教学内容】
随机向量的分布、数字特征、均值向量和协方差阵的性质
多元正态分布的定义与基本性质
多元正态分布的参数估计
【教学建议】
概率统计课程中讲授过一元正态分布以及它的参数估计问题,首先先让同学们回顾这部分内容,然后在此基础上来学习这一章的内容.课程讲授中首先介绍随机向量的分布、数字特征、均值向量和协方差阵,接着重点介绍多元正态分布的定义与基本性质,多元正态分布中参数的最大似然估计及其性质.
第3章 多元正态总体参数的假设检验(4学时)
【教学目的与要求】
1.理解并掌握三个重要的分布---威沙特(Wishart)分布、霍特林(Hotelling)T2分布、维尔克斯(Wilks)分布及其它们的性质;
2.掌握单总体均值向量的检验及置信域;
3.掌握多总体均值向量的检验;
4.掌握协方差阵的检验;
5.了解正态性检验。
【教学重点】
单总体均值向量的检验及置信域;多总体均值向量的检验;协方差阵的检验;正态性检验。
【教学难点】
威沙特(Wishart)分布、霍特林(Hotelling)T2分布、维尔克斯(Wilks)分布及其它们的性质。
【教学方法】
讲授、讨论。
【教学内容】
威沙特(Wishart)分布、霍特林(Hotelling)T2分布、维尔克斯(Wilks)分布及其它们的性质
单总体均值向量的检验及置信域
多总体均值向量的检验
协方差阵的检验
正态性检验
【教学建议】
数理统计中的假设检验大多数都是在一元正态分布的总体上来进行的,首先让同学们回顾数理统计中假设检验的思想和步骤,在此基础上进一步来介绍多元正态总体的假设检验.首先介绍三个重要的分布---威沙特(Wishart)分布、霍特林(Hotelling)分布、维尔克斯(Wilks)分布及其它们的性质,接着重点介绍单总体均值向量的检验及置信域,多总体均值向量的检验,协方差阵的检验,最后介绍正态性检验.
第4章 回归分析(7学时)
【教学目的与要求】
掌握经典多元线性回归的估计、检验、预测;
了解回归变量的选择问题、变量选择的准则,掌握逐步回归分析;
掌握多因变量的多元线性回归的参数估计、假设检验;
掌握多因变量的逐步筛选法;
了解并掌握双重筛选逐步回归的理论和步骤。
【教学重点】
多因变量的多元线性回归的模型、参数的估计及其性质、假设检验;多因变量的变量筛选;双重筛选逐步回归问题。
【教学难点】
多因变量的变量筛选;双重筛选逐步回归。
【教学方法】
讲授。
【教学内容】
经典多元线性回归的估计、检验、预测
回归变量的选择与逐步回归
多因变量的多元线性回归
多因变量的逐步回归
双重筛选逐步回归
【教学建议】
简单介绍多元线性回归模型的估计、检验、预测,重点介绍多因变量的多元线性回归的模型、参数的估计及其性质、假设检验,最后再介绍多因变量的变量筛选和双重筛选逐步回归问题.
第5章 判别分析(6学时)
【教学目的与要求】
1.了解判别分析的目的和意义;
2.掌握判别分析中所使用的几种常用的判别尺度的定义和基本性质,包括距离判别法,Fisher判别法,Bayes判别法以及逐步判别法;
3.理解判别效果的检验及各变量判别能力的检验。
【教学重点】
距离判别法,Fisher判别法,Bayes判别法以及逐步判别法。
【教学难点】
Fisher判别法,Bayes判别法以及逐步判别法的思路。
【教学方法】
讲授法。
【教学内容】
距离判别
贝叶斯判别法及广义平方距离判别法
费希尔判别
判别效果的检验及各变量判别能力的检验
逐步判别
【教学建议】
介绍判别分析的目的和意义,重点介绍四种判别法:距离判别法、Fisher判别法、Bayes判别法以及逐步判别法,最后介绍判别效果的检验及各变量判别能力的检验.建议同学们搜集随机现象的多指标数据,利用软件计算,进行判别分析,从而帮助同学们理解判别分析.
第6章 聚类分析(7学时)
【教学目的与要求】
1.了解聚类分析的目的和意义以及它的统计思想,掌握变量类型的几种尺度定义;
2.了解并掌握Q型和R型聚类分析常用的距离和相似系数的定义,特别是Minkowski距离、系统聚类法的基本思想和基本步骤、8种系统聚类方法的定义及其基本性质;
3.了解系统聚类法的性质以及类的定义、特征和类个数的确定;
4.理解动态聚类法的思想和步骤。
【教学重点】
Q型和R型聚类分析常用的距离和相似系数的定义;系统聚类法的基本思想和基本步骤、8种系统聚类方法的定义及其基本性质;系统聚类法的性质以及类的定义、特征和类个数的确定。
【教学难点】
有关聚类分析的计算方法。
【教学方法】
讲授法。
【教学内容】
聚类分析的方法
距离与相似系数
系统聚类法
系统聚类法的性质及类的确定
动态聚类法
【教学建议】
简单介绍聚类分析的目的和意义以及它的统计思想,重点介绍Q型和R型聚类分析常用的距离和相似系数的定义,系统聚类法的基本思想和基本步骤,8种系统聚类方法的定义及其基本性质,最后介绍系统聚类法的性质以及类的定义、特征和类个数的确定以及动态聚类法.建议同学们搜集随机现象的多指标数据,利用软件计算,进行聚类分析,从而帮助同学们理解聚类分析.
第7章 主成分分析(8学时)
【教学目的与要求】
了解主成分分析的思想和意义;
了解主成分分析的数学模型及几何解释,掌握主成分的推导及基本性质;
熟悉数据处理中的样本标准化的意义和处理步骤;
了解主成分的计算步骤及其应用。
【教学重点】
主成分分析及其基本性质;主成分分析的数学模型;数据处理中的样本标准化。
【教学难点】
主成分的推导及性质。
【教学方法】
讲授法。
【教学内容】
主成分分析及其基本性质
主成分分析的数学模型及几何解释
主成分的推导及性质
主成分分析的应用
【教学建议】
阐述主成分分析的思想和意义,重点介绍主成分分析的数学模型、主成分的推导及基本性质,最后通过介绍实例来介绍主成分的计算步骤.建议同学们搜集随机现象的多指标数据,利用软件计算,进行主成分分析,从而帮助同学们理解主成分分析.
第8章 因子分析(8学时)
【教学目的与要求】
了解因子分析的目的和基本思想;
掌握因子分析的数学模型,熟悉因子模型建模的假设条件和各个分量的统计意义;
了解并掌握因子模型中常用的三种估计方法:主成分法、主因子解和极大似然法;
了解方差最大的正交旋转、因子得分、Q型因子分析。
【教学重点】
因子分析的数学模型;因子模型中常用的三种估计方法:主成分法、主因子解和极大似然法;方差最大的正交旋转、因子得分、Q型因子分析。
【教学难点】
因子模型中常用的三种估计方法:主成分法、主因子解和极大似然法;方差最大的正交旋转、因子得分、Q型因子分析。
【教学方法】
讲授法。
【教学内容】
因子模型
参数估计方法:主成分法、主因子解和极大似然法
方差最大的正交旋转
因子得分
Q型因子分析
【教学建议】
简单介绍因子分析的思想和目的,重点介绍因子分析的数学模型、因子模型中的参数估计方法、方差最大的正交旋转、因子得分、Q型因子分析.建议同学们搜集随机现象的多指标数据,利用软件计算,进行因子分析,从而帮助同学们理解因子分析.
第9章 典型相关分析(5学时)
【教学目的与要求】
了解典型相关分析的概念、基本思想和数学模型;
掌握总体和样本的典型相关系数以及典型变量,典型相关系数的假设检验。
【教学重点】
典型相关分析的数学模型;总体和样本的典型相关系数以及典型变量,典型相关系数的假设检验。
【教学难点】
总体和样本的典型相关系数以及典型变量,典型相关系数的假设检验。
【教学方法】
讲授法。
【教学内容】
总体典型相关
样本典型相关
【教学建议】
简单介绍典型相关分析的概念和基本思想,重点介绍典型相关分析的数学模型,总体和样本的典型相关系数以及典型变量,典型相关系数的假设检验.建议同学们搜集随机现象的多指标数据,利用软件计算,进行典型相关分析,从而帮助同学们理解典型相关分析.
执笔人:翟明娟 审定人:李建丽