目录:

  • 问题提出
  • 数据概况
  • 整体描述性分析
  • 单变数线性回归
  • 多元变数线性回归分析
  • 管理建议

问题提出

校友捐赠是美国大学财政收入的重要来源,如果大学管理人员知道什么因素能够提高捐赠比例,那么就会采取相应措施来提高学校的财政收入。在这个案例里,我们基于美国48所大学的校友捐赠资料,来分析影响校友捐赠比例的因素。

数据概况

表单数据包括

  • 大学校名
  • 所在州
  • 毕业率
  • 小班率(小班:学生人数少于20的班级)
  • 学生与老师数量比
  • 校友捐赠率

描述性统计

我们先对数据做探索性分析

捐赠率直方分布

捐赠率在27-31有一峰值,其次是11-15之间,在右侧远端63-67有分布,从数据分布形态来看尚属正常

毕业率/小班率/师生比例箱型图

毕业率/小班率/师生比例箱型图形态正常,未发现异常

单变数线性回归分析(毕业率与捐赠率)

在毕业率/小班率/师生比例这三个自变数中,直观来看毕业率高的学校,学生会更愿意捐赠,我们首先考虑毕业率与捐赠率的关系,散点图是观察两个变数关系的可视化方法,从图中可以看出毕业率与捐赠率存在一定的正向相关。

捐赠率Y-毕业率X

以毕业率为自变数X,捐赠率为因变数Y,利用excel数据分析模块做线性回归拟合

Y=1.18ast X-68.76

预测捐赠率Y-毕业率X

此单变数线性回归模型统计数据如下

整体回归显著性分析F检验的结果显示,整体回归显著,同样,回归参数显著性分析t检验也表示回归参数等于0的假设不成立。

从回归统计来看,可决定系数 R^{2}=0.57 ,不算是非常好的指标,现有模型不足以来拟合捐赠率数据,我们应当考虑引入更多特征值做分析

多元变数线性回归分析

在大学中,一位老师面对较少数量的学生,通常会让学生有更好的体验,从而加大捐赠的比例。基于此逻辑的考虑,在「毕业率」之外,我们额外增加"小班率"以及"学生-老师数量比"为自变数,捐赠率为因变数,考虑多重线性回归拟合。

利用excel数据分析模块做线性回归拟合 Y=0.748ast 「Graduation Rate」+0.029ast 「 Per of Classes Under 20」-1.192ast 「Student-Faculty Ratio」-20.720

基于毕业率的捐赠率预测
基于小班率的捐赠率预测
基于学生-老师数量比的捐赠率预测

从图形可以看出,捐赠率与毕业率、小班率正向相关,与学生-老师数量比负向相关,这与我们对数据信息的经验分析相符合。

线性模型回归统计

多重线性模型回归统计

可决定系数 R^{2}=0.699 ,明显高于之前0.57

整体回归分析参数F检验显著。自变数小班率与截距的t检验P值大于0.05,两个参数可以假设为零。这意味著,我们可以舍弃小班率与截距。

在这里,可以考虑,小班率与学生老师数量比之间或存在线性相关,小班率高,学生老师数量比就小,反之亦然,我们试著把小班率去除,截距设为零,观察下回归模型计算的结果

利用excel数据分析模块做线性回归拟合

Y=0.56ast 「Graduation Rate」-1.5ast 「Student-Faculty Ratio」

基于毕业率的捐赠率预测
基于学生-老师数量比的捐赠率预测

多重线性回归模型统计

可决定系数 R^{2}=0.94

这是目前最好的结果,线性回归模型可以说明94%的捐赠率的偏离均值差异。整体回归分析F检验与参数t检验均表示显著。

为了更直观的认识线性模型,我们使用python来完成三维可视化

原始数据三维视图(毕业率X-学生老师数量比Y-捐赠率Z)
线性回归模型三维视图(毕业率X-学生老师数量比Y-捐赠率Z)

管理建议

最终,我们建立关于捐赠率的回归模型 「Alumni Giving Rate"=0.56ast 「Graduation Rate」-1.5ast 「Student-Faculty Ratio」

从模型分析中,我们会建议校方,为提升捐赠率,提高学校的财政收入,需要改善毕业率与学生老师数量比,其中学生老师数量比权重系数是毕业率的约三倍,这意味著改善学生老师数量比的相对收益更大。但是改善学生老师数量比,需要引进更多的老师,这会带来更多附加成本,因此对师生比因素的改善需要更多数据来评估。

改善毕业率意味著吸收更好的生源,提升教学质量,这其实是学校本有的发展目标,对于现有毕业率低于平均水准的学校而言,改善毕业率是提升财政收入的有效办法。


推荐阅读:
相关文章