上篇文章通过excel分析纽约市5月份的uber数据增长情况,由于excel进行数据分析时,数据量不能超过100万,那么这篇文章我选择sql来分析uber的5至9月数据增长情况,总计有3969811条记录数,以此来分析不同公司的车辆增长情况。


1、数据按照月份存储在csv文件中,每个文件都包括时间、经度、纬度、公司这4个栏位,将csv文件的数据存储到mysql资料库中。采用etl的方式将数据存储到资料库中,但是时间这一列是字元串类型,需要将其转换为时间类型。

时间类型转换

sj栏位是字元串型的,date栏位是转换后的date类型

提取出月份,统计出每个月的车辆数,将结果导出到excel中进行可视化展示。

统计月份的车辆数

基于上述的处理分析,uber数量随著时间的推移,数量逐步增长的趋势。

2、分析不同公司在5-9月份的数量情况,通过分组计算得出结果,将结果进行可视化展示。

分组计算公司每月的数量

5家公司数量的变化趋势

通过上述的分析得出,B02617和B02764这两家公司的呈现增长趋势,并且增长幅度大,B02617公司每个月都是呈现增长趋势,公司业绩发展最好,B02764前3月保持稳定,后2月发展速度增大;其余3家公司均出现下跌趋势,B02512的发展一直平稳,B02598和B02682两家公司波动性相对较大。

3、分析5家公司在不同月份早晚高峰时段数量的分布情况,通过tableau连接前面创建的uber资料库,进行分析展示。

5家公司在不同月份的时段分布情况

基于上述分析得出,早高峰出现在7-8点,晚高峰出现在16-18点。在前两个月时,B02598公司的uber数量是最多的,从7月份开始,B02617公司的uber数量赶超了B02598,且远远超过B02598公司。

基于上述综合分析,B02617公司的发展趋势最好,市场份额占有大。


推荐阅读:
相关文章