分析师,如何出身并不重要,数据分析是一门应用学科,你需要系统提升数据获取、数据分析、数据可视化、机器学习的水平。

第一阶段:Excel数据分析

每一位数据分析师都脱离不开Excel。

它是日常工作中最常用的工具,如果不考虑性能和数据量,它可以应付绝大部分分析工作。虽然现在机器学习满地走,Excel依旧是无可争议的第一工具。

对于没有经验的你,Excel是一款必须熟练的工具。它是日常工作中最常用的工具,如果不考虑性能和数据量,它可以应付绝大部分分析工作。

第二阶段:SQL资料库语言

作为数据分析人员,我们首先要知道如何去获取数据,其中最常见的就是从关系型资料库中取数,因此你可以不会R,不会python,但是你不能不会SQL。

DT时代,数据正在呈指数级增长。Excel对十万条以内的数据处理起来没有问题,但是往小处说,但凡产品有一点规模,数据都是百万起。这时候就需要学习资料库。

会在招聘条件中,越来越多的产品和运营岗位,将会SQL作为优先的加分项。SQL是数据分析的核心技能之一,从Excel到SQL是数据处理效率的一大进步。

主要了解资料库查询语言,where,group by,orderby,having,like,count,sum,min,max,distinct,if,join,left join,limit,and和or的逻辑,时间转换函数等。

学习SQL最快的方法是能自己下载资料库管理工具,找些数据练习。客户端这里推荐MYSQL。

推荐书籍:《MYSQL必知必会》

第三阶段:数据可视化商业智能

数据可视化能力已经越来越成为各岗位的基础技能。领英的数据报告显示,数据可视化技能在历年年中国最热门技能中排名第一。

可视化工作几乎是你正式进行数据分析的第一步,通过SQL拿到数据之后,我们需要使用可视化方法探索和发现数据中的模式规律。

数据分析界有一句经典名言,字不如表,表不如图。实际上除掉数据挖掘这类高级分析,不少数据分析就是监控数据和观察数据。

除此此外,数据分析的大多时候都是要兜售自己的观点和结论的,而兜售的最好方式就是做出观点清晰数据详实的PPT和报表给老板看。

可视化的工具有很多,这里我推荐Tableau或者FineBI。这两款都不要编程功底,实现起来简单,功能强大。下图是Excel制作销售管理分析仪案例:

Tableau制作股票分析仪:

FineBI可视化分析:

推荐书籍:《用图表说话》-麦肯锡

第四阶段:数理统计学

统计学是数据分析最重要的基础之一,是数据分析的基石和方法论。

统计知识会要求我们以另一个角度看待数据。当你知道AB两组的差异用平均值看是多傻的事情,你的分析技巧也会显著提高。

这里我们需要从基础的统计理论(描述性统计、区间估计、假设检验等)出发,到基本的统计分析(T 检验、方差分析等),最后到商业常用的模型(回归分析、方差分析等),学习数据分析背后的逻辑,掌握实用统计学的概念和会利用统计的思维去思考问题。

推荐书籍:《从零进阶 数据分析的统计基础》-曹正凤;《统计学》-贾俊平

第五阶段:数据分析与软体应用

SPSS是统计分析入门软体,如果你想快速入门而又不想学习编程,我推荐使用SPSS。

SPSS软体是世界三大统计分析软体之一,以其易于操作、易于入门,结果易于阅读的优点,一直备受数据分析人员的青睐,一般经过短期学习即可用SPSS 做简单的数据分析,包括绘制图表、简单回归、相关分析等等。

学习SPSS的重点并不在于软体本身,而是相关的统计学知识,这也是在前面建议大家铺垫的,也就是你要学会怎样去分析「输入数据后,软体给你呈现的结果」。

推荐书籍

《如虎添翼 数据处理的SPSS/SAS EG实现》-徐筱刚

《胸有成竹 数据分析的SPSS/SAS EG进阶》-常国珍

《SPSS统计分析基础教程+高级教程》-张文彤

第六阶段:数据挖掘与软体应用

数据挖掘,英文是Data Mining 也叫作数据勘探,类似于采矿,但是数据是贫矿。我们需要结合行业课题,利用数据挖掘工具,建置数据挖掘模型,发掘规律和商业价值。另外数据挖掘是交叉学科,涉及统计学、计算机、机器学习、运筹学等多门学科,是一个运用广泛和富有前景的学科领域。

学习演算法模型包括线性回归、逻辑回归、主成分分析、因子分析、聚类、关联规则、决策树、随机森林、支持向量机、贝叶斯、神经网路等。

对于工具,这一阶段,建议选择一门编程语言来学习。

Python或者R语言,这一点是必备项也是加分项,在数据挖掘方向是必备项,语言相比较工具更加灵活也更加实用。

对于R和Python,我们应该使用哪种语言,已经争论很多年了,至今没有定论...... 事实大概是Python的主要功能是编程,除了单纯的数据分析,在很多领域还有广泛利用,所以就业市场上对Python的需求是远大于R。

R主要侧重统计功能,在统计方面显示出了很多的优势,用R做单纯的数据分析还是妥妥的稳稳的。但是往数据科学方向走的话,R就有点顶不住了,轮到Python扬眉吐气了......

是否具备编程能力,是初级数据分析和高级数据分析的风水岭。数据挖掘、BI、爬虫、可视化报表都需要用到编程。以下以python介绍语言学习的路径:

Python则是万能的胶水语言,适用性强,可以将分析的过程脚本化。Pandas、Numpy、SKLearn等包也是非常丰富。Python学习导图:

推荐书籍:

《笨方法学Python》《像计算机科学家一样思考》

《Python数据科学手册》《利用Python进行数据分析》《数据科学入门》

《机器学习实战:基于Scikit-Learn和TensorFlow》

《数据挖掘实战》

《Python深度学习》

第七阶段:数据分析行业应用和数据分析思维

对于数据分析师来说,业务的了解比数据方法论更重要。当然很遗憾,业务学习没有捷径。

推荐书籍:《增长黑客》;《精益数据分析》

以上就是商业数据分析师的完整进阶路线,如果你沿著此路线学习,相信你在数据分析道路上有所收获。


作为一家拥有超多数据分析师的公司,怒答一波!

为你推荐初阶数据分析师的10个必备网站+5本必看书籍+3个必备工具

10 个必备网站

  1. 中国经济网数据中心

2. 互联网数据中心

3. IDC中国

4. CNZZ数据中心

5. 百度数据中心

6. 智库数据

7. 淘宝数据平台

8. 艾瑞咨询

9. 互联网信息中心

10. 国家数据

5 本必看书籍

1.《深入浅出数据分析》:HeadFirst 类的书籍,一向浅显易懂形象生动,可以对分析概念有个全面的认知。

2.《谁说菜鸟不会数据分析》:不仅讲解了一些常见的分析技巧,并附带 Excel 的一些知识以及数据分析在公司中所处的位置,对职场了解亦有一定帮助。

3.《赤裸裸的统计学》:作者年轻时是个追求学习意义的学霸,后来自己从统计学中发掘了很多可以应用到生活的地方。这也是本书的主旨,结合生活讲解统计知识,生动有趣。可以避免统计学一上来就大讲贝叶斯概率和随机分析的枯燥。

4.《统计数字会撒谎》:这本书知名度要高点,建议初学者可以好好看看。

5. 《SQL 从入门到精通》:学习 SQL 的入门书,薄册子一本,看起来很快。SQL 是个性价比很高的技能,简单而强大。任何想进一步提高自己数据分析技能的产品/运营/分析师 同学,都建议点亮这个技能点。

3 个必备工具

  1. PowerBI:BI(商业智能)工具,涵盖了报表、数据分析、可视化等多层。此外,底层还可于数据仓库衔接,构建OLAP分析模型。
  2. GrowingIO:支持网站、App、小程序数据采集和分析,对于数据分析师来说无需埋点,只需三行代码,一次部署,就可以秒级出各种趋势、漏斗等图。可以为数据分析师节省大量时间,把重点真正落实到数据分析!分析!分析!上(重要的事说三遍 )
  3. Rattle GUI:如果想用 R 语言完成数据分析,可以试试 Rattle。这个 GUI 基于 R 语言,在 R 中输入 install.packages("rattle"),然后 library(rattle),接著再输入 rattle(),就能启动 Rattle 了。

发布于 2020-03-11继续浏览内容知乎发现更大的世界打开Chrome继续猴子猴子?

中国科学院大学 电子与通信工程硕士本回答节选自盐选专栏,有助于解答该问题

我们先从整体上了解数据分析师要掌握的技能有哪些,然后再从具体职位类别来看,不同的职位具体要掌握的技能有哪些。


这样你不仅可以从整体上有了全局的认识,还能从细节上知道不同职位类别的技能是什么,这样你就能根据自己的实际情况,有针对性的准备和学习。

一、数据分析的胜任力模型是什么?


从整体上来看,数据分析师需要掌握的能力有很多,从总体上可以分为以下几类,这些能力构成了数据分析师的能力模型。



1)理论基础,包括统计学


2)数据分析工具,常用的分析工具有 Excel,SQL,Python 等


3)可视化工具,常用的有 Excel,商业智能(Business Intelligence,BI)


4)业务知识,包括常用的指标、某行业的业务流程


5)数据分析思维,包括常用的分析方法

6)通用能力,包括 PPT、沟通能力


下面我们来详细看下每一种能力的要求。


1.理论基础:统计学


数据分析背后的理论基础是统计学。所以,掌握了统计学以后我们才能去看懂数据表达的意义是什么。举个例子,给你一家公司员工的工资,是平均值能代表这家公司的工资水平,还是中位数能代表?


如果没学过统计学,那么可能只认识这里的平均值,而不知道中位数这个知识。但是,如果你学过了统计学就会知道,中位数比平均值更能反映出数据的集中表现。


统计学的内容比较多,详细又可以分为两类内容:描述统计分析、推论统计分析。


什么是描述统计分析?


对大量信息进行归纳是处理数据时最基本的任务。中国约有 14 亿人,一张记录每位中国人的姓名和收入的电子表格包含了我们衡量这个国家经济健康状况所需的所有信息,通常我们也将多个数据集合在一起的东东叫「简称数据集」。但这张信息过量的表格其实相当于什么都没有告诉我们。这就是让人觉得讽刺的地方:经常是数据越多,事实越模糊。??


因此,我们需要简化,将一系列复杂的数据减少为几个能够起到描述作用的数字,正如奥运会体操比赛中,我们将一套多难度组合的复杂动作浓缩为一个得分:9.8 分。?


描述统计分析就是将一系列复杂的数据减少为几个能够起到描述作用的数字,用这些有代表性的数字来代表所有的数据。这样在面对一大堆数据时,你可在不知道所有数据的情况下就能知道数据的整体情况。??


这就好比,我们通常一说起美女,能想到的是这样几个指标:长腿,大眼睛,脸蛋好看。虽然全国有那么多美女,你也没有见过全部的美女,但是你却能通过这样几个代表美女的指标就可以大概知道什么是美女。?



?同样的,描述统计学的关键点在于,找到几个关键的数字来描述数据的整体情况。那么,问题就来了,能担当起这样重要责任的数字有哪些呢?描述数据的整体情况,我们可以用 4 个指标来做,分别是:平均值、四分位数、标准差和标准分。?例如,前面我们在拿到工资数据,就可以用「中位数」这样的数字来描述工资的整体情况。


所以,描述统计分析就是掌握 4 个指标:平均值,四分位数,标准差和标准分。


什么是推论统计分析?


推论统计分析就是通过样本来推断出总体。需要掌握的知识包括概率分布、中心极限定、如何用样本估计总体、置信区间、假设检验。例如,互联网常用的 AB 测试背后的原理就是假设检验,如果不掌握推论统计分析,那么连 AB 测试的结果也看不懂,更不用说完成一个 AB 测试实验。


2.数据分析工具


很多人看到现在 Python 很火,就不管自己的能力水平如何,就一头扎进学习 Python 的大潮,最后发现其实自己学不会,或者学完用不上。


这其实是不对的,真正工作里最常用的数据分析工具其实是 Excel,SQL。所以,如果你的零基础,不建议一上来就学 Python,而是先学会 Excel 分析数据,然后学会 SQL。


这样你学会了常用的分析工具,然后再学 Python 才是加分项。同时,这样学习的顺序还有一个好处,如果你是零基础没学过编程,一上来学 Python,大概率是学不会的。但是如果你学过用 Excel、SQL 处理数据,那么就具备了一定的基础,再学 Python,很多概念就会理解起来比较容易。


这就好比,一个婴儿不是一上来就学习跑步(Python),而是先把走路学会,具备了走路(Excel、SQL)的基础,再跑步就容易多了。



需要注意的是,除非是工作必须要求的,其他少部分公司用的工具其实不需要学习。比如有些公司要求其他编程语言,例如 R、SPSS、SAS 这些工具。


现在 Pyhon 已经是人工智慧排名第一的编程语言了,大部分公司要求 Python,很少部分的公司要求其他的编程语言,所以学习市场要求最多的那个技能才能找到更多机会。如果你学习了少部分公司才要求的工具,那么意味著你找工作或者跳槽只能选择这些公司,而会错失其他大部分公司的求职机会,对你整个职业生涯不利。


TIOBE 编程语言排行榜是全球编程语言流行趋势的一个指标,每月更新,官网地址(https://www.tiobe.com/tiobe-index)。?下图是 2021 年 2 月份排名前 10 的编程语言的变化图,其中橙色曲线是 Python,我们会发现 Python 的流行趋势越来越高。
TIOBE 编程语言排行榜是全球编程语言流行趋势的一个指标,每月更新,官网地址(https://www.tiobe.com/tiobe-index)。?下图是 2021 年 2 月份排名前 10 的编程语言的变化图,其中橙色曲线是 Python,我们会发现 Python 的流行趋势越来越高。

3.可视化工具


常用的可视化工具包括 Excel、商业智能(BI)。


一般的可视化图表用 Excel 里的图表功能就可以实现,而且使用起来也方便。如果是要经常做报表,并且要求实现报表自动化,那么就需要用到商业智能(BI)工具。


那什么是商业智能(BI)呢?


微软官方给的定义是「使用用于自助服务和企业商业智能 (BI) 的统一、可扩展平台(该平台易于使用,可帮助获取更深入的数据见解),连接到任何数据并对数据进行可视化。 」


毫无悬念,看这种官方定义就是看不懂。简单来说就是把数据导入商业智能(BI)工具中,就可以快速对数据可视化。例如下图就是把数据导入用商业智能(BI)工具中,通过可视化数据来分析。



IDC《2019 年下半年中国商业智能软体市场数据跟踪报告》显示,在中国商业智能软体子市场中,报表分析仍是目前市场最主要的需求,2019 年全年年市场份额占比为 79.0%。高级分析和预测分析市场份额占比 21.0%(下图)。



常用的商业智能(BI)工具有哪些呢?


目前使用最多的商业智能(BI)工具是 Power BI、Tableau、帆软,选择其中任意一种学习就可以了。


4.业务知识


因为数据分析是用来解决具体行业问题的,需要从业务的角度出发,了解各个指标,以及每个指标之间的关系,还需要联系业务去理解数据。所以,工作中数据分析脱离不了业务,在分析中要找到导致问题发生的根本原因,而不只是单纯的统计数据。


因此需要具备某个行业的业务知识才能去理解这个行业里的术语、业务问题等。


业务知识包括某个行业的常用指标、业务流程。需要注意的是,不同行业的指标、业务流程是不一样的,所以需要学习的时候针对你的目标行业去学习准备。例如,下图分别是金融信贷行业、在线教育行业的业务流程。


金融信贷行业业务流程(来自书《数据分析思维》)
金融信贷行业业务流程(来自书《数据分析思维》)

在线教育业务流程(来自书《数据分析思维》)
在线教育业务流程(来自书《数据分析思维》)

如果是刚入门,这块内容做到了解即可,等进入工作以后,再慢慢深入业务,积累业务经验。具体某个行业的常用指标、业务流程可以看书《数据分析思维》,这本书里涉及了 10 多个行业的指标、业务流程。


5.数据分析思维


在数据分析相关的职位里经常会写这么一条招聘要求「具备数据分析思维」。在工作或者面试中,会经常听到分析思维、分析思路、分析方法。这三个词语有什么关系呢?其实简单来说,它们都是指分析方法。


数据分析思维需要你掌握 10 种常用的分析方法。


数据分析 10 种常用的分析方法
数据分析 10 种常用的分析方法

如果你的分析目的是想将复杂问题变得简单,就可以使用逻辑树分析方法,例如经典的费米问题就可以用这个分析方法。


如果你的分析目的是做行业分析,那么就可以用 PEST 分析方法,例如你想要研究中国少儿编程行业。


如果你想从多个角度去思考问题,那么就可以用多维度拆解分析方法,例如找相亲对象,需要从多个角度去分析是否合适。


如果你想进行对比分析,就要用到对比分析方法,例如你朋友问自己胖吗,就是在对比。


如果你想找到问题发生的原因,那么就要用到假设检验分析方法,其实破案剧里警察就是用这个方法来破案的。


如果你想知道 A 和 B 有什么关系,就要用到相关分析方法,例如豆瓣在我们喜欢的电影下面推荐和这部分电影相关的电影。


如果你想对用户留存和流失分析,就要用到群组分析方法,例如微博用户留存分析。


如果你想对用户按价值分类,那么就要用到 RFM 分析方法,例如信用卡的会员服务,就是对用户按价值分类,对不同用户使用不同的营销策略,从而做到精细化运营。


如果你想分析用户的行为或者做产品运营,就要用到 AARRR 模型分析方法,例如对拼多多的用户进行分析。


如果你想分析用户的转化,就要用到漏斗分析方法,例如店铺本周销量下降,想知道是中间哪个业务环节出了问题。


6.通用能力


通用能力包括 PPT 制作分析报告、沟通能力。


在工作中,要经常做分析结果做成数据分析报告,然后展示给业务部门、上级领导、客户等,而这种展示数据分析报告的场景常用的工具就是 PPT,所以就要求你会用 PPT 制作数据分析报告,有较好的的文字、书面总结能力。


职业社交网站领英发布的《2018 新兴工作岗位报告》报告里说,最大的技能缺口是软技能,比如口头交流、领导力和时间管理等。这份报告中建议,职场人士需要在快速变化的工作环境中,学习并保持软技能,因为拥有这些技能的人才具备更大的职场优势。


其实,任何职位都需要沟通能力,但是,数据分析师对沟通能力的要求更高。因为,数据分析师解决的是实际的问题,需要跨部门沟通业务,做好的数据分析报告也要展示给各个部门、领导、客户,只有好的沟通能力,才能让你的分析结果得到用户的认可。 那么这些通用能力如何提升呢?最直接的方式,就是通过写文章来提升。


通过写作可以同时提升你下面 3 个能力:


1)逻辑能力


写作的本质其实是把一件事情讲清楚,而逻辑能力强的人写出来的内容,读起来更顺畅。


2)文字表达能力


数据分析师要经常做数据分析报告,和通过邮件汇报分析结果。这体现的其实就是文字表达能力,提高这个能力的办法就是不断去写作。


3)沟通能力


写作其实就是把想说的话通过文字和你的用户去沟通。另外,经常在社群里提问和解答他人的问题,也可以提高你的沟通能力。你会看到不同人提问的水平是不一样的,有的人可以完整的把一个问题描述清楚,有的人说完,其他人也不明白他的问题是什么。这其实就是体现了沟通能力。


二、不同职位的数据分析能力要求有什么不一样?


经过前面的分析,我们从整体上知道了数据分析师需要掌握的能力。但并不是说,这些能力全都掌握了你才能找到一份数据分析师的工作。因为不同的职位的要求不一样的。在《职业发展前景:数据分析师的晋升通道》章节我们知道了数据分析相关职位的分类。



我把胜任力模型中的这些能力对应到不同的职位,就可以清楚的看到对应职位的能力要求(下图)。



有一个误区,很多人以为只要掌握了分析工具,就掌握了数据分析,其实不是的。从图中,我们可以看出。各个数据分析职位都需要的能力是:业务知识、分析思维、PPT、沟通能力。这些能力才可以让你从一个只会舞弄工具的普通职场人变成真正解决业务问题的职场高手。


很多人以为数据分析师需要掌握很高大的工具,其实不是的。例如腾讯里有一个岗位叫「商业数据分析师」,这听起来很高大上。其实这个职位对应的就是上图初级数据分析师的能力要求,也就是理论基础(描述统计分析),分析工具(Excel),可视化工具(Excel)。


上图中黄色标出的是相对于前一职位多出来的能力。中级数据分析师在初级数据分析师要求的能力上增加了分析工具(SQL),可视化工具(商业智能 BI)。高级数据分析师在中级数据分析师要求的能力上增加了理论基础(推论统计分析),分析工具(Python)。

Excel、SQL、Python 要掌握到什么程度?

我们知道了数据分析师最常用的分析工具是 Excel、SQL、Python。那么问题就来了,这些分析工具具体掌握哪些内容呢?


一、Excel 需要掌握下面的知识点:



1)数据清洗相关的功能


查找和删除重复数据,对应的是 Excel 里的删除重复项功能。


数据抽取,也就是从一堆杂乱的数据中找出想要的数据,例如薪资「10k-20k」,需要从中截取出最低薪水「10」和最高薪水「20」,这就要用到 Excel 的字元串截取函数 left、right、mid)。


数据计算函数,包括平均值(average)、求和(sum)、最大值(max)、最小值(min)等),日期函数(date),判断函数(if,or,countif)。


2)数据分析相关的功能

最低 0.3 元/天开通会员,查看完整内容

购买该盐选专栏查看完整 10 篇内容

盐选专栏

数据分析入行指南:助你互联网行业发展有「钱」途

猴子 猴子数据分析学院创始人,著有畅销书《数据分析思维》

¥9.90 会员免费

发布于 03-10继续浏览内容知乎发现更大的世界打开Chrome继续爱数据-橙子爱数据-橙子0基础入职数据分析师

首先你要先做的是背景评估,是否适合学习并且做数据分析,因为不是所有人都适合转行或学习数据分析,比如专业极度不相关,年龄较大或者城市基因不匹配的都不适合学,因为我们最终是以入职为目标的。

假设你全都满足的情况我们都需要学习什么呢?

我们可以先分析一个JD

以上我们很清晰的分析出数据分析师要具备以下5种能力:他们分别是数据工具、业务理解、沟通表达、思维逻辑和报告撰写

从初级数据分析师招聘要求的必须技能来看,主要包括理论知识工具实践两部分内容。

理论部分统计学:为什么将统计学放在第一位呢?因为统计学是数据分析的基石,而且统计分析可以解决日常大部分的分析需求。统计学这部分内容需要学习描述统计、假设检验、贝叶斯、概率、分布、抽样、线性回归、时间序列等内容。数据分析方法论:这里要学习一些数据分析常用到分析方法,如趋势分析法、对比分析法、多维分解法、用户细查、漏斗分析、留存分析、AB测试法、4P理论、PESTEL理论、SWOT分析、5W2H理论、逻辑树理论、用户使用行为理论、AARRR模型等。

工具部分

Excel:它是最基础的数据分析工具。在学习的Excel的时候需要重点掌握:常用函数的使用、快捷键操作、基础图表制作、数据透视表、Vlookup等。另外Excel还可以导入一些模板来使用,典型的包括数据分析模块、做假设检验经常用到;规划求解,做线性规划和决策等问题非常有效。SQL:它是数据分析的核心技能,SQL要重点学习Select,聚合函数、以及条件查询(Where、Group by、Order by等)PPT:用来和业务部门交流需求,展示分析结果。Python:主要学习Numpy、Pandas、Matplotlib、Seaborn等内容。Python 的底层是用 C 语言写的,很多标准库和第三方库也都是用 C 写的,在处理数据时候运行速度非常快。这里需要注意的是不同公司对工具的要求也不同,例如有些公司要求会使用R语言、SPSS等,具体学哪一个工具可以参照JD要求,其中Excel、SQL和PPT是必备的基础技能工具

学习可以分为两个途径:

1.自学:需要有极强的自律性,以及对学习资料和内容筛选的能力。否则效率会非常的低,而且一定要制定学习计划,根据学习计划执行。包括你要投递简历的时间,入职的时间等等。都要给自己一个规划。否则会容易懈怠。资料可以去通过一些行业领域的公众号,数据领域相关网站以及知乎,B站等去获取。

2.报班:效率会相对比较高,而且会非常快速的收获并且融入数据圈获得更多资源。让自己有一个更好的发展路径规划。但是选择机构就要非常的谨慎,避免掉坑。可以从师资力量(讲师是否在职,切记纸上谈兵的讲师),课程实用性(要有实战以及真实资料库),职场支持(根据城市基因个人背景做支持,忌所谓的包就业)等内容综合做评估

最后,一定给自己做一个职业规划,了解不同层级的数据分析师要掌握什么技能,想清楚自己未来的目标岗位,不断的去学习和提升自己,再一步步朝著目标迈进。

希望以上回答对题主以及刚刚想步入数据领域的小伙伴有帮助,欢迎同样困惑的小伙伴可以私信我。或者留言评论进橙子数据学习社群


我们先从整体上了解数据分析师要掌握的技能有哪些,然后再从具体职位类别来看,不同的职位具体要掌握的技能有哪些。


这样你不仅可以从整体上有了全局的认识,还能从细节上知道不同职位类别的技能是什么,这样你就能根据自己的实际情况,有针对性的准备和学习。

一、数据分析的胜任力模型是什么?


从整体上来看,数据分析师需要掌握的能力有很多,从总体上可以分为以下几类,这些能力构成了数据分析师的能力模型。



1)理论基础,包括统计学


2)数据分析工具,常用的分析工具有 Excel,SQL,Python 等


3)可视化工具,常用的有 Excel,商业智能(Business Intelligence,BI)


4)业务知识,包括常用的指标、某行业的业务流程


5)数据分析思维,包括常用的分析方法


6)通用能力,包括 PPT、沟通能力


下面我们来详细看下每一种能力的要求。


1.理论基础:统计学


数据分析背后的理论基础是统计学。所以,掌握了统计学以后我们才能去看懂数据表达的意义是什么。举个例子,给你一家公司员工的工资,是平均值能代表这家公司的工资水平,还是中位数能代表?


如果没学过统计学,那么可能只认识这里的平均值,而不知道中位数这个知识。但是,如果你学过了统计学就会知道,中位数比平均值更能反映出数据的集中表现。


统计学的内容比较多,详细又可以分为两类内容:描述统计分析、推论统计分析。


什么是描述统计分析?


对大量信息进行归纳是处理数据时最基本的任务。中国约有 14 亿人,一张记录每位中国人的姓名和收入的电子表格包含了我们衡量这个国家经济健康状况所需的所有信息,通常我们也将多个数据集合在一起的东东叫「简称数据集」。但这张信息过量的表格其实相当于什么都没有告诉我们。这就是让人觉得讽刺的地方:经常是数据越多,事实越模糊。??


因此,我们需要简化,将一系列复杂的数据减少为几个能够起到描述作用的数字,正如奥运会体操比赛中,我们将一套多难度组合的复杂动作浓缩为一个得分:9.8 分。?


描述统计分析就是将一系列复杂的数据减少为几个能够起到描述作用的数字,用这些有代表性的数字来代表所有的数据。这样在面对一大堆数据时,你可在不知道所有数据的情况下就能知道数据的整体情况。??


这就好比,我们通常一说起美女,能想到的是这样几个指标:长腿,大眼睛,脸蛋好看。虽然全国有那么多美女,你也没有见过全部的美女,但是你却能通过这样几个代表美女的指标就可以大概知道什么是美女。?



?同样的,描述统计学的关键点在于,找到几个关键的数字来描述数据的整体情况。那么,问题就来了,能担当起这样重要责任的数字有哪些呢?描述数据的整体情况,我们可以用 4 个指标来做,分别是:平均值、四分位数、标准差和标准分。?例如,前面我们在拿到工资数据,就可以用「中位数」这样的数字来描述工资的整体情况。


所以,描述统计分析就是掌握 4 个指标:平均值,四分位数,标准差和标准分。


什么是推论统计分析?


推论统计分析就是通过样本来推断出总体。需要掌握的知识包括概率分布、中心极限定、如何用样本估计总体、置信区间、假设检验。例如,互联网常用的 AB 测试背后的原理就是假设检验,如果不掌握推论统计分析,那么连 AB 测试的结果也看不懂,更不用说完成一个 AB 测试实验。


2.数据分析工具


很多人看到现在 Python 很火,就不管自己的能力水平如何,就一头扎进学习 Python 的大潮,最后发现其实自己学不会,或者学完用不上。


这其实是不对的,真正工作里最常用的数据分析工具其实是 Excel,SQL。所以,如果你的零基础,不建议一上来就学 Python,而是先学会 Excel 分析数据,然后学会 SQL。


这样你学会了常用的分析工具,然后再学 Python 才是加分项。同时,这样学习的顺序还有一个好处,如果你是零基础没学过编程,一上来学 Python,大概率是学不会的。但是如果你学过用 Excel、SQL 处理数据,那么就具备了一定的基础,再学 Python,很多概念就会理解起来比较容易。


这就好比,一个婴儿不是一上来就学习跑步(Python),而是先把走路学会,具备了走路(Excel、SQL)的基础,再跑步就容易多了。



需要注意的是,除非是工作必须要求的,其他少部分公司用的工具其实不需要学习。比如有些公司要求其他编程语言,例如 R、SPSS、SAS 这些工具。


现在 Pyhon 已经是人工智慧排名第一的编程语言了,大部分公司要求 Python,很少部分的公司要求其他的编程语言,所以学习市场要求最多的那个技能才能找到更多机会。如果你学习了少部分公司才要求的工具,那么意味著你找工作或者跳槽只能选择这些公司,而会错失其他大部分公司的求职机会,对你整个职业生涯不利。


TIOBE 编程语言排行榜是全球编程语言流行趋势的一个指标,每月更新,官网地址(https://www.tiobe.com/tiobe-index)。?下图是 2021 年 2 月份排名前 10 的编程语言的变化图,其中橙色曲线是 Python,我们会发现 Python 的流行趋势越来越高。
TIOBE 编程语言排行榜是全球编程语言流行趋势的一个指标,每月更新,官网地址(https://www.tiobe.com/tiobe-index)。?下图是 2021 年 2 月份排名前 10 的编程语言的变化图,其中橙色曲线是 Python,我们会发现 Python 的流行趋势越来越高。

3.可视化工具


常用的可视化工具包括 Excel、商业智能(BI)。


一般的可视化图表用 Excel 里的图表功能就可以实现,而且使用起来也方便。如果是要经常做报表,并且要求实现报表自动化,那么就需要用到商业智能(BI)工具。


那什么是商业智能(BI)呢?


微软官方给的定义是「使用用于自助服务和企业商业智能 (BI) 的统一、可扩展平台(该平台易于使用,可帮助获取更深入的数据见解),连接到任何数据并对数据进行可视化。 」


毫无悬念,看这种官方定义就是看不懂。简单来说就是把数据导入商业智能(BI)工具中,就可以快速对数据可视化。例如下图就是把数据导入用商业智能(BI)工具中,通过可视化数据来分析。



IDC《2019 年下半年中国商业智能软体市场数据跟踪报告》显示,在中国商业智能软体子市场中,报表分析仍是目前市场最主要的需求,2019 年全年年市场份额占比为 79.0%。高级分析和预测分析市场份额占比 21.0%(下图)。



常用的商业智能(BI)工具有哪些呢?


目前使用最多的商业智能(BI)工具是 Power BI、Tableau、帆软,选择其中任意一种学习就可以了。


4.业务知识


因为数据分析是用来解决具体行业问题的,需要从业务的角度出发,了解各个指标,以及每个指标之间的关系,还需要联系业务去理解数据。所以,工作中数据分析脱离不了业务,在分析中要找到导致问题发生的根本原因,而不只是单纯的统计数据。


因此需要具备某个行业的业务知识才能去理解这个行业里的术语、业务问题等。


业务知识包括某个行业的常用指标、业务流程。需要注意的是,不同行业的指标、业务流程是不一样的,所以需要学习的时候针对你的目标行业去学习准备。例如,下图分别是金融信贷行业、在线教育行业的业务流程。


金融信贷行业业务流程(来自书《数据分析思维》)
金融信贷行业业务流程(来自书《数据分析思维》)

在线教育业务流程(来自书《数据分析思维》)
在线教育业务流程(来自书《数据分析思维》)

如果是刚入门,这块内容做到了解即可,等进入工作以后,再慢慢深入业务,积累业务经验。具体某个行业的常用指标、业务流程可以看书《数据分析思维》,这本书里涉及了 10 多个行业的指标、业务流程。


5.数据分析思维


在数据分析相关的职位里经常会写这么一条招聘要求「具备数据分析思维」。在工作或者面试中,会经常听到分析思维、分析思路、分析方法。这三个词语有什么关系呢?其实简单来说,它们都是指分析方法。


数据分析思维需要你掌握 10 种常用的分析方法。


数据分析 10 种常用的分析方法
数据分析 10 种常用的分析方法

如果你的分析目的是想将复杂问题变得简单,就可以使用逻辑树分析方法,例如经典的费米问题就可以用这个分析方法。


如果你的分析目的是做行业分析,那么就可以用 PEST 分析方法,例如你想要研究中国少儿编程行业。


如果你想从多个角度去思考问题,那么就可以用多维度拆解分析方法,例如找相亲对象,需要从多个角度去分析是否合适。


如果你想进行对比分析,就要用到对比分析方法,例如你朋友问自己胖吗,就是在对比。


如果你想找到问题发生的原因,那么就要用到假设检验分析方法,其实破案剧里警察就是用这个方法来破案的。


如果你想知道 A 和 B 有什么关系,就要用到相关分析方法,例如豆瓣在我们喜欢的电影下面推荐和这部分电影相关的电影。


如果你想对用户留存和流失分析,就要用到群组分析方法,例如微博用户留存分析。


如果你想对用户按价值分类,那么就要用到 RFM 分析方法,例如信用卡的会员服务,就是对用户按价值分类,对不同用户使用不同的营销策略,从而做到精细化运营。


如果你想分析用户的行为或者做产品运营,就要用到 AARRR 模型分析方法,例如对拼多多的用户进行分析。


如果你想分析用户的转化,就要用到漏斗分析方法,例如店铺本周销量下降,想知道是中间哪个业务环节出了问题。


6.通用能力


通用能力包括 PPT 制作分析报告、沟通能力。


在工作中,要经常做分析结果做成数据分析报告,然后展示给业务部门、上级领导、客户等,而这种展示数据分析报告的场景常用的工具就是 PPT,所以就要求你会用 PPT 制作数据分析报告,有较好的的文字、书面总结能力。


职业社交网站领英发布的《2018 新兴工作岗位报告》报告里说,最大的技能缺口是软技能,比如口头交流、领导力和时间管理等。这份报告中建议,职场人士需要在快速变化的工作环境中,学习并保持软技能,因为拥有这些技能的人才具备更大的职场优势。


其实,任何职位都需要沟通能力,但是,数据分析师对沟通能力的要求更高。因为,数据分析师解决的是实际的问题,需要跨部门沟通业务,做好的数据分析报告也要展示给各个部门、领导、客户,只有好的沟通能力,才能让你的分析结果得到用户的认可。 那么这些通用能力如何提升呢?最直接的方式,就是通过写文章来提升。


通过写作可以同时提升你下面 3 个能力:


1)逻辑能力


写作的本质其实是把一件事情讲清楚,而逻辑能力强的人写出来的内容,读起来更顺畅。


2)文字表达能力


数据分析师要经常做数据分析报告,和通过邮件汇报分析结果。这体现的其实就是文字表达能力,提高这个能力的办法就是不断去写作。


3)沟通能力


写作其实就是把想说的话通过文字和你的用户去沟通。另外,经常在社群里提问和解答他人的问题,也可以提高你的沟通能力。你会看到不同人提问的水平是不一样的,有的人可以完整的把一个问题描述清楚,有的人说完,其他人也不明白他的问题是什么。这其实就是体现了沟通能力。


二、不同职位的数据分析能力要求有什么不一样?


经过前面的分析,我们从整体上知道了数据分析师需要掌握的能力。但并不是说,这些能力全都掌握了你才能找到一份数据分析师的工作。因为不同的职位的要求不一样的。在《职业发展前景:数据分析师的晋升通道》章节我们知道了数据分析相关职位的分类。



我把胜任力模型中的这些能力对应到不同的职位,就可以清楚的看到对应职位的能力要求(下图)。



有一个误区,很多人以为只要掌握了分析工具,就掌握了数据分析,其实不是的。从图中,我们可以看出。各个数据分析职位都需要的能力是:业务知识、分析思维、PPT、沟通能力。这些能力才可以让你从一个只会舞弄工具的普通职场人变成真正解决业务问题的职场高手。


很多人以为数据分析师需要掌握很高大的工具,其实不是的。例如腾讯里有一个岗位叫「商业数据分析师」,这听起来很高大上。其实这个职位对应的就是上图初级数据分析师的能力要求,也就是理论基础(描述统计分析),分析工具(Excel),可视化工具(Excel)。


上图中黄色标出的是相对于前一职位多出来的能力。中级数据分析师在初级数据分析师要求的能力上增加了分析工具(SQL),可视化工具(商业智能 BI)。高级数据分析师在中级数据分析师要求的能力上增加了理论基础(推论统计分析),分析工具(Python)。

Excel、SQL、Python 要掌握到什么程度?

我们知道了数据分析师最常用的分析工具是 Excel、SQL、Python。那么问题就来了,这些分析工具具体掌握哪些内容呢?


一、Excel 需要掌握下面的知识点:



1)数据清洗相关的功能


查找和删除重复数据,对应的是 Excel 里的删除重复项功能。


数据抽取,也就是从一堆杂乱的数据中找出想要的数据,例如薪资「10k-20k」,需要从中截取出最低薪水「10」和最高薪水「20」,这就要用到 Excel 的字元串截取函数 left、right、mid)。


数据计算函数,包括平均值(average)、求和(sum)、最大值(max)、最小值(min)等),日期函数(date),判断函数(if,or,countif)。


2)数据分析相关的功能

最低 0.3 元/天开通会员,查看完整内容

购买该盐选专栏查看完整 10 篇内容

盐选专栏

数据分析入行指南:助你互联网行业发展有「钱」途

猴子 猴子数据分析学院创始人,著有畅销书《数据分析思维》

¥9.90 会员免费

发布于 03-10继续浏览内容知乎发现更大的世界打开Chrome继续爱数据-橙子爱数据-橙子0基础入职数据分析师

首先你要先做的是背景评估,是否适合学习并且做数据分析,因为不是所有人都适合转行或学习数据分析,比如专业极度不相关,年龄较大或者城市基因不匹配的都不适合学,因为我们最终是以入职为目标的。

假设你全都满足的情况我们都需要学习什么呢?

我们可以先分析一个JD

以上我们很清晰的分析出数据分析师要具备以下5种能力:他们分别是数据工具、业务理解、沟通表达、思维逻辑和报告撰写

从初级数据分析师招聘要求的必须技能来看,主要包括理论知识工具实践两部分内容。

理论部分统计学:为什么将统计学放在第一位呢?因为统计学是数据分析的基石,而且统计分析可以解决日常大部分的分析需求。统计学这部分内容需要学习描述统计、假设检验、贝叶斯、概率、分布、抽样、线性回归、时间序列等内容。数据分析方法论:这里要学习一些数据分析常用到分析方法,如趋势分析法、对比分析法、多维分解法、用户细查、漏斗分析、留存分析、AB测试法、4P理论、PESTEL理论、SWOT分析、5W2H理论、逻辑树理论、用户使用行为理论、AARRR模型等。

工具部分

Excel:它是最基础的数据分析工具。在学习的Excel的时候需要重点掌握:常用函数的使用、快捷键操作、基础图表制作、数据透视表、Vlookup等。另外Excel还可以导入一些模板来使用,典型的包括数据分析模块、做假设检验经常用到;规划求解,做线性规划和决策等问题非常有效。SQL:它是数据分析的核心技能,SQL要重点学习Select,聚合函数、以及条件查询(Where、Group by、Order by等)PPT:用来和业务部门交流需求,展示分析结果。Python:主要学习Numpy、Pandas、Matplotlib、Seaborn等内容。Python 的底层是用 C 语言写的,很多标准库和第三方库也都是用 C 写的,在处理数据时候运行速度非常快。这里需要注意的是不同公司对工具的要求也不同,例如有些公司要求会使用R语言、SPSS等,具体学哪一个工具可以参照JD要求,其中Excel、SQL和PPT是必备的基础技能工具

学习可以分为两个途径:

1.自学:需要有极强的自律性,以及对学习资料和内容筛选的能力。否则效率会非常的低,而且一定要制定学习计划,根据学习计划执行。包括你要投递简历的时间,入职的时间等等。都要给自己一个规划。否则会容易懈怠。资料可以去通过一些行业领域的公众号,数据领域相关网站以及知乎,B站等去获取。

2.报班:效率会相对比较高,而且会非常快速的收获并且融入数据圈获得更多资源。让自己有一个更好的发展路径规划。但是选择机构就要非常的谨慎,避免掉坑。可以从师资力量(讲师是否在职,切记纸上谈兵的讲师),课程实用性(要有实战以及真实资料库),职场支持(根据城市基因个人背景做支持,忌所谓的包就业)等内容综合做评估

最后,一定给自己做一个职业规划,了解不同层级的数据分析师要掌握什么技能,想清楚自己未来的目标岗位,不断的去学习和提升自己,再一步步朝著目标迈进。

希望以上回答对题主以及刚刚想步入数据领域的小伙伴有帮助,欢迎同样困惑的小伙伴可以私信我。或者留言评论进橙子数据学习社群


首先你要先做的是背景评估,是否适合学习并且做数据分析,因为不是所有人都适合转行或学习数据分析,比如专业极度不相关,年龄较大或者城市基因不匹配的都不适合学,因为我们最终是以入职为目标的。

假设你全都满足的情况我们都需要学习什么呢?

我们可以先分析一个JD

以上我们很清晰的分析出数据分析师要具备以下5种能力:他们分别是数据工具、业务理解、沟通表达、思维逻辑和报告撰写

从初级数据分析师招聘要求的必须技能来看,主要包括理论知识工具实践两部分内容。

理论部分统计学:为什么将统计学放在第一位呢?因为统计学是数据分析的基石,而且统计分析可以解决日常大部分的分析需求。统计学这部分内容需要学习描述统计、假设检验、贝叶斯、概率、分布、抽样、线性回归、时间序列等内容。数据分析方法论:这里要学习一些数据分析常用到分析方法,如趋势分析法、对比分析法、多维分解法、用户细查、漏斗分析、留存分析、AB测试法、4P理论、PESTEL理论、SWOT分析、5W2H理论、逻辑树理论、用户使用行为理论、AARRR模型等。

工具部分

Excel:它是最基础的数据分析工具。在学习的Excel的时候需要重点掌握:常用函数的使用、快捷键操作、基础图表制作、数据透视表、Vlookup等。另外Excel还可以导入一些模板来使用,典型的包括数据分析模块、做假设检验经常用到;规划求解,做线性规划和决策等问题非常有效。SQL:它是数据分析的核心技能,SQL要重点学习Select,聚合函数、以及条件查询(Where、Group by、Order by等)PPT:用来和业务部门交流需求,展示分析结果。Python:主要学习Numpy、Pandas、Matplotlib、Seaborn等内容。Python 的底层是用 C 语言写的,很多标准库和第三方库也都是用 C 写的,在处理数据时候运行速度非常快。这里需要注意的是不同公司对工具的要求也不同,例如有些公司要求会使用R语言、SPSS等,具体学哪一个工具可以参照JD要求,其中Excel、SQL和PPT是必备的基础技能工具

学习可以分为两个途径:

1.自学:需要有极强的自律性,以及对学习资料和内容筛选的能力。否则效率会非常的低,而且一定要制定学习计划,根据学习计划执行。包括你要投递简历的时间,入职的时间等等。都要给自己一个规划。否则会容易懈怠。资料可以去通过一些行业领域的公众号,数据领域相关网站以及知乎,B站等去获取。

2.报班:效率会相对比较高,而且会非常快速的收获并且融入数据圈获得更多资源。让自己有一个更好的发展路径规划。但是选择机构就要非常的谨慎,避免掉坑。可以从师资力量(讲师是否在职,切记纸上谈兵的讲师),课程实用性(要有实战以及真实资料库),职场支持(根据城市基因个人背景做支持,忌所谓的包就业)等内容综合做评估

最后,一定给自己做一个职业规划,了解不同层级的数据分析师要掌握什么技能,想清楚自己未来的目标岗位,不断的去学习和提升自己,再一步步朝著目标迈进。

希望以上回答对题主以及刚刚想步入数据领域的小伙伴有帮助,欢迎同样困惑的小伙伴可以私信我。或者留言评论进橙子数据学习社群


分为三步。最后一步最关键

第一步

网站资源有很多,我推荐你上3Wschool把SQL和python的基础语法学习一遍。然后百度搜索SQL练习题面试题。python你可以上Kaggle的数据竞赛中寻找入门级的比赛。因为代码开源,你可以自己复制下来,然后一行行在IDE当中做输入输出。这是基础的搜索能力,你自己必须去做,去把陌生的知识运用到入门。

第二步

通过视频网站学习,可以跟著老师的视频讲解学习消化知识点的思路和消化好难一点的进阶知识内容给你带来知识的解疑和答惑。推荐你去天善智能这个学习网站。天善智能的网站足够你学习的了,入门和进阶的数据课程都有,我自己也在天善智能有录制课程。有兴趣可以看看。

第三步

第一步和第二步的总计划执行时间不要超过两个月。趁热打铁去面试,去实习去工作,去了解市场对于技能的真正需求和熟练度。

学习,是为了运用,也只有运用、才会让你真正学到知识和技能!

加油,等你运用熟练后,给公司带去生产力的贡献和需求输出后,你将获得劳动回报,兵家所言重赏之下必有勇夫,劳动报酬这是会真正让你更进一步突破数据科学劳动技能的巨大动力!

第三步最为关键,第一步和第二步是基础训练。

你一定可以的。有问题需要交流你向我私信亦可。


推荐阅读:
相关文章