如何进行数据分析?成为数据分析师应该怎么做?


做数据分析需要以目标为导向,更多的是要关注多个数据维度之间的相关关系,而不是单个数据产生的因果关系!

一. 培养数据分析的系统化思维

数据分析一般会存在两种方向,一种是自上而下,另一种是自下而上。

自上而下的思路在前文已经提到过,具体的思路为:确立数据分析目标——目标影响维度拆解——各数据维度相关关系建立——发现问题数据及出现原因——问题数据优化,这种思路多用户产品的数据分析体系或者模型的建立,从而保证数据分析的全面性。

自下而上的数据分析思路多用在针对已有数据报表中的数据问题发现,具体思路为:异常数据发现——该异常数据影响因素——影响因素与问题数据之间的相关关系——找出出现异常数据的原因——找到异常数据的解决办法。

二 .培养数据的敏感度

数据敏感度培养别无他法,除了掌握正确的数据分析方法外,就是每天看数据,每天分析数据,用数据说话。

三.需要掌握的各项技能

作为数据分析师,在工具使用上需要熟练掌握Excel、SQL、PPT、Python等工具。

· Excel是日常工作中用到的最多的工具,常用的函数及数据透视表都要学。

· SQL是数据分析的核心工具,主要学习Select、聚合函数以及条件查询等内容。

· Python重点掌握Pandas数据结构、Matplotlib库、Pyecharts库及Numpy数组。

对于工具来说,不同行业对工具的要求也会有差异,比如金融行业要求SAS等,一般情况下Excel、SQL、PPT、Python这4种工具能搞定大部分的数据分析工作

那么除了工具技能外,作为数据分析师还要了解统计学知识及数据分析方法、要有一定的数据思维,能够独立完成数据报告的撰写等

希望我的回答对你有帮助,如果有不清楚的可以私信我哈


题主问了两个问题,一个个来看,首先是如何进行数据分析?

想要做数据分析总结起来就是一句话:

数据分析,就是针对某个问题,将获取后的数据用分析手段加以处理,并发现业务价值的过程。

我把五个关键词给加粗了,这一句话,基本上可以包含数据分析所必须的流程点,我们一个个讲

1、首先第一个关键词是「问题」

我们可以把这个词解释「发现问题」或者是「目标问题」,这个关键词的核心是——目标。

数据分析一定要有目标!哪怕业务人员给你提出的问题或者需求,根本不是那么明确和清晰,你也要找到自己要分析的目标!这是太多人经常会犯的错误了,很多人知道数据分析要有目标,但是在实际过程中就成了摆设、花架子、无用功,最后你会变成了什么呢?就是取数机器。你会发现,你会陷入一个恶性循环,取数、发现没用-然后取更多的数-直到满足业务方的需求。

举个最简单的例子,业务方最近新上线了一个功能,想让你分析一下目前这个功能的使用情况。这时候你该怎么做?你会觉得「分析业务功能情况」是目标,然后根据这个模糊的目标你只能做一些描述性的统计分析,告诉业务方每天UV的最大值,最小值,中位数,平均数,方差,标准差……看起来很厉害的样子,但这些数据有啥意义呢。

这样子的目标就是在做样子,那么我们应该怎么做呢?

一是要明确业务方的需求是什么,然后分析业务最终的目的,把这个目的进行拆解;比如刚才的例子,业务真正想要了解的是什么,是这个新功能的目的吧,是为了提升客户的留存率,还是为了提升客户的转化率,还是其他的;然后再把这个目的给拆解,确定我们的指标,然后再进行分析。这才是真正的目标思维。

2、第二个关键词是「获取」,叫做「数据获取」或者「数据采集」

数据采集就是将原始数据从资料库中取出来,数据分析师在这一步更为重要的工作是搞清楚数据放在哪里+怎么把数据取出来这么两件事。

数据存放在哪里?

很简单的答案,很多人都知道公司的业务数据一般都是放在资料库里的,但是相同的资料库,数据源不一样相同,我们所取的数据一定保证数据源的一致,否则会造成数据混乱,比如说

  • 不同的数据存储系统,mysol、oracle、sqlserver等等
  • 数据仓库结构以及各库表之间的关联方式也可能有所不同,星型?雪花型?
  • 数据指标是否相同,名称、含义、栏位类型、约束条件等等?
  • 是否经过了ETL处理,清洗规则是什么样的?

这些都是我们在进行数据提取之前所必需了解的。

那么怎么把数据取出来呢?

其实只要搞清楚了数据放在那里,取出来就是水到渠成的事情。一般来说SQL是进行数据采集的必备技能,目前也是数据分析实际业务场景中最常使用的取数方式。当然了,能取出什么样的数据,也要看你是否精通sql,比如单张资料库表的提取很容易就做到了,但是跨表查询提取的时候很多人就不行了。再比如更为复杂一点的复杂查询、联机处理等等,这些做数仓的人用的很多,我们数据分析师不必设计这么深,我们只要熟练掌握就行了

3、第三个关键词是「数据」

这里说的数据是广义上的数据,包括资料库中的数据,也可以概括为数据场景,也可以理解为经过清洗后的数据。总之,这个数据指的是我们可以直接拿来分析的信息,而不是一堆脏乱差的原始数据。

比如说数据场景,很多人都问我为什么看资料看的好好的,一到实际业务场景中都歇菜了。只是因为在实际业务分析中,我们分析的不是数据,而是场景,那我们怎么根据场景找数据呢?最重要的方法是建立分析指标体系;

我很喜欢用点线面体的定义来解释指标体系,如果用点线面来解释,搭建分析指标体系就是分析整个「体」,将分析框架的体系化,明确每个点都是什么指标,任何一个分析路径都能对应到指标。

以电商为例,我们在取数前遵循「人货场」的思维逻辑,这就是我们的体,我们的大体指标框架。然后我们要找人货场各自的业务逻辑,也就是场景,电商常用的业务分析场景有哪些呢?无非就是销售、商品、渠道、竞品、会员等等,这就是我们的面。而商品可进一步细分为商品的库存、商品的利润以及关联销售分析,这就是线和点。总结起来就是,在整个业务分析体系中,确保先分析什么,后分析什么,从体及线,从线及点,有了点,我们就知道该需要什么数据了。

4、第四个关键词是「分析手段处理」

这里就是我们狭义上所说的数据分析了,根据实际场景需要可以分为四种:描述分析、统计分析、挖掘分析、建模分析,这一点是我们之后要讲的核心内容,就是如何结合实际业务进行分析。

比如说描述分析,其实就是数据分析思维,其实业务很喜欢让你做描述性的分析,因为不会用到演算法之类的东西,业务能看得懂,就能跟你扯皮。

比如说数理分析,基本要用到一些数理统计学基础的分析方法,比如聚类、回归等

第三个是建模分析,也就是数据分析模型,常见的一些有帕累托、漏斗模型等等

最后就是挖掘分析,基于我们的一些数据分析和挖掘工具,比如常用的excel和python,bi也有很多人喜欢用,因为比较简单

5、最后一个关键词是「业务价值」,这是数据分析最核心也是最终的目的

终于到了最后一个关键词,业务价值。那企业是做什么的呢?企业的作用是向市场提供产品或服务,为客户创造价值。那我们数据分析就是为企业提供服务和产品,为企业创造价值。

业务会为什么会找我们做数据分析?其实就是为了实现业务价值,价值体现在两点:

一是将盈利时间拉长,一是将单位时间内盈利量做大。

第一点,需创造的价值让越来越多的客户知道并认可,获得用户粘性,从而实现持续增长,其实就是用户体验;第二点,需提高企业创造价值的效率。

所以我们要做的数据分析也要跟紧紧贴合这两个点,这就要求我们在进行数据分析最后一步——数据可视化、数据报告等等时,要紧紧贴合业务,给领导或者业务最想看的数据

第二个问题是怎么成为数据分析师?

还是一句话,先基础、再业务、最后工具

1、先掌握数据分析的基础思维、方法

做数据分析师十之八九都会面临以下情景:「我们有一堆数,你分析分析吧,看看能有什么结果。」

有经验的分析师因为经验老道,会清楚地知道从什么角度分析,可以解决哪些问题,适用于哪些场景,预计产生什么结果,会将业务问题转化为数据分析问题。因此数据分析师要具备用数据分析思路和方法,具备分析思维来考虑问题的能力。

那作为小白,在没有项目经验时候,可以充分利用模仿技能,参考他人优秀的分析思路和方法。实际业务分析的大多数问题都是有前车之鉴可以学习的。很多分析已经是成熟的分析方法,例如客户画像,营销提升,网站运营,信用卡评分,欺诈作弊等等。

学习领会他人的分析思路,转化为自己的知识,是迈出分析的第一步。

当模仿别人的分析思路和方法时候,分析大方向已经确定了,具体部分需要结合自己的项目情况进行细化。如果只是简单的数据汇总就能解决的问题就可以直接进入实操阶段,但是如果发现需要运营一些复杂的分析方法,则不得不恶补专业知识。

例如做营销提升,看到多数分析思路中都提到了产品关联分析。什么是产品关联分析,需要具备哪些数据,用什么演算法,结果怎么应用,产品关联分析适不适合你目前的场景,这些问题需要恶补分析知识才能回答出来。

2、熟悉业务知识

所有数据分析师都会告诉后来人「业务知识很重要」,因为大家在踩了坑之后才恍然大悟分析中遇到的很多难题问题都源于对业务的不了解。数据分析可以说是一门通用的技术,可以运用于各行各业,但是想在行业中成功则需要结合行业知识。

例如,同样是对客户进行分析,互联网电商的客户与保险客户具有明显区别,前者重视来源,活跃度,购买率,流失率,后者关注渠道,报价,理赔风险,投诉。业务知识包括这种大方向的行业知识,也包括公司内部特殊情况,了解得越详细可以避免绕很多弯路。

例如,有些行为是内部人员参与的造成的数据异常要提前做处理,有些业务开展是带地区特性的,分析时候要区分对待等。

3、分析工具

真正做分析时候,你会发现市面上有太多的分析工具,需要掌握的实在是太多了,其实不必纠结于此,依据个人能力,配合当前的数据分析环境,适用的工具自然会被选出。

数据分析过来人都会说80%的时间都在做数据处理工作,所以数据处理能力是必须的,简单工具有Excel、SQL,复杂的有R,Python,Java。商业工具的报表finereport,SASS。

然后分析建模的能力,鉴于目前有丰富的演算法与成熟的模型调用机制包括商业软体,开源工具等,多数时候仅需要懂得演算法原理,然后在实际中调用工具实现即可,不必惊慌。

最后是分析结果展示能力,如果是报告或报表则需要运用图表,有效表达分析观点,使分析结果一目了然。图形的选择、版式的设计、颜色的搭配等等,需要掌握一定技巧。


如果进行数据分析,背景、数据、目的都没有,这个问题太宽泛了。

具体怎么成为数据分析师,去招聘网站多看一些JD学会基本技能,然后在工作中结合业务使用精进,当然目标是解决问题。


数据分析在每个行业都需要运用到,尤其是涉及业务版块的。数据分析又是一个外人看著很费力很复杂的事情,但是只要找到分析的基本办法,也是一件很容易的事情。如何进行数据分析,下面这几点大家不妨参考一下!

北京联科数信科技有限公司-长期招聘岗位?

mp.weixin.qq.com图标

(本公司目前也在招一些数据分析师,关注上面公司公众号,符合条件的可以投递简历(可培养!!!),欢迎各位童鞋踊跃投递!)

第一你要明白什么是数据分析?

数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。这一过程也是质量管理体系的支持过程。在实用中,数据分析可帮助人们作出判断,以便采取适当行动。

第二你要知道数据分析的目的:

目前世界500强企业中,有90%以上都建立了数据分析部门,为什么要这么做,数据隐含这价值,这就需要我们把隐藏在一大批看似杂乱无章的数据背后的信息集中和提炼出来,总结出研究对象的内在

第三、数据分析的分类

数据分析的三大作用:现状分析、原因分析、预测分析。

第四、数据分析流程(如何进行数据分析):

1.明确目的和思路

首先明白本次的目的,梳理分析思路,并搭建整体分析框架,把分析目的分解,化为若干的点,清晰明了,即分析的目的,用户什么样的,如何具体开展数据分析,需要从哪几个角度进行分析,采用哪些分析指标(各类分析指标需合理搭配使用)。同时,确保分析框架的体系化和逻辑性。

2.数据收集

根据目的和需求,对数据分析的整体流程梳理,找到自己的数据源,进行数据分析,一般数据来源于四种方式:资料库、第三方数据统计工具、专业的调研机构的统计年鉴或报告(如艾瑞资讯)、市场调查。

对于数据的收集需要预先做埋点,在发布前一定要经过谨慎的校验和测试,因为一旦版本发布出去而数据采集出了问题,就获取不到所需要的数据,影响分析。

3.数据处理

数据收集就会有各种各样的数据,有些是有效的有些是无用的,这时候我们就要根据目的,对数据进行处理,处理主要包括数据清洗、数据转化、数据提取、数据计算等处理方法,将各种原始数据加工成为产品经理需要的直观的可看数据。

4.数据分析

数据处理好之后,就要进行数据分析,数据分析是用适当的分析方法及工具,对处理过的数据进行分析,提取有价值的信息,形成有效结论的过程。

常用的数据分析工具,掌握Excel的数据透视表,就能解决大多数的问题。需要的话,可以再有针对性的学习SPSS、SAS等。

数据挖掘是一种高级的数据分析方法,你需要掌握数据挖掘基础理论,资料库操作Phython,R语言, Java 等编程语言的使用以及高级的数据可视化技术。要侧重解决四类数据分析问题:分类、聚类、关联和预测,重点在寻找模式与规律。

5.数据展现

一般情况下,数据是通过表格和图形的方式来呈现的。常用的数据图表包括饼图、柱形图、条形图、折线图、气泡图、散点图、雷达图等。进一步加工整理变成我们需要的图形,如金字塔图、矩阵图、漏斗图、帕雷托图等。

6.报告撰写

撰写报告一定要图文结合,清晰明了,框架一定要清楚,能够让阅读者读懂才行。结构清晰、主次分明可以使阅读者正确理解报告内容;图文并茂,可以令数据更加生动活泼,提高视觉冲击力,有助于阅读者更形象、直观地看清楚问题和结论,从而产生思考。

好的数据分析报告需要有明确的结论、建议或解决方案。

数据分析的四大误区

1.目的不明确,为了做而作,导致分析效果不明确;

2.对与行业、公司业务还有其他考虑因素认知不清楚,分析结果偏离实际。数据必须要结合企业业务和行业性质才有意义。摸清楚所在产业链的整个结构,对行业的上游和下游的经营情况有大致的了解,再根据业务当前的需要,制定发展计划,归类出需要整理的数据。同时,熟悉业务才能看到数据背后隐藏的信息;

3.为了方法而方法,为了工具而工具,只要能解决问题的方法和工具就是好的方法和工具;

4.数据本身是客观的,但被解读出来的数据是主观的。同样的数据由不同的人分析很可能得出完全相反的结论,所以一定不能提前带著观点去分析。

每个人都有自己的工作方法,但是数据分析是个很有逻辑的工作,要做好数据分析一定要合情合理,逻辑思路一定要处理清楚,数据分析就要产生价值,只有做到这些才算真正的做好了这份工作。

就先和大家分享到这里,有其他问题的可以私信我或者加助理V,我看到了就会帮你解答的。


好的分析师要做好一个杠精。

很多分析师觉得我只负责收集整理数据以及解读数据,至于你业务部门怎么用,那是业务部门的事情。

这种「与我无关」的想法非常普遍,如果说划清界限能够让自己的工作更加专注或者产出价值更大倒也还好,但是划清界限的结果反而是会导致分析师的工作价值无法凸显,最后形成自证预言,成为一个组织里面的边缘角色,组织的业务发展基本就与你无关了。

这种心态上的问题本质上是对分析师这个岗位的误会,认为分析师主要和数据打交道就可以了,不需要与其他部门去沟通和交流,这种天大的错觉在于「数据分析师」这个title带来的错误引导。

数据分析师的重点一定不在于「数据」,而是在于「分析」,这是我说过很多遍的观点,只是因为现在信息爆炸,数据足够多,需要有人去条分缕析地将数据给整理出来,所以才出现了专门的「数据分析师」。

但是如果你专注于「数据整理」,那么本质上跟传统制造业流水线上的工人没有什么区别,只不过工人们处理的是实物,而分析师处理的是虚拟的数据,「智能制造」都拉开大幕了,定位于流水线上的数据分析师被淘汰还会远吗?

当然也不用过于恐慌,虽然我认为数据分析师只是一个过渡岗位,但是现阶段依然是一个不可或缺的角色。作为个人我们所要做的就是在被淘汰之前如何提升自己的全局思维能力,让自己能够跳出「数据」的桎梏。

不要让自己「只见树木不见森林」,关注链条上的上游和下游。

在需求方跟你提一个数据需求的时候,多问两句,为什么会产生这个需求,他的思考逻辑和链条是什么样的。但是其实很多时候需求方自己也没想很清楚,于是这种时候就要跟他一起把这个链条捋清楚。

这里有一个很简单的方法,多问几个「然后呢?」,做一个惹人嫌的杠精。

需求方:帮我看一下昨天X数据表现怎么样吧?

分析师:我看了然后呢?这个数据之后对于你们的策略有什么指导吗?需求方:你先分析啊,分析完不就知道有什么帮助了。分析师:假设我现在分析完了,数据表现很好,然后呢?你们会做什么?需求方:那就说明我们前段时间的A策略很有效,接下来需要进一步推广执行。分析师:具体是什么策略?决策思路是什么?为什么你们觉得A策略会影响X数据呢?需求方:……分析师:或者数据表现很差,然后呢?你们会做什么?需求方:那就说明我们前端时间的A策略效果不好,接下来需要调整策略。分析师:为什么X数据不好就一定是A策略的问题呢?你们同期有做别的事情可能影响X数据吗?需求方:……

然后就不会有需求方再来给你提需求了。

开个玩笑,凡是经过你这样一番追问之后还能给出自圆其说的思考的需求方,才是靠谱的需求方,同时你也能够知道你给出了分析之后对于下游链条的影响。

而那些答不上来的,说明他们自己也没有想清楚,为什么要给他们做分析呢?


野生分析师,主要在电商和酒店行业,欢迎交流,关注我的微信公众号(西城慢慢爬)。


推荐阅读:
相关文章