做数据分析有哪些有趣的套路?

Sally 2018-01-29 15:47:37.0
1

数据分析给人感觉就是很高深的学问,让我做的话,就会很头疼,老是找不到切入点,我也在学习分析入门,理论知识太多,有点绕晕了,有没有人能指点一下,有哪些常用的套路?

评论(25
请先登录后再发表评论
咕噜大人 2018-02-01 15:32:47.0 回复
0

统计学是基础,打好基础,才能建高楼大厦,对吧,推荐书:深入浅出统计学 (豆瓣)

Joyce 2018-02-01 15:41:35.0 回复
0
回复咕噜大人:

我本来以为数据分析好有趣的,再去读一遍统计学,太无聊了吧

Diane 2018-02-03 12:10:35.0 回复
0
回复Joyce:

有趣的前提是,你可以找到一个有趣的切入点做数据分析,也得出一些惊掉人下巴的结论,就像那个老掉牙的啤酒与尿布案例,到了现在依然被拿出来讲。。。

爱丽丝 2018-02-03 12:14:07.0 回复
0

套路就是要附带解决方案,哈哈哈,用我的话说呢,数据分析就是用老板给你的一堆干巴巴的数据,把他变成一朵花一样的报表,然后还得附加上你为老板找出的企业问题,哦,对了如果你不附上解决办法,老板会不开心的,嗯还不能只有一套解决办法,so,明白了吗?

Diane 2018-02-03 12:14:52.0 回复
0
回复爱丽丝:

看你负责哪块工作吧,偏业务的就得应对业务中出现的各种问题,给出解答和建议;偏技术的会更像工程师,设计些算法什么的。

Julie 2018-02-03 12:15:33.0 回复
0
回复Diane:

同感,握手

浮生若梦 2018-02-03 14:25:55.0 回复
0

数据分析最重要的是什么呢? 

是合适,很多人在刚开始接触数据分析时候就恶补高级算法,高级图表,然后用的很生疏,表达的思想也不够准确,导致领导并不能很好的从数据分析报告里获取有用信息,这就像什么呢?我就是一个很平凡的普通人,你非得把英皇皇室的公主介绍给我做女朋友,我就比较尴尬了,那生活层面不一样,不搭嘎,虽然在一起了,那多累啊,是不是。

Sally 2018-02-03 14:27:51.0 回复
0
回复浮生若梦:

什么样的女朋友才是合适的?

浮生若梦 2018-02-03 14:29:44.0 回复
0
回复Sally:

选择女朋友,就是先看看自己的基本情况,再看看有哪些可以选择,选一个喜欢的看着舒服的,就是合适了。以图表来展示数据,其实就是,什么样的数据,配什么样的图表。当然不管你用什么工具,做好一个图表的前提是理解数据。

Sally 2018-02-03 14:34:22.0 回复
0
回复浮生若梦:

理解数据,这个概念有点头大,可以具体说说吗?

浮生若梦 2018-02-03 14:40:05.0 回复
0
回复Sally:

首先,我们需要了解,数据通常包含五种相关关系:构成、比较、趋势、分布及联系。 

构成主要关注每个部分所占整体的百分比,如果你想表达的信息包括:“份额”、“百分比”以及“预计将达到百分之多少”,这时候可以用到饼图; 

比较可以展示事物的排列顺序——是差不多,还是一个比另一个更多或更少呢?“大于”、“小于”或者“大致相当”都是比较相对关系中的关键词,这时候会首选条图; 

趋势是最常见的一种时间序列关系,关心数据如何随着时间变化而变化,每周、每月、每年的变化趋势是增长、减少、上下波动或基本不变,这时候使用线图更好地表现指标随时间呈现的趋势; 

分布是关心各数值范围内各包含了多少项目,典型的信息会包含:“集中”、“频率”与“分布”等,这时候使用柱图;同时,还可以根据地理位置数据,通过地图展示不同分布特征; 

联系主要查看两个变量之间是否表达出我们预期所要证明的模式关系,比如预期销售额可能随着折扣幅度的增长而增长,这时候可以用气泡图来展示,用于表达“与……有关”、“随……而增长”、“随……而不同”变量间的关系。 

对信息中包含的5种关系,可以简单归纳如下: 

构成:占总体的百分比 

比较:项目的排名 

趋势:如何随着时间变化 

分布:项目的频率情况 

联系:变量之间的关系

浮生若梦 2018-02-03 14:41:08.0 回复
0
回复Sally:

其次就是要了解每个数据图表适用的场景,才能根据工作需求制作对应的图表。这个我简单说一下,图表包括条形图、柱状图、饼/环图、折线图、双轴图等常见图表,还有词云、漏斗图、桑基图、树图、旭日图、行政地图等高级图表,其中,饼图、柱图、条图、线图、气泡图是最常用的,别看都是基本图表,只要能简单直接地展示清楚数据结果,让人一目了然的图表就是好图表,这些已经可以组成可视化报告90%图形,想要更酷炫的视觉化展示可以将图表组合起来综合使用。其他的自己多去看看可视化图表工具的各类图表使用说明就知道了。

Marie 2018-02-03 14:44:52.0 回复
0
回复浮生若梦:

每次做报告,都不知怎么选图表,要是有一种工具能根据数据结构,自动生成或者是推荐合适的图形就perfect了

浮生若梦 2018-02-03 14:45:18.0 回复
0
回复Marie:

tableau挺符合你需求的,只是收费太贵,不建议入门就买,初期还是努力学好Excel吧

不爱雨的孩子 2018-02-04 10:07:35.0 回复
0

提起数据分析,不少人头疼,也有不少人大手一挥小意思,还有不少人在一点一点突破自己追求完美,下面给大家理一下思路,整理了数据分析的六部曲,有更多想法的可以一起交流。 

第一步:明确分析目的和思路 你得知道你这次分析是为了挖掘什么问题,寻找哪个部门的不足,确定哪个项目成功的原因等等,你得知道你要干嘛。这是首要,其次就是要明白你完成这个目标的思路,没思路?OK,不着急,后边会讲到。

 首先要给大家普及的一个名词,叫数据分析方法论,这个词通俗来讲就是你的本次数据分析的一个目的和思路,有很多比较厉害的老板,在接收到一份数据分析报表时候,喜欢问一句,你的数据分析方法论简单讲一下,看看你分析的思路是不是清晰,就能确定你的报表是否有价值,所以,这个方法论的确立就非常重要了。 

那么如何确立自己的数据分析方法论呢?有两点,第一点就是肚子里要有货,第二点,建立自己的数据分析方法论,而且,很容易。那么看来第一点比较重要了,那么第一点的货到底是什么呢?分为两类:第一类营销理论模型,4P、用户使用行为、STP理论,SWOT,这四个理论模型,第二类是管理方面理论,PEST、5W2H、时间管理、生命周期、逻辑树、金字塔、SMART原则,等等这些理论,你需要做的就是打开电脑,去一一百度这些名词,一个个熟记于心,就好,如果你感觉精力不够,那就先去学习我加黑的理论模型,不难的,一看就能明白,这是基础,好好学习。

第二步:数据收集 俗话说巧妇难为无米之炊,所以,咱们搞数据分析的,就必须有数据不是,但是这数据怎么来,形式就很多样了,是不是,可以是公司端游收集的数据,可以是网站下载的数据,可以是公司数据库储存的数据,反正不可以是自己编的数据。 要深入了解数据来源,和一些数据录入方法,以及数据储存方式,等等,还有多余精力的话,可以去掌握一些爬虫工具的用法,对以后的工作肯定是大帮助的。这里不深入讲,略过,后期拔高可以拐回来学习。

Roger 2018-02-04 10:16:59.0 回复
0
回复不爱雨的孩子:

STP理论我查到了,看百度百科上的《STP理论

市场细分(MarketSegmentation)的概念是美国营销学家温德尔·史密斯(Wendell Smith)在1956年最早提出的,此后,美国营销学家菲利浦·科特勒进一步发展和完善了温德尔·史密斯的理论并最终形成了成熟的STP理论——市场细分(Segmentation)、目标市场选择(Targeting)和定位(Positioning)。它是战略营销的核心内容。STP理论中的S、T、P分别是Segmenting、Targeting、Positioning三个英文单词的缩写,即市场细分、目标市场和市场定位

要是有跟实际结合的例子就好了。这个STP太大了,数据分析在里面到底应该怎么做?

北冥有鱼 2018-02-06 17:49:07.0 回复
0
回复Roger:

这个不好举例,我只知道在房地产行业里把stp运用得不错的应该是万科

北冥有鱼 2018-02-06 17:55:35.0 回复
0
回复Roger:

刚找到一个分析报告,主要是分析市场细分的

https://wenku.baidu.com/view/ad5e7387ec3a87c24028c450.html

不爱雨的孩子 2018-02-04 10:07:45.0 回复
0

第三步:数据处理 为什么要数据处理呢?这个原因大家不说都明白,因为每次收集好数据,打开Excel的那一刻,心真的是提起来的,打开之后,哦,我的天呐,啪嚓,碎了一地儿的渣渣末啊,数据那叫一个乱,缺的缺,错的错,字体格式也是五花八门,非常有个性,想模仿都困难,所以,咱们对数据的一个处理,就非常有必要了,我们只有把数据变成我们数据的模样,才可以进行下一关。 这部分的话,主要是学习一些数据处理时的心态,要讲求三心二意:信心,细心,平常心,诚意,合意,讲的就是你能不能在整理了三四小时的数据,突然电脑断电了,数据全没了,然后等来电默默打开电脑,重新整理,我就试过,虽然很想卧擦,但是也没啥,神不知,鬼不觉,不过现在电脑文件都比较智能了,会自动保存一些的,这是心态。还有就是数据的一个清洗,要清洗的是重复的数据、缺失的数据、逻辑错误的数据,还有就是对数据进行加工,比如数据抽取,数据计算,数据分组,数据转换,最后是数据抽样的一些方法。

Sally 2018-02-04 10:11:01.0 回复
0
回复不爱雨的孩子:

晕了,感觉像教科书,有没有个实际例子?

开放数据风向标Mary 2018-02-04 10:12:50.0 回复
0
回复Sally:

我觉得这个例子好,很多套路都忽视了数据的清洗和探测,数据不是那么好收集的,里面的坏数据怎么办,里面的数据是否符合统计分布要求,都需要探测和清洗。如果把这个重要步骤忽略了,剩下的套路都是没有用的。我们推出城市要素库就想给数据分析师提供一个数据探索和观察的平台

诺一鹿相随 2018-02-04 10:14:59.0 回复
0

其实数据分析的套路(土办法)也就那么一回事儿,简单一点的说

01.确定问题 首先,应该明确自己要分析的问题,才能入手开始做 

02.数据来源 现在我们已经知道了我们要去研究怎样的问题了,下一个很重要的问题就是数据来源哪里?抓怎样的数据?抓怎样的数据可以帮我我们解释我们提出的待分析的问题。 

比如我们想研究淘宝的某个商品是否存在刷单行为,那我们就要想:刷单的行为有什么特征?显然,刷单的商品评论正常都会出现:短时间内突然出现超多商品评论,并且这些评论可能有很多是一样的内容。明确这一点,我们只需要去把这个商品的所有平均数据都提取出来。 

通过上面两个例子,你应该会发现:idea很重要,要分析怎样的问题,数据来源哪里,因此通常第一步第二步是最重要的。  

03.数据抓取 上一步已经确定了数据来源,有了数据我们才能进行分析,所以紧接着我们就要做数据采集。怎么爬数据?学习Python确实要一段时间,不妨考虑一些免费的网络爬虫软件,像集搜客这种网络爬虫,即免费有容易使用 

04.数据可视化 如何做可视化?其实没有那么难,我们都熟悉的excel就可以用来做数据可视化,excel 的功能其实非常的强大,只要我们稍微花点心思学习一下。

tigo 2018-03-01 09:51:07.0 回复
0
回复诺一鹿相随:

学习了,顶

kin酱 2018-02-05 16:13:58.0 回复
0

划水

wolulu 2018-02-06 09:20:48.0 回复
0

求大神分享更多有用资料