如何做数据分析,如何自己找数据分析项目来做?

给大家提供两个公开的项目来源如何做数据分析

如何做数据分析,如何自己找数据分析项目来做?

阿里天池阿里天池://tianchi.aliyun.com/ 是国内数据科学竞赛平台,有奖金可观的实战竞赛,也有供学员备战的学习赛。对刚入门数据分析的同学来说,学习赛是不错的选择。在提高技能的同时,还能对标其他同学,确定自己的竞争力。

下面是几个较容易上手的学习赛项目:

1. Airbnb短租数据集分析赛:

://tianchi.aliyun.com/competition/entrance/231715/introduction

这是一个较为开放式的问题,侧重分析的思路,是练习数据分析的最佳项目选择。

2. 零基础入门数据挖掘 – 二手车交易价格预测

://tianchi.aliyun.com/competition/entrance/231784/introduction

这是一个典型的回归问题,也是机器学习最容易上手的项目。

3. 零基础入门NLP – 新闻文本分类

://tianchi.aliyun.com/competition/entrance/531810/introduction

这是文本处理、NLP的入门项目。

除了学习赛,阿里天池还有竞争程度激烈的竞赛:如算法大赛、程序设计大赛、可视化大赛、诸神之战等,同学们可以根据自己感兴趣的发展方向选择比赛项目。

KaggleKaggle(:///)成立于2010年,是一个进行数据挖掘和预测的在线竞赛平台。Kaggle上的竞赛有多种,如奖金高且竞争激烈的 Featured项目,相对入门级别的Research项目。

Kaggle项目虽然不限制编程语言,但绝大多数队伍会选用Python和R,所以你需要至少熟悉其中一种。

下面是三个入门级的经典项目:

1.Titanic: Machine Learning from Disaster(泰坦尼克:从灾难中学习):

:///c/titanic

2.House Prices: Advanced Regression Techniques(房价预测:高阶回归技巧)

:///c/house-prices-advanced-regression-techniques

3.Digital Recognition(数字识别)

:///c/tmlc/notebooks

英文好的同学可以选择Kaggle的项目来练习,这是一个受国际认可的数据科学竞赛平台,在这个平台上成绩靠前的同学,是不愁找工作的,都是别人来找自己。

过往经验当然,除了上面的项目,平时工作中多数也会用到数据分析,你可以从之前工作中总结数据分析的思路。

虽然数据不是你处理的,但是分析的思路是通用的。

数据分析是为解决问题而生的,过去积累的通过数据发现问题进而给出解决方案的经验,是数据分析的精华所在。不要忽视哦!

我之前有整理过50多个数据分析项目,想要的话转发本文,私信我“项目”获得

如何数据分析师?

相比问这个问题的人应该是刚入行数据分析的,那我就以过来人的经验,说说入行数据分析师3年的成长要点和规划。

为什么要定义3年呢?这个行业基本3年内都是助攻,偶尔能成为主攻,助攻基本都是提取数据、处理数据、核对数据、写常规的分析报告,基本很少参加项目的讨论。

去看招聘信息时,这个时间内的分析师还是以技术、工具为主,因此3年内大家大部分时间都集中在工具、技术的研究,没办法,要先活着,得有份工作,3年后许多分析师才慢慢会有自己的思考和职场焦虑。

下面的几个点,也是我曾经用到的一些要点和思考,欢迎交流

一、断章取义(用数据说谎)经常看到一些人写文章,大多数人引用别人的数据,用一张看似完美的图表,来疯狂做自己的观点输出,然而你仔细看看数据报告的背景she’ji、数据的来源、统计的口径、时间维度等,你会发现他的观点其实是在自圆其说

举个栗子:都说转行AI即可年薪50万,转行数据分析即可30万,市场需求几千万人

聪明的人都会去看这个分析的背景,前因后果是什么?指标的定义是?数据可信度多大?

在数据分析中最重要的不是数据看到的结论,而是数据背后的意义

你的分析对象是谁?你的数据如何采集的?你的统计口径又是什么?这些都至关重要,带着这些问题去看一份报告,你才会产生自己的看法,而不是被别人套路,盲目跟风,到头来你还是一场空

这种深度思考报告的背后比看报告更有价值,你可以不是专业的数据分析师,但你必须要有数据分析师的思维

二、缺乏深度(长期养成)我们在看待任何问题时候,往往要多一些场景的假设和验证,你才能看透某件事情,比如前几天一个学员,给我发来一份简历,让我帮看看,我看到这么一句话:

工作成就,在XXX项目中帮助公司实现用户60%的增长

第一眼,我看过去,我靠,牛逼!但仔细想一想,还有几个问题有待商定

1、站在管理层,你花了多钱换来60%增长?

2、站在同行,你这个活动的特点是什么?和以往类似的活动比,这次真的好吗?同时期竞争对手在做什么?

3、站的数据分析师角度,你这个活动的时间维度是什么?有没有排出行业本身的因素(季节性、自然),活动评估跟踪的方式是什么?数据如何采集

4、站业务的角度,你对比的是什么时间,这个时间前后有没有什么事件发生,最近一段时间用户的增长程度如何?对比是2个数据的比较,一个过大、一个过小,很容易完成60%

等等,还有很多要考虑的

所以当我们看待一个问题时,一定要站在整个公司不同人、不同级别的程度去看待某个业务,这样你后面的思路和深度会更加清晰,一定要养成这种习惯

三、学会梳理(值得拥有)好多人学了几百G的视频,看了几十本书,换来的还是职场的现在的自己,在职场一定要定期学会梳理自己的知识体系,最简单的方式就是拆分自己的各种技能看不足之处,再设定目标去改进,最后在阶段性对比,看看到底有没有改变,拆分、对比、合并也是数据分析师常态化的思维

其实职场的关键技能学习也就10年的时间,10年后也许你看的书都是管理类、商业类、社会类的书籍,如何你不能清晰的梳理自己利弊,那么你薪资和职场很难一帆风顺,别人并没有看到你过人之处,高手与低手差别并不是在于工具、而是在于你看待问题的深度、广度

我经常也看一些学员的学习笔记,也希望大家多看看别人的笔记,特别同在一个学习小组,学同样课程的,每个人认识和认知都是不一样的,结构化思维拆分的方式也肯定不同,有的喜欢从课程难易程度去分解,有的喜欢从整个数据分析流程去梳理,有的喜欢从不同算法的场景去归纳,这些对你梳理都是很有帮助的,师夷长技以制夷,不要老去吐槽别人,要善于吸收别人的体系,融合成你的体系

举个简单栗子,指标体系一般是一个分析师常具备的技能,很多人梳理指标体系时,只是罗列了N个sheet,并没有去归纳和梳理

在企业里面,你常常会看到很多优秀分析师做出来的指标体系,让大BOSS会高声喊赞,注意几个要点

1、大而全,一定要站在公司未来发展的战略上去详细梳理,梳理出目前拥有和未来一定要有的

2、归纳,根据业务的形态对指标进行归纳,比如规模类、趋势类、盈利类、驱动类、核心类等等,类似聚类分析一样,给指标做出业务的画像

3、电路图,我们都学过电路,知道并联、串联,那一样要将这些指标与业务场景和发展的周期进行电路分析,那些指标是串联的,那些是并联的,那些是可以递推的,这点很重要

4、落地,要梳理出什么指标是日报用的,什么是周报用的,什么是月报看的,指标异常的设定,达到什么程度时,我们一定要介入专题进行分析

5、给领导的呈现和概述一定要简介,就好比电视遥控器一样,按一下通俗易懂的按钮,就能获得相应的内容,这不仅仅是目录

四、迅速提升(自我模仿)要模仿什么?当然是别人、你觉得优秀的分析思路、分析报告

一定要多看看行业报告,行业报告一般都是一个行业的通病和关注的核心方向,要提炼其中的思路转变成自己的,主要关注3点:1、整体报告逻辑;2、指标体系的设定;3、分析的角度;

光有这些还是不够的,还要学习方法论,这里的方法论不是算法,可以理解为商业分析模型,比如5W2H、SWOT、用户生命周期、漏斗、AARRR等等,这些框架样式的模型就是你分析的思路,剩下的就是指标的设计和分析体系,看似简单却很难,这需要大量的项目或者企业内部的优化。

模仿很懂,从行业的数据产品工具出发,理解这样设计的意义及行业的痛点、分析的方向是什么?

多去看一些数据产品的设计,比如网站分析,看GA、百度统计,APP看友盟、ThinkingData等,用户行为就去看看CRM、神策、GrowingIO等,有的产品工具把每个主题进行了划分,而且里面的呈现方式都是经过好多迭代的,拿迭代的依据就是他们客户的需求,这就是你要分析的方向,未来要关注的,提早做好储备的方向。

五、建护城河(自我造血)闭着眼睛想一想,一个月的薪水除了支付房租和日常花销外,几乎没有剩余,甚至还有负债,而你唯一的收入是“工资”

换句话讲,没有了工作,吃饭都是问题,设想一下,离开职场了,我们的活路在哪?

用2个常用的逻辑:

推理思维:家里没钱,要上班,不上班没人给钱

演绎思维:被公司KO了,我就完蛋了,要努力干好,可领导不好把控

那还有活路吗?

做生意?没头脑

要创业?没资金

要赚钱?没路子

要暴富?没人包

那不妨就从3方面全面提升

1、让自己变得更专业,知识与职场的锻造

2、借助互联网让自己变得更有名气,玩名气价值

3、让自己的人脉更广

这样简单吧

1、职场上好好干,没事就学习,多和同事交流

2、网络上塑造自己,多分享,但要专注

3、有事没事参加一些活动,针对性的参与

以上就是我感觉很重要的几个点,欢迎有不同想法的可以交流,毕竟每个人的成长、处境都不一样。

最后送一段,2012年写的数据分析5步走:

1、锁定分析目标,梳理思路,叫纸上谈兵;

2、把杂乱的数据整理出图表报表,用数据探业务,叫自问数答;

3、锁定核心抓重点,设定最终算法,叫挟天子以令诸侯;

4、梳理重点发现,准备剧本开拍,接受PK,叫才辨无双;

5、效果梳理,总结经验,叫内视反听。

文源:小邓种草

版权声明:本站部分文章来源互联网,主要目的在于分享信息,版权归原作者所有,本站不拥有所有权,不承担相关法律责任,如有侵权请联系我们,本站将立刻删除。
(0)
上一篇 2022年5月31日 上午12:16
下一篇 2022年5月31日 上午12:17

相关推荐