如何做数据分析 如何自己找数据分析项目来做?



给大家提供两个公开的数据分析项目来源如何做数据分析:

如何做数据分析 如何自己找数据分析项目来做?

文章插图
如何做数据分析 如何自己找数据分析项目来做?

文章插图
阿里天池阿里天池://tianchi.aliyun.com/ 是国内数据科学竞赛平台 , 有奖金可观的实战竞赛 , 也有供学员备战的学习赛 。对刚入门数据分析的同学来说 , 学习赛是不错的选择 。在提高技能的同时 , 还能对标其他同学 , 确定自己的竞争力 。
下面是几个较容易上手的学习赛项目:
1. Airbnb短租数据集分析赛:
://tianchi.aliyun.com/competition/entrance/231715/introduction
这是一个较为开放式的问题 , 侧重分析的思路 , 是练习数据分析的最佳项目选择 。
2. 零基础入门数据挖掘 – 二手车交易价格预测
://tianchi.aliyun.com/competition/entrance/231784/introduction
这是一个典型的回归问题 , 也是机器学习最容易上手的项目 。
3. 零基础入门NLP – 新闻文本分类
://tianchi.aliyun.com/competition/entrance/531810/introduction
这是文本处理、NLP的入门项目 。
除了学习赛 , 阿里天池还有竞争程度激烈的竞赛:如算法大赛、程序设计大赛、可视化大赛、诸神之战等 , 同学们可以根据自己感兴趣的发展方向选择比赛项目 。
KaggleKaggle(:///)成立于2010年 , 是一个进行数据挖掘和预测的在线竞赛平台 。Kaggle上的竞赛有多种 , 如奖金高且竞争激烈的 Featured项目 , 相对入门级别的Research项目 。
Kaggle项目虽然不限制编程语言 , 但绝大多数队伍会选用Python和R , 所以你需要至少熟悉其中一种 。
下面是三个入门级的经典项目:
1.Titanic: Machine Learning from Disaster(泰坦尼克:从灾难中学习):
:///c/titanic
2.House Prices: Advanced Regression Techniques(房价预测:高阶回归技巧)
:///c/house-prices-advanced-regression-techniques
3.Digital Recognition(数字识别)
:///c/tmlc/notebooks
英文好的同学可以选择Kaggle的项目来练习 , 这是一个受国际认可的数据科学竞赛平台 , 在这个平台上成绩靠前的同学 , 是不愁找工作的 , 都是别人来找自己 。
过往经验当然 , 除了上面的项目 , 平时工作中多数也会用到数据分析 , 你可以从之前工作中总结数据分析的思路 。
虽然数据不是你处理的 , 但是分析的思路是通用的 。
数据分析是为解决问题而生的 , 过去积累的通过数据发现问题进而给出解决方案的经验 , 是数据分析的精华所在 。不要忽视哦!
我之前有整理过50多个数据分析项目 , 想要的话转发本文 , 私信我“项目”获得
如何做好一名数据分析师?相比问这个问题的人应该是刚入行数据分析的 , 那我就以过来人的经验 , 说说入行数据分析师3年的成长要点和规划 。
为什么要定义3年呢?这个行业基本3年内都是助攻 , 偶尔能成为主攻 , 助攻基本都是提取数据、处理数据、核对数据、写常规的分析报告 , 基本很少参加项目的讨论 。
去看招聘信息时 , 这个时间内的分析师还是以技术、工具为主 , 因此3年内大家大部分时间都集中在工具、技术的研究 , 没办法 , 要先活着 , 得有份工作 , 3年后许多分析师才慢慢会有自己的思考和职场焦虑 。
下面的几个点 , 也是我曾经用到的一些要点和思考 , 欢迎交流
一、断章取义(用数据说谎)经常看到一些人写文章 , 大多数人引用别人的数据 , 用一张看似完美的图表 , 来疯狂做自己的观点输出 , 然而你仔细看看数据报告的背景she’ji、数据的来源、统计的口径、时间维度等 , 你会发现他的观点其实是在自圆其说
举个栗子:都说转行AI即可年薪50万 , 转行数据分析即可30万 , 市场需求几千万人
聪明的人都会去看这个分析的背景 , 前因后果是什么?指标的定义是?数据可信度多大?
在数据分析中最重要的不是数据看到的结论 , 而是数据背后的意义
你的分析对象是谁?你的数据如何采集的?你的统计口径又是什么?这些都至关重要 , 带着这些问题去看一份报告 , 你才会产生自己的看法 , 而不是被别人套路 , 盲目跟风 , 到头来你还是一场空
这种深度思考报告的背后比看报告更有价值 , 你可以不是专业的数据分析师 , 但你必须要有数据分析师的思维
二、缺乏深度(长期养成)我们在看待任何问题时候 , 往往要多一些场景的假设和验证 , 你才能看透某件事情 , 比如前几天一个学员 , 给我发来一份简历 , 让我帮看看 , 我看到这么一句话:
工作成就 , 在XXX项目中帮助公司实现用户60%的增长
第一眼 , 我看过去 , 我靠 , 牛逼!但仔细想一想 , 还有几个问题有待商定
1、站在管理层 , 你花了多钱换来60%增长?
2、站在同行 , 你这个活动的特点是什么?和以往类似的活动比 , 这次真的好吗?同时期竞争对手在做什么?
3、站的数据分析师角度 , 你这个活动的时间维度是什么?有没有排出行业本身的因素(季节性、自然) , 活动评估跟踪的方式是什么?数据如何采集
4、站业务的角度 , 你对比的是什么时间 , 这个时间前后有没有什么事件发生 , 最近一段时间用户的增长程度如何?对比是2个数据的比较 , 一个过大、一个过小 , 很容易完成60%
等等 , 还有很多要考虑的
所以当我们看待一个问题时 , 一定要站在整个公司不同人、不同级别的程度去看待某个业务 , 这样你后面的思路和深度会更加清晰 , 一定要养成这种习惯
三、学会梳理(值得拥有)好多人学了几百G的视频 , 看了几十本书 , 换来的还是职场的现在的自己 , 在职场一定要定期学会梳理自己的知识体系 , 最简单的方式就是拆分自己的各种技能看不足之处 , 再设定目标去改进 , 最后在阶段性对比 , 看看到底有没有改变 , 拆分、对比、合并也是数据分析师常态化的思维
其实职场的关键技能学习也就10年的时间 , 10年后也许你看的书都是管理类、商业类、社会类的书籍 , 如何你不能清晰的梳理自己利弊 , 那么你薪资和职场很难一帆风顺 , 别人并没有看到你过人之处 , 高手与低手差别并不是在于工具、而是在于你看待问题的深度、广度
我经常也看一些学员的学习笔记 , 也希望大家多看看别人的笔记 , 特别同在一个学习小组 , 学同样课程的 , 每个人认识和认知都是不一样的 , 结构化思维拆分的方式也肯定不同 , 有的喜欢从课程难易程度去分解 , 有的喜欢从整个数据分析流程去梳理 , 有的喜欢从不同算法的场景去归纳 , 这些对你梳理都是很有帮助的 , 师夷长技以制夷 , 不要老去吐槽别人 , 要善于吸收别人的体系 , 融合成你的体系
举个简单栗子 , 指标体系一般是一个分析师常具备的技能 , 很多人梳理指标体系时 , 只是罗列了N个sheet , 并没有去归纳和梳理
在企业里面 , 你常常会看到很多优秀分析师做出来的指标体系 , 让大BOSS会高声喊赞 , 注意几个要点
1、大而全 , 一定要站在公司未来发展的战略上去详细梳理 , 梳理出目前拥有和未来一定要有的
2、归纳 , 根据业务的形态对指标进行归纳 , 比如规模类、趋势类、盈利类、驱动类、核心类等等 , 类似聚类分析一样 , 给指标做出业务的画像
3、电路图 , 我们都学过电路 , 知道并联、串联 , 那一样要将这些指标与业务场景和发展的周期进行电路分析 , 那些指标是串联的 , 那些是并联的 , 那些是可以递推的 , 这点很重要
4、落地 , 要梳理出什么指标是日报用的 , 什么是周报用的 , 什么是月报看的 , 指标异常的设定 , 达到什么程度时 , 我们一定要介入专题进行分析
5、给领导的呈现和概述一定要简介 , 就好比电视遥控器一样 , 按一下通俗易懂的按钮 , 就能获得相应的内容 , 这不仅仅是目录
四、迅速提升(自我模仿)要模仿什么?当然是别人、你觉得优秀的分析思路、分析报告
一定要多看看行业报告 , 行业报告一般都是一个行业的通病和关注的核心方向 , 要提炼其中的思路转变成自己的 , 主要关注3点:1、整体报告逻辑;2、指标体系的设定;3、分析的角度;
光有这些还是不够的 , 还要学习方法论 , 这里的方法论不是算法 , 可以理解为商业分析模型 , 比如5W2H、SWOT、用户生命周期、漏斗、AARRR等等 , 这些框架样式的模型就是你分析的思路 , 剩下的就是指标的设计和分析体系 , 看似简单却很难 , 这需要大量的项目或者企业内部的优化 。
模仿很懂 , 从行业的数据产品工具出发 , 理解这样设计的意义及行业的痛点、分析的方向是什么?
【如何做数据分析 如何自己找数据分析项目来做?】多去看一些数据产品的设计 , 比如网站分析 , 看GA、百度统计 , APP看友盟、ThinkingData等 , 用户行为就去看看CRM、神策、GrowingIO等 , 有的产品工具把每个主题进行了划分 , 而且里面的呈现方式都是经过好多迭代的 , 拿迭代的依据就是他们客户的需求 , 这就是你要分析的方向 , 未来要关注的 , 提早做好储备的方向 。
五、建护城河(自我造血)闭着眼睛想一想 , 一个月的薪水除了支付房租和日常花销外 , 几乎没有剩余 , 甚至还有负债 , 而你唯一的收入是“工资”
换句话讲 , 没有了工作 , 吃饭都是问题 , 设想一下 , 离开职场了 , 我们的活路在哪?
用2个常用的逻辑:
推理思维:家里没钱 , 要上班 , 不上班没人给钱
演绎思维:被公司KO了 , 我就完蛋了 , 要努力干好 , 可领导不好把控
那还有活路吗?
做生意?没头脑
要创业?没资金
要赚钱?没路子
要暴富?没人包
那不妨就从3方面全面提升
1、让自己变得更专业 , 知识与职场的锻造
2、借助互联网让自己变得更有名气 , 玩名气价值
3、让自己的人脉更广
这样简单吧
1、职场上好好干 , 没事就学习 , 多和同事交流
2、网络上塑造自己 , 多分享 , 但要专注
3、有事没事参加一些活动 , 针对性的参与
以上就是我感觉很重要的几个点 , 欢迎有不同想法的可以交流 , 毕竟每个人的成长、处境都不一样 。
最后送一段 , 2012年写的数据分析5步走:
1、锁定分析目标 , 梳理思路 , 叫纸上谈兵;
2、把杂乱的数据整理出图表报表 , 用数据探业务 , 叫自问数答;
3、锁定核心抓重点 , 设定最终算法 , 叫挟天子以令诸侯;
4、梳理重点发现 , 准备剧本开拍 , 接受PK , 叫才辨无双;
5、效果梳理 , 总结经验 , 叫内视反听 。
文源:小邓种草

    推荐阅读