HI,下午好,欢迎来到新媒体服务!
24小时服务热线: 4000-163-301

新闻动态

NEWS CENTER

这可能是数据分析师最关心的5大问题

2020-01-13

已经2020年了,很多同学都在思考职业发展路径问题。最近咨询陈老师的也很多,一个很普遍被问到的,就是:数据分析师的红旗,到底能打多久?今天集中解答一下。

还是陈老师的一贯风格,不吹不黑,客观说事。我们一起来看看,面向2020年,数据分析师们最纠结的五个问题:

问题一:数据分析会不会被人工智能取代?

答:不会!

首先,看到提“人工智能”四个字的所有标题,大家都能认为是引发焦虑的伪问题。真正懂行的都说:算法、机器学习,或者干脆直插CV,NLP,推荐等某个具体领域。

其次,这俩玩意根本就是两件事。算法的发展不仅不会取代数据分析,反而会让数据分析更轻松。

为啥?

因为本质上,算法对抗的是低效率。通过人工标注-模型训练-预测检验的循环,算法可以大量替代以往需要耗费人力的工作。

但是算法实现这个目的是有前提的:第一,需要明确的结果:人工标注的图形、信用违约/未违约记录等等。第二,需要大量的特征数据,用于训练模型。

正是因为如此,我们看到算法应用最成功的就是CV领域。比对人脸、比对证件等就是特征丰富,结果明确。传统的风控、推荐等领域,也有相应进步。NLP领域进展相对较慢,就是被复杂的语境折腾的七荤八素。

本质上,数据分析对抗的是不确定性。当我们想要分析问题的时候,更多是:

  1. 没有数据:新业务刚上线,过往不重视数据采集
  2. 有假数据:业务操控,流程缺失,利益驱动
  3. 乱七八糟:口径不统一,流程不规范,使用瞎胡闹
  4. 人为扭曲:业务方为了保住KPI睁眼睛说瞎话
  5. 不会判断:只知道写同比环比,不会解读意义
  6. 主观臆断:做数据只为证明自己是对的,强词夺理

这种时候,就相当于根本没有标注,或者人工瞎几把标,模型压根训练不出来。还摸个屁。

正是如此,我才有了数据分析的五大问题:

  1. 是什么(量化结果,获取数据)
  2. 是多少(树立标准,评价好坏)
  3. 为什么(寻找原因,验证假设)
  4. 会怎样(综合评估,做出取舍)
  5. 又如何(预测前景,探索可能)


通过不断循环的解答这五个问题

  1. 我们量化监控业务走势,把不确定变成确定;
  2. 我们做出客观的评估,发现问题,沉淀经验;
  3. 我们合理预测前景,探索新可能,发现新道路;
  4. 最终推动业务持续进步和改善。


这种摸着石头过河的力量,才是算法不可取代的。当然,石头摸清楚了,数据质量好了,经验总结差不多了,这时候有些传统的工作可以用模型来干。比如在风控、推荐领域,传统业务经验越来越让位给模型。同样的,在的领域,数据分析继续做着开路先锋。

比如2019年,陈老师主导的项目,就有大量的社交电商、分享裂变、网红带货、私域流量转化的项目,这些项目往往是业务模式创新和数据分析齐头并进的。在这些新领域,各个行业都在摸石头,当然得带着有本事测量深浅的水文师。不然一脚下去踩坑里咋死的都不知道。

有意思的是,所谓的“人工智能会取代数据分析师”,正是来自对数据分析工作的无解。在不懂行的人眼里,数据分析师和算命大师没啥区别,不需要数据采集、不需要数据清洗、不需要数据治理、不需要分析建模、不需要积累经验、不需要你测试验证。只要眉头一皱、掐指一算,咒语一念,符咒一烧,算盘一拨,天上咔嚓一道炸雷掉下一道圣旨:明年业绩1257亿!

在不懂行的人眼里,算法、数据分析、算盘、《周易》没啥区别,反正过程他都看不懂,最后咔嚓一声能出个好牛逼的结果。有这种幼稚理念,当然会觉得人工智能会取代数据分析了,毕竟阿尔法狗比算盘听起来屌吗。

当然还有一种论调,来自:以后能自动提数了,数据分析师就要下岗了。这个更幼稚了,谁TM跟你说数据分析师就是人肉跑sql师了!

要我说,这种智能BI越早出越好!正好把那些每天2000行sql的小哥们解放出来,正好把那些无穷无尽的临时取数挡掉,正好可以让市场部那些只懂心机不懂技术的妹子们对着机器咆哮去:“这是总监要的,下班必须给!”这话都冲着阿尔法狗喊去,那画面想想都爽。我们就有更多的时间,来分析问题,来设计实验,来挖掘深层因素,以后出的成绩还多一点。

So,时代淘汰的不是数据分析师,而是只会写sql的肉鸡,是只会到处问“有没有模板抄抄”的菜鸡,是只会写同步环比的草鸡。大家大可安心。

问题二:数据分析会不会被会写sql的运营取代?

答:不会

这个问题陈老师有专门的分享,想看的可以戳文末的链接。这里不再赘述,只说结论:“运营做数据分析是有原罪的,叫:本位主义”。只要丫的身份还是运营,丫的数据分析结果就是屁股决定脑袋,就是短视且功利的,这一点跳进黄河都洗不清。

况且运营也就只会写sql而已,你让他弄数仓,搞ETL,搞数据治理试试,不累死也恶心死。这又是“只见高楼起万丈,不见地基累又脏”所产生的误解。所以做数据的同学们不要嫌弃这些脏活累活,这反而是我们的一个护城河(虽然里边都是泥巴)。

相关推荐