首页 > Data - 数据思维 - 上篇

Data - 数据思维 - 上篇

1 - 概念与定义

如果分析思维是一种结构化思考的体现,那么数据分析思维(简称数据思维)则是以数据为依托的结构化分析方式。

不同于“我觉得”、“以前是怎样”、“其他人如何”这些直觉化、经验化、类比化的思考方式,数据思维是以数据为导向,依据严格的分析、统计和证明来指导具体的应用与操作。

首先,要对事物本身有一个全面和客观的认识。

  • 以辩证思维来认识和看待事物,进行事物的分解和集成,全面客观地以数据说话,同时减少主观偏颇看法,
  • 结合外部环境、时间线、核心维度,全面的分析物的行为特征或动态展现
  • 关注事物的外在交互关系、内部结构和衔接,分析事物相关的内外环境因素

然后,确定事物本身的关键属性、维度和分析评估体系。

分析事物各关键指标特性间的相互制约和促进力。

任何评估指标值的得出,一定有事物本身内在数据和运作机制进行支撑的,也就是说,将对事物分析后的数据映射到具体的可用的科学评价体系之上。

1.1 - 数据分析的目的

数据分析是为了能以量化的方式来分析业务问题并得出结论。

“从历史数据中获得的洞察转化为可执行的决策或推荐的过程,将IT技术、管理科学和统计学结合以解决实际问题。”

明确数据分析本身的目的,以终为始,也就是必须明确要解决的问题

  • 问题背景
  • 问题的具体含义
  • 针对现有问题采取的行为和结果

1.2 - 数据分析的一般步骤

业务指导数据,数据驱动业务。

数据分析并不是一个结果,只是过程,在这个过程中是需要反馈和持续改进的。

819128-20190701235128163-247479403.png

1.3 - 数据分析的作用

数据分析的三大作用,主要是:现状分析、原因分析和预测分析。

什么时候开展什么样的数据分析,需要根据我们的需求和目的来确定。

  • 数据分析的目的越明确,分析越有价值。
  • 明确目的后,需要梳理思路,搭建分析框架,把分析目的分解成若干个不同的分析要点,然后针对每个分析要点确定分析方法和具体分析指标;
  • 最后,确保分析框架的体系化(体系化,即先分析什么,后分析什么,使得各个分析点之间具有逻辑联系),使分析结果具有说服力。

1.4 - 数据常识(Data Common Sense)

对数据的变化保持敏感。

这里的“变化”不仅仅来自数值本身的变动,更多的而来自“当前的数据”不同于平常的认知和判断。

而这种“平常的认知和判断”,其实不仅是长期数据观察和分析所形成的“感觉”,也是你的“经历和经验”,甚至是“当前的知识结构和能力树”。

能够认识到“变化”的来源,能有效避免掉入“主观判断”的陷阱。

想要培养出数据敏感性和具备意识数据偏离的能力,这需要保持持久的观察和分析,以及足够的耐心和好奇心。

业务数据对应着业务流程,业务流程暗含着业务需求,业务需求来自实际运营,从实际应用中去理解数据的产生和流动,有助于准确保持数据分析的“方向”不偏离“正轨”。

  • 形成查看关注数据的习惯,明确数值含义以及合理范围
  • 牢记核心数据、指标、报告和排名等,反复推算合理性
  • 抽离和规整数据,统一存放,方便查阅和分析

2 - 搭建框架

量化是为了统一认知,并且确保路径可回溯,可复制,避免“我感觉”、“我猜测”等主观判断。

路径可回溯、可复制:通过量化后的结果,许多优化的方法是可以被找到原因并且可以被复制的。

要想做到量化,需要做到三点:建立量化体系,明确量化重点和保证数据准确性。

2.1 - 建立量化体系

如果不能衡量,那么就不能有效增长和改进。

需要统一标准来定义和评价,这个标准就是指标。

具体的指标数值,可以避免“我觉得”造成的认知陷阱,“模糊虚妄”的描述会将人带入歧途。

2.2 - 明确量化重点

每个阶段,都应该明确当前的业务重点;量化体系需要根据业务阶段,更改量化重点及方式。

这同时意味着:有更细节的指标及更大的监控和推广力度。

每个阶段,都需要根据不同的业务情况来判断当前重点,从而围绕该重点建立一套无死角的分析监控体系。

2.3 - 指标设计方法

孤立的指标发挥不出数据的价值,需要建立结构化的指标体系。

不同业务形态有不同的指标体系,没有放之四海而皆准的模板。

指标的细分和拆解过程,其实对应着问题的拆分过程,应该根据具体的情况选择指标,只有选择合适的指标才能充分的反映问题。

  • 以准确和易懂为准则,集合统计学和业务效果的方法论。
  • 准确是指能够准确满足衡量目的,易懂是指标算法能直观显示好与坏,并且指标的算法也能够通俗易懂。
  • 准确是必须要保证的。

一些用于指标设计的常用统计学工具

  • 业务概况: 平均数、中位数、众数
  • 业务差异性:方差、标准差
  • 业务分布:频数

一些Tips

  • 比率指标:易于关注实际效果
  • 伴生指标:防止单个“片面性指标”的副作用
  • 防止坏指标:错误指标,虚荣指标(距离核心业务目标过远),复杂指标(数据波动时,很难分析原因)

指标维度字典(Dimension Dictionary)

  • 指标维度字典,(Bus Matrix),一定程度上解决了对于指标定义不清或不统一的问题。
  • 可以对一些关键和常用的指标进行统一的维护。

明确指标的定义和解释,要求制定者必须具备深入了解业务和拥有极高的抽象能力。

寻找业界已有量化方法并在组织内推广,将是件事半功倍的事情。

2.4 - 指标区分

一个好的指标需要可量化、可测量、可以精准反馈。

只有基于对问题的了解和思考,才能发现有价值的结论。

“好指标”

  • 不是所有的指标都是有效的,核心驱动指标才是需要重点关注的“好指标”。
  • 简单来说,核心驱动指标和组织发展相关联,是整个运营团队、产品团队乃至研发团队在统一为之努力的目标,是一个时期/阶段内的重点方向。
  • 不同业务的核心驱动指标也不一样。
  • "好指标"应该是在有效基数上的比率或者比例,易于衡量和对比。

“坏指标”

  • 虚荣指标:没有任何的实际意义,能够粉饰工作绩效
  • 后验性指标:时效性差,实际上只是在描述已发生事件,很难通过措施挽回成本和弥补损失
  • 复杂性指标:数据分析掉入“一堆隐藏变量指标”的陷阱中,无从下手

2.5 - 建立正确的指标结构

根据“指标设计方法”建立起围绕业务的指标体系。

核心是根据业务特征确定核心指标,在核心指标的基础上以不同的角度进行拆解,然后再慢慢补充其他业务的指标情况。

和分析思维的金字塔结构一样,拆解的过程依照金字塔方法论的“逐层拆解,不重不漏(MECE)”,指标呈现树状结构,构建核心是以业务流程为思路,以结构为导向。

从流程的角度搭建指标框架,可以全面的囊括用户相关数据,无有遗漏。

列举指标原则:需要有核心驱动指标。移除虚荣指标,适当的进行删减,不要为添加指标而添加指标。

若拆解出来或业务补充的指标过多,可借鉴数据仓库的“域”概念来管理这些指标。

3 - 数据准确性

确保准确性的方法

  • 采取可信来源:多来源交叉确认,采用新来源时需格外小心
  • 确认加工方式:指标定义和加工算法
  • Double Check:量级,计算逻辑和业务常识

Double Check 的技巧

  • 量级 Check:边界值,每个数据有它的大概范围
  • 计算逻辑 Check:总数、中位数、平均数等
  • 业务常识 Check:根据其他常用数字推算出该业务范围

数据产品已经有成熟的数据质量管理方法;涉及了数据源,指标计算和数据呈现等各个环节的监控。

4 - 沟通与反馈

4.1 - 站在业务方的角度

只有解决业务问题分析才能创造价值,包括个人价值和公司价值。

“忧其所虑,给其所欲”:精准理解对方需求。

4.2 - 主要环节

  • 沟通充分:确定业务方想要分析什么,提出更合理专业的衡量和分析方式,明确所要数据背后的含义,同时做好节点同步,切忌一条路走到黑
  • 结论简明:在阐述分析结果上,要记得结论先行,逐层讲解,再提供论据。论据上,图 > 表 > 文字
  • 提供信息量及可落地建议:从专业的角度,从已知边界向未知边界分析,提供给对方所未知的信息和可落地的建议
  • 寻求反馈:持续改进的触发点

5 - 方式与方法

5.1 - 数据分析方法论和数据分析法的区别

数据分析方法论主要是从宏观角度指导如何进行数据分析,就像是一个数据分析的前期规划,指导着后期数据分析工作的开展。

  • 利用维度分析数据
  • 使用统计学知识,例如数据分布假设检验
  • 使用机器学习

数据分析法主要从微观角度指导如何进行数据分析,是指具体的分析方法,比如对比分析、交叉分析、相关分析、回归分析等。

819128-20190702002907992-1661591572.png

5.2 - 维度分析法

维度是描述对象的参数,在具体分析中,可以把它认为是分析事物的角度。

有了维度后,就能够通过不同的维度组合,形成数据模型,一个多维的数据立方体。

数据模型将复杂的数据以结构化的形式有序的组织起来。

数据模型可以从不同的角度和层面来观察数据,这样提高了分析的灵活性,满足不同的分析需求、这个过程叫做OLAP(联机分析处理)。

5.3 - 指标和维度有什么区别?

维度是说明和观察事物的角度,指标是衡量数据的标准。

维度是一个更大的范围,不只是数据,比如时间维度和城市维度,我们就无法用指标表示,而指标(留存率、跳出率、浏览时间等)却可以成为维度。

通过业务建立和筛选出指标,将指标作为维度,利用维度进行分析,通俗理解:维度>指标。

一般来说,指标都可以作为维度使用。

转载于:https://www.cnblogs.com/anliven/p/6834083.html

更多相关:

  • 6 - 模型与框架 利用现有的成熟的理论、模型与框架,结合实际业务情况,搭建分析框架,尽量确保数据分析维度的完整性,结果的有效性及正确性。 营销理论模型:4P、用户使用行为、STP理论、SWOT等。管理理论模型:PEST、5W2H、时间管理、生命周期、逻辑树、金字塔、SMART原则等。7 - 简单的数据分析法 交叉分析:通常是把纵向...

  • [大数据、Big Data、巨量数据、海量数据]之分析模式工具相关资料 : http://www.wisdom1.net/?cat=9Data link Visualization Maker  人、事、时、地、物- 关系型交叉分析、调查分析、图形可视化分析数据库。DVM赋予情报分析员,执法,调查,研究人员和信息工作者的强大需求,是...

  • 本文是西门子开放式TCP通信的第2篇,上一篇我们讲了使用西门子1200PLC作为TCP服务器的程序编写,可以点击下方链接阅读:【公众号dotNet工控上位机:thinger_swj】基于Socket访问西门子PLC系列教程(一)在完成上述步骤后,接下来就是编写上位机软件与PLC之间进行通信。上位机UI界面设计如下图所示:从上图可以看出...

  • 我有一个大型数据集,列出了在全国不同地区销售的竞争对手产品。我希望通过使用这些新数据帧名称中的列值的迭代过程,根据区域将该数据帧分成几个其他区域,以便我可以分别处理每个数据帧-例如根据价格对每个地区的信息进行排序,以了解每个地区的市场情况。我给出了以下数据的简化版本:Competitor Region ProductA Product...

  • 作为一名IT从业者,我来回答一下这个问题。首先,对于具有Java编程基础的人来说,学习Python的初期并不会遇到太大的障碍,但是要结合自己的发展规划来制定学习规划,尤其要重视学习方向的选择。Java与Python都是比较典型的全场景编程语言,相比于Java语言来说,当前Python语言在大数据、人工智能领域的应用更为广泛一些,而且大...

  • 这段时间通过学习相关的知识,最大的变化就是看待事物更加喜欢去了解事物后面的本质,碰到问题后解决问题思路也发生了改变。举个具体的例子,我在学习数据分析,将来会考虑从事这方面的工作,需要掌握的相关专业知识这个问题暂且按下不表,那哪些具体的问题是我需要了解的呢,以下简单罗列:1、了解数据分析师这个岗位在各个地区的需求情况?2、数据分析师的薪...

  • 这一节将开始学习python的一个核心数据分析支持库---pandas,它是python数据分析实践与实战的必备高级工具。对于使用 Python 进行数据分析来说,pandas 几乎是无人不知,无人不晓的。今天,我们就来认识认识数据分析界鼎鼎大名的 pandas。目录一. pandas主要数据结构 SeriesDataFrame二...